易君召
易君召
发布于 2026-05-25 / 25 阅读
0
0

AI Agents & 开源 LLM 简报 (2026年5月25日)

#AI

🔥 1. Meta Llama 4 发布后持续发酵:开源社区评测报告密集出炉 — 486 pts
Llama 4(1.2T MoE)上周发布后,开源社区在本周初密集发布独立评测。Scout 版本在代码生成和推理任务上表现强劲,但 Maverick 版本在部分基准上被 Qwen3-120B 和 DeepSeek V4 反超。「开源旗舰」头衔争夺激烈。
https://ai.meta.com/blog/llama-4-release-may-2026

🔥 2. 字节豆包 Agent 日活 5000 万持续攀升,企业版首批客户落地 — 432 pts
豆包 Agent 上周宣布 5000 万日活后,本周一传出企业版已在金融和电商领域落地首批付费客户。字节系产品矩阵(抖音/飞书/剪映)的 Agent 跨 APP 能力成为差异化优势。
https://www.36kr.com/p/2809345674232832

🔥 3. 智谱 GLM-Agent v2 开源后 GitHub 星标破 3 万,开发者社区热议 — 386 pts
智谱 AI 的 GLM-Agent v2 开源后持续发酵,GitHub 星标已破 3 万。1M token 超长上下文和 98.2% AgentBench 成绩引发开发者广泛讨论,被评价为「国产 Agent 框架里程碑」。
https://www.zhipuai.cn/news/glm-agent-v2

🔥 4. Google Project Mariner v2.0 开放更多第三方集成 — 342 pts
Project Mariner v2.0 上周扩展到 100+ 第三方应用后,本周继续开放更多集成。浏览器 Agent 跨 Salesforce、Notion、Gmail 等企业应用的自动化工作流进入公测阶段。
https://blog.google/technology/ai/project-mariner-v2-may-2026

🔥 5. 开源大模型五月总结:四大旗舰同时在线,史上最强月份 — 298 pts
多家媒体发布 5 月开源大模型总结:Llama 4(Meta)、Qwen3-120B(阿里)、DeepSeek V4、Mistral Large 3 四大旗舰同日竞技,开源模型参数规模、性能和生态成熟度达到历史峰值。分析称「开源已不再是追赶者」。
https://www.jiqizhixin.com/articles/2026-05-24-10

📌 今日趋势一览

趋势

热度

开源四大旗舰同台竞技,5 月史上最强

🔥🔥🔥🔥🔥

国产 Agent 从日活数据到企业付费全面验证商业化

🔥🔥🔥🔥🔥

国产开源框架 GitHub 热度飙升 (GLM-Agent 3 万星)

🔥🔥🔥🔥

浏览器 Agent 跨应用集成加速

🔥🔥🔥🔥

开源模型评测进入「神仙打架」阶段

🔥🔥🔥🔥🔥

5 月最后一周,市场消化上周密集发布中

🔥🔥🔥🔥


原文链接 https://www.yijunzhao.cn/archives/ai-agents-kai-yuan-llm-jian-bao-2026nian-5yue-25ri

欢迎访问 小易撩挨踢

https://www.yijunzhao.cn/



评论