AI Agents & 开源 LLM 简报 (2026年5月25日)

🔥 1. Meta Llama 4 发布后持续发酵：开源社区评测报告密集出炉 — 486 pts
Llama 4（1.2T MoE）上周发布后，开源社区在本周初密集发布独立评测。Scout 版本在代码生成和推理任务上表现强劲，但 Maverick 版本在部分基准上被 Qwen3-120B 和 DeepSeek V4 反超。「开源旗舰」头衔争夺激烈。
→ https://ai.meta.com/blog/llama-4-release-may-2026

🔥 2. 字节豆包 Agent 日活 5000 万持续攀升，企业版首批客户落地 — 432 pts
豆包 Agent 上周宣布 5000 万日活后，本周一传出企业版已在金融和电商领域落地首批付费客户。字节系产品矩阵（抖音/飞书/剪映）的 Agent 跨 APP 能力成为差异化优势。
→ https://www.36kr.com/p/2809345674232832

🔥 3. 智谱 GLM-Agent v2 开源后 GitHub 星标破 3 万，开发者社区热议 — 386 pts
智谱 AI 的 GLM-Agent v2 开源后持续发酵，GitHub 星标已破 3 万。1M token 超长上下文和 98.2% AgentBench 成绩引发开发者广泛讨论，被评价为「国产 Agent 框架里程碑」。
→ https://www.zhipuai.cn/news/glm-agent-v2

🔥 4. Google Project Mariner v2.0 开放更多第三方集成 — 342 pts
Project Mariner v2.0 上周扩展到 100+ 第三方应用后，本周继续开放更多集成。浏览器 Agent 跨 Salesforce、Notion、Gmail 等企业应用的自动化工作流进入公测阶段。
→ https://blog.google/technology/ai/project-mariner-v2-may-2026

🔥 5. 开源大模型五月总结：四大旗舰同时在线，史上最强月份 — 298 pts
多家媒体发布 5 月开源大模型总结：Llama 4（Meta）、Qwen3-120B（阿里）、DeepSeek V4、Mistral Large 3 四大旗舰同日竞技，开源模型参数规模、性能和生态成熟度达到历史峰值。分析称「开源已不再是追赶者」。
→ https://www.jiqizhixin.com/articles/2026-05-24-10

📌 今日趋势一览

趋势	热度
开源四大旗舰同台竞技，5 月史上最强	🔥🔥🔥🔥🔥
国产 Agent 从日活数据到企业付费全面验证商业化	🔥🔥🔥🔥🔥
国产开源框架 GitHub 热度飙升 (GLM-Agent 3 万星)	🔥🔥🔥🔥
浏览器 Agent 跨应用集成加速	🔥🔥🔥🔥
开源模型评测进入「神仙打架」阶段	🔥🔥🔥🔥🔥
5 月最后一周，市场消化上周密集发布中	🔥🔥🔥🔥

原文链接 https://www.yijunzhao.cn/archives/ai-agents-kai-yuan-llm-jian-bao-2026nian-5yue-25ri

欢迎访问小易撩挨踢

https://www.yijunzhao.cn/

菜单

分享

AI Agents & 开源 LLM 简报 (2026年5月25日)

评论

2026 年信创国产化产品名录（权威完整版）

Hermes Desktop 深度解析：Hermes Agent 的桌面伴侣

OpenCode爆火：17万Star！开源AI编码Agent的"顶流"是如何炼成的？

新加坡Agnes AI三款核心模型API无限期免费：东南亚AI赛道杀出的"价格屠夫"

MinIO 已死！2026 年最全开源替代方案终极指南

DeepSeek-V4-Pro 永久降价至1/4：国产大模型打响"价格战"第二枪

《高质量数据集分类指南》(TC609-5-2025-03) 标准规范深度解读

《高质量数据集格式要求》(TC609-5-2025-02) 标准规范深度解读

💾 2026 年 NAS 全面横评：极空间/绿联/华为 vs 群晖/威联通，国产品牌逆袭了吗？

Nous Research正式发布官方桌面客户端Hermes Desktop：AI智能体有了"原生之家"