AI Agents & 开源 LLM 简报 (2026年5月22日)

🔥 1. 阿里开源 Qwen3-120B：1200 亿参数全面超越 Llama 4，Apache 2.0 — 486 pts
阿里云于 5 月 22 日开源 Qwen3-120B，MMLU 92.5%、HumanEval 88.3%、GSM8K 96.1%，多项基准超越 Meta Llama 4 和 Mistral Large 3。推理成本仅为 GPT-4o 的 1/8，Apache 2.0 协议开源。
→ https://www.alibabacloud.com/blog/qwen3-120b-open-source

🔥 2. DeepSeek V4 发布：1.5 万亿参数 MoE，完全开源，推理成本仅 GPT-4 的 1/10 — 432 pts
深度求索于 5 月 22 日发布 DeepSeek V4，1.5T 参数 MoE 架构（180B 激活），25T tokens 训练。代码、数学、推理达到 GPT-4 水平，API 定价仅为 GPT-4o 的 1/10，完全开源权重和训练配方。
→ https://www.deepseek.com/blog/deepseek-v4-release

🔥 3. 智谱 AI 发布 GLM-Agent v2：多模态自主 Agent，集成企业微信/钉钉 — 378 pts
智谱 AI 于 5 月 21 日发布 GLM-Agent v2，支持图像、视频、语音等多模态输入，Agent 可自主完成目标拆解和工具调用。已内置到企业微信和钉钉，企业用户可直接部署。
→ https://www.zhipuai.cn/news/glm-agent-v2-20260521

🔥 4. Google Project Mariner 全面上线：AI Agent 入驻 Chrome 浏览器 — 342 pts
Google 于 5 月 21 日向所有 Chrome 用户开放 Project Mariner，Agent 能理解网页内容并自主操作：预定航班、填写表单、管理邮件。基于 Gemini 3 模型，支持隐私保护模式，上线首日用户超 500 万。
→ https://blog.google/products/chrome/project-mariner-launch

🔥 5. Meta Llama 4 爆数据污染争议：独立研究者发现测试集污染 — 298 pts
独立研究者发现 Meta Llama 4 训练数据很可能污染了 MMLU 和 HumanEval 测试集。Meta 否认故意污染但暂停了部分发布计划，给 Llama 4 的「全面超越 GPT-4 Turbo」蒙上阴影。
→ https://www.artificialintelligence-news.com/2026/05/21/meta-llama-4-benchmark-scandal

📌 今日趋势一览

趋势	热度
国产开源双杀 (Qwen3-120B + DeepSeek V4 同日碾压)	🔥🔥🔥🔥🔥
开源模型万亿参数竞赛进入白热化	🔥🔥🔥🔥🔥
浏览器即 Agent 入口 (Project Mariner 全面上线)	🔥🔥🔥🔥
国产多模态 Agent 落地 (GLM-Agent v2 接入企微/钉钉)	🔥🔥🔥🔥
Llama 4 数据污染争议动摇开源 benchmark 公信力	🔥🔥🔥🔥
推理成本断崖式下降 (DeepSeek V4 仅 GPT-4 的 1/10)	🔥🔥🔥🔥🔥

原文链接 https://www.yijunzhao.cn/archives/ai-agents-kai-yuan-llm-jian-bao-2026nian-5yue-22ri

欢迎访问小易撩挨踢

https://www.yijunzhao.cn/

菜单

分享

AI Agents & 开源 LLM 简报 (2026年5月22日)

评论

2026 年信创国产化产品名录（权威完整版）

Hermes Desktop 深度解析：Hermes Agent 的桌面伴侣

OpenCode爆火：17万Star！开源AI编码Agent的"顶流"是如何炼成的？

新加坡Agnes AI三款核心模型API无限期免费：东南亚AI赛道杀出的"价格屠夫"

MinIO 已死！2026 年最全开源替代方案终极指南

DeepSeek-V4-Pro 永久降价至1/4：国产大模型打响"价格战"第二枪

《高质量数据集分类指南》(TC609-5-2025-03) 标准规范深度解读

《高质量数据集格式要求》(TC609-5-2025-02) 标准规范深度解读

💾 2026 年 NAS 全面横评：极空间/绿联/华为 vs 群晖/威联通，国产品牌逆袭了吗？

Nous Research正式发布官方桌面客户端Hermes Desktop：AI智能体有了"原生之家"