🔥 1. Anthropic 发布 Claude 4 Opus:内置 Agent 模式,刷新 SWE-bench 纪录 — 512 pts
Anthropic 于 5 月 5 日推出 Claude 4 Opus,深度集成 Agent 工作流——可直接调用工具、编写执行代码、自主浏览网页并自我纠错。同步开源低配版本 Claude 4 Haiku 供社区微调,在 SWE-bench 和 GAIA 上刷新多项纪录。
→ https://www.theverge.com/2026/5/5/24256678/anthropic-claude-4-opus-launch
🔥 2. Meta 开源 Llama 4 Ultra (405B):迄今最大完全开源模型 — 468 pts
Meta 于 5 月 3 日开源 Llama 4 Ultra,405B 参数在 MMLU-Pro 和 HumanEval 上超越 GPT-4o。同步发布配套 Agent Framework 工具包,支持低代码构建 Llama 驱动的自主 Agent。完全开源并允许商用。
→ https://venturebeat.com/2026/05/03/meta-llama-4-ultra-405b-open-source/
🔥 3. Adept AI 完成 3.5 亿美元 C 轮,英伟达微软跟投 — 386 pts
Adept AI 于 5 月 4 日宣布完成 3.5 亿美元 C 轮融资,General Catalyst 领投,英伟达、微软跟投。资金将用于扩大 Act-2 Agent 团队,该 Agent 能在浏览器、IDE 和终端中自主执行数据迁移、编写测试等复杂业务流程。
→ https://techcrunch.com/2026/05/04/adept-series-c-350-million/
🔥 4. 智谱 GLM-6-130B 开源:首推多模态 Agent 混合推理架构 — 287 pts
智谱 AI 于 5 月 3 日开源 GLM-6-130B,引入 MoMA(Mixture-of-Multimodal-Agents)架构,将视觉、代码、搜索 Agent 混合路由,可零样本执行「用图表总结论文并修改代码」等跨模态任务,国产开源 C-Eval 第一。
→ https://www.jiqizhixin.com/articles/2026-05-03-7
🔥 5. Hugging Face 发布 SmolAgent-2B:端侧 Agent 模型仅需 1.2GB 内存 — 176 pts
Hugging Face H4 团队于 5 月 4 日发布 SmolAgent-2B,参数量 2B、量化后仅需 1.2GB 内存,性能可媲美 Llama 3.2-3B。专为手机与 IoT 设备 Agent 任务设计,支持函数调用和层级规划,Apache 2.0 开源。
→ https://huggingface.co/blog/smolagent-2b
📌 今日趋势一览
趋势 热度
前沿闭源模型内置 Agent 能力 (Claude 4 Opus) 🔥🔥🔥🔥🔥
超大规模开源模型追赶闭源 (Llama 4 Ultra 405B) 🔥🔥🔥🔥🔥
Agent 基础设施融资持续高热 (Adept 再融 $350M) 🔥🔥🔥🔥
多模态 Agent 混合推理 (智谱 MoMA 架构) 🔥🔥🔥🔥
端侧小模型 Agent 化 (SmolAgent-2B) 🔥🔥🔥
开源+闭源双轨加速,Agent 成标配能力 🔥🔥🔥🔥