易君召
发布于 2026-05-07 / 2 阅读
0
0

AI Agents & 开源 LLM 简报 (2026年5月7日)

#AI

🔥 1. Mistral 发布 Mistral-Specialist-7B:开源代码模型 HumanEval 达 92.3% — 412 pts
法国 Mistral AI 于 5 月 7 日发布专为代码生成优化的开源模型,7B 参数在 HumanEval 上达 92.3% 通过率,超越同等规模闭源模型。采用 Apache 2.0 许可证,对边缘部署和本地化代码助手意义重大。
https://mistral.ai/news/mistral-specialist-7b

🔥 2. Google 发布 Gemini Agent 2.0 SDK:原生集成 Workspace 与第三方 API — 378 pts
Google 于 5 月 5 日推出 Gemini Agent 2.0 SDK,支持开发者构建能自主规划、执行和迭代任务的 AI Agent。原生集成 Google Workspace 和第三方 API,大幅降低专业 Agent 开发门槛。
https://developers.google.com/gemini-agent-2.0

🔥 3. Cognition Labs 完成 2 亿美元 B 轮,估值达 30 亿 — 342 pts
AI 编程 Agent Devin 的母公司 Cognition Labs 于 5 月 5 日宣布完成 B 轮融资,a16z 领投,估值达 30 亿美元。Devin 已能自主完成从需求分析到部署运维的全流程,本轮将拓展企业市场并开源部分基础组件。
https://cognition.ai/blog/series-b-2026

🔥 4. 开源社区发布「智言-14B」中文模型,超越 GPT-4o-mini — 268 pts
中国开源社区于 5 月 6 日联合发布 ZhiYan-14B,在 C-Eval 和 CMMLU 等中文基准上超越 GPT-4o-mini。MIT 许可证,8K 上下文,针对医疗、法律等专业领域微调,已登顶 Open LLM Leaderboard 中文榜。
https://huggingface.co/zhiyan-ai/ZhiYan-14B

🔥 5. 开源框架 AgentHub v2.0 发布:跨平台多 Agent 协作 — 198 pts
开源 Agent 编排框架 AgentHub 于 5 月 6 日发布 v2.0,首次支持跨操作系统(Linux/macOS/Windows)的多 Agent 协作,可编排数百个 Agent 共同完成复杂任务,GitHub 已获 15,000+ 星。
https://github.com/agenthub/agenthub

📌 今日趋势一览

趋势

热度

开源代码模型超越同等闭源 (Mistral-Specialist-7B)

🔥🔥🔥🔥🔥

Agent 开发框架 SDK 化 (Gemini Agent 2.0 SDK)

🔥🔥🔥🔥

AI 编程 Agent 持续吸金 (Cognition $200M B 轮)

🔥🔥🔥🔥

国产中文模型追赶加速 (智言-14B 超 GPT-4o-mini)

🔥🔥🔥🔥

跨平台多 Agent 协作工程化 (AgentHub v2.0)

🔥🔥🔥

专业领域微调成为差异化方向 (医疗/法律)

🔥🔥🔥


原文链接 https://www.yijunzhao.cn/archives/ai-agents-kai-yuan-llm-jian-bao-2026nian-5yue-7ri

欢迎访问 小易撩挨踢

https://www.yijunzhao.cn/


评论