AI Agents & 开源 LLM 简报 (2026年5月7日)

🔥 1. Mistral 发布 Mistral-Specialist-7B：开源代码模型 HumanEval 达 92.3% — 412 pts
法国 Mistral AI 于 5 月 7 日发布专为代码生成优化的开源模型，7B 参数在 HumanEval 上达 92.3% 通过率，超越同等规模闭源模型。采用 Apache 2.0 许可证，对边缘部署和本地化代码助手意义重大。
→ https://mistral.ai/news/mistral-specialist-7b

🔥 2. Google 发布 Gemini Agent 2.0 SDK：原生集成 Workspace 与第三方 API — 378 pts
Google 于 5 月 5 日推出 Gemini Agent 2.0 SDK，支持开发者构建能自主规划、执行和迭代任务的 AI Agent。原生集成 Google Workspace 和第三方 API，大幅降低专业 Agent 开发门槛。
→ https://developers.google.com/gemini-agent-2.0

🔥 3. Cognition Labs 完成 2 亿美元 B 轮，估值达 30 亿 — 342 pts
AI 编程 Agent Devin 的母公司 Cognition Labs 于 5 月 5 日宣布完成 B 轮融资，a16z 领投，估值达 30 亿美元。Devin 已能自主完成从需求分析到部署运维的全流程，本轮将拓展企业市场并开源部分基础组件。
→ https://cognition.ai/blog/series-b-2026

🔥 4. 开源社区发布「智言-14B」中文模型，超越 GPT-4o-mini — 268 pts
中国开源社区于 5 月 6 日联合发布 ZhiYan-14B，在 C-Eval 和 CMMLU 等中文基准上超越 GPT-4o-mini。MIT 许可证，8K 上下文，针对医疗、法律等专业领域微调，已登顶 Open LLM Leaderboard 中文榜。
→ https://huggingface.co/zhiyan-ai/ZhiYan-14B

🔥 5. 开源框架 AgentHub v2.0 发布：跨平台多 Agent 协作 — 198 pts
开源 Agent 编排框架 AgentHub 于 5 月 6 日发布 v2.0，首次支持跨操作系统（Linux/macOS/Windows）的多 Agent 协作，可编排数百个 Agent 共同完成复杂任务，GitHub 已获 15,000+ 星。
→ https://github.com/agenthub/agenthub

📌 今日趋势一览

趋势	热度
开源代码模型超越同等闭源 (Mistral-Specialist-7B)	🔥🔥🔥🔥🔥
Agent 开发框架 SDK 化 (Gemini Agent 2.0 SDK)	🔥🔥🔥🔥
AI 编程 Agent 持续吸金 (Cognition $200M B 轮)	🔥🔥🔥🔥
国产中文模型追赶加速 (智言-14B 超 GPT-4o-mini)	🔥🔥🔥🔥
跨平台多 Agent 协作工程化 (AgentHub v2.0)	🔥🔥🔥
专业领域微调成为差异化方向 (医疗/法律)	🔥🔥🔥

原文链接 https://www.yijunzhao.cn/archives/ai-agents-kai-yuan-llm-jian-bao-2026nian-5yue-7ri

欢迎访问小易撩挨踢

https://www.yijunzhao.cn/

菜单

分享

AI Agents & 开源 LLM 简报 (2026年5月7日)

2026 年信创国产化产品名录（权威完整版）

Hermes Desktop 深度解析：Hermes Agent 的桌面伴侣

MinIO 已死！2026 年最全开源替代方案终极指南

新加坡Agnes AI三款核心模型API无限期免费：东南亚AI赛道杀出的"价格屠夫"

OpenCode爆火：17万Star！开源AI编码Agent的"顶流"是如何炼成的？

主流免费 VNC 工具完整清单

《高质量数据集格式要求》(TC609-5-2025-02) 标准规范深度解读

DeepSeek-V4-Pro 永久降价至1/4：国产大模型打响"价格战"第二枪

《高质量数据集分类指南》(TC609-5-2025-03) 标准规范深度解读

💾 2026 年 NAS 全面横评：极空间/绿联/华为 vs 群晖/威联通，国产品牌逆袭了吗？