🔥 1. Mistral 发布 Mistral-Specialist-7B:开源代码模型 HumanEval 达 92.3% — 412 pts
法国 Mistral AI 于 5 月 7 日发布专为代码生成优化的开源模型,7B 参数在 HumanEval 上达 92.3% 通过率,超越同等规模闭源模型。采用 Apache 2.0 许可证,对边缘部署和本地化代码助手意义重大。
→ https://mistral.ai/news/mistral-specialist-7b
🔥 2. Google 发布 Gemini Agent 2.0 SDK:原生集成 Workspace 与第三方 API — 378 pts
Google 于 5 月 5 日推出 Gemini Agent 2.0 SDK,支持开发者构建能自主规划、执行和迭代任务的 AI Agent。原生集成 Google Workspace 和第三方 API,大幅降低专业 Agent 开发门槛。
→ https://developers.google.com/gemini-agent-2.0
🔥 3. Cognition Labs 完成 2 亿美元 B 轮,估值达 30 亿 — 342 pts
AI 编程 Agent Devin 的母公司 Cognition Labs 于 5 月 5 日宣布完成 B 轮融资,a16z 领投,估值达 30 亿美元。Devin 已能自主完成从需求分析到部署运维的全流程,本轮将拓展企业市场并开源部分基础组件。
→ https://cognition.ai/blog/series-b-2026
🔥 4. 开源社区发布「智言-14B」中文模型,超越 GPT-4o-mini — 268 pts
中国开源社区于 5 月 6 日联合发布 ZhiYan-14B,在 C-Eval 和 CMMLU 等中文基准上超越 GPT-4o-mini。MIT 许可证,8K 上下文,针对医疗、法律等专业领域微调,已登顶 Open LLM Leaderboard 中文榜。
→ https://huggingface.co/zhiyan-ai/ZhiYan-14B
🔥 5. 开源框架 AgentHub v2.0 发布:跨平台多 Agent 协作 — 198 pts
开源 Agent 编排框架 AgentHub 于 5 月 6 日发布 v2.0,首次支持跨操作系统(Linux/macOS/Windows)的多 Agent 协作,可编排数百个 Agent 共同完成复杂任务,GitHub 已获 15,000+ 星。
→ https://github.com/agenthub/agenthub
📌 今日趋势一览
原文链接
欢迎访问 小易撩挨踢