🔥 1. Hugging Face 将 hf CLI 改造为 Agent 优化的 Hub 交互方式 — 498 pts
Hugging Face 于 6 月 4 日发布新博文,宣布将 hf CLI 重新设计为 agent-optimized 的 Hub 交互方式。这意味着 Hugging Face 正在从「为人类开发者设计 CLI」转向「为 AI Agent 设计 API/CLI」。当 Agent 成为主要使用者时,CLI 的输出格式、错误处理、鉴权方式都需要重新设计。这是 AI 基础设施适应 Agent 时代的一个信号——未来的 CLI 不仅要给人用,更要给 Agent 用。
→ https://hf-mirror.com/blog/hf-cli-for-agents
🔥 2. ServiceNow 发布 EVA-Bench Data 2.0:3 个领域、121 个工具、213 个场景 — 468 pts
ServiceNow AI 在 Hugging Face 上发布 EVA-Bench Data 2.0,一个覆盖 3 个企业领域、121 个工具、213 个场景的 Agent 评测数据集。核心发现是:语音 Agent 故障高度领域特定——一个在机票改签场景下完美运行的系统,在处理 HR 策略时可能完全失效。EVA-Bench 2.0 为企业 Agent 提供了更细粒度的场景化评估标准,不再笼统地看「准确率」,而是按工具、场景、领域分别评估。
→ https://hf-mirror.com/blog/ServiceNow-AI/eva-bench-data
🔥 3. NVIDIA 发布 Nemotron 3.5 Content Safety:可定制的多模态安全方案 — 432 pts
NVIDIA 发布 Nemotron 3.5 Content Safety,面向全球企业 AI 的可定制多模态安全方案。随着 AI Agent 被部署到更多企业场景,内容安全从「过滤不良内容」扩展到「确保 Agent 的行为符合企业策略和合规要求」。Nemotron 3.5 支持图像、文本等多模态输入的安全审查,为企业 Agent 的大规模部署提供了关键的安全基础设施。
→ https://hf-mirror.com/blog/nvidia/nemotron-3-5-content-safety
🔥 4. 阶跃 Step 3.7 Flash 登顶 AA 榜:速度、性价比、端到端三项第一 — 398 pts
阶跃星辰发布的 Step 3.7 Flash 在 OpenRouter Trending 上热度暴涨稳居全球第二,同时在 AA 榜拿下速度、性价比、端到端三项第一。实测中模型表现出强大的多模态能力——手把手教用户使用 Blender 专业 3D 软件,甚至通过屏幕识别引导用户操作飞机模拟器。在 HuggingFace 上开源后下载量和讨论热度持续攀升。这是国产模型在「速度+性价比」维度的一次强势出击。
→ https://www.qbitai.com/2026/06/429294.html
🔥 5. 腾讯云发布 WorkBuddy 企业版及 Agent Suite:从超级个体到超级团队 — 362 pts
腾讯云在京召开 AI 产业应用大会,正式发布 WorkBuddy 企业版和办公智能体套件 Agent Suite。这是行业内首套「AI 原生组织进化解决方案」,定位从「超级个体」到「超级团队」。提供 7×24 专家数字员工、人机协作「团队」模式和企业级管理后台三大核心能力。将腾讯文档、腾讯网盘和腾讯乐享深度集成,帮助实现「个人提效」到「组织协同」的闭环。腾讯宣布 AI Agent 下半场的主线是进入企业业务真实场景。
→ https://www.qbitai.com/2026/06/430758.html
🔥 6. 金山办公发布 WPS 笔记:AI 原生多模态笔记产品 — 328 pts
金山办公正式发布 AI 笔记产品 WPS 笔记,定位为「AI 原生多模态笔记产品」。支持语音、图片、文字、网页等多种信息录入方式,将 AI 能力贯穿从记录到复用的全过程。WPS 笔记研发负责人指出:AI 时代的知识工作者不缺少信息,真正缺少的是能被理解、被找到、被复用的信息。产品将信息处理流程拆解为五步闭环:录入、理解、组织、检索、复用。今年 3 月内测以来已吸引超 10000 名用户参与。
→ https://www.qbitai.com/2026/06/431014.html
🔥 7. 全球首个机器人训练楼盘「开盘」:30 万套中国住宅供机器人训练 — 298 pts
具身智能领域出现了一种全新的训练资源形态——「机器人训练楼盘」,提供 30 万套中国真实住宅场景供机器人训练。与虚拟仿真环境不同,真实住宅中的家具布局、光照变化、物品摆放差异对环境泛化能力至关重要。这一模式将大幅加速家用机器人的训练效率,是具身智能基础设施的又一次进化。
→ https://www.qbitai.com/2026/06/429349.html
🔥 8. 华为云发布 Agentic AI 系列新品:打造智能时代「硅基黑土地」— 268 pts
华为云发布 Agentic AI 系列新品,延续其「黑土地」战略定位,面向 Agent 时代提供底层算力和平台支撑。华为的 Agentic AI 布局涵盖从昇腾芯片到盘古大模型再到 Agent 开发平台的全栈能力。在 Anthropic、OpenAI、Google 等国际巨头密集发布 Agent 产品的背景下,华为云在 Agent 基础设施上的布局也在加速。
→ https://www.qbitai.com/2026/06/431027.html
🔥 9. HuggingFace Agent 基础设施三连发:DPO、CLI、工具标准 — 238 pts
Hugging Face 本周密集发布 Agent 基础设施相关内容:DPO Beyond Chatbots(偏好优化扩展到 Agent)、hf CLI for Agents(Agent 优化的 CLI 设计),加上此前发布的 Agent 术语表。Hugging Face 正在成为 Agent 基础设施标准的重要制定者。这三篇博文从训练方法、开发工具到术语标准,系统性地覆盖了 Agent 开发的三个关键层次。
→ https://hf-mirror.com/blog/Dharma-AI/direct-preference-optimization-beyond-chatbots
→ https://hf-mirror.com/blog/hf-cli-for-agents
→ https://hf-mirror.com/blog/agent-glossary
🔥 10. NVIDIA Nemotron 3.5 + EVA-Bench 2.0:企业 Agent 的安全与评测标准成型 — 208 pts
NVIDIA 的 Nemotron 3.5 Content Safety 和 ServiceNow 的 EVA-Bench Data 2.0 在同一天发布,共同指向企业 Agent 落地的两个核心问题:安全和评测。Nemotron 3.5 解决「Agent 行为如何符合企业策略」,EVA-Bench 2.0 解决「Agent 在不同场景下能力如何」。当 Agent 从 Demo 走向生产环境,安全和评测成为两个必须攻克的工程化难题。
→ https://hf-mirror.com/blog/nvidia/nemotron-3-5-content-safety
→ https://hf-mirror.com/blog/ServiceNow-AI/eva-bench-data
📌 今日趋势一览
原文链接
欢迎访问 小易撩挨踢