AI Agents & 开源 LLM 简报 (2026年6月24日)

🔥 1. Claude Tag 发布：Anthropic 推出企业级团队协作 Agent，卡帕西称"LLM 第三次变革" — 1400 pts

Anthropic 正式发布 Claude Tag，定位为 Claude Code 的进化版——不仅是一个升级版的编程 Agent，更是一套深入企业组织上下文、知识和协作工作流的系统。目前 Anthropic 约 65% 的产品代码已由 Claude Tag 参与完成。核心创新在于四点：共享上下文（整个频道共享同一个 Claude，不是每人一个聊天窗口）、持续记忆（累积企业知识）、主动介入（Ambient Mode）（Claude 不再被动等提问，而是主动提醒被忽视的讨论、跟进超时问题）、异步执行（布置完任务可以离开 Slack，Claude 自己跑流程并在完成后再回来汇报）。刚加入 Anthropic 的 Karpathy 第一时间站台，称这是 LLM 用户界面的第三次重大变革——从网页聊天到桌面应用，再到"独立、持续运行、拥有组织工具和上下文的系统"。Claude Tag 目前仅支持 Opus 4.8，可直接在 Slack 中 @Claude 调用，已接入 GitHub、Jira、Linear 等工具。

→ https://www.qbitai.com/2026/06/437734.html

🔥 2. 字节豆包 Seed 2.1 发布：Agent 连续运行 18 小时完成芯片设计代码，编程比肩 Opus 4.7 — 1300 pts

字节跳动发布 Seed 2.1 系列（含 Pro 和 Turbo 两个版本），API 已全量上线火山方舟。最大亮点：Agent 自主运行能力——Seed 2.1 Pro 围绕一个 16×16 PE 的 Tiny NPU Tile，连续运行近 18 小时、经历 9 轮迭代，最终完成 6 个核心模块、1303 行 RTL 代码（芯片设计的寄存器传输级代码），通常这需要 3-5 名人类工程师花数周时间。评测方面，Terminal Bench 2.1 编程评测持平 Opus 4.7，SciCode 科学计算代码超过 Opus 4.7 和 GPT-5.5，MCP-Atlas 工具调用同样超过两项。在最新的 Agents' Last Exam（ALE） 基准（覆盖 13 个行业集群、1000+ 真实任务）中已处于第一梯队。价格仅为同类闭源模型的 1/4（输入 6 元/百万 Token，输出 30 元）。豆包日均 Token 使用量已突破 180 万亿。

→ https://www.qbitai.com/2026/06/437503.html

🔥 3. HIL-ResRL 发布：1 小时真机 RL 微调让 VLA 机器人成功率破 95% — 1200 pts

华为云 CloudRobo 团队在 arXiv 发布 HIL-ResRL（人机协同残差强化学习），提出一种即插即用的 VLA "外挂"方案。核心思路：把基础 VLA 模型当成黑盒冻结，额外训练一个极轻量的残差网络来输出修正动作，同时让人类操作员通过 3D SpaceMouse 在关键时刻"扶一把"。这意味着不需要获取 VLA 模型的权重或架构细节，任何已有的 Diffusion Policy 或 π0.5 等模型都可直接接入。仅需 1 小时真机在线训练，任务成功率即可从基础模型的 60-70% 突破到 95% 以上。关键设计包括人类在环（HIL）机制确保安全探索、聚焦困难样本、离策略强化学习极速收敛。这对柔性制造业中快速部署 VLA 模型极具实际价值。

→ https://www.qbitai.com/2026/06/438166.html

🔥 4. 360 发布"图龙锋"中国版 Mythos：AI 自主挖掘漏洞 3432 个 — 1200 pts

ISC.AI 2026 大会上，周鸿祎发布 360 AI 安全两大核心能力—— "图龙锋"（漏洞自动化挖掘智能体）和 "仪天阵"（网络安全自动化防御系统）。图龙锋被视为中国版 Mythos，已累计挖掘漏洞 3432 个，其中监管确认 105 个，多个被国家漏洞库定义为高危。它将漏洞发现从"靠专家经验偶然中彩票"变成了"可持续、可验证、可规模化的智能体作业流程"。周鸿祎表示，"图龙锋已具备 Mythos 同等能力"。仪天阵则面向自动化防御，让安全运营从"人海战术"走向"自动驾驶"。360 同时联合飞腾、麒麟、海光等信创企业发起"磐石之盾"安全协作计划。周鸿祎预测，未来几年中国关键基础设施将进入网络攻击高发期，中国不能"坐等风险爆发"。

→ https://www.qbitai.com/2026/06/437838.html

🔥 5. 阿里 QoderWork 推"峰谷 Token"：夜间 Agent 使用 Qwen3.7 低至 2 折 — 1000 pts

阿里 QoderWork 推出国内首个 "峰谷 Token" 计费机制——Agent 在每晚 22:00 到次日 08:00 运行可自动享受折扣，其中 Qwen3.7-Max 模型低至 2 折。用户白天设定定时任务或提交长程指令，Qwen3.7 模型在夜间自动运行，早上验收结果。这标志着 Agent 基础设施正在从"按量计费"演进到"峰谷电价"模式，类似电网的阶梯电价思路，把非高峰时段的计算资源转化为用户的成本优势。某种意义上，这是在推动 Agent 从"实时交互"走向"批量异步任务"——把 Agent 当成"夜间自动运行的数字化员工"来使用。折扣覆盖 QoderWork、Qoder Desktop 等产品线。

→ https://www.qbitai.com/2026/06/437834.html

🔥 6. 百度千帆 Token Plan 企业版发布：率先适配 GLM-5.2，聚合多模型统一管理 — 1000 pts

百度智能云发布 千帆 Token Plan 企业版，定位为企业级 AI 生产力订阅服务。核心创新："席位制 + 企业共享积分包"模式——企业按组织规模和需求采购席位，所有员工共享统一额度池，支持 DeepSeek-V4、GLM-5.2、Kimi-K2.6 等多模型统一调用和 Credits 统一抵扣。百度千帆已率先完成对智谱 GLM-5.2 的适配，企业无需部署即可在长程任务、复杂推理、Coding 等场景调用。这标志着企业 AI 资源管理正从"员工各自采购工具"（SaaS 模式）演进到"AI 作为统一生产力平台"（AI-as-Utility 模式）。提供轻享版/标准版/高级版等多档位席位方案。

→ https://www.qbitai.com/2026/06/438174.html

🔥 7. 周鸿祎：Mythos 对安全行业形成降维打击，中国不能坐等风险爆发 — 1100 pts

在 ISC.AI 2026 演讲中，周鸿祎对近期引发全球关注的安全模型 Mythos 做出深度分析。他警告：当 AI 能够快速、批量发现漏洞时，网络安全的游戏规则将被彻底改写。"过去网络安全建立在'漏洞难找'的基础上，高价值漏洞发现成本高昂，只有少数专家和国家级团队能做到。但 Mythos 改变了这一切——它让漏洞发现变得更快、更便宜、更规模化。"他判断未来几年中国关键基础设施将进入网络攻击高发期，对手已经复制出一批黑客智能体同时工作，"敌快我慢、敌众我寡"已成现实。中国不能简单照搬国外"大力出奇迹"路线，应发挥工程化优势，走智能体路线——将大模型能力、安全专家经验、漏洞知识库组织成可协同工作的智能体系统。这与 IBM 的 Agent Logic 论点形成了行业呼应。

→ https://www.qbitai.com/2026/06/437838.html

🔥 8. 高通从智能座舱之王转型物理 AI：车端 AI Agent 已量产落地 — 1000 pts

高通在 2026 汽车技术与合作峰会上展示了物理 AI 的完整落地案例。虽然被标签化为"智能座舱之王"，但高通正在悄悄完成认知跃迁——从座舱芯片供应商向物理 AI 基础计算层转型。亮点包括：车端 AI Agent已在量产车上路，不仅能完成全场景端到端 AI 驾驶，还能记住"雨伞放扶手箱"、识别熟人并提醒戒烟。高通宣布与诚迈科技等发起了"车端人工智能 Claw 生态计划"，加速 AI 智能体在车端规模化部署。座舱芯片累计出货超 7500 万套，每周 1.2 款新车下线的数据背后，高通正在构建"跨设备智能无处不在地运行"的物理 AI 生态。核心武器是 Flex 平台的混合关键级架构——在单芯片上安全隔离 AI 任务和安全关键任务。

→ https://www.qbitai.com/2026/06/432494.html

🔥 9. IBM 开源 CUGA Agent Harness：两打单文件 App 证明"一行代码即可构建 Agent" — 1000 pts

IBM Research 在 HF Mirror 发布 CUGA（Configurable Generalist Agent） 的完整应用指南——一个开源的 Agent 驯马器（Harness），专为企业级部署设计。核心理念：构建 Agent 90% 的工作是管道代码（工具、状态、护栏、扩缩），CUGA 帮你把这些全做了，你只需要写一个工具列表和一个 Prompt。IBM 用 24 个单文件 App 来证明这一设计，覆盖从简单任务到复杂多 Agent 编排。CUGA 支持从单 Agent 扩展到多 Agent 治理而无需重写——同一套 Agent 可以从开发环境无缝部署到生产环境，实现"由构造天然受控"。这补充了 IBM 之前的 Agent Logic 论点：好的 Agent 不是写出来的，是由好的 Harness 生长出来的。

→ https://hf-mirror.com/blog/ibm-research/cuga-apps

🔥 10. WAIC Future Tech：153 家早期 AI 项目登台，具身智能和数据底座最热 — 950 pts

2026 年世界人工智能大会 Future Tech 专区从 1200 个创新项目中筛选出 153 家初创企业和 22 个 OPC 项目，集中在行业应用和具身智能两条赛道。亮点项目包括：量坤科技（量子计算与大模型融合的科学智能体，成立 5 个月融资数亿元）、形界智维（流式视频生成，Stream-R1/Stream-T1 曾包揽 Hugging Face 日榜冠亚军）、渊澈太初（基于神经肌电信号的具身数据底座，半年融资超 5 亿元）、萝博派对（00 后团队专注开源双足人形机器人，获近亿美元融资）。这显示出 AI 创业的最新趋势——Agent + 硬件 + 数据底座正在成为资本最关注的结构性机会。

→ https://www.qbitai.com/2026/06/438157.html

📌 今日趋势一览

趋势	🔥热度
企业级 Agent 协作（Claude Tag / 千帆 Token Plan）	🔥🔥🔥🔥🔥
中国版 Mythos 与 AI 安全博弈（360 图龙锋）	🔥🔥🔥🔥🔥
Agent 自主长周期任务（Seed 2.1 18 小时芯片设计）	🔥🔥🔥🔥🔥
VLA 机器人即插即用强化学习（HIL-ResRL）	🔥🔥🔥🔥
Agent 成本优化（阿里峰谷 Token）	🔥🔥🔥🔥
物理 AI 量产落地（高通/DeepWay 货运）	🔥🔥🔥🔥
Agent Harness 标准化（IBM CUGA 开源）	🔥🔥🔥🔥
AI 早期项目投资热潮（WAIC Future Tech）	🔥🔥🔥
企业级开源模型服务平台（百度千帆 + GLM-5.2）	🔥🔥🔥
自动驾驶从数字 AI 走向物理 AI	🔥🔥🔥

原文链接 https://www.yijunzhao.cn/archives/ai-agents-kai-yuan-llm-jian-bao-2026nian-6yue-24ri

欢迎访问小易撩挨踢

https://www.yijunzhao.cn/

菜单

分享

AI Agents & 开源 LLM 简报 (2026年6月24日)

评论

Hermes Desktop 深度解析：Hermes Agent 的桌面伴侣

2026 年信创国产化产品名录（权威完整版）

新加坡Agnes AI三款核心模型API无限期免费：东南亚AI赛道杀出的"价格屠夫"

OpenCode爆火：17万Star！开源AI编码Agent的"顶流"是如何炼成的？

DeepSeek-V4-Pro 永久降价至1/4：国产大模型打响"价格战"第二枪

《高质量数据集分类指南》(TC609-5-2025-03) 标准规范深度解读

Nous Research正式发布官方桌面客户端Hermes Desktop：AI智能体有了"原生之家"

《高质量数据集格式要求》(TC609-5-2025-02) 标准规范深度解读

《高质量数据集质量评测规范》(TC609-5-2025-04) 深度解读

面向分布式集群与多租户场景的开源企业级后台管理系统Ruoyi-Vue-Plus