易君召
易君召
发布于 2026-06-24 / 5 阅读
0
0

AI Agents & 开源 LLM 简报 (2026年6月24日)

#AI

🔥 1. Claude Tag 发布:Anthropic 推出企业级团队协作 Agent,卡帕西称"LLM 第三次变革" — 1400 pts

Anthropic 正式发布 Claude Tag,定位为 Claude Code 的进化版——不仅是一个升级版的编程 Agent,更是一套深入企业组织上下文、知识和协作工作流的系统。目前 Anthropic 约 65% 的产品代码已由 Claude Tag 参与完成。核心创新在于四点:共享上下文(整个频道共享同一个 Claude,不是每人一个聊天窗口)、持续记忆(累积企业知识)、主动介入(Ambient Mode)(Claude 不再被动等提问,而是主动提醒被忽视的讨论、跟进超时问题)、异步执行(布置完任务可以离开 Slack,Claude 自己跑流程并在完成后再回来汇报)。刚加入 Anthropic 的 Karpathy 第一时间站台,称这是 LLM 用户界面的第三次重大变革——从网页聊天到桌面应用,再到"独立、持续运行、拥有组织工具和上下文的系统"。Claude Tag 目前仅支持 Opus 4.8,可直接在 Slack 中 @Claude 调用,已接入 GitHub、Jira、Linear 等工具。

https://www.qbitai.com/2026/06/437734.html

🔥 2. 字节豆包 Seed 2.1 发布:Agent 连续运行 18 小时完成芯片设计代码,编程比肩 Opus 4.7 — 1300 pts

字节跳动发布 Seed 2.1 系列(含 Pro 和 Turbo 两个版本),API 已全量上线火山方舟。最大亮点:Agent 自主运行能力——Seed 2.1 Pro 围绕一个 16×16 PE 的 Tiny NPU Tile,连续运行近 18 小时、经历 9 轮迭代,最终完成 6 个核心模块、1303 行 RTL 代码(芯片设计的寄存器传输级代码),通常这需要 3-5 名人类工程师花数周时间。评测方面,Terminal Bench 2.1 编程评测持平 Opus 4.7,SciCode 科学计算代码超过 Opus 4.7 和 GPT-5.5,MCP-Atlas 工具调用同样超过两项。在最新的 Agents' Last Exam(ALE) 基准(覆盖 13 个行业集群、1000+ 真实任务)中已处于第一梯队。价格仅为同类闭源模型的 1/4(输入 6 元/百万 Token,输出 30 元)。豆包日均 Token 使用量已突破 180 万亿

https://www.qbitai.com/2026/06/437503.html

🔥 3. HIL-ResRL 发布:1 小时真机 RL 微调让 VLA 机器人成功率破 95% — 1200 pts

华为云 CloudRobo 团队在 arXiv 发布 HIL-ResRL(人机协同残差强化学习),提出一种即插即用的 VLA "外挂"方案。核心思路:把基础 VLA 模型当成黑盒冻结,额外训练一个极轻量的残差网络来输出修正动作,同时让人类操作员通过 3D SpaceMouse 在关键时刻"扶一把"。这意味着不需要获取 VLA 模型的权重或架构细节,任何已有的 Diffusion Policy 或 π0.5 等模型都可直接接入。仅需 1 小时真机在线训练,任务成功率即可从基础模型的 60-70% 突破到 95% 以上。关键设计包括人类在环(HIL)机制确保安全探索、聚焦困难样本、离策略强化学习极速收敛。这对柔性制造业中快速部署 VLA 模型极具实际价值。

https://www.qbitai.com/2026/06/438166.html

🔥 4. 360 发布"图龙锋"中国版 Mythos:AI 自主挖掘漏洞 3432 个 — 1200 pts

ISC.AI 2026 大会上,周鸿祎发布 360 AI 安全两大核心能力—— "图龙锋"(漏洞自动化挖掘智能体)"仪天阵"(网络安全自动化防御系统)。图龙锋被视为中国版 Mythos,已累计挖掘漏洞 3432 个,其中监管确认 105 个,多个被国家漏洞库定义为高危。它将漏洞发现从"靠专家经验偶然中彩票"变成了"可持续、可验证、可规模化的智能体作业流程"。周鸿祎表示,"图龙锋已具备 Mythos 同等能力"。仪天阵则面向自动化防御,让安全运营从"人海战术"走向"自动驾驶"。360 同时联合飞腾、麒麟、海光等信创企业发起"磐石之盾"安全协作计划。周鸿祎预测,未来几年中国关键基础设施将进入网络攻击高发期,中国不能"坐等风险爆发"。

https://www.qbitai.com/2026/06/437838.html

🔥 5. 阿里 QoderWork 推"峰谷 Token":夜间 Agent 使用 Qwen3.7 低至 2 折 — 1000 pts

阿里 QoderWork 推出国内首个 "峰谷 Token" 计费机制——Agent 在每晚 22:00 到次日 08:00 运行可自动享受折扣,其中 Qwen3.7-Max 模型低至 2 折。用户白天设定定时任务或提交长程指令,Qwen3.7 模型在夜间自动运行,早上验收结果。这标志着 Agent 基础设施正在从"按量计费"演进到"峰谷电价"模式,类似电网的阶梯电价思路,把非高峰时段的计算资源转化为用户的成本优势。某种意义上,这是在推动 Agent 从"实时交互"走向"批量异步任务"——把 Agent 当成"夜间自动运行的数字化员工"来使用。折扣覆盖 QoderWork、Qoder Desktop 等产品线。

https://www.qbitai.com/2026/06/437834.html

🔥 6. 百度千帆 Token Plan 企业版发布:率先适配 GLM-5.2,聚合多模型统一管理 — 1000 pts

百度智能云发布 千帆 Token Plan 企业版,定位为企业级 AI 生产力订阅服务。核心创新:"席位制 + 企业共享积分包"模式——企业按组织规模和需求采购席位,所有员工共享统一额度池,支持 DeepSeek-V4、GLM-5.2、Kimi-K2.6 等多模型统一调用和 Credits 统一抵扣。百度千帆已率先完成对智谱 GLM-5.2 的适配,企业无需部署即可在长程任务、复杂推理、Coding 等场景调用。这标志着企业 AI 资源管理正从"员工各自采购工具"(SaaS 模式)演进到"AI 作为统一生产力平台"(AI-as-Utility 模式)。提供轻享版/标准版/高级版等多档位席位方案。

https://www.qbitai.com/2026/06/438174.html

🔥 7. 周鸿祎:Mythos 对安全行业形成降维打击,中国不能坐等风险爆发 — 1100 pts

在 ISC.AI 2026 演讲中,周鸿祎对近期引发全球关注的安全模型 Mythos 做出深度分析。他警告:当 AI 能够快速、批量发现漏洞时,网络安全的游戏规则将被彻底改写。"过去网络安全建立在'漏洞难找'的基础上,高价值漏洞发现成本高昂,只有少数专家和国家级团队能做到。但 Mythos 改变了这一切——它让漏洞发现变得更快、更便宜、更规模化。"他判断未来几年中国关键基础设施将进入网络攻击高发期,对手已经复制出一批黑客智能体同时工作,"敌快我慢、敌众我寡"已成现实。中国不能简单照搬国外"大力出奇迹"路线,应发挥工程化优势,走智能体路线——将大模型能力、安全专家经验、漏洞知识库组织成可协同工作的智能体系统。这与 IBM 的 Agent Logic 论点形成了行业呼应。

https://www.qbitai.com/2026/06/437838.html

🔥 8. 高通从智能座舱之王转型物理 AI:车端 AI Agent 已量产落地 — 1000 pts

高通在 2026 汽车技术与合作峰会上展示了物理 AI 的完整落地案例。虽然被标签化为"智能座舱之王",但高通正在悄悄完成认知跃迁——从座舱芯片供应商向物理 AI 基础计算层转型。亮点包括:车端 AI Agent已在量产车上路,不仅能完成全场景端到端 AI 驾驶,还能记住"雨伞放扶手箱"、识别熟人并提醒戒烟。高通宣布与诚迈科技等发起了"车端人工智能 Claw 生态计划",加速 AI 智能体在车端规模化部署。座舱芯片累计出货超 7500 万套,每周 1.2 款新车下线的数据背后,高通正在构建"跨设备智能无处不在地运行"的物理 AI 生态。核心武器是 Flex 平台的混合关键级架构——在单芯片上安全隔离 AI 任务和安全关键任务。

https://www.qbitai.com/2026/06/432494.html

🔥 9. IBM 开源 CUGA Agent Harness:两打单文件 App 证明"一行代码即可构建 Agent" — 1000 pts

IBM Research 在 HF Mirror 发布 CUGA(Configurable Generalist Agent) 的完整应用指南——一个开源的 Agent 驯马器(Harness),专为企业级部署设计。核心理念:构建 Agent 90% 的工作是管道代码(工具、状态、护栏、扩缩),CUGA 帮你把这些全做了,你只需要写一个工具列表和一个 Prompt。IBM 用 24 个单文件 App 来证明这一设计,覆盖从简单任务到复杂多 Agent 编排。CUGA 支持从单 Agent 扩展到多 Agent 治理而无需重写——同一套 Agent 可以从开发环境无缝部署到生产环境,实现"由构造天然受控"。这补充了 IBM 之前的 Agent Logic 论点:好的 Agent 不是写出来的,是由好的 Harness 生长出来的。

https://hf-mirror.com/blog/ibm-research/cuga-apps

🔥 10. WAIC Future Tech:153 家早期 AI 项目登台,具身智能和数据底座最热 — 950 pts

2026 年世界人工智能大会 Future Tech 专区从 1200 个创新项目中筛选出 153 家初创企业和 22 个 OPC 项目,集中在行业应用和具身智能两条赛道。亮点项目包括:量坤科技(量子计算与大模型融合的科学智能体,成立 5 个月融资数亿元)、形界智维(流式视频生成,Stream-R1/Stream-T1 曾包揽 Hugging Face 日榜冠亚军)、渊澈太初(基于神经肌电信号的具身数据底座,半年融资超 5 亿元)、萝博派对(00 后团队专注开源双足人形机器人,获近亿美元融资)。这显示出 AI 创业的最新趋势——Agent + 硬件 + 数据底座正在成为资本最关注的结构性机会。

https://www.qbitai.com/2026/06/438157.html

📌 今日趋势一览

趋势

🔥热度

企业级 Agent 协作(Claude Tag / 千帆 Token Plan)

🔥🔥🔥🔥🔥

中国版 Mythos 与 AI 安全博弈(360 图龙锋)

🔥🔥🔥🔥🔥

Agent 自主长周期任务(Seed 2.1 18 小时芯片设计)

🔥🔥🔥🔥🔥

VLA 机器人即插即用强化学习(HIL-ResRL)

🔥🔥🔥🔥

Agent 成本优化(阿里峰谷 Token)

🔥🔥🔥🔥

物理 AI 量产落地(高通/DeepWay 货运)

🔥🔥🔥🔥

Agent Harness 标准化(IBM CUGA 开源)

🔥🔥🔥🔥

AI 早期项目投资热潮(WAIC Future Tech)

🔥🔥🔥

企业级开源模型服务平台(百度千帆 + GLM-5.2)

🔥🔥🔥

自动驾驶从数字 AI 走向物理 AI

🔥🔥🔥


原文链接 https://www.yijunzhao.cn/archives/ai-agents-kai-yuan-llm-jian-bao-2026nian-6yue-24ri

欢迎访问 小易撩挨踢

https://www.yijunzhao.cn/


评论