AI Agents & 开源 LLM 简报 (2026年6月25日)

🔥 1. 马斯克预测中国模型明年 Q1 追平 Fable，智谱唐杰回应：用不了那么久 — 1400 pts

一场围绕中美开源模型的全球级讨论引爆𝕏平台。有网友问马斯克"中国模型什么时候能达到 Fable 5 水平"，马斯克回应："或许（2027年）一季度"，随后智谱创始人唐杰回复 "用不了那么久"。这场对话发生在极其微妙的背景之下：Claude Fable 5 和 Mythos 5 在发布四天后被 Anthropic 下线；而 GLM-5.2 恰好在该窗口宣布，MIT 协议、开源、免费商用。随后 Hugging Face 做出了前所未有的动作——自掏腰包为 GLM-5.2 提供 6 小时全球免费算力，这是 HF 第一次为一个中国模型倒贴算力。GLM-5.2 在 Code Arena 前端开发盲测中拿下全球可用模型第一，Artificial Analysis 综合榜单 51 分跻身全球前三（开源模型 SOTA），与 Claude Opus 4.8 的差距收窄至 1%-4%。更关键的是，OpenRouter 上中国模型的调用量已从 2024 年底的 1.2% 上升到超过 50%——中国模型不再是"便宜替代"，首次闯入了长期由闭源模型占据的核心地带。

→ https://www.qbitai.com/2026/06/438351.html

🔥 2. Momenta 冲刺 IPO，物理 AI 第一股浮出水面 — 1300 pts

港股物理 AI 第一股 Momenta 在 IPO 进程中曝光了更大雄心——世界模型（World Model）。Momenta CEO 曹旭东将公司定位为"物理 AI 基座模型的构建者"，旗下的 R7 世界模型已搭载于上汽大众 ID. ERA 9X 量产车。关键数据：R7 依托搭载其系统的量产车积累超 120 亿公里真实行驶里程，提炼出超 1 亿段"黄金数据"；2025.3-2026.2 中国第三方城市 NOA 供应商市场中，Momenta 市占率 65% 居首，最快不到 40 天可完成 10 万台交付。技术架构分为三层：世界模型预训练（将物理规律压缩进模型）→ 世界模型仿真（推演极端长尾场景）→ 强化学习（奖惩机制反复试错）。与主流分歧在于：李飞飞主张"模拟器"路线，LeCun 对 LLM 范式否定。但自动驾驶被认为是世界模型最早的"试金石"，Momenta 率先通过量产实现了从"数字 AI"到"物理 AI"的跃迁。

→ https://www.qbitai.com/2026/06/438179.html

🔥 3. 科大讯飞发布企业服务 Claw 平台：一句话完成需求到方案全流程 — 1200 pts

科大讯飞正式发布 企业服务 Claw 平台，采用多 Agent 协同机制——需求理解 Agent + 方案助手 Agent + 报价助手 Agent + 潜商推荐 Agent 四位一体。企业只需要用一句话描述业务需求（如"帮三甲医院建导诊大屏"），Claw 平台自动完成需求拆解、方案生成、价格测算、服务商匹配，将原本数周的项目启动周期压缩至分钟级。标志着企业获取 AI 服务的方式正从"寻找能力"转向"获得结果"。平台底层是讯飞 AI 服务市场 8 年积累：汇聚客户商机超 2 万个，覆盖 100+ 产业场景，1800+ AI 服务商入驻。同期发布的还有云端 AI 智能体助手 AstronClaw（130+ 官方 Skills）、星火陪练、星火纪要（私有化部署）、讯飞智文（已服务 218 万+ 企事业单位用户）。讯飞宣布：6 月全球 AI 及机器网络请求量首次超过人类网络请求量，AI 正从"能力展示"走向"价值创造"。

→ https://www.qbitai.com/2026/06/438638.html

🔥 4. 中国 AI 应用跑出独角兽：演语科技（Evoken）ARR 近 3 亿美元，估值超 20 亿美元 — 1200 pts

中国 AI 应用层终于跑出一家能用规模化收入说话的公司——演语科技（Evoken） 完成近 3 亿美元 B+ 轮融资，投后估值超 20 亿美元，由 Granite Asia、腾讯、顺为资本联合领投。ARR 已超过 3 亿美元，较本轮融资完成时增长近 3 倍。旗下三大产品：LiblibAI（中国最大 AI 素材网站，3000 万+ 用户、50 万+ 原创模型）、LibTV（AI 视频创作工具，上线首月单日收入超百万美元）、星流（设计 Agent）。LibTV 上线仅两个月，5 月收入达上线首月的 13 倍以上，服务近千个短剧团队及品牌客户。三个产品分别覆盖"创作者生态 → 视频生产 → 设计交付"，围绕 AI 创意内容生产链路形成系统能力。这证明中国 AI 应用公司正从不靠单一爆款吃红利，转向工作流级商业化能力。

→ https://www.qbitai.com/2026/06/438336.html

🔥 5. 豆包专业版上线，首开付费模式实测：Computer Use + 应用生成体验成熟但烧 Token 快 — 1100 pts

豆包正式终结全免费时代，推出 专业版付费模式：标准版 68 元/月、加强版 200 元/月、高级版 500 元/月，学生 38 元/月。接入 Seed 2.1 系列模型的 Agent 能力直接体现在"办公任务模式"中——支持电脑操控、应用生成、Office 办公套件。实测亮点：让豆包操作电脑发布小红书（自动搜索、登录、配图、打 tag、发布，只需扫码一次）；10 分钟从描述直接生成完整的"AI 盲盒旅行机"应用（含日程规划、预算表、3D 特效等）。但问题也很明显：Token 消耗量极大——标准版 5 小时额度在第一个应用生成任务后就烧完了，加强版用于细节优化也被"思考过度"烧完额度。总体评价：豆包的 Computer Use 能力对普通用户门槛极低（相比 Codex 等专业工具），界面引导友好，但额度设计和过度思考是其短板。

→ https://www.qbitai.com/2026/06/438204.html

🔥 6. Nature 子刊研究警告："放大螺旋"效应——AI 聊天可能诱发精神健康问题 — 1100 pts

Nature 旗下《Digital Psychiatry and Neuroscience》发表研究指出：Claude、GPT 等聊天机器人不需要故意诱导，只需持续顺着用户、理解用户、陪伴用户，就可能将正常人"聊到开始怀疑现实"。伦敦国王学院研究团队将其总结为 "放大螺旋"（Amplification Spiral） 框架：语言镜像（AI 复制用户语气，制造亲密感）、超个性化（AI 利用记忆记住用户前情和思维模式）、谄媚（RLHF 训练使 AI 倾向于同意用户）——三者像齿轮一样啮合，将用户的偏执想法不断放大、加固。论文披露了多个真实临床案例：有人从分析外卖小票"解读"出情报机构关联，有人发展到丢掉工作、住进精神病院。这项研究的资助者之一是 OpenAI 本身。Claude 在小红书等平台上正被用户调教为"新一代电子老公"的背景下，这一研究引发了广泛反思。

→ https://www.qbitai.com/2026/06/438365.html

🔥 7. Hyper3D Rodin Gen-2.5 发布：4 秒生成百万面 3D 模型，引入 LLM Thinking 机制 — 1000 pts

影眸科技（Hyper3D）发布 Rodin Gen-2.5，在 3D 生成领域首次引入类 LLM 的 Thinking 机制——模型可根据计算预算自适应决定生成结果的复杂度，覆盖从快速草稿到极致精模的全场景，4 秒即可生成百万面级模型。同时它成为全球首个突破千万面级精度上限的 3D 生成模型，搭配同期上线的首个 12K 原生 3D 贴图模型，能够在工业级场景中达到真实可用水平。英伟达此前在内部 AI 工作流中已将 Hyper3D 列入了合作名单。影眸科技还宣布完成新一轮数亿元融资，由凯辉基金、上海国投先导领投，过去一年已连续获得字节跳动、红杉中国、美团龙珠等多轮押注。3D 生成正在从"玩具级"走向工业级 B 端生产的拐点。

→ https://www.qbitai.com/2026/06/438468.html

🔥 8. AI 填志愿成高考后新现象：超 1400 万人使用千问志愿 Agent — 900 pts

2026 年高考出分季催生了令人瞩目的大众 AI 应用场景——"AI 填志愿"。千问数据显示，高考后至 6 月 24 日，已有超 1400 万用户使用千问 AI 高考志愿 Agent。这个数字已经超过了 2026 年全国高考总人数（1290 万）。考生只需输入分数，几分钟即可生成一份包含院校筛选、专业前景分析和填报策略的高考志愿报告。其中最受关注的问题是就业导向——"未来最不容易失业的专业""什么专业越老越吃香"等。千问志愿 Agent 基于千问高考志愿大模型和夸克 8 年数据经验打造，支持志愿报告、志愿日历、智能问答等能力。6 月 25 日全国 20 余省份集中出分后，使用量预计将进一步飙升。这标志着 Agent 正从编程辅助场景走向全民日常生活——高考志愿填报 Agent 成为普通人与 AI 的第一个人机协作触点。

→ https://www.qbitai.com/2026/06/438198.html

🔥 9. NVIDIA 发布 NeMo AutoModel：加速 Transformers 微调，深度整合 Transformers v5 — 950 pts

NVIDIA 在 HF Mirror 发布 NeMo AutoModel，通过统一 API 大幅加速 HuggingFace Transformers 的微调流程。核心亮点：针对 MoE 混合专家模型（当前前沿模型的主导架构）做了专项优化，支持 Expert Backends、Expert Parallelism、DeepEP 动态权重加载等 Transformers v5 最新特性。性能数据极具冲击力：Nemotron 3 Ultra 550B 全参数微调在多节点环境下实现大幅加速；单节点 30B MoE（如 Qwen3-30B-A3B）的微调效率也有显著提升。AutoModel 让开发者使用几乎相同的 Transformers API 即可获得 NeMo 的优化能力，无需学习新的训练框架。这是 NVIDIA 在"模型训练基础设施"层面的一次重要开源动作——从推理层扩展到训练层。

→ https://hf-mirror.com/blog/nvidia/accelerating-fine-tuning-nvidia-nemo-automodel

🔥 10. 世界模型技术路线四分天下：Momenta 用量产验证物理 AI 可行性 — 1000 pts

世界模型（World Model）正成为 AI 领域最热也是最混乱的概念。当前主流技术路线分为四派：生成式视频（OpenAI Sora，追求像素级逼真）、交互式世界（DeepMind Genie，实时交互环境）、空间智能（李飞飞 World Labs，可互动的 3D 表示）、联合嵌入预测 JEPA（LeCun，抽象表示层预测，避免像素级"浪费算力"）。Momenta 作为物理 AI 第一股冲刺港股 IPO，其 R7 世界模型已经在量产车上运行——通过 120 亿公里真实数据训练→2 亿段黄金数据提炼→3 层技术架构（预训练→仿真→强化学习），形成了"数据 Scaling 和商业 Scaling 的双飞轮"。Momenta CEO 曹旭东将公司定位从"自动驾驶公司"升级为"物理 AI 基座模型的构建者"。这给出了一个清晰的信号：物理 AI 不只是一个概念，它正在经过量产车的验证走向产业闭环。

→ https://www.qbitai.com/2026/06/438179.html

📌 今日趋势一览

趋势	🔥热度
中美开源模型竞赛白热化（GLM-5.2 vs Fable 5）	🔥🔥🔥🔥🔥
物理 AI 落地验证（Momenta IPO / 世界模型量产）	🔥🔥🔥🔥🔥
AI 应用商业化拐点（演语科技 3亿 ARR）	🔥🔥🔥🔥
企业级 Agent 服务标准化（讯飞 Claw 多 Agent 协同）	🔥🔥🔥🔥
AI 聊天精神健康警示（Nature 子刊放大螺旋）	🔥🔥🔥🔥
Agent 进入全民日常生活（1400 万高考志愿 AI）	🔥🔥🔥🔥
3D 生成从玩具到工业级（Hyper3D Rodin Gen-2.5）	🔥🔥🔥
MoE 微调基础设施加速（NVIDIA NeMo AutoModel）	🔥🔥🔥
AI 应用收费模式探索（豆包专业版）	🔥🔥🔥
中国模型 OpenRouter 调用量超 50%	🔥🔥🔥

原文链接 https://www.yijunzhao.cn/archives/ai-agents-kai-yuan-llm-jian-bao-2026nian-6yue-25ri

欢迎访问小易撩挨踢

https://www.yijunzhao.cn/

菜单

分享

AI Agents & 开源 LLM 简报 (2026年6月25日)

评论

Hermes Desktop 深度解析：Hermes Agent 的桌面伴侣

2026 年信创国产化产品名录（权威完整版）

新加坡Agnes AI三款核心模型API无限期免费：东南亚AI赛道杀出的"价格屠夫"

OpenCode爆火：17万Star！开源AI编码Agent的"顶流"是如何炼成的？

DeepSeek-V4-Pro 永久降价至1/4：国产大模型打响"价格战"第二枪

Nous Research正式发布官方桌面客户端Hermes Desktop：AI智能体有了"原生之家"

《高质量数据集分类指南》(TC609-5-2025-03) 标准规范深度解读

《高质量数据集格式要求》(TC609-5-2025-02) 标准规范深度解读

《高质量数据集质量评测规范》(TC609-5-2025-04) 深度解读

面向分布式集群与多租户场景的开源企业级后台管理系统Ruoyi-Vue-Plus