今日重点: 英伟达推出机器人自我研究框架ENPIRE、GLM-5.2开源(1M上下文+Agentic RL)、10人团队MaineCoon流式音视频模型SOTA、Meta内部士气崩溃、AlphaFold之父转投Anthropic
🔥 1. 英伟达推出ENPIRE:让8个Coding Agent自动做机器人研究 — 980 pts
英伟达联合CMU和Berkeley发布具身智能AutoResearch框架 ENPIRE,让8个Coding Agent各自控制一台双臂机器人,实现"机器人自己研究机器人"。Agent们会自主读论文、改算法、训练策略、部署实验、分析结果、总结经验,不满意就换个思路重来。在最具代表性的Pin Insertion任务中,仅用3小时,机器人将针插入4毫米孔洞的成功率从0%拉到99%,全程无人类参与。Jim Fan 发推称GEAR实验室部分工作已实现"彻夜自我改进"。ENPIRE本质上是给AI研究员搭建了一套自动化实验台(Harness Framework),由环境模块(自动复位+自动评分)、策略训练模块、实验管理模块和数据分析模块四部分构成。业内调侃"高情商:彻夜自我改进;低情商:没日没夜地烧token"。
→ https://www.qbitai.com/2026/06/437041.html
🔥 2. GLM-5.2 正式开源:专为长程Agent任务打造的1M上下文模型 — 920 pts
Z.AI(智谱AI关联团队)在Hugging Face发布 GLM-5.2,采用MIT开源协议,无地域限制。核心突破有三:一是1M token上下文窗口,通过IndexShare技术(每4层稀疏注意力共享同一个indexer)将1M上下文下的FLOPs降低2.9倍,稳定支持长程Agent工作流;二是引入Agentic RL后训练,利用slime框架协调大规模、多域、复杂执行的强化学习,在大幅面、多Token预算等场景下对抗"作弊"行为;三是提供灵活的effort控制,让用户按需平衡性能与延迟。基准测试方面:Terminal-Bench 2.1得分81.0(GLM-5.1仅63.5),SWE-bench Pro 62.1 vs 58.4,在多Agent协作评测中超过Claude Opus 4。社区评价其为"可与Opus匹敌的开源模型"。
→ https://hf-mirror.com/blog/zai-org/glm-52-blog
🔥 3. 10人团队MaineCoon:22B参数实现SOTA级流式音视频生成,成本仅为Veo 3的1/2000 — 880 pts
中国10人初创团队Catnip(猫薄荷)发布 MaineCoon(缅因猫) 流式音视频模型。22B参数,在单张H100上跑出47.5 FPS,推理速度为业界第一。该模型的特点是边生成边播放、音画同出,时长可达30分钟以上,为业界首次实现。造就是"社交交互"型生成模型——不是生完就跑,而是持续follow用户的实时状态。成本方面,每秒推理最低仅0.00025美元,是Veo 3的1/2000、Seedance的1/560。团队仅由3名00后领衔,两个月完成研发。技术报告发布后迅速获得多方关注,LTX官方已主动寻求合作。
→ https://www.qbitai.com/2026/06/436996.html
🔥 4. Meta内部士气跌至20年谷底:CTO承认AI重组"糟糕透顶" — 850 pts
Meta CTO Andrew Bosworth(Boz)在内部会议"Tuesdays with Boz"上亲口承认公司内部士气已跌至20年谷底,用"atrocious(糟糕透顶)"来形容今年3月成立的Applied AI部门重组。数千人围观的内部直播中,一名员工劫麦爆粗口要求转告某AI高管"他就是个piece of sh*t";其他员工将新部门形容为"古拉格"(gulag)。Boz承认重组动摇了三重信任:相信专长被看见、相信能在这里成长、相信工作有影响力。Applied AI部门约6500人,定位是为Meta超级智能实验室(超级智能实验室)打配合,但内部实际运转压抑至极。
→ https://www.qbitai.com/2026/06/436966.html
🔥 5. AlphaFold之父John Jumper离开DeepMind加入Anthropic — 840 pts
诺奖得主、AlphaFold之父 John Jumper 在X上官宣离开Google DeepMind,加入Anthropic。Jumper领导AlphaFold团队9年,与Demis Hassabis共同获得诺贝尔化学奖。Hassabis感谢了Jumper过去9年的"非凡合作",称AlphaFold"改变了世界"。Jumper的背景是物理学博士路线:范德堡大学物理数学学士→剑桥理论凝聚态物理→转型计算生物学。而就在两天前,Transformer核心作者Noam Shazeer也离开Google DeepMind加入OpenAI。48小时内Google AI连失两员大将。
→ https://www.qbitai.com/2026/06/436980.html
🔥 6. OpenAI与Molecule.one实现首次AI自主药物研发发现 — 810 pts
OpenAI与Molecule.one联合发布成果:GPT-5.4在近乎自主条件下改进了Chan-Lam偶联反应(药物合成中构建碳氮键的关键反应),提出了化学家都感到意外的优化方案。GPT-5.4被接入Molecule.one的Maria化学AI Agent系统,后者连接高通量自动化实验室。系统自主决定"改什么、怎么改",最终在伯磺酰胺与硼酸的偶联反应上取得突破——这个反应恰好是抗癌药、抗菌药和利尿剂合成的关键。Molecule.one CTO称这是"有机化学领域首个AI近乎自主完成的发现",标志着AI从辅助工具向自主科研伙伴的跃迁。
→ https://www.qbitai.com/2026/06/436842.html
🔥 7. Omnigent开源Agent框架两周狂揽4200星 — 780 pts
开源项目 Omnigent(omnigent-ai/omnigent)两周内在GitHub获得4200+星,成为6月最受关注的AI Agent基础设施项目。它是一个"元编排器"(meta-harness),可统一调度Claude Code、Codex、Cursor、Pi和自定义Agent——在不重写代码的前提下切换底层模型。核心能力包括策略执行、沙箱隔离、跨设备实时协作。采用Apache-2.0协议,Python实现,社区反响强烈,被认为解决了当前多Agent系统"碎片化"的核心痛点。
→ https://github.com/omnigent-ai/omnigent
🔥 8. 阿里HappyOyster 1.0:可实时交互的开放式世界模型 — 760 pts
阿里ATH发布 HappyOyster 1.0(快乐生蚝),一款可实时构建和交互的开放式世界模型产品。不同于Sora等"单程票"式生成(生完只能看),HappyOyster支持用户进入世界并与内容互动——加速、跳跃、切换视角、改变方向,与之前的实时生成无缝衔接。文章演示了用户踩着滑板在城市大道飞驰、随时变向和跳跃的实时交互体验。这标志着AI生成内容从"被动观看"进入"主动体验"阶段,在游戏、虚拟社交和创意设计领域有巨大潜力。
→ https://www.qbitai.com/2026/06/436864.html
🔥 9. 银河通用发布全球首个人形机器人通用小脑AstraBrain-WBC 0.5 — 740 pts
银河通用机器人正式发布 AstraBrain-WBC 0.5,号称"全球首个人形机器人通用小脑基础模型"。该模型使用全球最大规模2万小时人类动作数据进行训练,实现了零样本泛化能力——即机器人无需针对特定场景重新训练就能完成新任务。模型聚焦全身实时运控:在毫秒级时间内协同控制全身数十个自由度,在复杂环境中保持平衡,受外部冲击后快速恢复稳定。银河通用称这标志着"人形机器人正式迈入GPT时代"。
→ https://www.qbitai.com/2026/06/436813.html
🔥 10. OpenAI Q1狂烧37亿美元:2025年亏损385亿,IPO前财报泄露 — 730 pts
OpenAI 2026年Q1财报意外泄露:Q1收入57亿美元,支出37亿美元(约250亿人民币),超过一半收入被烧掉。2025年全年数据更惊人:收入130.7亿美元,支出340亿,亏损385亿美元,是2024年亏损额的近8倍。记者Ed Zitron通过审计报告曝光了数据,恰逢OpenAI IPO在即。消息一出引发业界震动——持续高烧钱模式是否可持续成为焦点。Anthropic等竞争对手"保持沉默",外界解读为这给OpenAI的上市之路蒙上了阴影。
→ https://www.qbitai.com/2026/06/436477.html
📌 今日趋势一览
原文链接
欢迎访问 小易撩挨踢