临时管理员
发布于 2026-06-03 / 2 阅读
0
0

AI Agents & 开源 LLM 简报 (2026年6月3日)

#AI

🔥 1. Anthropic 秘密提交招股书,最快 Q4 上市 — 498 pts

美东时间 6 月 1 日,Anthropic 向美国 SEC 秘密提交 S-1 注册声明,启动 IPO 进程。具体股份数量和发行价格尚未确定,待 SEC 完成审查后即可公开上市。Anthropic 与 OpenAI、SpaceX 被并称为「美股 AI 御三家」,正加速冲刺上市,这将是有史以来最引人注目的科技 IPO 浪潮之一。创始人 Dario Amodei 一直强调「安全优先」理念,IPO 后 Anthropic 将面临来自公开市场的更大压力。

https://www.qbitai.com/2026/06/428407.html

🔥 2. Hcompany 发布 Holo3.1:快速、本地的 Computer Use Agent — 468 pts

Hcompany 在 Hugging Face 上发布 Holo3.1,定位为快速且可本地运行的 Computer Use Agent。支持从浏览器自动化、企业软件到桌面应用的广泛工作流。Hcompany 表示,用户越来越希望在不依赖云服务的情况下运行 Computer Use 能力,Holo3.1 正是为此设计——在保持高性能的同时实现完全本地运行。这标志着 Computer Use Agent 正在从云端 API 向端侧本地部署的重要转变。

https://hf-mirror.com/blog/Hcompany/holo31

🔥 3. JetBrains Mellum2 + IBM Agent Logic 持续发酵:Agent 架构设计成为焦点 — 432 pts

昨日发布的 Mellum2(12B MoE 专为 Agent 编排设计)和 IBM 的 Agent Logic 文章本周持续引发讨论。JetBrains 强调「well-scoped models matter」,IBM 则指出企业 AI 的真正瓶颈不是模型能力而是 Agent Logic 缺失。两篇文章共同指向一个方向:当前 AI Agent 领域最缺的不是更大的模型,而是更好的架构设计、编排逻辑和治理方案。

https://hf-mirror.com/blog/JetBrains/mellum2-launch
https://hf-mirror.com/blog/ibm-research/agent-logic-and-scalable-ai-adoption

🔥 4. 跨维智能登顶 WorldArena:中国公司攻占世界模型赛道 — 398 pts

全球具身世界模型权威评测基准 WorldArena 公布最新榜单,中国公司跨维智能登顶 Track 2 赛道全球第一,超越英伟达和谷歌的旗舰模型。不到一周时间 WorldArena 榜首再次易主,世界模型赛道的竞争已进入白热化。跨维智能凭借具身数据引擎和落地能力突围,证明中国公司在世界模型这一前沿方向已具备国际竞争力。

https://www.qbitai.com/2026/06/428435.html

🔥 5. OpenAI 连续挖走两位顶尖华人学者:尹希(哈佛最年轻正教授)+ 苏炜杰 — 362 pts

OpenAI 持续扩张人才版图:哈佛史上最年轻华人正教授、弦理论新星尹希加入 OpenAI,参与 AI 与理论物理交叉研究;宾大沃顿商学院正教授苏炜杰同步加盟。两人均以学术休假(Sabbatical)方式在保留教职的情况加入。香港大学马毅教授公开质疑尹希对 AI 极限的判断过于乐观。结合此前重返机器人赛道的大规模招聘,OpenAI 正在从语言模型公司向跨学科 AI 研究机构全面转型。

https://www.qbitai.com/2026/06/428003.html

🔥 6. Meta Skill 来了:OpenSquilla 仓库爆火,Token 成本节省 60-80% — 328 pts

GitHub 上最新火爆仓库 OpenSquilla 迅速获得 2000+ 星。其核心创新是内置了智能模型路由,同任务下 Token 成本比主流方案省 60-80%,任务完成时会弹出动画显示具体节省。更值得关注的是其新功能 Meta Skill——元 Skill,即 Skill 的 Skill。一个 Meta Skill 内嵌多个 Skill,拼接成超级白皮书,端到端打通整套长程 Workflow。这标志着 Agent Skill 体系正从单点技能走向可组合的技能链。

https://www.qbitai.com/2026/06/428335.html

🔥 7. MiniMax M3 发布:对标 Opus 和 GPT-5,价格仅十分之一 — 298 pts

MiniMax 发布 M3 模型,Token Plan 的新计费方式引发热议。但更值得关注的是模型能力——Hermes 框架开发平台 Nous Research 联创公开背书,Vercel CEO、GitHub 540k 星 AI 大佬 Guillermo Rauch 也在 X 上公开推荐,称 M3 的表现紧跟 Opus 和 GPT-5,价格仅十分之一。实测涉及复刻论文、优化 CUDA 算子、自己训练模型等任务,长上下文、多模态、Coding 三种能力需同时在线。

https://www.qbitai.com/2026/06/428092.html

🔥 8. 字节跳动开源 Bernini:AI 视频编辑统一框架,「先理解再动手」— 268 pts

字节跳动商业化技术团队开源 Bernini,面向视频生成与视频编辑的统一框架。核心思路是让多模态大模型先负责语义理解与规划,再交给 diffusion 模型完成高质量视觉渲染。覆盖参考生成、视频编辑等多种任务,突出的是「可控」——不仅单帧画得好,前后帧一致性也能稳住。这对视频编辑 Agent 的发展具有重要意义。

https://www.qbitai.com/2026/06/427810.html

🔥 9. 卧安机器人 OneModel 1.7:隐式通路打通具身智能关键断层 — 238 pts

卧安机器人发布 OneModel 1.7 FrontoStria-RL,核心创新是 Predictive Policy Latent 隐式传导通路——将世界模型对场景的理解直接灌进动作执行模块,不靠显式中间图像或坐标传递。在 LIBERO 基准上平均成功率达 99%,领先 π0.5、GR00T-N1.5 等主流方案。这解决了具身智能领域「World Model 看懂环境但做不对动作」的核心断层。

https://www.qbitai.com/2026/06/428703.html

🔥 10. 橡木果机器人「本能驱动」路线:自下而上的具身智能新范式 — 208 pts

橡木果机器人(Acorn Robot)发布自下而上的「本能驱动」技术路线,与主流大模型端到端路线截然不同。创始团队由清华机械工程博士和哈佛神经科学博士后领衔,用 9 年时间走完从理论发现到产品商业化的闭环。核心发现是:操作存在先天本能(人类抓取行为高度一致),与其让机器人模仿人类,不如赋予它类人的操作本能,让其自主涌现操作智能。

https://www.qbitai.com/2026/06/428413.html

📌 今日趋势一览

趋势

热度

Anthropic 提交招股书,AI 御三家上市潮

🔥🔥🔥🔥🔥

中国公司登顶世界模型排行榜(跨维智能)

🔥🔥🔥🔥🔥

Holo3.1 本地 Computer Use Agent 发布

🔥🔥🔥🔥🔥

OpenAI 狂挖顶尖学者(尹希+苏炜杰)

🔥🔥🔥🔥🔥

Meta Skill / OpenSquilla:Token 节省 60-80%

🔥🔥🔥🔥

MiniMax M3 对标 Opus 价格仅 1/10

🔥🔥🔥🔥🔥

字节开源 Bernini 视频编辑框架

🔥🔥🔥🔥

具身智能「本能驱动」新范式 vs 主流通用路线

🔥🔥🔥🔥

卧安机器人隐式通路解决具身智能传导断层

🔥🔥🔥🔥

Agent 架构设计>模型大小(JetBrains+IBM 共识)

🔥🔥🔥🔥🔥


原文链接 https://www.yijunzhao.cn/archives/ai-agents-kai-yuan-llm-jian-bao-2026nian-6yue-3ri

欢迎访问 小易撩挨踢

https://www.yijunzhao.cn/


评论