易君召
易君召
发布于 2026-06-10 / 4 阅读
0
0

🌍 世界模型成 AI 新赛道:$150 亿资本押注,中美的下一场 AI 大战

#AI

从 LLM 到 World Model——AI 的下一个主战场,是让机器真正理解物理世界。

🔥 一、背景:2026 年,AI 赛道从"语言"转向"世界"

2024-2025 年,OpenAI Sora 首次让世界看到了"AI 理解物理"的可能性。但到了 2026 年,世界模型已从"学术概念"全面进化成产业级赛道——资本密集涌入、大厂全面布局、创业公司遍地开花。

什么是世界模型?它与 LLM 有何不同?

维度

LLM(大语言模型)

视频生成模型

世界模型

学习对象

文本语料

视频像素统计

视频+传感器+交互数据

物理理解

语义知道但不懂

无物理约束

内部建模重力/碰撞/力学

可交互

对话交互

单向生成

可改变输入获得不同输出

闭环控制

感知→预测→决策→执行

🔑 本质区别: 视频生成学的是"像素统计分布",世界模型学的是"物理因果律"。世界模型能回答"如果我推这个杯子,它会怎么倒?",而不仅仅是"生成一个杯子倒下的视频"。

🌐 二、全球主要玩家全景

国际阵营

公司/机构

技术路线

核心优势

资本/生态

NVIDIA Cosmos 🏆

Diffusion+物理引擎

9,820 Star开源+硬软一体化

英伟达全生态

World Labs(李飞飞)

NeRF/3D空间

空间智能专精

a16z领投,估值$10亿+

Google DeepMind Genie 2

Transformer

研究实力最强

Alphabet支撑

OpenAI Sora

Diffusion

技术影响力最大

$400亿+融资含此方向

Meta(LeCun JEPA)

抽象特征预测

理论根基最深

FAIR研究资源

Wayve

Diffusion+驾驶

自动驾驶世界模型标杆

软银$10.5亿重注


NVIDIA Cosmos 是目前全球最具影响力的开源世界模型。其核心架构包含Predict(通用预测)、Drive Dreams(自动驾驶模拟)、Mint(多模态交互)三大组件,加上 Isaac Sim 物理引擎和 Omniverse 数字孪生平台,构建了从硬件到软件、从训练到仿真的完整生态闭环。

Wayve 的 GAIA-2 代表了自动驾驶最成熟的商业化路径。用世界模型替代传统"采集路测→人工标注"流程,训练成本降低 90% 以上。软银+英伟达+微软的 $10.5 亿联合投资,证明了世界模型在自动驾驶中的巨大商业价值。

国内阵营

公司/机构

核心产品/方向

亮点

腾讯混元

HY-World 2.0

3D重建+生成+仿真一体化,2,171 Star

小米汽车

Auto World Model

重建+生成一体化,全基准 SOTA

BAAI 智源

Emu 系列

原生多模态世界模型,开源推动者

BIGAI 朱松纯

理论驱动 AGI

U-V-C理论框架,学术影响力大

字节跳动

Seedance 2.0

海量抖音视频数据驱动

阿里巴巴

通义多模态+3D

电商3D展示场景

智元机器人

机器人世界模型

稚晖君领衔,商用加速


小米 Auto World Model 是 2026 年中国该领域最大的亮点。它打破行业"重建与生成独立拆分"的传统路线,首创WorldRec(重建)+ WorldGen(生成)深度耦合架构,用 4D 场景表征作为跨帧共享记忆,在 Waymo、nuScenes 等主流自动驾驶基准上全面达到 SOTA。目前已在小鹏汽车合成数据、仿真测试、智能座舱三大场景落地。

腾讯混元 HY-World 2.0 则代表了 3D 世界的另一条路径——以 NeRF/3DGS 为核心的 3D 重建+生成+仿真一体化方案,与 Hunyuan-GameCraft-2(游戏生成)和 HY-Embodied(具身智能)形成产品矩阵。

🔥 关键格局判断: 中国企业全球竞争中的最大优势是应用场景——智慧工厂、自动驾驶路测、3D电商展示、游戏生成,中国有全球最大的落地市场。

💰 三、2026 年资本流向:$150 亿级别赛道

巨额融资案例

时间

公司

金额

方向

2024-2025

World Labs (李飞飞)

$2.3亿

空间智能世界模型

2025

Wayve (GAIA)

$10.5亿

自动驾驶世界模型

2025

Figure AI

$6.75亿

机器人世界模型

2025

1X Technologies

$1亿+

机器人世界模型

2026

OpenAI

$400亿+(软银)

含世界模拟器方向

2026 H1

中国多家创业公司

数亿人民币

自动驾驶/机器人/工业

全球累计资本流入(2024-2026):保守估计超过 150 亿美元。

投资热度排序

排名

方向

理由

🥇

自动驾驶世界模型

Wayve模式已验证商业化

🥈

机器人世界模型

人形机器人量产加速

🥉

3D世界生成

游戏/电商/ARVR场景

4

工业数字孪生

最稳健但增长慢

5

视频生成世界模型

竞争激烈壁垒低

分析师预测

来源

预测

Gartner

2027年前 30% 企业AI预算用于世界模型/仿真

PitchBook

2026年融资同比+200%

IDC

世界模型赋能市场2030年达$500亿

中国信通院

中国市场2028年达千亿人民币

🧬 四、五大技术路线深度对比

路线 1️⃣ Diffusion 路线

代表: NVIDIA Cosmos、OpenAI Sora、Runway
原理: 从噪声逐步去噪生成世界状态
优势: 生成质量最高,细节丰富
劣势: 推理慢,长时域一致性差
适合: 视频生成、内容创作

路线 2️⃣ Transformer 路线

代表: Genie 2、BAAI Emu 系列
原理: 将世界状态编码为 Token 序列预测
优势: 可扩展性强,推理速度快
劣势: Token 化丢失细节
适合: 游戏世界生成、交互式仿真

路线 3️⃣ NeRF / 3D Gaussian Splatting

代表: 腾讯 HY-World 2.0、World Labs
原理: 从多视角图像重建3D场景
优势: 几何精度高,多视角一致性
劣势: 需多视角输入
适合: 3D重建、数字孪生

路线 4️⃣ 物理仿真 + AI 混合

代表: NVIDIA Cosmos+Isaac、1X
优势: 物理精确度最高
劣势: 泛化受限
适合: 机器人训练、自动驾驶仿真

路线 5️⃣ 混合架构(2026 年主流趋势)🏆

代表: 小米 Auto World Model、腾讯 HY-World 2.0
核心理念: 重建(NeRF/3DGS)的几何精确性 + 生成(Diffusion/Transformer)的想象力深度耦合

小米的技术路线最具代表性:WorldRec(重建)+ WorldGen(生成)一体化架构,打破行业"重建/生成独立拆分"的传统路线,用4D场景表征作为跨帧共享记忆。

技术总评表

技术路线

物理精度

生成质量

推理速度

训练成本

Diffusion

中等

⭐高

极高

Transformer

中低

中高

⭐快

NeRF/3DGS

⭐高

⭐高

物理仿真+AI

⭐很高

混合架构 🏆

📱 六、六大应用场景

场景

成熟度

商业模式

国产代表

🚗 自动驾驶

⭐⭐⭐⭐⭐

训练降本90%+

小米、华为

🤖 机器人

⭐⭐⭐⭐

仿真训练替代真实数据

智元、优必选

🎮 游戏生成

⭐⭐⭐

开发成本降数量级

腾讯

🎬 视频创作

⭐⭐⭐

专业素材生产

字节跳动

🏭 工业仿真

⭐⭐⭐

自进化数字孪生

腾讯

🔬 科学模拟

⭐⭐

物理材料研究

BIGAI

⚠️ 七、挑战与风险

挑战

说明

💰 算力成本

视频训练数据量远超文本,GPU需求巨大

🔄 物理一致性

长时域模拟仍会出现违反物理规律的现象

📏 评估标准缺失

无类似 MMLU 的标准化世界模型评测基准

💼 变现路径

除自动驾驶外,其他场景仍需验证

©️ 数据版权

海量网络视频训练涉及版权问题

📌 八、总结

世界模型正在经历从"学术概念"到"产业基石"的关键转变。2026 年,$150 亿资本涌入、NVIDIA Cosmos 近万 Star 开源、中国小米/腾讯等重量级产品密集发布——这一切都指向一个事实:世界模型是继 LLM 之后 AI 最大的赛道。

三个核心判断

  1. 🏆 混合架构是 2026 年主流趋势——重建与生成深度融合,小米和腾讯走在前列

  2. 🏆 自动驾驶是当前最明确的商业化路径——Wayve 的 $10.5 亿融资已证明价值

  3. 🏆 LLM + World Model 融合是 AGI 最确定的方向——语言理解+物理理解的组合

一句话总结

如果 LLM 给了 AI 一个会说话的大脑,那么 World Model 正在给 AI 一双看得见、摸得着、理解物理世界的眼睛——这才是通往 AGI 的真正起点。


原文链接 https://www.yijunzhao.cn/archives/world-models-ai-new-frontier-15-billion-investment-us-china

欢迎访问 小易撩挨踢

https://www.yijunzhao.cn/


评论