智源对世界模型给出了其清晰的分类定义，并且表示目前智源正在尝试第一条路线和第四条

2026-06-17 20:17:07 马继华体育

智源对世界模型给出了其清晰的分类定义，并且表示目前智源正在尝试第一条路线和第四条的路线结合，试图走出“第五条路线”：

第一类是以语言为中心的世界模型，包括VLM、VLA，模型在文本空间中预测下一个词，学到的是语言描述的世界，并不能理解背后的物理后果；

第二类是以像素为中心的世界模型，像Sora和Seedance等视频生成类模型，在视觉空间中学习视频或图像，学到的是像素描述的世界；

第三类是以三维结构为中心的世界模型，包括3D重建以及李飞飞团队的World Labs Marble模型，不过模型重建3D空间不等于理解世界，几何结构也不代表物理状态；

第四类是以视觉表征为中心的世界模型，比如杨立昆的JEPA系列模型，预测的是视觉表征的压缩，但视觉嵌入演化不等于物理规律演化。

阅读：0 点赞：0

2026-06-14 烨华聊商业

标签： chatgpt openai GPU 化学

2026-06-10 映易赏汽车啦

标签：小米科技小米

2026-06-14 互联网料哥

标签：华为盘古大模型华为云

2026-06-16 薇赏科技

标签：华为百度盘古大模型

2026-06-18 如松聊武器

标签： ai 人工智能

2026-06-18 烟雨评社

标签：微软 deepseek openai 科技巨头

2026-06-16 薇赏科技

标签：小米科技盘古大模型文心大模型安卓系统

DC娱乐网