蔚来官方的《世界模型NWM有问必答》,正式回应了与VLA的关系:WorldMo

梦香评汽车啊 2025-08-03 19:35:31

蔚来官方的《世界模型NWM有问必答》,正式回应了与VLA的关系:

World Model(世界模型)是一个多元自回归生成模型,输入多模态数据,多模态包含图像和语言等,同时能输出多模态数据,包含图像和行动等等。

所以,当蔚来世界模型打开语言输入时,它就包含了VLA视觉语言行动模型的特征。停车场的自主漫游能力,就是VLA应用的一种形式。

我的个人理解:

目前行业中,对于世界模型应用主要在仿真领域,通过感知、理解世界,在对世界进行重构,让智能体(自动驾驶系统)在其中进行训练。

显然,蔚来的世界模型走了另一个流派,除了感知世界,同时加入了对未来的时空预测,把仿真和planning共同训练,从而让车辆可以直接输出规划轨迹,完成自动驾驶。

而构建蔚来世界模型的元素中,除了图像也包括了语言。

0 阅读:2
梦香评汽车啊

梦香评汽车啊

感谢大家的关注