理想AI Talk第二季 李想谈什么是VLA?简单说,就是让汽车像人类司机一样思考行动的“大脑”。它的进化分三步:
1️⃣靠预设规则+小模型(几百万参数),依赖高精地图,像蚂蚁按固定路线行动。能处理的场景有限,复杂路况就抓瞎,本质是“有轨交通”式驾驶,效率低、灵活性差。
2️⃣学会“看人类开车学动作”,通过端到端模型处理图像和速度数据,应对大部分常见路况还行,但不懂物理世界逻辑(比如为什么要避让行人)。虽引入视觉语言模型辅助,但开源工具在交通场景能力弱,只能打打下手。
3️⃣真正像人一样“看懂世界”:既能用3D视觉+2D信息(比如导航软件)理解物理环境,又有“思维链”推理能力——知道“看到红灯要停”背后的规则,还能预判其他车辆意图。这才是让车从“机械执行”进化到“自主思考”的关键。
✅VLA不是突然蹦出来的黑科技,而是从“按规矩走”到“懂原理会变通”的渐进式进化。
目标很简单:让车的“驾驶脑”越来越像人类司机,安全又聪明。
理想AI Talk第二季理想汽车