在写点推理【瞎蒙】
对,纯粹根据公开信息瞎写的[二哈]
如果要让VLA【或者叫具备多模态理解能力】的AD,具备L3 的能力
那么在感知定位【道路结构】肯定要获得超过1个以上的信息源
我们现在E2E 模型感知其实主要来自于静态路网【道路结构】+导航播发的信息【XX米后左右转之类的】
关键是后者信息很有可能错误,比如说高架上/下,主辅路,定位偏移等等
那么如果路线规划主要来自于导航播发和定位,这个模态的信息出错了该怎么办?
回过头,看以前没有导航的时代,我们是怎么开车的?
对.看路牌,其实路牌的结构已经是非常标准的文字语义信息。
当导航信息与路牌信息不一致的时候,且后者稳定性较高,至少可以避免现在大量乱走路的问题。
也可以为未来高速/高架L3 做好坚实的基础
有人问,为啥FSD 没咋用这么多多模态信息,也跑通了接近L3 甚至L4 。
有没有一种可能 FSD 用图【不是高精度地图】 用的非常的好呢,而且人家数据闭环和模型参量都非常的好呢[二哈]
本条不针对任何技术路线. 只是有感而发[二哈]