李想:
- 端到端是 VLA 的一部分。
- 今天很多企业做端到端都很吃力。
他的原话是:
- 我刚才讲的,其实端到端是 VLA(视觉语言行动模型)的一部分基础。如果你把端到端想象成一个一个具身智能执行的环节,那它其实就是我们 VLA(视觉语言行动模型)的 A(action 行动)的部分,就我 A(action 行动)的部分其实仍然是在拿这个数据在做训练的。其实它就组成了我的 A(action 行动)的部分了。只是我要多语言的部分,还要多更强的 3D vision(视觉)和高清 2D vision(视觉)的部分。
308_IO理想汽车新能源汽车