现在的收益大部分来自于动作模型【VLA的A】的能力提升10月份视觉语言模型【VL

啊小琪说汽车 2025-08-29 09:13:23

现在的收益大部分来自于动作模型【VLA的A】的能力提升

10月份视觉语言模型【VLA的VL】会大幅度迭代

现阶段部分错误选路、场景理解失衡的应该能解决掉不少~

还有一个期待能否 将多角度信息 低损直接进L?

此外还有一个明确提升是VLA 召唤和行车的逻辑会进一步对齐~

所以算一下:①选路、场景理解提升 ②模型对齐 ③场景扩展

理想mindvla让每个人都有专职司机理想汽车[超话]

0 阅读:0
啊小琪说汽车

啊小琪说汽车

感谢大家的关注