随着小鹏在CVPR进一步披露基座模型的细节,关于强化学习(RL)的价值,再次被证明了。
楼教主把模仿学习和强化学习作为L2和L4的技术分水岭之一,而做L2量产的主机厂,动作很快,进展也更快。
小鹏基座模型负责人,刘先明说:他大概是今天唯一一个来自大规模量产汽车公司的分享者,接下来的内容,将来自一个每天处理真实道路、真实用户和海量量产车数据的研发团队。在场的学者们将听到的,不再是纯粹的理论推演,而是一套在产业一线被反复捶打和验证过的解题思路。
图2来自硅星人Pro的文章截图,链接我放在评论区一楼了。