最近很多朋友提到「辅助驾驶的泛化问题」,依赖数据驱动的端到端,是否存在不同城市用户保有量有差异,带来体验上的差异呢?
比如:杭州,就有点典型。理想2024年杭州的终端销量,排在第三,仅次于特斯拉和比亚迪,所以电动知士智驾群在杭州的理想用户,对NOA的表现是比较认可的,理想VLM甚至可以解一部分杭州的可变车道。而小鹏2024年在杭州的销量仅排在第19名,所以XNGP在杭州的评价,就跟广州有差距。
这些销量数据,似乎印证了这种说法。
端到端早期,依赖主机厂自身车队、能快速起步,高质量的数据对于模型预训练价值更大,而从中长期来看,各家都会面临数据总量与数据质量的共同挑战,如果你拥有一个更大的用户车队规模,即便大浪淘沙,也总比无处挖掘更好。
而针对一些长尾问题,各家也开始通过搭建仿真环境,生成数据来解题,模型的强化学习也已经提上日程。
所以,模型的地区泛化性可能存在,但任何发版的软件,主机厂都会遵循一个质量标准,在安全、在体验上有会一个平均分要求,所以我不太相信,不同城市间会存在巨大的gap,更多的体验差异,可能还是在长尾场景里。
如何验证呢?我们从7月份开始,会重启「全国都能开第二季」的拍摄,下半年的主题,就是围绕城市差异、长尾场景展开,我相信今年跑完5-6个城市之后,这个问题会找到一些答案。