李想在罗永浩的访谈中，提到了具身智能目前最大的困境：就是缺少一个稳定的预训练模型

李想在罗永浩的访谈中，提到了具身智能目前最大的困境：就是缺少一个稳定的预训练模型。

具身智能要成功 → 必须先有一个稳定的物理世界预训练模型 → 这个模型要像GPT-3.5那样，基于大规模无监督预训练，强化学习对齐人类意图。成为"基座" → 有了这个基座，后面所有的RL（强化学习）才有意义。

对应自动驾驶行业，先通过海量的视频和传感器数据来做预训练，建立对物理世界、空间几何结构、运动学规律的基本预测能力。

但自动驾驶的基座模型，目前也不够完善，它还是基于结构化道路、低自由度运动的专用模型，而非物理世界的通用模型。

那对于自由度更高、还缺乏训练数据的具身智能（机器人等）来说，建立这个基座模型只会更难。更何况它对通用性的要求，远远高于汽车。

你可以想像一下，为了实现自动驾驶，全行业花了多少钱？

具身智能想做出这样的通用基座模型。成本恐怕十倍甚至百倍于自动驾驶。

众力资讯网