众力资讯网

李想在罗永浩的访谈中,提到了具身智能目前最大的困境:就是缺少一个稳定的预训练模型

李想在罗永浩的访谈中,提到了具身智能目前最大的困境:就是缺少一个稳定的预训练模型。

具身智能要成功 → 必须先有一个稳定的物理世界预训练模型 → 这个模型要像GPT-3.5那样,基于大规模无监督预训练,强化学习对齐人类意图。成为"基座" → 有了这个基座,后面所有的RL(强化学习)才有意义。

对应自动驾驶行业,先通过海量的视频和传感器数据来做预训练,建立对物理世界、空间几何结构、运动学规律的基本预测能力。

但自动驾驶的基座模型,目前也不够完善,它还是基于结构化道路、低自由度运动的专用模型,而非物理世界的通用模型。

那对于自由度更高、还缺乏训练数据的具身智能(机器人等)来说,建立这个基座模型只会更难。更何况它对通用性的要求,远远高于汽车。

你可以想像一下,为了实现自动驾驶,全行业花了多少钱?

具身智能想做出这样的通用基座模型。成本恐怕十倍甚至百倍于自动驾驶。