理想发了个Mind VLA,相比VLA有啥区别
官方说,不是简单地将端到端模型和VLM模型结合在一起,所有模块都是全新设计,MindVLA基于自研的重建+生成云端统一世界模型。
至于MINDVLA能实现什么?
官方通过看得懂、看得见和找得到表示它的能力。
看得懂基本上就是识别指令,没有导航直接去你说的目的地。
看得见,具备识别周围景观的能力,根据你发的指令,告知它的位置,类似于寻车。
找得到,车辆自己找车位停好类似这种场景。
理想MindVLA让每个人都有专职司机
理想发了个Mind VLA,相比VLA有啥区别
官方说,不是简单地将端到端模型和VLM模型结合在一起,所有模块都是全新设计,MindVLA基于自研的重建+生成云端统一世界模型。
至于MINDVLA能实现什么?
官方通过看得懂、看得见和找得到表示它的能力。
看得懂基本上就是识别指令,没有导航直接去你说的目的地。
看得见,具备识别周围景观的能力,根据你发的指令,告知它的位置,类似于寻车。
找得到,车辆自己找车位停好类似这种场景。
理想MindVLA让每个人都有专职司机
作者最新文章
热门分类
汽车TOP
汽车最新文章