众力资讯网

智元姚卯青:坚定投入世界模型 预计今年产出数百万小时高质量数据

上证报中国证券网讯(记者孙小程)在近日举办的“智汇金陵·AI开源人才峰会”上,智元合伙人、高级副总裁、具身业务部总裁姚卯青以“具身智能赋能新质生产力”为题发表主题演讲,阐述了智元在全链条技术布局与产业落地方面的思考与实践。

“具身智能想要真正走进实际场景、落地部署并赋能客户,是一项极具挑战性的系统工程,必须打通硬件、数据、模型、场景全链条闭环。”姚卯青说。

针对数据这一行业痛点,姚卯青认为,语言模型可获取数百万亿tokens的训练数据,但具身智能的训练数据量,与之存在4到5个数量级的差距。为此,智元已启动真机数据采集,并于2024年12月开源全球首个基于全域真实场景的百万真机数据集AGIBOTWorld。

姚卯青透露,目前智元持续拓展数据维度,同步布局真机实操、人机交互、物理场景等多类数据采集,今年预计产出数百万小时高质量有效数据,以优质数据夯实模型训练基础。

同时,为解决落地成本难题,智元构建了仿真全生命周期流程,“近90%的研发工作在仿真环境中提前搭建、验证并跑通,仅剩余10%的场景适配与落地调试工作。”姚卯青表示。

围绕核心技术突破,智元构建了“数据—预训练—后训练—世界模型”全链路闭环体系,打造可持续进化的具身智能模型。姚卯青介绍,在预训练层面,智元推出全国首个通用具身基座模型GO-1,开创性提出ViLLA架构,通过VLM与MOE的融合实现通用感知与动作能力及跨任务泛化,让机器人既能从人类视角学习动作规律,又能掌握物理世界交互逻辑。

在世界模型领域,姚卯青明确:“世界模型是我们坚定投入的方向,早在2024年,智元就认准这一技术赛道。相较于语言模型偏向抽象逻辑思维表征,世界模型是从3D物理世界中学习规律,更适配具身智能场景需求。”

峰会现场,魔搭社区联合CCF智能机器人专委会、工业和信息化部装备数字孪生技术重点实验室及Lumina具身智能社区等机构,正式发布了EAI-100(EmbodiedArtificialIntelligence100)具身智能年度百项代表性成果与人物榜单。智元获得“年度10大突破”“年度10大数据集项目”及“年度10大落地典范”等多项荣誉,姚卯青获评“EAIPioneer20”先锋人物。