机器人界的“脑内模拟器”冠军,被智元拿了
5月30日,未来图灵获悉,具身智能领域权威评测榜单WorldArena Track1(世界模型感知与动作响应赛道)公布了最新一期评测结果。智元机器人自主研发的世界模型Genie Envisioner-Sim 2.0(以下简称GE 2.0)以68.26分的综合得分,在全球所有参赛团队中位列总分第一。

WorldArena Track1是人工智能与计算机视觉领域国际顶级学术会议CVPR 2026官方设立的具身智能核心专项评测。该赛道的评测规则、数据集和评分体系均由CVPR学术委员会联合全球具身智能领域学者共同制定,所有参赛成绩将在CVPR 2026主会期间正式发布并颁发奖项。正因如此,该榜单吸引了谷歌、Meta、英伟达等相关团队,以及清华大学、斯坦福大学、北京大学、普林斯顿大学等高校和研究机构同台竞技。
据智元团队在同期发布的GE 2.0技术报告中披露,此次参评使用的是原生GE 2.0模型,并未针对WorldArena赛题进行任何特殊定制或定向优化,仅基于榜单官方数据对模型做了基础微调。这一“轻装上阵”的参评方式最终仍取得总分第一的成绩。

所谓世界模型,可以理解为机器人的“数字大脑”或“虚拟训练场”。它的核心价值在于让机器人在仿真环境中提前试错、积累经验,再将习得的策略迁移到真实物理世界,从而规避真实场景下试错带来的硬件损耗、时间成本和安全风险。对于当前正处于规模化部署起步阶段的具身智能行业而言,这种仿真到现实的迁移能力被视为机器人落地的关键基础设施之一。
智元官方信息显示,GE 2.0在多项技术指标上较上一代模型有明显提升。在长时序生成任务中,GE 2.0连续推演40秒到50秒的复杂场景视频后,其画面质量仍然优于行业基线模型前10秒内生成的画面效果,画面质量随推理时长增加而衰减的幅度显著低于同类产品。

在衡量世界模型核心价值的闭环评测可靠性验证上,智元团队在倒水、折叠毛巾、拔插头等多项典型机器人任务上进行了大规模验证。团队未止步于宏观统计层面的“成功率一致性”比较,还进一步开展了逐案rollout结果对比分析,并使用混淆矩阵提供了量化佐证。技术报告中的数据显示,GE 2.0的仿真预测结果与真实世界物理运行结果之间存在强相关性。

GE 2.0还内置了奖励模型机制。智元方面称,该奖励模型能够对世界模型中的仿真过程进行自动化筛选,将产出的高质量有效数据精准回流给策略模型。实验数据显示,这一数据回流机制在多项任务上为策略模型带来了显著的性能涨点,初步打通了“模型生成数据、数据反哺模型”的自主进化闭环。
智元机器人成立于2023年,由华为前副总裁邓泰华、天才少年稚晖君(彭志辉)联合创立,总部位于上海。公司定位为“具身智能基础模型公司”,而非单纯的硬件整机制造商。今年4月,智元在“AI WEEK”上一口气发布了涵盖数据集、仿真平台、基座大模型、世界模拟器和零代码应用平台的全栈技术体系。
智元在2026 APC合作伙伴大会上提出“部署态”概念,指机器人从实验室走向真实场景、实现规模化稳定作业的阶段。而世界模型正是实现这一跨越的关键技术——让机器人在虚拟环境中进行无限次试错和训练,将真实世界的试错成本降至最低。