具身智能这个本来就很热的赛道,正在迎来更多变量。过去大家聊机器人,注意力更多放在宇树、智元、优必选这些机器人硬件公司的名字上。但这次链博会上,有个细节挺有意思:蚂蚁灵波出现在了NVIDIA的合作生态里,而且站的是具身大模型代表这个位置,这个信号挺值得看。
蚂蚁灵波是蚂蚁集团旗下具身智能公司。
但NVIDIA关注的重点,显然不会只是一台机器人。
这也是我觉得这个动向有意思的地方。英伟达今年一直在推Physical AI,讲世界模型、仿真、机器人开发生态。它关注的公司,往往也代表了某种技术趋势:机器人接下来不能只靠“身体”出圈,还要有能理解物理世界的“大脑”。
蚂蚁灵波刚好卡在这个位置。
它真正押注的,是通用大脑能力,背后的一体化大脑,包含了多条模型线。
从底层看,机器人首先要解决感知和空间理解。LingBot-Depth负责深度感知,LingBot-Map负责持续重建周围环境,让机器人知道物体在哪、距离多远、空间结构如何。
再往上,LingBot-World 则提供更接近真实物理环境的训练和反馈空间,让机器人想得更明白。
在动作执行层,LingBot-VLA 把视觉、语言和动作打通。它用了约2万小时真实世界数据,覆盖9种常见双臂机器人构型,解决的是机器人听懂指令后,怎么把看到的东西转成具体动作。LingBot-VA则走视频-动作世界模型路线,让机器人一边推演、一边行动,拉高了传统VLA基于“模仿学习”技术路线的天花板。
这一串模型组合起来,补的是机器人进真实世界前最麻烦的几块:看得更清楚、想得更明白、干得更利索。
所以蚂蚁灵波和NVIDIA合作生态放在一起出现,重点不只是“又一家大厂公司被看见了”,更像是具身智能路线的一次站位:机器人本体当然重要,但通用大脑正在变得越来越关键。
养老、医疗辅助、家庭服务这些方向离普通人很近,但对机器人来说难度一点也不低:环境不标准,任务不固定,人还会随时打断。
这也是大厂做具身智能绕不开的一点。互联网公司和AI公司有模型、算力、数据和服务场景,硬件公司有本体、供应链和交付经验。谁能把这几块拼起来,谁才有机会把机器人带到真实业务里。
突围机会,可能也在这里


