宇树科技创始人王兴兴说实现AGI的很可能是一家机器人公司,DeepSeek怎么看?
摘自 自幼文武双全 勇敢姐飙AI
最近DeepSeek R1被大家玩得不亦乐乎,而我觉得最酷的玩法,除了将它嵌入现有业务流程去干活,应该还可以让它分析下感兴趣的领域的发展趋势。
今天看到宇树科技创始人王兴兴说实现AGI的很可能是一家机器人公司,我觉得这应该是王兴兴很重要的心得,所以拿来跟DeepSeek聊了一下,还是很有收获的。
我先问了它对王兴兴的观点的看法,它认为这一观点“主要基于其对具身智能(Embodied AI)的深度理解和对当前AI技术局限性的批判”,根据推理分析,它得出结论“尽管当前具身智能仍面临诸多挑战,但机器人公司通过硬件创新与数据闭环,确实可能成为AGI突破的关键力量。然而,AGI的实现更可能依赖跨领域协作,而非单一技术路径的垄断。”
我又继续追问“有没有一种可能,一个机器人公司会更有能力整合各方力量去实现AGI呢?”,它得出的结论是“ AGI的实现仍需跨领域协作,机器人公司更可能扮演生态整合者的角色”。
尽管大模型是天生的辩证思维者,但它最终的结论其实跟王兴兴的本意基本吻合。也许过去做计算机操作系统的独步天下,而计算机硬件商遍地开花的历史不会重演。这一切将得益于开源生态的强大。
整个过程简明扼要,思路清晰,的确是很不错的学习和思考的辅助工具。全程Copy如下:
Prompt 1 to deepseek R1:
宇树科技的创始人说,AGI很可能是由一个机器人公司实现,你怎么看?
Answer:
宇树科技创始人王兴兴提出“AGI(通用人工智能)很可能由机器人公司实现”的观点,主要基于其对具身智能(Embodied AI)的深度理解和对当前AI技术局限性的批判。结合搜索结果的多个访谈和技术进展,可以从以下几个方面分析这一观点的合理性与挑战:
1.具身智能是AGI的必要路径
物理交互与数据闭环的重要性
王兴兴认为,传统AI(如大语言模型)虽在文本和图像处理上表现优异,但缺乏对物理世界的真实感知与交互能力。例如,大语言模型对时间、空间及物理规律的理解“非常糟糕”,类似“活在梦里”,易产生逻辑混乱或“幻觉”。而具身智能通过机器人实体与环境的互动,能收集真实世界的全息数据(如重力、摩擦力、触觉反馈),形成闭环学习,从而更接近人类对世界的认知方式。
世界模型的构建
他提出,AGI需要构建“世界模型”,即对时空、物理规律及人类行为的通用理解。机器人通过具身实践(如工厂作业、家庭服务)积累多模态数据,可逐步完善这一模型。例如,特斯拉的自动驾驶系统(FSD)已通过车辆与环境的交互初步实现了局部“世界模型”。
2.机器人公司的技术优势
硬件与算法的协同进化
宇树科技在人形机器人领域的进展(如G1和H1型号)展示了硬件设计与AI控制的深度融合。例如,G1通过深度强化学习实现了仿人奔跑和复杂地形适应,H1则凭借纯电驱动和AI算法完成空翻等高难度动作。这些成果表明,机器人公司可通过实际应用场景迭代优化硬件性能与AI算法,形成技术壁垒。
数据驱动的强化学习
王兴兴强调,机器人公司天然具备数据采集优势。例如,宇树开发了轻量化遥操作数据采集系统,通过用户反馈和实际任务不断训练模型,推动AI从单一动作控制向通用任务处理进化。
3.对OpenAI等纯软件路线的批判
脱离物理世界的局限性
王兴兴指出,OpenAI早期虽尝试过机器人方向,但因GPT模型的快速成功而转向纯软件研究。他认为,这种“脱离身体”的AI发展路径难以实现真正的通用性,因为缺乏物理交互的模型无法理解人类情绪、环境动态等复杂因素。
身体与大脑的不可分割性
他以“梦境”类比大语言模型的局限性:人在梦中无法奔跑或感知触觉,正是因为大脑与身体断开连接。同理,AI若仅有“大脑”(算法)而无“身体”(机器人载体),其智能将始终受限。
4.挑战与争议
技术与成本的平衡
尽管宇树的G1已量产并售价9.9万元,但人形机器人仍面临高成本、低泛用性的问题。例如,复杂手部操作(如穿针引线)尚未突破,且当前AI训练仍依赖分动作独立训练,难以实现通用任务切换。
行业协作的必要性
王兴兴承认,AGI的实现需全球实验室与企业共同推动,而非单一公司能完成。例如,多模态模型的完善、世界模型的构建均需跨领域合作。
5.未来展望
短期目标与长期愿景
王兴兴预测,未来1-2年人形机器人将在体育、表演等领域超越人类(如百米跑进10秒),而长期则需突破通用任务能力,实现工厂、家庭等多场景覆盖。
AGI的实现路径之争
机器人公司的具身智能路线与大模型公司的纯算法路线或将长期并存。前者强调整合物理交互,后者依赖数据规模与算力。最终AGI可能需要两者的结合——例如,通过机器人收集数据训练通用模型,再反哺机器人应用。
总结
王兴兴的观点基于对AI发展史的深刻洞察与宇树科技的技术实践,强调物理世界的交互是AGI不可或缺的基石。尽管当前具身智能仍面临诸多挑战,但机器人公司通过硬件创新与数据闭环,确实可能成为AGI突破的关键力量。然而,AGI的实现更可能依赖跨领域协作,而非单一技术路径的垄断。
Prompt 2 to Deepseek:
有没有一种可能,一个机器人公司会更有能力整合各方力量去实现AGI呢?
Answer:
根据搜索结果中的信息,机器人公司在整合各方力量以实现AGI(通用人工智能)方面确实具备独特的优势,但也面临挑战。以下从多个角度分析这一可能性:
1.硬件与数据的天然整合能力
机器人公司通过实体机器人平台,能够直接整合硬件、算法、物理交互和真实世界数据,这是纯软件公司难以比拟的优势。例如:
数据闭环与多模态学习
机器人通过执行任务(如抓取、搬运、导航)收集物理世界的全息数据(包括触觉、力学反馈、视觉等),形成闭环训练系统,为AGI构建“世界模型”提供基础。例如,智元机器人开源的AgiBot World数据集,覆盖家居、工业等五大场景的3000多种物品和80余种动作,其规模和质量远超实验室级别,为具身智能训练提供了关键资源。
硬件与算法的协同进化
宇树科技的人形机器人H1通过深度强化学习实现了空翻等高难度动作,展示了硬件设计与AI控制深度融合的可能性。这种协同优化能够推动AI在复杂物理环境中的适应性。
2.跨领域协作的推动力
机器人公司往往需要与多个技术领域合作,这为其整合资源提供了契机:
开源生态与行业联盟
例如,智元机器人开源数据集AgiBot World,直接促进了学术界和工业界的协作,降低技术门槛并加速创新。类似地,OpenAI重启机器人项目后,与Figure等公司合作开发多模态交互能力,显示其通过生态合作弥补硬件短板。
资本与政策支持
西湖机器人一年内融资近亿元,Physical Intelligence获得4亿美元投资,表明资本市场对机器人公司推动AGI的认可。此外,工信部对5G和机器人技术的支持也为行业提供了基础设施保障。
3.对AGI技术路径的重新定义
机器人公司的实践正在挑战传统的纯算法路线:
具身智能的必要性
OpenAI近期重启机器人项目,认为人形机器人是实现AGI的必经之路,因为大语言模型(LLM)缺乏物理交互能力,难以构建真实世界的认知框架。这一观点与王兴兴(宇树科技创始人)的批判一致,即脱离物理交互的AI无法突破“虚拟世界幻觉”。
通用任务能力的突破方向
机器人公司通过场景化训练(如家庭服务、工业操作)推动AI从单一任务向通用任务进化。例如,特斯拉的自动驾驶系统(FSD)已通过车辆与环境的交互构建局部“世界模型”,为更复杂的AGI奠定了基础。
4.挑战与限制
技术与成本的平衡
当前人形机器人仍面临高成本和低泛用性问题。例如,复杂手部操作(如穿针引线)尚未突破,且硬件成本限制了大规模应用。
算法与硬件的割裂风险
尽管机器人公司强调整合,但算法研发(如大模型训练)仍高度依赖算力与数据规模,而这可能超出硬件公司的能力范围。例如,OpenAI虽重启机器人项目,但其核心优势仍在软件层面,硬件需依赖外部合作。
5.未来可能性:机器人公司作为“枢纽”
综合来看,机器人公司更可能成为AGI生态的枢纽而非唯一主导者:
数据提供者与场景试验场
机器人公司通过真实场景的数据采集和任务执行,为通用模型训练提供燃料。例如,AgiBot World数据集已被视为具身智能领域的关键资源。
跨领域技术的整合平台
从传感器、机械设计到AI算法,机器人公司需整合多方技术,这种需求可能推动其与云计算、芯片、材料等行业的深度合作,形成技术联盟。
机器人公司在整合硬件、数据与物理交互方面具备独特优势,且行业趋势(如开源协作、资本涌入)进一步强化了这一可能性。然而,AGI的实现仍需跨领域协作,机器人公司更可能扮演生态整合者的角色,而非独立完成所有突破。未来,具身智能与纯软件路线的结合(如机器人公司提供数据,大模型公司优化算法)或许是更现实的路径。