【中国这家公司造了个能看穿你情绪的人形机器人，口型同步延迟只有20毫秒...

【中国这家公司造了个能看穿你情绪的人形机器人，口型同步延迟只有20毫秒】

先说照片。
优必选放出来的两张图，一张是机器人和真人并肩站，我盯着看了十秒才敢确定右边那个是机器。另一张更绝，机器人噘着嘴、面无表情，活脱脱一个走秀模特——就是那种你明知道她是人类但死活看不出情绪的高级脸。
这个叫「UWORLD U1」的东西，优必选管它叫「全球首款全尺寸量产超仿生人形机器人」。参数堆得很凶：88个自由度，靠一条所谓的「专有双枢点仿生颈椎」能复现90%的人类基础动作。说人话就是，它转头、点头、歪头的幅度和流畅度，比之前那些脖子僵硬的同类高了一个量级。
但真正让我起鸡皮疙瘩的，是它那个「情绪感知」能力。优必选声称内置了全球首个情绪感知大语言模型，能识别20多种细粒度情绪状态，准确率超过90%。你坐在它面前，紧张、烦躁、假装开心，它都能读出来。然后呢？然后用一个「仿生表情驱动系统」回应你，语音和嘴唇的同步延迟压到了20毫秒以内。20毫秒什么概念？你眨一次眼大概要100到300毫秒。
这就意味着，你跟它说话的时候，它回你话的速度、嘴唇动的节奏、脸上的微表情，几乎跟你和真人聊天没区别。
拆一下它的底层架构。优必选提了一个叫「仿生快慢大脑」的设计，说是借鉴了认知神经科学。快系统500毫秒内给出直觉式响应，慢系统靠千亿参数模型做深度推理。翻译一下：日常对话、简单互动，它反应极快，不用等；遇到复杂问题，切到「慢脑」深度算一轮。这个双轨制如果能跑通，确实比市面上那些要么反应慢半拍、要么只会背模板的对话机器人实用得多。
官方给出的应用场景拉得也很满：日常陪伴、情感支持、老年护理、心理疏导、旅游导览、展览讲解、家政服务……甚至还能陪你跳舞。发布会上有一段它跟着音乐扭的画面，动作算不上丝滑，但至少不像是关节生锈的铁架子。
但我有几个过不去的地方。
第一个，长相。不是不逼真，是太逼真了，逼真到跌进了恐怖谷的深坑。那层硅胶皮肤、那个微表情驱动，做得越好，越让人觉得什么地方不对劲。特别是噘嘴那张图，你明知道它是个机器，但大脑本能会觉得「这张脸应该是有体温的」，然后你意识到它没有，后背就凉了。
第二个，数据问题。优必选说得很聪明，专门强调了「用户保留数据所有权」，「最小化云依赖」，大部分数据处理在本地完成。这套话术显然是为了打消隐私顾虑——一个能读你情绪的机器人，如果数据全传上云端，那基本等于在你家客厅装了个读心术监控。但本地处理到哪一步、哪些数据会被上传、更新模型时会不会回传用户交互记录，这些全没说。
第三，订单数。13000多台的预定数字看起来唬人，但你仔细看定价：17600美元，折合人民币13万左右。这个价位在企业采购里算中低端，但在消费市场，13万买一个「陪伴机器人」，谁会掏钱？是养老机构批量采购，还是真的有普通家庭愿意花一辆车的钱请个电子保姆回家？这个数字的含金量我持保留态度。
再说背景。中国政府已经在把南山区（就是深圳那个遍地科技公司的地方）往「机器人谷」的方向推，官媒也在造势要让人形机器人成为国家名片。同一周，日本和韩国几乎同时发布了各自的产业政策，也都喊出了「主导人形机器人行业」的口号。马斯克那边更不用说，放话要年产百万台，2040年要有100亿个人形机器人跟我们一起走路。
这赛道已经不是预热了，是直接烧开了锅。
但问题是，大家都在比谁跑得快，没几个人停下来想：我们要这些东西到底干什么。陪伴？情感支持？养老护理？这些需求真实存在，可把一个能读情绪、会做微表情、口型同步到毫秒级的机器人塞进这些场景里，带来的到底是解决方案，还是新的麻烦，我真说不好。
优必选这个U1，技术上确实甩了大部分同行一截。但它越像人，问题就越多。你还分得清自己在跟谁说话吗？你的孤独是被陪伴消解了，还是被模拟出来的共情泡沫暂时盖住了？13万买断一个人的表情和反应，这账到底划不划算？

众力资讯网

【中国这家公司造了个能看穿你情绪的人形机器人，口型同步延迟只有20毫秒...

热门分类

【中国这家公司造了个能看穿你情绪的人形机器人，口型同步延迟只有20毫秒...

猜你喜欢

热门分类