众力资讯网

【中国这家公司造了个能看穿你情绪的人形机器人,口型同步延迟只有20毫秒...

【中国这家公司造了个能看穿你情绪的人形机器人,口型同步延迟只有20毫秒】

先说照片。
优必选放出来的两张图,一张是机器人和真人并肩站,我盯着看了十秒才敢确定右边那个是机器。另一张更绝,机器人噘着嘴、面无表情,活脱脱一个走秀模特——就是那种你明知道她是人类但死活看不出情绪的高级脸。
这个叫「UWORLD U1」的东西,优必选管它叫「全球首款全尺寸量产超仿生人形机器人」。参数堆得很凶:88个自由度,靠一条所谓的「专有双枢点仿生颈椎」能复现90%的人类基础动作。说人话就是,它转头、点头、歪头的幅度和流畅度,比之前那些脖子僵硬的同类高了一个量级。
但真正让我起鸡皮疙瘩的,是它那个「情绪感知」能力。优必选声称内置了全球首个情绪感知大语言模型,能识别20多种细粒度情绪状态,准确率超过90%。你坐在它面前,紧张、烦躁、假装开心,它都能读出来。然后呢?然后用一个「仿生表情驱动系统」回应你,语音和嘴唇的同步延迟压到了20毫秒以内。20毫秒什么概念?你眨一次眼大概要100到300毫秒。
这就意味着,你跟它说话的时候,它回你话的速度、嘴唇动的节奏、脸上的微表情,几乎跟你和真人聊天没区别。
拆一下它的底层架构。优必选提了一个叫「仿生快慢大脑」的设计,说是借鉴了认知神经科学。快系统500毫秒内给出直觉式响应,慢系统靠千亿参数模型做深度推理。翻译一下:日常对话、简单互动,它反应极快,不用等;遇到复杂问题,切到「慢脑」深度算一轮。这个双轨制如果能跑通,确实比市面上那些要么反应慢半拍、要么只会背模板的对话机器人实用得多。
官方给出的应用场景拉得也很满:日常陪伴、情感支持、老年护理、心理疏导、旅游导览、展览讲解、家政服务……甚至还能陪你跳舞。发布会上有一段它跟着音乐扭的画面,动作算不上丝滑,但至少不像是关节生锈的铁架子。
但我有几个过不去的地方。
第一个,长相。不是不逼真,是太逼真了,逼真到跌进了恐怖谷的深坑。那层硅胶皮肤、那个微表情驱动,做得越好,越让人觉得什么地方不对劲。特别是噘嘴那张图,你明知道它是个机器,但大脑本能会觉得「这张脸应该是有体温的」,然后你意识到它没有,后背就凉了。
第二个,数据问题。优必选说得很聪明,专门强调了「用户保留数据所有权」,「最小化云依赖」,大部分数据处理在本地完成。这套话术显然是为了打消隐私顾虑——一个能读你情绪的机器人,如果数据全传上云端,那基本等于在你家客厅装了个读心术监控。但本地处理到哪一步、哪些数据会被上传、更新模型时会不会回传用户交互记录,这些全没说。
第三,订单数。13000多台的预定数字看起来唬人,但你仔细看定价:17600美元,折合人民币13万左右。这个价位在企业采购里算中低端,但在消费市场,13万买一个「陪伴机器人」,谁会掏钱?是养老机构批量采购,还是真的有普通家庭愿意花一辆车的钱请个电子保姆回家?这个数字的含金量我持保留态度。
再说背景。中国政府已经在把南山区(就是深圳那个遍地科技公司的地方)往「机器人谷」的方向推,官媒也在造势要让人形机器人成为国家名片。同一周,日本和韩国几乎同时发布了各自的产业政策,也都喊出了「主导人形机器人行业」的口号。马斯克那边更不用说,放话要年产百万台,2040年要有100亿个人形机器人跟我们一起走路。
这赛道已经不是预热了,是直接烧开了锅。
但问题是,大家都在比谁跑得快,没几个人停下来想:我们要这些东西到底干什么。陪伴?情感支持?养老护理?这些需求真实存在,可把一个能读情绪、会做微表情、口型同步到毫秒级的机器人塞进这些场景里,带来的到底是解决方案,还是新的麻烦,我真说不好。
优必选这个U1,技术上确实甩了大部分同行一截。但它越像人,问题就越多。你还分得清自己在跟谁说话吗?你的孤独是被陪伴消解了,还是被模拟出来的共情泡沫暂时盖住了?13万买断一个人的表情和反应,这账到底划不划算?