在这个由数据和算法狂飙突进的AI时代,我们习惯了与Siri、小爱同学对话,习惯了生成式AI妙笔生花。然而,在这片喧嚣的数字大陆之外,有一个群体被折叠在“沟通的孤岛”——他们因中风、渐冻症、喉癌切除等原因失去了发声的能力。
我国是中风发病大国,存量患者达2800万,其中三分之一伴有言语障碍后遗症。对于他们而言,最平常的“你好”或“我爱你”,都成了奢侈的渴望。传统电子喉只能发出单调的机械音,不仅难以听清,更剥夺了患者原有的声音特质与尊严。当前,AI浪潮席卷千行百业,但大多数焦点仍停留在算力、大模型或具身智能的竞赛上。有一家成立仅两年的公司——北京芯智睿声科技有限公司(以下简称“芯智睿声”)却选择了一条更安静、更具人文温度的技术路径:用“石墨烯+AI”为千万失语者重建声音。他们推出的全球首创可穿戴智能人工喉,不是冷冰冰的机器替代,而是一片薄如发丝的“创可贴”,通过纳米级传感器感知喉部肌肉振动,再经AI还原出患者患病前独有的音色与情感。

这不仅是硬科技的突破,更是对“人何以成为人”的一次温柔回应。我国仅聋哑人群就有近2780万,占总人口近2%,理论上每50人中就会遇到一位,我们却极少在生活中感知到他们的存在。原因是,沟通的壁垒将他们封闭在各自的圈子里。“这个需求一直都在,而且很大。之所以我们看不到,是因为之前没有能解决问题的技术。”联合创始人兼CEO王宇峰说。
正是这份“看见”,驱动他们研发出这款非侵入式可穿戴智能人工喉,让那些因喉切、中风、渐冻症而失语的人们,能重新发出属于自己的、带有情感和语调的声音。
这位毕业于清华的典型理工男,话语间没有浮夸的修饰,却字字透露出技术人独有的务实与坚定。他认为,AI最伟大的价值不是炫技,而是作为工具去解放那些被身体禁锢的生产力与灵魂,他坚信,“科技的温度,在于让每一个微弱的声音都被清晰地听见。”
是用户真实的呼声,让我看清了这个“真需求
:Q王总您好,我们注意到芯智睿声虽然公司在2024年6月才成立,但您在清华其实已经有十年的团队积累,能讲讲那段经历吗?王宇峰:没问题。我们本质上就是清华的一个科技成果转化项目,技术源头都在清华。我本硕都毕业于清华,课题组原本的研究方向就是智能传感设备,在传感器方面有多年积累,非常清楚它的性能边界,也一直在寻找合适的应用场景。直到大模型爆发,我们发现,把传感器和大模型结合起来,就能让它在功能上更加贴近实际应用,特别是在帮助语音障碍人群进行语音修复和重建方面,让他们可以和外界顺畅交流。:Q现在AI这么发达,咱们通过AI是怎么把准确率提到90%这样一个水平的?王宇峰:大模型爆发确实是个非常好的契机。从直观层面讲,语音障碍者讲话,虽然外人听不清、听不懂,但长期和他生活的家人或护工,却能大概猜出他的意思。这说明,他讲的话虽然变了形,但存在大量规律。而大模型最擅长的就是抓取规律,做非线性拟合。只要抓到用户发音的规律,就能将信号匹配成他想表达的内容,进行高精度还原。从技术细节讲,我们对声学信号有多年的研究积累,知道如何对生理信号进行特征提取和建模,再把这些和现在主流的Transformer或Conformer等深度学习网络架构结合起来,借助它们强大的拟合能力来总结规律,效果就非常好了:Q创业家里人是什么态度呢?王宇峰:这确实是一个取舍的问题。我也有大厂经历,但发现在大厂方向往往是确定的,个人能起到的作用相对有限。如果我看到一个方向,觉得它非常有未来且特别有意义,就更倾向于选择后者。我们这个方向就是典型,技术上具有创新性,同时又有很强的公益属性。你想想,我国光是中风后遗症存量患者就有2800万,其中三分之一有构音障碍;聋哑人群据统计也有2780万。这是什么概念?平均每50个人里可能就有一个。但为什么我们平时很少见到他们?因为他们被困在家里,社交半径极度受限,久而久之甚至会产生心理问题。如果我们的设备能帮他们恢复交流能力,这其实也是在解放生产力。:Q那有没有哪一个瞬间,让你下定决心“这件事我必须做”?王宇峰:可能很难归结为某个瞬间,这是一个逐渐坚定的过程。我们把原型机做出来后,受到了很多媒体关注,但最触动我的是收到了大量来自患者和家属的反馈。他们最关心两件事:一是我的情况你们能解决吗?二是你们的产品哪里能买到?这告诉我们,这是真正的需求。科技工作者最怕的就是自己臆想的需求。当看到那些数字,想清楚背后意味着什么,我就觉得这件事值得做。它既有巨大的社会公益意义,这么大的体量,在商业上也完全可以形成闭环。

:Q能看到这波创业者,清华的会特别多,作为清华毕业生,您怎么看待这个问题?王宇峰:我们学校的校训“自强不息,厚德载物”,我觉得特别好。自强不息就是说,生活中、创业中总会遇到各种困难,但只要认定了目标,就一定不要停止。厚德载物在我这里的理解,就是做任何事不仅要追求商业成功,也要看这件事是不是真的有意义,对多少人有意义,要站在社会层面的角度去考量。和北大的创业者也经常有接触,上学的时候,我们其实就隔着一条街。跟他们交流,可以形成很好的互补。他们看问题的角度可能更特别,思路更开阔。我们清华人可能是认准一个方向,脚踏实地,用很多具体方案去攻克它。北大的人呢,可能会给我们提供很多新思路,让我们去审视在其他领域还有没有扩展空间,或者和别的方向能不能产生结合。两边各有特点,结合起来其实很有力量。
一片”创可贴“背后的技术攻防战
:Q芯智睿声的设备是贴在喉咙上的,它有石墨烯传感器、麦克风、AI算法,这三者具体是怎么分工协作的?王宇峰:我们的石墨烯传感器是一个柔性应变传感器,贴附在喉部时,能感受讲话时头颈部肌肉的运动和振动,主要采集100赫兹以下的低频信号,比如口型变化。麦克风采集的是高频段的声音信号,主要是80到8K赫兹。这两者形成互补,而不是简单的1+1=2。有了这些物理信号后,我们的AI模型就要对它们进行特征提取和解码,把这些持续的波形和表达内容对应起来。特别是对于一些发声很弱的患者,麦克风信号微弱,此时柔性传感器采集的肌肉运动信号就至关重要,权重会更高,这让我们的适用范围比传统设备广得多。:Q那这款设备最核心的特点是什么?王宇峰:除了多模态互补带来的高准确率,最关键的是在用户体验上,我们能还原用户患病前的“原声”。只需要提供患病前大概3秒钟的音频或视频,就可以克隆他的音色。这点非常重要,因为很多人患病后,不仅是讲话不清楚,音色也会发生巨变,可能以前很有磁性的声音变得很尖细。这对病人是很大的心理落差,会产生社交羞耻感,导致他们不愿开口。我们的技术,是在帮他们重建信心,让他们能重新自信、自由地表达,而不仅仅是发出声音。:Q咱们主打的一个点是“无感”,这具体体现在哪?王宇峰:“无感”首先是非植入的,我们只需要贴付。而且传感器厚度只有50微米,大概是头发丝的一半,非常轻薄,贴上后做颈部运动都几乎没感觉。它可以反复使用,但我们建议隔一段时间换一片,因为作为柔性材料,长时间使用后性能会有一定漂移。不过成本控制得很好,用户每天的使用成本大概在两块钱左右,甚至比一些连续血糖监测仪的耗材成本还要低。

:Q目前市面上做这类产品的公司不多,大厂也几乎没进场。如果有人想抄,咱们最“抄不走”的优势是什么?王宇峰:这不是一个单点突破,而是环环相扣的壁垒。首先是柔性传感器本身,但更核心的是对声音相关生理信号的深刻理解。你得先知道哪些生理信号最能反映发声意图,才能针对性地设计传感器,并调整后端的大模型结构。这是从清华实验室开始,经过了非常长周期的积累。另一个巨大的护城河是数据。我们要采集的不是正常人说话的数据,而是语音障碍者的病理数据。他们精力体力有限,配合意愿也更低,需要我们反复沟通、解释意义,采集过程极其耗费心力,是真正的“脏活累活”。这种端到端的积累,别人即使看到,也很难在短时间内跨越。:Q我看咱们也获得了很多奖项,比如入选了工信部的“人工智能医疗器械创新任务揭榜挂帅”,还有在“中关村国际前沿科技大赛”拿了奖。这些荣誉对咱们意味着什么?王宇峰:工信部揭榜挂帅那个项目,门槛非常高,全国只有一百多家入选,我们是其中之一,联合了清华大学和华中科技大学附属同济医院共同申请。这是工信部和国家药监局、国家卫健委等多部门联合发布的,在人工智能医疗器械领域是最重要的一个板块项目。在这个项目里,我们不仅做了人工喉,还在吞咽可穿戴监测设备上做了布局,因为吞咽障碍和构音障碍往往是伴生的。这充分说明了我们的技术得到了国家层面的认可。:Q咱们的创业团队是一群什么样的人?王宇峰:要做这么一个有挑战性的全新项目,一定会有一个leader,但仅靠他一个人绝对没办法支撑起这么大体量的事业。我们现在公司规模不大,15位全职员工里有14位是工程师,硕博占比超过40%,麻雀虽小五脏俱全,从软件、硬件、固件到外观结构设计,全链条都覆盖了。每次取得里程碑,整个团队都会在一起做总结和庆祝。因为团队才是最重要的,尤其是在这个AI时代,AI虽然带来了知识平权,但人永远是最关键的。每次庆祝,都是对团队紧密合作的肯定,也是让大家蓄力去提出新目标的过程。
寻找同频的伙伴,在快与慢之间走稳路
:Q创业这么难,有遇到什么具体的困难吗?王宇峰:我们一直在克服各种困难。技术上,刚才提到的数据采集就是最大的挑战。融资上,对初创公司来说,寻找适配的伙伴非常重要,要找“Smart Money”。我们要找真正理解我们的技术、认可我们愿景,并愿意陪同长跑的资本。只有找到最合适的,他们在我们遇到困难时才会有耐心,甚至能带来供应链、人才等金融属性之外的资源,形成良性循环。:Q咱们的产品现在进展到哪一步了?王宇峰:因为我们走的是二类医疗器械注册,正在走监管流程。目前工程样机已经定型,完成了摸底检测和迭代,预计今年Q2正式提交请检,之后还要经过临床和报证两个阶段,拿到注册证后就可以上市销售了。上市最早也得明年。很多试用过这款产品的患者,都急切的希望能够使用。我们也很着急,但是确实需要一个过程。:Q那我们未来打算在哪能买到它?王宇峰:我们虽然是医疗器械,但属于消费医疗属性,无需医生做植入手术,也不像助听器那样需要专业技师适配,所以天然具有直达终端用户的属性。渠道上我们会多元化布局:一是跟政府和残联、脑协合作推广;二是传统的医院院内销售,这既是背书也是患者集散地;三是新兴渠道,比如跟保险公司、体检中心合作;四是我们最看重的,直接面向终端用户,通过线上电商结合线下药店加盟或体验店的形式。价格上,我们会推出不同的产品管线,并探索和公益基金合作,进入残联的辅助器械名录,争取补贴,力争让所有真正有需要的人都能用得上、用得起。:Q目前AI医疗赛道普遍存在“技术好、融资难、落地慢”的困境。咱们未来如果进行大规模融资,能保持初心不变吗?王宇峰:这又回到了“Smart Money”上。如果急于求成,拿了短视资本的钱,他们退出的条件和对回报周期的耐心,很可能跟我们的发展节奏错配。明明再坚持一年就能迎来爆发,但对方可能要求你马上变现,这会影响企业根基。所以,无论是从理想主义还是现实主义角度,坚守初心最关键的一点,就是找到和我们真正同频的投资人,能够长期陪伴,理解我们的愿景,并在困难时给予耐心和资源支持。
从医疗康复到人机交互的星辰大海
:Q咱们的技术也可以做延展,未来还想在哪些方向努力?王宇峰:我们最看重的扩展其实是在未来消费电子领域。你看现在的输入方式,无非是触屏和语音。但语音交互在图书馆、工位等场景会吵到别人,还涉及隐私问题。随着智能眼镜这类可穿戴设备发展,触摸屏没地方放,更需要新的交互方式。我们的技术如果延伸过去,就能实现“弱声”甚至“无声”的交互。你只需要动口型,或者极小声说话,别人听不见,但设备通过捕捉肌肉运动就能明白你的指令,这会是继触屏和语音之后,一种全新的交互范式。:Q您觉得咱们的技术未来可以和具身智能有融合吗?王宇峰:当然,这是个很有前瞻性的问题。具身智能现在流行“大小脑”概念,“大脑”负责决策,大模型已经能帮我们做很好的规划了。但问题往往出在“小脑”的执行层面。比如大脑说要喝水,小脑就得精准控制机械臂完成抓取、抬起、送到嘴边这一系列动作。现在很多执行层面还是靠视觉CV技术,但它有弊端,比如无法判断力度。如果我们能进行及时的触觉传感和反馈,效率会大大提升。我们的柔性传感器,未来可以像电子皮肤一样,低成本部署在关节节点上,为机器人的动作提供反馈信号,让抓取更准确高效。
