图灵AI对话|当石墨烯遇见AI：一片贴在喉咙上的“创可贴”，如何让千万人重新开口？

在这个由数据和算法狂飙突进的AI时代，我们习惯了与Siri、小爱同学对话，习惯了生成式AI妙笔生花。然而，在这片喧嚣的数字大陆之外，有一个群体被折叠在“沟通的孤岛”——他们因中风、渐冻症、喉癌切除等原因失去了发声的能力。

我国是中风发病大国，存量患者达2800万，其中三分之一伴有言语障碍后遗症。对于他们而言，最平常的“你好”或“我爱你”，都成了奢侈的渴望。传统电子喉只能发出单调的机械音，不仅难以听清，更剥夺了患者原有的声音特质与尊严。当前，AI浪潮席卷千行百业，但大多数焦点仍停留在算力、大模型或具身智能的竞赛上。有一家成立仅两年的公司——北京芯智睿声科技有限公司（以下简称“芯智睿声”）却选择了一条更安静、更具人文温度的技术路径：用“石墨烯+AI”为千万失语者重建声音。他们推出的全球首创可穿戴智能人工喉，不是冷冰冰的机器替代，而是一片薄如发丝的“创可贴”，通过纳米级传感器感知喉部肌肉振动，再经AI还原出患者患病前独有的音色与情感。

这不仅是硬科技的突破，更是对“人何以成为人”的一次温柔回应。我国仅聋哑人群就有近2780万，占总人口近2%，理论上每50人中就会遇到一位，我们却极少在生活中感知到他们的存在。原因是，沟通的壁垒将他们封闭在各自的圈子里。“这个需求一直都在，而且很大。之所以我们看不到，是因为之前没有能解决问题的技术。”联合创始人兼CEO王宇峰说。

正是这份“看见”，驱动他们研发出这款非侵入式可穿戴智能人工喉，让那些因喉切、中风、渐冻症而失语的人们，能重新发出属于自己的、带有情感和语调的声音。

这位毕业于清华的典型理工男，话语间没有浮夸的修饰，却字字透露出技术人独有的务实与坚定。他认为，AI最伟大的价值不是炫技，而是作为工具去解放那些被身体禁锢的生产力与灵魂，他坚信，“科技的温度，在于让每一个微弱的声音都被清晰地听见。”

是用户真实的呼声，让我看清了这个“真需求

：Q王总您好，我们注意到芯智睿声虽然公司在2024年6月才成立，但您在清华其实已经有十年的团队积累，能讲讲那段经历吗？王宇峰：没问题。我们本质上就是清华的一个科技成果转化项目，技术源头都在清华。我本硕都毕业于清华，课题组原本的研究方向就是智能传感设备，在传感器方面有多年积累，非常清楚它的性能边界，也一直在寻找合适的应用场景。直到大模型爆发，我们发现，把传感器和大模型结合起来，就能让它在功能上更加贴近实际应用，特别是在帮助语音障碍人群进行语音修复和重建方面，让他们可以和外界顺畅交流。：Q现在AI这么发达，咱们通过AI是怎么把准确率提到90%这样一个水平的？王宇峰：大模型爆发确实是个非常好的契机。从直观层面讲，语音障碍者讲话，虽然外人听不清、听不懂，但长期和他生活的家人或护工，却能大概猜出他的意思。这说明，他讲的话虽然变了形，但存在大量规律。而大模型最擅长的就是抓取规律，做非线性拟合。只要抓到用户发音的规律，就能将信号匹配成他想表达的内容，进行高精度还原。从技术细节讲，我们对声学信号有多年的研究积累，知道如何对生理信号进行特征提取和建模，再把这些和现在主流的Transformer或Conformer等深度学习网络架构结合起来，借助它们强大的拟合能力来总结规律，效果就非常好了：Q创业家里人是什么态度呢？王宇峰：这确实是一个取舍的问题。我也有大厂经历，但发现在大厂方向往往是确定的，个人能起到的作用相对有限。如果我看到一个方向，觉得它非常有未来且特别有意义，就更倾向于选择后者。我们这个方向就是典型，技术上具有创新性，同时又有很强的公益属性。你想想，我国光是中风后遗症存量患者就有2800万，其中三分之一有构音障碍；聋哑人群据统计也有2780万。这是什么概念？平均每50个人里可能就有一个。但为什么我们平时很少见到他们？因为他们被困在家里，社交半径极度受限，久而久之甚至会产生心理问题。如果我们的设备能帮他们恢复交流能力，这其实也是在解放生产力。：Q那有没有哪一个瞬间，让你下定决心“这件事我必须做”？王宇峰：可能很难归结为某个瞬间，这是一个逐渐坚定的过程。我们把原型机做出来后，受到了很多媒体关注，但最触动我的是收到了大量来自患者和家属的反馈。他们最关心两件事：一是我的情况你们能解决吗？二是你们的产品哪里能买到？这告诉我们，这是真正的需求。科技工作者最怕的就是自己臆想的需求。当看到那些数字，想清楚背后意味着什么，我就觉得这件事值得做。它既有巨大的社会公益意义，这么大的体量，在商业上也完全可以形成闭环。

：Q能看到这波创业者，清华的会特别多，作为清华毕业生，您怎么看待这个问题？王宇峰：我们学校的校训“自强不息，厚德载物”，我觉得特别好。自强不息就是说，生活中、创业中总会遇到各种困难，但只要认定了目标，就一定不要停止。厚德载物在我这里的理解，就是做任何事不仅要追求商业成功，也要看这件事是不是真的有意义，对多少人有意义，要站在社会层面的角度去考量。和北大的创业者也经常有接触，上学的时候，我们其实就隔着一条街。跟他们交流，可以形成很好的互补。他们看问题的角度可能更特别，思路更开阔。我们清华人可能是认准一个方向，脚踏实地，用很多具体方案去攻克它。北大的人呢，可能会给我们提供很多新思路，让我们去审视在其他领域还有没有扩展空间，或者和别的方向能不能产生结合。两边各有特点，结合起来其实很有力量。

一片”创可贴“背后的技术攻防战

：Q芯智睿声的设备是贴在喉咙上的，它有石墨烯传感器、麦克风、AI算法，这三者具体是怎么分工协作的？王宇峰：我们的石墨烯传感器是一个柔性应变传感器，贴附在喉部时，能感受讲话时头颈部肌肉的运动和振动，主要采集100赫兹以下的低频信号，比如口型变化。麦克风采集的是高频段的声音信号，主要是80到8K赫兹。这两者形成互补，而不是简单的1+1=2。有了这些物理信号后，我们的AI模型就要对它们进行特征提取和解码，把这些持续的波形和表达内容对应起来。特别是对于一些发声很弱的患者，麦克风信号微弱，此时柔性传感器采集的肌肉运动信号就至关重要，权重会更高，这让我们的适用范围比传统设备广得多。：Q那这款设备最核心的特点是什么？王宇峰：除了多模态互补带来的高准确率，最关键的是在用户体验上，我们能还原用户患病前的“原声”。只需要提供患病前大概3秒钟的音频或视频，就可以克隆他的音色。这点非常重要，因为很多人患病后，不仅是讲话不清楚，音色也会发生巨变，可能以前很有磁性的声音变得很尖细。这对病人是很大的心理落差，会产生社交羞耻感，导致他们不愿开口。我们的技术，是在帮他们重建信心，让他们能重新自信、自由地表达，而不仅仅是发出声音。：Q咱们主打的一个点是“无感”，这具体体现在哪？王宇峰：“无感”首先是非植入的，我们只需要贴付。而且传感器厚度只有50微米，大概是头发丝的一半，非常轻薄，贴上后做颈部运动都几乎没感觉。它可以反复使用，但我们建议隔一段时间换一片，因为作为柔性材料，长时间使用后性能会有一定漂移。不过成本控制得很好，用户每天的使用成本大概在两块钱左右，甚至比一些连续血糖监测仪的耗材成本还要低。

：Q目前市面上做这类产品的公司不多，大厂也几乎没进场。如果有人想抄，咱们最“抄不走”的优势是什么？王宇峰：这不是一个单点突破，而是环环相扣的壁垒。首先是柔性传感器本身，但更核心的是对声音相关生理信号的深刻理解。你得先知道哪些生理信号最能反映发声意图，才能针对性地设计传感器，并调整后端的大模型结构。这是从清华实验室开始，经过了非常长周期的积累。另一个巨大的护城河是数据。我们要采集的不是正常人说话的数据，而是语音障碍者的病理数据。他们精力体力有限，配合意愿也更低，需要我们反复沟通、解释意义，采集过程极其耗费心力，是真正的“脏活累活”。这种端到端的积累，别人即使看到，也很难在短时间内跨越。：Q我看咱们也获得了很多奖项，比如入选了工信部的“人工智能医疗器械创新任务揭榜挂帅”，还有在“中关村国际前沿科技大赛”拿了奖。这些荣誉对咱们意味着什么？王宇峰：工信部揭榜挂帅那个项目，门槛非常高，全国只有一百多家入选，我们是其中之一，联合了清华大学和华中科技大学附属同济医院共同申请。这是工信部和国家药监局、国家卫健委等多部门联合发布的，在人工智能医疗器械领域是最重要的一个板块项目。在这个项目里，我们不仅做了人工喉，还在吞咽可穿戴监测设备上做了布局，因为吞咽障碍和构音障碍往往是伴生的。这充分说明了我们的技术得到了国家层面的认可。：Q咱们的创业团队是一群什么样的人？王宇峰：要做这么一个有挑战性的全新项目，一定会有一个leader，但仅靠他一个人绝对没办法支撑起这么大体量的事业。我们现在公司规模不大，15位全职员工里有14位是工程师，硕博占比超过40%，麻雀虽小五脏俱全，从软件、硬件、固件到外观结构设计，全链条都覆盖了。每次取得里程碑，整个团队都会在一起做总结和庆祝。因为团队才是最重要的，尤其是在这个AI时代，AI虽然带来了知识平权，但人永远是最关键的。每次庆祝，都是对团队紧密合作的肯定，也是让大家蓄力去提出新目标的过程。

寻找同频的伙伴，在快与慢之间走稳路

：Q创业这么难，有遇到什么具体的困难吗？王宇峰：我们一直在克服各种困难。技术上，刚才提到的数据采集就是最大的挑战。融资上，对初创公司来说，寻找适配的伙伴非常重要，要找“Smart Money”。我们要找真正理解我们的技术、认可我们愿景，并愿意陪同长跑的资本。只有找到最合适的，他们在我们遇到困难时才会有耐心，甚至能带来供应链、人才等金融属性之外的资源，形成良性循环。：Q咱们的产品现在进展到哪一步了？王宇峰：因为我们走的是二类医疗器械注册，正在走监管流程。目前工程样机已经定型，完成了摸底检测和迭代，预计今年Q2正式提交请检，之后还要经过临床和报证两个阶段，拿到注册证后就可以上市销售了。上市最早也得明年。很多试用过这款产品的患者，都急切的希望能够使用。我们也很着急，但是确实需要一个过程。：Q那我们未来打算在哪能买到它？王宇峰：我们虽然是医疗器械，但属于消费医疗属性，无需医生做植入手术，也不像助听器那样需要专业技师适配，所以天然具有直达终端用户的属性。渠道上我们会多元化布局：一是跟政府和残联、脑协合作推广；二是传统的医院院内销售，这既是背书也是患者集散地；三是新兴渠道，比如跟保险公司、体检中心合作；四是我们最看重的，直接面向终端用户，通过线上电商结合线下药店加盟或体验店的形式。价格上，我们会推出不同的产品管线，并探索和公益基金合作，进入残联的辅助器械名录，争取补贴，力争让所有真正有需要的人都能用得上、用得起。：Q目前AI医疗赛道普遍存在“技术好、融资难、落地慢”的困境。咱们未来如果进行大规模融资，能保持初心不变吗？王宇峰：这又回到了“Smart Money”上。如果急于求成，拿了短视资本的钱，他们退出的条件和对回报周期的耐心，很可能跟我们的发展节奏错配。明明再坚持一年就能迎来爆发，但对方可能要求你马上变现，这会影响企业根基。所以，无论是从理想主义还是现实主义角度，坚守初心最关键的一点，就是找到和我们真正同频的投资人，能够长期陪伴，理解我们的愿景，并在困难时给予耐心和资源支持。

从医疗康复到人机交互的星辰大海

：Q咱们的技术也可以做延展，未来还想在哪些方向努力？王宇峰：我们最看重的扩展其实是在未来消费电子领域。你看现在的输入方式，无非是触屏和语音。但语音交互在图书馆、工位等场景会吵到别人，还涉及隐私问题。随着智能眼镜这类可穿戴设备发展，触摸屏没地方放，更需要新的交互方式。我们的技术如果延伸过去，就能实现“弱声”甚至“无声”的交互。你只需要动口型，或者极小声说话，别人听不见，但设备通过捕捉肌肉运动就能明白你的指令，这会是继触屏和语音之后，一种全新的交互范式。：Q您觉得咱们的技术未来可以和具身智能有融合吗？王宇峰：当然，这是个很有前瞻性的问题。具身智能现在流行“大小脑”概念，“大脑”负责决策，大模型已经能帮我们做很好的规划了。但问题往往出在“小脑”的执行层面。比如大脑说要喝水，小脑就得精准控制机械臂完成抓取、抬起、送到嘴边这一系列动作。现在很多执行层面还是靠视觉CV技术，但它有弊端，比如无法判断力度。如果我们能进行及时的触觉传感和反馈，效率会大大提升。我们的柔性传感器，未来可以像电子皮肤一样，低成本部署在关节节点上，为机器人的动作提供反馈信号，让抓取更准确高效。

：Q现在这款设备主要支持什么语言？能听懂方言吗？王宇峰：目前主要针对普通话人群，可以带口音，比如四川人讲的“川普”或者广东人讲的“广普”，都没有问题。但如果直接讲纯方言，比如粤语、闽南语，目前还比较困难，因为这需要收集专门针对那种方言的语料库来训练模型。但底层技术原理、硬件和模型架构都是相通的，方言支持都在我们的规划路径中。海外市场初期会优先从英文、西班牙文、法文这几个覆盖面最广的大语种开始做起。这同样面临两个核心问题：一是要采集相应语种的语音障碍患者数据来训练；二是产品必须通过当地对医疗器械的监管审批。：Q那对于一些极小众的语言，使用人数很少，可能商业上很不划算，您怎么看待这个问题？王宇峰：这涉及取舍和优先级。如果公司内部资源足够支持，我当然愿意去做，这有很强的公益属性。但我们的目标还是先惠及最广泛的人群。对于小语种，可以考虑与外部合作，比如当地的残联、政府组织，如果他们觉得这件事很重要，我们可以以政府立项的形式去推进，或者和基金会合作做定向的捐赠和立项。条条大路通罗马，不一定只能靠企业自身单打独斗。：Q如果让您展望一下，您老了之后回顾这段创业经历，最大的成就感会来源于哪？王宇峰：我希望能看到真的有人在使用我们的设备，并且是基于我们提出的理念和技术思路不断迭代，最终真正造福了这个群体。当然，如果等我老了他们还在用我这一代设备，那我会感觉有点“悲凉”，因为那说明技术没有进步。：Q最后想问一个感性的问题，创业过程中，有没有什么让您特别动容的瞬间？王宇峰：有一次我们给一位聋哑人试用，她的小朋友是不会手语的，所以平常母子之间没法顺畅沟通。用了我们的设备之后，这位体验官就可以跟孩子交流了，能说出那些以前用简单手语无法表达的细腻情感。那一刻，你会发现技术不再是一堆代码和硬件，它真的变成了一座桥。这也是支撑我们，哪怕历经再多繁琐与困难，也要走下去的终极动力。

众力资讯网

图灵AI对话|当石墨烯遇见AI：一片贴在喉咙上的“创可贴”，如何让千万人重新开口？

热门分类