“AI录音设备”这个品类的产品有很多,不过也逐渐收敛到“AI录音卡”或“AI录音豆”这两种形态上。
这类产品携带方便,随时可以开启录音功能。比较参见的场景是,工作上的会议记录、日常对话交流以及当作语音备忘录。“AI录音卡”的功能并不仅仅是录音,否则就该叫做录音卡了。这些硬件会在录音后通过 ASR 转换为文本,并接入 AI 模型进行润色和总结。有些产品甚至还号称可以帮助用户做决策。
我经常在电商平台上看到各种品牌的“AI录音卡”推荐,总想买个回来体验一下。但在昨天认真思考和实验后,发现的问题还比较多。
这些都是我自己的问题。其一是我几乎没有录音的需求,毕竟线下没有会议要参与,日常要张嘴的机会也比较少,而且很少自言自语。其二是我发现,我的口语表达非常差。
我昨天vibe了一个带ASR的本地应用,我发现只要点击开始录音,我就不怎么会讲话了。结巴不连贯,逻辑混乱,有时停顿10秒也吐不出下一句,压根没法把事情讲明白。即便不考虑逻辑,在语言流畅度上还比不上“黄龙江一派全都带蓝牙”那段。
脱稿表达完全不行,那读自己写的文本应该没问题吧?我试了下,好像也不太行。我发现念自己写的微博也会各种磕巴,因为在我一边念的时候就会发现自己的措辞和句子都有很多毛病,有毛病也就读不通顺了。这些毛病平时在默念检查的时候基本发现不了。
既然读自己写的不行,那朗诵别人写的总没问题了吧?好像也不太行,只要需要我张嘴念词儿,就会磕巴。我的感受是眼睛没办法把“光标”提前,读到自己无法预测的词儿就会磕巴一下。但默读的时候我的阅读速度可以很快,光标唰一下就扫过去了,所以可能还是得读出声才行。
前几天凌晨4点多,我突然醒了,迷迷糊糊躺床上刷了会儿购物APP,我刷到一款叫做“每日念嘴”的卡片,7乘6厘米的尺寸,上面印了一些文稿,一张合计五毛钱。由于我还没睡醒,所以就没细看内容,但直觉上这东西应该对我有用就下单了。到货后我看了下,这卡片上的文字有点儿“尬”,就放在了一旁。昨天重新拿起这些“文字很尬”的卡片,点开录音后读了两张。结果就是,虽然卡片的文字“很尬”,但我读起来依然不太流利。
对着显示器张嘴说话是很奇怪的,我很不习惯这样做,但我觉得还是要多练习。我简单想了下,我需要分三个级别来练习。第一级是念已有的文字,比如我买的卡片或是书籍上的文字。第二级是念自己写的东西,念一遍、改一遍,反复念、反复改。第三级是自己找个话题,不提前写文字稿自由表达,争取把想表达的事情说明白、说清楚、说流畅。
