众力资讯网

昨天看到一个蛮有趣的视频。在视频中,桌面上放着一个红色的有绳固定电话,作者拿起话

昨天看到一个蛮有趣的视频。

在视频中,桌面上放着一个红色的有绳固定电话,作者拿起话筒后说话,等到放下话筒后文字就发送给了豆包。我查了一下,这款固定电话的型号是 FUQIAO富桥HCD28(3)P/TSD 不过型号可能不是关键。

一般来说,我看到这种演示,就有比较大的把握能想到一系列的实现方案。不过看了视频我确实没想到特别简单的方案。

我们知道,这类固定电话所用的物理接口是 RJ11 接口,需要接入4芯水晶头,线端的外观看起来和网线差不多,但尺寸要小一些。虽然有4芯,但一般只有 Tip 和 Ring 信号在用。

而“电话线”中走的信号是比较难处理的,包含模拟音频信号,包含直流馈电,包含交流铃流以及用于拨号的 DTMF。其中挂机状态下是直流 48V 到 60V 之间,摘机后会降低到直流 8V 到 15V 左右。而振铃状态下是 25Hz 90V 的高压交流信号。

如果不针对固话做任何改动,那就需要有一个中继器去处理 RJ11 出来的信号。其中包括但不限于馈电电路的设计、摘挂机的检测逻辑、音频分离、振铃信号发生器、DTMF解析等等。后端还需要适时把音频送入 ASR 模块。

从视频上看,我猜测应该不是这样实现的,甚至电话线都没有接。所以要么是魔改了固话内部的电路,要么就是纯粹的摆拍。

我把视频EE群里和大家讨论了一下,大家的观点都差不多。群友建议我掏空电话机魔改会比较方便。

早上再去看了下视频评论区,发现作者“开源”了方案。简单看了下,是魔改,内部加了两路蓝牙。一路用 ESP32-C3 检测摘挂机动作,通过 BLE HID 来发送快捷键。另一路通过 CSR8645 蓝牙模块来连通筒麦克风和喇叭,把固话变成蓝牙耳机接入电脑。而 ASR 应该是豆包网页版自带的。

————掏空魔改固然方便不少,但做出来的东西仅此一套,大家复刻起来也会比较麻烦。做一个类似 RJ11 in USB/LAN out 的模块虽然难度高很多,但开源后复刻模块甚至小批量也比较方便。

虽然不一定会去做,但也有不少脑洞可以记录一下。

我最想保留的是 DTMF 的识别,因为这样就可以拨号。比方说打给 cc 是10086,打给 Codex 是10010,打给 Hermes 10000。

有了 DTMF 的解析,甚至在模块里面就可以处理操作逻辑。“新建会话请按1,查询已有会话列表请按2,查询余额请按3,排队下一轮请按4,暂停所有任务请按0”

振铃当然也不能浪费,当 Agent 完成任务或是需要人工确认的时候就会“打电话”过来,振铃一段时间后挂机,等两分钟再打过来直到人类拿起话筒,用按键或语音安排下一步指令。

然后把固话放在床头,半夜 Codex 可能就会给你打电话(不是)。“您布置的任务需要执行 xxxx 命令,抠1同意,抠2拒绝,重听请按0” (捣演的点子)