众力资讯网

科学家们说,他们已经想出了如何从 MRI 扫描中转录你的想法

我们正在朝着一个设备能够读取我们想法的未来迈进。你到处都能看到它的迹象,从脑机接口到从面部扫描中检测情绪的算法。尽管这项

我们正在朝着一个设备能够读取我们想法的未来迈进。

你到处都能看到它的迹象,从脑机接口到从面部扫描中检测情绪的算法。尽管这项技术仍然不完美,但它一直在接近:现在一组科学家表示,他们已经开发了一种模型,可以通过简单地分析人们大脑活动的扫描来生成对人们大脑所看到内容的描述。

他们将这种技术称为“思维字幕”,它可能代表了一种转录某人想法的有效方法,并具有令人印象深刻的全面和准确的结果。

“这很难做到,”《科学进展》杂志上一项新研究的合著者、加州大学伯克利分校的计算神经科学家亚历克斯·胡斯 (Alex Huth) 告诉《自然》杂志。“令人惊讶的是,你能得到这么多细节。”

这种技术的影响是一把双刃剑:一方面,它可以为因中风、失语症和其他医疗困难而难以说话的人发声,但另一方面,它可能会威胁到我们的精神隐私,在这个我们生活的许多其他方面都受到监视和编纂的时代。但该团队强调,该模型无法解码您的私人想法。“还没有人证明你能做到这一点,”胡斯补充道。

研究人员的新技术依赖于多种人工智能模型。为了训练它们,首先一个深度语言模型分析了 2,000 多个短视频中的文本字幕,生成了独特的“意义签名”。然后,另一个人工智能工具在六名参与者观看相同视频时对他们进行了 MRI 脑部扫描的训练,将大脑活动与签名相匹配。

结合起来,由此产生的大脑解码器可以分析观看视频的人的新大脑扫描并预测含义特征,而人工智能文本生成器则搜索与预测特征相匹配的句子,创建数十个候选描述并在此过程中对其进行细化。

虽然这听起来像是一连串精心设计的猜谜游戏,但结果非常具有描述性,而且主要是在金钱上。据《自然》杂志报道,通过分析观看某人从瀑布顶部跳下视频的参与者的大脑活动,人工智能模型最初预测了字符串“泉流”,在第十次猜测中将其细化为“在快速落下的瀑布之上”,最终在第 100 次猜测中落在“一个人跳过山脊上的深水瀑布”。

总体而言,生成的文本描述在识别 50 种可能性中的正确视频方面达到了 100% 的准确率。这明显高于随机机会,随机机会约为百分之一,并且在本质上从大脑模式中占卜出连贯想法的背景下令人印象深刻。

研究人员并不是唯一声称他们已经开发出一种扫描思想技术的人。但其他尝试只产生了对关键词的粗略描述,而不是提供详细的上下文,研究合著者、日本神奈川县 NTT 通信科学实验室的计算神经科学家 Tomoyasu Horikawa 告诉《自然》杂志。或者他们使用人工智能模型直接形成句子,模糊了人的实际想法和人工智能生成的想法之间的界限。

其他技术非常不切实际。例如,Meta 创建了一种设备,通过将深度学习 AI 模型与脑磁图扫描仪相结合,您可以用大脑输入文本。但这样的机器既昂贵又大,只能在不受地球磁场影响的房间内使用。

虽然这种最新方法依赖于 MRI 机器的扫描,这对于日常使用来说同样不切实际,但研究人员希望他们的方法可以与提供读数的大脑植入物相结合。

“如果我们能使用这些人工系统来做到这一点,也许我们可以帮助这些有沟通困难的人,”