将“老式”逻辑系统与驱动大型语言模型的神经网络融合,是人工智能领域最热门的趋势之一。
计算机是否能达到甚至超越人类水平的智能——如果会,又是如何实现的?今年早些时候,总部位于华盛顿特区的人工智能促进会(AAAI)问其会员,仅靠神经网络(目前人工智能系统的主要算法)是否足以实现这一目标,绝大多数人表示不行。相反,大多数人认为,要让这些系统达到标准,需要大量使用一种较老的人工智能:符号AI。

符号人工智能有时被称为“传统的AI”,它基于形式规则和概念间逻辑关系的编码。例如,数学是符号性的,“如果-那么”语句和计算机编程语言如Python,以及流程图或维恩图,这些图用于映射猫、哺乳动物和动物在概念上的关联。几十年前,符号系统是人工智能领域的早期领先者。然而,在2010年代初,它们被更灵活的神经网络大幅超越。这些机器学习模型擅长从海量数据中学习,是大型语言模型(LLM)以及ChatGPT等聊天机器人的基础。
然而,现在计算机科学界正积极推动新旧融合的更好、更大胆的结合。“神经符号人工智能”已成为城中最热门的流行词汇。马里兰大学学院公园分校的计算机科学家布兰登·科勒洛在学术论文中描绘了这一概念的迅速崛起(参见论文《不断向上》)。这些数据显示,自2021年左右开始,神经符号人工智能的兴趣激增,且没有减缓的迹象。
许多研究人员将这一趋势视为摆脱他们认为神经网络在人工智能研究中不健康的垄断地位的一种方式,并期待这一转变将带来更智能、更可靠的人工智能。
这两种策略的更好融合,可能促成通用人工智能(AGI):能够像人类一样,将知识从一种情境推理和推广到另一种情境的人工智能。科利洛表示,这也可能适用于高风险应用,如军事或医疗决策。他说,由于符号人工智能是透明且易于理解的,因此它没有出现让神经网络难以信任的“黑匣子”综合症。
已经有很好的神经符号人工智能实例,包括去年报道的谷歌DeepMind的AlphaGeometry系统能够可靠地解决数学奥林匹克题目——针对有才华的中学生的题目。但如何将神经网络和符号人工智能结合成一个多功能系统,是一项艰巨的挑战。
“你实际上是在设计这样一个双头怪兽,”同为马里兰大学的计算机科学家威廉·雷格利说。
2019年,计算机科学家理查德·萨顿在其博客上发表了一篇题为《苦涩的教训》的短文。他在书中论证,自20世纪50年代以来,人们反复假设制造智能计算机的最佳方式是将人类在物理学到社会行为等领域关于世界规则的所有见解灌输给它们。萨顿写道,令人难以下咽的苦果是,符号方法一次又一次被那些利用大量原始数据和放大计算能力来利用“搜索与学习”的系统超越。例如,早期的国际象棋电脑,训练基于人类制定的策略,但被那些仅仅输入大量棋局数据的计算机所超越。
这一教训被神经网络支持者广泛引用,用以支持让这些系统越来越大是实现通用人工智能的最佳路径。但许多研究者认为,这篇文章夸大了其观点,淡化了符号系统在人工智能中能够且确实发挥的关键作用。例如,目前最好的国际象棋程序Stockfish,将神经网络与允许走法的符号树结合起来。
神经网络和符号算法各有利弊。神经网络由多层节点组成,节点具有加权连接,在训练过程中会调整这些节点以识别模式并从数据中学习。他们反应快且富有创造力,但也必然会编造内容,无法可靠回答超出训练数据范围的问题。
而符号系统则难以涵盖“混乱”的概念,比如人类语言,这些涉及庞大且难以构建且搜索缓慢的规则数据库。但他们的运作方式清晰,且擅长推理,运用逻辑将常识应用于新情境。
在现实世界中应用时,缺乏符号知识的神经网络会犯经典错误:图像生成器可能画出每只手有六根手指的人,因为他们还没了解手通常有五根手指的普遍概念;视频生成器很难让球在场景中弹跳,因为它们没学会重力会把物体往下拉。一些研究者将这些错误归咎于数据或计算能力不足,但也有人认为这些错误反映了神经网络根本无法将知识进行泛化和逻辑推理。
许多人认为,在神经网络中添加象征意义可能是为人工智能注入逻辑推理的最佳——甚至唯一——方式。例如,全球科技公司IBM支持神经符号技术作为通用人工智能的路径。但也有人持怀疑态度:现代人工智能奠基人之一、科技巨头Meta首席人工智能科学家Yann LeCun表示,神经符号方法与神经网络学习“不兼容”。
萨顿现任加拿大埃德蒙顿阿尔伯塔大学,并于2024年获得图灵奖,相当于诺贝尔计算机科学奖,他坚定地坚持自己的原始论点:“这一苦涩的教训依然适用于当今的人工智能,”他告诉《自然》杂志。他认为,这表明“添加一个象征性、更手工制作的元素可能是个错误”。
加里·马库斯是一位常驻加拿大温哥华的人工智能企业家、作家和认知科学家,也是神经符号人工智能最直言不讳的倡导者之一,他倾向于将这种观点分歧框定为一场哲学之战,而现在正向他倾斜。
另一些人,比如麻省理工学院(MIT)剑桥分校的机器人学家莱斯利·凯尔布林,则认为争论哪种观点是干扰,人们应该专注于有效的方法。“我愿意做任何让我的机器人变得更好的事。”
萨顿现任加拿大埃德蒙顿阿尔伯塔大学,并于2024年获得图灵奖,相当于诺贝尔计算机科学奖,他坚定地坚持自己的原始论点:“这一苦涩的教训依然适用于当今的人工智能,”他告诉《自然》杂志。他认为,这表明“添加一个象征性、更手工制作的元素可能是个错误”。
加里·马库斯是一位常驻加拿大温哥华的人工智能企业家、作家和认知科学家,也是神经符号人工智能最直言不讳的倡导者之一,他倾向于将这种观点分歧框定为一场哲学之战,而现在正向他倾斜。
另一种想法是将符号符号插入大型语言模型的工作流程中,就像用计算器帮助人们解决数学谜题一样。许多人认为,在关键推理阶段使用基于规则的系统可以帮助防止大型语言模型偏离正轨。例如,包括程序辅助语言(PAL)模型在内的项目,使用LLM将自然语言任务转换为Python代码,利用符号代码解决问题,然后再用LLM将该解解释回自然语言。
贾媛·毛是一位刚在麻省理工学院凯尔布林完成博士学位的人工智能研究员,她在利用神经符号人工智能提升机器人训练效率方面取得了成功。她的策略是利用神经网络识别视觉场中的物体(如红色橡胶球或绿色玻璃立方体),然后用符号算法推理关于这些物体的关系性问题(例如“橡胶物体是否在绿色物体后面?”)。
她说,纯神经网络的训练数据中需要70万个样本,才能在这项任务中达到99%的准确率。但通过加入象征性技巧,她只需占其中10%。“即使只用1%,你也能达到92%的准确率,这相当令人印象深刻,”她说。她创造的类似神经符号系统在引导机器人在洗碗或泡茶时遇到陌生物体时,击败了基于神经网络的系统8.
符号人工智能面临的一个重大挑战是如何用逻辑和规则的语言编码有时模糊的人类知识。最早的尝试之一是名为Cyc的项目,由计算机科学家Doug Lenat于1984年发起,后来由他位于德克萨斯州奥斯汀的人工智能公司Cycorp监督。目的是明确表达常识性事实和经验法则,比如“女儿就是孩子”、“人们爱孩子”和“看到你爱的人让你微笑”。该项目的语言 CycL 使用符号(逻辑运算符如 IF、AND、OR 和 NOT)来表达逻辑关系,使推理引擎能够轻松得出结论,比如“看到你的孩子会让你微笑”。
Cyc目前拥有超过2500万条公理,已被应用于多种人工智能项目,并启发了其他项目,如谷歌的知识图谱,该图谱包含超过5000亿个事实。如今,“知识工程师”采用类似策略收集人类生成的事实和关系,构建专业数据库,并将其与人工智能集成。
凯尔布林说,符号数据库可以帮助人工智能将一种情境中的知识泛化并应用于另一种情境,这是一种增强推理效率的强大方式。但在处理许多“规则”有许多例外的主题时,准确性是有权衡的——比如,并非所有人都爱自己的孩子,看到自己喜欢的东西也不总能让你微笑。她说,象征性元素应仅在有帮助时才被纳入。“Cyc试图把常识变成数学。这几乎肯定是个坏主意,“凯尔布林说。
2023年,Marcus发表了一篇论文则阐述了LLM可以从Cyc中学到什么。作为这项工作的一部分,这对搭档请了 GPT-3——一款早期的大型语言模型,支持 ChatGPT 的基础——写出 CycL 语句,编码句子中逻辑关系的语句:“你是否触摸了位于法国首都的某个蓝色物体,日期为 2022 年 9 月 25 日?”他们称,这一回应“起初令Cyc团队惊讶”,因为这似乎产生了正确的陈述,语言也恰到好处。但仔细观察后,GPT-3 犯了许多关键错误,他们写道,比如得出结论“接触蓝色物体的是日期”。
“看起来不错,应该能用,但完全是垃圾,”科勒洛说。他说,这表明仅仅把一个象征性引擎和神经网络强加起来是毫无意义的。“那你干脆别有神经符号系统算了。”
科莱洛说,现在需要更多关于人工智能“元认知”的研究——即人工智能如何监控和进行自身思维。这将使人工智能“指挥者”能够监督两种范式的更复杂整合,而非仅仅由不同引擎轮流作。Colelough说AlphaGeometry在这方面做得很好,但背景有限。如果能开发出适用于任何知识领域的灵活导体,“那就是我的通用人工智能”,科莱洛说。
还有很多工作要做。可能需要新的硬件和芯片架构来高效运行神经符号人工智能10.随着时间推移,其他类型的人工智能——可能基于神经网络、符号人工智能,或两者皆非——可能会变得更令人兴奋,比如量子人工智能,这是一个试图利用量子世界特性来改进人工智能的新兴领域。
对毛来说,最终目标是利用神经网络的学习能力,创造人类尚未意识到的规则、范畴和推理路径。她说:“希望最终我们能拥有能够发明自己符号表示和符号算法的系统,从而真正超越人类的认知。”这可能就像计算机发现一个尚未被发现的数学或物理概念——或许类似于π或质量的性质——然后编码新概念以帮助扩展知识。“我们需要研究计算机如何教导人类,而不是人类如何教机器。”
勇编撰自论文"神经符号人工智能在高级认知系统中整合推理与学习的综述".自然.2025相关信息,文中配图若未特别标注出处,均来源于自绘或公开图库。