众力资讯网

AI正在构思数百万种新材料,但收到了科学家的广泛批评

批评者抨击了谷歌、Microsoft和Meta加快材料发现速度的努力。但在炒作背后,确实有进步。当谷歌深度思维(Goog

批评者抨击了谷歌、Microsoft和Meta加快材料发现速度的努力。但在炒作背后,确实有进步。

当谷歌深度思维(Google DeepMind)人工智能公司在大约两年前宣布,它已使用深度学习人工智能技术发现了220万种新的晶体材料时,这似乎预示着加速材料研究的新激动人心的时代的到来。

这些宝库中的材料由周期表中各种元素组成,其中包括5.2万种类似神奇材料石墨烯的层状化合物的模拟,528种潜在的锂离子导体可能用于改进可充电电池,以及其他更多内容。

这些工作似乎构建了一个“人工智能科学家”,但这项努力(以及随后由微软和Meta等科技公司参与的类似努力)很快受到了研究人员的批评,这些研究人员表示,AI系统构思的一些化合物既缺乏原创性、不可行或不符合实际需求。

“我们在查看DeepMind预测的晶体列表后发现了很多荒谬的东西,”加州大学圣塔芭芭拉分校(UCSB)的材料科学家安东尼·切斯姆说。他和他的UCSB同事拉姆·塞沙迪指出,该项目预测的超过18000种化合物包括极其稀缺的放射性元素如钷和镤,他们怀疑这些元素永远不可能成为有用的材料。“发现一种化合物是一回事,而发现一种新的功能性材料则是完全不同的事情,”切斯姆说。

涉及Meta的研究建议有超过100种材料可以直接从空气中捕获二氧化碳并帮助减少全球变暖。然而,这些也引发了类似的批评。苏黎世联邦理工学院(EPFL)的计算化学家伯恩德·史密特表示,这些候选材料并不适用于这一目的。他建议,在这项工作中使用的AI工具似乎如此令人兴奋以至于作者“有点被现实蒙蔽了”。

人工智能真的会革命化材料发现吗,还是说它已经被自己的炒作淹没了?自最初批评以来,材料科学家们已经更详细地检查了这些公司的结果,以评估人工智能的真实潜力。这项工作的背后团队也做出了回应,在某些情况下降低了最初的声明或提出了替代方案。

许多研究人员得出结论认为,人工智能在材料科学领域前景广阔,但与实验化学家的更多合作(以及对当前这些系统局限性的谦逊态度)将是实现其全部潜力的关键。从青铜时代铜和锡的混合物到不锈钢的发明,材料的发现推动了人类历史上的创新。

在过去十年中,人工智能在材料科学中的应用迅速发展。许多最新的努力利用人工智能加速新材料的发现,主要集中在晶体无机固体上,这类化学化合物是无数技术的关键组成部分,从半导体到激光器。

结晶无机固体的性质不仅由其所含的原子决定,还取决于这些原子是如何以重复模式排列的。因此,当科学家计划制备新的无机晶体时,他们不仅仅会想到新鲜的原子组合——他们通常还会尝试预测这些原子可能会采用什么样的结构。在人工智能出现之前,研究人员使用更为传统的计算方法来实现这一点。

其中最强大的方法之一是密度泛函理论(DFT),这是一种近似描述材料中电子行为复杂数学的方法。对于一种假设的无机化合物而言,这可以揭示哪种结构是最稳定的(也因此最有可能存在)以及该化合物的性质。

科学家利用DFT预测出了具有惊人性能的新材料,并在实验室中成功制备了出来——包括超强磁铁和“超导体”,后者可以在没有电阻的情况下传导电流,但与大多数超导材料不同,它们不需要极低的温度。

加利福尼亚劳伦斯伯克利国家实验室(LBNL)的Materials Project已在一个开放访问数据库中记录了大约200,000种晶体的DFT计算结构。但是,DFT计算需要大量计算资源。大多数学术实验室可以获取足够的计算能力来对少量化合物进行DFT计算,但同时筛查数百万种化合物将极其昂贵。

那便是那些高调的AI努力发挥作用的地方。以DeepMind为例,这家伦敦公司并没有仅仅依赖密集的DFT计算,而是向机器学习算法输入了例如Materials Project已经记录下来的计算结果。该算法,团队称之为材料探索中的图网络(graph networks for materials exploration, 或GNoME),从这些例子中学会了如何预测随机生成晶体结构的稳定性,并且比传统的DFT更快。然后系统使用DFT验证了这些预测中最有可能的结果并将结果反馈回GNoME以提高其性能。

最终,这使得GNoME能够构思出一个庞大的化合物集合,它预计这些化合物将是稳定的。“如果你在未来几年内不采用这类方法,你就会落后。”伯克利劳伦斯国家实验室和加州大学伯克利分校的材料科学家Kristin Persson表示,她也是Materials Project的负责人。

DeepMind研究者们还进行了一项努力,使用AI帮助合成材料。佩森与他人合写了一篇论文,该论文与GNoMe的结果一同发表,并描述了“A-Lab”这一机器人系统。该系统被输入了数万篇关于如何制备各种无机化合物的已发表论文。它学会了为一些尚未制备但其结构已被DFT预测并记录在Materials Project中的目标化合物设计合成配方。随后,A-Lab部署了物理机器人来制备这些化合物,并分析产品以检查它们是否符合预期目标,必要时调整配方。

GNoME和A-Lab团队发布论文不久后,微软推出了自己的用于材料发现的AI工具。与GNoME类似,MatterGen是一种经过训练以生成稳定晶体结构的机器学习模型。但MatterGen的设计更具针对性:它可以建议具有特定性质的假设性材料。“你可以直接生成满足设计标准的晶体,”英国剑桥研究员Tian Xie表示,他领导了这项研究。“这比使用暴力破解方法创建数百万个候选方案要高效得多。”与Meta合作的项目更是更加有针对性。

该公司的基础AI研究团队与美国亚特兰大乔治亚理工学院的科学家们合作,识别出了可能能够有效从空气中直接吸收CO2的多孔材料——金属有机框架(MOFs)。

研究人员使用DFT计算了超过8000个实验报道的MOFs吸附CO2的能力。然后,他们利用这些结果训练了一个AI模型来执行相同的任务,并表明该模型在准确性和速度上都与DFT相当。在2024年5月发表的一篇论文中,研究人员预测,其中超过100种MOFs包含能够强烈吸附CO2的区域,这证明了AI工具可以加速MOFs用于直接空气捕获的发展。但所有这些尝试都引发了争议。

当伦敦大学学院的固体化学家罗伯特·帕格雷夫查看A-Lab的结果时,他迅速得出结论,该项目错误地描述了一些它声称已产生的41种无机化合物,并且在某些情况下合成了已经存在的材料。帕格雷夫随后与新泽西州普林斯顿大学的莱斯利·施奥普等人合作,对A-Lab的工作进行了更详细的批评,在其中他们详细说明了产品表征中的不足之处,并得出结论称A-Lab论文中没有发现新的材料。

他们还指出了一个更根本的问题,根源在于为A-Lab提供目标结构的DFT技术本身的局限性。帕尔格雷夫指出,通常情况下,DFT方法预测的是高度有序的晶体结构,这些结构可能只有在温度降至绝对零度(-273°C)的情况下才稳定。但在现实中,结晶材料中原子的排列往往要混乱得多。虽然A-Lab被告知要合成的许多有序结构看起来是新的,但实际上它们之前以无序的形式已经存在过——最终正是那些已知的无序形式被A-Lab制备出来了,帕尔格雷夫说。

来自劳伦斯伯克利国家实验室和加州大学伯克利分校、并共同领导了A-Lab工作的Gerbrand Ceder则持不同意见。他表示,研究人员对A-Lab的表征进行了详细的重新分析,结果显示A-Lab的表征是可靠的。“A-Lab确实合成了它声称合成的化合物,并且没有合成信息支持这些化合物。”他补充说,“通常情况下,制备预测有序结构的无序版本被视为成功,并且在将理论预测与实验进行比较时以此为标准。”

该混乱问题也影响了基于AI的DFT代理模型,如GNoME。德国拜罗伊特大学的计算化学家约阿希姆·马格拉夫表示。他与同事一起,将机器学习系统训练在通过实验测量确定的晶体结构上,而不是使用DFT。该模型学会了预测由于晶体内相似元素位置互换而导致化合物可能混乱的可能性。

它表明,在DeepMind团队突出显示为合成有前景目标的大约380,000种稳定化合物中——所有这些化合物似乎具有有序的晶体结构——在实际生活中,80-84%会是混乱状态。这一发现意味着GNoME的许多建议可能不会以实验室中的有序形式实现,并且可能会表现出与预测不同的性质。马格拉夫表示,训练于DFT数据上的AI模型也可能忽略由于结构混乱而产生的潜在有用属性,这些属性是模型未予考虑的。“如果你忽视了混乱的存在,你可能会出现假阴性和假阳性的情况,”他说,“这不是一个小问题。”

材料科学家Ekin Dogus Cubuk是GNoME论文的主要作者之一,现已离开DeepMind,在加州创立了初创公司Periodic Labs。Cubuk承认,GNoME预测的许多有序结构很可能最终会变得无序。他表示,该工具的主要目的是为需要进一步研究的有前途的化合物提供指引。“并不是说有人可以仅仅模拟一种材料,它就会变成一个惊人的产品。”然而,有些人对DeepMind在论文中提出的观点感到不满,他们声称实现了“人类已知稳定材料数量级的增长”,这听起来太好了以至于难以置信。“这就像向公牛身上挥了一根红布一样,”Cheetham说,“面对AI的时候,我们的警惕感被提高了。”

勇编撰自《自然》论文.2025相关信息,文中配图若未特别标注出处,均来源于自绘或公开图库。