《ACTA MATERIALIA》:Dual Engine-driven Strategy for Advanced Copper Alloy Design employing Large Language Models
编辑推荐:
合金设计双引擎驱动框架研究:融合LLMs与PINNs提升物理可解释性,以Cu-Ni-Sn-In合金为例验证模型预测准确率(92%)及性能(抗拉强度1610MPa,导电率16.73%IACS),超越传统Cu-15Ni-8Sn合金。
谭飞|赵梓轩|姜彦斌|张文超|谢同|陈伟|马慕志|刘阳帆|叶彦鹏|肖 Zhu|雷倩|徐国富|任杰|赵玉媛|周莉
中南大学材料科学与工程学院,中国长沙410083
摘要
基于机器学习(ML)方法的先进合金设计已被广泛采用。然而,传统的经验方法和数据驱动方法通常缺乏物理可解释性,这在很大程度上误解了潜在的机制,从而限制了这些模型的应用潜力。本文提出了一个双引擎驱动的合金设计框架,将大型语言模型(LLMs)与物理信息神经网络(PINNs)相结合。与传统ML方法相比,LLMs能够提取微观结构的演变(如相变沉淀顺序),并将其嵌入神经网络中,从而显著提高模型的物理可解释性和准确性(从84%提高到92%),以指导新型合金的设计。以Cu-Ni-Sn为例,我们提出的策略筛选出了234,361种合金,并确定了Cu-10Ni-11Sn-0.1In和Cu-7.5Ni-11Sn-0.1In,这两种合金在强度和导电性方面达到了最佳平衡。实验制备的这些合金分别具有1610MPa和1441MPa的抗拉强度,以及13.34%IACS和16.73%IACS的导电率,优于现有的Cu-15Ni-8Sn合金(1379MPa,8.78%IACS)。
引言
包括合金在内的金属基功能材料被应用于航空航天、电子和能源等领域[[1], [2], [3]],其成分和结构设计[[4], [5]]受到了广泛关注。可以通过微合金化、加工技术和热处理等方法来改善合金的微观结构[[6], [7], [8]]。然而,现有的经验和传统合金设计方法的局限性阻碍了先进合金的发展和应用[[9]]。因此,人们开始使用机器学习(ML)来设计具有优异成分和结构的先进合金[[10]],这些合金已在电池[[11]]、无机超导材料[[12]]和催化材料[[13]]等领域得到成功应用。
尽管ML模型在合金设计中取得了成功应用,但它们无法理解合金合成过程中涉及的热力学和动力学原理。这主要是由于晶粒[[14,15]]、位错[[16,17]]和沉淀物[[18,19]]之间的复杂化学和物理相互作用。Wang等人[[20,21]]报告称,ML可以将纯统计的成分和加工输入与输出目标属性相关联,但忽略了关键的冶金相互作用和原理。此外,现有的ML模型无法准确预测合金性能,因为它们无法理解物理冶金学、固态相变理论、扩散动力学和沉淀强化机制。这最终导致了基于ML的预测与合金实际性能之间存在较大差距[[22,23]]。通过使用大型语言模型(LLMs)可以解决这一瓶颈,因为它们能够揭示新型合金合成过程中涉及的基本物理机制和隐含因素[[24,25]]。例如,Polak等人[[26]]利用LLMs建立了高熵合金的屈服强度数据库,并提取了金属玻璃的临界冷却速率。此外,LLMs还能高效地进行关系提取、知识推理和文本相关性分析[[27,28]]。通过开发策略将合金中的反应机制转化为适合ML模型的结构化数据,可以解决LLMs和ML模型在预测性能上的差异。
在这项研究中,我们提出了一种新颖的双引擎驱动合金设计框架,将大型语言模型(LLMs)与物理信息神经网络(PINNs)结合起来[[29]]。我们构建了一个Cu合金语料库,并利用LLMs阐明了沉淀顺序对合金性能的影响。在研究的24种合金元素中,In对合金整体性能的影响最为显著。通过热力学计算,将Ni-Sn-In合金中的沉淀顺序转化为结构化描述因子,用于模型训练。与单引擎驱动模型相比,训练后的模型预测准确性提高了8%。通过探索234,361种合金组合,我们发现了具有高抗拉强度和导电性的Cu-Ni-Sn-In合金。实验分析表明,这些性能提升归因于Ni3(Sn, In)2相的作用。这种方法显著提高了合金设计模型的预测准确性,为弥合传统ML模型与其在合金设计和制造中的实际应用之间的差距提供了全面而准确的方法。
模型框架
图1比较了单引擎驱动和双引擎驱动策略的框架。以Cu-Ni-Sn合金为例,数据驱动(单引擎驱动)策略得出了合金性能与其他加工参数(如合金成分和特性)之间的统计数学关系。结果,该模型无法准确确定原子扩散[[20]]、相结构特性和合金性能之间的非线性关系(图1)
数据与机制挖掘
图2展示了数据与机制挖掘的过程。通过搜索过去二十年发表在Elsevier、Springer Nature和Royal Society of Chemistry等主要材料科学期刊上的文章,建立了一个综合合金数据库。共识别出10,305篇标题和摘要中包含“copper”一词的文章(图2a)。由于文章的复杂性,其余文章被拆分为单独的段落作为文本单元,共计123万条
结论
总结来说,本文提出了一种利用数据和物理原理设计先进合金的双引擎驱动策略。利用LLMs构建了Cu–Ni–Sn合金中沉淀相的热力学和动力学描述符(OPT和TE),以确定影响合金性能的物理因素,并将其引入ML模型进行训练和优化。研究结果表明,这些描述符
作者贡献
谭飞分析了实验数据,开发了数据分析代码,并是手稿的主要作者。赵梓轩协助数据收集和分析。姜彦斌和张文超负责项目监督并参与撰写工作。陈伟、马慕志和刘阳帆进行了实验和数据分析。肖 Zhu、雷倩、徐国富和谢同负责手稿的英文编辑。叶彦鹏和任杰协助数据解释和可视化。
未引用的参考文献
[41,[51], [52], [53]]
CRediT作者贡献声明
谭飞:撰写 – 原始草稿、方法论、数据整理、概念化。赵梓轩:软件开发。姜彦斌:撰写 – 审稿与编辑、方法论。张文超:撰写 – 审稿与编辑、方法论。谢同:软件开发。陈伟:验证。马慕志:验证。刘阳帆:方法论。叶彦鹏:撰写 – 审稿与编辑。肖 Zhu:撰写 – 审稿与编辑、软件开发。雷倩:撰写 – 审稿与编辑。徐国富:撰写 – 审稿与编辑、方法论。任杰:撰写