《Materials Science and Engineering: A》:A machine learning framework augmented by generative models for accelerated design of refractory high-entropy alloys with superior strength-ductility synergy
编辑推荐:
平衡室温下强度与延展性是体心立方(BCC)难熔高熵合金(RHEAs)研发的核心挑战。本研究提出GAMP框架,整合生成对抗网络(GAN)与机器学习(ML)模型加速合金设计。通过GAN学习现有合金的分布特征生成新成分,结合XGBoost模型预测强度(UTS)和延展性(El),最终合成Al9.6Ti38.0Nb20.5Hf16.5V15.4合金,实验测得UTS 1058.1 MPa,El 18.5%,与预测一致。SHAP分析表明剪切模量局部失配(GLM)和原子尺寸差异(δ)主导强度预测,混合焓(ΔHmix)主导延展性。微观结构显示kink带形成是延展性的关键机制。该框架有效解决了小数据集下的高维合金设计难题,显著提升研发效率。
梁 Zhu|王佳坤|周明航|孔玲缇|李金福
上海交通大学材料科学与工程学院金属基复合材料国家重点实验室,中国上海200240
摘要
在室温下实现强度和延展性的平衡仍然是开发体心立方(BCC)难熔高熵合金(RHEAs)的一大挑战。面对广阔的成分设计空间,我们提出了一种合金设计框架GAMP,该框架结合了生成对抗网络(GAN)和机器学习(ML)预测模型,以加速潜在合金成分的筛选。与常见的逆向设计或基于图像的方法不同,本工作中的GAN作为正向搜索循环中的生成器,专门捕捉现有合金的潜在分布,以提出具有高潜力的新候选材料。在各种模型中,极值梯度提升(XGBoost)被证明是预测断裂时的极限抗拉强度(UTS)和伸长率(El)最准确的模型。实验验证表明,设计的Al9.6Ti38.0Nb20.5Hf16.5V15.4合金在室温下的UTS为1058.1 MPa,El为18.5%。可解释性分析进一步揭示,剪切模量局部不匹配(GLM)和原子尺寸差异(δ)是UTS的主要描述符,而混合焓(ΔHmix)是El的关键指标。微观结构分析表明,优异的强度-延展性协同效应源于多种变形机制的激活,其中拐角带的形成是实现优异室温延展性的关键因素。本研究为设计具有复杂性能要求的先进合金提供了一个高效框架。
引言
体心立方(BCC)结构的难熔高熵合金(RHEAs)因其优异的高温机械强度和热稳定性而被认为是下一代航空航天应用中高温结构材料的理想候选材料[1]、[2]。然而,RHEAs在室温下的低拉伸延展性严重限制了其加工性和工程应用[3]、[4]。此外,庞大的多主元素成分空间给通过实验或计算方法进行彻底搜索带来了重大挑战[5]。
近年来,机器学习(ML)方法在加速高性能合金设计方面显示出巨大潜力[6]、[7]、[8]、[9]、[10]、[11]。通过学习各种实验和计算数据,ML模型可以快速预测不同合金系统的目标性能,显著减少了传统试错方法和计算模拟所需的大量工作量。然而,ML模型的预测准确性高度依赖于训练集的大小和多样性。对于RHEAs,大多数现有研究集中在它们的压缩性能上[12]、[13]、[14]、[15]、[16]、[17],导致拉伸性能数据严重匮乏,这反过来又阻碍了高性能RHEAs的开发。
为了解决这一挑战,近年来生成模型(如生成对抗网络(GANs)被引入材料科学领域,用于基于大型数据库的图像生成或逆向设计等应用[18]、[19]、[20]、[21]、[22]、[23]、[24]。然而,人们也认识到,直接使用GANs进行逆向设计(即从目标性能直接生成成分)的效果一直不佳,原因有三:首先,性能到成分的映射缺乏所需的独特物理和化学边界条件,常常导致生成结果不可行;其次,与从空间连续数据(如图像)中提取潜在特征相比,从稀疏、高维的表格合金数据中捕捉潜在的非线性物理-冶金规则要困难得多;第三,现有的数据集与RHEAs近乎无限的成分设计空间相比显得不成比例地小[25]。
在这项工作中,我们提出了一种“GAN增强、ML预测”(GAMP)合金设计框架,用于设计在室温下具有优异强度-延展性协同效应的BCC RHEAs。我们重新利用GANs来替代正向搜索部分。具体来说,我们利用GANs强大的分布学习能力来学习文献中报道和已探索的合金成分的数据分布特征。在这个框架下,GAN充当探索指南,学习高维成分空间中成功合金的潜在分布特征。这相当于站在巨人的肩膀上,利用数据集中嵌入的集体冶金知识来指导搜索。通过从这个学习到的分布中采样,我们迅速生成了一组统计上相似且最有可能具有高性能潜力的新成分。最终,我们发现了一种新型的、未报道的Al9.6Ti38.0Nb20.5Hf16.5V15.4合金,实验验证其极限抗拉强度(UTS)为1058.1 MPa,室温下的拉伸伸长率(El)为18.5%,这两个值都与预测结果非常吻合,为该框架提供了高保真的验证。
因此,这项工作展示了一种在数据集受限的情况下高效可靠的数据驱动方法,用于探索高维空间中的有前景的合金。与计算上不可行的传统正向网格搜索以及效率低下且盲目探索的随机搜索相比,我们的GAMP框架显著提高了设计效率,使研究人员能够将实验资源集中在最有潜力的候选材料上。
部分摘录
GAMP合金设计框架
在这项研究中,GAMP框架包括六个阶段:数据收集、基于GAN的数据生成、特征工程、模型训练、性能预测和实验验证。具体来说,首先通过收集文献中的高熵合金(HEAs)数据建立数据集。然后使用GAN来学习数据分布并生成新的成分。在特征工程阶段,选择了相关的材料描述符,并计算了它们的相关系数
实验程序
使用高纯度的Al、Ti、Nb、Hf和V(纯度>99.95 wt.%),在Ar气氛下通过真空电弧熔炼制备了重50克的按钮形合金锭。为确保初始成分均匀性,每个锭子被翻转并重新熔炼五次,随后再进行两次电磁搅拌下的重新熔炼。最后,将按钮形锭子重新熔炼并滴铸成截面为10 mm × 10 mm的矩形锭子。
制备了5 mm × 4 mm × 1.5 mm的金属学样品
SHAP可解释性分析
SHapley Additive exPlanations(SHAP)分析可以揭示每个描述符对每个数据点对模型预测的影响。SHAP图上的每个点代表一个样本点,y轴表示使用的描述符,x轴表示该描述符对该数据点的SHAP值。特定描述符的重要性可以通过其数据点在x轴上的分布宽度来评估。分布越宽,表示其贡献越大结论
在这项工作中,我们成功开发并验证了一种“GAN增强、ML预测”合金设计框架GAMP,用于高效设计在室温下具有优异强度-延展性协同效应的BCC RHEA。本研究的主要结论如下:
(1)建立了一种结合数据增强和预测建模的高效合金设计工作流程,通过该流程,GAN成功学习了包含376个样本的小数据集的分布模式
CRediT作者贡献声明
李金福:撰写 – 审稿与编辑、验证、监督、资源管理、项目协调、资金获取、正式分析、概念构思。梁 Zhu:撰写 – 原始草稿、可视化、软件开发、方法论研究、正式分析、数据整理。王佳坤:软件开发、方法论研究、正式分析。周明航:方法论研究、正式分析、数据整理。孔玲缇:撰写 – 审稿与编辑、软件开发
利益冲突声明
作者声明他们没有已知的可能会影响本文工作的竞争性财务利益或个人关系。
数据可用性
支持本研究结果的主要数据可在本文及其补充材料中找到。如需更多数据,可向相应作者提出合理请求。利益冲突声明
? 作者声明他们没有已知的可能会影响本文工作的竞争性财务利益或个人关系。
致谢
这项工作得到了国家自然科学基金(项目编号:52231002)的支持。