综述:机器学习在金属增材制造领域面临的挑战与机遇:数据匮乏与解释性问题

《Materials Today》:Challenges and opportunities in machine learning for metal additive manufacturing: data scarcity and interpretability

【字体: 时间:2026年05月07日 来源:Materials Today 22

编辑推荐:

  郭凯 | 徐松哲 | 孙畅 | 严文涛 | 严金辉 | 余浩 | 王辰忠 | 徐伟 | 李金国 | 比仲南 | 胡涛 | 赵如新 | 王江 | 陈朝月 | 任忠明 中国上海市上海大学材料科学与工程学院先进特种钢国家重点实验室,邮编200444 **摘要** 金属增材

  郭凯 | 徐松哲 | 孙畅 | 严文涛 | 严金辉 | 余浩 | 王辰忠 | 徐伟 | 李金国 | 比仲南 | 胡涛 | 赵如新 | 王江 | 陈朝月 | 任忠明
中国上海市上海大学材料科学与工程学院先进特种钢国家重点实验室,邮编200444

**摘要**
金属增材制造(MAM)在复杂零件的近净成形生产中具有显著优势。然而,工艺参数、微观结构与机械性能之间的复杂关系使得质量控制变得具有挑战性。机器学习(ML)为解决这一问题提供了强大的框架。数据稀缺仍然是限制ML在MAM中应用的主要瓶颈。我们对MAM中数据稀缺相关的问题及其解决方案进行了全面探讨,并讨论了多种数据生成、采样和融合技术,这些技术涵盖了高通量实验和模拟以及主动学习和多保真度融合等先进方法。此外,我们还通过强调数据、精度和物理一致性之间的权衡来解决MAM中的可解释性挑战。通过对领域知识整合方法的分类,我们提供了系统性的指导,以了解它们在提高模型可靠性方面的优势和局限性。最后,我们提出了MAM中ML的发展路线图,突出了知识图谱驱动的RAG代理、高保真度数字孪生和体现式智能之间的协同作用。这条路径旨在通过自我改进的闭环系统实现自主制造,加速向完全智能化、数据驱动生产的过渡。

**引言**
金属增材制造(MAM)技术,也称为3D打印,由于其高效率的复杂零件近净成形能力,已被广泛应用于航空航天[1]、医疗植入物[2][3]、汽车[4][5]等领域[6][7]。MAM技术涉及光学工程、材料科学和机械制造等多个学科。随着金属粉末生产技术、先进计算机控制技术和廉价可靠的工业激光器的显著进步,MAM技术在过去几十年已成为最先进的生产方法[6][7]。然而,MAM是一个高度复杂和非线性的过程,涉及能量吸收、快速熔化和蒸发以及极度非平衡凝固等多种物理现象,这使得质量控制极其困难。尽管经过多年研究,仅有少数合金(如316L[9][10][11][12]、Ti6Al4V[13][14][15][16]、Inconel 718[17][18][19]和AlSi10Mg[20][21][22])显示出良好的可打印性。然而,它们的工业应用仍然面临关键挑战,包括复杂几何形状下的微观结构不均匀性、各向异性的机械性能以及不可避免的工艺诱导孔隙[23][24][25][26],这些因素严重影响了疲劳性能[18][27]。这些限制限制了其在航空航天和生物医学领域的广泛应用。此外,对于高性能合金(包括高强度铝合金[28][29][30]、用于铸造模具的高碳钢[31][32]以及极端服务环境用的超级合金[33][34][35]),层间开裂、微裂纹和较差的成形性等问题仍未得到解决。

**面对这一挑战,迫切需要更快的合金开发策略、更稳健的在线监测技术和更有效的工艺参数优化方法。**使用传统实验方法建立各种因素(如工艺参数和合金成分)与结果(如缺陷密度和目标机械性能)之间的关系既耗时又资源密集[36][37][38][39]。同时,数值模拟难以有效捕捉MAM的多物理复杂性,因为求解控制这些现象的耦合偏微分方程(PDEs)通常需要高保真度离散化和迭代求解器[40][41][42],从而导致大量的计算成本和资源密集型建模。机器学习(ML)通过高效建模和学习MAM的各种因素与制造结果之间的复杂关系,为这一挑战提供了另一种解决方案[43][44]。ML算法可以精确拟合非线性函数,从数据中识别模式以进行预测[45][46]。在材料科学与工程领域,ML加速了材料发现,优化了工艺参数,预测了材料性能,并实现了强大的在线监测[44][47][48][50]。在材料发现方面,ML根据组成和结构等输入特征预测超级合金的性能(如凝固范围、裂纹敏感性及相分数),从而设计和优化了特定应用的材料[51][52][53][54]。类似地,在聚合物材料中,贝叶斯优化(BO)和物理信息驱动的ML模型提高了材料设计的效率[55]。在工艺优化和性能预测方面,ML将各种特征与目标性能联系起来,同时提供了快速预测能力,降低了运营成本[56][57]。此外,ML算法用于实时分析传感器数据,识别潜在缺陷或偏差的模式和异常情况,这种实时分析允许立即采取纠正措施,确保制造过程保持在规定的质量标准之内。

**尽管取得了这些进展,数据稀缺和稀疏仍然是MAM的主要障碍。**MAM过程生成的数据复杂且维度高,但由于生成这些数据所需实验的时间消耗大且成本高昂[58][59],高质量、标记齐全的数据集的可用性往往有限。在MAM中,尤其是对于测试有限的稀有或新型合金,稀疏数据集(即数据点不完整或分布不均匀的数据集[60])也很常见。这种数据稀缺和稀疏性给训练准确和泛化的ML模型带来了挑战。在缺乏大规模数据集的情况下,ML算法可能会因数据有限而过度拟合,从而降低其在实际应用中的预测能力[61]。为了解决这些问题,需要高通量数据生成策略和新的数据采样方法,还需要数据融合方法来结合多模态和多保真度数据源。**另一个挑战是MAM中ML模型的可解释性较差。**复杂的ML模型通常像“黑箱”一样运行,难以理解预测是如何得出的,这可能会影响对结果的信任并限制其在分布外情况的预测能力[62]。先前的研究总结了MAM中的许多经验规则、物理洞察和本构方程[63][64][65][66],ML模型可以利用这些知识进行更准确的预测,显著提高性能同时减少所需数据量。此外,结合这些知识可以提高ML模型的可解释性,使其决策更加透明和易于理解[67][68]。然而,将领域知识整合到ML框架中仍然具有挑战性。这一领域仍缺乏标准方法,由于知识表示形式的多样性,这使得任务变得复杂。**一些学者对MAM中的ML进行了综述,大多数综述主要集中在典型应用上[69][70][79][71][72][73][74][75][76][77][78],如工艺参数优化、合金设计和缺陷检测。只有少数综述讨论了新的研究方向,如领域知识整合[55][62][67][80]、多模态数据融合[71]和数字孪生[70]。Parsazadeh等人[67]使用ML方法系统地收集和回顾了研究论文,提供了关于ML预测3D打印零件质量的全面概述。DebRoy等人[69]回顾了MAM中的冶金挑战、机理模型和ML应用,并强调将传统冶金知识与ML结合是未来发展的一个有前景的方向。然而,该综述对实现这种整合的具体方法讨论有限。King[72]在SAE国际协会的报告中描述了ML在MAM中广泛应用的实质性障碍,包括数据稀缺、模型可解释性差和数据标准的缺乏。Guo等人[62]强调了基于物理信息的机器学习(PIML)作为一种有前景的方法,可以提高模型透明度并使ML预测与潜在物理原理一致。Jin等人[70]回顾了ML和数字孪生在MAM中提高效率、准确性和可持续性的作用。尽管一些综述文章提到了数据稀缺问题,但专门针对这一挑战的系统和全面分析仍然缺乏。此外,生成大规模高质量数据集的方法往往是最资源密集和成本最高的,因此在现有文献中较少被讨论。此外,关于可解释性的讨论有限,现有文献缺乏对可解释性与领域知识之间关系的深入探索。而且,物理信息的整合尚未标准化。领域知识有多种形式,整合方法也各不相同。现有综述缺乏对这些不同整合方法的系统概述。**

**本综述重点关注MAM领域的数据稀缺问题,通过提供数据生成、采样和融合策略,特别是针对MAM的数据生成、采样和融合策略,与其他MAM和ML综述文章区分开来。**它涵盖了高通量实验、模拟、主动学习、大型语言模型(LLMs)和代理技术在数据采样和提取中的使用,以及多模态层次和多保真度层次的数据融合技术。这些方法为克服现有限制提供了途径,使得大规模数据集的快速生成和管理成为可能,这将在第3节中讨论。**本综述还关注了可解释性问题,介绍了数据量、模型精度和模型可解释性之间的权衡。此外,它分析了PIML与可解释性之间的关系,建议将领域知识整合到ML模型中可能有助于通过提高模型的物理一致性来克服这一权衡。**此外,我们详细讨论了如何将物理信息(如经验方程、本构方程和偏微分方程)整合到ML中,根据它们的整合方法对方法进行了分类,并展示了每种方法的优缺点,这将在第4节中进一步探讨。**最后,我们提出了MAM发展的路线图,以实现从物理信息指导到端到端学习的过渡。**本综述的结构如图1所示。

**ML的基本原理**
ML在材料领域的应用具有革命性[65][66]。基于ML的材料发现和设计的一般工作流程如图2所示,包括四个阶段[83]:数据收集和预处理、特征工程、模型训练以及模型评估和优化。特征工程是从原始数据中选择、修改或创建新特征以改善ML模型性能的过程。它涉及理解数据、领域...

**MAM中的数据生成**
为了使ML能够有效建模和优化MAM过程,需要大量的高质量数据[78]。本节讨论了获取ML所需综合数据集的各种方法。

**可解释且知识驱动的MAM ML**
数据驱动的ML方法的主要优势之一在于它们能够绕过基于物理机制的预定义本构方程的需求。这使得仅使用与材料和加工相关的输入特征即可直接预测缺陷、微观结构和材料性能,而无需明确建模MAM中许多复杂且通常理解不深的机制[78][156][157]。然而,纯数据驱动的方法也引入了显著...

**预测缺陷、微观结构和性能**
在MAM中,一致的质量控制和材料性能控制仍然是重大挑战[199][200]。传统的材料表征既耗时又劳动密集[201][202]。孔隙和裂纹是MAM过程中的主要缺陷,直接影响组件的性能和可靠性[203][204][205]。

**基于本综述,对于特定条件下的MAM,传统ML方法仍有许多挑战,尤其是在数据稀缺且ML模型不可靠的情况下。**通过整合计算机科学的尖端概念,我们提出了几种针对性的解决方案来解决这些固有限制。然而,相关问题预计将通过以下研究主题得到解决,如图28所示:

**结论**
近年来,ML辅助的MAM已成为一个快速发展的研究领域,学者们试图通过这种数据驱动的方法来解决这些挑战。然而,仍然存在障碍,其中最关键的问题是MAM数据的稀缺性。**作为回应,本综述介绍了几种改进数据生成、采样和融合的先进技术。**这些方法中的许多在MAM背景下尚未完全开发,可能需要多年的改进和调整。

**关于科学写作中的生成式AI声明**
生成式AI和AI辅助技术仅用于写作过程,以提高手稿的可读性和语言质量。

**CRedI作者贡献声明**
郭凯:撰写——原始草稿,调查;
徐松哲:撰写——审阅与编辑,监督;
孙畅:撰写——审阅与编辑。严文涛:撰写、审稿与编辑。严金辉:撰写、初稿撰写。于浩:撰写、审稿与编辑。王晨冲:撰写、审稿与编辑。徐伟:撰写、审稿与编辑。李金国:撰写、审稿与编辑。毕中华:撰写、审稿与编辑。胡涛:撰写、审稿与编辑。赵瑞新:撰写、审稿与编辑。

作者声明:作者声明他们没有已知的会影响到本文研究的财务利益或个人关系。

致谢:本项研究得到了国家自然科学基金(项目编号:52127807、52474412)和上海市自然科学基金(项目编号:25ZR1401131、25ZR1402153)的支持。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号