激光熔覆(Laser Cladding, LC)是一种高效的表面改性技术[1],能够在基底上直接形成具有灵活成分和微观结构设计的强化层。它在航空航天、能源、汽车和发电等领域得到广泛应用,典型应用包括叶片、涡轮盘、阀门、活塞杆、过热器管以及各种轴组件的表面[2],[3]。这种在成分和微观结构设计上的灵活性也使得开发具有优异性能的先进涂层材料成为可能。周等人[4]最近报道的由NbMoWTaAg组成的难熔高熵薄膜展示了出色的耐磨性,表明通过材料创新可以提升涂层性能。激光熔覆具有诸如热影响区小、冶金结合强度高、粉末选择范围广、耐腐蚀性强以及能够修复薄壁和小部件等优点[5],[6]。然而,激光熔覆涂层的质量受到工艺参数、材料选择和加工条件的影响。不适当的工艺设置可能导致诸如未熔合(Lack of Fusion, LOF)[7],[8]、球化(Balling)[9]和KeyHole(KH)[8],[10]等缺陷,从而降低涂层的耐腐蚀性、抗氧化性和耐磨性。尽管高保真多物理场模拟[11],[12]能够提供关于缺陷机制的见解,但华等人[13]利用原子模拟阐明了石墨烯在CoCrNi复合材料中的界面增强机制,尽管计算需求较大且计算成本较高。经验法则[14]往往由于工艺参数和材料属性之间的非线性相互作用而缺乏准确性。因此,优化工艺参数仍然是一个关键挑战,这促使人们需要采用稳健的数据驱动方法。
相比之下,机器学习(ML)方法特别擅长捕捉工艺参数、材料属性和缺陷之间的复杂非线性关系[15],[16]。例如,李等人[17]利用合成数据训练和补丁邻域特征提取来克服传统单点距离方法的局限性,显著提高了在线检测LC几何缺陷的准确性,F值超过89%。同样,Tridello等人[18]采用两个前馈神经网络模型,根据选择性激光熔化(Selective Laser Melting, SLM)工艺参数和零件风险体积直接预测关键缺陷的概率及其尺寸分布参数。此外,机器学习在材料科学的其他领域也展示了强大的能力,例如在预测高熵合金膜的摩擦学行为[19]和设计石墨烯增强复合材料的界面[20]方面取得了显著成就。尽管机器学习在捕捉工艺参数和缺陷之间的非线性关系方面表现出色,但其性能高度依赖于庞大的数据量。在新材料系统中,获取足够的实验数据通常成本高昂,导致数据集极其有限。在这种数据稀疏的情况下,传统的监督学习模型容易过拟合,并且泛化能力较差。
为了应对这些挑战,研究人员通常采用以下策略:(1)通过数据重采样(例如K折交叉验证)来稳定模型评估,相比简单的数据集划分,特别是在数据稀缺的情况下,提供更可靠的性能评估[21]。(2)集成学习通过汇总多个基础学习器的预测来减少方差并增强对抗过拟合的能力[22],[23]。(3)数据增强和合成通过基于物理的转换或生成模型来扩展训练集,生成符合物理定律的样本,以缓解数据稀缺问题[24],[25]。然而,这些方法仍然受到现有数据局限性的约束。在极端数据稀缺的情况下,它们仍可能遇到高评估方差、过拟合或合成样本偏差等挑战。因此,迁移学习(Transfer Learning, TL)作为一种有前景的替代方案应运而生。通过利用数据丰富目标领域的知识,它直接解决了信息不足的核心问题,以最小的数据需求有效增强了目标领域的模型泛化能力。
TL方法大致分为基于实例的、基于特征的和基于模型的方法[26],[27]。本研究关注的基于实例的TL通过重新加权或选择源域中最相关的样本来减轻分布差异。其核心原理是,即使源域和目标域之间的边际分布不同,具有与目标域相似条件分布的源样本仍然可以为目标任务提供有价值的信息。Shin等人[28]提出了一种多源TL方法,该方法利用低成本的材料数据进行模型训练,从而能够在最少的数据量下有效地迁移到目标材料。这种方法只需要少量的目标材料数据,就能有效检测线弧LC中的球化缺陷,显著缓解了数据稀缺问题。同样,Pandiyan等人[29]证明TL能够在激光粉末床熔覆中实现有效的跨材料缺陷分类,即使在目标域数据大幅减少的情况下也能保持良好的准确性,减轻了新材料的数据收集负担。Ahsan等人[30]进一步证明,在数据受限的情况下,TL通过重用预训练模型的泛化特征显著提高了3D打印缺陷的识别准确性,从而克服了传统ML方法在数据受限环境中的性能限制。然而,TL的性能并不总是更优,有时其预测准确性低于仅在目标数据集上训练的经典ML方法,这种现象称为负面迁移。大量且分散的源数据导致模型更关注源数据的特征,而未能捕捉到较小的目标数据集中的特征,从而导致性能下降。
本研究提出了一种新的样本加权TL框架,通过整合领域知识和源数据集,实现数据稀缺的LC系统中缺陷形成的快速可靠预测。首先,我们建立了一个结合了收集的源数据集和目标数据集的多源数据集,涵盖了三种铁基合金,并构建了一个以工艺参数(P,V_S,V_P)和材料属性(T_m,C, λ, ρ)作为输入、缺陷类型作为输出的分类模型。然后,我们引入了一种基于数据集相似性和大小的加权机制。该机制通过相似性感知和数据集基数来分配权重,提高了收敛速度和泛化能力,同时有效抑制了传统TL中常见的负面迁移现象。最后,我们构建了一个可打印性地图,并验证了该地图在未探索参数空间中的准确性。该框架为LC工艺窗口的智能设计提供了高效且高度准确的工具,为LC工艺优化和新材料系统的开发奠定了坚实的基础。