一种热稳定性良好的Ba??xMg??yZn?yGe?O?:xBi?+型蓝光荧光粉,可用于紫外光驱动的白光LED

《Journal of Alloys and Compounds》:Thermally robust Ba 2- xMg 1- yZn yGe 2O 7: xBi3+ cyan-emitting phosphor for UV-driven white LEDs

【字体: 时间:2026年02月18日 来源:Journal of Alloys and Compounds 6.3

编辑推荐:

  激光熔覆涂层缺陷预测中提出样本加权迁移学习框架,通过融合数据集相似性与规模动态分配权重,有效缓解数据稀缺与负面迁移问题。实验表明该方法F1值达0.8573,优于传统迁移学习及目标数据训练模型。SHAP分析揭示工艺参数对缺陷形成的关键影响,为过程优化提供依据。

  
王宇|王一浩|赵德超|张宏杰|张新尧|程曼|陈明|崔中宇|崔洪志
中国海洋大学材料科学与工程学院,青岛266100

摘要

缺陷会显著降低涂层的服役寿命,而利用迁移学习(Transfer Learning, TL)快速预测加工窗口提供了一种基于现有文献数据的高效且经济的方法。然而,大量的外部数据可能导致TL忽略实验系统的独特特性,从而产生负面迁移效应。为了解决这个问题,本研究引入了一种新颖的样本加权TL框架,该框架同时考虑了文献数据子集与目标数据集之间的相似性以及数据集的大小。首先,通过PCA降维和阈值将文献数据集划分为“相似”和“不相似”的子集,然后通过计算子集与目标数据集在低维空间中的欧几里得距离来衡量相似性。通过结合相似性和大小来计算综合权重。该框架通过考虑这两个因素有效地减轻了数据分布差异的不利影响。实验验证表明,该框架的F1分数为0.8573,显著优于仅使用目标数据的机器学习(Target-only ML)、融合数据的机器学习(Fused-data ML)和传统的TL方法。此外,SHAP可解释性分析强调了工艺参数在缺陷形成中的重要性,为激光熔覆优化提供了见解。

引言

激光熔覆(Laser Cladding, LC)是一种高效的表面改性技术[1],能够在基底上直接形成具有灵活成分和微观结构设计的强化层。它在航空航天、能源、汽车和发电等领域得到广泛应用,典型应用包括叶片、涡轮盘、阀门、活塞杆、过热器管以及各种轴组件的表面[2],[3]。这种在成分和微观结构设计上的灵活性也使得开发具有优异性能的先进涂层材料成为可能。周等人[4]最近报道的由NbMoWTaAg组成的难熔高熵薄膜展示了出色的耐磨性,表明通过材料创新可以提升涂层性能。激光熔覆具有诸如热影响区小、冶金结合强度高、粉末选择范围广、耐腐蚀性强以及能够修复薄壁和小部件等优点[5],[6]。然而,激光熔覆涂层的质量受到工艺参数、材料选择和加工条件的影响。不适当的工艺设置可能导致诸如未熔合(Lack of Fusion, LOF)[7],[8]、球化(Balling)[9]和KeyHole(KH)[8],[10]等缺陷,从而降低涂层的耐腐蚀性、抗氧化性和耐磨性。尽管高保真多物理场模拟[11],[12]能够提供关于缺陷机制的见解,但华等人[13]利用原子模拟阐明了石墨烯在CoCrNi复合材料中的界面增强机制,尽管计算需求较大且计算成本较高。经验法则[14]往往由于工艺参数和材料属性之间的非线性相互作用而缺乏准确性。因此,优化工艺参数仍然是一个关键挑战,这促使人们需要采用稳健的数据驱动方法。
相比之下,机器学习(ML)方法特别擅长捕捉工艺参数、材料属性和缺陷之间的复杂非线性关系[15],[16]。例如,李等人[17]利用合成数据训练和补丁邻域特征提取来克服传统单点距离方法的局限性,显著提高了在线检测LC几何缺陷的准确性,F值超过89%。同样,Tridello等人[18]采用两个前馈神经网络模型,根据选择性激光熔化(Selective Laser Melting, SLM)工艺参数和零件风险体积直接预测关键缺陷的概率及其尺寸分布参数。此外,机器学习在材料科学的其他领域也展示了强大的能力,例如在预测高熵合金膜的摩擦学行为[19]和设计石墨烯增强复合材料的界面[20]方面取得了显著成就。尽管机器学习在捕捉工艺参数和缺陷之间的非线性关系方面表现出色,但其性能高度依赖于庞大的数据量。在新材料系统中,获取足够的实验数据通常成本高昂,导致数据集极其有限。在这种数据稀疏的情况下,传统的监督学习模型容易过拟合,并且泛化能力较差。
为了应对这些挑战,研究人员通常采用以下策略:(1)通过数据重采样(例如K折交叉验证)来稳定模型评估,相比简单的数据集划分,特别是在数据稀缺的情况下,提供更可靠的性能评估[21]。(2)集成学习通过汇总多个基础学习器的预测来减少方差并增强对抗过拟合的能力[22],[23]。(3)数据增强和合成通过基于物理的转换或生成模型来扩展训练集,生成符合物理定律的样本,以缓解数据稀缺问题[24],[25]。然而,这些方法仍然受到现有数据局限性的约束。在极端数据稀缺的情况下,它们仍可能遇到高评估方差、过拟合或合成样本偏差等挑战。因此,迁移学习(Transfer Learning, TL)作为一种有前景的替代方案应运而生。通过利用数据丰富目标领域的知识,它直接解决了信息不足的核心问题,以最小的数据需求有效增强了目标领域的模型泛化能力。
TL方法大致分为基于实例的、基于特征的和基于模型的方法[26],[27]。本研究关注的基于实例的TL通过重新加权或选择源域中最相关的样本来减轻分布差异。其核心原理是,即使源域和目标域之间的边际分布不同,具有与目标域相似条件分布的源样本仍然可以为目标任务提供有价值的信息。Shin等人[28]提出了一种多源TL方法,该方法利用低成本的材料数据进行模型训练,从而能够在最少的数据量下有效地迁移到目标材料。这种方法只需要少量的目标材料数据,就能有效检测线弧LC中的球化缺陷,显著缓解了数据稀缺问题。同样,Pandiyan等人[29]证明TL能够在激光粉末床熔覆中实现有效的跨材料缺陷分类,即使在目标域数据大幅减少的情况下也能保持良好的准确性,减轻了新材料的数据收集负担。Ahsan等人[30]进一步证明,在数据受限的情况下,TL通过重用预训练模型的泛化特征显著提高了3D打印缺陷的识别准确性,从而克服了传统ML方法在数据受限环境中的性能限制。然而,TL的性能并不总是更优,有时其预测准确性低于仅在目标数据集上训练的经典ML方法,这种现象称为负面迁移。大量且分散的源数据导致模型更关注源数据的特征,而未能捕捉到较小的目标数据集中的特征,从而导致性能下降。
本研究提出了一种新的样本加权TL框架,通过整合领域知识和源数据集,实现数据稀缺的LC系统中缺陷形成的快速可靠预测。首先,我们建立了一个结合了收集的源数据集和目标数据集的多源数据集,涵盖了三种铁基合金,并构建了一个以工艺参数(P,V_S,V_P)和材料属性(T_m,C, λ, ρ)作为输入、缺陷类型作为输出的分类模型。然后,我们引入了一种基于数据集相似性和大小的加权机制。该机制通过相似性感知和数据集基数来分配权重,提高了收敛速度和泛化能力,同时有效抑制了传统TL中常见的负面迁移现象。最后,我们构建了一个可打印性地图,并验证了该地图在未探索参数空间中的准确性。该框架为LC工艺窗口的智能设计提供了高效且高度准确的工具,为LC工艺优化和新材料系统的开发奠定了坚实的基础。

方法论

本研究提出了一种样本加权TL框架,通过为不同相关性的数据集分配定制的权重来增强模型预测缺陷的能力。该方法的整体工作流程如图1所示,系统地分为三个相互关联的阶段。首先进行数据准备和预处理,识别并去除异常值,为模型开发奠定坚实基础(步骤1)。第二阶段涉及

目标数据集上的经典机器学习

由于效率高等原因,经典ML方法在LC缺陷预测研究中得到了广泛应用,它们实现迅速且适用于各种数据特征的多样化模型组合。本节评估了在目标数据集上训练的六个经典ML模型的性能。
图4展示了在目标数据集上训练的六个模型的验证混淆矩阵。训练混淆矩阵显示在图S5中。DT模型(图4(a))表现出强大的

迁移学习模型的比较分析

为了进一步验证所提出的样本加权TL框架的有效性,我们将其与两种最经典的基于实例的TL方法:TrAdaBoost和Kernel Mean Matching(KMM)进行了比较分析。这两种方法在相同的条件下进行了训练(使用240个源数据和80个目标数据作为训练集),并在相同的验证集(76个目标数据)上进行了评估。为了公平比较,TrAdaBoost和KMM的超参数使用相同的方法进行了优化

结论

为了解决数据稀缺LC系统中缺陷预测的关键挑战,本研究提出了一种新的样本加权TL框架,该框架同时考虑了数据集的相似性和大小。所提出的方法显著提高了模型的准确性、收敛行为和泛化能力。主要发现如下:
  • (1)
    样本加权TL框架将模型的Val F1分数从0.6528显著提高到了0.9369。通过为

披露声明

作者声明没有潜在的利益冲突。作者声明没有已知的竞争性财务或个人利益可能影响本研究的工作。

资助

崔H.Z.感谢山东省重点研发计划(编号2023ZLGX05和2023CXGC010406)、山东省自然科学基金重点计划(编号ZR2024ZD14)、国家自然科学基金重点计划(编号52331004)以及泰山学者攀登计划(编号tspd20230603)的财政支持。赵D.C.感谢山东省自然科学基金重点计划的财政支持

CRediT作者贡献声明

崔中宇:撰写——审稿与编辑、验证、资金获取、正式分析。陈明:撰写——审稿与编辑、验证、正式分析、概念化。王宇:撰写——初稿、验证、调查、正式分析、数据管理。崔洪志:撰写——审稿与编辑、资源获取、正式分析、概念化。张新尧:撰写——审稿与编辑、调查、正式分析、数据管理。张宏杰:验证,

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号