基于物理信息神经网络的自监督学习方法，用于激光焊接过程的焊接穿透深度预测模型

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Manufacturing Processes》：A welding penetration prediction model for laser welding process based on self-supervised learning using physics-informed neural networks

【字体：大中小】 时间：2026年02月05日 来源：Journal of Manufacturing Processes 6.8

编辑推荐：

　　本文提出SimPhysNet算法，通过融合物理约束的自监督学习与原型网络的小样本分类策略，有效解决了激光焊接穿透性预测中标注数据稀缺的问题。实验表明，仅需200张标注数据（总标注数据量的5%）即可达到96.06%的分类精度，显著优于传统监督学习方法。该方法创新性地将偏微分方程物理约束嵌入对比学习框架，结合图像增强任务和原型网络机制，实现了高精度、低成本的穿透性预测，为智能焊接自动化提供新思路。

李森|刘晓颖|徐晓健|邵晨东|王亚琪|兰玲|唐新华|崔海超

上海交通大学材料科学与工程学院材料激光加工与改性重点实验室，中国上海200240

摘要

激光焊接的完全穿透至关重要，因为它是实现无缺陷焊接接头的基本因素之一。因此，准确预测穿透状态对于确保焊接质量至关重要。为此，本文介绍了一种名为SimPhysNet的新算法，该算法仅使用有限数量的标记图像就能实现高分类精度。这种方法有效克服了监督学习分类算法的局限性，因为这些算法在工业应用中依赖于大量高质量标记数据。SimPhysNet的核心是一种独特的自监督学习范式，它将物理先验嵌入到对比学习框架中。通过结合物理信息神经网络（PINN），模型能够从大量未标记数据中提取熔池和关键孔的物理意义特征，而三种图像增强任务进一步提高了其泛化能力。随后，基于原型网络的少量样本学习策略通过从最少的标记图像集中构建类别表示来实现强大的分类能力。实验结果表明，SimPhysNet仅使用200张标记图像（约占总标记数据集的5%）就实现了96.06%的分类精度，这与使用整个标记数据集的传统监督学习算法的性能相当。这项工作提出了一种新的、高效且高度准确的方法，为激光焊接的智能自动化提供了途径。

引言

近年来，激光焊接技术已在核能、造船、航空航天、国防设备、汽车制造和铁路车辆生产等多个行业中得到广泛应用[1]。与传统焊接技术相比，激光焊接具有显著优势，包括低热输入、高焊缝深度与宽度比、快速焊接速度以及高自动化水平。因此，它被视为21世纪最具前景的先进连接技术之一。然而，要在激光焊接中实现高质量的焊接接头，需要对工艺参数进行精确控制和优化。因此，开发一个可靠的模型来模拟整个激光深穿透焊接过程将能够实时调整焊接参数，以确保完全穿透和优异的接头质量。

在激光焊接过程中，会产生大量信号，主要包括声学和光学信号[2]。近年来，由于光学信号信息丰富、易于获取且解释性强，研究人员对其给予了越来越多的关注。例如，Kang等人[3]开发了一种基于光学发射光谱（OES）的深度学习模型，用于实时预测铝/铜激光异种焊接（LDW）过程中的焊缝横截面几何形状，从而便于直观评估焊接质量。同样，Li等人[4]设计了一种基于成本效益高的电荷耦合器件（CCD）相机和多任务卷积神经网络的在线监测系统，实现了高精度的焊缝深度和宽度实时预测。然而，尽管这些深度学习模型具有很高的精度，但它们主要是监督学习模型，这在工业应用中存在重大障碍：获取大规模、高质量标记数据的成本非常高。在激光焊接的背景下，确定穿透状态的基准是一个劳动密集型的后处理活动。每个标签都需要仔细检查完成的焊缝——通常是通过检查其背面——以确认完全穿透。当这种验证过程必须扩展到数千或数万个样本以充分覆盖各种工艺参数和材料条件时，它就成为一个关键瓶颈。这种对大量后处理验证的依赖阻碍了模型的快速开发和迭代，并限制了它们在动态生产环境中的可扩展性。因此，开发一种能够在最小依赖标记数据的情况下实现高预测精度的方法对于激光焊接的智能自动化至关重要。

为了解决这些挑战，研究人员提出了少量样本学习方法。少量样本学习旨在用有限的样本数量实现高效学习，从而减少对大型标记数据集的依赖。该领域最重要的方法之一是基于度量的学习[5]。这种方法涉及训练模型将输入样本映射到低维嵌入空间中，同一类的样本在嵌入空间中紧密聚集，而不同类的样本则明显分离。在推理过程中，通过计算查询样本与该嵌入空间中支持集样本的距离来确定其类别。Raffin等人[6]发现，在数据有限的条件下，原型网络表现出出色的性能，在钩型缠绕激光焊接的质量监测任务中实现了94.4%的精度。这为工业视觉检测提供了一种数据高效的解决方案。为了解决工业焊缝检测中样本数据有限的挑战，Zhu等人[7]提出了一种基于距离度量分类机制的度量学习方法，在极端受限的数据条件下提高了检测精度。Liu等人[8]引入了一种名为FS-Classifier的新算法，该方法使用无监督学习对特征提取器进行预训练，并将其与优化的原型网络结合用于少量样本分类。这种方法使用少量样本数据集实现了高精度的钨极气体保护焊（TIG）缺陷分类，进一步证明了将无监督预训练与原型网络微调相结合的可行性。虽然这些工作展示了将无监督预训练与少量样本学习相结合的潜力，但它们的预训练目标纯粹是数据驱动的。对于像激光焊接这样的复杂物理过程，这些方法可能无法捕捉到潜在的因果关系，而是学习了表面的视觉相关性。这限制了它们从不基于过程物理特性的特征空间中进行稳健泛化的能力。

近年来，将物理信息整合到深度学习网络中引起了广泛关注。物理信息神经网络（PINNs）将物理定律作为先验知识纳入神经网络训练过程中。这种方法确保了模型在从数据中学习的同时，仍与基本物理原理保持一致。因此，PINNs可以利用物理约束来指导使用有限实验数据集学习准确的数据特征，从而实现用更少样本实现高分类精度的目标。Chen等人[9]提出了一种混合CNN方法，通过将焊接相关的物理定律转换为图像特征来整合物理先验知识，从而显著提高了可变极性等离子弧（VPPA）焊接质量预测的精度。同样，Lu等人[10]开发了一种物理信息CNN-LSTM（PI-CNN-LSTM）用于激光填充丝焊接的实时监测。他们的架构将时空熔池特征与分析热传递模型相结合，以推断热相关变量。通过使用物理感知的激活函数将这些参数限制在有意义的范围内，即使仅训练了数据集的10%，他们也实现了稳健的穿透深度预测。Li等人[11]引入了一种改进的M-PINN，通过将隐式物理模型纳入激活函数和显式物理约束纳入损失函数中，用于预测双面焊缝的疲劳寿命，这在数据有限的条件下显著提高了预测精度。尽管PINNs在解决监督问题时取得了成功，但它们作为自监督特征学习框架中的正则化器的潜力尚未得到充分利用。现有研究通常使用PINNs来近似特定解决方案。相比之下，我们的工作重新利用了这一范式，以在高维特征表示上强制物理一致性，这是一种根本不同的新应用。

为了解决上述挑战，本文介绍了SimPhysNet，这是一个旨在从有限数量的标记图像中实现高精度穿透预测的新框架。本工作的主要贡献总结如下：

1.

物理和自监督的融合用于特征学习：与仅依赖数据增强的传统自监督方法不同，我们的框架率先将由偏微分方程控制的物理先验直接嵌入到对比学习损失函数中。这种方法不同于以往的工作，因为它利用基本物理定律作为隐式的监督信号来指导特征提取器从未标记数据中学习物理意义上的表示，从而确保学习到的特征不仅仅是相关的，而是基于潜在的过程动态的。

2.

预训练和少量样本学习的协同整合：模型架构分为两个阶段。初始的预训练阶段利用未标记数据建立一个稳健且泛化的特征空间。随后，微调阶段采用基于原型网络的少量样本学习策略，以最少的标记数据实现高分类精度。这种协同设计有效缓解了数据有限情况下常见的过拟合问题。

3.

针对应用的图像增强策略：设计了三种监督性 pretext任务——旋转预测、高斯模糊级别预测和随机裁剪定位，并将其整合到预训练阶段。这些任务迫使网络学习从全局熔池形态到细粒度局部细节的分层特征，这对于区分穿透状态和提高模型的整体泛化能力至关重要。

实验设置

实验设置主要由三个关键组件组成：激光焊接模块、机器人运动控制系统和同轴图像采集模块。激光焊接模块包括光纤激光焊接机、水冷单元和激光焊接头。在焊接过程中，工件保持静止，而Yaskawa机器人臂精确控制焊接头的移动。在开始焊接程序之前，808纳米辅助激光

网络细节

如第一节所讨论的，具有强泛化性能和高精度的激光熔池分类模型通常依赖于大规模、高质量的数据集。然而，这样的数据集的注释既费时又费力。为了解决这个问题，本文提出了一种无监督分类网络SimPhysNet，它仅使用有限数量的标记样本就实现了较高的分类精度。图5展示了

预训练阶段的实验结果

本研究的实验框架使用PyTorch实现，训练环境配置在Intel i7-13900KF CPU、NVIDIA RTX 2080 Ti GPU和32 GB RAM上。训练配置采用随机梯度下降（SGD）[21]作为优化器，初始学习率为0.001，并采用OneCycleLR调度策略进行动态学习率调整。批量大小为256，在800个训练周期中使用，自动混合精度（AMP）是

结论

激光焊接穿透分类通常依赖于大量标记数据。为了解决这一限制，本文提出了一种深度学习算法SimPhysNet，它整合了两个关键组件：基于对比学习的预训练特征提取器和基于少量样本的分类器。主要贡献总结如下：

1)

通过将由偏微分方程控制的物理先验嵌入到对比学习损失中

CRediT作者贡献声明

李森：写作 – 审稿与编辑，撰写 – 原始草稿，可视化，验证，监督，软件，资源，形式分析，数据管理。刘晓颖：写作 – 审稿与编辑，撰写 – 原始草稿，监督。徐晓健：监督，写作 – 审稿与编辑。邵晨东：监督，写作 – 审稿与编辑。王亚琪：监督。兰玲：监督。唐新华：写作 – 审稿与编辑，监督，形式分析。崔海超：写作 – 审稿与

参与同意

作者声明他们同意参与。

出版同意

作者声明他们同意出版。

伦理批准

不适用。

资助

作者衷心感谢来自中国国家重点研发计划（编号2023YFB3407800）和国家自然科学基金（编号U2141213）的财政支持。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号