一种基于高质量条件引导扩散重建的无监督焊接质量检测方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Manufacturing Processes》：An unsupervised welding quality detection method based on high-quality condition-guided diffusion reconstruction

【字体：大中小】 时间：2026年02月03日 来源：Journal of Manufacturing Processes 6.8

编辑推荐：

　　焊接质量检测面临人工主观性强、模型泛化能力不足等问题，本文提出基于重建的两阶段无监督检测框架。首先通过模拟缺陷生成算法构建多类型缺陷数据集，结合Retinex理论和阈值去噪提升图像对比度；其次设计条件引导的高质扩散模型（H-DiffuM）实现精准图像重建，并嵌入多尺度频率域注意力融合模块（MFDAFM）增强检测效果。实验表明该方法像素级AUROC达97.80%，AP达93.34%，较现有方法提升3.53%和2.04%。

Xin Chen|Bin Zi|Kai Tang|Wenjun Tang|Yuan Li

安徽合肥工业大学机械工程学院，中国合肥230009

摘要

焊缝的射线检测在确保焊接制造质量方面起着关键作用，因为X射线成像技术能够清晰地显示焊缝区域的内部结构。然而，现有的主流检测方法依赖于人工检查或监督检测，这两种方法分别容易受到主观因素和模型泛化能力的限制。因此，本文提出了一种基于重建的两阶段无监督检测框架，以实现快速准确的焊接质量检测。首先，设计了一种基于真实焊接缺陷特征的模拟缺陷生成算法。构建了一个包含多种缺陷类型的数据集，并通过数据增强算法进一步优化了图像质量。其次，提出了一种基于残差学习的高质量扩散模型（H-DiffuM），该模型通过残差引导的噪声调度机制实现了焊缝缺陷图像的准确重建。最后，通过将门控机制与X射线图像的频域特征相结合，设计并嵌入了一个多尺度频域注意力融合模块（MFDAFM）到判别网络（Seg-net）中，从而提高了检测精度。最终的实验结果表明，所提出的方法在像素级AUROC上达到了97.80%，在AP上达到了93.34%，超过了当前最先进的无监督检测方法。同时，本文描述的检测方法具有检测速度快和精度高的优点，展示了其在快速评估焊接质量方面的应用潜力。

引言

焊接是制造过程中的关键工艺，广泛应用于大型设备和精密仪器的生产[1]、[2]、[3]。然而，焊接过程容易受到外部因素的影响，可能导致气孔和裂纹等缺陷。焊接质量直接影响船舶制造和结构钢制造等行业中设备和人员的安全[4]，因此焊接缺陷检测至关重要。与传统的表面检测方法相比，X射线可以揭示焊缝的表面和内部结构信息[5]。目前，基于X射线的缺陷识别仍然依赖于人工操作，这严重依赖于操作者的专业知识，引入了主观偏差，并且由于疲劳可能导致精度降低[6]。更重要的是，长时间暴露在X射线辐射下的操作者可能会出现健康问题，因此需要提高检测过程的可靠性和效率。

基于X射线的无损检测技术与其他表面的缺陷检测不同，它依赖于辐射波与材料相互作用时的波粒二象性来获取工件的缺陷信息。这种方法无法呈现工件的完整形态，使得检测过程更加抽象[7]。近年来，在工业异常检测方面取得了重大突破。由于手动特征提取需要高度专业化，以及基于阈值的识别方法存在冗余[8]，主流的异常检测系统已经从早期的二值分割[9]和机器学习技术[10]发展到卷积神经网络（CNNs）[11]。例如，Yang等人[12]和Xu等人[13]分别提出了基于编码器-解码器网络架构的焊缝缺陷定位方法和基于CNN的焊缝射线检测模型。这两种方法有效减少了冗余并消除了人为主观干扰。然而，它们的高计算复杂性和耗时的推理过程限制了实时检测的需求，限制了其在工业中的应用前景。Liu等人[14]基于YOLO框架设计了一个轻量级检测模型，解决了实时性能问题。然而，焊接缺陷检测涉及多任务识别和定位，由于任务冲突和固有的耦合，导致精度降低。因此，Zuo等人[5]从人类学习机制中获得灵感，提出了一种针对X射线图像的多专家检测方法，提高了精度和操作效率。尽管这些监督检测方法能够快速定位缺陷，但它们需要大量带有精确标签的高质量数据集进行模型训练。获取此类数据集具有挑战性，需要大量的人力和物力资源，严重限制了这些方法的发展。

近年来，无监督异常检测因其无需大量手动标注数据即可运行而受到关注[15]。因此，一些研究人员将这种方法应用于焊接检测，以实现高效和稳健的检测任务。为了应对焊接弧增材制造（WAAM）过程中的挑战，Li等人[16]使用VQ-VCAE重建熔池视频帧，并将其与孤立森林算法结合，实现了无监督异常检测。在Guo等人的工作中[17]，提出了一种基于多变量广义高斯混合模型（MGGMM）的分类方法，创建了一个全面的计算机辅助诊断工作流程，显著提高了检测精度和客观性。然而，MGGMM参数需要离线更新，无法实时适应新的缺陷样本。在[18]中，提出了一种基于图像分割的无监督局部深度特征学习方法，有效检测和分割未知缺陷，从而解决了Guo等人工作的局限性[17]。据我们所知，关于无监督焊接缺陷检测的研究仍然有限，大多数方法的任务适应性较弱。最近，基于重建的无监督检测方法由于其简单的设计理念和高检测精度而取得了显著进展。因此，本文采用基于重建的无监督策略，设计了一个两阶段焊接缺陷检测框架，将检测过程转化为重建缺陷图像与原始缺陷图像之间的差异分割。目标是准确分割和定位缺陷，为深入分析提供技术支持。

尽管基于重建的无监督异常检测在工业异常检测中表现出色，但直接将现有方法应用于焊缝X射线检测仍无法实现高精度检测。主要原因在于当前重建网络的固有局限性。研究人员探索了各种重建技术，通常利用自编码器（AE）、变分自编码器（VAE）或生成对抗网络（GAN）来学习正常数据的分布。然后根据测试样本重建前后的差异进行判断。尽管之前的研究[16]、[19]、[20]使用了VAE和GAN等模型进行焊接检测，但在处理X射线图像中的复杂结构或纹理时，VAE往往产生简单的复制而不是选择性条件重建，尽管减少了重建时间[21]。这导致重建图像过度平滑，严重影响了检测精度。相比之下，GAN在图像生成质量上具有较高的上限，但其训练过程不稳定且容易发生模式崩溃。这些固有局限性同样限制了它们在要求苛刻的焊接检测场景中的实际应用。近年来，扩散模型在各种图像恢复任务中得到了广泛应用，取得了显著突破[22]。扩散模型的高训练稳定性、卓越的重建质量上限以及易于扩展和条件控制的特点也使其在基于重建的检测中具有很大潜力。因此，为了解决传统重建模型的局限性，我们设计了一种由条件输入引导的高质量扩散模型（H-DiffuM）作为重建网络。这种方法通过精确控制输入条件，实现了高保真度的重建图像。

考虑到现有技术存在的问题，本文提出了一种基于重建的两阶段检测方法来解决缺陷检测问题。我们提出了一种模拟缺陷生成算法来生成大规模的成对缺陷数据集，并使用Retinex理论[23]和基于阈值的去噪技术[24]来提高焊接缺陷的对比度。认识到缺陷图像重建在最终检测分割过程中的重要性，我们提供了H-DiffuM作为重建模型，以获得高保真度的重建图像。此外，为了提高检测分割精度，我们提出了一种基于门控机制和频域信息特征的多尺度频域注意力融合模块（MFDAFM）。该模块被纳入判别网络（Seg-net）中，作为我们建议技术的判别模型。本研究的主要贡献如下：

(1) 为了解决数据集获取的困难，本研究考察了焊接缺陷模式，并提供了一种基于模拟的生成算法，用于从高质量焊接材料照片中创建数据集。为了解决缺陷对比度低的问题，使用Retinex理论处理高频信息，同时使用阈值去噪优化低频信息，以提高对比度和模型精度。

(2) 为了实现高质量的重建图像以进行检测，我们提出了条件引导的高质量扩散模型。残差学习允许从正样本和负样本中同时学习特征，从而减少了重建图像中的语义损失。多任务分布被转换为高质量共享分布（HSDT），使模型能够学习缺陷共享信息。这简化了训练并提高了重建质量。

(3) 我们设计了一个多尺度频域注意力融合模块（MFDAFM），在减轻网络重量和提高检测精度之间取得了平衡。实验结果表明，与现有的最先进无监督检测方法相比，我们的方法在AUROC和AP上分别提高了3.53%和2.04%。

本文的结构如下：第2节介绍数据收集和基于重建的无监督检测方法。第3节重点介绍异常检测数据集、实验设计和性能评估指标，随后是对最终实验结果的分析和讨论。最后，第4节总结了整篇论文。

节选

概述

我们提出的检测框架的总体架构及其完整的检测工作流程如图1所示。整个过程包括三个步骤：数据采集、模拟缺陷数据集生成和缺陷检测。值得注意的是，STEP3中的检测过程分为两个阶段：图像重建和缺陷检测与定位。

数据采集和模拟数据集生成

H-DiffuM需要使用有缺陷的图像及其对应的无缺陷状态图像进行训练。不幸的是，在实际

实验和结果

本节将讨论训练数据集的组成、实验实施的具体参数以及评估指标的选择标准。为了评估所提出方法的有效性，将依次进行后续的消融研究，然后与最先进的无监督检测方法进行比较分析。

结论

本文提出了一种基于条件引导扩散重建的两步无监督焊接缺陷检测技术。该方法无需大量标注数据即可实现精确的检测和定位。具体来说，我们设计了一种缺陷模拟生成算法来创建大量样本，从而缓解了真实缺陷数据的稀缺问题。为了加速图像重建并提高质量，结合了条件引导机制

CRediT作者贡献声明

Xin Chen：撰写 – 原始草稿、方法论、数据整理。Bin Zi：撰写 – 审稿与编辑、项目管理、资金获取、概念化。Kai Tang：软件、形式分析。Wenjun Tang：监督、概念化。Yuan Li：验证、调查。

利益冲突声明

作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。

致谢

本工作部分得到了中国国家重点研发计划（项目编号2024YFB4709400）和国家自然科学基金（项目编号52335002）的支持。

联系信箱：

粤ICP备09063491号

摘要

引言

节选

概述

数据采集和模拟数据集生成

实验和结果

结论

CRediT作者贡献声明

利益冲突声明

致谢

热点排行