焊接是制造过程中的关键工艺,广泛应用于大型设备和精密仪器的生产[1]、[2]、[3]。然而,焊接过程容易受到外部因素的影响,可能导致气孔和裂纹等缺陷。焊接质量直接影响船舶制造和结构钢制造等行业中设备和人员的安全[4],因此焊接缺陷检测至关重要。与传统的表面检测方法相比,X射线可以揭示焊缝的表面和内部结构信息[5]。目前,基于X射线的缺陷识别仍然依赖于人工操作,这严重依赖于操作者的专业知识,引入了主观偏差,并且由于疲劳可能导致精度降低[6]。更重要的是,长时间暴露在X射线辐射下的操作者可能会出现健康问题,因此需要提高检测过程的可靠性和效率。
基于X射线的无损检测技术与其他表面的缺陷检测不同,它依赖于辐射波与材料相互作用时的波粒二象性来获取工件的缺陷信息。这种方法无法呈现工件的完整形态,使得检测过程更加抽象[7]。近年来,在工业异常检测方面取得了重大突破。由于手动特征提取需要高度专业化,以及基于阈值的识别方法存在冗余[8],主流的异常检测系统已经从早期的二值分割[9]和机器学习技术[10]发展到卷积神经网络(CNNs)[11]。例如,Yang等人[12]和Xu等人[13]分别提出了基于编码器-解码器网络架构的焊缝缺陷定位方法和基于CNN的焊缝射线检测模型。这两种方法有效减少了冗余并消除了人为主观干扰。然而,它们的高计算复杂性和耗时的推理过程限制了实时检测的需求,限制了其在工业中的应用前景。Liu等人[14]基于YOLO框架设计了一个轻量级检测模型,解决了实时性能问题。然而,焊接缺陷检测涉及多任务识别和定位,由于任务冲突和固有的耦合,导致精度降低。因此,Zuo等人[5]从人类学习机制中获得灵感,提出了一种针对X射线图像的多专家检测方法,提高了精度和操作效率。尽管这些监督检测方法能够快速定位缺陷,但它们需要大量带有精确标签的高质量数据集进行模型训练。获取此类数据集具有挑战性,需要大量的人力和物力资源,严重限制了这些方法的发展。
近年来,无监督异常检测因其无需大量手动标注数据即可运行而受到关注[15]。因此,一些研究人员将这种方法应用于焊接检测,以实现高效和稳健的检测任务。为了应对焊接弧增材制造(WAAM)过程中的挑战,Li等人[16]使用VQ-VCAE重建熔池视频帧,并将其与孤立森林算法结合,实现了无监督异常检测。在Guo等人的工作中[17],提出了一种基于多变量广义高斯混合模型(MGGMM)的分类方法,创建了一个全面的计算机辅助诊断工作流程,显著提高了检测精度和客观性。然而,MGGMM参数需要离线更新,无法实时适应新的缺陷样本。在[18]中,提出了一种基于图像分割的无监督局部深度特征学习方法,有效检测和分割未知缺陷,从而解决了Guo等人工作的局限性[17]。据我们所知,关于无监督焊接缺陷检测的研究仍然有限,大多数方法的任务适应性较弱。最近,基于重建的无监督检测方法由于其简单的设计理念和高检测精度而取得了显著进展。因此,本文采用基于重建的无监督策略,设计了一个两阶段焊接缺陷检测框架,将检测过程转化为重建缺陷图像与原始缺陷图像之间的差异分割。目标是准确分割和定位缺陷,为深入分析提供技术支持。
尽管基于重建的无监督异常检测在工业异常检测中表现出色,但直接将现有方法应用于焊缝X射线检测仍无法实现高精度检测。主要原因在于当前重建网络的固有局限性。研究人员探索了各种重建技术,通常利用自编码器(AE)、变分自编码器(VAE)或生成对抗网络(GAN)来学习正常数据的分布。然后根据测试样本重建前后的差异进行判断。尽管之前的研究[16]、[19]、[20]使用了VAE和GAN等模型进行焊接检测,但在处理X射线图像中的复杂结构或纹理时,VAE往往产生简单的复制而不是选择性条件重建,尽管减少了重建时间[21]。这导致重建图像过度平滑,严重影响了检测精度。相比之下,GAN在图像生成质量上具有较高的上限,但其训练过程不稳定且容易发生模式崩溃。这些固有局限性同样限制了它们在要求苛刻的焊接检测场景中的实际应用。近年来,扩散模型在各种图像恢复任务中得到了广泛应用,取得了显著突破[22]。扩散模型的高训练稳定性、卓越的重建质量上限以及易于扩展和条件控制的特点也使其在基于重建的检测中具有很大潜力。因此,为了解决传统重建模型的局限性,我们设计了一种由条件输入引导的高质量扩散模型(H-DiffuM)作为重建网络。这种方法通过精确控制输入条件,实现了高保真度的重建图像。
考虑到现有技术存在的问题,本文提出了一种基于重建的两阶段检测方法来解决缺陷检测问题。我们提出了一种模拟缺陷生成算法来生成大规模的成对缺陷数据集,并使用Retinex理论[23]和基于阈值的去噪技术[24]来提高焊接缺陷的对比度。认识到缺陷图像重建在最终检测分割过程中的重要性,我们提供了H-DiffuM作为重建模型,以获得高保真度的重建图像。此外,为了提高检测分割精度,我们提出了一种基于门控机制和频域信息特征的多尺度频域注意力融合模块(MFDAFM)。该模块被纳入判别网络(Seg-net)中,作为我们建议技术的判别模型。本研究的主要贡献如下:
(1) 为了解决数据集获取的困难,本研究考察了焊接缺陷模式,并提供了一种基于模拟的生成算法,用于从高质量焊接材料照片中创建数据集。为了解决缺陷对比度低的问题,使用Retinex理论处理高频信息,同时使用阈值去噪优化低频信息,以提高对比度和模型精度。
(2) 为了实现高质量的重建图像以进行检测,我们提出了条件引导的高质量扩散模型。残差学习允许从正样本和负样本中同时学习特征,从而减少了重建图像中的语义损失。多任务分布被转换为高质量共享分布(HSDT),使模型能够学习缺陷共享信息。这简化了训练并提高了重建质量。
(3) 我们设计了一个多尺度频域注意力融合模块(MFDAFM),在减轻网络重量和提高检测精度之间取得了平衡。实验结果表明,与现有的最先进无监督检测方法相比,我们的方法在AUROC和AP上分别提高了3.53%和2.04%。
本文的结构如下:第2节介绍数据收集和基于重建的无监督检测方法。第3节重点介绍异常检测数据集、实验设计和性能评估指标,随后是对最终实验结果的分析和讨论。最后,第4节总结了整篇论文。