《Pattern Recognition》:A Prototype Correction Multi-scale Feature Reconstruction Network for Industrial Anomaly Detection
编辑推荐:
本文提出原型修正多尺度特征重建网络(PMSR),通过多尺度原型库修正机制净化训练数据,避免污染导致的误检和漏检;结合复合掩码策略和多尺度特征匹配模块,增强局部与全局异常检测能力。实验表明,PMSR在MVTec AD、VisA和MPDD数据集上像素级AUROC分别达到99.8%、98.0%和98.9%,显著优于现有方法。
Lanxiao Li|Chunjuan Yan|Da Song|Binghui Wang|Chuanxu Wang
青岛科技大学信息科学与技术学院,中国山东省青岛市松岭路260061
摘要
由于异常检测和定位技术的效率和泛化能力,它们在工业制造领域得到了广泛应用。然而,尽管无监督方法在训练阶段不需要异常样本,但在实际应用中仍面临许多挑战:一方面,训练数据中的正常样本可能包含微小缺陷或噪声;这种污染可能会误导学习过程,导致模型未能检测到缺陷,从而增加误报或漏报率。另一方面,异常样本的稀缺性常常导致模型过拟合,而异常的复杂多变形态使得精确识别和定位变得困难。为了解决这些问题,我们提出了一种原型校正的多尺度特征重建网络(PMSR)。该网络利用一个纯净的多尺度原型库作为指导,以准确重建正常区域。PMSR包含两个核心组件:一个多尺度原型校正机制,通过原型库对训练数据进行优化;以及一种复合掩蔽策略,增强模型对局部结构和全局模式扰动的鲁棒性。此外,一个专用的特征匹配模块最大化特征之间的对齐概率,进一步提高模型精度。在三个代表性的工业数据集MVTec AD、VisA和MPDD上的实验结果表明,PMSR达到了先进的检测性能,证实了其在工业缺陷检测中的有效性和适用性。
引言
在工业4.0的背景下,高度自动化和智能化的生产模式已成为制造业的主流趋势,这使得产品质量检测变得至关重要。然而,传统的手动检测效率低下,无法满足快速生产的需求。因此,基于计算机视觉和人工智能的工业异常检测技术应运而生[1]、[2]、[3]。工业异常检测的目标是精确快速地识别表面或内部缺陷,从而确保智能生产中的高可靠性、最小化浪费和高效利用资源。在现实世界的工业环境中,异常样本的数量远少于正常样本,并且具有高度的不可预测性,导致严重的类别不平衡;在这种情况下,监督学习方法[2]、[4]难以准确定位缺陷。为了减轻对异常标注的依赖,最近的研究DPDL[5]通过多个高斯正态原型和薛定谔桥扩散迁移,实现了正态聚类和异常距离的判别分布空间,从而增强了异常检测能力。然而,它仍然需要引入标注的异常样本作为先验指导。相比之下,仅使用正常样本的无监督学习方法[6]、[7]、[8]已在工业异常检测领域得到广泛应用。
最近在三大主要范式下的无监督学习方法得到了进一步研究[9]。对于基于嵌入的方法,ReConPatch[10]采用对比学习来线性调整补丁表示,产生面向任务的、高度可分的嵌入;EfficientAD[11]通过对比分析教师网络和学生网络的输出分布来自动标记潜在的缺陷区域。对于基于合成的方法,GLASS[12]通过梯度上升和噪声注入在图像和特征层面生成可控的伪缺陷;PBAS[13]学习近似的决策边界并以目标方式合成特征级别的异常;GeneralAD[14]通过简单的噪声添加和特征重排创建跨域伪异常。对于基于重建的技术,DDAD[15]引入条件去噪扩散来准确重建异常区域,同时保持分布内的一致性;GLAD[16]在训练过程中注入图像级和特征级的伪异常,并进行全局和局部扩散重建。尽管这些方法缓解了正常样本和异常样本之间的类别不平衡,但它们仍然难以精确定位所有缺陷区域。我们将这一不足归因于三个因素:(1)对高质量训练数据的依赖。实际上,“正常”样本通常包含微小的噪声或不完美之处(如图1所示),导致重建模型(如自动编码器[17])要么错误地将异常重建为正常(增加误报),要么将正常杂质误分类为缺陷(增加漏报),从而降低检测性能。(2)异常的微妙性。一些缺陷表现为局部微观特征的变化,可能被主导的正常模式所掩盖,使得细粒度异常难以辨别。相反,涉及全局结构变化的异常可能被全卷积网络(FCNNs)[18]忽略,尽管它们在捕捉小尺度缺陷方面具有优势,但接受域有限,可能错过较大尺度的异常模式。(3)伪异常的缺乏真实性。真实异常在大小、形状和分布上具有广泛的变异性;过于简化的合成异常可能与实际缺陷大相径庭,甚至产生无效的伪影。如果伪异常过于理想化或极端,模型可能会过度拟合这些人工模式,而无法泛化到现实世界中遇到的更微妙的异常。换句话说,不切实际的伪异常可能会使训练偏向于识别这些特定形状,从而降低对真实复杂缺陷的敏感性。
为了突破现有方法在训练数据污染、异常特征的多尺度隐藏以及伪异常生成方面的限制,本文提出了原型校正和多尺度特征重建网络(PMSR)。首先,构建了一个多尺度原型库,并引入了一种校正机制来测量和替换可疑的“正常”特征,以净化训练分布,从而避免由于训练集污染导致的误检测和漏检问题。其次,采用多尺度特征建模和专用特征匹配模块来进行多尺度重建和特征匹配,从而抑制不同尺度上异常的隐藏。最后,设计了一种复合掩蔽策略,用可见区域的掩蔽来替代伪异常的生成,有效避免不切实际伪异常的干扰。与大多数现有方法相比,PMSR优化了仅在正常特征空间建模的范式,无需数据净化,并结合了多尺度重建匹配和复合掩蔽进行协同训练。这是PMSR在处理训练数据污染和多尺度异常定位方面的独特优势。
我们的主要贡献总结如下:
•我们提出了一种用于工业异常检测和定位的新型原型校正多尺度特征重建网络(PMSR)。通过采用基于多尺度原型库的原型校正机制,PMSR有效指导重建过程,从根本上消除了由于训练集污染导致的误检测和漏检,从而显著提高了工业异常检测和定位的可靠性。
•我们提出了一种复合掩蔽策略,在训练过程中交替随机掩蔽前景区域和整个图像。这使得重建网络能够同时捕获局部微异常和全局语义异常,同时有效减轻合成异常中的分布偏差,从而显著提高模型对多种异常场景的适应性。
•我们在完全无监督的条件下,与最先进的方法进行了公平比较。PMSR在MVTec AD数据集上取得了99.8%的像素级AUROC,在VisA和MPDD数据集上分别取得了98.0%和98.9%的AUROC。这些结果进一步证实了PMSR在无监督异常检测领域的显著优势。
章节片段
基于嵌入的方法
基于嵌入的方法是指在预训练的特征空间中对正常嵌入分布进行建模,并在推理阶段使用与该分布的一致性(如特征距离或密度偏差)作为主要的异常评分机制[19]。PatchCore[1]通过稀疏记忆库和kNN实现高召回率定位;随后,CFLOW-AD[20]使用规则化流进行补丁分布建模,平衡了实时性能和准确性
方法
本节详细介绍了PMSR架构的概述、模块细节,以及推理阶段训练损失、异常图和异常分数的生成策略。
数据集
为了全面验证PMSR网络的有效性和泛化能力,我们选择了当前工业异常检测领域中的三个代表性公共数据集,每个数据集中的图像数量和类别数量如表1所示。
MVTec AD [37] 作为异常检测和定位的行业基准,MVTec AD包括15个对象和纹理类别,共计5,354张高分辨率图像。每个类别的训练集仅包含无缺陷的图像
结论
本文提出了一种新颖的工业异常检测和定位框架——PMSR。在这个框架中,我们创新性地引入了一个多尺度原型库校正机制。通过动态确定和替换潜在的异常样本,确保指导多尺度重建过程的正常特征都来自未受污染且具有高度代表性的正常样本,从根本上消除了由于
CRediT作者贡献声明
Lanxiao Li:撰写——原始草稿。Chunjuan Yan:撰写——审阅与编辑。Da Song:概念构思。Binghui Wang:概念构思。Chuanxu Wang:撰写——审阅与编辑。
利益冲突声明
作者声明他们没有已知的可能会影响本文所述工作的竞争性财务利益或个人关系。
致谢
本研究得到了国家自然科学基金(资助编号:61672305)的支持。我们对这一支持表示衷心的感谢。国家自然科学基金的支持对我们研究的进展起到了重要作用。