自动视觉检测(AVI)技术对于确保带材质量至关重要。带材表面存在不规则的多类缺陷会严重影响产品价值和生产安全(M. Li等人,2022年)。因此,快速识别缺陷和随后的过程控制是必要的(Huang等人,2025年)。手动视觉检测方法效率低下、成本高昂且存在安全风险。因此,需要一个高效的缺陷检测模型来提升现有AVI系统的性能。最近的进展,如YOLO系列检测器(Tian等人,2025年),显著扩展了工业AVI的适用性和实用性。
卷积神经网络(CNN)被广泛用于缺陷检测。尽管早期研究已经证明了高检测准确性(Kou等人,2021年;Liu等人,2023年),但在实际应用中仍存在较大差距。首先,传统CNN架构的推理速度较慢,导致缺陷检测往往是反应性的而非实时的(Hou等人,2023年;Ying等人,2022年)。此外,工业图像经常包含背景干扰,如镜面反射、雾或污渍,这要求模型能够区分缺陷特有的纹理特征和环境噪声(Huang等人,2025年)。缺陷本身通常表现出不规则、不均匀的纹理模式。然而,CNN通常以牺牲空间分辨率为代价来捕获具有大接收场的特征,从而导致无法充分表示细小的无序细节,限制了识别准确性(Zhu等人,2023年)。因此,将纹理敏感机制集成到CNN中对于提升缺陷感知能力至关重要。这样的模型应能有效融合局部纹理描述符和全局语义上下文,同时保持轻量级结构,以适应实际工业应用。
为了解决这一挑战,我们采用了改进的可学习Gabor滤波器来构建轻量级的特征提取模块,从而提高带材缺陷检测中的纹理识别能力。Gabor滤波器是纹理分析的常用方法(Zhu等人,2023年;Oh等人,2018年),它通过高斯核与正弦函数的调制来可靠地捕获空间和频率域信息(C. Li等人,2022年)。
Daugman证明Gabor滤波器类似于视觉皮层中简单细胞的接收场,能够精确提取局部纹理细节(Daugman,1985年)。此外,它们可调的频率参数可以对光谱内容进行显式控制,克服了传统CNN的频率偏差限制。这些滤波器还对光照变化、对比度和物体形态变化具有很强的鲁棒性,有助于多尺度、多方向的纹理提取,并减少噪声。在带材表面缺陷检测中,仔细调整Gabor参数至关重要,因为空间定位、方向敏感性和频率表示直接影响检测准确性(Bodnarova等人,2002年)。然而,手动设计的参数集(Luan等人,2018年;Liu等人,2018年)或仅依赖单个Gabor滤波器(Shi等人,2024年)在处理大小和复杂性多样的缺陷时往往限制了性能。
为了解决传统Gabor滤波器在参数配置、模型紧凑性和对噪声敏感性方面的局限性,我们提出了一种可学习Gabor滤波器框架,其中大多数参数是可训练的,而方向参数保持固定。我们进一步使用幽灵图技术简化了网络架构,并引入了参数约束策略以防止过滤过程中的能量溢出。然后,我们开发了一种缺陷纹理增强注意力机制,该机制结合了统计纹理分析和位置编码,从Gabor响应图中提取显著特征。基于这些组件,我们设计了LGTR-Net,这是一个由多个具有不同核尺寸的Gabor卷积层组成的轻量级骨干网络。这些精心设计的选择使得缺陷纹理的提取和检测既高效又有效。最后,我们提出了SSDC-10,一个新的带材表面缺陷分类数据集,包含十个缺陷类别,并在三个额外的基准测试上进行了广泛实验以验证LGTR-Net的有效性。得益于我们可学习Gabor滤波器的简化设计,LGTR-Net在所有数据集上都实现了最先进的(SOTA)性能。
本工作有四个主要贡献:
(1) 我们提出了一种改进的、基于Gabor的可学习卷积方法,该方法简单高效,能够快速准确地提取纹理细节。
(2) 我们引入了几种Gabor滤波器的新优化措施,包括参数约束策略、幽灵图技术和网络架构改进。这些创新减轻了频率混叠等不利影响,促进了多维和多尺度特征提取,并降低了模型复杂性。
(3) 我们开发了一种纹理增强注意力机制,将统计纹理分析与位置编码相结合,提高了对低级纹理线索的敏感性。
(4) 提出的带材表面缺陷分类(SSDC-10)数据集包含了丰富的缺陷样本和纹理特征。在四个分类和检测基准测试上的广泛实验表明,LGTR-Net实现了最先进的性能和卓越的缺陷识别能力。
本文的其余部分结构如下:第2节讨论相关工作;第3节介绍LGTR-Net方法;第4节展示实验和模型性能分析;第5节总结本研究的重要性。