一种基于改进型可学习Gabor滤波器卷积的轻量级钢带缺陷纹理识别网络

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《COMPUTERS IN INDUSTRY》：A lightweight steel strip defect texture recognition network based on improved learnable Gabor filter convolution

【字体：大中小】 时间：2026年03月01日 来源：COMPUTERS IN INDUSTRY 9.1

编辑推荐：

　　针对传统卷积神经网络在钢铁带表面缺陷检测中存在的感知字段有限、频率混叠等问题，本文提出轻量级可学习Gabor纹理识别网络（LGTR-Net）。通过引入可学习的Gabor滤波器、Ghost Map技术及参数约束策略，优化了纹理特征提取能力，同时降低了模型复杂度。在自建SSDC-10数据集及三个公开数据集上的实验表明，LGTR-Net在准确率和速度上均达到最优水平。

黄月|陈臻|周迪|潘尔顺

上海交通大学工业工程与管理系，上海200240，中国

摘要

尽管自动视觉检测被广泛用于带材缺陷检测，但传统的卷积神经网络存在接收场有限和频率混叠的问题，这阻碍了缺陷纹理的准确识别。钢材缺陷纹理的多样性和复杂性使得在推理准确性和速度之间取得平衡变得困难。为了解决这些问题，我们提出了轻量级的Gabor纹理识别网络（LGTR-Net），该网络在缺陷纹理推理方面提高了准确性和效率。我们的贡献包括一种新颖的可学习Gabor滤波器，用于构建轻量级的卷积结构；一种幽灵图方法，用于进一步简化模型；以及受限的可学习滤波器参数。我们还引入了一种基于统计纹理和位置增强的新注意力机制。LGTR-Net在一个新提出的带材表面缺陷分类数据集以及三个额外的公共数据集上进行了评估。广泛的实验表明，LGTR-Net实现了先进的推理准确性和速度。代码可在以下链接获取：https://github.com/EtsuHuang/LGTR-Net。

引言

自动视觉检测（AVI）技术对于确保带材质量至关重要。带材表面存在不规则的多类缺陷会严重影响产品价值和生产安全（M. Li等人，2022年）。因此，快速识别缺陷和随后的过程控制是必要的（Huang等人，2025年）。手动视觉检测方法效率低下、成本高昂且存在安全风险。因此，需要一个高效的缺陷检测模型来提升现有AVI系统的性能。最近的进展，如YOLO系列检测器（Tian等人，2025年），显著扩展了工业AVI的适用性和实用性。

卷积神经网络（CNN）被广泛用于缺陷检测。尽管早期研究已经证明了高检测准确性（Kou等人，2021年；Liu等人，2023年），但在实际应用中仍存在较大差距。首先，传统CNN架构的推理速度较慢，导致缺陷检测往往是反应性的而非实时的（Hou等人，2023年；Ying等人，2022年）。此外，工业图像经常包含背景干扰，如镜面反射、雾或污渍，这要求模型能够区分缺陷特有的纹理特征和环境噪声（Huang等人，2025年）。缺陷本身通常表现出不规则、不均匀的纹理模式。然而，CNN通常以牺牲空间分辨率为代价来捕获具有大接收场的特征，从而导致无法充分表示细小的无序细节，限制了识别准确性（Zhu等人，2023年）。因此，将纹理敏感机制集成到CNN中对于提升缺陷感知能力至关重要。这样的模型应能有效融合局部纹理描述符和全局语义上下文，同时保持轻量级结构，以适应实际工业应用。

为了解决这一挑战，我们采用了改进的可学习Gabor滤波器来构建轻量级的特征提取模块，从而提高带材缺陷检测中的纹理识别能力。Gabor滤波器是纹理分析的常用方法（Zhu等人，2023年；Oh等人，2018年），它通过高斯核与正弦函数的调制来可靠地捕获空间和频率域信息（C. Li等人，2022年）。

Daugman证明Gabor滤波器类似于视觉皮层中简单细胞的接收场，能够精确提取局部纹理细节（Daugman，1985年）。此外，它们可调的频率参数可以对光谱内容进行显式控制，克服了传统CNN的频率偏差限制。这些滤波器还对光照变化、对比度和物体形态变化具有很强的鲁棒性，有助于多尺度、多方向的纹理提取，并减少噪声。在带材表面缺陷检测中，仔细调整Gabor参数至关重要，因为空间定位、方向敏感性和频率表示直接影响检测准确性（Bodnarova等人，2002年）。然而，手动设计的参数集（Luan等人，2018年；Liu等人，2018年）或仅依赖单个Gabor滤波器（Shi等人，2024年）在处理大小和复杂性多样的缺陷时往往限制了性能。

为了解决传统Gabor滤波器在参数配置、模型紧凑性和对噪声敏感性方面的局限性，我们提出了一种可学习Gabor滤波器框架，其中大多数参数是可训练的，而方向参数保持固定。我们进一步使用幽灵图技术简化了网络架构，并引入了参数约束策略以防止过滤过程中的能量溢出。然后，我们开发了一种缺陷纹理增强注意力机制，该机制结合了统计纹理分析和位置编码，从Gabor响应图中提取显著特征。基于这些组件，我们设计了LGTR-Net，这是一个由多个具有不同核尺寸的Gabor卷积层组成的轻量级骨干网络。这些精心设计的选择使得缺陷纹理的提取和检测既高效又有效。最后，我们提出了SSDC-10，一个新的带材表面缺陷分类数据集，包含十个缺陷类别，并在三个额外的基准测试上进行了广泛实验以验证LGTR-Net的有效性。得益于我们可学习Gabor滤波器的简化设计，LGTR-Net在所有数据集上都实现了最先进的（SOTA）性能。

本工作有四个主要贡献：

(1) 我们提出了一种改进的、基于Gabor的可学习卷积方法，该方法简单高效，能够快速准确地提取纹理细节。

(2) 我们引入了几种Gabor滤波器的新优化措施，包括参数约束策略、幽灵图技术和网络架构改进。这些创新减轻了频率混叠等不利影响，促进了多维和多尺度特征提取，并降低了模型复杂性。

(3) 我们开发了一种纹理增强注意力机制，将统计纹理分析与位置编码相结合，提高了对低级纹理线索的敏感性。

(4) 提出的带材表面缺陷分类（SSDC-10）数据集包含了丰富的缺陷样本和纹理特征。在四个分类和检测基准测试上的广泛实验表明，LGTR-Net实现了最先进的性能和卓越的缺陷识别能力。

本文的其余部分结构如下：第2节讨论相关工作；第3节介绍LGTR-Net方法；第4节展示实验和模型性能分析；第5节总结本研究的重要性。

整体结构

LGTR-Net的结构如图1所示。LGTR-Net在每个阶段使用多Gabor颈部（MGN）来构建特征提取模块。每个阶段包括一个步长为2的MGN和多个步长为1的MGN。给定一个大小为H×W×3的输入图像，首先通过3×3卷积提取低级特征表示。这些特征随后通过LGTR-Net的五个层次化阶段，每个阶段都包含具有不同级别和尺度的多Gabor模块（MGM）。

数据集

我们的实验使用了四个钢带表面缺陷数据集。首先，我们介绍了新编译的SSDC-10数据集，其中包含十个生产线缺陷类别，包括溢出（SP）、夹杂物（IN）、卷入氧化皮（RS）、粘铁（SI）、红铁片（RI）、斑点（PA）、划痕（SC）、冲压（PU）和边缘损伤（ED）。所有样本均来自热轧生产线。每种缺陷的典型形态如图4所示。图像大小为

结论

缺陷识别网络逐渐被应用于AVI系统中。对于纹理识别网络来说，平衡准确性和速度是一个挑战。本文提出了LGTR-Net来实现缺陷纹理识别。我们提出了一种轻量级的可学习Gabor卷积结构来提取纹理特征。辅助的幽灵图方法进一步简化了模块结构。可学习参数的范围经过调整，以减少频率混叠等负面影响。

CRediT作者贡献声明

黄月：撰写——原始草案、验证、软件、方法论、调查、形式分析。陈臻：撰写——审阅与编辑、资金获取、概念化。周迪：监督、数据管理。潘尔顺：资源协调、调查。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的竞争性财务利益或个人关系。

致谢

本工作部分得到了上海自然科学基金（资助编号：23ZR1428100）和上海市科学技术委员会科技创新计划（资助编号：22511103600）的支持。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号

摘要

引言

相关研究

相关工作

整体结构

数据集

结论

CRediT作者贡献声明

利益冲突声明

致谢

热点排行

新闻专题