《Pattern Recognition Letters》:Lightweight moment-residual-coherent patterns for image recognition
编辑推荐:
这篇论文综述提出了一种高效的轻量级CNN模型CaretNet,其核心是引入了新颖的矩-残差-相干特征(MRCF)感知块,以解决轻量模型空间特征多样性不足及聚合信息用于恒等映射的缺陷。通过创新性的增加矩与减少矩自适应残差机制,该网络能在不增加模型复杂性的前提下,有效利用聚合空间特征,显著提升了图像识别的性能。
亮点
- •
一个强大的MRCF感知块,可高效捕获交织模式的一致性以供学习过程使用。
- •
新颖的自适应通道缩放残差,以适应主干网络中MRCF块的信道弹性矩。
- •
一种高效的聚合空间特征恒等映射,且不增加计算复杂度。
- •
一个浅层主干网络根据MRCF的信道弹性矩进行设计。
- •
实验结果验证了CaretNet相较于其他轻量级网络的卓越性能。
1. 轻量级卷积算子
为在轻量级模型中构建用于特征提取的感知块,深度可分离(Depthwise)卷积和点卷积(Pointwise)通常用于给定张量 Tin∈ RCin× H × W,其中 Cin是 Tin的通道数,H × W 代表其空间维度。实际上,深度卷积是一种可分离操作,在 Tin的每个通道 cj∈ R1 × H × W上进行卷积以提取空间特征:Tdw= cj* ηj,其中 ηj是一个 1 × k × k 的卷积核;j = 1, …, Cin。由于可分离卷积,深度卷积张量 Tdw与 Tin具有相同的通道数。请注意
2. 提出的方法
为了缓解特征提取中的空间信息遗漏以及聚合空间信息用于恒等映射的缺陷,我们提出了一种新颖的感知模型来挖掘张量的矩-残差-相干特征(详见图1概览)。此后,将详细阐述这一重要提案。
3. 数据集与学习设置
为了评估我们基于MRCF的特征的鲁棒性,CaretNet将在用于图像识别的基准数据集上进行验证。为了客观评估,我们使用了流行的设置:初始学习率 lr = 0.1;使用带动量(momentum)= 0.9 和权重衰减(weight-decay)= 10-4的SGD优化器。其他设置根据数据集的特定属性进行分配。
CIFAR 数据集包含两个32×32图像的子集,如下所述。CIFAR-10包含60k张图像,分为10类,其中50k个样本用于
4. 结论
我们提出了一种高效的轻量级模型,用于挖掘多样化深度卷积特征的矩-残差-相干信息。具体而言,我们提出了一种新颖的MRCF感知块,以实现互补组分的判别性融合。为了适应MRCF块的信道弹性矩,我们提出了矩残差,它利用了点卷积算子的扩展灵活性以及融合张量的聚合空间特征。随后,CaretNet