基于增强特征融合与优化感受野的轻量级目标检测性能提升研究

《Neurocomputing》：Boosting lightweight object detection with enhanced feature fusion and optimized receptive field

【字体：大中小】 时间：2026年01月20日 来源：Neurocomputing 6.5

编辑推荐：

　　本文针对轻量级目标检测模型性能提升缓慢的问题，提出了一种结合混合池化卷积压缩激励模块（HP-CSE）和深度双阶段感受野模块（D2S-RFB）的优化方法。研究人员通过在多款先进YOLO系列轻量模型上集成这两个模块，显著提升了模型在MS COCO数据集上的平均精度（mAP），同时确保了在边缘设备（如NVIDIA Jetson Nano）上的实时推理速度。这项工作为在资源受限环境下实现高精度目标检测提供了有效的解决方案，具有重要的实际应用价值。

在计算机视觉领域，实时目标检测技术一直是研究的焦点，其目标是在低延迟条件下精确识别和定位图像或视频流中的物体。尽管基于深度学习的方法取得了显著进展，但在边缘设备上实现准确、实时的检测仍然是一个巨大的挑战。尤其令人关注的是，轻量级目标检测器的性能提升似乎进入了瓶颈期。数据显示，在416像素输入分辨率下，最新五款YOLO系列纳米级架构模型的平均性能提升仅为0.3%，其中提升最大的YOLOv12-n与YOLOv11-n之间也仅有0.8%的差距。这种微小的进步与实际应用中对高性能边缘计算的需求形成了鲜明对比，凸显了寻找有效突破口的紧迫性。

问题的根源可能在于现有轻量级模型架构的内在限制。传统的特征融合策略往往简单地将不同分辨率的特征图相加，忽视了不同尺度特征的重要性差异。同时，为了保持计算效率，模型主干网络通常大量使用小卷积核（如3x3），这限制了模型的感受野，导致其难以捕捉大范围上下文信息，从而影响了对大物体、遮挡物体以及复杂场景的检测能力。正是在这样的背景下，来自罗马尼亚克卢日-纳波卡技术大学计算机科学系的Dan-Sebastian Bacea和Florin Oniga开展了一项创新研究，旨在通过高效的模块化设计来突破轻量级目标检测的性能瓶颈。他们的研究成果发表在《Neurocomputing》期刊上，为边缘智能应用带来了新的希望。

为了达成研究目标，作者团队主要运用了深度学习模型架构设计与优化这一核心技术路径。他们并未依赖复杂的试剂或生物样本操作，而是专注于计算机算法和模块的创新。具体而言，研究的关键在于成功设计并验证了两个新颖的神经网络模块：混合池化卷积压缩激励模块（HP-CSE）和深度双阶段感受野模块（D2S-RFB）。研究过程涉及对多种主流轻量级目标检测框架（如YOLOv7-tiny, YOLOv8-n等）的深入分析，并在大规模公开数据集MS COCO上进行了系统的模型训练、验证和测试。性能评估则综合考量了检测精度（如mAP）、计算复杂度（如BFLOPS、参数量）以及在边缘硬件（NVIDIA Jetson Nano）上的实时推理速度（FPS）等多个维度。

研究结果

1. 模块设计与有效性验证

研究人员首先精心设计了HP-CSE和D2S-RFB两个模块。HP-CSE巧妙地融合了卷积压缩激励（CSE）和卷积块注意力模块（CBAM）的优点，采用混合池化（平均池化与最大池化）策略来生成更精细的通道权重，从而更有效地融合来自不同金字塔层级的特征。D2S-RFB则是在现有感受野模块（如CSP-CAM）的基础上进行优化，将所有标准卷积替换为深度可分离卷积以降低计算量，并创新性地引入了双阶段结构，第二阶段使用更大的卷积核（5x5）和扩张卷积来进一步扩大感受野。消融实验结果表明，HP-CSE在多种注意力机制中取得了最佳的精度-计算量权衡，而D2S-RFB则在保持较低参数量的前提下，实现了优于其他感受野模块的性能提升。

2. 跨架构通用性证明

为了证明所提模块的普适性，研究人员将其集成到了六种最新的轻量级目标检测器架构中，包括YOLOv7-tiny、YOLOv8-n、YOLOv9-t、YOLOv10-n、YOLOv11-n和YOLOv12-n。对于每种架构，他们按照统一的方法论插入模块：在主干网络起始处添加一个D2S-RFB模块，在颈部网络的特征融合点后添加多个HP-CSE模块。实验结果显示，所有集成新模块的模型均实现了显著的检测精度提升。例如，改进后的YOLOv7-tiny在MS COCO数据集上的mAP_50:95从基准的52.7%提升至56.5%，提升了3.8个百分点；最新的YOLOv12-n的mAP_50:95也从48.2%提升至50.1%。这表明HP-CSE和D2S-RFB能够有效增强不同架构模型的特征表示能力，具有良好的跨架构通用性。

3. 性能对比与优势分析

与单纯增加模型容量（如倍增主干网络前几层的卷积核数量）的策略相比，引入HP-CSE和D2S-RFB带来了更显著的性能增益。在参数量和计算量相近的情况下，采用新模块的模型其mAP提升幅度平均是单纯增加容量模型的3倍。与国内外其他先进的轻量级目标检测器（如NanoDet、PP-PicoDet、ECF-YOLOv7-tiny等）相比，集成新模块的YOLOv7-tiny在输入分辨率为416时取得了领先的检测精度（mAP_50:95达到56.5%），同时在国际通用的NVIDIA Jetson Nano边缘计算设备上仍能保持约8-9 FPS的实时处理速度，证明了其优异的实用价值。

4. 泛化能力与鲁棒性评估

研究还评估了模型在分布外数据上的泛化能力。将在MS COCO上训练的模型直接用于PASCAL VOC 2007数据集的测试，结果显示改进后的模型相比原模型有显著提升，证明了其更强的泛化性。更重要的是，在专门评估遮挡鲁棒性的COCO-OLAC数据集上，改进后的模型在所有遮挡级别（低、中、高）上都表现出了更好的性能，尤其是在高遮挡情况下，YOLOv7-tiny的改进模型其AP值提升了4.9%，召回率提升了5.0%。这表明扩大感受野和优化特征融合有助于模型更好地处理部分遮挡的物体，提升了在复杂场景下的检测可靠性。

结论与意义

本研究成功提出了HP-CSE和D2S-RFB两个高效模块，系统地解决了轻量级目标检测模型在特征融合和感受野方面的局限性。通过一种通用的集成方法论，这些模块被证明能够显著提升多种先进YOLO轻量版模型的检测精度，同时将其计算开销控制在边缘设备可接受的范围内。研究的创新之处在于不仅提升了模型性能，更在于提供了一种可复用的、模块化的增强思路，而非针对单一模型的特定优化。

这项工作的意义重大。首先，它为在资源受限的边缘设备上部署更高精度的目标检测模型提供了切实可行的技术方案，推动了边缘AI技术的发展。其次，所提出的模块设计思想，如混合池化注意力机制和深度可分离双阶段感受野扩展，对后续的轻量级网络结构设计具有重要的启发意义。最后，详尽的实验分析，包括跨架构验证、与模型扩容对比、泛化性及遮挡鲁棒性测试，为研究成果提供了坚实的证据支撑，增强了结论的可信度。尽管模块在极端条件（如严重雾霾、极低对比度）下的检测能力仍有提升空间，但本研究无疑为轻量级目标检测的性能突破迈出了坚实的一步，为自动驾驶、智能监控、移动机器人等众多实际应用场景带来了新的可能性。

热点排行

新闻专题