一种轻量级、基于颗粒感知特征金字塔的网络,具有上下文感知能力,用于小型交通标志检测

《Expert Systems with Applications》:A Lightweight Granular Perception Feature Pyramid Network with Context-aware for Small Traffic Sign Detection

【字体: 时间:2026年03月06日 来源:Expert Systems with Applications 7.5

编辑推荐:

  针对小目标检测中的空间信息退化、语义模糊和特征不稳定性问题,提出LGP-FPN特征金字塔网络,结合尺度保持与上下文感知机制,增强细粒度空间信息与高阶语义的融合,并构建LGP-YOLO检测框架,在TT100K和CCTSDB数据集上精度分别达91.6%和93.8%,优于YOLOv8 7.9%和5.4%。

  
张岩|毕登峰|黄青青|韩燕|赵明航
教育部工业物联网与网络控制重点实验室,重庆邮电大学,重庆,400065,中国

摘要

交通标志检测在智能交通系统和自动驾驶中发挥着至关重要的作用,但由于大多数标志本身是小型物体,因此检测起来仍然具有挑战性。这些小物体容易在空间信息上出现退化,在特征融合过程中产生语义模糊,并且在动态驾驶环境中特征稳定性不足。尽管深度学习提高了检测性能,但传统的特征金字塔结构(如FPN、PAN和Bi-FPN)难以在不同尺度上保留细粒度的空间细节,导致小标志的检测遗漏。本文提出了轻量级的颗粒感知特征金字塔网络(LGP-FPN),这是一种具有尺度保持和上下文感知机制的新型特征融合架构。以往的特征融合网络主要依赖于重复的下采样和密集的横向连接,这往往会导致细粒度空间信息的丢失以及特征辨识度的降低。相比之下,LGP-FPN通过尺度一致的上采样和上下文引导的聚合逐步整合高级语义信息,从而在语义抽象和空间精度之间实现了更好的平衡。LGP-FPN中嵌入了扩张感受野聚合模块(DRFAM),该模块能够在计算成本仅略有增加的情况下扩大感受野,从而增强多尺度特征融合能力。基于LGP-FPN,我们开发了LGP-YOLO,这是一种兼具高精度和实时效率的轻量级检测器。在TT100K和CCTSDB数据集上的评估表明,LGP-YOLO的准确率分别达到了91.6%和93.8%,比YOLOv8高出7.9%和5.4%,验证了所提出方法的优越性。

引言

自动驾驶通过无缝集成感知、定位、决策和控制等关键技术来实现安全高效的导航。其中,交通标志检测(TSD)在感知系统中起着重要作用,因为它提供了诸如速度限制和禁止等关键的监管和警告信息,直接指导驾驶行为并确保交通合规性。
在实际驾驶环境中,交通标志检测器必须尽早识别标志以确保有足够的反应时间和安全性。由于图像分辨率和相机距离的限制,大多数标志在检测时呈现为小物体,如图1所示。在自动驾驶中,这一挑战更加严峻,因为高频数据处理要求及时且高度准确的检测。检测这些小物体面临重大挑战:标志通常缺乏足够的像素信息,容易受到背景杂乱或遮挡的影响,并且在多阶段特征处理过程中可能会丢失。TT100K中的数据分布凸显了这一难题。根据该领域的常见标准,面积小于32×32像素的物体被视为小物体。如图2所示,小物体在TT100K中占大多数。由于像素信息极少,小物体的判别特征几乎消失,对环境噪声的敏感性增加,且对定位精度的要求极高,少数像素的偏差就可能导致检测失败。考虑到数据集中即使是“大”标志也相对较小,因此需要网络保持极高的分辨率,这使得提高小尺度交通标志的检测精度同时保持实时性能成为研究重点。
随着深度学习的兴起,物体检测已经发展成能够同时学习判别特征并执行分类和定位的端到端框架。开创性模型如DINO(张等人,2022a)和RT-DETR(赵等人,2024)实现了显著的准确率,而像YOLOv10(王等人,2024a)和RTMDet(吕等人,2022)这样的单阶段检测器则通过简化架构实现了实时性能。然而,尽管取得了显著进展,标准检测器在复杂交通场景中处理小物体时仍会出现性能大幅下降。根本原因在于深度层对细粒度空间线索的保留不足,以及网络深度、语义抽象和推理速度之间的权衡,这限制了检测器对小尺度标志的空间精度保持能力。
为了解决交通标志检测任务的需求,研究人员提出了各种改进策略,主要集中在增强目标特征提取和优化特征融合上。然而,现有证据表明,仅增强主干特征提取对小物体检测的收益有限,因为细粒度空间细节在深层中往往会消失(Liew、Lim、Tan、Mohar,2025;Liu、Hu、Lin、Yao、Xie、Wei、Ning、Cao、Zhang、Dong等人,2022)。与单独改进主干提取不同,融合层结合了空间和语义线索来有效恢复小物体特征。由于主干增强和特征融合的互补优势和局限性,近期研究越来越多地关注优化融合阶段,这已成为检测网络中特定任务和性能的关键部分。在优化特征融合方面,研究人员主要关注增强不同尺度和语义层次特征之间的信息互补性和协作表达能力。为此,提出了各种改进策略,例如引入双向特征金字塔网络(Bi-FPN)(Tan、Pang、Le,2020)、动态特征融合模块(DFFM)(Xie、Cui、Tan、Zheng、Yu,2024b)、自适应空间特征融合(ASFF)(Liu、Huang、Wang,2019)和注意力引导的融合模块(Ren、Xia、Weng、Hu、Lin,2024),以加强高级语义特征和低级位置信息的有效融合。尽管这些方法在一定程度上提高了多尺度特征的检测精度,但它们对交通标志中小物体的检测能力仍然有限。虽然大多数之前的改进都集中在通过结构优化特征融合上,但它们往往忽略了现实世界场景中自然存在的上下文依赖性。
为了弥补传统特征融合方案中缺乏上下文建模的问题,本文基于上下文感知范式进行开发,该范式整合了多尺度空间和语义线索,以增强小交通标志的识别和定位。在实际交通环境中,视觉理解不仅依赖于标志本身的局部外观,还依赖于其周围环境,后者为准确感知提供了必要的语义信息。通过共同建模这些上下文关系,所提出的上下文感知特征融合机制使网络能够捕捉多尺度上的空间-语义相关性。与独立处理特征的常规融合策略不同,这种设计促进了细粒度感知,并允许检测器利用小标志的关联上下文来推断缺失或模糊的细节。
基于这一洞察,提出的LGP-FPN将上下文感知融入到保持尺度的融合路径中,有效结合了局部细节保持和全局语义推理。通过将这种特征融合范式整合到整体检测架构中,我们进一步开发了LGP-YOLO,这是一个轻量级且鲁棒的框架,旨在在复杂交通环境中实现高精度和实时效率。主要贡献可以总结如下:
  • 1.
    LGP-FPN是我们框架的核心。与具有重复下采样和横向连接的传统特征金字塔不同,LGP-FPN采用保持尺度的自上而下的路径,并通过渐进式上采样进行融合。这通过上下文感知聚合保持了空间分辨率和语义一致性,提高了小物体的检测能力,同时减少了参数和计算成本。
  • 2.
    我们设计了DRFAM模块,该模块使用扩张卷积来扩大感受野,而不引入计算开销,使网络能够在保留小物体细节的同时捕获更丰富的上下文线索,并保持全局语义。
  • 3.
    设计的LGP-YOLO是一个轻量级的交通标志检测框架,它继承了YOLO系列的经典三阶段结构,并将LGP-FPN作为其核心。通过结合上下文感知和保持尺度的特征融合策略,该框架有效增强了小规模和多尺度交通标志的表示能力,同时保持了高精度并降低了计算成本。

部分片段

交通标志检测

交通标志检测方法的发展大致可以分为三个阶段:传统图像处理、基于机器学习的方法和基于深度学习的检测。
在传统阶段,检测依赖于颜色和形状等低级特征。常用的技术包括HSV空间中的颜色分割、边缘检测和模板匹配。虽然计算效率高,但这些方法在光照变化的情况下表现不佳,

方法

开发的LGP-YOLO是一个轻量级的交通标志检测器,配备了专门设计的特征融合结构LGP-FPN,增强了其在多尺度和小物体检测方面的能力。本节介绍了轻量级颗粒感知网络用于交通标志检测的动机和设计原则,随后详细解释了LGP-FPN和LGP-YOLO的架构。

数据集描述

为了全面评估所提出方法的有效性和泛化能力,我们在两个广泛使用的交通标志数据集TT100K(朱等人,2016)和CCTSDB2021(张等人,2022b)上进行了实验。

结论

本文提出了LGP-YOLO,这是一个针对小尺度交通标志检测的轻量级且具有上下文感知能力的检测框架。所提出的LGP-FPN引入了保持尺度和语义一致性的融合策略,使网络能够在不同尺度上保留细粒度的空间信息并整合高级语义。同时,DRFAM通过不同速率的感受野聚合增强了上下文感知,从而加强了

作者声明

张岩:本研究的概念构思、方法论、撰写与审稿。毕登峰:概念构思、调查、方法论、原始草稿准备。黄青青:撰写与审稿、验证。韩燕:数据整理、形式分析。赵明航:撰写与审稿、验证。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号