在复杂环境中,通过改进的YOLOv8结合小目标识别技术实现头盔佩戴检测

【字体: 时间:2026年03月13日 来源:Digital Signal Processing 3

编辑推荐:

  提出基于改进YOLOv8的MMAE-YOLOv8模型,通过C2f-MSEFA、MSAC、ASF-FS和EELD模块优化多尺度特征融合与边缘检测,有效提升复杂环境下小目标及部分遮挡头盔的检测精度。

  
魏张|杜一淼|吴志恒
安徽工业大学电气与信息工程学院,马鞍山,243000,中国

摘要

本文提出了一种新型的头盔佩戴检测模型,该模型结合了改进的YOLOv8算法和小目标识别技术,称为多尺度多模块增强YOLOv8(MMAE-YOLOv8),旨在解决在建筑工地等复杂环境中由于小目标、部分重叠和部分遮挡导致的目标检测漏检问题。首先,引入了坐标到特征的多尺度边缘感知特征聚合(C2f-MSEFA)模块,以替代传统的C2f模块,从而增强边缘特征提取和多尺度融合能力。其次,提出了多尺度注意力卷积(MSAC)模块,替代了空间金字塔池化快速(SPPF)模块,有效捕捉多尺度上下文信息。第三,设计了注意力尺度序列融合特征选择(ASF-FS)结构,该结构结合了坐标到特征的多尺度边缘感知特征选择(C2f-MSEAFS)模块和优化的P2检测层,使模型能够同时有效捕捉全局上下文和局部细节,从而提高小目标检测能力并增强对复杂视觉模式的理解。最后,开发了高效通道注意力增强轻量级检测(EELD)头部结构,在提高检测性能的同时降低计算成本。在Safety HELmet 5K(SHEL5K)数据集上的实验表明,MMAE-YOLOv8在复杂背景下的头盔佩戴检测中表现出色,尤其是对于小目标和部分遮挡的目标。

引言

在建筑工地和矿场等高风险环境中,外部力量或掉落物体的冲击可能导致严重的脑损伤甚至死亡。佩戴头盔可以显著降低头部受伤的风险。传统的头盔佩戴检测主要依赖于人工检查,但这存在许多局限性。首先,人工检查无法确保对整个建筑工地的持续监控;其次,人工检查的结果受到检查人员主观判断的影响;此外,过度依赖人工检查效率低下且人力和管理成本较高。
近年来,基于深度学习的对象检测在计算机视觉领域受到了广泛关注,在人体姿态估计和行为识别[1][2][3]、细粒度分类[4][5][6]以及工业检测[7][8]等应用中取得了显著成果。随着对工业安全监控需求的增加,头盔佩戴检测已成为重要的研究焦点[9][10]。尽管头盔佩戴检测技术取得了显著进展,但在复杂环境中的实际应用仍面临挑战。一些代表性研究已经针对这些问题进行了探索。早期方法(如Park等人[11])使用HOG特征与支持向量机(SVM)结合进行头盔检测,证明了传统基于特征的方法的可行性,但在复杂环境中的准确性有限。随后,基于CNN的方法成为主流,Xie等人[12]使用卷积神经网络实现实时检测,但其在小目标或远距离目标上的性能有限;Fang等人[13]采用了高精度和高速的Faster R-CNN框架来提高检测准确性,尽管部分遮挡的头盔仍难以检测;Wu等人[14]提出了一种基于单阶段的SSD和反向渐进式注意力机制的CNN,实现了智能特征选择和融合以增强边界框预测;Mneymneh等人[15]开发了一种基于运动的方法来检测工人头部的头盔存在情况,实现动态监控。为了平衡准确性和效率,出现了轻量级CNN方法:Deng等人[16]提出了ML-YOLOv3,结合CSPNet和GhostNet构建了高效的残差网络;Shan等人[17]将高效通道注意力(ECA)和加权双向特征金字塔网络(BiFPN)集成到YOLOv5中,以增强多尺度特征融合。最近,Zhang等人[18]提出了一种基于视频的头盔检测方法,通过跨连续帧聚合信息实现持续和稳健的监控。
尽管取得了这些进展,现有的头盔佩戴检测方法在复杂背景干扰下仍难以准确识别小规模和部分遮挡的头盔。为了解决这些问题,本文提出了一种改进的基于深度学习的头盔佩戴检测模型MMAE-YOLOv8,该模型增强了多尺度特征表示和线索感知信息聚合能力。本文的主要贡献如下:
  • (1)
    C2f-MSEFA模块替代了主干网络中的标准C2f结构,增强了边缘特征提取并促进了多尺度特征融合。
  • (2)
    提出了多尺度注意力卷积(MSAC)模块,该模块结合了多尺度膨胀卷积和高效通道注意力机制,有效捕捉了多尺度上下文信息。
  • (3)
    开发了一种名为ASF-特征选择(ASF-FS)的新型颈部结构,以提高小目标检测性能。
  • (4)
    提出了ECA增强轻量级检测头部结构,替代了原有的检测头部,有效减少了参数数量和计算复杂度,同时提高了准确性。
  • 章节片段

    YOLOv8算法

    YOLOv8[19]代表了实时对象检测领域的重大进展。它由三个主要部分组成:主干网络、颈部结构和检测头部。YOLOv8的整体架构如图1所示。

    方法

    本文介绍了MMAE-YOLOv8,这是一种改进的YOLOv8变体,旨在提高复杂环境中小目标和部分遮挡目标的头盔佩戴检测能力。首先,本文提出了坐标到特征的多尺度边缘感知特征聚合(C2f-MSEFA)模块,以替代主干网络中的原始C2f模块,从而更好地捕捉细粒度细节,适应复杂背景,并提高整体检测性能。

    数据集

    本文使用了Safety HELmet数据集,该数据集包含5000张图像(SHEL5K),它是SHD数据集的增强版本。该数据集包含5000张图像及其对应的注释文件,涵盖了六个类别的75,578个标注实例:头盔、戴头盔的头部、戴头盔的人、头部、不戴头盔的人和面部[30]。SHEL5K数据集可在以下链接公开获取:https://universe.roboflow.com/database-sjrvw/shel5k-new

    结论

    现有的头盔佩戴检测算法在复杂背景下难以准确识别小目标和部分遮挡的目标。为了解决这一限制,本文提出了一种结合改进YOLOv8算法的小目标识别新型头盔佩戴检测模型。具体来说,本文提出了坐标到特征的多尺度边缘感知特征聚合模块,替代了传统的C2f模块,从而提高了边缘特征提取和多尺度融合能力。

    CRediT作者贡献声明

    魏张:概念化、方法论、软件开发、初稿撰写。杜一淼:数据整理、可视化、调查、撰写——审阅与编辑。
    吴志恒:方法论、形式分析、调查、撰写——审阅与编辑、监督。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号