基于对您提供的文档《HDA-YOLO: a hierarchical and densely-fused attention network for rice pest detection in complex agricultural environments》的深入分析,以下是我的逐一解答。 中文标题 分层密集融合注意力网络HDA-YOLO:赋能复杂农田场景下水稻病虫害智能检测

《Frontiers in Plant Science》:HDA-YOLO: a hierarchical and densely-fused attention network for rice pest detection in complex agricultural environments

【字体: 时间:2026年03月03日 来源:Frontiers in Plant Science 4.8

编辑推荐:

  这篇研究提出了一种创新的HDA-YOLO模型,针对复杂田间环境中水稻害虫检测的鲁棒性与精度挑战。该工作通过在骨干网络中引入非对称动态下采样(ADDS)与多级级联预融合(MCPF)模块以增强特征保真度,并构建了由层次化注意力机制(ISAM/ICAM)驱动的HADF-Net(Hierarchical Attention-Driven Dense Fusion Network)实现动态、内容感知的特征融合。实验表明,该模型在保持轻量化架构(3.93M参数,12.02 GFLOPs)的同时,在多个核心指标上显著优于基准模型YOLOv8n,并在微信小程序中成功部署,为智慧水稻农业的病虫害实时监测提供了高效精准的解决方案。

  
在全球粮食安全面临严峻挑战的背景下,水稻作为最重要的主粮作物之一,其产量稳定受到病虫害的严重威胁。实现快速、精准的病虫害识别与监测,是病虫害防控的核心环节,对智慧农业的发展至关重要。然而,直接将现有模型应用于真实的农田环境,其性能受到一系列固有挑战的制约:信息保真度问题导致小目标特征在卷积神经网络(CNN)的逐层下采样中丢失;特征可辨别性问题则源于害虫与水稻茎叶颜色纹理的相似性所带来的自然伪装;而效率与精度之间的权衡,则为模型在移动或边缘设备上的实时部署带来了困难。为了系统性、协同地解决这些挑战,本研究提出了一种轻量级、高性能的目标检测模型——HDA-YOLO(Hierarchical and Densely-fused Attention YOLO),其核心设计理念是通过对网络的特征提取、特征融合和特征解释三个关键阶段进行系统性、协同性优化,以实现信息流在整个网络中的保真度与交互效率最大化。
具体而言,研究团队构建了一个更具挑战性的自定义数据集RicePest_12,该数据集包含2,807张高质量图像,覆盖了亚洲稻螟、褐飞虱、稻秆蝇等12种常见水稻害虫类别,并对数据进行了扩充以平衡样本分布。基于此数据集,HDA-YOLO在YOLOv8架构基础上引入了四项协同创新的核心模块。在骨干网络部分,非对称动态下采样(ADDS)模块通过平均池化后将特征通道一分为二,分别通过包含Omnidimensional Dynamic Convolution(ODConv)的动态卷积下采样分支和包含SimAM注意力机制的显著特征保留分支并行处理,再通过拼接生成具有更高信息保真度的下采样特征图。多级级联预融合(MCPF)模块则接受了来自骨干网络多个阶段(P2, P3, P4, P5)的特征图作为并行输入,通过“下采样-融合”的级联工作流,逐步将高分辨率特征整合到更深层的特征流中,从而在特征输入检测颈前生成一个更全面、细节更丰富的特征图。
在颈部网络,HDA-YOLO构建了由层次化注意力机制驱动的密集融合网络(HADF-Net)。该网络在结构上采用了比BiFPN(Bidirectional Feature Pyramid Network)更密集、跨度更广的跨层“捷径”,在机制上则受到Transformer的启发,通过部署不同层级的特定注意力类型来实现动态特征增强与融合。首先,尺度内自注意力模块(ISAM)用于在特征进入融合路径前,对每一层级的特征进行全局上下文增强。随后,在颈部网络的融合节点,尺度间交叉注意力模块(ICAM)利用深层特征作为“查询”,来动态“探测”并整合已对齐的浅层特征信息。这种“先增强,后选择”的设计,使HADF-Net能够根据输入内容智能地调整信息流。同时,为了进一步增强网络在特征融合时的多尺度分析能力,模型颈部中的C2f模块被升级为多尺度上下文(MSC)模块。该模块采用多分支并行结构,通过使用不同尺寸的组卷积核提取多粒度特征,以形成多个不同感受野的子空间,使其能更好地适应目标尺度的变化。
通过消融实验的系统性验证,研究表明MCPF、ADDS、HADF-Net和MSC这四个模块各自贡献了独特且关键的性能增益,并协同工作,共同推动模型整体性能的跃升。在完整的HDA-YOLO模型中,精确度(Precision)达到0.910,召回率(Recall)达到0.856,mAP@50(mean Average Precision at IoU threshold 0.5)达到0.900,F1分数(F1-score)达到0.882,在多项核心指标上均超越了包括EfficientDet-D0、基于Transformer的RT-DETR-R18以及YOLOv5n、YOLOv8n、YOLOv9t、YOLOv11n在内的多种主流轻量级目标检测模型。特别值得关注的是,与RT-DETR-R18相比,HDA-YOLO在计算成本(GFLOPs)和参数数量(Parameters)分别仅为前者的约22%和20%的情况下,mAP@50反而高出4.8个百分点,充分展示了在卷积神经网络(CNN)架构内进行深度优化的卓越效率。相较于在参数量上极致优化的YOLOv9t,HDA-YOLO以适度的资源投入(3.93M vs. 2.01M参数)换取了近5个百分点的mAP@50性能优势。而与计算复杂度最低的YOLOv11n相比,HDA-YOLO在仅轻微增加计算成本的情况下,将Precision、Recall和mAP@50分别从82.8%、77.1%和84.3%提升至91.0%、85.6%和90.0%,展现出更优越的性能与效率权衡。
定性的检测结果对比和混淆矩阵(Confusion Matrix)分析进一步证实,HDA-YOLO在多个复杂场景下均表现出显著优越性,特别是在检测小而密集的目标、以及区分背景与形态相似目标方面,展现出更强的鲁棒性,有效解决了其他模型中存在的漏检、误检和边界框定位不准确等问题。然而,分析也指出,在应对极端伪装条件和对非常小的目标进行细粒度识别方面,模型仍有优化空间。为增强模型的可解释性,研究还通过Grad-CAM(Gradient-weighted Class Activation Mapping)技术生成了比较特征热力图。与标准模块相比,MCPF模块生成的特征图激活区域更集中,能有效覆盖目标关键区域;MSC模块的激活区域则更紧凑,能更准确地聚焦于害虫目标,有效区分关键与非关键区域;而HADF-Net则展示了对特征图进行端到端优化、逐步细化的完整过程。
综上所述,本研究提出的HDA-YOLO模型通过深度耦合非对称动态下采样、多级级联预融合、层次化注意力驱动的密集融合网络以及多尺度上下文模块,构建了一个端到端的协同特征演化架构,成功解决了复杂田间环境下水稻害虫检测的关键挑战。该模型在保持轻量级架构的同时,实现了检测精度与效率的卓越平衡,为智能农业监测场景提供了一种具有显著应用潜力的高精度解决方案,并已在微信小程序中成功部署,展现了其在田间实时精准识别害虫方面的实际应用价值。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号