《Smart Agricultural Technology》:MEGE-DETR: A Multi-scale Edge Generation and Enhancement Detection Transformer with Wavelet Transform for Small-object Pest Detection
编辑推荐:
本文针对田间复杂场景下密集小目标害虫检测存在的边缘模糊、特征弱等难题,提出了一种基于RT-DETR的MEGE-DETR模型。通过设计多尺度边缘生成融合网络MEGFNet、极性感知线性注意力编码器PLAE和可学习多波段小波上采样LMWU模块,显著提升了模型对害虫边缘细节的捕捉能力。实验结果表明,该模型在mAP@0.5和mAP@0.5:0.95指标上分别达到96.5%和77.3%,参数量仅11.9M,检测速度达106 FPS,为智慧农业中的害虫精准监测提供了高效解决方案。
在全球粮食安全面临严峻挑战的背景下,农作物病虫害每年导致约20%的产量损失,成为制约农业生产的主要因素。随着人口增长和气候变化,病虫害爆发频率增加,对农业可持续发展构成严重威胁。传统害虫检测方法依赖人工巡查,效率低下且易漏检,而基于机器学习的检测方法又存在特征提取能力有限、泛化性差等问题。尤其对于田间环境中的密集小目标害虫,其边缘模糊、特征微弱、背景复杂等特点,使得现有检测模型往往表现不佳。
当前,基于卷积神经网络(CNN)的目标检测模型如YOLO系列虽在实时性方面具有优势,但对小目标害虫的检测精度有限;而基于Transformer的DETR模型虽具有全局建模能力,却存在计算复杂度高、训练收敛慢等问题。RT-DETR虽在实时性方面有所改进,但在密集小目标场景下仍存在边缘信息提取不足、特征表示不充分等缺陷。
针对这些挑战,河南理工大学计算机科学与技术学院的研究团队在《Smart Agricultural Technology》上发表了一项创新研究,提出了一种名为MEGE-DETR的多尺度边缘生成与增强检测Transformer模型。该研究通过三个核心技术创新,实现了小目标害虫检测精度与效率的显著提升。
关键技术方法
研究团队构建了包含5类田间害虫、378张图像、19,422个标注实例的数据集。模型采用MEGFNet作为主干网络,通过多尺度边缘生成器(MEG)和边缘融合模块(EFM)增强边缘特征提取;引入PLAE编码器,基于PolaFormer机制保留特征计算中的负值信息;设计LMWU上采样方法,通过四组可学习滤波器融合不同子带特征,有效保留高频边缘信息。模型在保持轻量化(参数量11.9M)的同时,实现了106 FPS的检测速度。
研究结果
3.1. 多尺度边缘生成与融合网络
通过设计的新型特征提取主干网络MEGFNet,显著提升了模型对边缘细节的捕捉能力。该网络包含多尺度边缘生成器(MEG)和边缘融合模块(EFM),能够生成不同尺度的边缘特征图(VE3、VE4、VE5),并与主干网络提取的语义特征进行有效融合。实验表明,该设计将模型参数量降至基线模型的37.1%,同时使mAP@0.5提升1.8%。
3.2. 极性感知线性注意力编码器
提出的PLAE模块解决了传统注意力机制中负值特征丢失的问题。通过将查询和键分解为正负分量,并采用四种不同的交互方式(正-正、负-负、正-负、负-正),显著增强了模型对纹理和边缘特征的敏感性。该改进使mAP@0.5:0.95指标提升达6.2%。
3.3. 可学习多波段小波上采样
LMWU模块通过四组不同的滤波器(LL、LH、HL、HH)进行反卷积上采样,有效保留了图像的高频边缘信息。与传统上采样方法相比,该方法显著减轻了细节模糊问题,提升了小目标特征的重建质量。
4.4. 先进检测器性能比较
在与主流检测模型的对比实验中,MEGE-DETR在各项指标上均表现最优。其mAP@0.5达到96.5%,mAP@0.5:0.95达到77.3%,显著高于YOLO系列和DETR系列的其他模型。特别是在参数量(11.9M)和计算复杂度(39.2 GFLOPs)大幅降低的同时,实现了106 FPS的实时检测速度。
4.5. 检测结果可视化对比
在不同密度和干扰程度的场景测试中,MEGE-DETR均表现出优异的检测性能。在高密度害虫场景下,该模型能够准确区分相邻害虫,避免漏检和重复检测;在存在其他昆虫干扰的场景中,能有效抑制非目标干扰,显示出更强的鲁棒性。
4.6. Grad-CAM可视化结果对比
通过梯度加权类激活映射(Grad-CAM)分析表明,MEGE-DETR能够更精准地将注意力集中在目标害虫区域,避免了对背景或其他昆虫的误关注。在复杂场景下,其注意力分布更加集中和准确,这是其获得优异检测性能的重要原因。
4.7. 统计实验分析
箱形图统计结果显示,MEGE-DETR在不同测试场景下均保持稳定的高性能,其mAP@0.5:0.95的中位数达到75%,且数据分布集中,方差小,证明了模型具有良好的泛化能力和鲁棒性。
研究结论与意义
该研究提出的MEGE-DETR模型通过创新性地整合边缘增强、注意力机制优化和多波段上采样等技术,有效解决了小目标害虫检测中的关键难题。模型在保持轻量化的同时,实现了精度和速度的显著提升,为智慧农业中的害虫实时监测提供了可靠的技术方案。研究成果对推进农业智能化、减少农药使用、保障粮食安全具有重要意义,为复杂田间环境下的病虫害精准防控提供了新的技术路径。
未来研究方向包括扩展数据集多样性、验证模型在不同农业场景下的适应性,以及推动模型在实际农业生产中的部署应用。该技术有望在更大范围的智慧农业应用中发挥重要作用,为可持续农业发展提供技术支持。