《Smart Agricultural Technology》:Dycorn-YOLO11: Dynamic feature alignment and lightweight optimization for real time field deployable corn disease detection
编辑推荐:
为应对田间多变环境对玉米病害精准、快速识别的挑战,并克服现有深度学习模型在计算成本与实时部署间的矛盾,研究者提出Dycorn-YOLO11。该模型基于双动态特征捕获架构设计,融合在线卷积重参数化块(OREPA)与动态头(DyHead)及动态上采样(Dysample),辅以“通道剪枝+知识蒸馏”轻量化流程,显著提升了对小尺寸、低对比度病斑的检测能力。实验表明,优化后模型在精度、召回率与mAP指标上均超越基准模型YOLO11n,同时模型参数量与体积大幅压缩,推理速度显著提升,并在外部复杂数据集及静/动态田间实验中保持了高性能与稳定性,为玉米田间精准喷施提供了坚实的技术基础。
玉米是全球最重要的主粮作物之一,对全球粮食供应和农业经济至关重要。然而,病害的威胁始终是其产量和品质的“隐形杀手”,如北方玉米叶枯病、灰斑病、锈病等。传统的病害识别方法严重依赖农业专家的田间目视检查,不仅耗费大量人力,而且长时间、高强度的作业容易导致疲劳,影响诊断的准确性。而实验室的病原菌样本分析虽然精确,但流程复杂、设备昂贵,从采样到结果往往耗时数天甚至数周,难以满足田间即时防控的需求。随着技术的发展,基于深度学习的对象检测方法,特别是YOLO系列,因其在精度和实时性之间取得的良好平衡,已成为移动端和嵌入式病害检测的有力候选方案。然而,在复杂多变的自然田间环境下,模型仍面临诸多挑战:多数模型训练的病害类别有限,难以满足田间条件下多种病害联合检测的需求;在复杂多变背景中,不同病害的视觉相似性易导致误判或漏检;检测精度与实时速度之间的权衡仍不充分,限制了其在移动平台和现场部署中的实际应用。为此,发表于《Smart Agricultural Technology》的研究团队提出了Dycorn-YOLO11,旨在实现自然场景下多种玉米病害的高效检测,并通过面向田间的部署与测试验证其实用性。
为开展研究,研究人员主要采用了以下关键技术方法:首先,构建了一个覆盖褐斑病、霜霉病、灰斑病、叶枯病、锈病和黑穗病这六种代表性玉米病害的高质量数据集,包含从公开库和田间实地采集的6511张图像。其次,在YOLO11算法基础上提出了Dycorn-YOLO11改进模型,核心是双动态特征捕获架构,包括在主干网络中嵌入在线卷积重参数化块(OREPA)以降低训练和推理复杂度,以及将v3-DyHead与Dysample模块结合以实现变形对齐和内容自适应采样。最后,通过“通道剪枝+知识蒸馏”的轻量化流程对模型进行压缩,并设计了基于边缘设备(Jetson Orin NX)的嵌入式部署流程和实时可视化系统,进行了静态与动态的田间测试。
2.1. 数据集构建
研究聚焦于6种常见玉米病害,通过整合公共数据与在山东淄博农业科学院试验站进行的田间成像,最终获得一个包含6511张图像的数据集,并按照8:1:1的比例划分为训练集、测试集和验证集。
2.2. 改进的Dycorn-YOLO11模型
研究以YOLO11为基础,提出Dycorn-YOLO11。其核心改进包括:在主干网络的C3k2模块中融合OREPA,通过训练时多分支并行卷积学习丰富特征,推理时合并为单一等效卷积,实现高效且富有表现力的工作流。其次,引入由v3-DyHead和Dysample构成的双动态特征捕获设计,共同关注不规则、小型或低对比度病斑区域,显著提升复杂场景下的检测精度。
2.3. C3k2-OREPA模块
为满足自然条件下实时、高通量病害检测的需求,引入OREPA以降低训练计算量并加速推理。该模块包含在线模块线性化和训练时压缩两个阶段,最终将C3k2内部的Bottleneck替换为新的C3k2-OREPA模块,在不显著增加计算复杂度的情况下提高了检测精度。
2.4. 双动态特征捕获架构
2.4.1. DyHead:为应对田间同一病害的病斑形态多样、不同病害在特定条件下高度相似导致的误检漏检问题,采用动态头(DyHead)。它集成了尺度感知、空间感知和任务感知,分别提高对不同尺度病斑的敏感性、强化空间模式识别以及根据当前子任务调整特征通道。
2.4.2. v3-DyHead:为进一步增强DyHead,将空间感知分支从DCNv2升级到DCNv3,形成了更强的v3-DyHead。DCNv3通过神经元间权重共享加速推理,并引入多组机制,使不同组能适应不同的聚合模式,显著增强了视觉相似病斑的表征能力。
2.4.3. Dysample:针对小病斑感知在强光照、雾、雨后等田间多变条件下仍然脆弱的问题,在特征融合颈部引入了动态上采样模块Dysample,替代最近邻上采样。Dysample根据局部上下文调整其采样策略,从而更有效地捕获病斑细节。
2.5. 模型剪枝
研究采用基于L1范数准则的结构化剪枝技术,对模型进行后训练压缩。首先对批归一化(BN)通道的缩放因子进行稀疏性学习,驱动不重要的通道缩放因子趋近于零,然后根据设定的剪枝率(本研究选择0.8)移除这些通道,最后进行微调以恢复部分性能损失。
2.6. 知识蒸馏
为进一步恢复因剪枝而降低的检测精度,采用了特征知识蒸馏。将未压缩的增强模型作为教师模型,剪枝后的模型作为学生模型,通过直接对齐中间特征图或学习它们之间的变换,使学生模型在选定层的表征紧密跟随教师模型,从而使学生模型在保持紧凑的同时继承教师模型强大的表征能力。
3.1. C3k2-OREPA放置实验
实验表明,仅在主干网络中替换C3k2-OREPA模块实现了最佳的整体检测性能,达到P=87.8%, R=73.5%, mAP=81.0%,且推理速度最高(87.7 FPS)。因此后续实验采用仅在主干网络替换的配置。
3.2. 剪枝率实验
实验评估了不同剪枝率下的性能。当剪枝率为0.8时,模型在精度、召回率和mAP上仅出现可接受的下降,同时参数量和模型大小相对于未剪枝基线分别减少了43.4%和43.1%,在压缩收益和精度损失之间取得了良好平衡,故选择0.8作为默认剪枝率。
3.3. 消融实验
消融研究验证了每个改进组件的有效性。C3k2-OREPA、v3-DyHead和Dysample的组合使得未压缩的增强模型获得了最佳检测性能(P=89.2%, R=75.7%, mAP=81.7%)。在对此模型应用“剪枝+知识蒸馏”(PD)后,学生网络在精度指标上略有下降,但保持了较高的性能(P=88.2%, R=73.9%, mAP=81.5%),同时计算量(FLOPs)显著降低,推理速度大幅提升至113.2 FPS,模型大小和参数量也大幅缩减,为边缘部署提供了理想的精度-效率平衡。
3.4. 轻量化性能比较
与传统的轻量化模块替换方法相比,提出的PD策略在显著减少参数量的同时,取得了最高的mAP,显示出其在效率和精度之间更优的权衡。
3.5. 检测头感受野比较
感受野可视化分析表明,从原始检测头到DyHead再到v3-DyHead,三个检测头的感受野显著扩大,中心响应更强,覆盖更广、更均匀。v3-DyHead需要最大的输入图像区域来达到相同的贡献水平,表明引入DCNv3增强了自适应采样和对齐能力,扩大了判别线索的空间支持范围,有助于在部分遮挡、低对比度和光照变化下区分视觉相似模式并减少漏检。
3.6. 热图比较
使用Grad-CAM生成的热图显示,采用双动态架构的模型在所有病斑类型上都表现出更强、更连续的高响应区域。例如,对于灰斑病,它几乎覆盖了所有小病斑,而原始YOLO11n模型几乎没有响应。这证实了双动态架构在注意力分布和检测性能方面的综合优势。
3.7. 与主流模型比较
与Faster-RCNN、SSD、YOLOv5s、YOLOv7、YOLOv8n、YOLOv10n、YOLO11n、YOLO11s、YOLOv12n和RT-DETR等主流模型相比,Dycorn-YOLO11在mAP上优于大多数模型,同时保持了最低的参数量(1.51M)和模型大小(3.3 MB),并实现了最高的推理速度(113.2 FPS),展现出卓越的综合性能。
3.8. 泛化性评估
在一个外部收集的、包含复杂田间条件的数据集上评估模型的泛化性能。Dycorn-YOLO11取得了76.5%的mAP,优于所有对比模型,且在各类病害上的检测精度分布均衡,表明其在不同光照和采集设置下具有稳定的性能。
3.9. 边缘设备部署与田间测试
模型被成功部署到Jetson Orin NX边缘设备上,并通过TensorRT引擎加速。在静态田间测试中,模型在连接手机摄像头的笔记本电脑上实现了实时视频流检测。在动态行走测试中,模型在手持设备沿玉米行移动时仍能保持稳定的检测性能,重复实验证明了其鲁棒性。可视化系统能够清晰展示检测结果,为目标验证和后续精准喷施提供了便利。
综上所述,本研究提出的Dycorn-YOLO11模型通过创新的双动态特征捕获架构,有效提升了在复杂自然场景下对多种玉米病害,尤其是小尺寸、低对比度病斑的检测精度。同时,通过“通道剪枝+知识蒸馏”的轻量化流程,在保持高精度的前提下,显著压缩了模型体积并提升了推理速度,使其能够高效运行在资源受限的边缘计算平台上。广泛的实验验证,包括消融研究、与主流模型对比、泛化性评估以及实际的边缘部署与田间测试,均证明了该模型在准确性、紧凑性和效率之间的优异平衡。Dycorn-YOLO11展现了强大、可部署的性能,为玉米田间的智能病害监测和精准喷施提供了一个切实可行的技术方案,对推动智慧农业发展具有重要意义。未来的工作可以探索将模型扩展到更多作物病害类型,并进一步优化以适应更低功耗的移动和物联网设备。