CFNet-YOLOv12:融合坐标与焦点调制注意机制的改进YOLOv12模型用于复杂环境下苹果叶部病害的精准检测

《Horticultural Plant Journal》:CFNet-YOLOv12: A novel deep learning framework for apple leaf disease detection

【字体: 时间:2026年03月15日 来源:Horticultural Plant Journal 6.2

编辑推荐:

  本文聚焦苹果叶片病害检测在复杂背景、多变光照及遮挡条件下的挑战,研究者提出了一种名为CFNet-YOLOv12的改进深度学习框架。该研究基于YOLOv12架构,通过简化结构、嵌入坐标注意机制(CoordAtt)以及融合焦点调制注意机制(FMA),有效提升了对模糊及微小病害特征的提取与定位能力。实验表明,该方法在mAP@[0.5:0.95]指标上达到了97.62%的优异精度,超越了多种主流模型,为实现精准农业病害智能预警与高效防治提供了可靠的技术支持,具有显著的应用前景与产业价值。

  
在现代化的果园管理中,及时、准确地发现植物叶片上的病害,就像为植物进行“体检”一样重要,这关系到作物的健康、产量乃至果农的“钱袋子”。苹果作为全球最主要的经济水果之一,其叶片常受到黑星病、黑腐病、锈病等多种病害的侵扰,这些病害不仅影响果树生长,严重时甚至可导致高达40%的产量损失。过去,有经验的果农依靠肉眼观察来诊断病害,但这不仅效率低下、主观性强,而且难以应对大规模种植园的需求。近年来,人工智能特别是深度学习技术,为自动化病害检测带来了曙光。然而,现实中的果园环境远比实验室复杂得多:叶片可能相互遮挡,光照在一天中剧烈变化,病斑特征可能模糊不清或尺寸微小,这些都给现有的检测算法带来了巨大挑战。许多先进的模型在理想的实验数据上表现出色,但一旦投入到真实、多变的田间环境,其性能便会大打折扣。为了破解这一难题,河南城建学院计算机与数据科学学院的研究团队开展了一项创新性研究,他们提出了一种名为CFNet-YOLOv12的新型深度学习框架,专门用于提升苹果叶部病害在复杂环境下的检测能力。这项研究成果发表在了园艺学领域的知名期刊《Horticultural Plant Journal》上。
为了验证和改进模型,研究人员主要运用了以下关键技术方法:首先是模型架构的工程优化,他们以YOLOv12为基线,针对苹果叶部病害的特点进行了结构简化和通道压缩。其次是注意力机制的集成创新,他们将坐标注意机制(CoordAtt)嵌入到骨干网络的C3k2模块中,以增强模型对病害特征的空间感知能力;同时,还将焦点调制注意机制(FMA)整合到A2C2f检测头中,以提高模型对微小、低对比度病斑特征的关注度。再次是全面的实验验证与评估,他们构建了一个包含12254张图片的数据集,其中整合了开源数据集(如PlantPathology Apple Dataset)和在中国河南省苹果种植基地自行采集的数据。最后是边缘部署可行性测试,他们在NVIDIA Jetson Orin Nano边缘计算平台上,利用TensorRT进行模型优化和性能评估,测试了模型的推理速度和功耗。
研究结果
4.3. Experimental results
实验结果表明,所提出的CFNet-YOLOv12模型性能优异。在训练过程中,与原始YOLOv12相比,改进模型在验证集上的分类损失下降更快、更平稳,平均精度(mAP@[0.5:0.95])最终达到约97.32%,显著高于基线模型的96.18%。消融实验进一步证实了各改进模块的有效性:单独引入简化结构会牺牲少量精度以换取速度;单独加入CoordAtt模块能使mAP@[0.5:0.95]提升0.69%;单独加入FMA模块也有小幅提升。而当CoordAtt与FMA模块协同集成到简化后的YOLOv12中时,模型取得了最佳性能,mAP@[0.5:0.95]达到了97.32%,仅比基线模型增加了0.1M参数和0.09G FLOPs的计算开销,实现了精度与效率的良好平衡。
在NVIDIA Jetson Orin Nano边缘设备上的测试显示,完整模型(改进YOLOv12+FMA+CoordAtt)能以25 FPS的速度稳定运行,功耗为7.9W,证明了其在实际农业边缘场景中部署的可行性。热力图可视化分析显示,融合了双注意机制的模型能够更集中、更精确地激活病斑区域,特别是对于微小病斑和边缘特征的定位能力显著增强。
与YOLOv8n、MobileNet-SSD、EfficientDet-D0、PP-PicoDet、YOLO-NAS-S等多种主流及轻量级模型相比,CFNet-YOLOv12在召回率(Recall)、精确率(Precision)、mAP@50和mAP@[0.5:0.95]等多项评估指标上均表现领先。混淆矩阵分析表明,该模型对四类叶片状态(健康、黑腐病、黑星病、锈病)的分类总准确率达到99.84%,显著减少了类别间的误判。柱状散点图和误差棒分析进一步确认了该模型在不同病害类别上检测性能的优越性和稳定性。雷达图则直观展示了该模型在各项评估指标上均衡且全面的高性能。
此外,模型在樱桃、柑橘、蓝莓和草莓等其他果树叶部病害开源数据集上也展现了良好的泛化能力,mAP@[0.5:0.95]指标均超过91%,表明其方法具有一定的普适性。与近三年相关研究工作的对比显示,该模型在中等规模数据集上达到了99.5%的mAP@50,其性能优于大多数同类研究,展现了出色的数据利用效率和检测精度。
结论与讨论
该研究成功构建了一个面向复杂果园环境的苹果叶部病害高精度检测模型CFNet-YOLOv12。其核心贡献在于通过任务导向的结构轻量化,以及CoordAtt与FMA两种注意力机制的协同创新,有效解决了传统方法在复杂背景、光照变化、叶片遮挡及微小病斑检测上的性能瓶颈。研究表明,CoordAtt模块通过分解二维全局池化为方向编码,显著增强了模型对病斑空间位置的感知;而FMA模块则通过调制卷积整合全局上下文,强化了对细微纹理和边缘特征的提取能力。两者的结合产生了“1+1>2”的互补增强效应。
该模型不仅在检测精度上实现了突破,其轻量化的设计(仅2.65M参数)和高效的推理速度(边缘设备25 FPS)为其在无人机、手持巡检设备等资源受限的嵌入式平台上的实际部署扫清了障碍。这为构建“空-地-人”协同的智能病害监测网络,实现园艺植物病害的大规模、立体化精准防控提供了坚实可靠的技术框架。研究者展望,未来工作将聚焦于模型在极端边缘环境下的进一步优化,开发与园艺无人机兼容的嵌入式芯片,并将该框架推广至更广泛的作物病害视觉检测任务中,从而支持园林植物健康监测系统的可持续发展,赋能智慧农业。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号