DC-Former:一种轻量级的非对称混合网络,用于资源受限的田间环境中实时识别植物病害

《Computers and Electronics in Agriculture》:DC-Former: A lightweight asymmetric hybrid network for real-time plant disease identification in resource-constrained field environments

【字体: 时间:2026年02月15日 来源:Computers and Electronics in Agriculture 8.9

编辑推荐:

  植物病害在边缘设备上的诊断需解决背景噪声和微小特征问题,对称混合架构存在高延迟高内存问题。本文提出DC-Former,通过移除ResNet50第四阶段并引入SFDE模块对齐异构特征,结合SBG动态加权机制抑制噪声,在PlantDoc和Paddy数据集上Top-1准确率达80.67%和98.41%,内存占用降低67%,适用于资源受限环境。

  
彭天|叶倩|赵家伟|王新瑞|陈江泉|尹涛|孙继红|李彤
中国云南省昆明市云南农业大学大数据学院,650201

摘要

在资源有限的边缘设备上诊断植物疾病具有挑战性,因为存在背景噪声和疾病特征不明显的问题。现有的并行混合架构通常采用对称结构,这会导致高延迟和高内存消耗。为了解决这个问题,本研究提出了DC-Former,一种非对称的双流架构。该模型采用了一种截断和重构策略,用串行特征双重编码(SFDE)模块替换了计算量较大的ResNet50的第四阶段。该模块通过使用高级语义来定位低级纹理细节,从而对疾病区域进行关注。此外,选择性分支门控(SBG)模块用于加权跨分支特征以减少噪声。实验结果表明,DC-Former在PlantDoc和Paddy数据集上的Top-1准确率分别为80.67%和98.41%。在移动平台上,与ResNet50基线相比,DC-Former将峰值内存消耗减少了约67%,实现了高效的实时推理。这种在准确性和效率之间的平衡使得该模型适用于资源受限的环境。

引言

全球人口的快速增长要求稳定的农业产量以确保粮食安全(Fasoula和Fasoula,2002年;Wilmoth等人,2021年)。然而,植物疾病会显著降低作物产量和质量(Garrett等人,2022年)。气候变化和集约化农业增加了病原体的变异性,导致疾病爆发更加频繁(Chakraborty,2013年;Singh等人,2023年)。传统的监测方法依赖于人工检查或实验室分析,这些方法主观性强、劳动密集且耗时(Wang等人,2025年;Yadav和Yadav,2025年)。在大规模农业中,这些限制常常导致误诊和延误关键干预措施。因此,在边缘设备(如无人机和手持终端)上部署自动化诊断系统对于实时监测至关重要。
深度学习已成为植物疾病诊断的主要方法。卷积神经网络(CNN)和视觉变换器(ViT)因其特征提取能力而被广泛使用。然而,在农业物联网中部署这些模型面临着非结构化田间环境和有限边缘资源的挑战(Liang等人,2023年;Saber等人,2025年;Wang等人,2024年)。田间条件通常包括光照变化、杂乱的背景和叶片遮挡。因此,模型必须从复杂的背景中区分疾病模式,而数据往往有限(Paul等人,2025年;Sun等人,2025年;Tamim等人,2025年;Wu等人,2023年)。另一方面,边缘设备(如无人机和手持终端)在功耗、计算能力和存储方面有严格限制,这限制了模型的复杂性。标准的CNN(如ResNet50)受到局部感受野的限制,常常无法捕捉到准确诊断所需的全局上下文。此外,它们的高计算成本使得它们不适合低功耗硬件。尽管ViT能够有效捕捉全局上下文,但自注意力的二次复杂性会导致高延迟和高内存消耗。因此,现有架构难以在准确性和效率之间取得平衡:轻量级模型在复杂环境中往往表现不佳,而重型模型则不适用于实时边缘部署。
集成局部纹理和全局语义的混合架构提供了一个潜在的解决方案。代表性的方法包括双流CrossViT(Chen等人,2021a)和混合CTRL-F(EL-Assiouti等人,2025)。然而,将这些模型应用于资源受限的农业场景存在挑战。(1)现有的混合模型通常采用对称堆叠设计,为CNN和Transformer保留了完整的架构,导致深度CNN特征和全局Transformer表示之间的功能冗余,从而增加了功耗(Lin等人,2025年),这限制了在电池供电设备上的部署。(2)CNN和Transformer特征具有不同的空间分布。简单的融合方法(如连接或加法)无法完全弥合这一差距。在田间环境中,这限制了噪声抑制并模糊了疾病细节(Pi等人,2025年)。因此,解决基于边缘的疾病诊断问题需要一种资源平衡的架构,能够自适应地对齐特征,同时最小化结构冗余。
为了解决这些挑战,本研究提出了DC-Former,一种非对称的双流架构。为了减少对称架构的冗余,采用了截断策略。用轻量级的Transformer分支替换了计算量较大的ResNet50的第四阶段,以重构高级语义。为了解决特征交互过程中的不对齐问题,引入了串行特征双重编码(SFDE)模块。该模块使用全局语义来指导局部纹理细节的聚合,解决了跨尺度冲突,同时降低了复杂性。此外,选择性分支门控(SBG)机制使用软门控策略自适应地校准跨分支特征权重。这种设计提高了对环境噪声的鲁棒性,并确保了在边缘设备上的效率。
本文的主要贡献总结如下:
  • 本文提出了DC-Former,一种非对称的双流架构。通过移除ResNet50的第四阶段并添加一个轻量级的Transformer分支,该模型保留了田间诊断所需的细粒度特征,并减少了结构冗余。
  • 串行特征双重编码(SFDE)模块对异构特征进行了对齐。通过使用全局上下文来聚合局部纹理细节,有效解决了交互层中的语义不对齐问题。
  • 选择性分支门控(SBG)机制作为动态过滤器来处理背景干扰。它实时校准跨分支权重,使模型能够根据图像复杂性抑制噪声并定位疾病区域。
  • 在移动边缘平台上验证了性能。结果证实,DC-Former在保持高准确率的同时实现了低内存消耗和低延迟,证明了其在资源受限环境中的实时疾病监测可行性。
本文的其余部分组织如下:第2节回顾相关工作。第3节详细介绍了数据集、DC-Former架构和实验设置。第4节展示了结果和讨论。第5节总结了本文。

章节片段

基于CNN的植物疾病识别方法

自从AlexNet(Krizhevsky和Hinton,2009年)以来,卷积神经网络(CNN)由于其特征提取能力已成为植物疾病诊断的主导技术。深度架构(He等人,2016年;Howard等人,2017年;Simonyan和Zisserman,2014年;Tan和Le,2019年)被广泛用于提取叶片纹理和颜色特征,为自动化识别设立了基准。
例如,Mohanty等人(2016年)将AlexNet和GoogLeNet应用于大规模数据集。

数据集

为了评估DC-Former在真实农业场景中的性能,本研究选择了两个公开可用的基准数据集:Paddy(Murugan和Arjunan,2023年)和PlantDoc(Singh等人,2020年),这些数据集来自非结构化的自然农田环境。前者具有大规模和细粒度的场景,而后者则存在样本量有限和背景噪声复杂等挑战。本研究旨在验证DC-Former是否能够有效抑制

消融实验

为了评估DC-Former中每个组件对整体架构及其在不同数据分布下的性能的贡献,在PlantDoc和Paddy数据集上进行了消融研究。

结论

本研究提出了DC-Former,一种旨在平衡边缘设备上诊断准确性和计算成本的非对称混合架构。在田间数据集上的实验结果表明,与资源密集型的Transformer模型相比,DC-Former实现了相当的识别准确率,同时具有更低的延迟和最小的内存消耗。这些发现证实了在边缘硬件上进行可靠的实时作物监测是可行的。
此外,全面分析证实了

CRediT作者贡献声明

彭天:写作 – 审稿与编辑,撰写原始草稿,软件开发,方法论,形式分析,数据管理,概念化。叶倩:监督,资源获取,资金筹集。赵家伟:验证,调查。王新瑞:可视化,数据管理。陈江泉:验证,资源管理。尹涛:可视化,调查。孙继红:监督,项目管理,资金筹集。李彤:资源管理,项目管理,方法论。

利益冲突声明

作者声明他们没有已知的可能会影响本文报告工作的竞争性财务利益或个人关系。

致谢

本研究得到了中国云南省科技人才与平台计划(院士专家工作站)(编号:202405AF140077、202405AF140013、202505AF350026)、中国云南省重点研发计划项目(编号:202403AC100042-4)、中国云南省重大科技项目(编号:202402AE090018-1)以及中国云南省中青年学术和技术领军人才储备计划(编号:)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号