基于噪声增强的条件扩散模型用于作物病害图像的生成与增强

《Computers and Electronics in Agriculture》:Noise-enhanced conditional diffusion model for crop disease image generation and augmentation

【字体: 时间:2026年01月23日 来源:Computers and Electronics in Agriculture 8.9

编辑推荐:

  作物病害图像生成与增强研究提出噪声增强条件扩散模型(NECD),通过构建图文转换机制提取疾病先验特征,结合双条件噪声增强方法(DCNE)优化图像细节恢复,并引入自注意力增强记忆模块解决长序列生成信息丢失问题。实验在PlantVillage和AI Challenger数据集上取得CLIP得分0.3014、0.2969和FID 22.68、22.94,有效提升数据多样性与模型泛化能力。

  
王永红|王晓峰|刘瑞清|吴昂丘
中国山西省忻州市忻州师范学院计算机科学系,邮编034000

摘要

在农业领域,作物病害一直是研究的重点方向。为了解决作物病害图像匮乏、同类病害图像相似以及同类病害图像差异较大的问题,本文提出了一种基于噪声增强的条件扩散模型(NECD),用于作物病害图像的生成与增强。首先,在扩散模型的基础上构建了一个先验条件特征提取模块,通过建立图像-文本转换机制来形成作物病害的先验信息,从而提高生成条件的多样性。接着,利用获得的作物病害先验信息作为条件文本,提出了一种双条件噪声增强方法(DCNE),以增强反向扩散过程中图像细节的恢复效果。最后,引入基于自注意力的记忆增强模块,以提高模型在长序列生成方面的性能,弥补DCNE扩散过程中丢失的长期信息。实验表明,NECD在PlantVillage和AI Challenger数据集上的CLIP分数分别为0.3014和0.2969,FID分别为22.68和22.94,证明了其有效性。

引言

作物病害问题日益严重。然而,传统的手动检测方法不适合大规模和精准化的现代农业(Lu等人,2025年)。深度学习为作物病害分析提供了新的思路。基于图像细节生成的作物分析技术能够通过生成清晰的病害细节,在小样本和复杂环境中显著提高检测精度(Ngugi等人,2024年;Dolatabadian等人,2025年)。这一技术不仅解决了传统方法在小目标病害分析中的问题,还为早期检测和精准防控提供了技术支持。
目前,作物图像病害分析面临许多挑战。首先,作物病害的表现形式存在显著规模差异(Faisal等人,2025年;Alvarado等人,2025年;Praveen等人,2025年)。例如,在病害早期,水稻稻瘟病的病斑直径仅为0.5–2毫米,而在病害晚期,病斑可扩展至数厘米。其次,同一病害在不同作物或生长阶段表现出不同的形状(如圆形、不规则形和网状),并伴随颜色变化(如黄化、褐变和紫色斑点)(Goyal等人,2025年)。例如,番茄晚疫病的病斑边缘模糊,而黄瓜霜霉病的病斑呈多边形,因此使用传统模型提取通用特征较为困难。第三,自然场景中的光照变化(背光、阴影)、叶片遮挡、露水反射等因素会扭曲病害特征(Jesupriya等人,2025年)。例如,在背光条件下,葡萄霜霉病容易与生理性病害混淆,导致误判率增加。最后,昆虫和鸟类的活动可能导致叶片损伤,这些损伤与病害症状相似(如虫洞和细菌斑点)(Mallick等人,2025年;Saini等人,2025年)。
许多学者根据不同作物的特点和上述问题进行了相关研究。Mokhtar等人(2015年)提出了基于Gabor小波的模型,用于番茄病害检测;通过分离番茄叶片,利用小波特征提取技术确定最佳特征子集,并通过不同核函数评估检测粉虱和早疫病的能力。Xu等人(2017年)将小麦叶锈病的灰度图像转换为单通道RGB模型,利用Sobel算子检测边缘、病斑和叶面积比来提高病害评级诊断的精度。Wang等人(2019年)提出了一种基于深度卷积神经网络(CNN)和目标检测的番茄病害检测方法,使用Faster R-CNN分类病害类型,并用掩码R-CNN定位和分割病害区域。Fawzia Rahim和Mineno(2021年)结合深度实例分割、数据合成和颜色分析,准确识别和计数不同生长阶段的番茄。Shi等人(2024年)提出了基于轻量级U-Net的深度学习模型,结合深度可分离卷积优化参数数量,实现小麦疮痂病的准确分割和严重程度评估。Shwetha等人(2024年)基于MobileNetV4定制了U-Net架构,探索了不同的U-Net分割方法,并评估了各种骨干网络的性能。
总体而言,传统图像处理方法适用于特定环境下的作物病害分析,但在病害形状复杂时效果较差。机器学习依赖于特征提取,其泛化能力有限。深度学习在处理大面积复杂农田病害时灵活性不足。受图像生成技术的启发,本文专注于病害作物数据的增强和生成,通过合成具有真实病害特征的图像样本来进一步提高数据的多样性和模型的泛化性能(Safonova等人,2023年)。生成对抗网络(GAN)(Creswell等人,2018年)和去噪扩散概率模型(DDPM)(Ho等人,2020年;Rombach等人,2022年)作为新的生成模型,在图像生成和数据增强中得到广泛应用。例如,Bao等人(2025年)提出了一维光谱数据优化一维深度卷积GAN(Radford等人,2015年)和一维CNN模型,通过准确预测多种水稻品种来生成高质量样本。Zhang等人(2024年)提出了DP-CycleGAN模型来增强数据集。结合结构感知损失和纹理感知损失函数,激活重建和掩蔽机制以改进生成图像。Lin等人(2025年)提出了基于VisionMamba(Zhu等人,2024年)的网络模型,通过建立长距离依赖关系生成类似真实图像的图像。Feng等人(2025年)提出了结合StyleGAN3和Real-ESRGAN的数据增强策略,降低了Fusarium萎蔫病图像采集的成本和分割模型的标注成本。这些生成模型分别用于小麦穗图像生成和超分辨率重建,以筛选出高质量的生成图像。
尽管现有模型可以扩展数据集,但准确标注作物病害样本仍然困难,尤其是对于频率低、数据稀缺的特殊病害。此外,由于作物病害图像的类间相似度高、类内差异大,模型效果受限。因此,本文提出了一种基于噪声增强的条件扩散(NECD)模型,用于作物病害图像的生成与增强。

方法

所提出的NECD模型如图1所示。该模型基于总时间步长为T的扩散概率模型,模拟正常图像的复杂分布。正向过程将正常图像
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号