SPECGAN:基于生成对抗网络从植物病害光谱中提取敏感波段

《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》:SPECGAN: Extracting sensitive bands from plant disease spectra based on generative adversarial network

【字体: 时间:2026年03月24日 来源:Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy 4.3

编辑推荐:

  水稻细菌性叶枯病早期诊断中,基于生成对抗网络的SPECGAN框架通过时间域特征金字塔融合与残差注意力机制,有效解决高光谱数据维度冗余及样本稀缺问题,提取关键波段(520-550nm及680-720nm)并生成合成数据,MLP分类器在仅8%波段下达96.22%准确率,数据增强使性能提升6%-13%。

  
Jiale Chang|Shuxin Zhu|Hongfeng Yu|Shichao Wu|Rong Mu|Huanliang Xu|Zhaoyu Zhai
智能农业学院(人工智能学院),南京农业大学,南京211800,江苏,中国

摘要

高光谱成像为非破坏性植物疾病诊断提供了详细的光谱信息,但其应用受到原始光谱高维度以及数据记录不足和不平衡的限制。这些问题阻碍了弱病理信号的提取,最终降低了模型的适用性。为了克服这些挑战,本研究提出了SPECGAN,这是一种结合了时域特征金字塔融合(TD-FPNF)和残差注意力机制的生成对抗网络。SPECGAN为敏感波段的提取和数据增强提供了一个通用框架。多尺度卷积模块能够捕捉与生化变化相关的局部窄带特征,以及与生理结构相关的全局宽带趋势。残差注意力机制通过自适应地重新加权多层次融合特征并抑制背景噪声,进一步增强了微妙的疾病线索。SPECGAN基于判别器的梯度显著性分析准确识别关键区分波段,同时生成高质量的合成样本以缓解数据稀缺问题。实验结果表明,敏感波段主要集中在绿峰(520–550 nm)和红边(680–720 nm)区域,这与疾病引起的生理变化一致。仅输入前20个波段(占光谱的8%),MLP分类器的准确率可达96.22%。在14.6:1的不平衡情况下,生成1500个合成样本可以将性能提高6%–13%。总体而言,SPECGAN为水稻细菌性叶斑病的早期诊断提供了一种高效且可解释的方法。

引言

水稻(Oryza sativa L.)是世界上最重要的粮食作物之一,是超过35亿人的主食,占全球谷物产量的近40%,2023–2024年的总产量约为7.82亿吨[1],[2]。然而,由于气候变化、耕地减少和人口持续增长,水稻生产面临着前所未有的压力。由Xanthomonas oryzae pv. oryzae(Xoo)引起的水稻细菌性叶斑病(BLB)是最具破坏性的水稻疾病之一[3]。BLB广泛分布在亚洲、西非、澳大利亚北部和美洲的热带地区。严重的爆发可能导致20–70%的产量损失,在极端情况下,甚至会导致整个田地的毁灭,对全球粮食安全构成重大威胁[4]。这一挑战因7–14天的潜伏感染期而加剧,在此期间没有可见的症状,使得传统的田间巡查几乎无效。因此,开发早期、准确且非破坏性的检测技术对于保障水稻产量稳定至关重要[6],[7]。
近年来,高光谱成像(HSI)因其独特的图像-光谱融合能力而成为早期植物疾病诊断的强大工具[8],[9]。HSI可以捕捉疾病压力引起的生化变化,包括叶绿素含量减少、细胞壁降解和次生代谢产物的异常积累[10]。这些微妙的生理和生化变化使HSI相比传统的基于多光谱和RGB的检测方法具有显著优势[11],[12]。许多研究证明了HSI在早期植物疾病检测方面的能力,例如DC2Net [13]、RBD-VGG [14]、SDC-3DCNN [15]和EfficientNet [16]。
尽管HSI具有优势,但在农业中的应用仍面临两个主要挑战。首先是高维度。高光谱数据通常包含数百甚至数千个光谱波段,其中冗余信息往往超过80%[17]。这种冗余增加了计算负担,引入了噪声,并可能掩盖疾病引起的光谱变化[18]。此外,当样本量固定时,高维度会导致预测性能下降,这被称为Hughes现象。现有的降维方法主要分为两类:特征提取和特征选择[19]。特征提取方法,如主成分分析(PCA)和线性判别分析(LDA),可以生成低维表示,但PCA忽略了高光谱数据中的非线性结构(例如与疾病相关的荧光发射或反射率变化)[20]。LDA严重依赖于足够的标记数据,限制了在小样本下的泛化能力[48]。特征选择方法,如最小绝对值收缩和选择算子(LASSO)、ReliefF、Shapley加性解释(SHAP)和连续投影算法(SPA),通过识别原始波段的特定子集来保持物理可解释性[21]。然而,LASSO假设线性关系,无法处理非线性光谱关系[22]。ReliefF对类别不平衡敏感,可能会偏向多数类别[23]。SHAP虽然可解释,但在高维度设置下的计算成本较高[24]。SPA忽略类别标签,容易在类别较少的数据集中选择噪声波段[25]。
第二个挑战是农业高光谱数据的稀缺性和类别不平衡。收集高光谱样本需要昂贵的设备,且注释依赖于植物病理学专家[26]。在训练数据有限的情况下,深度学习模型可能会过拟合,无法学习到稳健的特征。此外,田间数据自然表现出强烈的类别不平衡,健康样本的数量远多于患病样本。这种类别不平衡通常导致模型过度拟合多数类别,从而降低了对少数类别(如早期疾病)的泛化能力[27]。生成对抗网络(GANs)已被广泛用于数据增强[28],[29],[30]。在我们之前对BLB高光谱数据增强的探索中,我们观察到GAN中的生成器必须捕捉和重建必要的光谱-空间特征分布,以成功欺骗判别器。因此,对GAN重建最有影响力的光谱波段通常包含最具代表性的高光谱信息。受此观察的启发,最近的研究开始将GANs纳入波段识别框架。例如,Rank-aware生成对抗网络(R-GAN)[31]提取中心参考特征,并使用结构相似性指数测量(SSIM)进行波段显著性建模。由于R-GAN将波段选择与对抗学习过程分离,它高度依赖于生成器的稳定性和参考特征的质量,因此在样本量极小的情况下容易发生模型崩溃和特征漂移。此外,它对排名约束和SSIM的依赖可能无法完全捕捉由品种差异、疾病压力和光照变化引起的非线性光谱变化。条件波段选择生成对抗网络(CBS-GAN)[32]将波段选择网络(BSNet)与GAN结合,用于波段提取和增强。但它将每个模块独立处理,而没有利用GAN捕捉高光谱结构的能力。总之,现有的GAN方法作为多阶段、解耦的流程运行。它们未能将波段评估指标内在地嵌入对抗游戏中,以统一、端到端的方式同时解决高维度和数据稀缺问题。比较的结构细节如图1所示。(见图2。)
最近,先进的深度学习框架在解决数据不平衡和复杂特征提取方面取得了显著进展。例如,开发了一种多模态非高斯去噪扩散生成对抗网络(MNG-DDGAN),以在样本极度有限的情况下增强数据增强和恢复复杂分布[43]。为了整合异构信息,利用跨特征注意力融合的多分支并行感知架构在捕捉协同故障特征方面表现出强大能力[44]。此外,无监督迁移学习架构——特别是具有可移动窗口的多通道校准Transformer——已被提出以实现稳健的领域适应[45],而局部熵选择缩放提取chirplet变换(LESSECT)已被证明在解决非平稳信号分析的非比例瞬时频率方面有效[46]。
尽管有这些方法上的突破,但在农业高光谱植物疾病诊断方面仍存在显著的研究空白。首先,现有方法通常将降维和数据增强视为独立任务,未能利用生成模型的内在能力来同时学习复杂的光谱流形并缓解数据稀缺问题。其次,虽然传统算法难以处理早期光谱的高维共线性和冗余噪声,但直接应用黑盒深度模型往往缺乏明确的物理可解释性。因此,开发一个能够在严重不平衡情况下生成高保真样本的同时提取物理上有意义、对疾病敏感的窄带特征的统一框架仍然是一个关键挑战。
为了解决这些限制,我们提出了SPECGAN,这是一种用于高光谱成像的敏感波段提取框架。与现有工作不同,我们的框架不仅将GAN用于数据增强,还用作特征提取器。本研究的主要贡献如下:
1. 我们提出了SPECGAN,一个集成特征波段识别和数据增强的统一框架。与传统的独立波段选择方法不同,SPECGAN利用生成器和判别器之间的对抗学习机制。在强制进行高保真光谱分布学习的同时,该框架将内部特征依赖性转换为明确的波段重要性分数。这种设计弥合了降维和数据增强之间的差距,解决了经常阻碍农业高光谱应用的的高维度和样本稀缺问题。
2. 我们设计了一种改进的生成器架构,集成了多尺度卷积、时域特征金字塔融合(TD-FPNF)和残差注意力机制。针对检测微弱早期疾病信号的挑战,该架构并行提取多尺度空间-光谱特征,并动态重新加权贡献通道。这提高了噪声抑制能力,并增强了模型对微小光谱变化的敏感性。
3. 在我们自构建的水稻BLB数据集上的广泛实验表明,SPECGAN识别的前20个特征波段(占全光谱的8%),包括521 nm、542 nm、672 nm和717 nm,与疾病引起的生理变化(如叶绿素减少和细胞结构损伤)密切相关,提供了强大的生物学可解释性。使用这前20个波段子集,MLP分类器的准确率达到96.22%,超过了使用全部波段的性能。
4. 在极端类别不平衡的情况下,SPECGAN生成的合成样本将分类性能提高了6%–13%,有效缓解了田间的注释限制。此外,SPECGAN在公共小麦枯萎病数据集上的准确率达到99.47%,显示出出色的泛化能力和迁移能力。

部分片段

植物材料和病原体接种

水稻栽培和病原体接种在受控的设施环境中进行。幼苗被移植到装有专门为水稻栽培配制的粘土土壤的塑料盆中(高度32厘米,直径35厘米)。每个盆中保留三株生长均匀的植物。应用标准的农艺实践,包括使用基肥和分蘖肥,并保持连续的浅水灌溉。在接种前七天,植物

输入特征的效果

为了验证SPECGAN模型提取的特征波段的有效性和区分能力,并确定最佳特征子集大小,进行了多次比较实验。根据梯度显著性分数,SPECGAN识别的前5个、前10个、前20个和前30个特征波段被输入到四个机器学习分类器中,包括多层感知器(MLP)、支持向量机(SVM)、决策树(DT)和随机森林(RF)。作为基线,

讨论

本研究提出的SPECGAN框架解决了高光谱成像在植物疾病诊断中的两个核心挑战:光谱数据的高维度(Hughes现象)和标记田间样本的稀缺性。实验结果表明,SPECGAN仅使用前20个波段进行水稻BLB检测时,不仅实现了更高的准确率(96.22%),而且还在小麦赤霉病上表现出强大的泛化能力

结论

本研究提出了SPECGAN,这是一种结合了自适应特征金字塔和残差注意力机制的生成对抗网络,用于解决水稻BLB疾病早期检测中的高光谱维度和类别不平衡问题。比较实验和消融分析证实,SPECGAN结合了高效的特征波段识别、出色的生物学可解释性和强大的数据增强能力。选出的前20个波段(大约

资金来源

本工作得到了国家自然科学基金 [Grant No. 32401697]和江苏省自然科学基金 [Grant No. BK20231004]的支持。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

作者感谢南京农业大学智能农业实验室的成员在高光谱数据收集方面的协助。我们感谢杭州CHNSpec Technology提供的便携式高光谱相机(FigSpec? FS-IQ-VISNIR)。我们还要感谢匿名审稿人的宝贵评论和建议,这些评论和建议有助于改进手稿。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号