《Computers and Electronics in Agriculture》:Early detection of cotton Verticillium wilt using hyperspectral and chlorophyll fluorescence imaging fusion
编辑推荐:
本研究融合高光谱与叶绿素荧光成像技术,构建四分类深度学习模型,实现棉花黄萎病早期检测,准确率达99.57%(训练集)和97.88%(测试集),有效减少农药使用并精准防控。
谭飞|闫天颖|段龙|陈伟|闫京坤|狄若宇|高秀文|吴年义|吕鑫|潘高
石河子大学信息科学与技术学院,中国石河子832003
摘要
棉花是一种全球广泛种植的重要经济作物,极易受到由
Verticillium dahliae真菌引起的轮枝菌枯萎病(VW)的侵害。这种病害会导致生物量、棉纤维产量和纤维质量的显著损失。目前,棉花中VW的检测和控制主要依赖于视觉检查和杀菌剂处理,但这些方法耗时、劳动强度大且对环境有污染。本研究结合了高光谱成像和叶绿素荧光成像技术,并采用四级分类(健康、轻微、中等、严重)来准确识别轻微感染样本——这对应于疾病的早期阶段——从而通过多源成像融合技术实现棉花轮枝菌枯萎病(VW)的早期检测。通过从不同VW感染级别的棉花叶片中提取高光谱数据和叶绿素荧光诱导动态曲线,我们研究了棉花在不同VW感染水平下的表型特征变化。利用像素级、特征级和决策级特征融合策略整合高光谱成像和叶绿素荧光成像数据,我们识别了棉花的表型特征信息,并基于这些融合策略构建了一个多输入、单输出的深度学习架构。该架构放大了VW感染棉花的早期表型变化,提高了VW检测和预警的及时性和准确性。结果表明,与单一成像建模相比,使用融合策略的传统机器学习和深度学习方法在检测准确性和稳定性方面取得了整体提升。特别是,以Resnet-1D为主干的多源数据特征级融合深度学习架构表现出显著的优势。在该架构中,棉花不同VW感染级别的检测准确率在训练数据集上达到99.57%,在测试数据集上达到97.88%。棉花早期VW的检测准确率超过99%。这项研究为棉花VW的绿色防控提供了技术支持,有助于有效减少棉花产量损失,同时最小化杀菌剂的使用,从而实现精确的区域喷洒控制。代码可在以下链接获取:
https://github.com/TianyingYan/MISO。
引言
作为全球重要的经济作物,棉花是制造数千种消费品和工业产品的关键原材料(Bardak等人,2021年)。由土壤传播的病原体Verticillium dahliae(V. dahliae)引起的轮枝菌枯萎病(VW)严重损害了棉花的茎、枝条和叶片的生长,导致植物生物量和纤维质量大幅下降(Klosterman等人,2009年;Zhang等人,2020年)。目前,VW已成为新疆棉花种植区最具破坏性的病害之一(Guo等人,2016年;Tao等人,2020年)。然而,棉花VW的检测和管理主要依赖于视觉检查和杀菌剂施用方法,这些方法耗时且对环境有害(Li等人,2016年)。等到明显症状出现时,V. dahliae已经广泛侵染了植物,造成不可逆的损害,严重影响作物产量和质量(Calderón等人,2015年)。因此,准确、快速、早期地检测棉花VW对于病害防控至关重要,因为它可以有效减少棉花产量损失,同时实现绿色防控和精准管理。
在病害胁迫下,植物的表型特征会发生显著变化,包括内部生理反应和生理指标,这些变化进一步改变了植物的光学性质和外部形态(Lu等人,2023年)。高光谱成像(HSI)包含丰富的目标光谱和空间信息,能够快速捕捉植物叶片中潜在的病害相关信号。目前,许多研究集中在从高光谱图像中提取目标样本的光谱,然后分析由植物病害引起的光谱曲线差异(Li Kang等人,2021年;Lacotte等人,2022年;Wu等人,2023年)。然而,由于光谱曲线的差异很小,因此在疾病早期或无症状阶段检测病害仍然具有挑战性(Lowe等人,2017年;Terentev等人,2022年)。Gao等人(2020年)发现,在葡萄叶卷曲病的早期阶段,健康叶片和病毒感染叶片的原始光谱有大量重叠,阻碍了使用原始光谱数据进行早期病害检测。Xie等人(2024年)应用高光谱成像对小麦冠腐病进行了早期无损检测,通过支持向量机实现了超过0.75的F1分数。Yang等人(2024年)使用连续小波变换(CWT)提取高光谱特征,选择了最佳小波特征来构建检测无症状棉花轮枝菌枯萎病(VW)的模型,并报告称基于这些小波特征的逻辑回归模型准确率达到90.62%。
叶绿素是植物光合作用的物质基础。在病害胁迫下,植物内部生理指标(如叶绿素含量)的变化常用于评估植物的抗逆性(Gorbe和Calatayud,2012年;Lei等人,2017年)。叶绿素荧光成像(CFI)是检测植物光合作用、生理状况和抗性的有效工具,它能够实现像素级的检测,从而反映植物生理状态的异质性(Ivanov和Bernards,2016年;Moustaka和Moustakas,2023年)。Cen等人(2017年)测量了柑橘叶片的叶绿素荧光图像,并通过结合荧光参数和图像特征,实现了对健康叶片、黄龙病(HLB)感染叶片和营养缺乏叶片97%的分类准确率。然而,早期检测的准确性仍不明确。Sun等人(2023年)阐明了荧光响应与各种黄瓜病害之间的关系,表明叶绿素荧光成像可以有效识别黄瓜病害类型及其严重程度。Zhang等人(2023年)提出了一种基于机器学习的枸杞叶枯病早期检测算法,使用叶绿素荧光图像。结果显示,基于随机森林(RF)、支持向量机(SVM)和K-最近邻(KNN)算法的模型分别对三种叶片类型的分类准确率为90.7%、85.3%和84.0%。
鉴于植物病害早期症状阶段叶片表型的细微变化,依赖单一成像技术的检测方法可能难以进一步提高检测准确性(Wang等人,2018年)。高光谱成像关注植物的光学性质和图像信息,而叶绿素荧光成像则强调植物光合作用和生理反应参数的变化。多源成像数据的有效整合可以促进优势互补,可能克服高通量植物表型分析的瓶颈(Weng等人,2023年)。Simko等人(2015年)结合了高光谱成像和叶绿素荧光成像技术来提取特征波长和参数,实现了新鲜和腐烂生菜97%的分类准确率。Mahlein等人(2019年)结合了高光谱成像、叶绿素荧光成像和红外热成像来检查疮痂病感染和健康的麦穗,发现多源数据的像素级融合有助于提高检测准确性。Zhang等人(2022年)使用高光谱成像和叶绿素荧光成像来识别两种除草剂胁迫和两种重金属胁迫下的水稻植株,并提出了一种新的端到端深度融合模型。结果显示,该模型的检测准确率最高(97.7%),优于使用单一数据源的模型。
通过高光谱成像和叶绿素荧光成像技术获得的数据包含丰富的植物表型信息。深度学习可以自动从这两种成像方式中提取与病害相关的表型特征,从而增强表型检测的深度和广度(Tetila等人,2020年;Ahmad等人,2023年)。Nguyen等人(2021年)使用自构建的2D和3D卷积神经网络(CNN)从高光谱图像中提取特征,然后将其输入传统机器学习模型。Kaur等人(2023年)通过结合改进的InceptionResNet-V2模型和迁移学习,实现了番茄叶病的有效识别,分类准确率高达98.92%。Deng等人(2024年)设计了一种优化的深度学习架构,能够从高光谱图像中准确提取光合作用参数;结果显示,基于高光谱数据和深度学习的模型优于传统模型。Chun等人(2024年)开发了一种使用高光谱荧光成像快速、无损确定草莓果实感染阶段的方法。他们的研究发现,基于ResNet-50的1D CNN模型表现最佳,准确率为96.86%。因此,应用深度学习从高光谱成像和叶绿素荧光成像中提取棉花表型特征有助于深入挖掘棉花表型信息,为进一步建立棉花表型特征与轮枝菌枯萎病(VW)胁迫之间的关联奠定基础。
目前关于棉花轮枝菌枯萎病(VW)早期检测的研究主要集中在单一传感器的可行性研究上,主要探讨病害症状明显时的光学性质变化。对于不同病害严重程度下棉花表型特征的深入探索以及多特征融合用于棉花病害检测的研究相对较少。本研究聚焦于棉花,结合高光谱成像和叶绿素荧光成像技术,研究VW胁迫下棉花叶片的光谱特征和叶绿素荧光诱导动力学曲线的变化。目标是实现棉花VW的准确、快速、无损的早期检测。主要研究内容包括:(1)棉花VW的数据收集及棉花表型特征的变化研究;(2)通过结合传统机器学习和深度学习实现基于单一成像的棉花VW早期检测;(3)基于多源数据的像素级、决策级和特征级的融合实现棉花VW早期检测。
实验设计
本研究采用了棉花自然感染VW的模式。为了确保有足够的感染样本,建立了病原体分布均匀的棉花种植区。种植地点位于新疆石河子市石河子大学第二实验场附近(85°58′9″E,44°19′25″N),如图1所示。棉花采用传统的田间种植方法种植,并通过地下滴灌进行正常灌溉
光谱曲线和叶绿素荧光诱导曲线的分析
如图6所示,健康叶片和感染轮枝菌枯萎病(VW)的棉花叶片的高光谱曲线显示出不同的模式。可见光谱传达了植物的表面颜色信息,如图6(a)所示。将健康棉花叶片与感染VW的叶片进行比较时,感染叶片出现黄化、卷曲和萎蔫现象。随着叶片中叶绿素和类胡萝卜素含量的减少,它们对可见光的吸收下降,这反过来又增加了结论
(1)高光谱成像和叶绿素荧光成像可以用来研究不同VW感染程度下棉花叶片的损伤程度。研究表明,从感兴趣区域(ROI)提取的高光谱和叶绿素荧光诱导动力学曲线可以作为检测VW感染程度的判别数据。与健康叶片相比,轻度VW感染的棉花叶片表现出高光谱反射率的降低
资助
本研究得到了中国国家自然科学基金(62265015)、新疆生产建设兵团青年科技创新人才项目(2023CB008-16)、石河子大学科技成果转化项目(CGZH202310)和石河子大学高层次人才科研启动项目(RCZK202029)的支持。
作者贡献声明
谭飞:撰写 – 审稿与编辑,撰写 – 原始草稿,验证,方法论,调查,形式分析。闫天颖:撰写 – 审稿与编辑,撰写 – 原始草稿,可视化,验证,数据管理,概念化。段龙:调查,形式分析。陈伟:撰写 – 审稿与编辑,概念化。闫京坤:撰写 – 审稿与编辑,调查。狄若宇:软件,形式分析。高秀文:形式分析,数据管理。吴年义:
利益冲突声明
作者声明他们没有已知的可能会影响本文工作的财务利益或个人关系。
致谢
作者衷心感谢中国国家自然科学基金(62265015)、新疆生产建设兵团青年科技创新人才项目(2023CB008-16)、石河子大学科技成果转化项目(CGZH202310)和石河子大学高层次人才科研启动项目(RCZK202029)提供的支持。感谢石河子大学提供的实验条件