基于高光谱成像与SHAP可解释性分析的烟草叶部病害多类识别与严重度评估

《Frontiers in Plant Science》:Identification of tobacco leaf diseases using hyperspectral imaging and machine learning with SHAP interpretability analysis

【字体: 时间:2026年01月06日 来源:Frontiers in Plant Science 4.8

编辑推荐:

  本综述系统评估了高光谱成像(HSI)与机器学习在烟草叶部病害诊断中的应用。研究通过Savitzky-Golay(SG)预处理、连续投影算法(SPA)波长选择和人工神经网络(ANN)分类器,仅用20个特征波段实现了对健康叶片及四种主要病害(褐斑病、野火病、烟草花叶病毒TMV、马铃薯Y病毒PVY)的高精度多类识别(准确率98.88%)。Transformer模型虽表现略优(99.35%),但依赖全谱数据且计算成本高。SHAP可解释性分析揭示了与色素吸收(如567.3 nm)和结构变异(如870.8 nm)相关的关键光谱区域,像素级预测支持了病害严重度分级。该框架为开发轻量化多光谱诊断系统提供了理论基础。

  
引言
烟草作为中国农业经济的支柱产业,易受褐斑病、野火病、烟草花叶病毒(TMV)和马铃薯Y病毒(PVY)等叶部病害侵袭,严重影响产量与品质。传统诊断方法依赖主观性强的人工观察或破坏性分子检测,亟需开发快速、无损的客观诊断技术。高光谱成像(HSI)能够捕获叶片在可见-近红外波段(400–1000 nm)的连续光谱信息,通过病害引起的色素、细胞结构和水分状态变化导致的反射率差异实现病害识别。然而,现有研究多集中于单一病害或二分类任务,缺乏针对多病害场景的通用性、可解释性分析框架。本研究旨在构建一个结合HSI和机器学习的多病害烟草诊断框架,重点解决模型效率、可解释性及严重度定量评估问题。
材料与方法
研究选用烟草品种云烟99,于四川省宜宾市采集95片叶片(褐斑病35片、野火病33片、PVY 14片、TMV 8片、健康5片)。采用Pika XC2高光谱成像系统(400–1000 nm,462个波段)获取图像,并通过阈值分割、连通域分析和形态学闭运算去除背景。数据标注以叶片为单位划分训练集、验证集和测试集,避免像素级数据泄露。比较了SG平滑、标准正态变量变换(SNV)、最小-最大标准化(MMS)和标准缩放(SS)四种预处理方法,并评估竞争性自适应重加权采样(CARS)、连续投影算法(SPA)和最小角回归(LARS)三种波长选择算法。分类模型包括人工神经网络(ANN)、XGBoost、随机森林(RF)、支持向量机(SVM)、偏最小二乘判别分析(PLS-DA)以及作为深度学习基准的X-Transformer模型。模型性能通过准确率、精确率、召回率和F1值评估,并采用SHAP分析关键波长贡献。针对褐斑病和野火病,基于像素级预测计算病斑面积比例实现严重度分级。
结果
光谱特性分析显示,不同病害在400–1000 nm波段反射率存在显著差异:褐斑病和野火病在全波段反射率低于健康叶片,且在500–600 nm无显著反射峰;TMV和PVY在550 nm附近绿峰反射率降低,但在700–1000 nm近红外区高于健康叶片。SG预处理能有效抑制噪声,ANN模型在SG预处理下全谱分类准确率达98.93%。波长选择中,SPA筛选出20个特征波段,SG-SPA-ANN模型测试准确率为98.88%,与全谱模型相当但输入维度降低95.7%。X-Transformer模型准确率略高(99.35%),但参数量达484万,且依赖全谱输入。SHAP分析表明,870.8 nm(近红外散射)、711.6 nm(红边位置)和567.3 nm(叶绿素吸收)是区分病害的关键波段,其贡献与色素降解、细胞结构破坏等生理变化一致。像素级病害可视化显示,SG-SPA-ANN能准确定位褐斑病和野火病病斑空间分布,严重度分级准确率超过90%。
讨论
本研究提出的SG-SPA-ANN框架在保持高精度的同时显著降低了数据维度和计算需求,为开发轻量化多光谱诊断设备奠定了基础。SHAP分析不仅提升了模型可解释性,还揭示了与生理机制一致的光谱响应规律,如褐斑病和野火病在近红外波段反射率降低与细胞结构塌陷相关。然而,研究存在局限性:数据均来自室内可控环境,样本量尤其是病毒病害和早期症状样本不足,且未验证跨品种泛化能力。未来需扩大样本多样性,结合生理参数测量,并探索田间应用适应性。
结论
基于高光谱成像和机器学习的烟草叶部病害识别框架,通过SG预处理、SPA波长选择和ANN分类器,实现了多类病害的高精度识别和严重度评估。SHAP可解释性分析明确了关键光谱特征的生理意义,验证了模型决策的合理性。该研究为开发低成本、高效率的烟草病害诊断系统提供了技术支撑,尤其适用于受控环境下的精准农业应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号