《Smart Agricultural Technology》:Multi-crop early detection of spider mite damage using hyperspectral data and XGBoost
编辑推荐:
为应对二斑叶螨(Tetranychus urticae)对黄瓜和草莓等高价值作物的严重威胁,研究人员在受控条件下,利用高光谱成像(HSI)技术和基于极端梯度提升(XGBoost)的机器学习模型,开展了针对早期(包括无症状阶段)叶螨侵染的检测研究。结果表明,使用全波段时,模型对黄瓜、草莓及两者混合叶片的分类准确率分别达93%、84%和87%;即使使用筛选出的5个有效波长,准确率仍可达70%、65%和65%,证明了利用单个融合模型进行跨作物早期虫害检测的可行性,为开发基于传感器的精准农业实用工具奠定了基础。
在现代化的农业生产中,有一种微小却破坏力惊人的“隐形杀手”——二斑叶螨(Tetranychus urticae Koch)。这种全球性的重要害虫,其“食谱”涵盖了超过150种作物,其中就包括我们餐桌上常见的黄瓜和草莓。叶螨通过刺吸植物叶片背面的叶肉细胞为食,导致叶绿素降解、光合作用速率下降,并形成褪绿斑点。更棘手的是,由于其世代周期短、繁殖力强且易对多种杀螨剂产生抗性,往往在农民肉眼观察到明显危害症状之前,损害就已经造成,导致严重的经济损失。因此,如何实现叶螨危害的“早期预警”,在症状显现甚至害虫潜伏阶段就将其识别,成为了植物保护领域的一项紧迫挑战。
传统的检测方法依赖人工巡查,效率低、主观性强,且难以发现早期或无症状的侵染。近年来,高光谱成像(Hyperspectral Imaging, HSI)技术为这一难题带来了曙光。HSI能够捕获观测物体在电磁波谱上的连续、精细信息,其光谱分辨率可达纳米级别,涵盖了可见光、红边和近红外等对植物生理变化敏感的关键波段。当叶螨取食导致叶片内部生理结构和化学成分改变时,其光谱反射特性也会发生相应变化,这为基于图像的虫害识别提供了理论可能。尽管已有研究利用HSI或机器学习(Machine Learning, ML)模型对单一作物的特定病虫害进行检测,但开发一种能够同时适用于多种不同作物的通用型早期检测模型,对于推动精准农业(Precision Agriculture)的实用化、规模化发展具有重要意义。
为此,一项发表在《Smart Agricultural Technology》上的研究迈出了探索性的一步。来自德国霍恩海姆大学的研究团队开展了一项创新性工作,旨在评估利用高光谱成像结合极端梯度提升(eXtreme Gradient Boosting, XGBoost)机器学习模型,实现对黄瓜和草莓两种不同作物上叶螨早期危害(包括无症状侵染)进行跨作物检测的潜力。他们的研究回答了三个核心问题:XGBoost模型准确分类多种侵染状态的能力如何?使用精简的有效波长集时模型性能怎样?能否用一个合并的单一模型来准确分类两种作物的叶螨侵染?
关键技术方法简述
本研究在受控条件下进行。研究人员使用黄瓜(品种Picolino)和草莓(品种Clery)植株,并分为健康组和人工接螨的侵染组。核心数据采集设备为SENOP HSC-2高光谱相机,光谱范围500–900 nm。图像采集持续至每个侵染组中至少有一片叶子出现首个肉眼可见症状为止,同时将所有经确认有叶螨存在(无论是否有症状)的叶子均归入侵染类别。数据处理在Python环境中完成,主要步骤包括:将高光谱图像分割为10×10像素的瓦片;使用基于DeepLabv3卷积神经网络(CNN)的模型对叶片与背景进行精确分割,以提取纯净的叶片光谱信息;对每个瓦片内的像素反射率值进行平均,为每个波长生成平均光谱签名。最终,分别为黄瓜和草莓叶片生成了367,985和228,080个平均光谱签名。使用XGBoost算法构建了三个独立的分类模型(分别针对黄瓜、草莓及两者合并的数据集),并利用其内置的特征重要性度量来筛选对分类最有效的波长。模型训练与测试的数据分割比例为70:30,并在模型训练完成后,使用准确率、精确率、召回率和F1分数等指标进行评估。
研究结果
1. 症状发展与光谱特征
研究发现,可见症状的出现时间在作物间存在差异:黄瓜叶片在接螨6天后出现症状,而草莓叶片则需要9天。这可能与草莓叶片表面具有丰富的腺毛(trichomes)等物理防御结构有关。更重要的是,实验结束时并非所有被侵染的叶片都出现了可见症状,这凸显了基于光谱进行早期(包括无症状阶段)检测的必要性。
对平均光谱签名的分析表明,健康与受侵染叶片之间的反射率差异是细微的。在可见光范围内,受侵染叶片的反射率略高。在红边(690–740 nm)和近红外(NIR, 700–1000 nm)区域,尤其是在750–900 nm范围内,差异更为明显,并通过梯度曲线的峰值体现出来。这些区域分别对叶绿素含量、叶肉结构和水分的早期变化敏感,而这些正是受叶螨取食影响的因素。
2. 特征选择与分类结果
通过XGBoost的特征重要性分析,研究筛选出了用于分类的最有效波长。一个关键发现是:当筛选波长数量减少时(特别是减少到10个和5个时),可见光区域的波长不再被选中,而红边和近红外区域的波长则 consistently 被选中,凸显了这两个非可见光谱区域对于早期检测的重要性。
具体的分类性能如下:
- •
使用全部波长(112个)时:模型对黄瓜叶片的分类准确率最高,达到93%;对草莓叶片的分类准确率为84%;当两种作物数据合并后,单一合并模型的分类准确率仍达到87%,且精确率、召回率和F1分数也均为87%,表现均衡。
- •
使用筛选后的有效波长时:
- •
当使用筛选出的前55个有效波长时,性能与使用全波段时相当甚至略有提升(合并模型准确率达88%)。
- •
随着使用的波长数量减少,模型性能逐步下降。当仅使用5个最有效波长时,对黄瓜、草莓及合并数据集的分类准确率分别降至70%、65%和65%。
- •
模型比较:合并模型在仅使用5个波长时达到的65%准确率,虽然低于黄瓜单一模型(70%)和草莓单一模型(65%),但下降幅度在可接受范围内,证明了开发跨作物通用检测模型的可行性。混淆矩阵分析进一步显示,随着特征波长减少,模型对侵染叶片的误判(特别是假阴性)有所增加。
研究结论与重要意义
本研究成功地证明,在受控条件下,基于高光谱成像和XGBoost机器学习模型,能够对黄瓜和草莓的叶螨早期危害(包括无症状侵染)进行有效检测。这是首个已知的、成功将单一合并机器学习模型应用于两种不同作物早期叶螨检测的研究。
研究的核心结论与意义体现在以下几个方面:
- 1.
跨作物检测的可行性得到验证:研究构建的单一合并模型在仅使用5个关键波长时,对两种作物的混合数据仍能达到65%的分类准确率。这表明,尽管不同作物的叶片结构和光谱特性存在差异,但叶螨取食引发的早期生理响应可能具有某些共性的光谱特征,使得开发通用型检测模型成为可能。这为开发适用于多种作物的、成本更低的便携式检测设备提供了理论依据。
- 2.
红边与近红外区域是关键:特征选择结果一致表明,对早期检测最重要的波长集中在红边和近红外区域,而非人眼敏感的可见光区域。这强调了利用非可见光谱信息进行“透视”检测的优势,能够在肉眼观察到明显症状前捕捉到叶片内部的生理变化。
- 3.
为精准农业提供了实用化路径:研究表明,即使将高光谱数据大幅精简到少数几个有效波长,模型仍能保持一定的检测能力。这极具实用价值,因为这意味着未来可以针对这些特定波长开发专用的、成本更低的多光谱或滤光片式传感器,从而推动该技术从实验室走向温室或田间,实现实时、在线的病虫害监测。
- 4.
揭示了早期检测的挑战与潜力:本研究中,即使是性能最好的模型,其准确率也并非100%,且对草莓的检测效果普遍低于黄瓜。这反映了在症状极其轻微或无症状的“极早期”阶段进行检测的固有难度。然而,能够在如此早期的阶段达到可观的检测率,已充分证明了高光谱与机器学习结合技术的巨大潜力。
总之,这项研究为多作物害虫的早期光谱检测奠定了基础,是迈向智能化、精准化植物保护管理的重要一步。未来的研究可以探索将这种方法扩展到更多作物,并在更复杂的温室或大田环境中验证其鲁棒性,最终与实时传感技术结合,开发出可用于生产实践的早期预警工具。