《Ecological Indicators》:Enhancing multi-stage and multi-depth soil moisture estimation in winter wheat fields with UAV remote sensing fusion and ensemble learning strategy
编辑推荐:
本研究针对传统土壤水分监测方法在精度和泛化能力上的不足,创新性地融合无人机多源遥感数据与集成学习策略,系统评估了不同机器学习算法在冬小麦关键生育期对不同深度土壤水分含量的估测性能。结果表明,多源数据融合显著提升了估测精度,灌浆期XGBoost模型结合融合数据对表层土壤水分估测效果最佳,且Stacking集成策略进一步优化了模型性能,为旱地农业精准灌溉管理提供了可靠的技术参考。
水是生命之源,更是农业的命脉。在干旱半干旱地区,农业用水矛盾尤为突出,实现精准灌溉对于保障粮食安全和水资源可持续利用至关重要。这一切的基础,在于对农田土壤水分状况的精准把握。然而,传统的土壤水分监测方法,如称重法、时域反射计等,虽然测量准确,但属于点状测量,费时费力,且难以捕捉田间尺度的水分空间变异性,无法满足现代精准农业对高时空分辨率数据的需求。
卫星遥感技术为大范围监测提供了可能,但其空间分辨率往往较粗,难以满足田间管理的要求,且信号在植被覆盖密集时容易受到干扰。近年来,无人机以其灵活、成本低、分辨率高的优势,成为农田信息获取的新兴平台。它能够搭载多种传感器,如可见光、多光谱和热红外相机,从不同维度捕捉作物的生长信息。作物在水分胁迫下会表现出叶片颜色、冠层温度等生理特征的变化,这些变化可以被无人机遥感捕获,从而间接反演土壤水分状况。但这其中存在几个关键挑战:首先,遥感信号主要反映地表或冠层信息,如何准确估测对作物生长更为关键的深层土壤水分是一个难题;其次,作物不同生长阶段其冠层特征与土壤水分的关系会发生变化,这种时空非平稳性给模型构建带来了困难;再者,单一的机器学习模型在应对复杂非线性关系时,可能存在过拟合或泛化能力不足的问题。
为了解决这些挑战,发表在《Ecological Indicators》上的研究《Enhancing multi-stage and multi-depth soil moisture estimation in winter wheat fields with UAV remote sensing fusion and ensemble learning strategy》进行了一项系统性的探索。该研究旨在通过融合无人机多源遥感数据和采用集成学习策略,建立一个鲁棒的冬小麦农田土壤水分估测框架。
研究人员在新疆奇台县的冬小麦试验田开展了研究。他们利用大疆无人机平台,在冬小麦的拔节期、灌浆期和乳熟期这三个关键生育期,同步获取了高分辨率的RGB、多光谱和热红外影像。同时,在田间布设了60个固定监测点,使用TRIME-PICO-IPH时域反射计测量了0-60厘米深度内不同土层的土壤体积含水量,为模型构建和验证提供了地面真值数据。从遥感影像中,研究人员提取了包括归一化绿红差异指数、温度植被干旱指数等在内的21个植被指数和热红外指标。随后,他们系统评估了反向传播神经网络、支持向量回归、随机森林回归、极端梯度提升回归、高斯过程回归和梯度提升回归树这六种机器学习算法在不同数据源组合下的估测性能。为了进一步提升模型稳健性,他们还采用了Stacking集成学习策略,探索了不同基学习器组合和次学习器对模型性能的影响。
关键技术方法概述
本研究的技术核心在于多源数据获取与机器学习建模。研究在新疆奇台县冬小麦试验田进行,通过无人机平台同步获取RGB、多光谱和热红外影像,并结合地面TDR测量的不同深度土壤水分数据。研究系统计算了多种植被指数和热红外指标,并采用六种机器学习算法和Stacking集成学习策略,通过五折交叉验证评估模型在不同数据组合、生长阶段和土壤深度下对土壤水分含量的估测性能。
3.1. 不同生育期植被指数与表层土壤水分相关性分析
研究首先揭示了植被指数与表层土壤水分的关系随作物生育期动态变化的规律。在拔节期,植被指数与土壤水分呈显著负相关,这可能是因为植被覆盖度高导致蒸腾作用强,加速了土壤水分的消耗。进入灌浆期后,关系转变为正相关,此时水分供应直接影响籽粒灌浆。到了乳熟期,这种正相关性进一步增强,所有植被指数与土壤水分的相关性均高于灌浆期,表明乳熟期是进行表层水分遥感反演的最佳物候期。其中,基于红边和近红外波段的植被指数以及温度植被干旱指数在整个生育期内均与土壤水分保持了极显著的相关性。
3.2. 灌浆期不同传感器对表层土壤水分的估测
在灌浆期,不同数据源组合的估测效果差异明显。仅使用RGB数据的模型精度普遍较低。而基于多光谱数据的模型表现更优,支持向量回归模型取得了最佳结果。当融合多光谱和RGB数据后,反向传播神经网络模型的精度进一步提升。效果最好的是融合了多光谱、RGB和热红外的数据组合与极端梯度提升回归模型的结合,其R2达到0.73,相对均方根误差为0.06。这表明光谱信息的维度扩展和数据融合是提高土壤水分估测精度的关键途径。
3.3. 不同生育期表层土壤水分估测
模型估测精度同时受到生育期和特征维度的共同影响。在拔节期,使用融合数据的反向传播神经网络模型效果最优。灌浆期,融合数据下的极端梯度提升回归模型表现最佳。到了乳熟期,所有模型的精度均高于前两个时期,反向传播神经网络模型在融合数据下的R2达到0.76。总体而言,多源数据融合在各个生育期均能提升模型预测能力,特别是在拔节期和乳熟期显著改善了支持向量回归模型的性能。
3.4. 灌浆期不同深度土壤水分估测
随着土壤深度的增加,所有模型的估测精度均呈现下降趋势。对于0-20厘米和0-40厘米土层,极端梯度提升回归模型在融合数据下表现最好。对于0-60厘米的深层土壤,模型精度显著下降,随机森林回归模型在融合数据下相对最优。尽管估测深层土壤水分更具挑战性,但多源数据融合相比单一数据源仍在多数深度上改善了估测精度。
3.5. 基于集成学习的土壤水分估测
Stacking集成学习策略总体上提供了比单一基学习器更稳健的估测结果。当使用支持向量回归作为次学习器,并保留全部六个模型作为基学习器时,在融合数据条件下取得了最优的表层水分估测效果。集成学习未能显著提高深层土壤水分的估测精度。从基学习器组合来看,保留更多模型的组合在多数场景下取得了更好的估测性能,表明基学习器模型的多样性有利于提升集成效果。
3.6. 灌浆期冬小麦土壤水分的空间分布图
基于最优模型生成的土壤水分空间分布图,能够清晰显示田间的水分变异情况。低水分区域主要由胁迫处理和补种事件引起,与实地测量结果高度一致。这种空间化的估测结果有助于实现按需灌溉,为农业水管理者制定实时灌溉决策提供了高效合理的依据。
研究结论与重要意义
该研究成功构建了一个融合无人机多源遥感与集成学习的冬小麦农田土壤水分估测框架。其主要结论包括:确定了红边、近红外植被指数和热红外指标对土壤水分的高敏感性,并明确乳熟期是表层水分反演的最佳窗口;验证了多模态数据融合相较于单一数据源的显著优势;确定了极端梯度提升回归模型在融合数据下对表层土壤水分估测的优越性,以及其在深层土壤中仍保持的稳健性能;证明了Stacking集成策略能有效克服单一模型的局限性,特别是以支持向量回归作为次学习器的组合实现了最高的总体精度。
这项研究的创新之处在于系统性地探讨了数据融合和模型集成策略在应对土壤水分估测中垂直差异性、时空非平稳性和模型泛化能力等挑战方面的潜力。它不仅为旱地冬小麦农田的精准水分管理提供了坚实的理论依据和强有力的技术工具,其方法论对于其他作物和生态系统的水分监测也具有重要的借鉴意义。通过实现非破坏性、多深度的土壤水分动态监测,该研究为推动智慧农业和节水农业的发展迈出了坚实的一步。