可迁移至棉花灌溉调度的田间尺度日土壤水分预测:基于最小输入长短期记忆网络

《Smart Agricultural Technology》:Transferable field-scale daily soil moisture forecasting in cotton with a minimal-input LSTM for irrigation scheduling

【字体: 时间:2026年05月04日 来源:Smart Agricultural Technology 5.7

编辑推荐:

  摘要 准确的田间尺度日土壤水分预测对于数据驱动的灌溉调度至关重要,然而针对该任务的机器学习操作框架仍然有限。利用2023年(训练/验证)和独立的2024季(迁移学习)的棉花田间测量数据和农场气象数据,研究人员对随机森林(RF)、极限梯度提升(XGBoost)、

  
摘要 准确的田间尺度日土壤水分预测对于数据驱动的灌溉调度至关重要,然而针对该任务的机器学习操作框架仍然有限。利用2023年(训练/验证)和独立的2024季(迁移学习)的棉花田间测量数据和农场气象数据,研究人员对随机森林(RF)、极限梯度提升(XGBoost)、支持向量机(SVM)和长短期记忆网络(LSTM)在序列土壤水分预测中的表现进行了基准测试。其中,LSTM始终实现了最高精度,捕捉了传统机器学习模型无法捕捉的时间依赖性。特征重要性分析确定降水(prcp)、太阳辐射(srad)和水汽压(vp)为三个主要驱动因子。使用这三个驱动因子训练的最小输入LSTM保持了接近基线的性能(R2=0.95)。将最小输入LSTM模型通过迁移学习应用于独立的2024生长季数据,经微调后显示出适度的预测技能(R2=0.56)。该紧凑型LSTM模型的操作部署使得利用简单的土壤水分阈值进行田间尺度灌溉调度成为可能,并可通过滞后(hysteresis)、短期平滑(short-memory smoothing)和水均衡检查(water balance checks)进行增强。结果表明:(i) 基于序列的LSTM架构对于日尺度田间土壤水分预测具有鲁棒性;(ii) 一个紧凑且物理信息化的驱动因子集(降水-辐射-水汽压)在低数据需求下保持了高模型精度;(iii) 预测可直接转化为清晰的灌溉决策。该方法提供了一种可解释且可扩展的框架,将机器学习模型与实际水管理联系起来,并为砂质土壤中的精准灌溉提供了低负担、高精度的流程。
论文解读:基于最小输入LSTM的棉花田土壤水分预测与灌溉调度研究
本研究由克莱姆森大学农业科学系的Qiong Su、Yun Lin、Glen C. Rains及Javad Mohammadpour Velni共同完成,旨在解决田间尺度土壤水分精准预测及其在灌溉调度中的应用难题,相关成果发表于《Smart Agricultural Technology》。
研究背景与现状
有效根区土壤水分是作物水分吸收与产量的关键,也是灌溉决策的基础。然而,田间尺度的原位高频监测面临传感器网络部署维护成本高、空间覆盖不均等问题。尽管微波遥感与再分析产品提供了广域覆盖,但其主要反映表层2-5 cm土壤状况,且易受植被干扰。传统的基于物理的水文模型虽具解释性,但参数化复杂且依赖高质量输入数据。相比之下,机器学习(ML)虽能从多源数据中捕捉非线性关系,但在田间应用中常受限于数据稀疏、跨季节泛化能力差以及“黑箱”特性导致的信任缺失。因此,开发一种结合物理机制、具备可解释性且能适应跨季节变化的田间尺度日土壤水分预测框架,成为精准灌溉领域的迫切需求。
关键技术方法
研究人员利用佐治亚州蒂夫顿校区2023年(训练/验证)和2024年(迁移学习)的棉花田间试验数据。试验地土壤为砂质壤土(loamy sand),排水迅速。数据采集包括植株性状(株高、节数、SPAD)、土壤指标(8 cm深处体积含水量、温度、电导率)及Daymet气象数据集。特征工程构建了基础特征集与包含参考蒸散量(ET0)、水汽压差(VPD)及水平衡(WB)等的工程特征集。模型基准测试涵盖随机森林(RF)、XGBoost、支持向量机(SVM)和长短期记忆网络(LSTM)。采用基于排列的重要性分析进行特征筛选,并实施渐进式解冻(progressive unfreezing)策略进行跨季节迁移学习。模型性能通过决定系数(R2)、均方根误差(RMSE)和平均绝对误差(MAE)进行评估。
研究结果
3.1 模型与特征集的比较
研究人员首先对比了四种算法在基础特征集下的表现。结果显示,LSTM在测试集上的准确度最高(R2=0.96),显著优于RF(0.77)、XGBoost(0.70)和SVM(0.61)。尽管SVM在训练集上拟合良好,但在测试集上泛化能力急剧下降,表现出严重的过拟合。引入工程时序特征后,RF、XGBoost和SVM的性能得到显著提升(如XGBoost的R2升至0.89),但LSTM的性能未获实质性增益,表明其直接从序列数据中学习时间依赖性的能力已足够优越。
3.2 重要性引导的特征选择与LSTM重训练
基于排列的重要性分析显示,对于LSTM,降水(prcp)、太阳辐射(srad)和水汽压(vp)是贡献最大的三个变量,累计贡献率约80%。基于此,研究人员构建了仅含这三个驱动因子的“最小输入LSTM”并重新训练。该模型在2023年测试集上仍保持了高性能(R2=0.95,RMSE=0.84%),证明了在砂质、快排水系统中,仅需少量关键气象因子即可实现高精度预测,大大降低了数据需求与模型复杂度。
3.3 从2023到2024生长季的迁移学习
在将2023年训练的模型直接应用于2024年数据时,由于大气水汽压(vp)和土壤水分本身的分布偏移(domain shift),模型性能崩溃(R2=-10.95)。通过采用渐进式解冻策略进行微调(先调整输出层,再解冻密集层和顶层LSTM),模型性能得到显著恢复(R2=0.56,RMSE=1.08%)。这表明尽管存在年度间差异,LSTM学到的底层时间表征具有一定的可迁移性。
3.4 对每日灌溉调度的启示
针对研究区域的砂质土壤(田间持水量14%,萎蔫点5%),研究设定了10%体积含水量的保守灌溉阈值。基于LSTM的预测,2023年识别出六个主要的灌溉窗口,而2024年则因持续的水分亏缺显示出全时段灌溉的需求。该阈值法结合滞后处理、短期记忆平滑和水均衡检查,可将预测直接转化为可操作的灌溉处方。
讨论与结论
讨论部分
研究者指出,8 cm深度的浅层测量虽成本低廉,但可能与根区实际状况脱节。为此,建议引入滞后带(hysteresis band)、水均衡背景检查(如要求7日水平衡为负且无水日≥5天)以及短期记忆土壤水指数(SWI)来稳定触发信号。此外,针对早期冠层覆盖不足的情况,建议采用基于生长度日(GDD)或叶面积指数(LAI)的动态阈值。尽管研究展示了良好的初步季节性可移植性,但由于2023至2024年的转移涉及气候变异与地块物理特性的复合偏移,未来仍需在多站点、多年份条件下进一步验证其普适性。
结论部分
本研究证明,结合紧凑型物理信息特征选择的LSTM是棉花田砂质壤土日尺度土壤水分预测最准确且鲁棒的方法。LSTM始终优于RF、XGBoost和SVM,且在经过重要性引导剪枝后,仅依靠降水(水分供应)、太阳辐射(蒸散能量)和水汽压(大气需求)三个可解释驱动因子即保持了接近基线的技能。工程化的时序聚合特征虽显著改善了表格基线模型,但对LSTM而言基本冗余。研究还展示了初步的季节性可移植性:通过“检测-适应”的迁移学习步骤,模型在显著的年际输入输出偏移下提高了适用性,尽管2024年的表现仅属中等,提示了跨季节转移的局限性。最后,结合约10% VWC的简单水分阈值(可选配滞后、平滑及水均衡检查),可将预测转化为透明的灌溉计划。这些要素共同提供了一个准确、可解释且操作高效的流程,将数据与日常灌溉决策联系起来,降低了过度或不足灌溉的风险,支持在生产环境中规模化部署。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号