编辑推荐:
本文提出并验证了一种混合效应时空学习框架(ME-LSTMMixed-Effects Long Short-Term Memory),用于动态评估不同耕作-秸秆管理措施(如RT、NTS、PTS)对玉米产量的影响并进行跨生态区稳健预测。该研究通过融合多年田间试验与文献资料的多源数据,利用滑动窗口重构捕捉管理滞后效应,并借助LSTM网络学习气候-土壤-遥感序列的非线性依赖关系。其核心创新在于引入了层次化混合效应模块,以显式分离管理固定效应与来源、地点、年份、地块的随机效应,从而吸收数据异质性,增强模型可解释性与跨区域迁移能力。研究结果表明,ME-LSTM在测试集上取得了优异的预测性能(R2= 0.8989, RMSE = 309.83 kg ha?1),并通过管理×环境交互项量化了系统对气候/土壤驱动因子的特异性敏感度,为制定气候适应性管理决策提供了有力工具。
摘要
Tillage–residue management is a controllable lever for improving maize yield and system resilience under climate variability. Here we propose a mixed-effects spatiotemporal learning framework (ME-LSTM) that integrates multi-source observations to enable robust yield prediction and management system evaluation across heterogeneous sites and years. First, we construct multi-year sliding-window inputs to represent legacy effects and cumulative influences of past management and environment. Second, a deep temporal encoder learns nonlinear dependencies from climate–soil–remote-sensing sequences to enhance interannual extrapolation. Third, a mixed-effects module explicitly separates management fixed effects from hierarchical random effects (e.g., source/study, site, year, and plot), absorbing source-specific biases and unobserved heterogeneity while improving interpretability. Finally, we parameterize management × climate/soil interactions to quantify system-specific sensitivities to environmental drivers and to support scenario-based comparison and recommendation of management options. Across multi-ecological maize datasets, ME-LSTM achieved an R2of 0.8989 with an RMSE of 309.83 kg ha?1on the test set. Ablation analyses show that removing remote-sensing features or ground-based temporal information substantially degrades performance, confirming the complementary value of multi-source fusion. Benchmarking against strong temporal baselines (LSTM, GRU, BiGRU, and Transformer) further demonstrates consistent accuracy gains of ME-LSTM, highlighting its suitability for small-sample, noisy, and hierarchically structured agricultural data. Overall, ME-LSTM provides an interpretable and scalable tool for climate-adaptive optimization of tillage–residue management and supports robust, actionable decision-making across diverse agro-ecological conditions.
1. 引言
粮食安全是国家安全的重要基石,准确的产量预测对于保障粮食供应、稳定市场和支持农业政策制定至关重要。然而,日益加剧的气候危机和极端天气事件频发,使得作物产量对气象变化的响应呈现高度随机和非线性特征。在作物生产系统中,管理措施是少数能够缓解这些气候风险的人为驱动因素之一。在基于玉米的种植体系中,免耕秸秆覆盖(No-till with straw mulch, NTS)和翻耕秸秆还田(Plow tillage with straw incorporation, PTS)是广泛应用的策略,可通过调节土壤水分缓冲能力和养分供应来改变产量结果。综合分析与荟萃分析证据表明,秸秆还田和减耕会影响土壤有机碳(Soil Organic Carbon, SOC)和作物产量,但这些效应的大小和方向在不同农业生态背景下差异显著。因此,产量模型必须超越静态预测,必须能够区分不同的耕作-秸秆管理体系,并显式量化其与环境条件的动态相互作用,以支持可操作、气候智能的决策制定。在更广泛的农学和生态学文献中定位此类模型尤为重要,因为管理效应常常依赖于具体环境,并可能随着降水格局和极端气候的变化而转变。
已有大量方法被探索用于作物产量预测。早期工作依赖于时间序列和经典统计模型(如ARIMA和多元回归),这些方法计算效率高,但通常不足以捕捉非线性和非平稳的产量响应。随着机器学习的发展,随机森林、支持向量机和神经网络等方法的应用日益增多。Shook等人开发了一个整合了谱系信息和气象时间序列的注意力增强LSTM模型,提高了关键物候期的预测准确性和可解释性。此外,序列模型如LSTM/Bi-LSTM和CNN–RNN混合模型在农业中被广泛应用,以从天气和遥感时间序列中学习时间依赖性,用于产量估计和相关决策支持任务。为了更好表征作物的时空动态,遥感技术已被整合到产量预测流程中。Zhuo等人通过四维变分方法和参数优化,将MODIS叶面积指数(Leaf Area Index, LAI)同化到WOFOST模型中,改善了区域冬小麦产量预测并减少了不确定性。Dhakar等人通过LAI同化和集合卡尔曼滤波(Ensemble Kalman Filter)整合了作物模型、遥感和天气预报,增强了对小麦物候和产量的预测,同时减少了对密集型田间管理输入的依赖。最近,基于Transformer的架构被引入以更好地捕捉遥感时间序列中的长程时间依赖性,在卫星时间序列中显示出改进的产量估算性能,迁移学习策略也被探索用于解决数据稀缺问题。值得注意的是,近期工作强调了多模态学习和跨区域迁移(例如,利用遥感进行产量预测的深度迁移学习),以及用于产量预测的注意力/Transformer多模态数据融合,反映了这个快速发展领域的快速进步。
尽管有这些方法学进展,关键的建模差距依然存在,特别是常见的深度学习训练/评估实践隐含地将样本视为独立,这与农业数据(例如,嵌套在研究、地点、年份和地块内的观测)的层次化、相关结构不匹配。大多数现有深度学习研究将管理视为静态背景因素,而非明确的决策变量。此外,它们常常未能将管理实践的“固定效应”与来自地点特异性土壤异质性和年际气候变率的“随机效应”解耦。生态学和应用统计领域的基础性且被广泛引用的参考文献已经建立了混合效应建模的最佳实践,包括指定随机效应、避免常见陷阱以及解释固定与随机分量的指南。关键的是,当产量观测嵌套在地块/田块和年份内时,标准LSTM或Transformer模型缺乏明确的机制来区分观察到的产量差异是由管理驱动,还是由未观测到的地点或年份水平效应(例如,土壤异质性和年份特异性天气冲击)驱动。结果,这些模型可能无意中将地点特异性噪声或年份特异性异常归因于管理标签,导致混淆和跨地点、年份的迁移性有限。标准LSTM或Transformer模型有过拟合地点特异性噪声的风险,而不是学习产量对管理-气候相互作用的广义响应。虽然荟萃分析表明,秸秆还田平均上提高了水分利用效率,但这些益处的程度和方向严格依赖于环境。因此,一个核心挑战依然存在:如何将多源观测整合到一个统一的框架中,该框架不仅能捕捉非线性时间动态,还能统计上处理层次异质性,从而在多变气候下实现情景特异性管理建议推荐。这一挑战促使了混合效应模型的应用,该模型可以在分离管理固定效应与层次随机效应的同时,显式建模管理-环境相互作用。最近关于混合效应模型设定可靠性的讨论进一步强调了在整合异构数据集时需要透明的层次建模选择。
为了弥补这些差距,提出了一个用于动态评估耕作-秸秆管理系统和玉米产量预测的混合效应时空学习框架(Mixed-Effects LSTM, ME-LSTM)。通过使用一个包含长期多地点试验和标准化文献记录的汇总数据集,评估了三个代表性系统(RT、NTS、PTS)。其核心创新在于将时间深度编码器与层次混合效应层(研究/来源-地点-年份-地块)进行端到端耦合,该层显式地将管理固定效应与多源偏差和未观测异质性分离开。这种设计使模型能够学习多年遗留效应,同时保持统计可解释性和跨区域、年份的迁移性。具体来说,ME-LSTM (1) 通过多年滑动窗口重构捕捉遗留效应;(2) 从气候-土壤-遥感序列中学习非线性时间依赖性;(3) 通过显式的管理 × 气候/土壤交互项量化系统特异性敏感度;(4) 输出依赖情景的、可解释的RT/NTS/PTS之间的对比,支持气候适应性建议,而非静态平均比较。通过将一种被广泛采用的层次建模原则嵌入到现代序列学习中,该框架在生态混合效应传统和最近一波用于农业预测的多模态深度学习浪潮中都占有一席之地。由于层次结构是显式的,该框架易于扩展到其他管理选项、其他作物和新兴数据流(例如,更高频的卫星产品),为未来的气候智能决策支持提供了一个通用蓝图。
2. 材料与方法
2.1. 研究地点与数据来源
本研究使用的数据来源于两个来源:(i) 2017–2025年在中国辽宁省阜新市(42.13° N, 121.74° E)进行的长期田间试验;(ii) 从54项符合条件的研究中通过荟萃分析提取编制的汇总文献数据集,覆盖了30个城市,观测时间跨度为2006–2024年。
评估了三个代表性的耕作-秸秆管理系统:秸秆移除的常规旋耕(Conventional rotary tillage with straw removal, RT)、秸秆覆盖/保留残留的免耕(No-till with straw mulch/retained residue, NTS)、秸秆还田的翻耕(Plow tillage with straw incorporation, PTS)。汇总地点涵盖了中国主要玉米生产省份/地区(例如辽宁、吉林、黑龙江、陕西、甘肃、内蒙古、山东、河南、山西、河北),覆盖了主要的玉米农业生态类型;在报告的情况下,原始试验遵循三次重复的随机完全区组设计。
经协调、质量控制和平滑窗口重构后,最终的监督学习数据集包含来自31个地点的837个样本,涵盖九年和三个管理系统(RT/NTS/PTS)。具体而言,81个样本来自阜新田间试验,756个样本来自文献数据集。为了实现三年窗口重构,文献记录仅在每个城市(或研究地点)提供至少连续三年的玉米种植记录,并有所需的结果和协变量时,才被保留,以构建一致的三窗窗口。在两个来源中,籽粒产量均标准化为 kg ha?1,气象变量按每年玉米生长季汇总,土壤变量在可行时对齐到0–20 cm土层。如果缺少必要的元数据(地点/年份/管理描述)、处理无法明确映射到RT/NTS/PTS,或者无法进行跨源协调,则记录被排除。
对于模型开发和评估,采用了严格按时间排序的分割以防止时间泄漏。在所有三年窗口构建完成后,样本按窗口结束年份排序,然后以8:1:1的比例分割为训练/验证/测试集。最早的80%样本用于模型拟合(训练集),随后的10%用于超参数调优和提前停止(验证集),最近的10%保留为独立测试集用于最终性能报告。此协议确保了训练或模型选择期间不使用未来年份的信息。
为了量化预测不确定性,采用了基于集成的策略。具体而言,使用相同的训练协议但不同的随机种子和训练集的bootstrap重采样训练ME-LSTM模型。对于每个输入样本,获得预测的经验分布。95%预测区间(PI)计算为该分布的2.5%和97.5%分位数,并汇总PI宽度以表征跨年份和管理系统的不确定性。此过程捕捉了有限样本下的数据驱动变异性和模型不稳定性。
由于田间观测和文献来源的记录在空间/时间粒度和测量协议上存在差异,采用了协调优先策略整合两个来源:(1) 变量被标准化到一致的单位和定义;(2) 观测与玉米生长季对齐;(3) 在建模阶段引入层次随机效应以吸收来源特异性偏差和未观测异质性。具体而言,针对研究/来源(文献)和地点/地块(田间试验)的随机截距允许模型解释由测量方法、管理报告详细程度和背景条件差异引起的系统性偏移,从而提高了跨源可比性和泛化能力。
土壤样品在玉米收获后使用S形取样模式从0–20 cm耕层采集。土壤有机碳(SOC)采用外加热重铬酸钾氧化法测定,土壤有机质(Soil Organic Matter, SOM)由SOC通过转换因子1.724计算得出。气象数据来自每个试验点的自动气象站,记录了整个玉米生长季的日降水量和气温。产量数据通过收获法(逐区收获)收集;籽粒重量精确测量并转换为单位面积产量。
遥感数据来自美国地质调查局(U.S. Geological Survey, USGS)提供的多光谱Landsat地表反射率产品,包括Landsat 5 TM、Landsat 7 ETM+和Landsat 8 OLI,并与每个地点-年份在玉米生长季期间匹配。所有图像均处理为地表反射率,并使用附带的QA掩膜进行质量过滤以去除云和云影。为确保跨传感器一致性,使用每个传感器对应的近红外、红和蓝反射波段计算植被指数。计算了四个具有生理学意义的指数(NDVI、SAVI、MSAVI、EVI),并在玉米关键生长阶段(拔节、抽雄、灌浆)提取,从而形成一个阶段性的时间序列特征集,捕捉冠层动态。指数定义见正文。
不同耕作-秸秆管理系统下主要土壤和气候变量的描述性统计在正文中汇总。总体而言,NTS下的SOC (26.32 ± 2.54 g kg?1) 和SOM (45.38 ± 4.38 g kg?1)显著高于PTS和RT,其变异系数相对较低,表明NTS在维持土壤肥力稳定性方面表现更好。平均温度在各系统间基本相当,而降水量表现出显著的年际变异性(变异系数 = 72.6%),突显了明显的气候不确定性,并强调了进行适应性、气候韧性动态管理研究的必要性。
2.2. 滑动窗口时间重构与数据集构建
耕作-秸秆管理系统的效应表现出显著的累积和滞后特征。当年的产量不仅受当年管理措施的影响,也受之前年份耕作-秸秆管理和环境条件历史的影响。为有效捕捉这种时间依赖性,采用了一种基于滑动窗口的时间重构方法,将多年观测整合到监督学习样本中,从而提取产量形成的动态模式。此重构应用于汇总多源数据集,涵盖中国31个地点、九年观测和三个管理系统。
具体而言,使用了三年窗口长度。连续三年的观测被重构为一个监督样本来预测窗口最后一年的玉米产量。在每个窗口内,为气象和土壤变量提取了三种类型的衍生时间特征:(1) 三年平均值,代表窗口期间的平均水平;(2) 三年标准差,表征年际变异性;(3) 时间趋势(结束值减去起始值),描述窗口内的变化方向。通过此重构,原始时间序列被转换为监督学习格式,产生了837个样本。由于各地点记录长度和完整性不同,每个地点贡献的重构三年窗口数量不一定相等。每个样本包含42个特征,共同代表土壤动态、气候条件、光谱信息和管理描述符。每个三年窗口内的原始变量集包括两个土壤属性(土壤有机质和土壤有机碳),七个生长季气象变量(降雨频率、平均降水量、平均气温、最大降水量、最小降水量、最高气温、最低气温),四个卫星衍生的植被指数,以及三个管理指标。对于连续变量,进一步推导了窗口级汇总特征(_mean, _std, _diff)以编码平均状态、年际变异性和方向变化,共同构成建模中使用的聚合特征表示。为了避免特征维度的混淆,定义了两个互补的输入:(i) 一个年度级别的时间步长特征向量,用作时序网络的序列输入(LSTM分支),(ii) 一个窗口级别的聚合特征向量(三年窗口内的均值、标准差和趋势),用作混合效应/统计分量的补充输入。这种设计保留了窗口内的时间依赖性,同时捕捉累积和变异信号。通过结合序列输入和聚合输入,模型在保证无信息泄漏的前提下,学习短期动态和多年遗留效应。结合严格按时间排序的分割,此重构确保了在模型训练或模型选择期间不使用未来年份的信息,从而防止了时间泄漏。
2.3. 混合效应LSTM模型(ME-LSTM)架构
作物产量形成同时受到连续变化的时间变量和层次化/组结构因素的影响。为联合捕捉非线性时间依赖性和层次异质性,设计了一个层次化集成建模框架,称为混合效应LSTM模型(ME-LSTM)。在ME-LSTM中,时序网络提取的高级时间特征与一个混合效应组件相融合,该组件由管理固定效应、层次标识符的随机效应以及显式的管理-环境交互项组成。整体模型架构如图所示。
该模型是一个端到端神经网络,其前向传播和最终输出可解释为公式(1):
?i, t+1= ziTα + xtTβ + (zi⊙et)Tγ + fLSTM(Si, [t-2:t]) + ustudy+ uyear+ uplot
其中?i, t+1表示第t+1年、第i种