动态预测与归因：不同年份类型下的农田蒸散量

《Agricultural Water Management》：Dynamic prediction and attribution of farmland evapotranspiration across year types

【字体：大中小】 时间：2026年05月11日 来源：Agricultural Water Management 6.5

编辑推荐：

　　湖南孙|贾昊安|雷玉平|沈娟|刘帆|窦晓军|沈彦军|张玉翠中国石家庄050022，中国科学院遗传与发育生物学研究所农业资源研究中心，节水农业河北重点实验室，滦城农业生态系统实验站 **摘要** 准确预测农田实际蒸散量（ETc act）对于优化农业水资源管理和保障粮

　　湖南孙|贾昊安|雷玉平|沈娟|刘帆|窦晓军|沈彦军|张玉翠
中国石家庄050022，中国科学院遗传与发育生物学研究所农业资源研究中心，节水农业河北重点实验室，滦城农业生态系统实验站

**摘要**
准确预测农田实际蒸散量（ETc act）对于优化农业水资源管理和保障粮食安全至关重要。本研究利用华北平原滦城站1984-2023年的温度和降水数据，将2007至2023年间的年份分为六类：温度年份类型（平均/寒冷/温暖温度年份：ATY/CTY/WTY）和降水年份类型（高/低/平均降水年份：HPY/LPY/APY）。基于2007-2023年的日气象变量和涡度协方差方法测得的ETc act数据，开发了六种机器学习模型（RF、XGBoost、SVR、MLP、LightGBM和CatBoost）。结果显示，不同水热年份类型的ETc act存在显著差异，四分位数范围（IQR）在2.47至2.75毫米/天之间。CatBoost模型在ATY、CTY、HPY和APY类别中表现优异，并且在整个数据集上取得了最佳的整体效果（测试集R2 = 0.80，RMSE = 0.79毫米/天）。MLP和XGBoost模型分别在WTY和LPY情况下表现出特定优势，其R2值达到0.81和0.82。SHAP框架揭示了灌溉农田ETc act驱动因素的贡献模式。日太阳辐射和温度相关变量是所有年份类型中的主要驱动因素，分别占ETc act贡献的27.75%和34.34%。相比之下，空气湿度、风速和降水量是次要因素。此外，分析表明，日总太阳辐射必须超过18.3 MJ/m2才能显著增加ETc act。将最优CatBoost模型应用于九个全球FLUXNET农田站点进行独立训练和验证，测试集R2值介于0.65至0.86之间。通过结合年份类型识别和可解释的机器学习来揭示气候胁迫下ETc act驱动因素的动态模式，本研究为复杂环境中的模型动态适应和优化提供了理论支持。

**1. 引言**
作为陆地生态系统水循环和地表能量平衡的核心环节，蒸散作用（ET）是一个结合土壤蒸发、冠层截留和植被蒸腾的复合水文过程（Haghighi和Kirchner，2017）。其动态不仅深刻影响区域和全球气候模式，还是制约陆地生态系统生产力的关键变量（Granata等，2024）。在农业领域，ET代表作物的总水分消耗，与它们的生长过程和最终产量直接相关。华北平原（NCP）作为中国的粮食生产核心区，由于水资源匮乏而面临严峻的农业发展挑战（Sun等，2010）。该地区以冬小麦-夏玉米轮作为主，这种水资源密集型农业模式引发了严重的水资源短缺与粮食生产之间的冲突，成为可持续农业发展的关键瓶颈（Iqbal等，2014；Li等，2024；Wang等，2024）。因此，准确预测农田蒸散量对于优化水资源配置、提高农业用水效率和确保粮食安全具有重要的理论和实践意义。

目前，估算实际作物蒸散量（ETc act）的方法主要包括直接观测技术、经验公式和基于物理的模型。微气象方法如涡度协方差法（Scott，2010）和Bowen比率法（Todd等，2000），以及直接测量仪器如蒸渗仪（Liu等，2002）和闪烁仪（Guyot等，2009）在获取高精度数据方面表现出色。然而，这些方法通常存在设备成本高、操作复杂和需要大量时间的挑战。像Hargreaves-Samani（Hargreaves和Samani，1985）和Priestley-Taylor（Priestley和Taylor，1972）这样的经验模型在数据稀缺地区仍然具有价值，因为它们所需的输入参数较少且数据容易获取。然而，这些模型的性能高度依赖于温度和辐射参数与参考蒸散量（ETo）之间的具体关系（Patil和Deka，2016），当风速或湿度等其他因素占主导时，其准确性会受到影响。此外，这些方法的默认参数无法保证在不同气候区域的可靠性（Su等，2022），导致模型准确性和泛化能力有限。相比之下，“两步”方法，以物理上全面的FAO56-Penman-Monteith（PM）模型为中心，被广泛采用（Allen等，1998）。该框架通过将ETo乘以作物系数（Kc）和土壤水分胁迫系数（Ks）来估算ETc act。然而，在计算实际农田ETc act时，该模型对难以准确确定的参数（如表面电阻和空气动力阻力）非常敏感。此外，在许多发展中国家获取大规模时空气象数据（如气温、太阳辐射、风速、水汽压）具有挑战性（Yong等，2024）。另外，作物系数、冠层气孔导度和水分胁迫系数等参数难以准确估计，因为它们受到土壤条件、作物生长状态和灌溉方法等因素的显著影响（Han等，2021）。

为了解决传统物理模型在参数敏感性、数据获取成本和泛化能力方面的局限性，基于数据的方法（如机器学习（ML）为ET估算提供了新的途径（Bellido-Jiménez等，2023）。与传统依赖于显式物理方程的方法不同，ML模型的优势在于它们能够自动学习并捕捉高度复杂的非线性关系（Tasan等，2022）。这种能力使它们在水文学（Bhasme等，2022）、生态学和环境科学（Shi等，2024）以及农学（Wang等，2025）等领域展现出优异的预测性能。近年来，机器学习在ET估算中的应用尤为显著。研究表明，随机森林（RF）、极端梯度提升（XGBoost）、支持向量机（SVM）和多层感知器（MLP）等模型仅使用常规气象变量（如温度、辐射和湿度）即可达到与传统经验或半经验方程相当的预测精度（Ferreira和da Cunha，2020；Mehdizadeh等，2017；Reis等，2019）。凭借强大的非线性映射能力和不需要复杂物理参数的优势，机器学习成为ET估算的研究前沿，为高精度预测开辟了新途径。然而，这些纯数据驱动模型的主要挑战在于它们在其他地点和气候条件下的空间迁移性。为了解决这一局限性，本研究不仅关注局部动态预测，还扩展了其框架，以明确评估最优模型在全球不同FLUXNET站点上的泛化能力。

尽管这些模型已被证明是理解和量化不同时空尺度ET过程的有效工具，但现有研究仍存在一些局限性。首先，大多数模型在考虑ET对不同水热年份类型下的不同响应机制方面存在不足，这可能限制了它们在特定气候条件下的预测准确性和泛化能力。虽然先前的研究探讨了温度、辐射和降水等气象因素对ET的影响（Aschale等，2023；Jia等，2023；Valipour和Guzmán，2022），但缺乏对这些驱动因素动态变化的深入、定量和系统分析，以及它们相对重要性的精确排序和复杂相互作用，特别是在长时间序列和不同环境胁迫条件下。其次，尽管机器学习在预测性能上取得了突破，但其“黑箱”本质仍限制了科学解释的深度。传统的特征重要性评估方法（如基于树模型中信息增益的归因）难以揭示复杂模型的内部决策机制，也无法提供细粒度的局部解释，从而限制了对ET主导因素和调控原理的深入理解。为了解决这个问题，研究人员提出了各种方法，如局部可解释模型不可知解释（Local Interpretable Model-agnostic Explanations）、Shapley加性解释（ShAP）和类激活映射（Class Activation Mapping）（Jones等，2022；Wei等，2022；Xue等，2024）。其中，基于博弈论的SHAP框架能够准确归因每个特征的贡献，并通过计算其Shapley值来确定其影响方向。此外，该框架还可以通过特征交互值量化多个因素之间的协同效应，显著增强了模型解释的一致性和稳定性（Hu等，2021）。虽然先前的研究广泛应用SHAP来识别ET的主要驱动因素，但大多数方法依赖于静态的全球特征归因（Li等，2026；Guan等，2026）。为了解决这一局限性并突出我们的创新贡献，本研究将SHAP的应用从基本变量排序扩展到动态机制转换和非线性生理阈值的提取。具体而言，我们利用该框架定量追踪不同气候背景下能量驱动（需求受限）和生理限制（供应受限）蒸散机制之间的潜在转换。

本研究以华北平原典型的冬小麦-夏玉米轮作系统为例，基于降水量和累积温度指数构建了一个六类水热年份分类系统，包括温度年份类型（平均/寒冷/温暖：ATY/CTY/WTY）和降水年份类型（高/低/平均：HPY/LPY/APY）。研究目标包括：（1）揭示不同水热背景下农田实际蒸散量（ETc act）的动态响应机制；（2）比较六种机器学习模型（RF、XGBoost、SVM、MLP、LightGBM和CatBoost）在不同年份类型下的预测准确性，并探索模型性能对不同气候条件的适应能力；（3）整合SHAP可解释框架，定量分析关键气象因素对ETc act的相对贡献权重及其在不同代表性年份类型下的动态演变。通过采用这种结合年份类型识别、机器学习预测和深度SHAP基础归因分析的新研究方法，本研究不仅旨在实现更精确的ET动态模拟，还致力于从数据驱动的角度系统解释不同气候情景下统治农田ET的主要气象因素及其调控模式。

**2. 材料与方法**
**2.1. 研究区域**
研究区域位于中国科学院滦城农业生态系统实验站，位于华北平原中部冲积平原（37°53′N，114°41′E，海拔50.1米）。该地区具有典型的暖温半湿润大陆性季风气候，四季分明，夏季降雨和高温同时发生。根据长期气象数据，该地区的年平均温度约为12.3°C，年平均降水量为450至550毫米，其中70%以上的降水量集中在6月至8月的夏季（Zhang等，2011）。该站点的种植系统是冬小麦和夏玉米的一年两季轮作。夏玉米在6月中旬播种，9月底收获，而冬小麦的生长期从一年的10月初延续到次年的6月中旬（Guo等，2023）。研究期间，该农业生态系统的年平均灌溉量为230毫米。实验站地的土壤类型为壤土，田间持水量为35%，容重为1.53克/立方厘米（Zhang等，2013）。不同机器学习模型在整体数据集上的性能评估。（注意：对于RMSE和MAPE轴，数值越小，其位置越靠外边缘，表示性能越好。）下载：下载高分辨率图片（632KB）下载：下载全尺寸图片

图4. 不同年份类型下，最优模型对ETc实际值的预测性能和拟合优度的评估。该图展示了六个不同水热年份类型的模拟日平均ETc实际值与最优模型预测值的散点图。其中，橙色点代表训练集，蓝色点代表测试集；黑色虚线是1:1参考线，实线是对应数据集的线性回归线。每个子图显示了最优模型对其所在年份类型的预测结果：(a) 平均温度年份（ATY，使用Catboost算法），(b) 寒冷温度年份（CTY，使用Catboost算法），(c) 温暖温度年份（WTY，使用MLP算法），(d) 降水量高的年份（HPY，使用XGBoost算法），(e) 降水量低的年份（LPY，使用CatBoost算法），(f) 降水量适中的年份（APY，使用Catboost算法）。下载：下载高分辨率图片（129KB）下载：下载全尺寸图片

图5. 不同年份类型下，最优模型预测中每个气象因素的平均SHAP值。下载：下载高分辨率图片（388KB）下载：下载全尺寸图片

图6. 不同水热年份类型下，影响ETc实际值的驱动因素的SHAP值分布。该图是一个SHAP摘要图，全面展示了每个特征的重要性及其对模型预测结果的影响。y轴上的特征按全局重要性（平均绝对SHAP值）从高到低排序。x轴表示SHAP值，指示特征对单一样本预测结果（ETc实际值）的贡献程度和方向；正值表示促进效应，负值表示抑制效应。图中的每个点代表一个样本，其颜色表示该天该特征的实际值大小（红色表示高值，蓝色表示低值）。每个子图(a–f)对应于不同年份类型的最优模型预测结果：(a) 平均温度年份（ATY，使用Catboost算法），(b) 寒冷温度年份（CTY，使用Catboost算法），(c) 温暖温度年份（WTY，使用MLP算法），(d) 降水量高的年份（HPY，使用XGBoost算法），(e) 降水量低的年份（LPY，使用XGBoost算法），(f) 降水量适中的年份（APY，使用Catboost算法）。下载：下载高分辨率图片（422KB）下载：下载全尺寸图片

图7. 不同水热年份类型下，太阳辐射和关键温度因素对蒸散作用的交互效应。该图是一个SHAP交互图，x轴表示太阳辐射（SR）的值，y轴表示SR的SHAP值，表示其对蒸散作用（ETc实际值）预测的贡献。点的颜色表示协同作用特征的值，红色代表高值，蓝色代表低值。每个子图(a–f)对应于不同年份类型的最优模型预测结果：(a) 平均温度年份（ATY，使用Catboost算法），(b) 寒冷温度年份（CTY，使用Catboost算法），(c) 温暖温度年份（WTY，使用MLP算法），(d) 降水量高的年份（HPY，使用XGBoost算法），(e) 降水量低的年份（LPY，使用XGBoost算法），(f) 降水量适中的年份（APY，使用Catboost算法）。下载：下载高分辨率图片（1MB）下载：下载全尺寸图片

图8. CatBoost模型在九个代表性农业生态系统站点上的性能验证。该图显示了独立训练的CatBoost模型预测的日平均实际蒸散作用（ETc实际值）与实际观测值的散点图。橙色点代表训练集，蓝色点代表测试集。黑色虚线是1:1参考线，实线是对应数据集的线性拟合线。子图对应于：(a) US-Ne1（灌溉连续种植的玉米，美国），(b) US-Ne2（灌溉玉米-大豆轮作，美国），(c) US-Ne3（雨养玉米-大豆轮作，美国），(d) US-ARM（美国南部大平原），(e) DE-Geb（德国干旱耕地），(f) FR-Gri（法国温带耕地），(g) IT-BCi（意大利地中海气候），(h) FI-Jok（芬兰北方耕地），以及(i) CH-Oe2（瑞士高降水量耕地）。

2.2. 数据收集与处理
2.2.1. 气象数据和涡度协方差观测蒸散作用（ETc实际值）
本研究使用的气象数据（1984–2023年）来自实验站部署的无线自动气象站（Model A753 WS，Vaisala，芬兰），并补充了同期的人工观测记录。该气象站以1小时频率监测气温、相对湿度、风速、太阳辐射、地表温度和降水量等气象要素。最终构建的日气象变量包括：日平均气温（Tmean）、日最高气温（Tmax）、日最低气温（Tmin）、相对湿度（RH）、露点温度（TD）、平均日蒸发压（VP）、2米风速（W2）、日太阳辐射（SR）、地表温度（ST）和日降水量（P）。数据序列中的小间隙采用分层插补方法填补：首先使用同期人工观测记录填补，如果仪器数据和人工数据都缺失，则使用线性插补填补间隙，以确保数据序列的完整性和连续性。
实际蒸散作用（ETc实际值）通量数据（2007–2023年）是通过位于兰城站的开放路径涡度协方差（EC）系统获取的。该系统包括一个CO2/H2O红外气体分析仪（LI-7500A，LI-COR，美国）和一个三维声学风速仪（CSAT 3/3B，CAMPBELL，美国），安装高度为地面以上3.5米。冠层高度随作物生长而变化，小麦的最大高度为0.8米，玉米的最大高度为2.5米。系统在盛行风向下的覆盖范围约为塔架的50–100米。该系统的安装、数据采集和维护严格遵循ChinaFLUX网络的技术标准，以确保数据标准化和高质量。原始的高频通量数据以10赫兹的采样频率采集，并处理成30分钟的平均值，随后经过一系列严格的后期处理程序，主要包括去尖峰、时间滞后消除、双坐标旋转、频率响应校正和质量控制（Zhang等，2022a；Liu等，2023；Allen等，2011）。为了验证通量数据的最终质量，评估了该站点的能量平衡闭合情况。结果显示，研究期间的能量平衡闭合值始终大于0.85（图S1），证实了本研究中使用的EC测量数据具有可靠的质量（Teixeira等，2008）。

2.2.2. Global FLUXNET验证数据
为了评估所提出的建模框架的稳健性和泛化能力，使用FLUXNET网络内的九个代表性农田站点的数据进行了独立验证。为了确保数据的可靠性和全面验证空间适应性，这些站点的选择基于三个具体标准：(1)时空和生态多样性；(2)参数可用性；(3)高质量和连续性。根据多样性标准，所选站点有意涵盖了广泛的纬度范围，以全面测试模型在不同地理、气候和管理环境下的适应性。具体来说，选择范围涵盖了从灌溉系统到雨养系统的管理梯度（US-Ne1，US-Ne2，US-Ne3；2002–2013年），以及从北美洲到欧洲的广泛气候梯度，包括地中海、温带和北方区域（US-ARM，2003–2012年；DE-Geb，2001–2014年；FR-Gri，2004–2014年；IT-BCi，2004–2014年；FI-Jok，2000–2003年；CH-Oe2，2004–2014年）。为了满足参数可用性和数据质量的标准，所有验证站点都采用了与兰城站相同的气象因素集作为模型特征。所有ETc实际值数据均来自具有长期观测记录且缺失值最少的涡度协方差观测。此外，这些数据集经过了与主站一致的质量控制和间隙填补程序，以确保验证数据集的稳健性、完整性和连续性。

2.2.3. 年份类型分类方法
为了研究不同水热背景下ETc实际值的响应模式，本研究对研究期间的年份进行了分类。考虑到研究区域的冬小麦-夏玉米轮作情况，“生长年份”被用作基本的时间单位，其中冬小麦生长季节从10月1日持续到次年的6月15日，夏玉米生长季节从6月16日持续到9月30日。年份类型的分类分别针对温度和降水量两个维度进行。
(1) 基线气候计算：为了获得稳定且具有代表性的气候背景值，并确保年份类型分类的准确性和可靠性，本研究使用了1984年至2023年的长期气象数据。计算了生长年份的总降水量（μP）和年累积温度（μT）的多年平均值（1984–2023年），以及它们的标准差（σP和σT）。年累积温度定义为生长年度内所有大于0°C的日平均温度之和。
(2) 标准化指数计算：对于本研究涵盖的每个生长年份（2007–2023年），计算了其年总降水量（Pt）和年累积温度（Tt）的标准化异常指数（I）。该指数的公式为：
It = Xt ? μt / σt
其中It是第t个生长年份的标准化指数，Xt是该生长年份的观测值（Pt或Tt），μt和σt分别是相应变量在基准期间（1984–2023年）的多年平均值和标准差。根据计算出的标准化指数I的值，每个生长年份按照以下标准进行分类（McKee等，1993；Xu等，2022）：当I > 1.0时，该年份被定义为温暖温度年份（对于温度）或高降水量年份（对于降水量）。当?1.0 ≤ I ≤ 1.0时，该年份被定义为平均温度年份或降水量适中年份。当I < ?1.0时，该年份被定义为寒冷温度年份或低降水量年份。通过应用这些标准化标准，连续的长期气候被有效地离散化为具有代表性的水热情景。然而，在灌溉农业系统中使用基于降量的分类需要明确其背后的生态水文意义。尽管灌溉可以均匀土壤湿度，但它无法抵消大气蒸发的总体需求。在中国北方平原，降水量低的年份通常伴随着强烈的太阳辐射和升高的水汽压差（VPD），这显著影响作物的气孔行为。因此，年份类型分类作为宏观气候背景的重要代理，而不仅仅是土壤水分输入。同时，为了防止掩盖短期极端事件（例如热浪），建模和SHAP归因仅在日尺度上进行，以确保高度动态的、基于事件的生理反应能够在整体气候框架内得到明确捕捉。

2.3. 机器学习模型构建
本研究选择了六个来自不同理论框架的代表性机器学习模型来预测ETc实际值，并比较它们在不同水热年份类型下的性能差异。这些模型主要包括基于Bagging和Boosting策略的集成树模型、支持向量回归以及人工神经网络。随机森林（RF）是一种基于Bagging集成策略的强大机器学习方法。它通过同时对训练样本和特征进行随机采样来构建大量独立的决策树，并通过平均机制输出结果。这种并行策略有效降低了模型的方差并提高了其泛化性能（Pagano等，2023）。与RF的并行构建不同，本研究还采用了三种基于Boosting策略的集成树模型，这些模型以串行方式迭代优化模型。极端梯度提升（XGBoost）是这一类别的经典算法；它通过迭代构建新的决策树来拟合先前模型的残差，并将L1和L2正则化项纳入目标函数，以有效抑制过拟合并提高泛化能力（Zhangzhong等，2023）。本研究还评估了两种更先进的梯度提升框架：Light梯度提升机（LightGBM），它通过采用基于梯度的单边采样和优先扩展增益最大的叶子来显著加快训练速度（Teshome等，2024）；以及分类提升（CatBoost），它专注于解决目标泄漏引起的预测偏移，并内置了高效处理分类特征的算法（Huang等，2019）。除了集成树模型外，还包括两种基于不同理论基础的模型进行比较。支持向量回归（SVR）是一种基于支持向量机理论的非线性回归方法，通过在特征空间构建“ε不敏感管”来寻找最优超平面，显示出对噪声和局部扰动的良好鲁棒性（Nourani等，2025）。多层感知器（MLP）是一种经典的前馈人工神经网络，通过多层神经元结构和非线性激活函数（本研究使用ReLU）来拟合复杂的关系，并依赖反向传播算法来最小化预测误差（Torres等人，2011年）。为了确保模型间比较的公平性和实验结果的可重复性，所有模型都遵循统一的数据划分和超参数优化工作流程。该框架作为一个并发的状态映射模型，仅根据同一天的气象强迫情况模拟每日蒸发量（ETc），而不包含时间滞后特性。具体来说，整个数据集首先使用固定的随机种子随机分为75%的训练集和25%的测试集。随后，在训练集内应用五折交叉验证结合网格搜索方法来找到每个模型的最佳超参数组合（表S1–S6）。在此过程中，采用了适当的正则化技术（如L2惩罚、提前停止）来防止过拟合并保证模型的泛化能力。最后，在未参与训练或优化的独立测试集上评估每个模型的最优版本。所有模型开发均在Python 3.9环境中进行，使用了Pandas、NumPy和Scikit-Learn等核心库进行数据处理和建模。

本研究采用了一致的全年建模方法来研究冬小麦-夏玉米轮作系统，而不是分别训练独立的作物模型。这种纯气象驱动方法的一个关键挑战是在相似的主要强迫条件下（例如，5月和8月的辐射和温度相似）区分不同作物的水分消耗。模型通过提取多维“气象指纹”来解决这一问题。具体而言，5月的小麦生长季节呈现“干燥炎热”的环境（低相对湿度RH、高蒸发潜力VPD、较低最低温度Tmin），而8月的玉米生长季节则是“湿润炎热”的季风环境（高RH、较低VPD、较高的Tmin）。通过捕捉这些复杂非线性的气象相互作用，像XGBoost和MLP这样的算法能够隐式识别季节性气候变化，从而有效地区分不同的作物生长季节，并在没有明确分类输入作物类型或物候阶段的情况下准确模拟蒸发量。

2.4. 模型准确性评估
为了全面和客观地评估本研究中构建的模型的预测性能，采用了五个指标进行验证：决定系数（R2）、均方根误差（RMSE）、平均绝对百分比误差（MAPE）、异常相关性系数（ACC）和综合性能指标（IGP）。R2是评估回归模型最常用的指标，其值越接近1表示拟合度越好。RMSE量化了预测值与观测值之间的平均误差大小，数值越小表示预测越精确。MAPE关注百分比误差，提供了相对误差的直观解释，数值越小表示预测误差越小。ACC专门用于衡量模型预测变量异常的能力（即偏离正常状态的程度）；接近1的值表明对异常变化的捕捉更准确。IGP是一个综合指标，通过标准化和平均上述不同尺度的指标来提供一个统一的、可比较的模型整体性能分数。各指标的计算公式如下：
(2)?R2=1?∑i=1nyi?yi?2/∑i=1nyi?y?2
(3)RMSE=1/n∑i=1nyi?yi?2
(4)MAPE=100%n∑i=1nyi?yi?yi/√∑i=1nyi?ydi
(5)ACC=∑i=1nyi?ydiyi??ydi/√∑i=1nyi?ydi2
(6)Ni=Xi?Xmin/（Xmax?Xmin）
(7)Ni=Xmax?Xi/（Xmax?Xmin）
(8)IGP=1/k∑i=1kNi

在上述公式中，n是样本数量；yi是第i个样本的观测值；?i是模型的预测值；?是所有观测值的平均值。在ACC公式中，yd(i)是指第i个样本对应日期的多年平均气候值。在IGP的标准化公式中，Xi是给定指标的原始值，Xmax和Xmin是该年份所有模型中该指标的最大值和最小值。在IGP的计算公式中，k是包含在计算中的指标数量。

2.5. 特征重要性分析
本研究采用了基于博弈论的SHAP（Shapley加性解释）框架。SHAP的理论基石是合作博弈论中的Shapley值，它将每个输入特征视为合作博弈中的“参与者”，最终预测结果视为它们合作产生的“总收益”。计算完成后，SHAP将这种“总收益”公平地在各特征之间分配，从而精确量化每个特征对每个单独预测的贡献（Mardian等人，2023年）。这种基于博弈论的归因方法不仅揭示了模型的整体特征重要性排名，还可以通过Beeswarm图等工具可视化每个特征对特定样本的贡献分布，同时允许明确分析特征之间的交互作用。

3. 结果
3.1. 不同年份类型下蒸发量动态分析
本研究分析了六种水热年份类型下蒸发量的特征，涵盖了不同的时间尺度。在日常尺度上，不同年份类型的平均值和数据分散度存在显著差异。温度年份类型的平均蒸发量范围为1.89至2.06毫米/天，四分位数范围（IQR）在2.47至2.75毫米/天之间。在降水年份类型下，平均蒸发量范围为1.97至2.00毫米/天，IQR在2.58至2.73毫米/天之间（图S2）。在季节尺度上，所有年份类型的蒸发量动态都表现出“双峰”物候节律，但这些峰值的时间和幅度有显著差异（图S3）。在冬小麦生长季节，蒸发量与热量供应呈正相关。WTY具有最高的生长度日（GDD）2462.6°C·d，相应的季节性水消耗量为427.76毫米。相比之下，热量受限的CTY的GDD仅为1607.4°C·d，其水消耗量降至最低的398.85毫米。在夏玉米生长季节，LPY虽然仅获得了201.0毫米的季节性降水量，但由于其充足的GDD为2654.75°C·d，因此实现了最高的的水消耗量323.98毫米。相反，尽管CTY获得了最高的降水量445.8毫米，但其蒸发量最低，为291.62毫米，对应的GDD为2473.39°C·d。在年度尺度上，WTY由于最高的年度GDD为5208.3°C·d，实现了全年总蒸发量峰值751.18毫米。尽管CTY的降水量丰富（543.8毫米），但由于其累积GDD最低（4080.8°C·d），其年度总蒸发量最低（690.47毫米）。这些结果表明，在灌溉保证下，蒸发量与GDD呈正相关，与自然降水量呈负相关，表明能量是灌溉农田生态系统中驱动水消耗的主要因素。

3.2. 机器学习模型性能评估
雷达图直观地展示了六个机器学习模型在整个数据集上的整体性能，包括训练集（图3a）和测试集（图3b）。在训练集中，Catboost展示了最强的拟合能力，具有最大的多边形覆盖面积以及在ACC、MAPE和RMSE维度上的最佳表现。相比之下，SVR在所有维度上表现出最明显的收缩，表明它是表现最差的模型（图3a）。在测试集中，CatBoost和RF都表现优异，它们的多边形面积显著超过其他模型。尽管两者在R2（均为0.80）和RMSE（均为0.79毫米/天）方面达到了相似且最优的性能（图3b），但CatBoost在ACC和MAPE维度上显示出显著优势，最终获得了最高的IGP。这些结果清楚地表明CatBoost是最优的全局基准模型，具有最佳的全面性能。

在确定CatBoost为最佳基准模型后，本研究进一步调查了每个模型在不同水热年份类型情景下的性能适应性。结果显示，对于每种年份类型的最佳模型，模拟和测量的蒸发量在训练集和测试集中都紧密分布在1:1线上。此外，这些最佳模型在测试集上的R2值均超过了0.75，表明构建的模型具有强大的预测能力。此外，这些最佳模型不仅在整体评估指标上表现突出，还有效捕捉了整个生长年度内蒸发量的季节动态（图S4）。残差分析表明，虽然模型没有表现出显著的系统性偏差，但仍然表现出数据驱动模型固有的“回归均值”现象，不同水热年份类型的误差分散程度不同（图S5）。具体来说，所有模型在ATY和CTY情景下的测试集R2、RMSE、MAPE和ACC值分别在0.76–0.82、0.71–0.83、0.44–0.75和0.12–0.54之间（表S7）。特别是CatBoost模型在ATY和CTY情景下表现出显著优势，而MLP在WTY情景下表现最佳；它们的IGP值分别达到了0.93、0.89和0.88。与同一组中表现最差的模型相比，CatBoost将ATY和CTY的测试集R2分别提高了1.30%和3.95%，并将ACC分别提高了7.89%和58.33%。在WTY情景下，MLP的测试集R2为0.81，ACC为0.54，分别比表现最差的模型提高了3.85%和25.58%。在三种降水年份类型下，所有模型的测试集R2、RMSE、MAPE和ACC指标分别在0.75–0.86、0.62–0.83、0.36–0.74和0.24–0.47之间（表S7）。值得注意的是，CatBoost在APY和HPY情景下表现优异，而XGBoost在LPY情景下成为最优模型，其IGP值分别为1.00、0.81和0.81。具体来说，与表现最差的模型相比，CatBoost分别将APY和HPY的测试集R2提高了6.67%和3.61%，并将ACC分别提高了6.82%和9.52%。在LPY情景下，XGBoost将R2和ACC分别提高了7.89%和20.83%，相比表现最差的模型。

3.3. 不同年份类型下气象因素的重要性分析
SR是预测所有年份类型下日蒸发量的主要因素，其在所有六种年份类型的平均SHAP值显著高于其他因素，其对蒸发量的贡献率超过27.75%。这一结果定量表明太阳辐射是农田蒸散过程中的核心能量驱动因素。其次，与温度相关的因素（Tmean、Tmax、ST、Tmin）共同构成了第二重要的驱动因素组，它们的总贡献率在每种年份类型中超过34.34%。这些因素在热定义的CTY和WTY中的重要性尤为突出（图中用洋红色区域表示）；在极端温度条件下，温度本身对蒸发过程的影响变得更加关键（Wang等人，2023年；Yu等人，2024年）。反映空气湿度（RH、TD、VP）的因素在整体重要性排名中通常较低，但它们的总SHAP贡献在年份类型之间存在显著差异。这三个因素的总体贡献在LPY中最低，为10.55%，而在HPY中达到峰值18.46%。这种差异反映了供水背景对蒸发机制转换的调节作用。在HPY情景下，充足的供水维持了需求受限的状态；此时，能量是主要驱动因素，使得空气湿度能够有效地作为次要调节器，直接抑制蒸发潜力（例如，高相对湿度降低了蒸汽压差）（Liu等人，2021年）。相反，在LPY情景下，系统转变为供应受限状态。在这种条件下，蒸散过程不再完全由能量驱动，而是受到植物生理反应的强烈制约（即，极端VPD触发气孔关闭）。因此，基线空气湿度因素的传统调节作用显著减弱，降至10.55%。W2和P因素在本研究的整体重要性层次中始终排名较低。它们在CTY中的峰值贡献分别为7.79%和2.96%，而在HPY中的最高总SHAP贡献为10.29%，同样出现在CTY中。这表明它们的影响可能被主导能量因素所涵盖，因此它们对日蒸发量的直接预测贡献相对较小。

驱动农田蒸发量的气象因素表现出动态的演变层次结构。普遍观察到的一条规则是，太阳辐射（SR）是所有年份类型中的主要驱动因素，高SR值始终与强烈的正驱动效应相对应，从而从数据驱动的角度确立了能量输入在蒸散作用中的绝对主导地位。同时，次要驱动因素的重要性会根据具体的气候背景进行适应性重组。具体而言，模型的决策逻辑在不同热条件下表现出明显的重点转移。在高温年份（CTY）和高降水年份（HPY）中，最低温度（Tmin）的重要性显著增加，远高于最高温度（Tmax），这表明在热量受限的条件下，Tmin成为限制植被生理活动的核心因素。相反，在湿润年份（WTY）和低降水年份（LPY）中，Tmax变得更为关键，表明在能量充足的情况下以及有灌溉支持的干旱条件下，高温成为蒸发潜力的关键驱动因素。这种动态适应性在旱年份（APY）中最为明显，其中排名靠前的因素全部与能量相关（SR、ST、Tmax、Tmean），而湿度和降水因素则受到严重抑制；因此，实际蒸散量（ETc）的过程几乎完全受到可用能量 supply 的限制。

3.4 核心因素交互作用效应分析
在详细说明交互机制之前，有必要澄清所分析的特征对的选择。鉴于SR是全球绝对主导驱动因素，我们固定了SR并计算了它与其余九个特征的SHAP交互值。具体来说，我们客观地筛选了每种气候年份类型下与SR交互作用最强的伙伴。本研究利用SHAP交互图来揭示SR与关键温度因素对ETc作用的协同驱动机制。分析显示SR的驱动作用存在一个阈值效应：当SR低于18.3MJ/m2时，其SHAP值大多为负，表明能量输入尚未达到启动加速蒸散过程的关键条件。然而，一旦超过这个阈值，其促进效应随着SR的升高而急剧增加。更重要的是，温度因素在这个过程中表现出显著的协同增效效应，高温条件可以在任何给定的SR水平下将ETc作用的幅度放大数倍，例如在湿润年份（WTY）中，当SR为20MJ/m2时，高Tmax的贡献约为1.0，而低Tmax的贡献则显著减少。

此外，与SR表现出最强协同作用的温度因素在不同年份类型中会动态变化。当按照“能量可用性”（即基于温度的分类）来定义时，协同因素在ST和Tmax之间转换。在热量受限的干旱年份（ATY）和高温年份（CTY）中，ST成为主要的协同因素。特别是在高温年份（CTY）条件下，低ST对ETc作用产生限制效应，即使SR增加，ETc作用也难以有效驱动；这直观地验证了表面热量积累是启动蒸散过程的前提条件。相反，在能量充足的湿润年份（WTY）中，Tmax成为最关键的协同因素，表明在能量充足的情况下以及有灌溉支持的干旱条件下，高温成为蒸散潜力的关键驱动因素。当分析视角转向“水分可用性”（即基于降水的分类）时，平均温度（Tmean）在所有年份类型（HPY、LPY、APY）中始终是与SR交互作用最强的因素。此外，在高降水年份（HPY）条件下观察到由低Tmean引起的“抑制平台”效应，进一步证实了即使水分充足，热量赤字仍然是限制ETc作用协同驱动的关键因素。

4. 讨论
4.1 机器学习模型性能的差异
本研究的结果表明，CatBoost模型在整体数据集以及干旱年份（ATY）、高温年份（CTY）、高降水年份（HPY）和旱年份（APY）中保持了最佳性能。这一发现与最近的研究结论一致。例如，Rahimi等人（2025年）比较了五种机器学习模型（包括CatBoost、RF和MLP）对美国德克萨斯州半干旱地区玉米实际蒸散量的估算，并发现CatBoost在所有测试场景中取得了最高的准确率。同样，在中国南部湿润地区估算参考蒸散量（ETo）时，Huang等人（2019年）证实，当气象数据完整时，CatBoost的表现优于RF和SVM。这归因于CatBoost独特的“有序提升”策略，该策略有效解决了目标泄漏引起的预测偏移问题。这种机制确保了模型对不同水热年份类型的数据分布变化的鲁棒性，从而能够从异构数据分布中学习出更普遍的模式（Kilinc等人，2023年）。此外，其迭代式分层构建允许对特征空间进行精细的非线性划分，准确捕获随气候背景动态演变的多维气象因素与ETc作用之间的复杂交互机制。从更广泛的角度来看，由CatBoost代表的四种基于树的集成模型在整体数据集上的表现优于SVR和MLP。在低降水年份（LPY）中，基于树的模型的整体优势持续存在；特别是在测试集R2和RMSE方面，所有基于树的模型都显著优于SVR和MLP，证明了它们在处理此类压力条件下的非线性关系时的更高效率。这主要归因于集成树模型的内在算法特性：它们的分层分割和贪婪搜索策略能够高效识别多维气象因素中的局部最优分割点，表现出出色的鲁棒性（Ransom等人，2019年；Zhai等人，2023年）。Fan等人（2018年）也得出了类似的结论，指出基于树的XGBoost和GBDT模型在保持与SVM相当准确性的同时显著降低了计算成本。

本研究表明，不同的机器学习模型显示出对特定水热气候背景的高度适应性和依赖性。在湿润年份（WTY）中，MLP的性能超过了所有基于树的模型，取得了最佳预测结果。这一现象源于这种年份类型的独特气候特征，因为在这种年份类型中，丰富的能量输入导致了气象因素之间异常强的非线性耦合和交互作用。凭借其作为“通用函数逼近器”的强大能力，MLP利用其复杂的网络结构和非线性激活函数在模拟高维、平滑的全球函数方面表现出色（Castaneda-Miranda和Castano，2017年），从而有效捕捉了能量因素之间高度耦合的交互作用。Ferreira等人（2019年）表明，即使在温度数据有限的情况下，MLP也能有效估算ETo。在低降水年份（LPY）中，XGBoost模型凭借其算法的鲁棒性表现最佳。LPY年份主要以水分胁迫为特征，其独特的数据分布对模型的泛化能力提出了严格要求。通过在目标函数中加入正则化项并利用损失函数的二阶泰勒展开，XGBoost提高了计算效率和可扩展性，以实现最优解（Karbasi等人，2022年；Pei等人，2024年）。这种机制使模型能够有效适应水分胁迫的LPY环境中的ETc作用响应模式。因此，本研究的发现超越了单纯的模型性能比较，揭示了根据特定气候年份类型定制和适应性选择模型对于提高未来ETc作用估算的准确性和可靠性至关重要。

除了气候适应性之外，这些模型的鲁棒性还必须针对突然的物候转变进行评估。从实际农学的角度来看，在高度短暂的“夏季收获和播种”窗口（六月中旬）预测ETc作用是一个独特的挑战，因为物理机制会从蒸腾作用突然转变为纯粹的裸土蒸发。我们关注的评估时间段（生长日161-176天）显示，尽管缺乏明确的动态植被输入（例如叶面积指数LAI），纯气象驱动的最优模型成功保持了预测稳定性。在此过渡阶段，RMSE保持在0.22至0.49毫米/天的范围内，成功捕捉到了向裸土蒸发水平的急剧下降。模型通过复杂的非线性组合隐式学习了这种物候转变。

4.2 不同年份类型下ETc作用的多时间尺度动态机制
本研究分析了NCP灌溉农田中ETc作用在多个时间尺度上的动态特征，并揭示了水热因素的调节原则。在年际尺度上，ETc作用与生长季节累积温度（GDD）正相关，与年降水量负相关。这一发现与典型雨养农业系统的结果不同。之前在陕西雨养玉米地区的研究发现，ETc作用与降水量正相关，在湿润和正常年份ETc作用高于干旱年份（Zhang等人，2022b）。这是因为雨养系统中的水分供应完全依赖于降水量，使其成为限制土壤湿度并最终决定作物蒸散的关键因素（Huang等人，2021年；Rockstr?m等人，2010年）。然而，我们研究区域的灌溉措施有效缓解了水分胁迫，意味着ETc作用不再受自然降水的限制，而是更多地受热量（GDD）的驱动。Zhuo等人（2016年）对中国冬小麦的研究指出，在雨养条件下，水分胁迫是产量的核心限制因素，而在灌溉条件下，能量驱动成为决定ETc作用的关键因素。

在冬小麦生长季节，降水对ETc作用的限制作用变得明显。尽管湿润年份（WTY）和低降水年份（LPY）的GDD分别为2462.6°C·d和2470.2°C·d，但WTY的降水量比LPY高102.9毫米，导致更高的季节性水分消耗。这表明在作物重新生长后的快速生长期，充足的春季水分对于提高作物对光和热资源的利用效率以及实现其生长潜力至关重要（He等人，2016年；Wu等人，2024年）。进入夏季玉米生长季节，当热量和雨水同时存在时，主导因素明显转变为热量供应。水分充足的LPY年份，降水量为201.0毫米，达到最高的季节性ETc作用323.98毫米，而热量不足的CTY年份，降水量为445.8毫米，ETc作用最低为291.6毫米。此外，灌溉条件更好的WTY年份的ETc作用与LPY年份基本相当。这可能归因于WTY生长季节期间更频繁的极端高温，这些高温可能会触发作物的生理负反馈机制，如气孔关闭，从而限制蒸腾速率。

在本研究中，NCP灌溉夏季玉米的ETc作用约为290-330毫米，并与降水量负相关。相比之下，Chen等人（2023b）对东北部中国雨养玉米的研究表明，其季节性ETc作用从干旱年份增加到湿润年份，然后在湿润年份减少，正常年份达到峰值580毫米。这是因为本研究中的灌溉条件消除了水分赤字，使蒸散过程主要受能量限制。相反，在Chen等人研究的雨养生态系统中，该过程仍然深度依赖于降水量并受其限制，严重干旱期间的水分胁迫显著抑制了ETc作用。此外，在我们的冬小麦-夏季玉米轮作系统中，夏季玉米的生长季节大约为100天，远远短于东北部中国单季玉米的约150天生长季节，这种生长季节长度的差异直接限制了ETc作用的累积量。总之，适当的灌溉使NCP农田中的实际蒸散量（ETc作用）摆脱了自然降水的限制，转变为一个由能量驱动的过程。这种机制表明，优化该地区的灌溉调度不应仅依赖于土壤湿度或降水量赤字作为唯一指标。在实际管理中，结合气象预报中的辐射和热量因素来预测ETc作用的峰值并指导灌溉，可以有效地减少无效的蒸散并提高在多变气候条件下的农业用水效率。

4.3 不同气候年份类型下ETc作用驱动因素的动态调节
通过使用SHAP可解释性框架，本研究揭示了在不同水热年份类型下主导驱动因素及其对ETc作用相互作用的调节机制。分析表明，太阳辐射（SR）是所有年份类型中的主要驱动因素，始终保持最高的贡献率（>27.75%）。此外，研究确定了一个大约为18.3 MJ/m2（211.76 W/m2）的阈值，该阈值能够加速ETc的活性。当太阳辐射（SR）低于此阈值时，其对ETc活性的促进作用相对温和；然而，一旦超过这个阈值，ETc的活性率会随着能量输入的增加而急剧上升。焦等人（2018年）发现，中国西北部干旱地区玉米的季节性可用能量（Rn-G）为125 W/m2，而张等人（2013年）则确定20 MJ/m2（231.48 W/m2）的日太阳辐射是梨树和冬小麦旺盛生长的关键阈值。本研究中模型得出的18.3 MJ/m2的加速阈值位于季节平均能量供应与作物旺盛生长所需能量阈值之间，这证实了这个能量水平是推动当地农田生态系统从正常状态转变为高耗水状态的关键点。值得注意的是，18.3 MJ/m2的阈值是一个普遍的基准，代表了在不同年份类型中观察到的最小能量临界点。随着背景气候的变化，这个阈值会有所波动。这种动态变化准确地反映了辐射强迫与大气动力学需求之间的平衡。空气湿度的变化改变了蒸发的“驱动力”，这与太阳辐射协同作用。因此，触发高ETc活性率所需的特定太阳辐射能量在不同的气候年份类型中略有不同。通过将18.3 MJ/m2作为绝对最小基准，该框架能够有效捕捉所有气候变化中最早可能的强烈ETc活性开始时间。在所有年份类型中，温度因素组（由ST表示）始终是仅次于SR的核心驱动力。这一点已被先前的研究证实；例如，在比较了SVM、BP神经网络和ANFIS等多种机器学习模型后，张等人（2018年）同样发现，地表温度是干旱中国西北部估算蒸发量（ETo）的最重要特征之一。此外，我们还发现了在不同热背景下温度因素的动态变化。在能量受限的情景（CTY、HPY）中，最低温度（Tmin）的重要性排名显著上升，成为限制植被生理活动的核心因素。较低的夜间和清晨温度可能接近或低于作物生理过程的临界阈值，低温压力会直接抑制植物的光合速率和气孔导度（Lei等人，2022年）。相反，在能量充足的情景（WTY、LPY）中，最高温度（Tmax）成为驱动ETc活性的核心因素。在这些年份类型中，能量供应通常不是限制因素，ETc活性的每日峰值出现在下午，这与气温达到最高点和VPD峰值的时间高度吻合。许多微气象学研究表明，VPD是驱动冠层蒸腾作用的最直接因素（Chen等人，2023a；Hashimoto等人，2008年；Yao等人，2023年）。因此，模型认为Tmax作为高下午VPD的最佳代理指标，在能量充足的条件下解释了高ETc活性的值，这证实了我们构建的模型能够捕捉复杂的生理和生态响应。

值得注意的是，模型不仅捕捉了主导因素的切换，还捕捉了复杂的非线性反馈机制，尤其是在高温胁迫下的反应。这种现象在WTY情景下的MLP模型中最为明显：尽管高Tmax值通常提供了预期的ETc活性正向驱动，但极高的Tmax值（在SHAP图中用红点表示）却对应着负的SHAP值。MLP模型成功模拟了“高温胁迫引起的气孔关闭”这一关键的生理负反馈机制。当温度超过作物的耐受阈值时，植物会关闭气孔以减少过多的水分损失，从而导致蒸腾速率下降（Xu等人，2025年）。MLP模型在WTY数据集中成功学习了这一关系，在这种情景下，“热应力”样本首先促进然后抑制了ETc活性。同时，这一机制也在LPY情景下的XGBoost模型中得到了一定程度的验证，其中极少数极端的Tmax值也显示出轻微的负SHAP贡献。这表明这种生理现象确实存在，但其在模型解释中的重要性取决于数据中应力信号的强度和频率。气孔调节的影响，如上述热应力反应所证明的，也为另一个数据驱动的发现提供了生理基础：W2的相对较低SHAP贡献率（峰值 <7.79%）。这一结果似乎与传统Penman-Monteith物理方程中空气动力阻力的关键作用相矛盾；然而，它与实地微气象学完全一致。在PM框架中，蒸散作用是由空气动力阻力（ra）和冠层阻力（rc）共同调节的（Srivastava等人，2018年）。对于生长季节的农作物而言，一旦风速提供了足够的边界层混合，ra就会显著小于由气孔驱动的rc（Yan等人，2021年）。因此，ETc活性对调节气孔行为的因素（即太阳辐射和水分压力差）极为敏感，而不是风速。此外，由于SHAP框架归因了模型预测的方差，较低的贡献率表明在当地这种农业生态系统中，风速很少成为蒸发的限制瓶颈。其日常波动与强烈的辐射和热强迫相比，对ETc活性的宏观变化贡献甚微。这证明了模型能够识别实际的生态水文限制因素，而不仅仅是复制理论方程结构。

虽然SHAP框架提供了对变量相互作用深刻的见解，但必须承认多重共线性对特征归因的潜在影响。在气象数据集中，如Tmax、Tmean和SR等变量往往是高度相关的。尽管基于树的算法在预测阶段对多重共线性具有很高的鲁棒性，但SHAP值的分配仍可能在理论上受到影响。在迭代分割过程中，模型可能会在高度相关的输入之间切换，可能在这些输入之间分配重要性权重，并“稀释”它们各自的SHAP分数（Aas等人，2021年）。然而，这种理论限制并不影响本研究的核心农学发现。尽管分数可能会有所稀释，但SR在所有年份类型中仍然稳健地显现为主要的驱动因素。此外，温度因素的动态转换（例如，从Tmin到Tmax的转换）以及热应力的非线性负反馈与已建立的植物生理机制高度一致。这种一致性表明，尽管多重共线性可能会在绝对归因百分比中引入轻微的不确定性，但模型识别出的宏观驱动模式和特定生理阈值在物理上是合理的且高度可靠的。未来的研究可以探索分组的SHAP值，以进一步完善对严格独立气象强迫的归因。

本研究中的年份类型分类基于年度累积总降水量和年度累积温度，而机器学习模型的构建和SHAP归因依赖于日尺度的气象观测数据。年度尺度分类与日尺度观测数据的整合可能会引发尺度不匹配的问题：特定的年份类型代表了一个宏观气候背景，但这并不排除年度内出现相反的日常天气事件（例如，在低温年份的夏季仍可能发生高温天气）。然而，多尺度分析框架有效地揭示了气候驱动因素的累积调节机制。作为宏观气候约束，年份类型决定了特定天气事件（如高温或低温）的频率和强度。具体来说，尽管CTY在夏季仍可能经历高温，但这种热应力的频率、持续时间和强度在统计上显著低于WTY。由于机器学习模型在日尺度上捕捉ETc活性响应，因此不同年份类型之间观察到的SHAP重要性的系统差异（例如，在CTY中Tmin的重要性显著高于Tmax）是长时间序列中特定气象应力累积频率的精确反映。这表明宏观气候背景通过重塑日尺度气象因素的时间分布特性来调节ETc活性，从而在季节性或年际尺度上改变了主导ETc活性过程的核心限制因素。

4.4. 全球最优模型的多站点验证
我们将全球最优的CatBoost模型应用于FLUXNET网络中的九个代表性农田站点进行独立训练和评估。结果表明，CatBoost模型表现出强大的泛化能力，所有站点的测试集R2值在0.65到0.86之间，证明了该框架的高模拟精度（表S8）。在雨养站点（US-Ne3，R2=0.83）的性能略优于灌溉站点（US-Ne2，R2=0.81）。作为由人类决策驱动的离散水输入事件，灌溉的时间和量对于仅依赖气象数据的模型来说是随机的；这可能是预测不确定性的一个主要来源（Talib等人，2021年）。相比之下，雨养系统中的蒸散过程与自然气候节律更为紧密相关，表现出模型更容易学习和捕捉的规律性。灌溉对模型性能的影响也取决于模型架构和输入变量。一些研究发现，机器学习模型在灌溉情景中的准确性高于雨养情景。这归因于包含了“站点ID”等时空特征变量作为核心驱动因素。这些变量实质上作为局部综合管理模式的代理信息，使模型能够将特定人为灌溉规律性视为可学习的特征，而不是不可预测的随机噪声（Li等人，2023年）。跨越北美和欧洲的气候梯度进一步展示了模型的环境适应能力。在气候温和、水热条件平衡的温带站点（法国的FR-Gri和德国的DE-Geb），模型通常具有高精度（R2 > 0.76）。然而，在面临更强季节性压力的站点（如地中海地区的IT-BCi和美?南部大平原的US-ARM），模型性能下降（R2 < 0.67）。这表明，在水资源受限、水热冲突更为明显的地区，ETc活性的非线性响应更为复杂，对模型的拟合能力要求更高（Qian等人，2024年）。相反，在芬兰严重能源受限的北方站点（FI-Jok），测试集R2达到了0.81。这证明了模型能够准确捕捉由极短生长季节和非常低的冬季蒸散作用构成的强烈季节信号，反映了其在不同能源背景下强大的适应能力。

4.5. 局限性和未来展望
尽管纯气象驱动的机器学习框架具有强大的预测性能和泛化能力，但仍需承认一些局限性。作为高度复杂的生态水文过程，ETc活性不仅受到大气蒸发需求的调控，还受到土壤水分可用性和动态植物生理状态（如气孔导度、叶面积指数（LAI）和二氧化碳施肥效应）的影响。虽然传统物理模型明确参数化了这些关键机制，但我们的数据驱动模型仅依赖于主要的气象强迫。尽管这些模型可以通过多维“气象指纹”隐式捕捉作物物候，但缺乏明确的土壤和植被输入从根本上限制了模型从机械上分离土壤水分压力与大气干旱效应的能力。这种纯气象方法的主要优势在于其在缺乏全面农业监测网络的地区的实际应用性。

此外，我们承认可解释AI框架的固有局限性。SHAP值仅量化了特征对模型预测的贡献，而不是直接衡量现实世界中的物理因果关系。因此，提取的机制和阈值本质上代表了模型内部的数据驱动逻辑。然而，这种SHAP派生逻辑与不同水热年份类型中贡献因素的转换（例如，从湿润年份的能量驱动状态转变为干旱年份的生理限制状态）之间的一致性表明，模型隐式地捕捉了物理上合理的关系的，而不是依赖于虚假的相关性。未来的研究应该将这些数据驱动的见解与基于过程的物理模型结合起来，以明确验证因果关系。

5. 结论
通过将年份类型识别与可解释的机器学习相结合，我们开发了一种新颖的ETc活性预测和归因分析框架。通过利用2007年至2023年间在冬小麦-夏玉米轮作系统中进行的长期涡度协方差测量，我们明确识别了不同水文年度类型中环境驱动因素的动态变化。具体而言，研究发现太阳辐射加速蒸散作用的临界值为18.3 MJ/m2，多层感知（MLP）模型成功捕捉到了高温对冬小麦-夏玉米轮作系统中蒸散作用的抑制效应。此外，可解释性框架揭示了最大温度（Tmax）和最低温度（Tmin）在不同水热气候类型中的重要性变化。在多个全球FLUXNET农田站点进行的独立验证表明，所提出的建模框架具有稳健的空间可转移性，克服了许多数据驱动方法常见的特定站点过拟合问题。最终，这种可解释且可转移的预测方法为优化精准灌溉策略提供了可靠且可扩展的工具，从而在气候条件日益变化的情况下提高了农业水资源管理的韧性。

**CRediT作者贡献声明：**
张玉翠：撰写、审阅与编辑、监督、资源获取、项目管理和资金筹措、概念构思。
沈彦军：撰写、审阅与编辑、监督、方法论和概念构思。
沈 Juan：资源协调与调查工作。
窦晓军：撰写、审阅与编辑。
刘帆：撰写、审阅与编辑及验证工作。
孙豪楠：撰写初稿、数据可视化、验证、软件开发、方法论研究及正式数据分析、概念构思。
雷玉平：撰写、审阅与编辑及调查工作。
安家豪：撰写、审阅与编辑、数据整理工作。

热点排行