《Journal of Hydrology: Regional Studies》:An ensemble learning framework for streamflow reconstruction incorporating aleatoric and epistemic uncertainty
编辑推荐:
研究区域为印度尼西亚南苏拉威西(South Sulawesi)。研究重点为:机器学习(Machine Learning, ML)模型已被用于在数据稀疏区域重建径流数据,但其偶然不确定性(aleatoric uncertainty)和认知不确定性(epistem
研究区域为印度尼西亚南苏拉威西(South Sulawesi)。研究重点为:机器学习(Machine Learning, ML)模型已被用于在数据稀疏区域重建径流数据,但其偶然不确定性(aleatoric uncertainty)和认知不确定性(epistemic uncertainty)的评估仍十分有限。为弥补这一不足,本研究聚焦于一个基于机器学习的框架,该框架评估了在印度尼西亚南苏拉威西22个站点重建长期径流时传播的多种不确定性。研究人员通过加权堆叠集成(weighted-stacking ensemble)方法整合了三种决策树(decision-tree)和三种神经网络(neural network)架构,并将水文模型模拟的径流和十个区域气候指数(climate indices)作为预测因子。研究人员利用观测数据相关(偶然)和模型相关(认知)的不确定性来源评估了集成性能。该区域的新水文见解为:结果表明,基于决策树的集成方法优于其他模型,中位数纳什-萨特克利夫效率(Nash-Sutcliffe Efficiency, NSE)达到0.54,克林-古普塔效率(Kling-Gupta Efficiency, KGE)达到0.48。加入空间信息和大尺度气候指数(如太平洋暖池区(Pacific Warm Pool Region, PWP)和准两年振荡(Quasi-Biennial Oscillation, QBO))后,预测性能中位数NSE提升至0.72,KGE提升至0.68。偶然不确定性仍为主要来源,由径流的固有变异性驱动。多种类型的曼-肯德尔(Mann-Kendall, MK)检验结果显示,南苏拉威西仅在高流量的趋势上具有显著性,表明在气候变化背景下发生前所未有洪水的高风险。本研究突显了人工智能(Artificial Intelligence, AI)在综合评估多种不确定性来源及数据稀疏区域水文变异性和趋势方面重建径流数据的潜力。
**论文解读:结合偶然与认知不确定性的径流重建集成学习框架**
**研究背景与问题**
在全球范围内,特别是全球南方国家,由于观测网络稀疏,长期连续的径流数据严重缺乏,这限制了对区域水文动态及其变化的理解,增加了水相关灾害的风险。印度尼西亚南苏拉威西地区(South Sulawesi)是约1000万人口的聚居地,农业是主要经济活动,但该地区在2000–2024年间经历了669次洪水和284次干旱,影响约190万人,造成重大损失。然而,该地区的径流监测系统存在大量时空缺失,77个测站中仅有22个满足分析要求,且记录长度不一,缺失数据比例达5%–43%。现有研究多关注单一模型或仅评估模型相关的认知不确定性,而忽略了数据相关的偶然不确定性以及两者在建模过程中的传播效应。因此,亟需一种能够综合评估多种不确定性来源的稳健框架,以重建长期径流数据,并为水资源管理和灾害风险应对提供依据。
**研究内容与结论**
研究人员开发了一个基于集成学习的框架,用于重建南苏拉威西22个测站1980–2020年的日径流数据。该框架整合了三种决策树模型(随机森林、极限梯度提升、轻量梯度提升机器)和三种神经网络模型(深度神经网络、长短期记忆网络、门控循环单元),通过基于克林-古普塔效率(KGE)的加权堆叠集成方法进行组合。预测因子包括来自变入渗能力水文模型(Variable Infiltration Capacity, VIC)结合径流路线模块(RRM)模拟的天然径流(25公里网格)以及十个大尺度气候指数(如ENSO降水指数、NINO1+2、NINO3.4、NINO3、NINO4、太平洋年代际振荡、太平洋暖池区、准两年振荡、印度尼西亚海平面气压、赤道南方涛动指数)。
研究得出以下主要结论:决策树集成方法(ENS(DT))在整体性能上优于神经网络集成和全部模型集成,中位数NSE和KGE分别达到0.54和0.48。加入空间信息(从单网格扩展至整个流域乃至全区)后,性能显著提升,中位数NSE和KGE升至0.72和0.68(在加入气候指数的情况下)。偶然不确定性是主要不确定性来源,由径流的固有高变异性驱动,而模型校准和结构的认知不确定性贡献相对较小。基于夏普利加性解释(SHAP)值的特征重要性分析显示,不同模型类型和流域对气候指数的敏感性存在差异;决策树模型突出太平洋暖池区(PWP)和准两年振荡(QBO)的作用,神经网络模型则强调赤道南方涛动指数(EQSOI)和印度尼西亚海平面气压(IDSLP)。多种曼-肯德尔(MK)趋势检验(包括标准MK、去趋势预白化MK、完全自相关MK和长程持久性MK)表明,仅年最大日径流表现出显著增加趋势,尤其在考虑长期持久性时仍有部分站点显著,暗示气候变化下极端洪水风险升高。
**重要意义**
该研究为数据稀疏区域提供了一种动态、站点自适应的径流重建框架,填补了南苏拉威西长期连续径流数据的空白,并系统评估了偶然与认知不确定性来源的相对重要性。成果发表于《Journal of Hydrology: Regional Studies》。
**主要关键的技术方法**
研究基于印度尼西亚南苏拉威西22个径流测站的观测数据(来源:Pompengan Jeneberang流域组织,1999–2020年,缺失5%–43%)。关键技术方法包括:1)变入渗能力水文模型(VIC)结合径流路线模块(RRM)模拟天然径流(25公里网格,ERA5-Land再分析数据驱动);2)十个大尺度气候指数(1980–2020年,来自NOAA和CPC);3)六种机器学习模型(随机森林RF、极限梯度提升XGBoost、轻量梯度提升LightGBM、深度神经网络DNN、长短期记忆网络LSTM、门控循环单元GRU)通过性能加权堆叠集成;4)不确定性诊断使用夏普利加性解释(SHAP)值、连续排位概率得分(CRPS)和性能与站点属性(如坡度、变异系数)的斯皮尔曼秩相关;5)趋势分析采用四种曼-肯德尔(MK)检验(MK1至MK4)及Pettitt突变检验。
**研究结果**
**3.1 框架场景的性能与影响**:通过对比不同输入场景(单网格、流域网格、全区网格及是否加入气候指数),发现决策树集成(ENS(DT))在所有场景中均优于神经网络集成(ENS(NN))和全部模型集成(ENS(DT,NN))。加入空间信息后,中位数NSE从0.09(单网格)升至0.44(流域网格)和0.54(全区网格)。加入气候指数后,流域网格场景中位数NSE升至0.72。SHAP值分析显示,决策树模型中最常被选为首要特征的气候指数为太平洋暖池区(PWP,37%),其次为准两年振荡(QBO,21%);神经网络模型则最常依赖赤道南方涛动指数(EQSOI,23%)。尽管重建径流在洪峰和枯水时相上表现良好,但洪峰量级仍存在低估。
**3.2 框架在流域间的一致性**:通过平均排名和投票得分评估,发现最优预测策略因测站而异。流域网格加气候指数(BSF+INDX)场景在41%的测站中一致性最高,尤其适用于Walanae Cenranae(东部)流域;全区网格加气候指数(ASF+INDX)在Pompengan Larona(北部)和Saddang(西部)北部高海拔站点表现更佳。部分站点存在指标投票不一致的情况,可能与泛化与误差之间的权衡有关。
**3.3 不确定性来源**:通过性能与数据特征(缺失数据比例、变异系数CV)及地理特征(流域面积、海拔、坡度)的相关性分析,发现模型性能与观测径流CV呈显著负相关,与坡度呈正相关,表明高变异性导致更大误差,而陡坡因快速径流响应使模型更容易捕捉。模型校准(超参数优化)对性能影响有限,随着参数增加,决策树和神经网络模型的交叉验证NSE均趋于饱和或下降,表明认知不确定性相对次要。集成范围分析显示,湿季的不确定性范围(四分位距和均值)高于干季,且不同输入场景下范围稳定,进一步证实偶然不确定性的主导作用。
**3.4 径流统计量的趋势**:将四种MK检验应用于重建的年最大、年均和年最小7天平均径流。年最大日径流在MK1中有13个站点、在MK4中有4个站点表现出显著增加趋势,且所有显著站点均检测到突变,表明存在非渐变的变化。年均和年最小径流的趋势大多不显著。这提示南苏拉威西面临前所未有的高流量洪水风险。
**讨论与结论**
讨论部分指出,偶然不确定性是主要不确定性来源,源于观测径流的高变异性、VIC-RRM模拟的残余误差以及峰值流量估计的可靠性受限。为减少不确定性,可考虑使用残差学习策略、针对高流量样本的合成过采样技术(如SMOTE)以及利用新的遥感数据(如地表水和海洋地形任务SWOT)。模型性能对校准不敏感,而集成范围保持稳定,进一步支持偶然不确定性的主导作用。不同模型类型对气候指数的敏感性差异反映了它们捕捉线性和非线性关系的能力。研究提倡采用动态、站点自适应的框架,允许最佳配置本地化。
**研究结论翻译**:在本研究中,研究人员诊断了一个基于人工智能的框架中的多种不确定性来源,该框架结合了VIC-RRM模拟的天然径流和十个大尺度气候指数,用于重建印度尼西亚南苏拉威西的径流数据。结果表明,空间信息增强了模型性能,并为数据稀疏区域的径流重建提供了基础。研究人员提出了一种动态、站点自适应的框架,能够在多样化的局部水文条件下实现长期重建,而现有方法尚未系统性地解决这一问题。诊断揭示,偶然不确定性是该框架中的关键不确定性来源,特别是观测径流的高变异性、VIC-RRM的残差误差以及峰值流量估计的受限可靠性。这一发现为如何减少数据稀疏区域长期径流数据重建中的不确定性提供了见解,例如在陆面水文模型中更好地表示物理过程,以及开发针对有限高流量样本的分段模型。该发现也强调了新数据源在不确定性减少中的重要性,例如利用新的遥感数据(如SWOT使命数据)。所提出的框架拓宽了机器学习在数据稀疏区域的应用,并通过展示不确定性来源如何影响预测而深化了应用。重建的径流及其不确定性范围为这一数据稀疏区域提供了宝贵的数据集,因为尚无单一研究填补这一空白。最终,重建的径流突显了加强地面监测的迫切需求。通过这项研究,研究人员展示了基于人工智能的框架在数据稀疏区域重建一致长期径流数据序列的潜力。持续的原位监测对于验证建模研究和准确表示现实世界的文动态仍然至关重要。