通过空间优化的风云卫星降水数据改进极端径流模拟

《Journal of Hydrology》:Improving extreme runoff simulation with spatially optimized Fengyun satellite precipitation

【字体: 时间:2026年05月04日 来源:Journal of Hydrology 6.3

编辑推荐:

  阮月华|何昆仑|陈小红|李浩杰 中山大学土木工程学院与南方海洋科学与工程广东实验室(珠海),珠海519082,中国 **摘要** 为了解决数据有限的水文区域极端径流模拟的挑战,本研究提出了一种新方法,通过将土壤和水资源评估工具(SWAT)的子流域划分集成到XGBoo

  阮月华|何昆仑|陈小红|李浩杰
中山大学土木工程学院与南方海洋科学与工程广东实验室(珠海),珠海519082,中国

**摘要**
为了解决数据有限的水文区域极端径流模拟的挑战,本研究提出了一种新方法,通过将土壤和水资源评估工具(SWAT)的子流域划分集成到XGBoost模型中,以提高中国典型湿润流域的径流模拟精度。我们优化了子流域降水提取和流域尺度聚合方法,以提高极端径流模拟的准确性。风云定量降水估计(FY QPE)在水文建模中的潜力得到了验证,同时使用SHAP分析量化了驱动因素的贡献,揭示了水文要素的潜在机制。根据极端径流阈值,使用平均值(FYm)和混合最大值-平均值策略(FYmm70、FYmm75、FYmm80、FYmm85、FYmm90、FYmm95)提取了代表性降水序列。探索了五种聚合方法——平均值、面积加权(A)、距中心距离(D2C)、距出口距离(D2O)和聚类——以获得流域尺度的降水输入,从而在分布式和集中式建模之间架起桥梁,提高稳定性和可解释性。结果表明,尽管FY QPE低估了极端值,但其与实地数据的相关性很高(CC > 0.87,NSE > 0.74)。XGBoost的性能优于SWAT,NSE提高了10%,偏差(PBIAS)也有所减少。FYmm80和FYmm85在极端高径流模拟中表现优异(PBIAS改善超过20%),而D2C和D2O聚合方法获得了最佳的整体性能(NSE 0.80–0.82,KGE 0.81–0.86)。累积降水量(7天和15天)是主要驱动因素,季节性变化受湿度和日照时间的影响。该框架通过提高降水的空间代表性、减少极端值的偏差以及增强模型的可解释性,推进了基于卫星的水文建模。

**引言**
准确模拟日径流对于灾害缓解、高效水资源分配和可持续管理至关重要(Liu等人,2015;Wang等人,2025;Yin等人,2022a),尤其是在气候变化加剧极端水文事件频率和严重性的情况下(Lee和Romero,2023;Tabari,2020)。在许多地区,特别是发展中国家和偏远地区,传统的基于雨量的降水数据存在空间覆盖稀疏、报告延迟和潜在的手动错误等问题,这限制了它们在高精度径流模拟中的实用性,尤其是在极端事件期间(Li等人,2025a)。基于卫星的降水产品(SPPs)提供了一种有前景的替代方案,提供了高分辨率、近乎实时的空间连续数据,特别适用于无测量点或数据稀缺地区的径流预测(He等人,2023;Wang等人,2017;Yuan等人,2018)。其中,中国自主研发的风云定量降水估计(FY QPE)产品现已成为世界气象组织全球地球观测卫星星座的一部分,在选定的区域研究中表现出色(Song等人,2024;Wu等人,2021;Yin等人,2022b),使其在地面观测密度有限的地区的水文建模中特别有价值。然而,由于应用有限和技术挑战持续存在,其在极端径流事件水文建模中的潜力尚未得到充分探索。FY QPE是一个高精度数据集,由中国自主研发,由于其精细的空间分辨率和区域适应性,在东亚的水文应用中显示出巨大潜力(Song等人,2024;Wu等人,2021;Yin等人,2022b)。现有研究(Song等人,2024;Sun等人,2022;Wu等人,2021;Yin等人,2022b)将FY QPE与其他SPPs进行了比较,包括全球卫星降水测绘(GSMAP)、热带降雨测量任务(TRMM)、气候预测中心的形态技术(CMORPH)、利用人工神经网络的降水估计(PRESIANN)和全球降水测量(GPM)产品,证实了其在捕捉中国不同地区(如青藏高原(Song等人,2024)、东北亚(Yin等人,2022b)和中国东南部(Li等人,2022)的降水时空分布方面的能力。然而,这些研究也一致报告了夏季降水的系统偏差,高强度降雨被低估,低强度降雨被高估(Lu等人,2020;Xu等人,2019;Yin等人,2022b)。相比之下,FY-2 SPPs在估计冬季降水量和观测覆盖极稀少的地区表现较好(Sun等人,2022)。目前关于FY QPE在径流预测中的应用研究较少,而径流预测是水文实践中的关键组成部分。作为自主研发的卫星产品,FY QPE在区域适应性方面具有固有优势。系统地评估其在极端径流预测中的适用性可以提高使用本地数据的水文研究的自主性和实时监测能力,提高极端事件模拟的准确性,并为水资源管理提供坚实的理论基础和实际指导。

**过程驱动模型(PBMs)**已被广泛用于径流模拟,随着技术的不断进步,数据驱动模型(DDMs)在径流模拟中的应用也越来越普遍。土壤和水资源评估工具(SWAT)是一种基于过程的分布式水文模型,能够有效模拟水文过程,并已被广泛采用(Li等人,2025b;Tan等人,2020;Abbaspour等人,2015;Wang等人,2022)。然而,SWAT径流模拟仍面临数据稀缺、参数过多和计算效率低等挑战,这往往导致极端径流估计出现显著误差(Lin等人,2021;Makwana和Tiwari,2017)。机器学习(ML)方法在DDMs中可以有效解决这些限制,在模拟极端径流方面表现出色,特别是在高径流事件中(Tripathy和Mishra,2024;Wang等人,2015;Mei等人,2025;Ren等人,2025;Kilinc等人,2023;Wang和Peng,2024)。值得注意的是,Kratzert等人(Kratzert等人,2018)展示了长短期记忆(LSTM)网络在捕捉复杂长期水文依赖性方面的开创性能力。为了解决处理极端值的挑战,出现了物理引导或混合框架,包括PHY-LSTM模型(Xie等人,2021),该模型结合了物理约束以改善洪峰预测和极端行为。更广泛地说,物理信息神经网络(PINNs)和可微分水文模型在应对未见过的极端事件方面表现出更好的泛化能力(Bhasme等人,2022;Donnelly等人,2024;Duan等人,2023;Song等人,2026),将半物理ML方法置于水动力模拟器的替代模型框架中。在各种ML模型中,XGBoost因其强大的非线性拟合能力和处理高维特征训练的卓越效率而脱颖而出,在实际应用中取得了有希望的结果(Guo等人,2023;Wang等人,2022;Wang和Peng,2024)。然而,ML模型中缺乏物理机制限制了它们的可解释性,阻碍了更广泛的采用(Duong等人,2025;Liu等人,2023;Nearing等人,2021)。此外,与SWAT等半分布式模型不同,传统ML方法通常缺乏整合网格化降水数据的空间信息的能力。最近,可解释AI(xAI)在水文学中的研究,包括基于SHAP的诊断方法,通过提供特征贡献和模型限制的洞察力,提高了可解释性(Hosseini等人,2025;López-Chacón等人,2025;Maity等人,2024),使得通过Yilmaz等人(Yilmaz等人,2008)提出的框架对极端值进行更精确的评估成为可能。SHapley Additive exPlanations(SHAP)框架是一种可解释的ML方法,已在基于ML的水文模拟中得到广泛应用,提供了关于特征贡献和模型行为的强大洞察力(Wang等人,2021;Wang等人,2022;Wang和Peng,2024;Wu等人,2023)。将基于SHAP的可解释性与空间增强的卫星降水输入相结合,为推进径流建模提供了有希望的途径,并逐步接近测量点级别的精度,使这项工作区别于纯粹的聚合工程,强调了混合物理-ML的新颖性和对极端值的诊断评估。这种集成对于提高极端径流模拟的准确性和深入理解水文驱动因素的时间动态尤为重要。

**现有研究**
基于卫星的径流模拟通常依赖于网格点降水数据或子流域平均降水,导致模拟性能不佳和计算效率低下(Jiang等人,2024a;Tapas等人,2025)。在大多数径流建模中,流域内的降水是通过面积加权的站点数据或网格化降水平均值计算的。然而,站点网络分布往往不均匀,虽然卫星降水提供了空间连续的信息,但其空间异质性经常被忽略(Chen等人,2025;Ruan等人,2025)。这种忽略是关键的,因为流域内的降雨变异性强烈影响极端径流事件的规模和时机——这是洪水预测的关键因素。为了扩展FY QPE的适用性并提高模型的可解释性,本研究将SWAT建模中常用的子流域划分技术集成到XGBoost框架中。通过优化子流域降水提取和流域尺度降水聚合方法,我们旨在充分利用FY QPE中的空间信息,提高径流模拟精度并增强可解释性。具体来说,我们的目标是:(1)评估FY QPE在日径流模拟中的潜力;(2)研究不同的子流域降水提取方法(例如,平均值与混合最大值在极端事件中的差异)对模拟性能的影响;(3)比较流域尺度聚合方法(例如,面积加权、距离加权、基于聚类的方法)对总体径流和极端径流(前5%、前10%、低5%、低10%)模拟的改进;(4)使用SHAP分析确定主要驱动因素。

**研究区域**
北江发源于中国江西省新丰县石界附近,是珠江第二大支流。它流经南岭山脉和珠江三角洲平原,在思贤角与西江汇合后,流入珠江三角洲网络河流区域。北江流域位于中国南部的广东省北部,经度介于112°E至114.8°E之间,纬度介于23.5°N至25.7°N之间。

**土壤和水资源评估工具(SWAT)**
土壤和水资源评估工具(SWAT)是一种基于物理的、连续时间的半分布式水文模型(Arnold等人,1998;J. G. Arnold等人,2012;Neitsch等人,2011)。最初旨在评估农业管理策略对大型无测量流域的水资源、泥沙输送和养分或农用化学品产量的影响(Arnold等人,1998),SWAT已发展成为一个多功能平台,广泛用于模拟水文过程(Li等人)。

**风云卫星降水的性能**
图3a和c展示了2008年至2017年的网格尺度和区域尺度序列的统计指标。结果表明,网格点在日尺度上的CC值为0.90,NSE值为0.81,POD值为0.97,表明FY QPE在研究区域内表现出可接受的准确性。此外,PBIAS值(2.60%)显示所有网格点之间存在一定程度的高估或低估。FAR值(0.23)表明FY QPE偶尔会过高或过低估计降水。

**FY QPE在降水测量点稀少地区的潜在应用**
在本研究中,雨量计数据作为评估FY QPE准确性的基准,由雨量计驱动的模拟优于未经优化的FY运行(详见补充表S4);针对FY输入的优化显著缩小了这一差距,展示了其在径流模拟和水文预测中的强大潜力。通过优化子流域降水提取和流域尺度降水聚合方法,我们提高了日极端径流的模拟精度。

**结论**
本研究评估了FY QPE及其在径流模拟中的应用,确认了其潜力,并优化了数据处理方法以提高模拟精度。主要结论如下:
(1)在研究区域内,FY QPE与实地测量数据的高度相关性(CC > 0.87,NSE > 0.74)。尽管它低估了极端降水事件,但其时空分布仍然合理,使其成为水文模拟的有效驱动因素。

**作者贡献声明**
阮月华:方法论、调查、资金获取、正式分析、数据管理、概念化。
何昆仑:软件、资源、项目管理、方法论、调查、资金获取。
陈小红:资源、调查、资金获取。
李浩杰:资源、项目管理、方法论。

**利益冲突声明**
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

**致谢**
本研究得到了国家自然科学基金(U25A20356)和珠海市风暴潮-内涝复合灾害快速预警与防控系统研究(SML2024SP014)的财政支持。

**代码可用性声明**
核心代码(预处理、XGBoost训练、SHAP分析主脚本)已上传到公共GitHub仓库:
(https://github.com/Frankhydroextreme/Optimized-Fengyun-Satellite-Precipitation-Improving-Extreme-Runoff)
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号