径流动态与洪水形成分析:通过一个可解释的深度学习框架进行的研究

《Global Medical Genetics》:Analysis of runoff dynamics and flood formation: An investigation through an explainable deep learning framework

【字体: 时间:2026年03月21日 来源:Global Medical Genetics 1.5

编辑推荐:

  珠江流域面状径流时空变异特征分析基于CNN-BiLSTM-ATT模型与SHAP解释方法,揭示降雨、上游来水及土壤湿度等驱动因素差异,为流域水文过程研究和灾害防治提供依据。

  
王天|张丽丹|王玉明|周兆强|戴永久
中山大学大气科学学院,广州,中国

摘要

水资源在空间和时间上的不均匀分布,加上气象和地表驱动因素的复杂性,为分析水文过程和洪水特征带来了持续而复杂的挑战。本研究通过开发一个深度学习模型(CNN–BiLSTM–ATT)来探讨中国第二大河流流域——珠江流域(PRB)地表径流的变化性。由于并非所有子流域都有连续的日流量观测数据,因此使用基于GLDAS的径流参考序列作为目标输出。该模型结合了卷积神经网络(CNN)、双向长短期记忆网络(BiLSTM)和多头注意力机制,以有效捕捉影响PRB径流的复杂时空因素。此外,还利用了可解释人工智能(XAI)的应用技术SHAP值分析来解释模型输出,并识别出影响不同PRB子流域地表径流的关键驱动因素。最终的CNN–BiLSTM–ATT模型在所有子流域的平均NSE和R2值达到了0.74,注意力模块有助于减少误差并稳定多个子流域的性能。特征分析表明,降雨和上游来水量是驱动径流生成的主要因素。在PRB东部,土壤湿度的影响更为显著;而在西部,蒸发和温度的作用更为重要。进一步分析发现,降雨和上游来水量被认为是影响洪水的主要因素,土壤湿度则是第二重要的因素。降雨和土壤湿度与洪水峰值呈显著正相关,而温度、蒸发、风速和NDVI对峰值大小的影响不明显。本研究提高了对PRB地表径流和洪水特征的理解,为流域尺度的水文过程提供了更深入的见解,并有助于可持续的水资源管理。

引言

气候变化显著改变了全球降水趋势(Frich等人,2002;Trenberth,2011),对地表径流和极端洪水事件的发生频率产生了重大影响(Barnett等人,2008;Ji等人,2015;Kundzewicz等人,2014;Peterson等人,2013)。洪水是与气候变化相关的最普遍的自然灾害之一,影响了全球超过三分之一的陆地面积(Syldon等人,2024)。这些事件影响了全球约82%的人口(Perera等人,2015),并对农业、城市基础设施和生态系统构成了重大挑战(Piao等人,2010;Skogen等人,2018)。自1900年以来,洪水已导致约七百万人死亡(Chen等人,2021;Chen等人,2021b;Lai等人,2020;Zheng等人,2024),2021年 alone 的全球经济损失就超过了700亿美元(Bevere和Remondi,2022;Endendijk等人,2024)。沿海地区居住着超过27.5亿人(Reimann等人,2023),面临极端降水、热带气旋和海平面上升的严重风险(Buzard等人,2024;Hasan Tanim和Goharian,2021;Li等人,2023)。因此,深入分析地表径流的长期趋势及其背后的机制对于预测未来的水文行为和制定有效的水资源管理及洪水缓解策略至关重要(Hu等人,2012)。
珠江是中国第二大河流,按年流量计算在全球排名第13位(Zhang等人,2009)。珠江流域(PRB)的径流变化显著影响了区域生态系统(Howard和Howard,2016)、沉积物输送以及三角洲的形态(Li等人,2011)。PRB的水资源在空间和时间上表现出显著的变化性,降水的季节性和空间性波动经常导致洪水和干旱的发生(Gu等人,2017)。研究表明,自20世纪50年代以来,PRB极端降雨事件的发生频率呈上升趋势(Zhang等人,2011;Zolina等人,2010),这加剧了洪水的严重性(Zhang等人,2015)。然而,大多数研究仅关注趋势和相关性分析,对径流和洪水驱动因素的定量归因仍然有限,尤其是在子流域和事件尺度上。以往的研究强调了气象和水文变化的时空趋势及其对地表径流的综合影响(Chen等人,2019;Wu等人,2019;Wu等人,2023b)。其中,降水变化通常被认为是主要控制因素(Zhu等人,2019)。这一差距凸显了进行定量、时间分辨的驱动因素归因的必要性,以明确洪水生成机制并改进灾害预防措施。
现有的地表径流分析方法大致可以分为两种不同的途径。第一种方法基于数据进行分析,包括相关性研究,旨在评估气候变化和景观变化对径流和沉积物输送的影响(Liang等人,2023;Liu等人,2020;Wu等人,2023b;Zhou等人,2019)。第二种方法利用基于过程的模型或水量平衡原理来定义环境变化与径流之间的联系,从而推断影响径流变化的机制(Du等人,2015;Li等人,2011)。
这两种方法在同时有效拟合数据和处理变量之间的非线性关系方面都遇到了困难。此外,目前关于PRB径流机制的研究往往采用分离的方法,未能全面分析气象、水文和地貌因素之间的相互作用。对PRB洪水事件的特征和驱动因素进行综合分析对于阐明不同自然条件下的水文气象因素与地表径流之间的相互作用至关重要(Xu等人,2024)。这些见解将为有效的灾害缓解和水资源管理奠定坚实的科学基础(Zhang等人,2023)。
机器学习的最新发展使得深度学习方法能够有效地对非平稳时间序列进行建模和预测(Brunner等人,2021;Kumar等人,2023)。深度学习在从数据中提取抽象特征方面非常有效,通常优于传统的回归技术,并克服了其根本局限性(Jimeno-Sáez等人,2018;Kratzert等人,2019)。通过与数据的完全整合,这些模型能够揭示输入和输出之间的隐含关系。长短期记忆(LSTM)网络在模拟动态水文变量方面表现出出色的能力(Jiang等人,2022),并常用于降雨和洪水模拟(Zhao等人,2024)。与人工神经网络(ANN)和支持向量机(SVM)等技术相比,LSTM在捕捉时间序列数据中的长期依赖性方面具有更强的能力(Hu等人,2018;Kang等人,2020)。双向LSTM(BiLSTM)(Schuster和Paliwal,1997)架构结合了前向和后向LSTM层,从而提高了模型捕捉过去和未来数据中依赖性的能力。最近,结合CNN(LeCun等人,1998)和BiLSTM进行特征提取的架构在降雨和径流预测领域受到了关注(Deng等人,2022;Hu等人,2023;Wu等人,2023a;Zhang等人,2024)。尽管取得了这些进展,深度学习模型的“黑箱”特性仍限制了其透明度,尤其是在科学背景下(Ilyas等人,2019)。为了提高模型的透明度和可信度,已经开发了可解释人工智能(XAI)技术(Wang等人,2023)。如SHapley加性解释(SHAP)、部分依赖图(PDP)和局部可解释模型不可知解释(LIME)等技术在阐明复杂机器学习模型的机制方面发挥了重要作用。
本研究旨在探讨PRB地表径流的驱动机制和主要影响因素。我们从各个子流域收集了高分辨率的数据集,包括降水、温度、土壤湿度、蒸发、风速和上游径流,以开发用于训练CNN–BiLSTM–ATT模型的时间序列数据。该模型结合了CNN、BiLSTM和注意力机制,有效捕捉了复杂的非线性关系,并改进了极端径流的模拟。此外,还使用SHAP来评估模型的可解释性,并测量不同气象和水文因素对不同子流域地表径流的相对影响。在这个背景下,我们将问题定义为水文检测和归因任务,并开发了一个数据驱动的框架,用于检测地表径流的变化,并将其归因于PRB子流域中的各个气象和水文驱动因素。因此,本研究扩展了深度学习与XAI结合在水文归因方面的最新应用。在此框架内,进行了消融实验,以量化在CNN–BiLSTM架构中嵌入多头注意力模块的增量效果。还使用RMSE_HF对高流量日进行了额外评估。基于这些进展,本研究为流域尺度的水文过程提供了新的见解,并为洪水缓解和水资源管理提供了实证支持。

章节摘录

CNN–BiLSTM–ATT模型学习水文过程的机制

地表径流和洪水研究领域的学者主要集中在流域出口处的流量过程上,而不是研究区域内的平均流量(Grigorev等人,2023)。出口流量过程能更准确地表示洪水的规模和强度(Miao和Wang,2020),从而提高了洪水风险评估的有效性。本研究采用了子流域方法,利用不同出口处的地表径流时间序列

结果

如2.2节所述,我们为PRB中的22个建模单元分别构建了每日出口地表径流时间序列作为预测目标,并将相应的水文气象强迫作为输入到CNN–BiLSTM–ATT模型中。在本节中,我们评估了训练好的模型再现这些目标径流序列的能力,并讨论了控制模型技能的空间模式的主要因素。

洪水原因差异的分析

径流过程被定义为非平稳序列,在年份内部和之间都表现出相当大的变化性,这种变化受多种自然因素的影响。本节研究了洪水事件以及在不同气候和地表条件变化下导致洪水峰值的各种输入特征(Gu等人,2017)。通过Tukey检验(Abdi和Williams,2010)进行统计分析来识别洪水事件

结论

本研究强调了CNN–BiLSTM–ATT深度学习模型在模拟和分析珠江流域(PRB)地表径流动态方面的有效性。我们创建了一个详细的深度学习框架,以研究径流生成的时空驱动机制。结合多头注意力机制和可解释技术,使模型能够有效捕捉水文过程的变异性,并量化关键气象因素的贡献

CRediT作者贡献声明

王天:撰写 – 审稿与编辑,撰写 – 原稿,方法论,资金获取,正式分析,概念化。张丽丹:撰写 – 原稿,可视化,正式分析,数据管理。王玉明:撰写 – 审稿与编辑,正式分析,概念化。周兆强:撰写 – 审稿与编辑,方法论。戴永久:撰写 – 审稿与编辑,监督。

免责声明

出版商声明:Copernicus Publications对文中提到的管辖权主张、发布的地图、机构隶属关系或任何其他地理表示保持中立。虽然Copernicus Publications尽力包含适当的地名,但最终责任在于作者。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。我们感谢所有合作者的贡献以及实验室同事提供的宝贵建议和支持。

致谢

我们感谢每位合作者对本文的贡献和支持;也感谢实验室中每一位同事在改进本文方面提供的建议和帮助。本研究得到了博士后奖学金计划和中国博士后科学基金会(项目编号:BX20240442)以及国家自然科学基金(项目编号:52409012)的联合支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号