一种基于物理原理的双阶段混合深度学习模型用于洪水预测：提升模型过程理解能力和可解释性

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Advances in Water Resources》：A two-phase physics-informed hybrid deep learning model for flood forecasting: improving process learning and interpretability

【字体：大中小】 时间：2026年05月10日 来源：Advances in Water Resources 4.2

编辑推荐：

　　成晨|李斌泉|赵勇|李旷|朱永南|梁忠民中国南京210098，河海大学水循环与水安全国家重点实验室 **摘要** 基于深度学习的洪水预测通常通过利用流量自相关性而非学习降雨-径流机制来获得高精度，但这限制了模型的鲁棒性、可解释性和可转移性。我们提出了一种两阶段物理

　　成晨|李斌泉|赵勇|李旷|朱永南|梁忠民
中国南京210098，河海大学水循环与水安全国家重点实验室

**摘要**
基于深度学习的洪水预测通常通过利用流量自相关性而非学习降雨-径流机制来获得高精度，但这限制了模型的鲁棒性、可解释性和可转移性。我们提出了一种两阶段物理信息混合深度学习框架，用于基于事件的洪水预测，该框架将数据驱动的径流生成与基于物理的流动路径引导结合在一个端到端的可微分计算图中。多站点降水量通过神经模块映射为有效径流，而路径引导则由一个轻量级、可学习的纳什瞬时单位流量曲线（IUH）表示，该曲线直接嵌入在前向传播中。通过在对数域中的IUH计算和显式归一化来确保物理一致性，以满足质量守恒要求。模型训练采用两阶段策略：首先预训练路径参数，然后进行联合优化，以在观测数据有限的情况下提高模型的稳定性和参数可识别性。该框架在黄河下游的一条支流上进行了测试。与仅基于数据的基线模型相比，实验表明基于IUH的耦合方法在保持预测精度的同时减少了对方程流量持续性的依赖。在处理不同规模的数据集时，IUH-Physics-Informed Gate Recurrent Unit（IUH-PIGRU）模型表现出更稳定的性能，特别是在数据有限的条件下，其纳什-萨特克利夫效率（NSE）仍保持在0.6以上，优于纯数据驱动模型。随着预测提前时间的增加（12-24小时），IUH-PIGRU模型在评估指标和水量误差方面均表现出更好的性能。将其转移到相邻流域进一步证明了其相对于无约束基线的鲁棒性和泛化能力。总体而言，将物理约束的路径引导嵌入到神经预测框架中为学习降雨-径流关系提供了一种实用的方法，同时实现了数据高效和可转移的洪水预测。

**引言**
洪水是最常见的自然灾害之一，通常造成最严重的生命和财产损失（Aerts等人，2018；Tellman等人，2021；Bouwer等人，2007；Mazzoleni等人，2021；Gao等人，2019）。洪水预测是洪水管理中的关键非结构性措施，有助于发布洪水警报、制定缓解策略以及更有效的水资源管理（Kuller等人，2021；Wetterhall等人，2013；Ming等人，2020；Alfieri等人，2013）。水文模型是洪水预测的重要工具。早期的方法主要是统计性的，并基于单位流量曲线的概念（Sherman，1932；Dooge，1959）。随着对径流生成和路径引导理解的深入，一系列基于物理的模型被开发并广泛应用，包括TOPKAPI（Ciarapica和Todini，2002）、TOPMODEL（Beven和Kirkby，1979）、SWAT（Arnold等人，1998）、新安江模型（XAJ，Zhao等人，2025）和MIKE SHE（Abbott等人，1986）。这些模型通过数学公式化的过程表示径流生成和流动路径引导，使用物理意义上的参数对流域地形和水文行为进行参数化，由于其结构稳定且校准数据需求适中，因此在水灾预测和预警中得到广泛应用。然而，现实世界的流域过程往往与模型假设存在偏差，导致这些模型的可靠性降低（Beven和Binley，1992；Klemes，1986；Sivapalan，2003；Kirchner，2006）。因此，研究人员开始探索更具适应性的非线性建模方法来模拟更复杂的径流生成和路径引导过程。

随着神经网络在各领域的广泛应用以及计算能力的提升（Reichstein等人，2019），机器学习方法已被引入洪水预测，并成为水文建模的主流方法之一（Shen，2018）。其中，以长短期记忆（LSTM，Hochreiter和Schmidhuber，1997）为代表的时间序列深度学习模型已在洪水预测研究中得到广泛应用（Kratzert等人，2018，2019；Xiang等人，2020），而近年来新兴的模型如时间卷积网络（TCN，Bai等人，2018）和Transformer（Lim等人，2021）也在水文建模中取得了高预测精度（Xu等人，2021；Mhedhbi和Erechtchoukova，2025）。许多最新研究表明，深度学习模型的预测性能远超基于物理的水文模型。然而，这些模型本质上是一个“黑箱”，目前尚不清楚它们具体从数据中学习了什么以实现如此高的精度（Reichstein等人，2019；Tripathy和Mishra，2024；Herath等人，2021）。为了探究深度学习模型究竟学到了什么，研究人员越来越多地尝试解释它们的行为，其中SHAP（Shapley Additive Explanations，Jiang等人，2024a，2024b）被广泛用于深度学习模型的可解释性分析。例如，Zhu等人（2025b）使用LSTM网络学习并纠正XAJ模型的预测误差，并利用SHAP识别在预测提前时间内对误差贡献最大的历史时间步骤。Huang等人（2024）应用SHAP量化CNN-LSTM洪水预测模型中各个输入特征的影响，发现下游站点的历史观测流量是最有影响力的预测因子。Zhu等人（2025a）结合BiLSTM和卷积神经网络（CNN）以及注意力机制进行中长期径流预测，并利用SHAP揭示ENSO指数是主要的影响因素。这些研究部分揭示了数据驱动模型的“黑箱”，提供了对模型学习内容的初步理解；然而，这些研究主要是描述性的，无法指导输入特征与预测目标之间转换的物理机制的学习。为了解决这一限制，研究人员开始将物理机制作为约束条件纳入神经网络中，以指导深度学习模型的训练。Kratzert等人（2019）提出了一种物理-数据融合方法，将基于深度学习的LSTM模型与SWAT相结合，以更好地捕捉降水与径流之间的复杂关系。这种方法不仅提高了模型的预测精度，还增强了對水文过程的理解。特别是在数据稀缺的情况下，物理驱动模型能有效减少过拟合，提高模型的泛化和可解释性。He等人（2025）提出了一种分布式混合洪水建模（DHFM）框架，将物理机制与深度学习相结合，提高了洪水预测的准确性和效率，其中基于CNN的路径引导在模拟和计算性能方面优于传统方法。Wang等人（2024）提出了一种分布式混合水文建模框架，通过将水文过程编码到神经网络中，提高了流量、水量存储和潜在蒸发量（PET）估计的准确性。

尽管取得了这些进展，但在混合式、物理引导的深度学习能够作为与过程相关且可转移的洪水预测工具之前，仍存在一些挑战。首先，大多数现有的建模方法将水文站的历史流量视为不可或缺的输入，可解释性分析经常表明模型预测严重依赖于历史流量信息（Huang等人，2024）。这与基于物理的水文模型不同，后者利用降雨-径流关系从初始状态递归计算流量曲线。这种差异表明，高预测精度可能并非来自学习降雨-径流机制，而是模型可能依赖于基于流量自相关性的捷径。其次，现有的耦合策略在物理信息的整合方式上存在很大差异，并且模型前向计算过程中并不总是确保物理一致性，这限制了联合训练和所学过程的可解释性。常见的深度学习-物理混合水文模型通常依赖于松耦合方案，其中深度学习用于后处理模拟结果或动态调整模型参数（例如LSTM-HBV框架），而不是结构上整合到物理过程表示中（例如Yu等人，2023；Espinoza等人，2024）。Feng等人（2022）将HBV模型重新表述为可微分形式，并使用神经网络直接学习其物理参数。尽管这种方法也涉及使用深度学习训练物理模型参数，但其可微分的水文建模框架为实现物理模型与深度学习方法之间的紧密耦合提供了重要见解。

因此，我们提出以下问题：（1）如何将水文过程表示与深度学习相结合，以增强过程学习（即降雨-径流关系），同时减少对流量自相关性的依赖并保持预测精度；（2）如何以可微分的方式形式化这种“物理信息”耦合（即，在模型中嵌入一个质量守恒且物理上可解释的路径引导操作符）；（3）在数据有限、预测提前时间延长和转移设置下，所得模型是否能提高鲁棒性和可解释性。为了解决这些问题，有必要重新思考如何将物理过程整合到深度学习模型中。与其将水文知识视为外部约束或后处理步骤，不如将物理意义上的路径引导机制直接嵌入模型结构中。在本研究中，我们开发了一个物理信息混合深度学习框架，其中径流生成由神经网络学习，而路径引导受到IUH模块的约束。本研究的主要贡献包括：（1）将物理约束的质量守恒路径引导操作符嵌入深度学习模型的前向计算中；（2）将IUH重新表述为可学习和数值稳定的路径引导核；（3）引入两阶段训练策略以提高参数可识别性和训练稳定性；（4）系统地研究和缓解由流量自相关性驱动的捷径学习。本研究采用过程导向的评估框架，使用合成降雨-径流数据进行控制训练和基准测试，而观测数据用于现实条件下的诊断评估。本文的其余部分组织如下：第2节描述研究区域和数据；第3节详细说明提出的架构、耦合策略和两阶段训练程序；第4节介绍实验设计、基准比较和可解释性分析；第5节讨论对过程学习、预测提前时间依赖性和可转移性的影响；第6节总结主要结论。

**研究区域**
选择黄河下游的伊洛河流域作为研究区域。伊洛河是黄河下游最大的支流，也是洪水的主要来源，因此它是研究黄河下游流域水文过程和洪水控制问题的代表性区域。该流域位于温带半湿润大陆季风气候区内，其地形特征是西部海拔较高，东部海拔较低。

**方法论**
本节提出了一种将物理模型与深度学习模型相结合的混合建模框架。深度学习组件包括LSTM、GRU（Gate Recurrent Unit）和TCN，这些在洪水预测研究中得到广泛应用。为了实现GPU加速训练，物理组件采用了结构相对简单的纳什瞬时单位流量曲线（Nash IUH）。模型训练分两个阶段进行：第一阶段预训练物理模型的参数；第二阶段...

**案例研究**
本节建立了三种基于物理信息的深度学习模型：IUH-Physics-Informed GRU（IUH-PIGRU）、IUH-Physics-Informed LSTM（IUH-PILSTM）和IUH-Physics-Informed TCN（IUH-PITCN）。另外还使用了三种纯数据驱动的深度学习模型（GRU、LSTM、TCN）进行对比和评估。共使用LS流域生成的100次洪水事件进行模型训练、验证和测试。

**讨论**
本研究开发了一种结合物理机制的深度学习洪水预测模型，采用了两阶段训练策略。该模型结合了IUH来模拟降雨引起的径流，并替换了输入中的历史流量特征，使深度学习模型能够进一步学习和预测未来的流量。结果表明，这种方法提高了模型捕捉降雨-径流关系的能力，提供了令人满意的预测性能。

**结论**
本研究提出了一种两阶段物理信息深度学习框架，用于基于事件的洪水预测，该框架能够增强模型对降雨-径流关系的学习。该方法将轻量级、可微分的纳什瞬时单位流量曲线路径引导模块与序列学习架构相结合，并通过对数域计算IUH并对路径引导核进行显式归一化来满足质量守恒要求。两阶段训练策略...

**作者贡献声明**
成晨：写作-审阅与编辑、撰写-初稿、验证、软件开发、方法论研究、概念化。
李斌泉：写作-审阅与编辑、监督、方法论研究、资金获取、数据管理、概念化。
赵勇：写作-审阅与编辑。
李旷：数据管理。
朱永南：方法论研究、数据管理。
梁忠民：方法论研究。

联系信箱：

粤ICP备09063491号

热点排行