受极端气候事件、环境变化和人类活动加剧的影响,洪水已成为全球最频繁和最广泛的自然灾害(Shehzad, 2023; Fischer et al., 2025),对人类社会构成了最大的威胁之一(Tellman et al., 2021; Leda et al., 2025)。2000年至2019年间,洪水占全球所有记录自然灾害的约44%,是所有灾害类型中最高的比率,并造成了巨大的社会经济损失。2020年,洪水灾害导致超过2300人死亡,影响了9500多万人,估计经济损失超过400亿美元(UNDRR, 2020)。在这种情况下,开发快速准确的洪水模拟和预测模型对于减轻洪水风险、增强灾害抵御能力和确保在变化条件下的可持续社会经济稳定至关重要(Chen et al., 2020; Gauch et al., 2021; El Baida et al., 2025)。
基于过程的水文模型是降雨-径流模拟和洪水预测的基本且有效的工具。代表性模型包括土壤和水资源评估工具(SWAT)(Arnold et al., 2012)、水文工程中心的水文建模系统(HEC-HMS)(Cunderlik and Simonovic, 2004)以及新疆(XAJ)模型(Zhao, 1992)等。这些模型通过明确表示水文过程来描述径流生成,并已成功应用于不同地区(Lü et al., 2013; Bayat et al., 2022; Agarwal et al., 2024; Supratman et al., 2025)。然而,它们对物理过程的高度概念化表示和简化的计算公式限制了它们在变化条件下捕捉非线性相互作用和反馈的能力。此外,尺度依赖性、参数非唯一性以及结构和输入不确定性的累积通常会降低它们在非平稳和极端水文气象条件下的鲁棒性(Sikorska and Renard, 2017; Ghaith et al., 2021; Moges et al., 2020; Guo et al., 2021)。这些限制共同限制了传统水文模型的准确性和泛化能力。
随着大规模水文气象数据集的日益丰富和计算能力的迅速提升,深度学习(DL)作为机器学习(ML)的一个最先进分支,已被广泛用于水文建模和预测(LeCun et al., 2015; Shen and Lawson, 2021)。通过利用强大的非线性特征学习能力,纯数据驱动的DL模型在模拟复杂降雨-径流动态和预测径流变化方面表现出显著性能(Gao et al., 2020; Song et al., 2019; Liu et al., 2020; Xiang et al., 2024)。然而,它们对大规模高质量数据集的依赖以及倾向于在训练数据的统计范围内过拟合,往往导致在极端条件下的泛化能力较差(Frame et al., 2022; Kratzert et al., 2024)。此外,神经网络的内部机制本质上是“黑箱”,缺乏明确的物理意义,使得在真实水文过程的背景下难以解释或物理上证明模型预测(Gurbuz et al., 2024; De La Fuente et al., 2024)。因此,将物理水文机制整合到数据驱动框架中已成为开发具有强物理机制的稳健洪水预测模型的关键步骤。
为了克服传统基于过程和纯数据驱动DL模型的局限性,混合物理-DL框架在水文建模中受到了越来越多的关注。这些框架结合了概念性水文模型的明确物理机制和DL架构的强大非线性学习能力。总体而言,当前的研究可以分为三个主要方向。第一个方向是物理引导的后处理模型,其中将水文模型的输出输入DL网络以纠正偏差或细化残差动态。例如,Cui等人(2021)将XAJ模型与LSTM网络耦合,作为后处理器来细化径流估计。混合模型比传统的XAJ模型具有更高的预测精度。第二个方向是基于参数校准的混合模型,利用DL来估计或优化物理水文模型的参数。例如,Li和Lu(2023)提出了一个Transformer-LSTM框架来校准变渗透能力(VIC)模型参数并预测蒸散量,而Feng等人(2024)使用LSTM网络根据气象和流域属性校准HBV模型参数,这两者都展示了DL在水文建模中捕捉复杂参数-过程关系的潜力。第三个方向是物理约束的神经网络,将物理定律或指标直接嵌入网络设计或损失函数中。例如,Xie等人(2021)将Nash–Sutcliffe效率(NSE)作为物理约束纳入LSTM损失函数,从而显著提高了径流模拟的准确性。总的来说,这些方法通过各种耦合策略展示了物理-数据协同的可行性,显著提高了可解释性和预测性能(Jiang et al., 2020; He et al., 2025)。
大多数现有的基于物理的DL框架仍然耦合松散或半集成,物理模型和神经网络通常作为独立模块运行,而不是作为一个统一的系统。因此,它们往往难以捕捉在快速变化或极端水文气候条件下的降雨、蒸发和径流之间的动态反馈,导致洪峰的系统性低估(Ren et al., 2023; Frame et al., 2022; Martel et al., 2025)。此外,物理知识通常通过辅助损失正则化或静态参数校准来结合,从而限制了模型表示变化和非线性降雨-径流相互作用的能力(Li et al., 2024; Du and Pechlivanidis, 2025)。核心物理机制,如渗透、存储-径流动态和径流生成,通常被过度简化或外部强加,而不是在网络架构内自然学习(Wang et al., 2024; De La Fuente et al., 2024)。此外,最近的研究强调了静态流域属性在区域水文建模中的重要性,将静态流域属性整合到DL框架中已成为提高模型性能和泛化能力的有效方法(Liu et al., 2024a; Tursun et al., 2024; Mananoma et al., 2025)。然而,许多现有的混合框架仍然忽略了静态流域属性的长期影响,忽略这些地理控制会限制模型的泛化能力,并在非平稳水文气候条件下破坏物理一致性(Bassi et al., 2024; Ding, 2024)。如何开发一个完全耦合的、动态交互的、物理上连贯的混合框架,将基于过程的水文机制深入嵌入DL架构中,是一个重要的研究方向。
因此,为了克服这些限制,本研究开发了一种新的混合动态参数网络(HyDPNet)模型,该模型将XAJ模型的微分形式嵌入到动态参数循环层中,并将其与LSTM架构耦合。在这个框架中,我们引入了一个新的水文气象响应指数δ,该指数根据动态气象强迫和静态流域属性自适应地得出。这一因素使模型能够在变化的水文气象条件下捕捉非线性降雨-径流相互作用。本研究的目标是:(1)评估HyDPNet模型在泸水河流域的径流模拟性能;(2)评估其在极端水文气象事件中的能力;(3)为混合水文建模提供新的范式。通过以完全动态和交互的方式将水文机制与DL集成,HyDPNet模型确保了物理降雨-径流的一致性,捕捉了过程反馈,并表现出强大的泛化能力,为提高洪水模拟精度和支持洪水预测和风险管理提供了有希望的方法。本文的结构如下:第2节介绍材料和方法;第3节报告结果;第4节提供讨论;第5节总结研究。