《Water Resources Research》:Integrating Physical Parameterization and Attention Mechanisms in Recurrent Neural Networks for Hydrological Modeling: Quantification of Storage Layers Dynamics and Meteorological Responses Within the PRNN Model Framework
编辑推荐:
本研究创新性地将注意力机制(AM)融入基于HBV-6模型的物理过程包裹循环神经网络(PRNN),构建了PRNN-θaf-A诊断框架。该框架在451个CAMELS流域的大样本验证中,纳什效率系数(NSE)中位数达0.72,显著优于基准模型。研究首次系统量化了五个储水层(S1-S5)对径流模拟的动态贡献,揭示土壤水层(S3)为主导贡献者(年均注意力权重0.53),并证实模型内部表征与水文物理原理一致,其季节性注意力转换与流域雪水当量分数显著相关(R2=0.68),为弥合过程模型与数据驱动模型间的鸿沟提供了新途径。
引言
随着深度神经网络和物理-数据双驱动耦合方法的发展,流域水文模拟迎来了新的机遇。注意力机制(AM)和物理过程包裹循环神经网络(PRNN)通过动态突出关键水文特征及整合物理概念来学习复杂过程,从而提升模型性能。然而,在径流依赖于储水层驱动水文过程的PRNN模型中,利用AM来量化和解释不同含水层划分的储水层各自贡献的潜力尚未被充分探索。本研究通过将AM集成到基于HBV模型的PRNN中,构建了一个诊断框架,以评估模型的内部表征是否与既定水文原理一致。
方法论
物理概念模型
研究采用HBV-6模型作为物理基准,该模型以其简洁结构、物理意义明确的参数和强大的水平衡分析能力而著称,适用于集成到混合建模框架中。模型结构明确表示了雪、地表和土壤等概念性储水“桶”的水文过程。
径流建模的实现
研究采用混合建模框架,整合了两个独立的神经网络模块:PRNN和参数化神经网络(PNN)。PRNN核心将HBV-6模型的关键水文过程(如产流、地下水流动和水储存动态)直接编码到其网络架构中。PNN则实现为全连接神经网络(FCNN),将流域属性映射到物理模型参数。研究构建了四种主要的PRNN模型变体:基线PRNN模型和三种PNN驱动的参数化变体(PRNN-θa, PRNN-θf, PRNN-θaf),通过加权分配策略平衡静态属性(θa)和动态驱动(θf)的贡献。
PRNN中的注意力机制
为了动态评估不同储水层的变化贡献,在PRNN框架中引入了注意力机制(AM)。该机制通过一个三层全连接网络计算一组可学习的权重,动态地为上一时间步的状态变量分配重要性权重,特别强调HBV-6储水层。采用了一种加权的平均策略,将原始状态变量与注意力加权的状态变量以特定比例结合,以在捕获动态特征的同时保留原始状态变量的基本信息。
评估指标
使用纳什效率系数(NSE)、百分比偏差(PBIAS)和均方根误差(RMSE)三个评估指标来评估模型的径流模拟性能。
研究区域与数据源
案例研究使用了两个主要数据集:CAMELS和GRACE。CAMELS数据集提供了每日气象驱动、径流观测和静态流域属性。GRACE提供了月尺度总水储量异常(TWSA)数据用于独立验证。研究聚焦于451个具有代表性的流域,数据周期为2000年至2014年。
结果与讨论
构建的PRNN模型性能
PRNN框架在451个CAMELS流域上进行了评估。基线PRNN(中位数NSE为0.57)优于概念性HBV-6模型(0.51)和纯数据驱动的RNN(0.55)。在PRNN变体中,整合了流域属性和气象驱动的PRNN-θaf模型实现了最有效的参数化,中位数NSE最高,为0.67。模型在高流量事件中表现尤佳(PRNN-θaf的NSE-HF中位数为0.75),但在低流量条件下所有模型性能均显著下降,揭示了模型的结构局限性。
注意力机制对模型性能的影响
将AM纳入PRNN框架后,径流和TWSA的模拟指标普遍提高。对于径流,PRNN-θaf-A变体的中位数NSE从0.67增加到0.72(+7.5%)。对于TWSA模拟,改进更为普遍,PRNN-θf-A的中位数NSE从0.48上升到0.60(+25%)。AM的存在还强化了所有变体中模拟径流与TWSA之间的相关性(PRNN-θaf-A中达到0.89),表明该机制支持对耦合水文过程动态的更一致捕获。
PRNN中储水层的定量分析
储水层对径流模拟的贡献
across all models, S3 consistently receives the highest attention weight, highlighting its dominant role in runoff generation and regulation. S5 ranks second, while S1, S2, and S4 generally receive lower weights. In the best-performing PRNN-θaf-A model, S3 remains the highest weight, but S1 and S2 increase to levels comparable to S5, suggesting a more balanced utilization of storage components. Spatially, S3被确定为239个流域的主导贡献层,主要集中在美国东部和中西部。
储水层对气象驱动因素的响应
S1和S3对气象强迫表现出不同的响应模式。S1的贡献权重在不同降水扰动下保持稳定,但在温度升高+4°C时从0.09增加到0.17,表明融雪加速。相反,S3的贡献在降水减少时从0.53增加到0.62,但在温度升高时大幅下降至0.32,这可能是由于蒸散增加导致土壤水分减少。
注意力权重的季节动态与气候适应性
模型内部的AM系统性地适应了长期的流域气候。S1的“季节性注意力转换”(雪季平均权重-雨季平均权重)与流域雪水当量分数呈强正相关(R2=0.75),而S3则呈显著负相关(R2=0.58)。在雪主导流域,注意力从雪相关层(S1, S2)向土壤水分(S3)季节性过渡;而在雨主导流域,S3全年保持主导地位。
结论
本研究开发了一个基于HBV-6模型的PRNN模型框架,整合了流域属性、气象驱动和注意力机制(AM),系统研究了不同储水层对径流生成和调节的贡献。关键发现包括:1) 整合流域属性和气象驱动显著提高了PRNN性能;2) 融入AM改善了储水层贡献的量化,其中S3贡献最大;3) 储水层对气象因子表现出明显的时空变异性;4) 模型的内部AM系统性地适应了长期流域气候,表现出两种不同的操作模式。该框架展示了物理信息PRNN的潜力,其内部表征可以为理解主导产流过程提供说明性见解。