《Water Resources Research》:Locally Relevant Streamflow by Integrating a Land Surface Model Ensemble With a Two-Stage LSTM Post-Processor
编辑推荐:
本文提出了一种混合建模框架,将过程型土地表面模型(LSM)与深度学习(特别是长短期记忆网络LSTM)相结合,旨在不依赖流域特定校准的情况下显著改善日尺度径流模拟。该研究利用印度土地数据同化系统(ILDAS)的多模型水文集合,通过一个包含残差预测LSTM和自回归元学习LSTM的两阶段后处理器,成功将印度220个流域的国家中位数Kling-Gupta效率(KGE)从0.18(未校准)提升至0.60,并在208个流域中表现出改进,同时显著降低了洪峰时序误差和峰值平均绝对百分比误差(MAPE),尤其在季风期和季风后时期残差四分位距(IQR)分别下降了66.3%和81.7%,为水资源管理和洪水预报提供了更准确、本地化的解决方案。
引言
过程型土地表面模型(LSM)在解析陆-气相互作用以提供土壤湿度、雪盖、蒸散发和径流等陆地表面状态和通量的准确一致估计方面发挥着关键作用,是许多国家设立的土地数据同化系统(LDAS)的重要组成部分,旨在协助政策制定者进行土地和水资源规划以及减轻自然灾害。然而,由于不完善的模型结构、不充分的过程表征、气象输入数据的偏差以及关于初始条件和参数的错误假设,LSM通常表现出显著的不确定性,这些不确定性在径流模拟中尤为明显。例如,在北美土地数据同化系统(NLDAS)和全球土地数据同化系统(GLDAS)的评估中,均发现模拟径流存在偏差和时序错误。在印度次大陆地区的研究,例如使用印度土地数据同化系统(ILDAS)进行的评估,也揭示了LSM倾向于高估该地区的日径流。因此,从此类水文模型中获取本地相关的径流仍然是一个挑战。
数据与方法
本研究整合了最先进的LSTM模型与印度次大陆的水文-水动力设置,即印度土地数据同化系统(ILDAS)。ILDAS使用两个土地表面模型:Noah-MP 3.6和集水区土地表面模型(CLSM),以及HyMAP路由模型,结合三种不同的气象强迫数据(IMD、MERRA-2、CHIRPS),生成空间分辨率为0.1°的日输出,包括土壤湿度、径流、地下水和河道流量等水循环分量,形成了一个六成员的集合输出。观测数据集包括印度大陆220个测量点的日流量数据,每个点位至少有20年的连续数据。此外,还结合了七项日气象强迫时间序列和20项地球物理属性。
长短期记忆网络
LSTM是循环神经网络(RNN)的一种变体,专门设计用于解决传统RNN中常见的梯度爆炸和消失问题,使其能够有效捕获和学习长期时间依赖性。LSTM通过记忆细胞保留来自先前时间步的信息,其操作通过输入门、遗忘门、输出门和细胞状态更新等一系列方程控制。
实验设置
研究采用了混合深度学习框架,对ILDAS的原始径流集合输出进行后处理。框架包含两个主要阶段:第一阶段是残差校正层(ILDAS-rLSTM),使用六个独立的LSTM模型分别校正ILDAS六个径流集合成员中的残差误差;第二阶段是元学习层(ILDAS-mLSTM),训练一个LSTM模型,将残差校正后的六个径流序列与观测流量的3日历史移动平均值相结合,以观测流量为目标变量,生成最优加权的确定性日流量时间序列。为了确保顺序训练并避免前瞻性偏差,ILDAS-rLSTM和ILDAS-mLSTM的训练期是分开的。
结果与讨论
性能评估表明,混合框架显著改善了日径流模拟。在全国范围内,ILDAS-mLSTM将中位数KGE从ILDAS的0.18提升至0.60,在220个流域中的208个表现出改进。ILDAS-mLSTM在捕获径流残差的季节性变化方面表现出卓越的能力,在季风期将残差IQR从ILDAS的187.94 m3/s显著降低至63.23 m3/s(降低66.3%),在季风后时期进一步降低了81.7%。然而,在干旱的冬季和季风前季节,独立的LSTM模型性能略优于ILDAS-mLSTM。
在洪峰事件分析中,ILDAS-mLSTM表现出最有利的性能,其峰值MAPE最低,为44%,同时具有最低的误报率(FAR为0.09)。虽然LSTM的峰值时序误差略低(0.73),但ILDAS-mLSTM仍保持了0.82的概率检测(POD)和0.80的峰值时序误差。相比之下,独立的ILDAS模型在峰值事件分析中持续表现不佳。
研究还评估了静态流域属性与各模型KGE之间的相关性。对于ILDAS,性能随着流域更大、更湿润而提高,但在蓄水效应、农业活动和干旱程度增加的流域中性能下降。LSTM在建成区面积、沙质土壤和水库上游的流域表现较差。ILDAS-rLSTM和ILDAS-mLSTM在这些具有挑战性的条件下略有改善,但蓄水效应仍然与所有模型的KGE负相关。
结论
本研究成功开发了一个新颖的两阶段后处理器,通过将问题分解为两部分来生成来自过程型土地表面模型集合的本地相关径流:首先使用深度学习专门校正每个单独集合成员中的残差,然后使用深度学习将校正后的集合成员与观测数据集成,而不是使用传统的平均方法。该混合深度学习框架,特别是ILDAS-mLSTM,被证明是最有效的建模方法,在整体评估和洪峰事件期间均表现出卓越的性能。最终输出在空间上一致且准确。未来的工作可以探索将这些变量纳入动态方案,可能会进一步提高模型的预测性能。