基于高海拔山区流域次模态特征的深度学习,对多种洪水类型进行预测的研究
《Journal of Hydrology: Regional Studies》:Research on forecasting of diverse flood types based on the deep learning of sub-modal features in high-altitude mountainous basin
【字体:
大
中
小
】
时间:2026年05月07日
来源:Journal of Hydrology: Regional Studies 4.7
编辑推荐:
徐阳石|廖娇|梁海东|方功华|刘铁|陈曦
中国西南科技大学环境与资源学院,绵阳621010
**摘要**
研究区域:
开都河流域位于新疆维吾尔自治区境内,是塔里木河的四大支流之一。
**研究重点**
本研究探讨了预测非线性和非平稳洪水过程的挑战,特别关
徐阳石|廖娇|梁海东|方功华|刘铁|陈曦
中国西南科技大学环境与资源学院,绵阳621010
**摘要**
研究区域:
开都河流域位于新疆维吾尔自治区境内,是塔里木河的四大支流之一。
**研究重点**
本研究探讨了预测非线性和非平稳洪水过程的挑战,特别关注高海拔山区流域。基于1959年至2018年在 Dashankou 水文站观测到的日径流量数据,并利用 POT(Peaks Over Threshold)方法提取了152次洪水事件。研究开发了一种结合变分模态分解(VMD)和长短期记忆(LSTM)的混合模型,以进行洪水模拟和预测,无需任何未来参考信息,并分析了不同子模态分解特征在径流序列中的作用。
**该地区的新水文见解**
经过贝叶斯优化后,独立的 LSTM 模型和混合 VMD-LSTM 模型在模拟径流序列方面均表现出色,其 R2 值分别为 0.99 和 0.93。VMD-LSTM 模型通过将径流信号分解为低频到高频的多个子模态成分,显著降低了信号复杂性,增强了模型捕捉洪水事件动态的能力。值得注意的是,VMD-LSTM 模型的同日峰值流量检出率为 88.2%,远高于独立 LSTM 模型的 2.6%。通过从低频到高频的子模型特性,混合模型层次化地解决了径流累积的确定性以及洪水发展过程中的短期波动不确定性。即使没有未来观测数据,它仍能有效捕捉洪水演变过程。在1天、5天、10天和15天的四个预测时段内,其累积误差始终低于单一 LSTM 模型。虽然 LSTM 模型在捕捉高海拔山区流域的总体径流规律方面表现良好,但与 VMD 的结合显著提升了洪水事件的检测和预测性能。这种混合框架为改进山区洪水预警和防御策略提供了宝贵的科学见解。
**1. 引言**
山洪是全球最具破坏性的自然灾害之一,经常引发灾难性后果(Ren 等,2007年)。在中国,超过70%的洪水相关死亡事件由山洪造成(Zhai 等,2021年)。在气候变化加速的影响下,极端降水事件变得更为频繁和强烈,导致山洪发生的频率和强度显著增加(Wang 等,2024年)。这些趋势极大地增加了山洪风险缓解的复杂性和挑战性。山洪预警作为主动防洪的关键措施,在实践中面临重大挑战,因为山洪具有突发性、快速演变和高度复杂的水文气象过程(Zhai 等,2021年;Tang 等,2023年;Wang 和 Qi,2024年)。
目前山洪预测主要依赖两种范式:基于物理的水文建模和数据驱动的机器学习方法。随着多源观测数据的增加和分布式计算技术的进步,物理水文模型在捕捉流域径流形成过程方面变得有效,并广泛应用于径流预测(Yang 等,2020年;Nourani 等,2017年)。然而,高海拔山区的 hydrological 过程非常复杂,径流与气候、地形和土壤变量之间存在强非线性。这些非线性为水文模型公式带来了结构上的不确定性,难以解决(Zhang 等,2023年)。此外,山区地形的数据稀缺常常需要大量的计算资源进行参数校准,进一步降低了预测精度并增加了模型运行成本(Zhang 等,2023年)。
随着大数据技术的发展,基于机器学习的数据驱动方法已成为径流预测的主要替代方案(Hu 等,2023年)。与水文模型不同,机器学习算法无需显式表示 hydrological 过程,而是从历史数据中直接学习非线性的输入输出关系,取得了有希望的结果(Duan 等,2020年;Lecun 等,2015年)。特别是在数据有限的山区流域,机器学习方法在计算效率和预测准确性方面通常表现出更优的性能(Liu 等,2025年)。为更好地考虑径流变化的连续性(当前径流形成依赖于过去一段时间内环境变化),循环神经网络(RNN)被用于增强时间序列依赖性的分析(Kabir 等,2020年)。在此基础上,长短期记忆(LSTM)网络作为一种深度学习模型,通过门控机制解决了传统 RNN 的梯度消失和爆炸问题(Hochreiter 和 Schmidhuber,1997年),因此被广泛应用于径流预测,显示出优越的时间建模能力(Kratzert 等,2019年)。Zhang 成功将 LSTM 模型应用于中国35个山区的6小时提前径流预测(Zhang 等,2022年)。此外,Wang(Wang 等,2023年)开发了一种基于 LSTM 的网格表面径流模型,在中国北部山区的小流域模拟中取得了高精度和空间一致性。
径流形成过程本质上非常复杂,其相关时间序列具有高非平稳性,并受到多种噪声源的干扰。这些特性给单一深度学习模型带来了挑战,它们往往难以从这种高维、噪声丛生的数据中提取有意义的模式(Wu 等,2009年)。因此引入了信号分解技术。通过将原始信号分解为一组具有不同频率带的固有子模式,这些方法减少了噪声干扰并提高了信号纯度,从而提高了下游深度学习模型捕捉潜在时间依赖性的能力(Huang 等,2009年;Feng 等,2020年)。目前,如经验模态分解(EMD)(Gao 等,2023年)、离散小波变换(DWT)(Daubechies,1990年)和变分模态分解(VMD)(Dragomiretskiy 和 Zosso,2013年)等信号分解方法与机器学习算法相结合,用于应对复杂样本信号的挑战。在这些方法中,VMD 在噪声环境中表现出出色的鲁棒性,并在分解过程中表现出强大的性能。它在处理信号模式混叠和分解结果完整性方面更为有效(Dragomiretskiy 和 Zosso,2013年;Qi 等,2022年)。在典型的山区高噪声环境中,VMD 的分离精度明显优于其他方法。这种信号分解方法可以将复杂时间序列信号分解为不同频率带的子模式,为深度学习模型提供更清洁、更有结构的数据输入,使 LSTM 能够更专注于学习清晰信号模式下的潜在时间依赖性。Tan 等提出了一种结合 VMD 和 LSTM 的模型,并成功应用于湖泊水位预测,取得了有希望的结果(Tan 等,2023年)。
径流序列本质上是非线性和非平稳的,这对准确预测提出了重大挑战。尽管当前将深度学习与信号分解相结合的方法(通过“分解-学习-集成”框架)通常能有效捕捉总体信号变化和模拟径流(Quilty 和 Adamowski,2018年;Fang 等,2019年),但在洪水预测中仍有两个主要缺点。首先,记录中的洪水事件通常由短期水文刺激(如强降雨或快速融雪)与长期累积径流的相互作用触发。这些事件代表了不同时间尺度上的变化,表现为多尺度动态,具有确定性和随机性(Gao 等,2020年)。特别是在受“雨-雪-冰”径流机制支配的高海拔寒冷山区,由降雨和融雪等不同因素引起的洪水事件在持续时间、峰值上升/下降速率和水文图形状方面表现出显著差异(Chen 等,2013年)。与连续径流序列相比,洪水事件通常更为突然且难以预测,尤其是在短时间内受极端降雨或融雪影响时。当前研究主要将径流预测视为回归或插值问题——侧重于拟合整个时间序列,而不是明确识别、描述或预测离散的洪水事件。此外,在深度学习中, subsequences 的训练和测试涉及通过整合未来信息来重构和优化模型,反映了学习能力而非验证和应用学习结果的能力。这是一种“事后计算实验”(Zhang 等,2015年;Napolitano 等,2011年)。因此,尽管模型在历史数据上可能表现良好,但它们在仅使用过去和当前输入、严格排除未来信号的情况下进行真正预测实验的能力尚未得到充分验证。此外,这些所谓的优势……很少在现实的、操作条件下进行评估。迫切需要从评估模型拟合性能转向在严格因果限制下严格评估其预测能力。
**结论**
为了解决这两个问题——即对离散洪水事件的关注不足以及依赖非因果、回顾性学习范式——本研究以开都河(中国最大的内陆河塔里木河的源头)作为案例研究。利用1959年至2018年在 Dashankou 水文站观测到的日径流量数据,开发了一种混合 VMD-LSTM 模型,首先分析径流序列中的子模式。通过 VMD,分解复杂的径流信号,去除噪声,并提供更有结构的输入数据。这使得能够深入探索径流序列中包含的信息,并构建用于时间序列及其子模式的深度学习模型。经过贝叶斯优化后,模型从复杂时间序列中提取有意义的特征,更专注于长时间序列中的洪水事件,从而增强了模型捕捉洪水事件过程的能力。预期该混合模型将通过提高洪水预测精度来优于传统模型,特别是在洪水波动迅速的情况下。在没有未来参考信息的情况下,该研究预测了未来15天内洪水事件的发展,最终实现了基于模态特征深度学习的山洪预测。这为高海拔山区地区的洪水预测提供了一种新方法。
**2. 研究区域和数据**
开都河是塔里木河(中国最大的内陆河)的四大支流之一,位于新疆维吾尔自治区的巴音格尔蒙古自治州。它是向塔里木河下游输送生态水的重要水源,在恢复该地区沙漠河岸走廊方面发挥着关键作用。本研究关注由 Dashankou 水文站控制的上游流域,该流域面积约为22,000平方公里(图1)。地形呈明显的西北至东南梯度,海拔差异为1750米。年平均径流量为33.62亿立方米,河流主要由融雪和季节性降雨补给,后者在5月至9月间达到峰值。
**图1. 开都河流域概览**
本研究探讨了将变分模态分解(VMD)与长短期记忆(LSTM)网络结合的潜力,以从复杂的非平稳水文时间序列中提取内在模式。为此,利用了 Dashankou 水文站收集的60年(1959–2018年)日径流量数据(开都河流域的控制点)。使用这些长期序列数据训练和验证了混合模型,以评估其捕捉径流趋势和洪水事件的能力,以及在不依赖任何其他参考信息的情况下预测洪水发展的能力。所有水文数据均由中国新疆塔里木河流域管理局提供。
**3. 研究方法**
基于1959年至2018年在开都河流域 Dashankou 水文站观测到的日径流量数据,使用变分模态分解(VMD)对径流序列进行模态分解。通过排列熵、模糊熵、赫斯特指数和中心频率分析评估原始序列及其每个子模式的复杂性、平稳性和长期记忆特征。遵循“分解-学习-集成”框架,为每个子模式开发独立的 LSTM 模型。此外,使用 Peaks Over Threshold(POT)方法提取径流序列中的洪水事件,并从三个维度分析相关洪水指标:幅度、时间和形态。系统地将 VMD-LSTM 混合模型的性能与标准 LSTM 模型进行比较,包括:(1)捕捉整体径流趋势,(2)识别洪水事件,以及(3)在不包含未来信息的情况下进行15天洪水预测。文中还探讨了子模特征在捕捉和预测各种洪水事件中的作用。技术路线图如图2所示。下载:下载高分辨率图像(486KB)下载:下载全尺寸图像图2. 技术路线图。3.1. 信号分解方法VMD是一种非递归的、自适应的信号处理方法,以其高分解精度和强大的抗噪能力而闻名。VMD的核心原理是利用变分方法分解信号,同时自适应地确定每个模式的最优中心频率和有限带宽。这种方法产生了一组相对稳定的子模式,有效避免了传统EMD中常见的模式混叠和端点效应(Dragomiretskiy和Zosso,2013;Qi等人,2022)。VMD的目标是将原始信号分解为一系列模式信号,每个模式对应一个特定的中心频率(如方程1所示)。(1)X(t)=∑k=1Kuk(t)其中X表示原始信号,uk表示第k个模式信号,K是信号分解的模式数量。VMD分解过程是通过最小化变分目标函数来实现的(如方程2所示),该函数优化了每个模式的时间域信号。(2)minUK(·),ωk∑k=1K{‖??t(uk(t))‖2+λ‖uk(t)?u?(k)(t)‖2+α|ωk|}其中uk表示第k个模式信号,wk是该模式中心频率,λ是控制信号与模式之间差异的平衡因子系数,u?kt是通过频率约束处理后的模式信号。在本研究中,使用Python 3.15版本的第三方库vmdpy对径流序列进行信号分解。主要参数包括惩罚因子(alpha)、噪声容忍度(tau)、直流分量参数(DC)、收敛容忍度(tol)和初始模式参数(init)。设置的值如下:alpha=1000、tau=1.1、DC=0、init=1、tol=1e-7。其中,最重要的值需要通过初步实验来确定。初始设置用于提取和观察模式成分和频谱。如果频谱中出现模式混叠,则可以确认该值;如果没有模式混叠,则继续设置直到观察到模式混叠。经过多轮实验后,最终确定当K=6时,模式分离效果良好,不再有模式混合现象。3.2. LSTM深度学习方法LSTM是RNN的一种专门架构,如图3所示。由于其独特的结构,LSTM不仅能够从当前输入中学习数据模式,还能够捕捉时间序列数据中的长期依赖性(Qi等人,2022)。这一能力使得LSTM在处理长时间序列时非常有效,大大提高了模型的拟合和预测精度。LSTM引入了“记忆单元”,使模型能够有效地捕捉和保持长期依赖性。它广泛应用于时间序列预测、自然语言处理、语音识别等领域。LSTM的核心特征是其三门机制:遗忘门、输入门和输出门。这些门调节网络内的信息流动(Hochreiter和Schmidhuber,1997),允许LSTM确定保留哪些信息、丢弃哪些信息以及在每个步骤中记忆的强度应该有多强。下载:下载高分辨率图像(42KB)下载:下载全尺寸图像图3. LSTM的工作原理。本研究基于VMD的模态分解结果,为原始径流序列和每个子模式构建了LSTM模型。模型参数使用贝叶斯方法独立优化。贝叶斯方法是一种基于贝叶斯定理的统计推断框架,它利用概率来量化不确定性,并随着新信息的出现不断更新信念。它将任何未知量——无论是模型参数、隐藏状态还是未来观测值——视为随机变量。首先为这些变量分配一个主观或经验性的先验分布,然后利用数据通过贝叶斯定理计算后验分布,以完成推断和决策过程。该方法结合了先验知识与数据驱动的证据,使得在高不确定性情况下能够更准确、更灵活地优化参数(Greff等人,2017)。(3)p(θ|D)=p(D|θ)p(θ)p(D)其中θ表示要推断的未知量,D表示观测数据,Pθ是先验分布,表示在观测数据之前的对θ的信念,PDθ是似然函数,表示在给定θ的情况下观测到D的概率,Pθ|D是后验分布,表示在结合数据后的对θ的更新信念。贝叶斯选择了八个对建模有显著影响的参数进行校准。训练周期的数量决定了模型从数据中学习的次数。适当的周期数量有助于模型充分学习数据中的模式,同时避免过拟合或欠拟合。批量大小影响训练过程的效率和稳定性;选择合适的批量大小可以在计算效率和模型的泛化能力之间取得平衡。学习率控制参数更新的步长;适当的学习率可以加速模型的收敛并提高其稳定性。Dropout率作为一种正则化方法,可以防止过拟合并增强模型的泛化能力。神经元数量决定了模型的复杂度;选择适当的神经元数量可以在避免过拟合的同时提高模型学习数据特征的能力。窗口长度由序列本身的自相关和偏自相关函数确定。训练集和验证集的比例为0.7–0.3。表1显示了通过VMD分解的六个子模态序列和原始观测径流序列的优化后的LSTM模型参数。表1. 最优化的LSTM和VMD-LSTM模型参数。空单元IMF1IMF2IMF3IMF4IMF5IMF6OBSEpoch12121212121256批量大小1281281921286464128学习率5.8*10?31.2*10?55.8*10?35.8*10?35.8*10?35.8*10?32.3*10?5Dropout率0.10.10.10.10.10.10.10.2第1层的单元数量962569696969664第2层的单元数量16019216016016016016032第3层的单元数量160160160160160256时间步长161613101212203.3. 洪水事件提取方法对于径流序列中的洪水事件,本研究使用POT(峰值超过阈值)模型进行提取。POT模型专门用于表征超过某个阈值的随机变量的“尾部”行为(Lang等人,1999)。与将样本划分为固定段并仅考虑每个段内的最大值的方法不同,POT模型保留所有“超过阈值的事件”,并检查所有超过阈值的部分以揭示洪水的分布模式(Zhang等人,2023)。POT模型中选择阈值的公式如下:(4)T=E(Q)+aVar(Q)其中T表示洪水分类的阈值,EQ表示样本均值,varQ表示样本方差,a取值1、2或3。确定阈值是洪水提取的关键步骤,目前尚无统一的标准或方法(Guo等人,2016)。Kaidu河流域是一个典型的高海拔山区,不同季节会发生由降雨、融雪等引起的不同类型的洪水。为了提取不同类型的洪水,在初步计算后,选择了a=1的较小阈值作为分类标准,确保年平均洪水事件发生次数在1.6到3.0次之间(Lang等人,1999)。在提取洪水事件时,判断连续洪水峰值是否为独立洪水事件是基于方程5。(5)θ>5+ln(A1.6092)且Xmin<34min(Q1,Q2)其中θ表示两个洪水峰值之间的间隔天数,A表示研究区域(km2),Q1和Q2表示两个不同洪水事件的峰值流量(m3/s),Qmin表示两个洪水峰值之间的最小日径流量。在本研究中,洪水分类的阈值相对较小,这导致独立洪水事件的持续时间过长。因此,引入了一种通用方法(Bezak等人,2014)来确定洪水事件的开始和结束日期。(6)QS≤aQP且TP?TS≤b(5+ln(A1.6092))QE≤aQP且TE?TP≤b(5+ln(A1.6092))其中Qp和Qs分别表示洪水事件的峰值流量和开始日期的流量,TP和TS分别表示峰值流量的日期和洪水事件的开始日期,TE和QE分别表示洪水事件的结束日期和当天的相应流量,α和bare是经验参数,通常选择α=0.5和b=1.5(Zhang等人,2021)。本研究关注洪水事件过程展示的信号特征以及模型捕捉和预测这些信号的能力。短时间内的洪水事件可能是由于水位波动等因素引起的,而不是由降雨、融雪、径流和退水等过程引起的完整洪水事件,这样的事件可以被训练有素的模型“完美”拟合。这可能导致对模型准确捕捉洪水事件能力的误判。因此,基于使用POT方法提取的洪水事件,并考虑到Kaidu河流域的水文特征(Xie和Zhu,2011),排除了持续5天或更短的洪水事件。最后,分析了三个维度——规模、时间和形态——来统计评估六个洪水事件指标(如表2所示),这些指标反映了洪水事件的信号特征。表2. 洪水事件行为特征的指标。类别指标单位公式规模总流量Qtotal/m3Qtotal=total*T(S)峰值流量Qpeak(m3/s)时间持续时间T/d形态上升速率RQrise(m3/s)RQrise=ΔQriseΔTrise上升速率RQrise=ΔQriseΔTrecessiom退水速率RQrecession(m3/s)RQrecessiom=ΔQrecessiomΔTrecessiom峰值频率高脉冲持续时间T0.75PT0.75P=T(Q>75%×Qpeak)T注意:ΔQrise和ΔQrecession分别表示洪水事件开始和结束时的流量与峰值流量之间的差异;ΔTrise和ΔTrecessio分别表示洪水上升和退水阶段的持续时间。3.4. 评估指标本研究使用三个指标——NSE(Nash-Sutcliffe效率)(Nash和Sutcliffe,1970)、R2(决定系数)(Pechlivanidis等人,2011)和RMSE(均方根误差)——来评估模型的回归和预测准确性。较高的NSE和R2值接近1,较低的RMSE值接近0,表示模型的性能更好。计算公式如下:(7)NSE=1?∑i=1n(Qobs,i?Qsim,i)2∑i=1n(Qobs,i?Qobsˉ)2(8)R2=[∑i=1n(Qobs,i?Qobsˉ)(Qsim,i?Qsimˉ)]2∑i=1n(Qobs,i?Qobsˉ)2∑i=1n(Qsim,i?Qsimˉ)2(9)RMSE=1n∑i=1n(Qobs,i?Qsim,i)2其中Qobs,i表示第i时间步的观测值,Qsim,i表示第i时间步的模拟值,Qobs?表示观测值的平均值,Qsim?表示模拟值的平均值,n表示样本大小。4. 结果与分析4.1. 径流序列回归结果4.1.1. 模态分解结果分析根据第3.1节描述的方法,VMD将Dashankou站(1959–2018年)的日径流序列分解为六个模态成分,如图4所示。子序列的时间分布显示成分之间没有模式混叠。每个子序列的计算中心频率见表3。IMF1代表超低频趋势成分,捕捉序列信号中的长期缓慢变化。IMF2–IMF3对应低频信号,其特征是准周期性波动。IMF4–IMF6包含中高频细节,反映了高频干扰和快速波动。IMF1–IMF6表现出明显的频带分离和递增趋势,具有清晰的频率分层。这进一步验证了VMD方法在特征提取中的有效性和合理性。下载:下载高分辨率图像(565KB)下载:下载全尺寸图像图4. 1959–2018年Dashankou水文站日径流序列每个子模态的时间分布。表3. 每个子模态和原始序列的指标。空单元OBSIMF1IMF2IMF3IMF4IMF5IMF6模糊熵0.410.150.260.290.180.160.19排列熵0.920.550.590.720.910.990.98HURST0.780.780.440.290.270.290.30中心频率0.120.010.040.090.190.310.39对于分解结果,使用模糊熵和排列熵来评估每个序列信号的复杂性,同时使用HURST系数(Shi等人,2021;Adarsh等人,2019)来检验序列的长期记忆。计算结果显示,相对于原始序列,每个子序列的模糊熵显著降低,表明VMD分解有效降低了原始序列信号的复杂性。此外,排列熵的比较显示,低频成分IMF1–IMF3的值远低于原始序列,表明主要的可解释动态已被提取为更有序的成分。相比之下,高频成分IMF5–IMF6的排列熵接近1,表明强烈的随机干扰被有效集中在少数高频模式中。通过对所有序列应用ADF和Ljung–Box(LB)测试,发现它们都在0.05的显著性水平上通过了ADF单位根测试和LB测试。ADF结果表明所有子序列都表现出强烈的平稳性,适合构建时间序列预测模型。Ljung–Box测试进一步表明数据序列不是白噪声,而是具有显著的自相关性,为时间序列预测提供了坚实的基础。HURST系数用于衡量时间序列中的长期依赖程度。结果显示,Dashankou观测到的径流序列的HURST系数大于0.5,表明该序列具有长期记忆性。这种依赖性主要体现在IMF1分量上,即其持续的周期性变化中。相比之下,IMF2–IMF6的HURST系数均小于0.5,表明这些模式表现出抗持续性。这表明应更多地关注短期波动和随机性,同时减少对长期依赖性的建模需求。
4.1.2. 模拟结果分析
根据第3.2节描述的“分解-学习-整合”框架开发的VMD-LSTM混合模型和单一LSTM模型用于模拟Dashankou水文站的观测径流序列,其散点图如图5所示。VMD-LSTM模型的大多数散点分布接近1:1线,整体决定系数R2=0.99,训练集和验证集的R2值分别为0.99和0.98。进一步分析表4发现,VMD-LSTM模型在高值范围内获得的高R2主要是由IMF1和IMF2决定的,它们在重构序列中起主导作用。这些低频分量具有相对较低的模糊熵和排列熵,表明信号纯度较高。此外,95%的预测区间显著缩小,并在整个径流范围内保持大致同方差性,没有明显的系统偏差。相比之下,LSTM模型的R2为0.93,略低于混合模型,主要是由于高流量值估计不足和散点离散度较大。总体而言,在参数优化后,VMD-LSTM和LSTM模型都能对Dashankou的径流序列进行满意的模拟。
图5. 1959–2018年Dashankou站模拟(VMD-LSTM (a)和LSTM (b))与观测值的散点图。
表4. 所有子模态和原始序列模型的评估指标。
图6显示了两种模型在训练和测试期间模拟径流序列的一致性,两者在两个阶段都表现出一致的特征。在长时间低流量期间,两种模型的表现非常相似。然而,在流量快速上升和下降的极端径流过程中,尤其是在峰值流量阶段,VMD-LSTM模型能够比单一LSTM模型更准确地再现观测序列的峰值-低谷特征和时间演变,模拟误差更小。特别是在快速波动的条件下,VMD-LSTM模型显著减少了单一LSTM模型中观察到的幅度低估和相位滞后。总体而言,LSTM和VMD-LSTM模型在模拟径流序列方面都表现出强大的能力。
4.2. 洪水事件检测能力分析
根据第3.3节所述的方法,从Dashankou水文站1959–2018年的日径流序列中,使用POT方法共识别出152次具有完整上升和下降过程的洪水事件。同样,从同一时期的LSTM和VMD-LSTM模拟结果中也提取出了152次洪水事件。图7展示了三个数据集中洪水事件特征指标的统计结果。在所有指标中,除了0.75P指标外,VMD-LSTM模拟的洪水事件在特征值和极端值上都更接近观测值。值得注意的是,对于上升和消退速率,VMD-LSTM模型的中位数更接近实际值,且分散度更低,从而更准确地反映了洪水上升和消退的趋势。在峰值方面,VMD-LSTM模型的集中度趋势最接近实际值,只有少数高端异常值,因此能够更稳健地捕捉到峰值。对于总洪水体积指标,三个数据集之间的差异很小,因为结果几乎相同。
图8显示了LSTM和VMD-LSTM模型在训练集(a)和验证集(b)中对152次洪水事件模拟与观测值的峰值时间差异。VMD-LSTM模型通过多尺度和非平稳成分分解,能够更准确地捕捉到信号强度较大段中的振幅和相位变化,从而在捕捉洪水事件方面具有显著优势。
4.3. 洪水事件预测能力分析
4.3.1. 累计预测误差
为了进一步评估LSTM和VMD-LSTM模型在学习序列信号变化后的实际预测能力,时间序列在每次洪水事件开始前一天被截断,并进行“预测实验”,不引入任何未来信息。总预测步长设置为15天。表4显示了预测1天、5天、10天和15天后所有洪水事件的平均误差变化。
根据表5,由于模型重建和优化过程中失去了未来参考信息,两种模型的误差都会随预测步长的增加而累积。然而,VMD-LSTM模型的误差明显小于LSTM模型。四种预测步长的累计平均误差依次为VMD-LSTM的33.5%、37%、42.2%和46.2%。在误差增长方面,VMD-LSTM仅在1天预测步长时误差小于LSTM(VMD-LSTM为5.26,LSTM为8.04),而在其他预测步长时,VMD-LSTM的误差(5.43和5.32)大于LSTM的误差(3.86和4.77)。
为了更全面地了解模型预测洪水变化过程的能力,选择了96次洪水事件,这些事件在15天预测期内都经历了上升和下降阶段。在这项研究中,将洪水上升和消退阶段超过峰值流量80%的局部极端点定义为峰值点。随后将洪水事件分为单峰、双峰和多峰三类,分别为27次、32次和37次。表6展示了这三种类型洪水事件的平均特征指标。根据统计指标,单峰洪水的峰值流量最高,但总体体积和持续时间最小,上升和消退过程急剧,形成“尖锐而细长”的过程曲线。相比之下,多峰洪水的峰值流量最小,但持续时间最长,总体体积最大,上升和消退过程较为平缓,形成“短而粗”的过程曲线。双峰洪水介于两者之间,特征值介于“尖锐而细长”和“短而粗”的曲线之间。
图9显示了VMD-LSTM和LSTM模型对三种类型洪水典型发展过程的预测结果。如图9所示,LSTM模型对三种类型洪水的预测通常呈现线性分布,未能捕捉到洪水的变化过程。在前8天内,VMD-LSTM模型的预测结果通常能够匹配不同类型洪水的发展趋势,显示出一致的上升和下降过程,并成功捕捉到洪水波动的拐点。然而,在流量值预测方面,两种模型都存在幅度低估的问题,且随着预测步长的增加,低估现象更加明显。8天后,两种模型的预测结果与实际洪水流量偏差较大,特别是在双峰和多峰洪水事件中,短时间内发生了多次大幅波动,导致模型无法有效预测洪水的上升和下降趋势。
5. 讨论
5.1. LSTM模型的学习性能
尽管先前的研究表明,通过“分解-学习-整合”框架将信号分解技术与深度学习模型相结合可以获得比单独使用深度学习模型更好的模拟和回归性能(Li等人,2022年),但LSTM在处理复杂时间序列信号方面也展示了强大的潜力和优势(Kratzert等人,2019年)。根据第4.1.2节的结果,对于Dashankou水文站60年观测到的日径流序列的模拟,VMD-LSTM模型在整体曲线匹配性能上并未表现出显著优势。表4和表3的综合分析表明,VMD-LSTM在低至中频模式方面具有明显优势。IMF1–IMF3的评估指标明显优于原始序列和高频模态序列。然而,随着中心频率的提高,尽管模式的整体复杂性降低(表3),短期波动性增强,长期记忆性减弱(Li等人,2024年),LSTM的记忆优势变得不那么有效,导致评估指标下降。图10展示了每种序列的损失函数变化。对于IMF1–IMF3,损失在2-3个周期内迅速减小并趋于零,训练和验证曲线几乎重叠,表明低频和中频组分的可学习性强,泛化误差小。对于IMF4–IMF6,验证损失在早期略高,并出现短暂的平台期,但随后稳步下降并与训练损失逐渐收敛,表明高频、短记忆信号更难拟合,尽管没有观察到过拟合或发散现象。对于原始序列,训练和验证损失几乎相同,并在更长的迭代过程中逐渐减小,反映了强烈的跨样本一致性。这表明低频成分表现出稳定的季节性波动,与年温度变化周期高度一致,暗示温度是控制其低频变化的主要因素。降水和温度的滞后分析进一步显示,IMF5和IMF6对降水最为敏感,滞后时间均为1天。高频成分表现出间歇性增强的振荡结构,其高振幅阶段大多发生在降水集中或温度相对较高的时期,反映了诸如降雨径流形成、融水短期增强和快速流动集中等过程。其余成分在两种实验中都处于中间水平,表现出介于低频背景变化和高频峰值扰动之间的特征,从而反映了不同时间尺度上的过渡性水文响应。在这些条件下,LSTM的有效记忆长度受到限制。因此,VMD-LSTM混合模型在高频模式中的相位不匹配和偏差在积分过程中累积,抵消了在低频模式中取得的部分改进,使得整体信号匹配的优势不明显。
5.2. 子模态在洪水检测和预测中的作用
第4.2节表明,LSTM和VMD-LSTM模型都能有效捕捉Dashankou(1959-2018年)的日径流序列模式。然而,VMD-LSTM模型在检测洪水事件方面表现出明显优势——这些洪水事件具有高不确定性和复杂的时空动态。图11使用径流序列及其子模态以热图形式展示了152个洪水事件的评估指标。
评估指标表明,独立的LSTM模型无法充分表示洪水发展过程。对于LSTM模拟的53个洪水事件,NSE值低于0,表明完全无法跟踪洪水动态。统计上,这53个事件具有独特的特征:平均峰值流量为278.54立方米/秒(非洪水事件的123%),平均上升和下降速率为12.91立方米/秒·天(正常值的112%)和11.88立方米/秒·天(正常值的151%),持续时间均少于13天,证实了洪水的迅速发作和强烈的非平稳性。尽管LSTM模型能够成功捕捉长期趋势和周期性变化,但它难以学习主导洪水动态的高频短期波动。因此,尽管模型与整体径流模式吻合良好,其对洪水事件的模拟并不准确。
在VMD-LSTM模型中,各个子模态成分对洪水预测的影响在模拟结果中可以清晰观察到。在第4.3.2节中,我们评估了省略每个特定子模态成分(IMF1至IMF6)对96个洪水事件预测的影响,这些事件都在15天的预测范围内表现出上升和下降阶段。图12总结了三种洪水类型(单峰、双峰和多峰)的预测性能变化。图12的水平轴表示被省略的子模态信号;例如,“DIMF6”表示从分解-学习过程中排除了IMF6。
当未来参考信息不可用且预测仅基于序列的内在信号时,每个内在模态函数(IMF)对洪水预测的影响通常会随着中心频率的增加而减小。排除IMF6和IMF5(最高频成分)对预测准确性的影响仅是边际的。然而,去除IMF3(包含洪水发展的主要趋势)会导致性能显著下降。随着洪水事件从单峰发展到双峰和多峰类型,IMF4的贡献变得越来越关键。在多峰洪水情景中,其影响接近IMF3的影响,强调了其在捕捉复杂洪水动态中的重要作用。
与LSTM模型相比,VMD-LSTM模型在洪水过程预测方面表现出更好的性能,主要是由于VMD分解能够通过隔离不同的频率成分来简化信号复杂性。LSTM更容易学习每个子模态——从长期趋势到短期波动——从而能够精确重建复合洪水信号。即使在缺乏未来参考信息的情况下,模型也能保留并利用从每个子模态中学到的模式,最终在积分后实现准确的洪水过程预测。相比之下,独立的LSTM模型难以解析原始序列中嵌入的多尺度特征。尽管通过训练过程中的迭代参数调整可以提高其性能,但它缺乏稳健捕捉内在信号特征所需的结构分解。因此,在真实预测情景中,其跟踪实际信号变化的能力显著减弱。
6. 结论
基于1959年至2018年喀都河流域Dashankou水文站的日径流数据,本研究采用了一个混合VMD-LSTM模型来模拟……并分析子模态动态。分析了该模型捕捉152个已识别洪水事件的能力,并进行了预测实验以评估子模态特征的功能贡献。得出的结论如下:
(1) 在参数优化后,LSTM和VMD-LSTM模型在径流时间序列回归方面的性能相当,然而VMD-LSTM模型有效地整合了高性能的中频和低频成分以及强大的高频成分,显著减少了信号噪声和模态混叠——尤其是在流量高和波动迅速的时期。
(2) 在处理复杂和不确定的洪水事件时,VMD-LSTM模型在整合之前会从每个子模态中学习到不同的模式。整合后,它在捕捉洪水过程(包括上升、峰值和下降阶段)方面的表现优于独立的LSTM模型,洪水事件的回归准确性显著提高。
(3) 即使没有外部未来输入,VMD-LSTM模型也能通过利用其对子模态特征的学习记忆来保留和扩展有用信息,显示出比LSTM模型更高的预测成功率和更好的信息保留能力。
尽管这些结果很有前景,但本研究仍有一些需要在未来研究中注意的局限性。首先,所有实验仅在喀都河流域进行,限制了研究结果的普遍性。虽然该模型在该地区表现强劲,但其对其他山区流域的适用性仍有待确定。未来的工作应该将该方法应用于不同气候和地形区域的更多山区流域,并将其性能与全球山区地区的现有模型进行比较。使用来自多个流域的径流数据进行交叉验证对于测试该方法的可扩展性和稳健性至关重要。此外,所提出的方法尚未准备好用于实际操作。我们相信这项研究为高海拔、数据稀缺的山区地区的径流预测提供了有价值的见解——特别是在实时气象观测有限或不可用的情况下。
声明
本文在准备过程中使用了AI工具。
资助
本研究得到了新疆干旱区水循环与利用关键实验室开放基金(XJY0907-2024-yb-02)、中国科学院西部青年学者(2022-XBQNXZ-002)、国家自然科学基金重点项目(42230708)以及国际交流与合作项目(NSFC42361144887)的支持。
CRediT作者贡献声明
方功焕:验证、方法论
梁海东:写作-审阅与编辑、数据管理
刘骄:写作-审阅与编辑、软件、方法论
徐洋:写作-审阅与编辑、软件、方法论
陈曦:调查
刘铁:方法论、概念化
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号