《Water》:Predicting Groundwater Depth Using Historical Data Trend Decomposition: Based on the VMD-LSTM Hybrid Deep Learning Model
Jie Yue,
Hong Guo,
Deng Pan,
Huanxiang Wang,
Yawen Xin,
Furong Yu,
Yingying Shao and
Rui Dun
编辑推荐:
本研究针对地下水深度预测在非线性和非平稳时间序列中的挑战,提出了一种结合变分模态分解(VMD)与长短期记忆神经网络(LSTM)的混合深度学习框架。该模型仅利用历史地下水位数据,通过VMD将原始信号自适应分解为具有明确物理意义的多个本征模态函数(IMF),再为每个IMF构建独立的LSTM模型捕捉其独特的时间演化模式,最后线性重构得到最终预测。在郑州典型缺水地区的研究表明,VMD-LSTM模型的决定系数(R2)超过0.90,平均绝对误差(MAE)和均方误差(MSE)较低,显著优于基准模型。该框架为缺乏水文气象数据的地区提供了创新的、可靠的地下水深度预测技术途径,并对区域地下水资源的可持续利用管理具有重要科学价值。
1. 引言
地下水是全球水资源系统的核心组成部分,在供水安全、生态维护、地质过程和经济发展中发挥着不可替代的作用。在水资源稀缺和局部水质性缺水的地区,其重要性尤为显著。近年来,随着社会经济的快速发展和需水量的持续增长,许多地区出现了地下水超采现象,导致地下水位下降、地面沉降、地裂缝等一系列环境和地质问题,严重制约了区域经济社会的健康发展。
为全面理解水文过程并实现精准预测,研究人员采用了多种方法。传统概念模型过度简化了流域内的物理过程,并且依赖充足、完整的基础水文数据支持。基于物理的模型作为主要工具,虽然能为理解地下水系统的水文过程提供宝贵见解,但往往受到水文地质参数不准确、复杂水文过程数据不足等重大限制。此类物理属性信息的缺失可能会显著降低模型预测性能或增加模型的不确定性。
为应对这些挑战,利用观测数据集提高模型预测精度凸显了机器学习方法的可行性。此方法有效缓解了传统概念模型在地下水模拟中固有的不确定性。目前,一些研究已将机器学习方法应用于地下水深度预测。机器学习模型不需要显式表达复杂的水文过程,可以通过从历史数据中捕获演化趋势来实现准确预测。基于数据的水文方法因其对数据要求极低,近年来发展迅速,日益普及。值得注意的是,在数据丰富但机制复杂的环境中,机器学习模型在地下水水位预测方面表现出比基于物理的模型更明显的优越性。鉴于此,机器学习方法在地下水水位预测中得到了越来越广泛的应用。
作为一个非常有前景的模型,人工神经网络(ANNs)已被越来越多地应用于地下水深度预测。许多研究验证了人工神经网络在地下水深度预测中的实用性。然而,由于人工神经网络对数据质量和数量的高要求,以及其泛化能力有限,它们难以捕捉长时序数据中复杂的非线性关系。为了解决传统ANN处理时序数据时的序列依赖问题,研究者提出了循环神经网络(RNN)。通过引入循环结构和隐层状态反馈机制,RNN使模型在处理当前时间步的输入时,能够纳入历史时间步的隐层信息,从而有效捕获时序数据的序列相关性。
作为RNN的改进变体,长短期记忆(LSTM)神经网络解决了梯度消失问题,同时优化了模型选择性记忆和遗忘时间信息的能力,这使得LSTM成为水文研究中时间序列预测的主流模型。许多研究利用LSTM进行地下水深度数据的重建和预测,证明了其高精度和稳定性。
大多数研究使用气象站数据作为模型输入特征来预测地下水深度。然而,在许多地区,气象站分布不均,少数地区缺乏气象站,导致数据不足或难以获取,这往往限制了模型的性能和预测精度。历史数据通常是影响未来地下水深度波动的重要因素,为缺乏水文气象数据的地区提供了新的预测解决方案。因此,本研究尝试使用历史地下水深度数据作为模型输入特征来预测地下水深度的变化。鉴于地下水深度数据的高度非线性特征,需要结合某些其他技术来提高LSTM对地下水深度的预测精度。
郑州市属于资源性缺水和水质性缺水城市,其人均水资源占有量仅为全国平均水平的1/10。长期的地下水超采导致地下水位持续下降。限制开采区和禁止开采区的划定,结合南水北调工程和黄河水资源的调引,触发了郑州地下水深度动态变化的新演化模式。因此,开展有关地下水深度动态变化和趋势预测的相关研究势在必行。
变分模态分解(VMD)用于分解非平稳时间序列数据信号,它可以自适应地将数据分解为多个相互独立的本征模态函数(IMF),并有效提取多尺度特征。本研究以郑州市地下水深度监测数据为基础,基于VMD和LSTM神经网络模型,开展对郑州市地下水深度趋势的预测研究。VMD-LSTM混合模型将复杂的水文信号解耦为可解释的组成部分,并准确学习每个组成部分的时间变化模式。在处理地下水深度时间序列的非线性和非平稳特性方面,它优于单一的深度学习模型和传统的数据驱动方法。与以往研究相比,该模型具有明显优势:它通过VMD在数据有限和时间序列较短的条件下保持稳定的性能,克服了传统概念模型对水文参数和数据完整性的依赖。同时,与单一的深度学习模型相比,VMD与LSTM的结合增强了对历史数据信息挖掘和捕获非线性关系的双重能力。VMD在处理非线性和非平稳数据方面的能力有助于快速适应不同的监测点和区域,有效克服了现有模型在数据稀缺的复杂水文情景中的局限性。本研究不仅为缺乏水文气象数据的地区提供了一种创新方法,也为地下水资源的合理开发利用和城市地下水监测网络的优化布局提供了科学依据。
2. 材料与方法
2.1. 研究区域与数据
研究区地下水主要分为松散岩类孔隙水、碎屑岩孔隙裂隙水、碳酸盐岩裂隙岩溶水和基岩裂隙水四种主要类型。浅层地下水定义为地表以下80米以内的潜水(研究区典型的浅层地下水类型),以京广铁路为界分为东、西两区,含水层岩性特征明显不同。东部位于黄河冲积平原,含水层以全新统和上更新统细-中砂为主,局部为粉细砂。西部分布于黄土台塬前缘平原和阶地高岗区。前缘平原主要由全新统和上更新统冲洪积粉细砂层组成,部分夹有中更新统冲洪积粘土和中细砂。在阶地高岗区,上部主要为中更新统冲洪积细-中砂,下部为下更新统和新近系湖相沉积。由粘土和粉质粘土组成的隔水底板,其渗透性良好,一般位于地下50-70米深度,该含水层的地下水系统是一个由底板岩性控制的潜水向弱承压水过渡的类型。
在郑州,中层地下水是研究区的典型承压水类型,其赋存于80-350米深度的含水层组中,与上覆浅层潜水被稳定的粘土弱透水层隔开,是主要的开采地下水层之一。中层含水层顶板位于地下50-100米(东部局部可达150米)深度,主要由粉质粘土或粉土、粘土组成。含水层底板在研究区东部位于300-380米深度,西部位于220-280米深度,主要由粘土组成。各段的中更新统含水层主要以细砂和中细砂为特征,偶尔出现中粗砂或粉土层。下更新统含水层在西南部缺失,而东北部以中砂、中粗砂和砾石层为主,局部夹有细砂和粉细砂。上新统含水层包括中砂、中细砂、局部的粉土以及粗砂-砾石层,在西南部高原地区缺失。
郑州市位于河南省中北部,黄河中下游交界处,总体地形趋势为西南高、东北低。其地理坐标范围为东经112°42′至114°14′,北纬34°16′至34°58′。该市属温带大陆性季风气候,年平均气温为14.25°C。以郑州市主城区为研究区域,郑州市水资源公报数据显示,该地区多年平均年降水量为628.3毫米,时空分布不均。多年平均年蒸发量为1221毫米,相对湿度为66%。研究区内主要河流系统包括贾鲁河、索须河、熊耳河、七里河和东风渠,而黄河是流经该地区的主要跨境河流。
自2020年以来,由于超采控制、南水北调水源替代以及降水增加等措施,水位呈现显著上升趋势,地下水埋深相应减小。影响地下水埋深波动的因素相对复杂。在数据可用性有限的条件下,本研究可以仅利用历史观测数据实现对地下水深度的准确预测。本研究选取的监测井均位于郑州市地下水降落漏斗核心区,是区域地下水动态变化的典型代表。监测数据涵盖了研究区地下水埋深从超采下降到受干预上升的关键演化阶段,并包含了自然因素和人类活动耦合驱动的多尺度波动特征,赋予时间序列数据较强的区域代表性。
基于研究区监测站点数据,所选监测站点及输入时间范围如下:浅层Q1:2020年11月–2023年3月;浅层Q8:2015年11月–2023年3月;中层Z14:2015年12月–2023年3月;中层Z30:2016年4月–2023年3月,时间尺度为日。本研究使用日尺度地下水埋深监测数据构建了日时间尺度的地下水深度预测模型。地下水埋深动态数据集按比例随机划分为训练集(60%)、验证集(20%)和测试集(20%),所有相关实验均基于Python 3.10编程语言设计和实现。
2.2. 变分模态分解(VMD)
VMD是一种自适应非平稳信号分解方法。通过构建和求解变分问题,将原始信号分解为若干个具有明确物理意义的IMF。其核心过程如下:首先,构建一个约束变分问题,将原始信号f(t)分解为k个IMF。为了确保分量频带的集中性,最小化所有IMF的带宽之和,约束条件是所有IMF的叠加等于原始信号。该计算过程用公式表达。
在表达式中,{ωk}是IMF的中心频率。
为了求解约束问题,引入了拉格朗日乘子和惩罚因子,将其转化为增广拉格朗日函数。最后,采用交替方向乘子法(ADMM)在频域迭代更新IMF分量以确保分量最优性。同时,更新中心频率,并确定收敛性。最终,输出IMFs和残差以完成分解。
在本研究中,VMD方法被应用于分解日地下水埋深时间序列,关键实施步骤如下:(1) 确定最优分解数量:采用纳什效率系数(NSE)作为评估标准,通过迭代搜索NSE随分解数量变化的趋势,确定每个监测点的最优IMF数量,以平衡“特征完整性”和“分量有效性”,避免过度分解或分解不足。(2) 划分IMF物理意义:分解后,根据频率特征对IMF进行划分,其中IMF1代表地下水埋深的长期趋势分量,IMF2反映中低频波动特征,而IMF3~IMF7为高频细节分量和瞬时冲击分量。浅层监测点Q1、Q8和中层监测点Z14、Z30的最优分解数量分别确定为7、6、6和5。
2.3. 长短期记忆网络(LSTM)
LSTM是一种基于RNN改进的深度学习模型,形成了以细胞状态和门机制为中心的框架,其网络结构如图所示。门结构由输入门、遗忘门和输出门组成。假设前一个时间步的输出是ht-1,当前时间步的输入是xt,则可以通过一系列计算(包括遗忘门、输入门、细胞状态更新和输出门)得到当前时间步的细胞状态Ct和输出ht。LSTM通过这些门的协同工作,能够有效地学习时间序列中的长期依赖关系,并克服传统RNN的梯度消失问题。
在本研究中,为每个经过VMD分解得到的IMF分量构建一个独立的LSTM预测模型。每个LSTM模型被设计为捕获其对应IMF分量的独特时间模式。通过这种“分解-预测-重构”的策略,复杂的非平稳地下水埋深信号被解耦为多个相对平稳、频率特征明确的子序列,然后由专门的LSTM模型进行高精度预测,最后将所有IMF分量的预测结果线性叠加,得到最终的地下水埋深预测值。这种方法充分利用了VMD在信号多尺度特征提取方面的优势和LSTM在捕获复杂时间依赖关系方面的强大能力。