采用时频变换方法来减轻总氮波动对深度学习模型预测结果的影响

《Journal of Water Process Engineering》:Using time-frequency transformation approach to mitigate impacts of total nitrogen fluctuation on prediction results obtained by deep learning models

【字体: 时间:2026年03月06日 来源:Journal of Water Process Engineering 6.7

编辑推荐:

  总氮浓度波动特征与深度学习预测模型优化研究,提出VMD-深度学习框架及PCA降维方法,显著提升成都平原TN预测精度(RMSE降低44%),验证VMD对时频干扰抑制效果最优(LSTM组合模型R2达0.94),并建立3个核心环境因子(pH/EC/NTU)输入体系,为西南地区数据稀缺流域水质预警提供新范式。

  
梅莉|何一琳|王德科|陈克星|徐瑞
成都大学建筑与土木工程学院,中国成都,610106

摘要

总氮(TN)是评估淡水质量的重要指标。预测总氮并提高预测准确性对于水污染的早期预警至关重要。本研究分析了中国成都盆地总氮浓度的波动特征,并探讨了其对深度学习模型预测结果的影响。为了减轻波动的影响,采用了时频变换方法——变分模态分解(VMD)。然后,构建了一个结合VMD和深度学习模型的预测框架来预测总氮。此外,应用主成分分析(PCA)来减少监测点稀少且长期数据不连续的河流流域中的环境变量数量。结果表明,总氮的强烈波动是导致深度学习模型预测准确性下降的主要原因。VMD可以有效减轻波动干扰,并显著提高所有模型的预测性能。性能提升的顺序为:LSTM > GRU > MLP > 1D-CNN。VMD-LSTM取得了最佳性能,RMSE、MAE和SMAPE分别降低了44%、45%和45%,R2最高达到了0.94。此外,通过PCA将环境变量数量从18个减少到3个——pH值、电导率(EC)和浊度(NTU),为数据稀缺的流域应用我们的研究成果提供了可能性。我们的研究揭示了总氮的动态波动特征,并提供了一个相对准确的总氮预测框架,有助于加强水污染的早期预警管理。

引言

快速的城市化增加了不透水表面的面积,加剧了气候变化的影响,从而加速了非点源污染物进入河流的速度,最终恶化了淡水质量[1]。非点源污染作为河流污染的主要形式,其特点是来源广泛(如农田排水、土壤侵蚀和降雨径流等)、随机性强且潜伏期长[2],这使得对其组成污染物的预测特别具有挑战性。总氮(TN)作为一种典型的非点源污染物,是评估河流污染的关键指标,也是水体富营养化和有害藻类爆发的主要驱动因素。这破坏了水生生态系统的正常功能,并对人类和动物健康构成间接威胁[3]。以成都河流域为例,该地区66%的水质未能达到《地表水环境质量标准》(GB 3838–2002)中的III类水质标准,其中总氮是主要污染物之一[4]。因此,建立准确的总氮污染早期预警系统已成为该地区水污染控制和水质改善的核心要求。然而,由于总氮传输的固有随机性和时空变异性,传统的固定点监测方法难以准确捕捉其动态时空变化[5]。为了解决这个问题,找到一个准确的总氮预测模型框架至关重要。近年来,随着环境信息技术的发展,应用深度学习模型有效识别总氮的非线性时空变化模式已成为一个热门研究趋势。
人工神经网络(ANN)早期被应用于总氮预测[6],并且能够有效处理复杂的非线性问题[7]。ANN使用水质参数或非水质参数(如城市、人口密度和IKONOS影像数据)作为输入变量,并通过反向传播算法迭代调整模型的连接权重以最小化预测误差。与线性回归模型相比,ANN表现出更低的平均平方误差(ASE)和平均绝对相对误差(MARE)值以及更高的决定系数(R2)值,表明在模拟非线性总氮时间序列数据方面具有更好的性能。Sinshaw等人[8]开发了一个以pH值、电导率和浊度(NTU)为输入变量的ANN模型,用于预测美国湖泊中的总氮。Amiri等人[9]结合ANN和多元线性回归(MLR)对日本中部21个流域的总氮进行了预测。通过使用城市、农业、草地、水体和人口密度的最大值等非水质输入变量,使用R2评估了预测性能。结果表明,ANN模型的性能优于MLR模型,因为其隐藏层神经元通过反向传播迭代优化权重,从而提高了预测性能。类似地,刘等人[10]使用IKONOS影像的反射值作为输入变量,对中国的总氮进行了MLR和ANN模型的预测。预测结果通过R2和均方根误差(RMSE)进行了评估。两种模型的预测值与实际值相对接近,表明IKONOS卫星数据作为输入变量具有足够的潜力。然而,由于ANN在处理长时间序列数据时计算复杂度高,容易过拟合[11]。在这种情况下,提出了循环神经网络(RNN)。
RNN通过引入循环机制,可以有效处理长时间序列数据,从而降低过拟合的风险。与ANN相比,RNN表现出更好的性能[12]。此外,当将RNN与其他算法结合时,RNN的预测准确性可以得到提高,因为新的预测框架可以从输入变量中更好地提取信息。Geng等人[13]提出了一个结合RNN和多路径注意力(MPA)的模型框架,用于预测废水中的总氮。输入变量包括化学需氧量(COD)、氨氮(NH3?N)、总磷(TP)、pH值和流量。结果表明,RNN-MPA模型具有更好的预测性能,因为它可以有效地捕捉长期时间依赖性并通过共享信息机制最小化信息损失。然而,RNN在捕捉非常长期的依赖性时仍存在明显限制,容易出现梯度爆炸或梯度消失等问题[14]。为了解决这些问题,引入了长短期记忆(LSTM)和门控循环单元(GRU)模型。
LSTM和GRU通过门控单元可以有效控制梯度流动,不仅减轻了梯度消失和梯度爆炸的问题,还增强了长期序列的建模能力[15]、[16]。为了进一步提高LSTM和GRU的预测准确性,将它们与其他深度学习模型结合是必要的。这种模型框架通过互补机制整合了不同模型的优势,从而提高了模型性能。例如,提出了一个卷积神经网络(CNN)-LSTM模型,用于预测韩国NRB河流中的总氮[17]。该模型使用水位(由传感器监测并通过CNN预处理)、总磷(TP)、总氮(TN)和总有机碳(TOC)作为输入变量。结果表明,CNN-LSTM模型的预测性能更好,预测值与实测值更为一致。原因是CNN-LSTM模型不仅可以利用CNN识别图像特征,还可以利用LSTM识别时间序列。Tian等人[18]结合深度时间卷积网络(DeepTCN)和GRU,使用温度(T)、溶解氧(DO)、pH值、氨氮(NH3?N)和总磷(TP)作为输入变量,预测开封市的总氮。比较分析表明,DeepTCN-GRU混合模型在总氮预测方面的准确性显著高于单一模型(CNN、RNN、GRU和DeepTCN),RMSE、平均绝对误差(MAE)和均方误差(MSE)分别降低了29.69%、40.21%和36.05%,R2提高了6.63%。
尽管一些深度学习模型(如GRU和LSTM)在总氮预测方面取得了高准确性,但许多研究发现,它们的特征提取效率仍受原始数据质量的限制。例如,未经处理的原始数据通常包含噪声或波动,这将降低模型的预测准确性[19]、[20]、[21]。时频变换方法(如变分模态分解(VMD)由于其非递归解决方案和独立模块选择的优点,可以有效解决干扰问题[22]。VMD可以有效去除噪声并区分不同频率的信号成分,从而减少模型特征提取的干扰负担。因此,将VMD与深度学习模型结合可以提高模型的预测准确性。构建了一个结合VMD和耦合奇异谱分析(CSSA)-LSTM-MLR(VCLM)的模型,用于鄱阳湖的总氮预测[3]。在该组合模型中,首先使用VMD对水质时间序列数据进行去噪。然后使用CSSA计算LSTM的最优超参数。最后,使用内在模态函数(IMFs)作为LSTM和MLR的输入变量来预测总氮。结果表明,VCLM模型的MAE、MAPE和RMSE分别降低了15.80–37.91%、17.69–33.37%和21.36–47.09%,而Nash-Sutcliffe效率系数(NSE)和Kling-Gupta效率(KGE)分别提高了10.91–16.25%和11.10–15.97%。Zuo等人[23]将VMD与加权群体鲸鱼优化算法(VMD-WSWOA)、时间卷积网络(TCN)和自回归积分移动平均(ARIMA)结合,用于预测香港维多利亚港的总氮。原始时间序列数据首先通过VMD分解,然后通过WSWOA进行优化。结果表明,VMD-WSWOA-TCN-ARIMA混合模型取得了高预测准确性。这种改进可以归因于WSWOA与VMD的结合,它加快了收敛速度并提高了模型输入变量的精度。
基于上述研究背景,尽管在总氮预测建模方面取得了显著进展,但仍存在一些不足。首先,大多数研究仅关注总氮预测的准确性优化,而忽视了探索优化的环境原因。本研究调查了总氮的波动特征,并揭示了它们对预测结果的影响。其次,迄今为止关于中国西南地区总氮预测的研究很少。因此,我们尝试在成都盆地使用深度学习模型实现总氮预测。引入了VMD预处理来减轻总氮波动引起的负面影响,从而提高了该地区的总氮预测准确性。最后,由于总氮预测的准确性受到环境输入数据数量的限制,应用了主成分分析(PCA)来减少模型对数据量的依赖。

研究区域

研究区域

我们的研究区域位于成都盆地(图1),该区域属于长江上游的岷江和沱江流域。其河流网络不仅为城市生产和日常生活提供水源,还支持农业灌溉。因此,该地区的水质管理对于确保饮用水安全和生态健康具有重要意义。

数据收集

数据集来自中国成都盆地的六个代表性站点。

缺失值和异常值的处理结果

为了确保模型训练和测试的数据质量,识别并处理了数据集中的缺失值和异常值,从而获得了完整合理的数据集。

结论

在本研究中,我们发现单个深度学习模型得到的总氮初始预测结果并不令人满意。为了探究原因,首先分析了总氮浓度变化的特点。发现总氮的波动是影响预测结果的重要因素。随后,采用了时频变换方法——VMD来减轻波动干扰。然后构建了一个结合VMD和深度学习模型的框架。

CRediT作者贡献声明

梅莉:撰写 – 审稿与编辑,撰写 – 原稿。何一琳:撰写 – 原稿,调查。王德科:数据管理。陈克星:方法论。徐瑞:撰写 – 审稿与编辑,监督。

资助

本工作得到了广西科技计划(AB24010027、AB25069169)和国家自然科学基金(62266014)的支持。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系,这些关系可能会影响本文所述的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号