多尺度分解与模糊规则注意力:一种可应用于跨流域的长期水质预测框架

《Water Research》:Multiscale decomposition and fuzzy-rule attention: A transferable cross-basin framework for long-term water quality forecasting

【字体: 时间:2026年02月22日 来源:Water Research 12.4

编辑推荐:

  水质量预测中提出融合物理信号分解与模糊逻辑的深度学习框架,采用多通道奇异谱分析分离趋势与噪声,结合Transformer架构的自注意力机制与自适应模糊机制,处理非stationary环境驱动交互。基于2007-2022年中国149站周数据验证,模型26步超前预报NSE达0.75±0.19,对溶解氧、pH等周期性指标表现优异,跨流域迁移能力提升28.41%。

  
Jingzhe Hu|Ying Li|Dawei Jiang|Danrong Zhang|Chunhui Lu|Wei Zhi
中国江苏省南京市,210024,长江水利开发研究院水灾害防治国家重点实验室、水利部水循环与水动力系统重点实验室、河海大学

摘要

准确地进行长期河流水质预测对生态系统管理至关重要;然而,基于过程的模型往往受到历史记录碎片化、缺乏长期连续性以及环境驱动因素之间复杂非平稳相互作用的限制。为了解决预测精度与跨流域普适性之间的权衡,我们提出了一个可迁移的深度学习框架,该框架结合了物理信号分解和模糊逻辑。具体来说,我们采用多通道奇异谱分析来分离出随机噪声中的不同趋势。该框架整合了Transformer架构和自适应模糊机制,旨在管理不确定性并捕捉复杂的时空依赖性。通过对2007年至2022年间中国不同河流流域149个监测站的实地观测数据进行评估,该模型在26步预测(大约六个月)中的平均Nash–Sutcliffe效率(NSE)超过了0.75±0.19。它在溶解氧和pH值等季节性主导的指标上展示了有效的预测能力,并提高了高锰酸盐指数和氨氮等事件驱动污染物的预测稳定性。比较分析表明,所提出的框架优于现有的最佳基线模型,平均NSE提高了24.85%。值得注意的是,跨区域建模策略使NSE相比独立单站模型的性能提高了28.41%,验证了该框架在异质区域间传递学习到的结构先验的能力。这些发现表明,将结构分解与软模糊约束相结合为数据稀缺流域的水质预测提供了一种有前景的解决方案。

引言

对淡水需求的不断增加,加上气候变化的影响和非点源污染的加剧,显著增加了河流水质动态的复杂性(Zhao等人,2025年;Moeinzadeh等人,2024年)。这些复杂的动态对生态系统稳定性和公共健康构成了严重挑战(Graham等人,2024年;Mau?ner等人,2025年)。在这种情况下,开发稳健的长期水质预测模型对于指导流域管理、优化水资源分配和设计有效的污染控制策略至关重要(Zhi等人,2024年;X. Zhou等人,2024年)。然而,由于监测数据在空间和时间上通常都很稀疏(Liao等人,2023年),准确的预测仍然很困难。此外,环境驱动因素之间的非线性相互作用进一步增加了这些系统准确表征的复杂性(Wu等人,2025年)。
模拟河流水质的方法大致分为两类:基于过程的方法和数据驱动的方法(Huang等人,2024年;Aliashrafi等人,2021年)。基于过程的模型基于质量守恒和能量守恒定律,明确表示降水-径流过程、溶质传输和生物地球化学转化(Lohse等人,2009年;Li,2019年)。广泛使用的工具如土壤和水资源评估工具(SWAT)(Abbaspour等人,2007年)和MIKE 21水动力模型(Zhang等人,2022年)可以为长期预测提供可解释的机制洞察(Huang等人,2023年)。然而,这些模型需要高分辨率的输入数据(包括气象、土壤和土地利用数据),以及劳动密集型的参数校准(Leimer等人,2011年;Hutchins等人,2017年)。特别是在数据有限的情况下(例如,监测网络稀疏、现场水质记录不连续、采样频率不规则),以及缺乏过程模型通常所需的机制参数(例如,特定污染物的衰减率或再曝气系数),这些方法往往面临预测不确定性增加和等效性问题(Renard等人,2010年;Ratto等人,2007年)。
随着监测网络的扩展,数据驱动方法已成为基于过程方法的关键补充(Trabucchi和Buganza,2019年)。这些方法可以大致分为机器学习和深度学习(Searcy和Boehm,2022年)。传统的机器学习方法,如随机森林(Chen等人,2020年)和梯度提升机(Chang等人,2024年),通常依赖于浅层架构或手动特征选择来捕捉输入-输出相关性。虽然这些方法对于静态映射有效,但它们往往难以捕捉变量之间的动态变化耦合(R. Zhou等人,2024年),因此在不同季节性条件下的泛化能力有限。
相比之下,深度学习架构能够从高维数据中自动提取层次化表示(D. Li等人,2025年;Shen等人,2023年)。早期的基于循环神经网络的模型,如长短期记忆(LSTM)网络(Graves,2012年)和门控循环单元(GRU)(Chung等人,2014年),已被广泛应用于水文时间序列分析(Zheng等人,2025年)。然而,这些模型受到其顺序递归性质的限制,这限制了并行化效率并阻碍了长距离时间依赖性的建模(Jiang等人,2025年)。此外,标准的深度学习模型通常将监测站视为孤立节点,纯数据驱动的模型往往忽略了上下游的溶质传输(Asadi等人,2025年;Nai等人,2024年)。这种限制往往导致当模型转移到数据稀缺的流域或具有不同环境特征的异质区域时泛化能力较差(Kraft等人,2025年)。
为了克服这些顺序瓶颈,Transformer架构作为一种强大的替代方案应运而生。通过利用自注意力机制,Transformer无需递归即可自适应地建模任意时间步骤之间的依赖性(Vaswani等人,2017年;Nejad等人,2024年)。尽管具有潜力,但在水质预测中应用Transformer面临特定挑战。首先,水文信号通常是非平稳且噪声较大的;标准的注意力机制可能会无意中关注高频噪声而不是明显的物理趋势(Hou等人,2024年)。其次,纯数据驱动的模型缺乏处理环境数据固有不确定性的能力(Zhu等人,2025年)。将模糊逻辑集成到注意力机制中提供了一种编码专家规则和处理决策不确定性的方法,从而提高了对模式变化的鲁棒性(Yin等人,2025年)。然而,现有模型通常依赖于单变量分解或特定站点设计,导致信息碎片化、频率混叠以及难以同时捕捉趋势和季节性成分。特别是,尽管神经模糊系统在其他领域显示出潜力(Shihabudheen和Pillai,2018年),但将其与多尺度分解结合以提高水文可解释性方面的研究仍然不足。
为了解决这些挑战,本研究旨在:(1)开发一个用于大规模长期水质预测的Fuzzy-Transformer模型;(2)实现改进的预测精度和稳健的跨流域迁移能力。为了严格验证该模型进行长期水质预测的能力,我们利用了中国不同水文气候区149个站点15年的连续每周记录(2007-2022年)。通过利用这个十年数据集,我们展示了所提出的框架如何超越传统的孤立单站范式,有效地捕捉和传递共享的水文模式。

研究区域

研究范围涵盖了中国的内陆和沿海地区,纬度从20°–50°E到80°–130°E,总面积约为960万平方公里。共选择了149个水质监测站(图1(a)),展示了它们相对于区域地形和主要流域(包括长江、黄河、珠江、松花江和淮河)以及中国东部代表性沿海河流的空间分布。该地区涵盖了多样的

中国内陆和沿海站点的指标特定性能

在2007年至2022年间对中国149个内陆和沿海站点进行的26步多变量预测中,所提出的模型平均NSE为0.75。不同指标的性能存在系统性差异:溶解氧(DO)和pH值的预测能力和稳定性更高,平均NSE值分别为0.85±0.120.83±0.12。相比之下,营养物质和有机指标的准确性和空间变异性较低,NSE分别为0.74±0.20.59。此外,多尺度分解与模糊规则注意力的结合协调了预测精度与跨流域迁移能力之间的权衡。MSD模块通过明确分离正交趋势和季节性成分,简化了非线性映射任务,使深度学习模型能够专注于学习残差动态,而不是从头开始解开复杂的相互作用。这种结构先验与跨流域联合建模相结合,促进了知识的高效转移

结论

本研究开发了一个Fuzzy-Transformer框架,该框架结合了趋势-季节性分解,以平衡预测精度和跨流域迁移能力。该模型通过分离低频趋势和稳定的年度周期,整合了可解释的结构先验。这种改进带来了显著的性能提升,平均NSE提高了24.85%。在149个站点的评估中,跨流域联合建模使NSE提高了28.41%。

CRediT作者贡献声明

Jingzhe Hu:撰写 – 审稿与编辑、原始草稿撰写、验证、软件开发、方法论、调查、概念化。Ying Li:撰写 – 审稿与编辑、可视化、验证、方法论、调查、形式分析。Dawei Jiang:可视化、软件开发、调查。Danrong Zhang:撰写 – 审稿与编辑、监督、项目管理、数据管理。Chunhui Lu:监督、项目管理、资金获取、数据管理。Wei Zhi:撰写 –

代码可用性

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

致谢

本研究得到了国家自然科学基金(52595704、42577102)、青年教师科研创新能力支持项目(SRICSPYF-ZY2025153)、江苏省基础研究计划(BK20250013)和南京海外归来人员科技创新计划(B2506501)的资助。Wei Zhi还感谢国家自然科学基金的优秀青年科学家基金和河海大学的高性能计算平台的支持
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号