ADAPT:一种基于相空间调优的物联网驱动的分析数据同化方法,用于长序列水质预测

《Environmental Modelling & Software》:ADAPT: A novel IoT-driven analytical data assimilation method based on phase-space tuning for long-sequence water quality forecasting

【字体: 时间:2026年01月21日 来源:Environmental Modelling & Software 4.6

编辑推荐:

  水质模型参数动态校准方法研究:基于相空间重构与Transformer模型的ADAPT框架提出,通过Aquaformer模型建立参数与水质动态的非线性映射关系,解决传统数据同化方法空间泛化能力差的问题。数字孪生与实地试验表明,ADAPT相比EnKF在监测点误差降低36.26%,未监测点降低54.66%,且参数调整具有强迁移性和误差稳定性。

  
孙明庄|李志立|傅光涛|贾海峰
中国水利水电研究院水循环与水安全国家重点实验室,北京 100038

摘要

由于外部环境变化导致参数过时,水质模型的性能常常会下降。为了解决这个问题,本研究提出了一种名为“通过相空间调整进行解析数据同化”(ADAPT)的新框架。与直接更新状态变量的传统数据同化方法不同,ADAPT通过使用基于Transformer的深度学习模型Aquaformer,在参数与水质动态之间建立稳健的联系,从而动态校准模型参数。该方法在中国滇农河的数字孪生模型和实际实验中得到了验证。结果表明,ADAPT的性能显著优于集合卡尔曼滤波器,在监测站点将预测误差降低了36.26%,在未监测站点降低了54.66%。ADAPT具有优异的可转移性和稳定的误差控制能力,有效克服了传统方法在空间泛化方面的局限性。本研究为智能水管理系统中的高频自动校准提供了一种可靠且基于物理原理的解决方案。

引言

水动力和水质模型对于水体的水质评估至关重要,可以为智能水管理提供实时预测(Feng等人,2024年)。它们的准确性依赖于校准,而这需要实际观测数据以及一定的计算时间(Garcia等人,2015年;Schneider等人,2018年)。这些要求限制了校准频率,导致由于参数过时而降低准确性(Liu等人,2022年;Milos等人,2024年;Zhou等人,2022年)。利用基于物联网(IoT)的高频水质数据进行数据同化可以通过动态调整参数,实现模型的高频自动校准(Milos等人,2024年;Oh和Bartos,2023年)。传统的数据同化方法通过将原始结果与观测数据结合来更新模型输出,但仅对监测点有益(Loos等人,2020年;Park等人,2020年)。然而,智能水管理需要全面了解整个水体的水质,而不仅仅是特定点。基于参数的数据同化更为合适,因为模型方程可以适当地将参数调整转化为输出变化,从而从监测点转移到未监测点(Zhang和Fu,2023年)。尽管具有潜力,但关于基于参数的水质预测数据同化的研究仍然有限,大多数研究集中在输出更新方法上,这突显了进一步研究的必要性(Cho等人,2020年;Huang和Gao,2017年)。
当前参数调整方法适用于水质数据的程度有限。基于传统方法的参数调整方法仍然依赖于其内在的理想化假设,例如卡尔曼滤波器及其变体中的正态分布误差和线性状态更新(Chen等人,2023年;Kong等人,2023a;Kong等人,2023b;Li等人,2017年;Zhang等人,2020年;Zwart等人,2023年)。这些假设在水质模拟中几乎不成立,因为水质模拟涉及强烈的非线性动态,从而影响了参数调整的稳健性和有效性。一些最近的研究在每次同化步骤中整合了气象数据和外部条件,允许模型通过强化学习自主调整参数(Jeung等人,2023年;Kang等人,2018年;Maier等人,2021年)。然而,自然水体中外部条件与参数之间的复杂且变化的关系难以用强化学习来建模。据报道,统计方法可以将参数值映射到模型输出,从而有效更新水动力参数(Ghorbanidehno等人,2020年)。然而,这些方法在水质模拟中应用效果较差,因为即使参数值固定,水质指标也可能随时间大幅变化,使得基于模拟水质推断参数值变得困难。
一种更直接的方法是分析参数与水质动态之间的关系(Ghorbanidehno等人,2020年)。参数与指标动态的联系比与指标值的联系更为清晰;然而,由于量化动态的挑战,这种方法尚未得到充分探索。由于水质序列可以被视为混沌时间序列,可以利用混沌理论来研究水质动态(Karunasingha和Liong,2018年;Pang等人,2025年;Wang等人,2020年;Wu等人,2009年)。作为确定性但未知的混沌系统的投影,尽管已知的混沌时间序列可能看起来是随机的,但相空间重建(PSR)可以使用混沌时间序列来重新创建与原始系统在动态上相似的混沌系统,提供了一个可能的解决方案(Hou等人,2022年;Su等人,2022年)。重建的混沌系统及其对应的相空间可以用来体现水质动态。传统上,PSR与线性回归结合使用,而基于Transformer模型的深度学习能够有效地模拟非线性动态,特别是基于注意力机制的Transformer模型(Hu等人,2024年;Huang等人,2022年;Zhang等人,2022年)。基于Transformer的模型可以通过分析历史数据点之间的相互作用来有效预测未来数据点,从而在混沌系统内实现从历史状态到未来状态的非线性映射(Liu等人,2023年;Wang等人,2023a;Wang等人,2023b;Zhi等人,2024年)。因此,可以在事先分析中建立参数与水质动态之间的联系,从而根据观察到的模式推断出适当的模型参数值。
本研究旨在将改进的稀疏注意力模块与PSR相结合,以建立参数与水质动态之间的先验联系,从而开发出一种可靠的基于参数的数据同化方法,以提高水质模型的准确性。在我们之前的研究中开发的Transformer变体Aquaformer(Sun等人,2026年)能够在各种预测范围内提供高质量的预测,并有效表征不同参数值对应的动态。本研究基于Aquaformer驱动的先验分析开发了一种基于参数的数据同化方法ADAPT(通过相空间调整进行解析数据同化),并将其应用于中国银川市滇农河的数字孪生模型。ADAPT可以帮助水质模型动态适应外部变化,并通过自动校准提高预测性能,符合“适应”一词的含义。如图1所示,ADAPT是一种基于参数的数据同化方法,因此能够提高整个水体的预测性能;参数更新过程基于相空间驱动的先验分析,有效地量化了水质动态,并为参数更新提供了可靠的值。通过数字孪生模型和实际实验评估了ADAPT、基线方法和非同化方法的性能。在不同同化步骤下比较了ADAPT和非同化方法的误差,以测试它们误差控制的稳定性。然后进行了消融研究,以验证相空间对齐的Aquaformers的效率以及比较多时间范围结果的必要性。Aquaformer和ADAPT专门针对水质数据的强非线性和相互依赖性进行了优化,结合了混沌理论和先进的深度学习算法,从而动态提高水质预测的准确性,为智能水管理系统的建立提供了坚实的支持。

研究区域和传感器数据

研究区域是中国银川市境内的滇农河。使用环境流体动力学代码(EFDC)建立了该水体的数字孪生模型,并结合了基于物联网的在线监测系统。EFDC是一种广泛使用的水质模型,用于模拟河流、湖泊和沿海地区的水动力、地球化学过程、藻类动态等(Kim等人,2017年;Liang等人,2020年;Ren和Hartnett,2017年;Ren等人,2016年;Tasnim等人,2024年;Zhang

整体性能比较

图4比较了对照组、EnKF和ADAPT在数字孪生模型和实际实验中的整体性能。在两种实验中,ADAPT在所有点的表现都最好。在数字孪生模型实验中,ADAPT的MAE分别比EnKF和对照组降低了36.26%和56.43%;而在未监测点,相对改进分别达到了54.66%和55.52%。EnKF的同化效果远不如ADAPT。

结论

在数字孪生模型和实际实验中,ADAPT在同化性能上均优于EnKF和非同化方法(对照组),显著降低了预测误差。ADAPT的参数调整具有很高的可转移性,在数字孪生模型中的未监测点保持了一致的性能,而EnKF在没有观测数据的点的性能仅略高于非同化基线。虽然对照组的误差逐渐

CRediT作者贡献声明

贾海峰:撰写——审稿与编辑、监督、资源管理、项目行政、资金获取、正式分析。孙明庄:撰写——初稿、可视化、验证、软件开发、方法论、数据管理、概念化。傅光涛:撰写——审稿与编辑、资源管理。李志立:数据管理、数据整理

软件和数据可用性

软件名称:ADAPT-Dynamic parameter updating for EFDC
开发者:孙明庄和贾海峰
联系方式:jhf@tsinghua.edu.cn
首次可用日期:2025年10月1日
编程语言:Python
应用程序安装、测试和部署的详细文档可在:https://github.com/NestonM/ADAPT/README.md
用于EFDC模型构建的气候和边界数据可在:https://github.com/NestonM/ADAPT/data

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

软件和数据可用性

软件名称:ADAPT-Dynamic parameter updating for EFDC
开发者:孙明庄和贾海峰
联系方式:jhf@tsinghua.edu.cn
首次可用日期:2025年10月1日
所需软件:Docker(所有其他软件都安装在Docker镜像中)
编程语言:Python
应用程序安装、测试和部署的详细文档可在:https://github.com/NestonM/ADAPT/README.md
用于EFDC模型构建的气候和边界数据可在:https://github.com/NestonM/ADAPT/data

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

致谢

本研究得到了国家自然科学基金(编号:52070112、41890823)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号