ES MDA-BaPC:一种高效的贝叶斯替代方法,用于污染物来源识别

《Journal of Hydrology》:ES MDA-BaPC: an efficient bayesian surrogate approach for contaminant source identification

【字体: 时间:2026年03月17日 来源:Journal of Hydrology 6.3

编辑推荐:

  提出一种结合ES-MDA与贝叶斯多项式混沌展开(BaPC)的高效污染源识别方法,通过代理模型减少计算量约80%,同时保持高精度(R2≥0.9962,RMSE≤0.0021),并在合成含水层模型中验证有效。

  
张国栋|徐腾|张文军|杨杰|叶宇|卢春辉
中国南京河海大学水利水电工程学院

摘要

识别污染源是一个复杂的挑战,需要在计算效率和准确性之间取得谨慎的平衡。尽管结合多重数据同化的集合平滑器(ES-MDA)方法被公认为估计污染源信息的有效手段,但其计算成本仍然是一个限制因素。为了解决这个问题,我们提出了ESMDA-BaPC,这是一种将ES-MDA与贝叶斯框架结合的方法,并使用任意多项式混沌展开(BaPC)来高效识别污染源参数,包括释放位置和质量负荷率。在这种方法中,BaPC首先作为ES-MDA数据同化过程中的替代模型。然后,ESMDA-BaPC迭代地改进替代模型和污染源参数,以获得更精确的结果。我们的结果表明,ESMDA-BaPC的性能优于传统的ES-MDA,在大幅减少计算时间的同时保持了相当的准确性,运行时间减少了约80%。此外,替代模型能够准确预测污染羽流,预测浓度与实际监测数据非常吻合,R2值高达0.9962,RMSE低至0.0021。

引言

地下水是水资源的重要组成部分,对人类生存和发展至关重要,在生态系统中扮演着不可替代的角色。然而,城市扩张以及工业和农业的发展导致了地下水的退化,点源污染是这种污染的重要原因之一,潜在的地下水污染源如图1所示。因此,识别点源污染物的位置和浓度可以为解决地下水污染问题提供关键信息 [Snodgrass和Kitanidis, 1997; Xu等人, 2018; Pan等人, 2021]。
在地下水污染的背景下,点源污染物主要包括工业废水和城市生活污水的固定排放点,以及来自未知位置的泄漏污染,这是现代常见的污染方式。在处理污染事件时,准确识别污染源至关重要。最初,污染源的识别通常依赖于插值观测数据和求解偏微分方程 [Neuman, 1973, Stallman, 1956]。尽管插值方法不断改进,提高了准确性,但它们对结果的影响仍然很大,需要进一步的发展 [Rasheed和Shaban, 2022]。随着计算机技术的进步,已经开发出了反演方法 [Luo等人, 2023]。这些方法主要基于模型知识,旨在从可测量的参数值推断目标状态参数 [Han等人, 2020, Moghaddam等人, 2021]。它们可以大致分为优化方法和随机方法 [Chadalavada等人, 2011]。
在早期研究中,常用的经典优化方法包括梯度法、Hessian矩阵法、拉格朗日乘数法、单纯形法和梯度下降法 [Ak?elik等人, 2003, Li等人, 2008, Sciortino等人, 2000, Pujol, 2007, Sayeed和Mahinthakumar等人, 2005]。然而,随着研究问题的复杂性增加,研究人员现在广泛使用智能优化算法,如模拟退火算法、粒子群优化算法等 [Han等人, 2020, Jha等人, 2013, Guneshwor等人, 2018]。
然而,智能优化算法容易陷入局部最优解。此外,由于这些方法得到的结果是确定性的,某些问题中的解决方案质量可能会因执行而异,导致结果的不确定性和不稳定性。因此,研究人员更倾向于使用随机方法,其中集合卡尔曼滤波器(EnKF)[Evensen, 2003]和马尔可夫链蒙特卡洛(MCMC)[Hastings, 1970]尤为突出且应用广泛。与优化方法相比,EnKF方法具有更高的计算效率。EnKF方法利用一组状态估计(集合)来更新模型,有效处理了动态系统中的不确定性 [Wang等人, 2019]。随着对EnKF方法研究的深入,已经提出了多种提高其性能的方法。例如,Emerick和Reynolds(2013)引入了结合多重数据同化的集合平滑器(ES-MDA)。与EnKF不同,ES-MDA同时同化所有时间步的观测数据,从而提高了参数识别的效率 [Emerick和Reynolds, 2013, Chen等人, 2023b]。近年来,ES-MDA方法因其有效性而受到广泛关注,特别是在解决源识别问题方面。例如,Todaro等人(2021)成功应用ES-MDA识别了污染源参数,如释放历史和位置。Chen等人(2023a)扩展了ES-MDA的应用,评估了其在不同条件下的污染源释放历史识别准确性。此外,Xu等人(2022)利用ES-MDA解决了与非点源污染物相关的参数识别挑战。
尽管ES-MDA方法提高了污染源识别的速度,但在计算过程中需要反复调用污染传输模型,这非常耗时。因此,使用替代模型作为污染传输模型的替代方案可以显著提高污染源识别的效率 [Zhang等人, 2016]。替代模型也称为简化模型或低保真度模型,通过替换高保真度模型来减少计算时间 [Willcox等人, 2002, Zhang等人, 2024]。
替代模型可以分为数据驱动的替代模型、简化模型和基于投影的替代模型 [Robinson等人, 2008]。其中最常用的方法是数据驱动方法,因为它易于实现且适用范围广 [Zhang等人, 2017]。在数据驱动的替代建模领域,多项式混沌展开(PCE)[Kim等人, 2022]、高斯过程 [Park等人, 2018]和支持向量机 [Chen等人, 2012]是突出的技术。自问世以来,PCE因其出色的收敛性和可解释性而在各个领域表现出色 [Rajabi, 2019]。然而,一个关键挑战是从稀疏数据中确定参数概率分布,这通常需要在传统PCE替代模型中对这些分布进行假设 [Zhang等人, 2024]。为了解决这个问题,Foo和Karniadakis(2010)通过协方差分析改进了PCE替代建模,而Oladyshkin和Nowak(2012)引入了任意多项式混沌展开(aPC),有效解决了假设参数分布的问题,aPC替代模型的应用已扩展到其他领域,Beckers等人(2020)使用贝叶斯框架和任意多项式混沌展开(BaPC)校准了河流模型参数。
此外,Zhang等人(2024)首次成功使用BaPC识别污染源。然而,他们指出获得可靠结果需要相对较大的样本量,这仍然是一个限制,因为这涉及到时间消耗。为了克服这一挑战,我们提出了一种新的混合反演方法ESMDA-BaPC,它结合了ES-MDA在减少所需样本量方面的优势以及BaPC作为替代模型在最小化污染传输模拟计算成本方面的效率。通过将其应用于合成含水层并将其结果与ES-MDA方法的结果进行比较,评估了该方法在识别污染源方面的性能。
本文的后续部分结构如下:第2节和方法论,第3节和应用分别描述了方法和应用。第4节详细介绍了结果。第5节提供了全面的讨论和发现总结。

部分摘录

ES-MDA

ES-MDA由Emerick和Reynolds(2013)提出,是一种有效的数据同化方法,它将观测数据与模型模拟相结合,以提高各种科学领域的预测准确性,包括天气预报、气候建模和水文学 [Aalstad等人, 2018, Chen等人, 2020; Silva等人, 2000]。ES-MDA源自集合平滑器(ES)框架。虽然ES通过同化所有可用观测数据进行单一全局参数更新

应用

本研究使用合成封闭含水层模型评估了ESMDA-BaPC在污染源识别方面的能力。所设想的含水层域是一个尺寸为8000 [L] × 8000 [L] × 80 [L]的矩形棱柱。为了数值模拟,该域被离散为80 × 80 × 1个单元的均匀网格,每个单元的尺寸为100 [L] × 100 [L] × 80 [L]。含水层的对数传导率场是使用GCOSIM3D地质统计软件生成的 [Gómez-Hernández等人, 1993]

结果

在构建BaPC替代模型时,使用配置点更新模型是至关重要的。因此,配置点的选择显著影响替代模型的准确性和可靠性。图5显示了由aPC生成的原始配置点以及ESMDA-BaPC在场景S1中迭代细化过程中生成的新配置点的位置。可以观察到,随着迭代的进行,新的

讨论

基于前几节的结果,本节系统地检验了所提出的方法与现有文献的关系,明确指出了其局限性,并概述了未来研究的有希望的方向。

结论

本研究的主要目的是评估ESMDA-BaPC在识别污染源信息方面的能力。此外,我们进一步评估了其与传统ES-MDA在污染源识别方面的准确性和效率。结果表明:(1)ESMDA-BaPC提供了准确的配置点,确保替代模型的输出值接近真实值;(2)ESMDA-BaPC准确识别了源信息,包括

未引用的参考文献

Silva等人, 2020, Xu和Gómez-Hernández, 2018, Zhang等人, 2019, Zhang等人, 2020。

CRediT作者贡献声明

张国栋:撰写——原始草稿,方法论。徐腾:撰写——审阅与编辑,撰写——原始草稿,监督,项目管理,方法论,资金获取,概念化。张文军:撰写——审阅与编辑,方法论。杨杰:撰写——审阅与编辑。叶宇:撰写——审阅与编辑。卢春辉:撰写——审阅与编辑。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

本研究的资金支持来自国家自然科学基金(资助编号:42377046)。卢C感谢国家自然科学基金(资助编号:51879088)和江苏省自然科学基金(资助编号:BK 20190023)。叶Y感谢国家自然科学基金(资助编号:42477061)。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号