地下水是水资源的重要组成部分,对人类生存和发展至关重要,在生态系统中扮演着不可替代的角色。然而,城市扩张以及工业和农业的发展导致了地下水的退化,点源污染是这种污染的重要原因之一,潜在的地下水污染源如图1所示。因此,识别点源污染物的位置和浓度可以为解决地下水污染问题提供关键信息 [Snodgrass和Kitanidis, 1997; Xu等人, 2018; Pan等人, 2021]。
在地下水污染的背景下,点源污染物主要包括工业废水和城市生活污水的固定排放点,以及来自未知位置的泄漏污染,这是现代常见的污染方式。在处理污染事件时,准确识别污染源至关重要。最初,污染源的识别通常依赖于插值观测数据和求解偏微分方程 [Neuman, 1973, Stallman, 1956]。尽管插值方法不断改进,提高了准确性,但它们对结果的影响仍然很大,需要进一步的发展 [Rasheed和Shaban, 2022]。随着计算机技术的进步,已经开发出了反演方法 [Luo等人, 2023]。这些方法主要基于模型知识,旨在从可测量的参数值推断目标状态参数 [Han等人, 2020, Moghaddam等人, 2021]。它们可以大致分为优化方法和随机方法 [Chadalavada等人, 2011]。
在早期研究中,常用的经典优化方法包括梯度法、Hessian矩阵法、拉格朗日乘数法、单纯形法和梯度下降法 [Ak?elik等人, 2003, Li等人, 2008, Sciortino等人, 2000, Pujol, 2007, Sayeed和Mahinthakumar等人, 2005]。然而,随着研究问题的复杂性增加,研究人员现在广泛使用智能优化算法,如模拟退火算法、粒子群优化算法等 [Han等人, 2020, Jha等人, 2013, Guneshwor等人, 2018]。
然而,智能优化算法容易陷入局部最优解。此外,由于这些方法得到的结果是确定性的,某些问题中的解决方案质量可能会因执行而异,导致结果的不确定性和不稳定性。因此,研究人员更倾向于使用随机方法,其中集合卡尔曼滤波器(EnKF)[Evensen, 2003]和马尔可夫链蒙特卡洛(MCMC)[Hastings, 1970]尤为突出且应用广泛。与优化方法相比,EnKF方法具有更高的计算效率。EnKF方法利用一组状态估计(集合)来更新模型,有效处理了动态系统中的不确定性 [Wang等人, 2019]。随着对EnKF方法研究的深入,已经提出了多种提高其性能的方法。例如,Emerick和Reynolds(2013)引入了结合多重数据同化的集合平滑器(ES-MDA)。与EnKF不同,ES-MDA同时同化所有时间步的观测数据,从而提高了参数识别的效率 [Emerick和Reynolds, 2013, Chen等人, 2023b]。近年来,ES-MDA方法因其有效性而受到广泛关注,特别是在解决源识别问题方面。例如,Todaro等人(2021)成功应用ES-MDA识别了污染源参数,如释放历史和位置。Chen等人(2023a)扩展了ES-MDA的应用,评估了其在不同条件下的污染源释放历史识别准确性。此外,Xu等人(2022)利用ES-MDA解决了与非点源污染物相关的参数识别挑战。
尽管ES-MDA方法提高了污染源识别的速度,但在计算过程中需要反复调用污染传输模型,这非常耗时。因此,使用替代模型作为污染传输模型的替代方案可以显著提高污染源识别的效率 [Zhang等人, 2016]。替代模型也称为简化模型或低保真度模型,通过替换高保真度模型来减少计算时间 [Willcox等人, 2002, Zhang等人, 2024]。
替代模型可以分为数据驱动的替代模型、简化模型和基于投影的替代模型 [Robinson等人, 2008]。其中最常用的方法是数据驱动方法,因为它易于实现且适用范围广 [Zhang等人, 2017]。在数据驱动的替代建模领域,多项式混沌展开(PCE)[Kim等人, 2022]、高斯过程 [Park等人, 2018]和支持向量机 [Chen等人, 2012]是突出的技术。自问世以来,PCE因其出色的收敛性和可解释性而在各个领域表现出色 [Rajabi, 2019]。然而,一个关键挑战是从稀疏数据中确定参数概率分布,这通常需要在传统PCE替代模型中对这些分布进行假设 [Zhang等人, 2024]。为了解决这个问题,Foo和Karniadakis(2010)通过协方差分析改进了PCE替代建模,而Oladyshkin和Nowak(2012)引入了任意多项式混沌展开(aPC),有效解决了假设参数分布的问题,aPC替代模型的应用已扩展到其他领域,Beckers等人(2020)使用贝叶斯框架和任意多项式混沌展开(BaPC)校准了河流模型参数。
此外,Zhang等人(2024)首次成功使用BaPC识别污染源。然而,他们指出获得可靠结果需要相对较大的样本量,这仍然是一个限制,因为这涉及到时间消耗。为了克服这一挑战,我们提出了一种新的混合反演方法ESMDA-BaPC,它结合了ES-MDA在减少所需样本量方面的优势以及BaPC作为替代模型在最小化污染传输模拟计算成本方面的效率。通过将其应用于合成含水层并将其结果与ES-MDA方法的结果进行比较,评估了该方法在识别污染源方面的性能。
本文的后续部分结构如下:第2节和方法论,第3节和应用分别描述了方法和应用。第4节详细介绍了结果。第5节提供了全面的讨论和发现总结。