一种混合深度学习与数据同化方法,用于在边界条件不确定的情况下联合反演地下水污染物来源和水力传导率

《Advances in Water Resources》:A hybrid deep learning-data assimilation approach for joint inversion of groundwater contaminant sources and hydraulic conductivity with uncertain boundary conditions

【字体: 时间:2026年02月28日 来源:Advances in Water Resources 4.2

编辑推荐:

  地下水污染源与边界条件协同反演的深度学习框架研究。通过整合WGAN-GP渗透系数场参数化、CNN-Transformer动态边界建模和ILUES多参数同化算法,提出可同时反演污染源特性、非均质渗透系数场及不确定边界条件的新方法。实验表明该方法有效降低参数不确定性32.7%,较传统高精度模拟计算效率提升6.2倍,解决了固定边界假设导致的结构偏差问题。

  
夏绪民|赵玉乐|蒋思敏|胡瑶|李先文
上海科技大学环境与建筑学院,中国上海200083

摘要

准确识别地下水污染源对于有效的风险评估和修复设计至关重要。然而,传统的反演方法通常将边界条件视为已知,这一假设在现实世界的地质水文条件下往往是无效的,会导致结构偏差以及估计参数的可靠性降低。为了解决这个问题,本研究提出了一个集成深度学习技术的反演框架,用于同时估计污染源特征、非均质水力传导率场和不确定的边界条件。该框架整合了三个关键组成部分:(1)Wasserstein GAN与梯度惩罚(WGAN-GP),用于在高维传导率场的情况下实现低维潜在表示,同时保留地质统计特征;(2)一种新颖的CNN-Transformer替代模型,能够在动态边界条件下捕捉局部空间异质性和长距离时空依赖性,该模型通过边界感知的特征选择机制和局部损失函数得到增强;(3)迭代局部更新集成平滑器(ILUES),用于实现稳健的多参数同化。在具有恒定水头、恒定流量和时变流量边界的合成案例上进行评估,所提出的方法能够准确识别边界类型,描述污染源参数,并精确重建非均质水力传导率场,从而大幅降低整体参数不确定性。此外,与高保真度物理模拟相比,它在计算速度上也有显著提升,同时保持了相当的反演精度。本研究为在边界条件未知的复杂含水层中进行可靠的污染源特征描述提供了一个可行的解决方案,并展示了通过进一步整合数据同化和深度学习方法来增强联合参数估计的潜力。

引言

地下水是全球水资源的重要组成部分,在提供饮用水、支持农业灌溉和维持工业运营方面发挥着关键作用。然而,由于工业排放的加剧、农业径流和城市化的推进,地下水质量的恶化变得越来越严重,对公共健康和生态系统稳定性构成了严重威胁(Qian等人,2020;Liu等人,2024;Li等人,2025)。因此,准确识别污染源对于有效的地下水管理和修复至关重要。这一过程中的一个主要挑战是同时估计污染源特征和地质水文属性。这种全面的反演是必要的,以减少不确定性并建立可靠的污染物传输模型。然而,地下水流和溶质传输机制的固有复杂性,加上地质水文参数的空间变异性、边界条件的不确定性和观测数据的稀疏性,使得高精度反演在计算上非常密集(Kitanidis,1997)。尽管在行业实践和许多应用地下水建模研究中,已经将边界条件视为不确定的,并与含水层属性和污染源项一起联合估计,但仍有相当一部分学术反演研究假设边界条件是固定或完全已知的,以简化问题(Hill & Tiedeman,2007;Liu等人,2009)。因此,仍需要开发先进的反演框架,以便在不确定的、动态的复杂现实世界环境条件下实现计算效率,并可靠地支持多参数识别。
为了应对高保真度数值模拟所带来的巨大计算成本,替代建模技术已被广泛采用以加速反演过程。早期的替代模型主要使用了多项式混沌展开(PCE)、支持向量机(SVMs)和随机森林(RF)等方法,这些方法在处理中等非线性问题时表现良好,但由于无法完全考虑时空相关性,在地下水污染源识别方面存在局限性(Mo等人,2019)。卷积神经网络(CNNs)因其捕捉空间特征的能力而得到广泛应用;然而,它们的局部感受野限制了它们捕捉大尺度空间依赖性的能力(Xu & Albert,2015)。为了提高性能,近年来开发了结合时间序列建模组件(例如LSTM)的混合CNN模型,这些模型在地质水文的时空预测任务中表现出更好的适用性(Zhao等人,2025)。然而,大多数传统替代模型在捕捉长距离时空依赖性和全局相互作用方面仍然有限,这推动了将基于自注意力的架构(如Transformer)集成到替代建模中。这些架构可以明确地模拟全局依赖关系,并显示出显著提高反演框架精度的巨大潜力(Sun等人,2024;Pang等人,2024)。然而,上述替代模型在反演过程中的发展和应用通常依赖于一个关键的简化假设:边界条件遵循预定义的时间模式或被视为固定的,只有它们的大小或参数受到不确定性影响(Irsa & Zhang,2012)。这导致了一个根本性的限制:虽然行业实践经常将边界条件视为完全不确定的变量,但大多数基于替代模型的学术反演研究只将污染源强度、位置或释放历史作为待估计的参数,假设边界是固定的或边界动态具有预定义的功能形式(Atmadja & Bagtzoglou,2001;Neupauer & Wilson,2005;Sun,2015;Pang等人,2024a;Wang等人,2024a),从而忽略了严重影响模拟结果的边界不确定性的全部范围。在实际应用中,地下水系统边界受到季节变化、动态河流-含水层相互作用和人为活动(例如抽水和补给)的显著影响(Hassanizadeh & Gray,1989;McLaughlin & Wood,1988)。强加的固定边界条件可能会在模型中引入不可避免的结构误差。因此,即使使用先进的替代模型,由于边界规格错误,反演得到的源参数也可能表现出显著的偏差,从而严重削弱了基于反演的结论的可靠性(Jiao & Zhang,2014;Xu & Albert,2015)。
因此,当前研究的核心挑战在于超越将边界条件中的边界类型视为已知前提的做法,而是将其视为需要与污染源特征一起联合反演的关键参数。这一转变需要开发新一代替代模型,以支持能够同时估计污染源参数、水力传导率和边界条件参数(类型和边界值)的反演框架。尽管最近的研究尝试在联合反演方案中将边界条件作为未知量进行整合(Wang等人,2024a;Xu等人,2024),但它们通常假设预定义的功能形式(例如,恒定的、线性的或单峰模式),这可能无法充分反映现实世界的复杂性。在实践中,边界条件的真实时间变化通常是未知的,这对可靠的反演构成了根本性的挑战。为了克服这一限制,替代模型需要进一步改进,以超越固定边界输入-输出映射,而是捕捉污染源和边界条件变化的耦合非线性响应。最终目标是将全局敏感的替代模型(例如Transformer)与稳健的反演算法集成到一个统一的框架中,从而共同量化来自源和边界的不确定性,从而提高复杂现实世界环境中污染源识别的可靠性。
本研究提出了一个混合深度学习-数据同化框架,能够同时、可靠且计算效率高地反演地下水污染建模中的三个关键未知量:污染源特征、非均质水力传导率场和不确定的时变边界条件。由高保真度数值模拟器驱动的直接联合反演通常在计算上具有挑战性,需要大量的正向模拟;此外,当真实的边界行为是不确定的或时变的时,将边界条件中的边界类型视为固定的或完全已知的可能会引入结构偏差。该框架整合了三个专门设计的组件,以克服传统方法的关键限制:
首先,WGAN-GP生成器提供了高维传导率场的地质统计一致的低维参数化,有效缓解了维度灾难,同时保持了真实的空间结构。其次,CNN-Transformer替代模型旨在捕捉局部空间异质性和长距离时空依赖性,即使在动态变化的边界条件下也能以前所未有的计算效率提供高精度的正向模拟。第三,迭代局部更新集成平滑器(ILUES)作为一个稳健的推理引擎,通过与稀疏观测数据的一致性,同时更新源参数、传导率实现和边界参数。通过将这些组件结合成一个连贯的端到端系统,所提出的框架减少了由边界错误规格引起的结构偏差,在观测数据有限的条件下显著提高了反演的可靠性,并为具有边界不确定性的复杂现实世界含水层中的污染源识别和风险管理提供了一种实用的、计算效率高的方法。
本文的其余部分组织如下。第2节介绍了系统模型和提出的联合识别污染源、边界参数和水力传导率场的方法。第3节展示了所提方法获得的结果及其相应的讨论。最后,第5节提供了整个研究的总结。

章节片段

地下水数值模拟模型

在本研究中,考虑了稳态和瞬态地下水流动条件下的污染物传输。瞬态流动考虑了多个应力周期内的时变边界流量。假设对流和扩散是主要的传输机制,而反应过程在当前分析中被忽略。
瞬态地下水流动的控制方程表示如下(Arlen等人,2000):
Ss?h?t=?(K?h)+qs
在本研究中,水力

问题描述

本节概述了在不同边界条件规格下评估所提出的反演框架的案例设置。如图4所示,基础模型域代表一个封闭的含水层,尺寸为32米(x方向)×20米(y方向),划分为0.5米×0.5米的均匀正方形网格单元,厚度为1米。该含水层的孔隙率为0.30,纵向扩散率为2.0米,横向扩散率为0.6米。非均质水力

WGAN-GP参数化的性能

在本研究中,WGAN-GP框架被用来快速随机实现二维水力传导率场。生成器将一个200维的高斯潜在向量z~N(0,1)转换为40×64个水力传导率场实现,通过一个由三个转置卷积层组成的深度卷积解码器架构(每个层后跟Leaky ReLU激活函数,斜率为0.2)。鉴别器由三个卷积层组成

结论

本研究构建了一个联合反演框架,结合了WGAN-GP参数化、CNN-Transformer替代模型和ILUES数据同化算法,以同时识别地下水污染源特征、非均质水力传导率场和不确定的边界条件。系统的数值实验和比较分析得出了以下主要结论:
  • (1)
    WGAN-GP有效地参数化了2560维的水力传导率
  • 未引用的参考文献

    Arjovsky等人,2017;Luo等人,2023;Sun,2016;Triadis和Broadbridge,2010;Wang等人,2024b;Bai和Tahmasebi,2022

    CRediT作者贡献声明

    夏绪民:写作——审阅与编辑、监督、资源、方法论、调查、概念化。赵玉乐:写作——原始草稿、可视化、验证、软件、方法论、数据管理。蒋思敏:写作——审阅与编辑、监督、资金获取、概念化。胡瑶:可视化、资源。李先文:监督、调查。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号