《Computers & Geosciences》:Uncertainty quantification using Hamiltonian Monte Carlo for structural geological modelling with implicit neural representations (INR)
编辑推荐:
为了解决基于人工智能的地质建模方法在预测不确定性表征上的关键空白,研究人员将高效的隐式神经表征(INR)地质建模框架GeoINR与基于贝叶斯神经网络(BNN)的哈密顿蒙特卡洛(HMC)采样器相结合。该方法探索了网络参数和观测数据不确定性所导致的完整地质模型实现空间,定量评估了预测地质界面的不确定性。实验在北海无噪声钻孔和加拿大萨斯喀彻温省有噪声测井数据集上均取得良好效果,且在评估无噪声数据认知不确定性方面,相比常用的蒙特卡洛Dropout方法表现出更优的准确性,为地质建模中的AI不确定性量化提供了更准确的新工具。
地质学家和工程师们一直在努力“透视”地球的内部,构建精确的三维地质模型。这不仅是寻找矿产资源、开发油气田和进行地下水管理的基石,也是支撑碳封存选址等可持续发展议题的关键。传统的三维地质建模方法主要分为显式建模和隐式建模两大类。显式方法对每个地质界面进行独立构建,几何清晰度好,但需要大量人工干预,效率和适应性受限。隐式方法,尤其是其中的无网格方法,则通过一个标量场来同时表示多个共形界面,自动化程度高,尤其擅长处理不完整和分散的数据。然而,当需要整合海量地质数据和先验知识时,隐式方法背后的数学模型会在可扩展性上面临挑战,因为它需要用一个高一维度的标量场(对于三维地质建模而言,即一个三维标量场)来插值表示二维的地质界面。
近年来,神经网络技术的发展带来了转机。它被证明是克服隐式地质结构建模可扩展性限制的有效插值器。以GeoINR(Geological Implicit Neural Representations)为代表的方法,借鉴计算机视觉领域神经辐射场(NeRF)技术,利用神经网络直接学习从空间坐标到标量场的映射,能够灵活集成先验知识,显著提升了建模效率和分辨率独立性。然而,一个问题依然悬而未决:当我们用这些神经网络模型进行地质预测时,我们究竟有多大的把握?
这正是本研究要解决的核心问题。神经网络训练过程涉及高度非凸的损失函数优化,网络参数的随机初始化会导致不同训练次数的预测结果出现差异。此外,观测数据本身也可能存在噪声和不完整性。这些都引入了不确定性。以往的研究通常设置固定随机种子以获得可复现的单一确定性结果,但这仅是巨大解空间中的一个可能实现。量化神经网络地质建模中的不确定性,特别是区分由数据噪声(偶然不确定性)和模型本身认知不足(认知不确定性)带来的影响,仍是一个开放的挑战。
为了解决这一关键空白,来自德国亚琛工业大学(RWTH Aachen University)计算地球科学、地热学与储层地球物理研究所(CG3)的Kaifeng Gao, Michael Hillier 和 Florian Wellmann开展了一项创新性研究。他们提出将哈密顿蒙特卡洛(Hamiltonian Monte Carlo, HMC)采样器与GeoINR地质建模框架相结合,构建一个贝叶斯神经网络(Bayesian Neural Network, BNN)模型,以量化隐式神经表征中预测地质界面的不确定性。该研究成果发表在《Computers & Geosciences》期刊上。
主要关键技术方法
研究人员将GeoINR的神经网络架构作为BNN的基础,其中网络参数被视为服从分布的随机变量,而非固定值。他们采用了汉明(Kaiming)正态分布作为参数的先验分布。不确定性量化的核心是使用No-U-Turn Sampler(NUTS)——一种自适应HMC采样算法——来高效地从网络参数的后验分布中进行采样。通过对观测数据(即已知地质界面的空间坐标和对应的预设标量值)进行学习,HMC利用目标后验分布的梯度信息在函数空间中进行高效探索,生成一系列网络参数样本。利用这些参数样本,可以生成对应的预测标量场,进而提取地质界面。通过计算大量采样模型结果的统计量(如均值、方差)和信息熵,来量化并可视化地质界面的不确定性。研究使用了两个真实数据集进行验证:一是来自荷兰TNO地质调查局公开数据库(DINOloket)的北海无噪声钻孔数据集(共13个钻孔,5个地质单元,63个界面点);二是来自加拿大萨斯喀彻温省的有噪声地球物理测井解释数据集。
研究结果
1. 无噪声数据集中的不确定性
在北海钻孔数据集的案例中,研究者主要关注由模型认知不足引起的认知不确定性(即“Type 2”不确定性)。经过400步预热和1500次采样后,HMC采样器接受率达到87%,表明采样高效。通过计算1500个采样标量场的信息熵(Entropy),研究者可视化并量化了地质界面预测的不确定性(见图3d, e)。结果表明,在观测数据(钻孔)附近,不确定性最低;随着远离数据点,不确定性逐渐增加。这与地质建模中“数据约束越强,不确定性越低”的直观认知相符。为了定量评估不确定性估计的准确性,研究者绘制了准确度图(Accuracy Plot),并将HMC-BNN方法与常用的蒙特卡洛Dropout(Monte Carlo Dropout)方法进行了比较。在该无噪声数据集中,HMC-BNN方法的不确定性精度为0.7,精确度为0.99,其校准曲线更接近理想的45度对角线,说明其不确定性量化比蒙特卡洛Dropout方法更为准确和可靠(见图4)。蒙特卡洛Dropout方法在较高置信水平下倾向于低估不确定性。
2. 含噪声数据集中的不确定性
第二个案例使用来自萨斯喀彻温省的地球物理测井解释数据,数据本身包含解释噪声,因此同时包含了认知不确定性和偶然不确定性(即“Type 1”不确定性)。HMC-BNN方法同样能够处理这种混合不确定性,并产生合理的不确定性空间分布。结果显示,整体不确定性水平比无噪声案例更高,这反映了数据噪声带来的额外影响。该案例再次验证了HMC-BNN方法在量化实际观测数据不确定性方面的有效性。
3. 包含正断层的简单场景应用
为了进一步测试方法的普适性,研究者还将其应用于一个包含平坦地层中一个正断层的简单构造场景。通过将断层面作为建模约束纳入损失函数,HMC-BNN方法成功地对该断层场景下的地质界面不确定性进行了量化,证明了该方法能够扩展至包含断裂等复杂地质构造的情形。
结论与讨论
本研究成功地将哈密顿蒙特卡洛(HMC)采样器集成到基于隐式神经表征(INR)的GeoINR地质建模框架中,建立了一种新的贝叶斯神经网络(BNN)方法,用于量化地质界面预测中的不确定性。研究在两个真实数据集(无噪声钻孔和有噪声测井数据)以及一个包含断层的简单构造场景中验证了方法的有效性。结果表明,HMC采样器能够高效地探索网络参数在函数空间中的后验分布,并生成准确且可解释的不确定性估计。
与当前广泛使用的近似贝叶斯推断方法(如蒙特卡洛Dropout)相比,HMC-BNN方法在无噪声数据集上对认知不确定性的评估更为准确。这是因为HMC是一种精确的马尔可夫链蒙特卡洛(MCMC)方法,能更准确地从后验分布中采样,避免了近似方法可能低估不确定性的问题。这对于依赖高置信度地质模型进行关键决策(如资源评估、工程选址)的领域具有重要意义。
同时,研究也指出了该方法的潜在挑战,即在大数据集和复杂网络情况下的计算效率问题。尽管现代GPU硬件和PyTorch等框架使得全批量HMC计算成为可能,但对于更大规模的问题,仍需在计算效率和推断精度之间寻求平衡。未来工作可以探索更高效的近似方法或随机梯度哈密顿蒙特卡洛(SGHMC)等变体,以提升可扩展性。
总之,这项工作为地质建模领域引入了一种新颖且强大的AI不确定性量化工具。它将严谨的贝叶斯推断与前沿的隐式神经表征相结合,不仅能够生成“最佳估计”地质模型,还能提供关于模型预测可靠性的量化指标。这标志着地质建模从追求单一确定性解向拥抱概率化、可解释性AI决策支持系统迈出了坚实的一步,对于推动地球科学领域的智能化、精细化发展具有重要的理论和应用价值。