《Computers & Geosciences》:GAN-MT1DInv: A Physics-Informed Generative Adversarial Network for Magnetotelluric Inversion
编辑推荐:
磁层电阻率反演中提出基于生成对抗网络的物理信息约束方法,通过嵌入前向求解器实现对抗训练,有效解决非线性、非唯一性问题,并验证其在多场景下的优越性。
顾团福|邓聚志|陈辉|余辉|王献祥|黄先阳|袁从伟
中国东华理工大学铀资源勘查开采与核遥感国家重点实验室,南昌,330013
摘要
磁大地电(MT)反演本质上是非线性的、非唯一的,并且属于病态问题,这通常导致精度有限、收敛速度慢以及对初始模型的依赖性强。尽管深度学习(DL)提高了反演性能,但其对训练数据集的依赖性以及缺乏物理约束限制了其在复杂地质场景中的应用。为了解决这些问题,我们提出了GAN-MT1DInv,这是一种基于物理信息的生成对抗网络,用于一维MT反演。该方法将正向求解器嵌入到生成器中,并采用WGAN-GP架构进行对抗训练,使得生成的响应能够紧密逼近MT场数据。从电磁传播定律中衍生出的物理信息正则化项进一步增强了反演的可靠性。数值实验表明,GAN-MT1DInv在多种场景下表现稳健,包括不同的初始模型、多级噪声污染、不规则的频率采样、缺失的频率带以及复杂的电阻率结构。它始终优于最小二乘法(LSM)、全连接神经网络(FCNN)和U-Net方法。值得注意的是,即使测试模型与训练数据集有显著差异,GAN-MT1DInv也能重建地下电结构,这突显了其强大的泛化能力。将GAN-MT1DInv应用于内蒙古塔木苏盆地的实地数据,得到的电阻率模型与已知的地质层序一致,并有效描绘了盆地的几何形状。这些结果表明,GAN-MT1DInv提供了一种准确、通用且基于物理信息的MT反演方法,显著减少了对大规模训练数据集的依赖性,为地下成像提供了一个实用工具。
引言
磁大地电(MT)探测是一种利用自然产生的电磁场的频域电磁方法。由于其成本效益高、操作简单、穿透深度深以及对地表地形相对不敏感,MT已广泛应用于地壳成像、矿产勘探和深层电结构研究(Deng等人,2020年;Yu等人,2023年)。从MT数据中获得高分辨率的地下电阻率图像在很大程度上依赖于强大且高效的MT反演算法。然而,由于地球物理反问题的固有非线性和病态性质,这一任务仍然具有很大挑战性。
传统MT反演的基本优势在于它遵循经典的迭代工作流程,通过反复的正向建模、数据不匹配计算以及基于误差反馈的电阻率模型更新来严格保持物理一致性。所有传统方法,无论其具体的优化策略如何,都遵循这一范式。基于梯度的方法,如非线性共轭梯度法(Kelbert等人,2014年)、拟牛顿法(Avdeev和Avdeeva,2006年;2012年)和Occam反演法(Siripunvaraporn和Egbert,2000年;2005年),都依赖于线性化技术。然而,由于MT反问题的固有非线性,这些解决方案往往不是唯一的,容易不稳定,并且对初始模型非常敏感。为了更好地探索解空间并缓解局部最小值问题,引入了全局和概率优化方法,包括模拟退火(Wang等人,2012年)、遗传算法(Wang等人,2018年)、粒子群优化(Pace等人,2019年)和贝叶斯反演(Seillé和Visser,2020年)。然而,它们的高计算成本和慢收敛速度严重限制了它们在大规模MT调查中的实际应用。
近年来,深度学习(DL)作为一种强大的替代方法出现,能够高效地模拟观测数据与地下模型参数之间的复杂非线性映射(Yu和Ma,2021年)。在MT反演领域,各种数据驱动的DL架构,如卷积神经网络(CNNs)、ResNets和U-Net已被广泛应用于一维反演(Puzyrev,2019年;Liu等人,2021年;Liao等人,2022年;Ling等人,2023年;Jevinani等人,2024年)以及更高维度(2D/3D)的MT反问题(Pan等人,2024年;Yu等人,2025a;Yu等人,2025b;Li等人,2025年)。这些研究的主要目的是提高计算速度和模型分辨率。
为了加强观测数据与电阻率模型之间的物理一致性,学者们开始将MT的控制物理方程整合到DL损失函数中,从而提高反演结果的物理合理性。MT反演中的物理驱动DL研究通常遵循两个主要方向:首先,涉及显式嵌入物理关系的方法,通过构建可微的正向算子来实现MT反演(Alyousuf和Li,2022年;Liu等人,2022年;Goyes-Pe?afiel等人,2025年);其次,利用高级DL架构在模型训练期间结合基于物理的损失项的方法(Liu等人,2023年;Liu等人,2024年;Jiang等人,2024年;Ling等人,2024年)。
尽管DL在MT反演方面取得了显著进展,但数据驱动和物理驱动的DL方法都存在显著的限制。数据驱动方法严重依赖于大型、多样化的训练数据集,当训练数据集稀缺或不具代表性时,它们的泛化性能会显著下降。此外,固定输入和输出维度的刚性要求在数据维度发生变化时需要重新进行计算密集型的训练。相反,虽然物理驱动的DL方法确保了物理一致性,但将物理约束残差损失(PDE)和边界条件损失整合到组合目标函数中通常会导致复杂的复合损失函数。这种复杂性使得调整每个损失组分的权重参数变得复杂,并增加了优化过程中梯度消失或爆炸的风险。
为了解决这些关键挑战,我们提出了一种新的深度学习框架(GAN-MT1DInv),它将DL的生成能力战略性地整合到物理一致的传统MT迭代反演策略中。GAN-MT1DInv并没有完全取代传统的反演逻辑,而是将生成对抗网络(GAN)嵌入到迭代过程的核心电阻率模型更新步骤中。与传统DL反演框架相比,GAN-MT1DInv具有几个明显的优势:(1)它显著减少了数据准备和训练的计算负担,从而最小化了了对大规模训练数据集的依赖;(2)该架构具有高度的可扩展性,可以灵活适应不同维度的实地数据而无需重新训练;(3)它有效解决了传统物理驱动方法中普遍存在的复杂复合损失函数和梯度不稳定问题,同时利用GAN的生成能力高效地量化了MT反演的固有非唯一性,从而提高了反演模型的可靠性。
这些贡献确立了GAN-MT1DInv作为一种新颖且稳健的DL驱动MT反演策略,结合了基于物理的信息约束和对抗优化。本文的其余部分组织如下:第2节介绍了1D MT正向问题的基础和提出的反演方法。第3节通过数值实验评估了GAN-MT1DInv的性能。第4节展示了其在实地MT数据中的应用。最后,第5节讨论了研究结果并得出了结论。
部分摘录
MT正向算子
MT响应主要由视电阻率(ρa)和相位(φ)表征,它是根据给定地下电阻率模型的麦克斯韦微分方程在频域中推导出来的(Liao等人,2022年)。对于水平分层的1D介质,递归表面阻抗方法(Grandis,1999年)提供了一个高效且数值稳定的解决方案,表示为:其中Zm是第m层的波阻抗,Z0m是第m层的特征阻抗。
数值实验
本节使用理论电阻率模型对提出的GAN-MT1DInv框架进行了系统评估。在包括不同初始模型、噪声水平、采样频率、观测周期和数据缺失条件等多种场景下,全面评估了该模型的性能。在对抗训练过程中,监测了两个定量指标来评估收敛情况:RMSEData,表示视电阻率(ρa)与
实地数据
为了验证GAN-MT1DInv的实际适用性,我们将该框架应用于从内蒙古塔木苏盆地获得的实地数据。建立了一个长度为20公里的N164°E走向的剖面,包含21个相隔1公里的站点(图9)。数据采集使用了配备MTC-80磁力计的Phoenix V5-2000系统,记录了两个水平电场分量(Ex,Ey)和两个水平磁场分量(Hx,Hy)。
结论与讨论
在这项研究中,我们提出了GAN-MT1DInv,这是一种新颖的基于物理信息的生成对抗网络框架,用于一维MT反演。通过将可微的基于物理的正向算子嵌入生成器并将其与对抗训练相结合,所提出的方法有效地弥合了数据驱动DL和基于物理的建模之间的差距。我们使用理论电阻率模型和塔木苏盆地的实地数据系统评估了该框架。结果表明
CRediT作者贡献声明
顾团福:撰写——原始草稿、软件、方法论。邓聚志:撰写——审稿与编辑、监督、资金获取。陈辉:撰写——审稿与编辑、资金获取、概念化。余辉:撰写——审稿与编辑、资金获取。王献祥:撰写——审稿与编辑、数据整理。黄先阳:撰写——审稿与编辑。袁从伟:项目管理
未引用参考文献
Avdeeva和Avdeev,2006年;Avdeeva等人,2012年;Siripunvaraporn等人,2005年。
代码可用性
代码名称:GAN-MT1DInv(代码和数据)
硬件要求:Win11,NVIDIA GeForce RTX 4070 SUPER GPU。
程序语言:Python,Matlab。
所需软件:Python,Matlab。
程序大小:1GB压缩文件
利益冲突声明
? 作者声明以下可能被视为潜在利益冲突的财务利益/个人关系:邓聚志报告称获得了中国国家自然科学基金会的财务支持。陈辉报告称获得了中国国家自然科学基金会的财务支持。余辉报告称获得了中国国家自然科学基金会的财务支持。如果有其他作者,他们声明没有已知的
致谢
这项研究由作者们的中国国家自然科学基金会(授权号:42130811和42304090)、江西省科技项目(DHSQT42023001)、铀资源勘查开采与核遥感国家重点实验室的自主部署项目(2025QZ-YZZ-03)以及中国磁大地电阵列国家科技重大项目(2024ZD1000204)共同资助。