物理信息神经网络在超深层烃源岩TOC少样本预测中的突破性应用

《ACS Omega》：Integration of PINN with Conventional Well Logging for Few-Shot TOC Prediction in Ultradeep Source Rocks

【字体：大中小】 时间：2026年01月17日 来源：ACS Omega 4.3

编辑推荐：

　　本文提出了一种物理信息神经网络（PINN）框架，通过将岩石物理约束直接整合到神经网络优化过程中，实现了在超深层（>8000米）烃源岩中利用极少校准数据（仅35个样本）对总有机碳（TOC）进行高精度预测。该方法在塔里木盆地塔北隆起L3井的下寒武统玉尔吐斯组应用验证，其预测性能（R2= 0.9451, RMSE = 0.8571）显著优于ΔlogR法、多元回归分析（MRA）及多种机器学习模型（MLP、RF、SVM），为解决超深层勘探中数据极度稀缺条件下的可靠地层评价提供了创新解决方案。

1. 引言

随着常规浅中层油气藏日趋成熟，针对埋深超过6000米地层的超深层油气勘探已成为战略重点。中国塔里木盆地是关键区域，其奥陶系碳酸盐岩和寒武系烃源岩的近期突破展示了巨大的商业潜力。盆地内下寒武统玉尔吐斯组是一套世界级的超深层烃源岩，具有异常高的有机质丰度，TOC值范围2%–30%，热成熟度（Ro）为1.4%–1.7%。值得注意的是，该盆地较低的地温梯度（19.6 °C/km）使得液态石油在接近9000米的深度仍得以保存，有利勘探面积超过20,000 km²。然而，这些机遇伴随着前所未有的技术挑战。鉴于超深层钻探的巨额成本，准确的钻前TOC定量评价不再是锦上添花，而是商业可行性的必要条件。这迫切需要从传统的评价技术向更先进、一体化的表征方法进行范式转变。

TOC是烃源岩评价中最基础的参数，量化了可用于生烃的干酪根浓度。在超深层勘探背景下，准确的TOC评价至关重要。首先，超深井的极端钻探成本要求对烃源岩质量进行严格的钻前评估以最小化经济风险；其次，随着深度增加，生烃窗口变得日益受限，使得精确的TOC量化对于确定是否存在足够的有机质以形成商业油气聚集至关重要。传统的TOC量化方法主要依赖于岩心样品的实验室地球化学分析。然而，在超深层钻探环境中，取心面临巨大障碍：高昂的钻探成本、有限的岩心收获率、极端温度-压力条件下的机械故障以及延长的作业时间。这些限制通常导致稀疏的TOC测量数据（通常少于100个），无法充分捕捉深层烃源岩系统固有的垂向和横向非均质性。因此，石油工业需要能够利用现成测井数据生成连续、高分辨率TOC曲线的稳健方法。

2. 地质背景

2.1. 区域构造背景

塔里木盆地位于中国西北部，是世界上最重要的古生代克拉通盆地之一，面积约560,000 km²。该盆地北邻天山，南接昆仑山，东南为阿尔金山。这个古老的含油气盆地经历了复杂的多期构造演化。下寒武统玉尔吐斯组（∈₁y）由黑色页岩夹泥质白云岩和硅质层段组成，代表了海侵最大期在台地普遍缺氧条件下的沉积，有利于有机质的异常保存。上覆的小尔布拉克组（∈₁x）和吾松格尔组（∈₁w）构成了主要的储集层段。中寒武统的沙依里克组（∈₂s）和阿瓦塔格组（∈₂a）以蒸发岩序列为特征，为下伏油气系统提供了关键的区域盖层。

2.2. 石油系统要素

研究区下寒武统石油系统展现了超深层油气聚集的最佳源-储-盖配置。玉尔吐斯组黑色页岩是世界级的烃源岩，具有异常高的有机质丰度和适宜的热成熟度（Ro 1.4%–1.7%），在当前埋藏深度下处于生油窗。储集岩主要发育在吾松格尔组白云岩中，尽管埋藏极深，仍保持了有效的孔隙度和渗透率。试油获得了134 m³/天的油和45,917 m³/天的气，证实了在171 °C和90.8 MPa储层条件下存在商业性油气聚集。盆地异常低的地温梯度延迟了油向气的裂解，使得液态石油在这些极端深度下得以保存。中寒武统蒸发岩序列提供了卓越的封盖能力，其综合的机械和化学特性在盆地复杂的变形历史中保持了盖层的完整性。

3. 材料与方法

3.1. 数据与方法概述

研究数据来自L3井，深度区间为8516–8526米。测井表征组合包括六种常规电缆测井：深侧向电阻率（RD）、浅侧向电阻率（RS）、自然伽马（GR）、密度（DEN）、声波时差（DT）和中子（CNL），并辅以实验室测量的TOC浓度。超深层钻探的巨大挑战使得校准数据集仅限于35个样本，这构成了一个典型的少样本学习场景。

3.2. 方法论框架

为解决样本稀缺和物理约束的难题，本研究开发了一个专门为少样本学习场景定制的PINN框架。该方法将物理原理通过物理约束损失项直接整合到神经网络架构中。提出的PINN架构包含了三个关键的岩石物理约束作为显式损失项：地层密度与有机质含量之间的反比关系（反映干酪根独特的低密度特性）；伽马射线响应与TOC之间的正相关（由于富有机质层段铀的富集）；以及通过针对超深层条件校准的修正岩石物理关系进行的经验一致性验证。这种物理信息方法确保了预测在从稀疏数据学习的同时，遵循基本地质原则，有效弥合了数据驱动的灵活性和基于物理的可靠性之间的差距。

3.3. 物理信息神经网络（PINN）模型

神经网络组件采用全连接前馈结构，包含三个隐藏层和一个输出层。每个隐藏层包含64个神经元，使用双曲正切（Tanh）激活函数。损失函数是数据损失和物理损失项的加权组合。物理损失项包含三个组成部分，基于测井响应与有机质含量之间的物理关系：

1.
密度-TOC关系约束：由于有机质密度远低于矿物基质密度，TOC含量增加导致地层密度降低，建立负相关关系（?TOC/?DEN ≤ 0）。
2.
伽马射线-TOC关系约束：富有机质页岩通常表现出较高的自然放射性，TOC与GR通常呈正相关（?TOC/?GR ≥ 0）。
3.
复合经验关系约束：结合DEN-TOC和GR-TOC经验关系，对模型预测进行物理一致性验证。

通过综合比较实验，最终选择物理损失权重λ = 0.25，这在拟合观测数据和满足地质物理约束之间提供了良好的平衡。模型训练采用Adam优化算法，共进行800个训练周期以确保充分收敛。

4. 结果与讨论

4.1. 实测TOC与生烃潜力

L3井下寒武统玉尔吐斯组的TOC含量范围为1.99%–18.25%，平均为8.61%，显示了优质烃源岩特征。有机地球化学分析表明有机质主要为II型干酪根，含少量I型干酪根，主要来源于浮游藻类和细菌。等效镜质体反射率（Ro）范围为1.51%–1.72%，表明处于高成熟阶段，确认这些烃源岩已进入高效生烃阶段。微观检查揭示了四种岩相的不同分布模式：硅质泥岩TOC最高（9.74%–18.25%，平均13.13%），富含海绵骨针和底栖藻类碎片；泥岩TOC中等（7.5%–9.6%，平均8.2%），含分散沥青和球形浮游藻类；泥质碳酸盐岩TOC相对较低（2%–3%），但仍达到烃源岩标准。这些变化反映了沉积环境和有机质保存条件的差异。

4.2. TOC预测性能比较

本研究系统评估了六种方法在L3井35个超深层样本上的TOC预测性能。比较评估表明：

•
ΔlogR方法表现出严重受限的预测能力（R²= 0.2473），这主要是由于超深层地层中深电阻率（RD）与TOC含量之间的相关性可忽略不计。
•
多元回归分析（MRA）达到了接近0.8的适度可接受的相关系数，但相关的预测误差仍然相当大。
•
机器学习方法（SVM、RF、MLP）表现出明显更优的预测性能，成功建立了测井响应与TOC含量之间复杂的非线性映射。其中，支持向量机（SVM）性能最高（R²= 0.8521），随后是随机森林（RF，R²= 0.8374）和 multilayer perceptron (MLP，R²= 0.8262)。
•
本研究提出的PINN架构实现了最佳的预测性能，R²达到0.9451，RMSE为0.8571。与ΔlogR法、MRA、MLP、RF和SVM模型相比，R²分别提高了282%、18%、14%、13%和11%。同时，训练时间（29秒）相较于RF和MLP方法大幅减少。

综合测井曲线图提供了代表性深度区间内TOC预测性能与实测岩心值的详细可视化。垂直分布分析表明，所有四种方法都成功识别了TOC富集层段；然而，在详细表征能力方面出现了显著差异。PINN预测曲线显示出与实测TOC剖面最高的吻合度，特别是在8520–8524米区间内，实测TOC表现出明显的变化。在这个地质复杂的层段，PINN模型展现了卓越的适应性，在保持合理曲线光滑度的同时，以显著的灵敏度捕捉了快速的TOC波动。这一卓越性能验证了在神经网络架构中整合物理约束的有效性，使模型能够同时遵从数据驱动模式和控制超深层烃源岩系统中有机质分布的基本岩石物理关系。

4.3. 地质意义

PINN模型在不需预先标记岩相信息的情况下实现了可接受的TOC预测，这与通常进行特定岩相标定的常规方法不同。这表明集成的电缆测井响应包含了足够的信息来表征不同岩性背景下的TOC分布。该方法有助于减少评价工作流程中人工岩相分类引入的主观性。

这一认识对于理解塔里木盆地烃源岩分布具有重要意义。尽管玉尔吐斯组在盆地范围内广泛发育富有机质相，所有四种岩相均满足基本烃源岩标准（TOC > 0.5%），但实际的油气聚集集中在特定区域，如塔中、塔北和顺托-果勒地区。这种空间上的不一致表明，仅凭岩相存在无法预测有效的油气系统。 productive烃源岩的分布受多种因素控制，包括有机质类型、热成熟度、生烃和排烃效率以及保存条件。

PINN方法提供的连续、高分辨率TOC曲线使得能够更详细地描绘岩性单元内烃源岩质量的变化。未来的应用应将PINN预测的TOC分布与实测的有机地球化学参数（包括热成熟度（Ro）、生烃动力学和排烃效率）相结合。通过纳入这些参数的约束，可以更精确地识别具有真正勘探潜力的有效烃源岩，为超深层勘探中的目标优选和风险评价提供支持。

这种结合TOC预测和地球化学参数约束的综合评价框架，可能有助于阐明塔中、塔北和顺托-果勒等地区油气富集的地质控制因素。PINN方法仅需要大多数井中可用的标准电缆测井系列，便于以相较于广泛取心计划更低的成本进行盆地尺度评价。这对于钻探成本高昂且取心面临技术挑战的超深层勘探尤其相关。为TOC预测所演示的物理信息学习框架有可能扩展到其他岩石物理参数，如孔隙度和渗透率，为更全面的超深层地层评价提供了可能性。

5. 结论

本研究开发了一个PINN框架，用于超深层烃源岩中的少样本TOC预测，解决了在埋深超过8500米的地层中数据极度稀缺的关键挑战。岩石物理约束与神经网络优化的结合代表了在数据有限条件下进行地下表征的根本性进步。

1.
PINN模型在利用L3井有限的校准样本（35个）下展示了卓越的预测性能，实现了R²为0.9451，RMSE为0.8571。比较分析显示，其R²相较于ΔlogR法、MRA、MLP、RF和SVM模型分别提高了282%、18%、14%、13%和11%。物理信息约束有效防止了过拟合，并确保了地质一致性。
2.
该方法在塔里木盆地下寒武统玉尔吐斯组（8516–8526米）的成功应用，生成了连续的高分辨率TOC曲线。垂直分布分析揭示了不同岩相间系统的TOC变化，硅质泥岩富集程度最高（TOC 9.74%–18.25%，平均13.13%），其次是泥岩（7.5%–9.6%，平均8.2%）和泥质碳酸盐岩（2%–3%）。PINN衍生的连续曲线为塔北隆起地区的油气系统模拟和烃源岩质量评价提供了关键输入。
3.
所提出的物理信息框架为数据稀缺环境下的岩石物理评价建立了一种有效方法。该方法仅使用大多数井中可用的标准电缆测井系列，便于以比广泛取心计划更低的成本进行盆地尺度评价。未来的研究应侧重于将PINN预测的TOC分布与实测的热成熟度和生烃动力学等有机地球化学参数相结合，以更精确地识别有效烃源岩。

总体而言，这项工作有助于降低超深层油气资源评价中的不确定性，并推进了数据有限储层表征的方法学。

热点排行

新闻专题