基于井测数据和地震反演结果的岩性预测：一种机器学习方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Applied Geophysics》：Lithology prediction based on well-log data and seismic inversion result: A machine learning approach

【字体：大中小】 时间：2026年02月02日 来源：Journal of Applied Geophysics 2.1

编辑推荐：

　　三维岩石分类预测方法研究 based on LightGBM integrating well-log and seismic inversion data to address data imbalance and parameter tuning challenges.

贾伟华|刘定进|张光志|兰天军|孙振涛|胡华峰

中国石油地球物理研究院有限公司，南京

摘要

地震预测岩性对于地质建模和水库特征描述具有重要意义。在机器学习（ML）框架内，基于地震数据预测岩性分布常常面临诸如标记数据有限、数据集不平衡、参数调整复杂以及预测结果不稳定等挑战。我们提出了一种使用Light Gradient Boosting Method（LightGBM）的全面3D岩性预测工作流程，该流程整合了井测井数据和地震反演结果。此工作流程包括特征工程、数据预处理、参数调整以及多种方法比较。为了构建一个全面的特征数据集，我们采用了井测井数据，并通过交叉图和相关性分析从定性和定量角度进行了特征选择。通过混淆矩阵和预测准确率等评估指标来评估模型性能，以确定最适合研究区域的机器学习算法。通过将LightGBM方法应用于叠前地震反演结果，能够以地质上一致的方式增强岩性的空间特征描述，从而验证了所提出工作流程的可靠性和有效性。

引言

基于地球物理数据预测地下介质的岩性分布对于水库预测、地热资源开发和二氧化碳封存具有重要意义（Hussain等人，2024；Okoroafor等人，2022；Wang等人，2020；Xie等人，2018；Yang等人，2025a；Yang等人，2025b）。机器学习（ML）能够发现地球物理数据与岩性之间的非线性关系，为岩性预测提供了一种智能且有效的方法（Bergen等人，2019；Gholami等人，2014；Kumar等人，2022；Fan等人，2024）。我们的主要目标是建立一个结合井测井数据和地震反演结果的ML驱动工作流程来进行岩性预测。

根据是否需要标签，机器学习可以分为监督学习和无监督学习（Geurts等人，2006）。无监督学习可以发现未标记数据中的内在关系。常见的无监督学习算法包括K-means聚类（Troccoli等人，2022；Weatherill和Burton，2009；Fan等人，2026）、主成分分析（Roden等人，2015；Wu和Bai，2018）以及核密度估计。而监督学习则需要预定义的标签（Shuvo和Joy，2024）。它涉及使用特征数据和标记数据训练模型，然后根据评估结果选择最优参数或模型以准确预测目标参数（Li等人，2024；Mou等人，2022）。常见的监督学习方法包括梯度提升决策树（GBDT）（Al-Mudhafar等人，2022；Zhou等人，2020）、K最近邻（Lee等人，2019）和集成方法（Zhao等人，2023）。监督学习可以进一步分为分类和回归，前者提供离散输出结果，后者提供连续输出结果（Osisanwo等人，2017；Rokach，2016；Duan等人，2026）。

在石油地球物理学中，已经应用了多种ML方法来进行地质解释任务。预测地震相（Zhou等人，2025）、岩相（Babu等人，2022）和成岩相（Zhu等人，2025）等地质属性本质上是一个分类问题，而预测包括弹性属性和岩石物理参数在内的水库参数则构成一个回归任务（Wang等人，2026；Kumar等人，2025；Zou等人，2021）。由于石油地球物理学的应用必须保持地质意义并符合地球物理原理，因此最常采用监督学习或半监督学习方法。为了获得更可靠的岩性预测，本研究采用了一种改进的监督梯度提升分类方法。传统上，岩性预测主要依赖于井测井数据（Zhao等人，2021）。然而，随着勘探目标的日益复杂，预测岩相的3D空间分布变得至关重要。因此，本研究首先使用井测井数据训练ML模型，然后整合3D地震反演结果来预测岩性的3D空间分布。这种工作流程为地下地质异常特征描述和井位优化提供了强有力的数据支持。

GBDT算法是一种强大的机器学习方法，能够高效处理分类和回归问题（Dev和Eden，2019；Liang等人，2020）。为了提高GBDT算法的计算效率并降低参数优化难度，近年来开发了多种GBDT算法。LightGBM提高了ML模型的训练速度并降低了内存消耗（Demir和Sahin，2023）。Extreme Gradient Boosting（XGBoost）增强了GBDT的并行计算能力，使其适用于大规模数据集的预测（Wang等人，2023a）。这些算法在岩性预测（Dong等人，2016；Gu等人，2020；Kim，2022；Zhao等人，2021）、地震相预测（Dunham等人，2020；Liu等人，2020）和水库参数预测（Pan等人，2022；Talib等人，2022；Wu等人，2023）等领域得到了广泛应用。

本文的结构如下。首先，我们介绍了研究区域的地质背景。然后，我们描述了基于井测井数据和地震反演结果的LightGBM预测工作流程。我们重点解释了LightGBM的算法原理以及所使用的数据和特征选择过程。接下来，我们展示了在研究区域的应用结果。此外，我们还讨论了LightGBM与其他梯度提升方法之间的预测性能比较。

区域地质背景

本研究使用的数据来自位于华北地区的某个油田的GT地层（图1）。该地区位于三个主要构造系统的交汇处：济阳凹陷、渤海湾凹陷和滩陆断裂带（Wang等人，2023b）。该地区受到多次构造运动的影响，形成了复杂的地质结构。研究区域位于成北低隆起带，其南部有桑南凹陷和渤海湾凹陷

工作流程

本文将井测井曲线与地震反演结果相结合，通过选择对岩性敏感的参数来实现岩性预测和地质特征描述。具体工作流程如图2所示。

敏感性参数分析：基于井测井曲线，通过对不同水库参数的交叉图分析和相关性分析来确定对岩性敏感的参数。

ML模型训练：使用

数据描述和特征选择

机器学习在石油地球物理学中的应用可以分为四个步骤：数据预处理、模型训练、模型评估以及对新样本的应用。其中，数据预处理阶段占所需总时间的一半以上。数据预处理的任务主要包括两部分：建立岩性标签和优化特征参数。由于我们的目标是实现3D岩性分类预测，因此有效地融合井测井数据至关重要

基于井测井数据的预测结果

根据交叉分析和相关性分析结果，本研究确定该区域的岩性敏感参数为泊松比、S波速度和μ。因此，我们使用这三个井测井曲线作为输入特征。在GB、XGBoost和LightGBM算法的支持下，我们实现了1D岩性分类预测，并将其与实际岩性进行了比较（图12）。LightGBM方法表现出最高的预测准确性，能够

不同ML方法的准确性比较

井测井数据提供了关于地下岩性最可靠的信息，因为它直接测量了地下介质。为了确保ML模型的可靠性，我们通常选择井测井数据或附近井的数据作为训练集，并据此测试模型的可靠性。随着ML算法的不断进步，出现了几种改进的梯度提升算法，包括XGBoost和LightGBM。这些方法在各个方面都得到了优化

结论

岩性预测是预测油气储层的关键步骤。此外，岩性还可以表征河流和三角洲等地下特殊地质体的分布模式。在本研究中，我们提出了一种基于LightGBM的岩性预测工作流程，该流程在ML框架内整合了井测井数据和地震反演结果。通过进行交叉分析和相关性分析，我们实现了定性和定量的同时描述

CRediT作者贡献声明

贾伟华：撰写——原始草稿、方法论、调查、概念化。刘定进：撰写——审阅与编辑、资源获取。张光志：监督、调查。兰天军：验证、软件。孙振涛：可视化、资源。胡华峰：可视化、软件、资源获取。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的财务利益或个人关系。

致谢

本工作得到了国家自然科学基金高精度地震导向钻井关键技术及软件项目（资助编号：U23B6010）的财政支持。

联系信箱：

粤ICP备09063491号

摘要

引言