利用水库水质和电动潜水泵参数进行的数据驱动型油井产量预测

【字体: 时间:2026年03月13日 来源:Physics and Chemistry of the Earth, Parts A/B/C 3.0

编辑推荐:

  该研究通过机器学习算法预测油井产量,采用六项参数(初始压力、 discharge压力、API重力、气油比、含水量、功率),经异常检测和交叉验证处理后,CNN模型表现最佳(R2=0.98),SHAP分析显示 discharge压力和API重力影响最大。

  
Zan Li|Barno Abdullaeva|Amit Ved|Muktha Eti|Mohammed Al-Bahrani|SHREEYA UPPAL|Badri Narayan Sahu|Sanjeev Kumar Shah|Raj Kumar|Raed H.C. Alfilh|Jamal K. Abbas|Aseel Smerat|Hojjat Abbasi|Wenrui Jiang
哈尔滨大学食品工程学院,中国哈尔滨,150086

摘要

本研究开发了一种基于机器学习的算法,利用水库流体和电动潜水泵的参数来预测油井的生产率。在562个实验数据点上,测试了八种算法:决策树(DT)、AdaBoost、K-最近邻(KNN)、随机森林(RF)、集成学习、卷积神经网络(CNN)、多层感知器人工神经网络(MLP-ANN)和Extra Trees,这些算法涵盖了六个输入参数:初始水库压力(Pi, psi)、油气比(GOR, SCF/STB)、排放压力(Pd, psi)、API比重、含水率(%)和马力(HP)。通过基于杠杆值的异常值检测方法提高了数据质量。相关性分析表明,排放压力(Pd)是最重要的因素(系数:0.85),其次是API比重(0.14)、初始压力(-0.25)、马力(-0.23)、含水率(-0.22)和油气比(0.05)。CNN模型在测试集上取得了最高的预测准确性,决定系数(R2)为0.9799567,均方误差(MSE)为37092.863,优于其他模型(如决策树、AdaBoost和Extra Trees)。Shapley Additive Explanations(SHAP)分析进一步确认了Pd是主导因素,API比重次之。敏感性分析验证了所有输入参数的相关性。这种方法为在不同条件下预测生产率提供了一种精确且经济可行的替代方案。

引言

电动潜水泵(ESPs)已成为主要的石油和天然气开采方法,全球约有150万口井采用了这项技术[1]。在现有的人工举升系统中,ESPs因其适应性而脱颖而出,它们可以处理广泛的流速范围,并适用于直立和倾斜的井筒。ESPs在大量生产和深井场景中表现出色,每天可达到超过45,000桶的流量,并能在12,000英尺的深度有效运行[2]。其紧凑的设计也使其适用于海上部署。海上生产监测也受益于先进的传感技术,包括用于平台活动检测的光学和热成像遥感技术[3]。然而,ESPs也存在局限性,例如在高气体含量环境中效率降低(特别是当泵入口处气体占比超过10%时),以及对含有固体的液体的耐受性较差。
典型的ESP系统包括地面组件,如电源、变压器、控制面板和阀门,而地下部分则包括离心泵、电动机、密封段、井下电缆和传感器[4]。海上生产组件的结构完整性和刚度建模对于确保在高压条件下的系统可靠性也非常重要[5]。由于ESP由多个离心阶段组成,每个阶段都会重复这一泵送循环[6]。为了提高性能,可以添加井下传感器来传输当前数据,如接受压力和释放压力、温度和振动。密封腔用于保护发动机免受腐蚀性液体的影响,并保持井筒和内部电机油之间的压力平衡。本质上,ESP通过调整旋转频率(f)和节流阀开口(zc)等参数,将水库流体提升到地面[7]。多孔介质中的气体解吸和传输机制也会显著影响流体生产行为[8]。关键因素如碳氢化合物流量(qp)、生产区域内的流动状态以及泵的扬程(H)定义了泵的操作范围,即性能包络,包括升压和降压限制。该包络在图形上表示为最低压力和最大流量线之间的区域。泵的扬程定义为压力与流体密度的比值,通常随着流量的增加而减小[9, 10]。井口、井底和集管处的系统压力分别用Pwh、Pbh和Pm表示。纳米流体注入等增强采油技术也会改变流体性质和生产性能[11]。
许多研究采用了人工智能(AI)方法来探索ESP性能的各个方面。在优化任务中,Mohammadzaheri等人[12]应用了遗传算法,而Dachanuwattana等人[13]使用了随机森林模型和神经网络。在预测ESP系统故障方面,Okoro等人[14]、Chen等人[15]和Brasil等人[16]采用了神经网络方法,Ambade等人[17]则选择了随机森林模型。关于ESP支持井的流量估算研究,Mohammadzaheri等人[12, 18]、Azim[19]、Popa[20]和Sabaa[21]也使用了神经网络。遗传编程[22]、非线性回归[23]和支持向量机[24]也得到了研究。最近的进展包括基于物理的神经网络[25]以及SVM、CNN和XGBoost等混合算法[26]。
本研究旨在创建一个可靠的模型,用于利用ESP系统预测井中的流体输出水平。许多现有模型缺乏明确的公式,忽视了计算效率问题,也无法评估输入参数的敏感性,这些因素限制了它们在实时流量预测中的应用。为了解决这些问题,我们提出了一个基于人工神经网络的模型,该模型计算效率高且易于重现,利用了易于获取的地面级输入参数。
在各种机器学习技术中,神经网络因其能够无需预定义方程即可模拟复杂的非线性输入-输出关系而受到青睐[27]。此外,神经网络还具有容错能力[28]和多种训练策略的选择。尽管有这些优势,神经网络也存在挑战,例如大量可调参数以及依赖试错方法进行网络配置,这可能导致训练时间延长[29]。最近的进展包括用于石油和天然气基础设施定量风险评估的自适应正则化神经网络[30]。
在变化的水库和操作条件下直接测量油井生产率的复杂性促使人们采用机器学习(ML)算法作为传统实验方法的可靠高效替代方案。新兴的井下监测技术,如电磁层析成像,在多相流特性分析方面显示出潜力[31]。通过采用数据驱动的方法,研究人员可以构建精确的预测模型,从而提高对油井性能的理解,同时减少资源密集型现场实验的需求。
本研究专注于利用水库流体和电动潜水泵参数开发复杂的机器学习模型来预测油井生产率。所采用的算法包括决策树(DT)、AdaBoost、随机森林(RF)、集成学习、K-最近邻(KNN)、卷积神经网络(CNN)、多层感知器人工神经网络(MLP-ANN)和Extra Trees。为了确保数据集的可靠性,采用了基于杠杆值的异常值检测方法。此外,还使用了K折交叉验证来减少模型训练过程中的过拟合风险。通过综合指标和视觉分析评估模型效果,并使用Shapley Additive Explanations(SHAP)值来解释输入特征对生产率的影响。注入引起的水库流体成分变化和排量效率变化,特别是在化学注入过程中,会显著改变生产行为和井性能[32]。
预测油井输出水平的方法在图1中进行了可视化展示。过程从数据预处理开始,包括敏感性分析以评估每个输入变量的影响,以及基于蒙特卡洛的异常值检测技术以保持数据完整性。选择了六个关键输入参数:初始水库压力(Pi, psi)、排放压力(Pd, psi)、API比重、油气比(GOR, SCF/STB)、含水率(%)和马力(HP)。然后这些输入通过一系列机器学习算法进行处理,包括RF、AdaBoost、DT、集成学习、CNN、KNN、MLP-ANN和Extra Trees。严格评估每种算法的性能,并选择最有效的模型来预测油井生产率。这种系统化、数据驱动的方法确保了在各种条件下对油井生产的稳健建模。

部分代码片段

决策树(DT)

决策树是指导学习中广泛采用的方法,特别适用于分类和回归任务。它们表示一个结构化的模型,以树状格式模拟一系列决策及其可能的结果。每个内部(非终端)节点对应于由特定特征决定的选择,每条边代表该选择的结果,每个叶节点表示预期的结果或标签。由于其逻辑流程

数据收集描述

本研究用于模型开发和评估的数据集来自中东一个原油开采区域的现场数据。它包含562个数据点,涵盖了重要的输入因素:Pi(psi)、排放压力(Pd, psi)、API比重、GOR(SCF/STB)、含水率(%)和HP,这些数据来自多种来源。这些参数对影响油井生产率至关重要,因此对于有效的预测建模非常重要。图10

结论

本研究致力于创建复杂的数据驱动模型,利用水库流体和电动潜水泵参数来预测油井生产率。采用了多种机器学习技术,包括决策树(DT)、AdaBoost、随机森林(RF)、集成学习(Ensemble Learning)、K-最近邻(KNN)、卷积神经网络(CNN)、多层感知器人工神经网络(MLP-ANN)和Extra Trees来开发这些预测算法。研究使用了包含562个数据点的强大数据集,涵盖了关键输入参数,如Pi、Pd、API、GOR、含水率(%)等

作者贡献声明

Raed H. C. Alfilh:方法论、调查、正式分析。Jamal K. Abbas:软件、资源、调查、正式分析。Sanjeev Kumar Shah:监督、软件、方法论、正式分析。Raj Kumar:写作——审稿与编辑、原始草稿撰写、软件、资源。Wenrui Jiang:写作——审稿与编辑、软件、方法论。Amit Ved:监督、资源、方法论、正式分析。Muktha Eti:监督、软件、项目管理、调查

数据可用性声明

数据可应要求向相应作者索取。

利益冲突

资助

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

致谢

国家关键研发项目(政府间国际科技创新合作(项目编号:2022YFE0122600);黑龙江省揭榜领航项目(项目编号:2022ZXJ01A02, 2022ZXJ01A01);以及国家自然科学基金(项目编号:22378089。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号