DF3WCN:深度融合三重聚类网络

《Expert Systems with Applications》:DF3WCN: Deep Fusion Three-way Clustering Network

【字体: 时间:2026年02月10日 来源:Expert Systems with Applications 7.5

编辑推荐:

  页岩气井液载量严重性分级模型研究提出对比学习增强的特征融合分类模型(CL-FFCM),通过融合多源生产数据构建特征空间优化,实现四级分类精度达0.94-0.95。实验表明对比学习使主流模型准确率提升6%-9%,现场应用预警偏差3-8小时。

  
Fanhui Zeng|Peng Chen|Jianchun Guo|Zhangxing John Chen|Yanqiang Wang|Chunyi Yang
中国西南石油大学油气水库地质与开发工程国家重点实验室,成都,610500

摘要

作为一种低污染的非常规能源,页岩气开发依赖于压裂技术来克服其固有的低渗透性。然而,压裂后的水库/井筒变化加上弱的气液携带能力导致页岩气井中普遍出现液体积聚,增加了回压,降低了产量,甚至可能导致水库水淹。传统的检测方法存在局限性:基于机理的模型由于假设简化而误差较大;现有的数据驱动模型大多是二分类器,无法区分液体积聚的严重程度;而数据驱动的液位检测成本高昂。为了解决这些问题,本研究提出了一种基于对比学习的特征融合分类模型(CL-FFCM),该模型包括一个用于多源潜在特征提取的“融合网络”和一个用于四级分类的“头部网络”。SupCon损失函数增强了类别间的差异,以解决特征边界不明确的问题。在142口页岩气井上的实验表明,CL-FFCM的准确率达到了0.94–0.95。对比学习将五种主流模型的准确率提高了6%–9%。在四川南部的实际应用中,该模型平均预警偏差为3–8小时。这一模型为精确的液体积聚管理提供了可靠的工具,对高效页岩气开发具有重要意义。

引言

在全球向清洁和低碳能源结构转型的背景下,页岩气作为一种高效、低污染的非常规天然气资源,在确保能源安全和减少碳排放强度方面发挥着战略作用。中国拥有丰富的页岩气储量。近年来,通过水平钻井和水力压裂技术,四川南部和重庆东部等核心产区在商业开发方面取得了显著进展。然而,压裂作业也直接加剧了页岩气井中的液体积聚问题。为了解决页岩储层的低渗透性问题,压裂需要使用高压流体形成人工裂缝网络。这一过程不仅改变了储层的孔隙结构,还将压裂液残余物以及地层水和凝析油困在井筒中。此外,页岩气井中固有的低气体流速使得难以将井筒中的多源液体完全带到地面,从而导致液体积聚迅速积累,这成为限制页岩气井稳定生产的突出挑战(Zhao, Zhu, Cao, Zhu, & Zhang (2021); Zheng, DENG, ZHUGE, LIN, & GONG (2024))。
准确检测和评估页岩气井中的液体积聚情况面临多重技术挑战(Han, An, & Guo (2022); Huang, Shi, & Zhou (2024); Jia et al. (2022))。一方面,页岩气储层的地质条件复杂,导致不同井况下的液体积聚速率和分布模式存在显著差异,难以用统一标准判断液体积聚状态。另一方面,液体积聚发生在封闭的井下空间,直接测量依赖于井下传感器,但大多数页岩气井的深度超过1000米,导致传感器部署成本高、维护困难,并且容易受到高温和高压干扰,从而降低了实时监测数据的可靠性。此外,液体积聚严重程度的分类缺乏明确的定量工程指标,传统的基于经验的判断方法主观性很强,无法满足精确开发的需求。
为了解决上述问题,学术界和工业界最初依赖基于机理的模型进行液体积聚检测。其中,液滴去除模型和液膜反演模型是最常用的两种方法。液滴去除模型通过计算液体携带的临界气体流速来判断井筒中是否发生液滴沉积(Belfroid, Schiferli, & Alberts (2008); Coleman, Clay, & McCurdy (1991); Du & Liang (2021); Li, Lei, & Li (2001); Turner, Hubbard, & Dukler (1969); Wei, Meng, & Liu (2011); Xiong, Zhang, Cao, Xian, & Lu (2015);液膜反演模型通过分析液膜稳定性来预测液膜是否转变为连续的液柱(Barnea (1986); Luo, Kelkar, & Pereyra (2014); Pan & Hanratty (2002); Rastogi & Fan (2020); Shekhar, Kelkar, Hearn, & Hain (2017); Wallis (1969); Xiao & Li (2010))。然而,这些方法存在明显局限性:首先,它们的建立基于许多简化假设,与页岩气井的实际复杂工况有很大偏差,导致检测误差较大;其次,模型参数需要通过现场实验或经验公式获得,而页岩气井的多相流参数动态变化,难以满足模型的实时要求,无法有效支持液体积聚严重程度的动态评估。
随着物联网和大数据技术在油气领域的应用,数据驱动模型为页岩气井中液体积聚的检测提供了新的技术途径。这些模型不依赖于复杂的物理机制,而是通过探索生产数据与液体积聚状态之间的潜在相关性来实现液体积聚的分类和严重程度评估。例如,Chen et al. (2024b) 使用双向长短期记忆网络预测下一次液体积聚的时间;Chen, Chen, Yang, Xu, & Feng (2024a) 提出了一种基于半监督学习的液体积聚严重程度分类模型;Chen, Huang, Miao, Shi, & Li (2022) 使用自适应阈值测量神经网络的数据重建误差来检测液体积聚;Zhang, Chen, & Chen (2025) 基于卷积神经网络建立了柱塞气举井中气体产量、液体产量和液体积聚的预测模型;Xiang, Xia, & Liu (2024) 提出了一种基于梯度提升回归树的井筒内液体积聚高度预测方法;Yang (2023) 提出了一种基于集成学习的井筒内液体积聚状态预测模型;Xu, Zhihong, Wang, & Yi (2025) 提出了一种基于CNN-LSTM-Attention的井筒内液体积聚诊断模型。
目前,根据任务目标,数据驱动的页岩气井液体积聚诊断模型分为三类:液体积聚预警、严重程度分级和液体积预测。液体积聚预警本质上是一个二分类任务,具有数据需求低、适用范围广、实时性能高和训练成本低的优点,但判断粒度较粗,无法支持精确决策。液体积预测本质上是一个连续值回归任务,具有最高的诊断准确性和定量基础,但数据需求极高——模型训练依赖于“实际液体积聚量”的标记数据,而直接测量页岩气井中的液体积聚量成本高昂,许多生产单位缺乏可用数据。相比之下,严重程度分级更符合现场需求,作为一种多类分类任务,其结果可以直接指导后续的液体积聚排放措施选择。与液体积聚预警相比,它提供了更详细的信息;与液体积预测相比,它不需要高精度的液体积聚量标记数据。
然而,现有的严重程度分级模型仍面临一个关键瓶颈:提取的特征大多是表面数据相关性,缺乏区分不同液体积聚严重程度的判别性特征学习。具体来说,相同严重程度的样本特征相似性不足,不同严重程度样本之间的特征边界模糊,从而影响了模型的泛化能力和可靠性。
本文引入了对比学习的方法:通过构建“正样本对”(相同严重程度的样本)和“负样本对”(不同严重程度的样本),对比学习优化了特征空间分布,有效增强了同一类别样本之间的特征一致性,并扩大了不同类别样本之间的特征差异,从而为严重程度分级模型的缺陷提供了新的解决方案(Chopra, Hadsell, & Lecun (2005)。基于此,本研究提出了一种基于对比学习的特征融合分类模型(CL-FFCM),用于准确评估页岩气井中的液体积聚严重程度。该模型将传统的数据驱动网络分为“融合网络”和“头部网络”:融合网络从多源生产数据中提取潜在特征向量,并通过对比学习损失函数优化特征空间,增强了相同液体积聚严重程度样本的特征相似性,扩大了不同严重程度样本之间的差异。头部网络以优化后的判别特征作为输入,对液体积聚严重程度进行分类。

方法论

CL-FFCM模型旨在分类页岩气井中的液体积聚严重程度。传统的数据驱动网络被划分为两个模块:“融合网络”和“头部网络”,并引入对比学习来优化融合网络输出的潜在特征。模型结构如图1所示,由四个主要部分组成。
特征输入层: 接收页岩气井的生产数据(如井口压力、气体产量、液体产量等)

实验设置

模型训练过程:
  • 数据准备:将数据集分为训练集(70%)、验证集(15%)和测试集(15%),并对训练集进行标准化(仅基于训练集计算均值/标准差以避免数据泄露)。
  • 初始化:随机初始化融合网络和分类头部网络的权重,设置对比学习温度 τ 和损失权重 λ
  • 迭代训练:对训练集样本进行批量采样(批量大小=256)

相似性计算方法的影响

为了研究不同相似性计算方法对CL-FFCM模型对比增强效果的影响,本实验使用引入对比学习后的F1分数作为评估指标,系统地验证了余弦相似性、欧几里得距离、曼哈顿距离、皮尔逊相关系数和杰卡德相似性的效果差异。其他计算方法(余弦相似性除外)的公式如下

应用背景

CL-FFCM已成功应用于中国南部的一个页岩气开发区块。该区块位于四川盆地南部,属于四川南部缓坡构造带。其核心开发层为上奥陶统吴峰组和下志留统龙马西组,岩性主要为灰黑色富有机质的页岩。生产层的埋藏深度在900至4500米之间(平均深度为3000米)

结论

在全球能源结构转型和页岩气井精确开发需求的背景下,本研究通过提出一种基于对比学习的特征融合分类模型(CL-FFCM),解决了现有数据驱动液体积聚严重程度分级模型中类别内特征相似性不足和类别间特征边界模糊的问题。该模型将传统的数据驱动网络分为“融合网络”和“头部网络”

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号