基于物理知识的顺序数据增强方法在三元流建模中的应用

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Chemometrics and Intelligent Laboratory Systems》：Physics-informed sequential data augmentation for three-phase flow modeling

【字体：大中小】 时间：2026年03月13日 来源：Chemometrics and Intelligent Laboratory Systems 3.8

编辑推荐：

　　油-气-水三相流特性建模中提出基于物理信息的两阶段数据增强策略，通过局部增强捕获各工况动态特征，全局增强利用时间变分自编码器（TimeVAE）扩展样本库，结合GRU模型预测多相泵流量。实验验证该方法有效提升复杂流动特性建模精度。

刘安鹏|邓红英|刘毅

浙江工业大学过程装备与控制工程学院，杭州，310023，中国

摘要

准确描述多相泵的油气水三相流特性对于原油提取中的结构设计和工况调整是非常重要的。考虑到可用标记数据的有限性以及流动过程的复杂性，本文提出了一种基于物理知识的序列数据增强方法，以生成足够的样本用于三相流过程的建模。首先，利用多相传输的过程知识以及蒙特卡洛dropout策略得出的量化不确定性，分别识别出每种工况的复杂区域，并在这些区域进行局部数据增强。然后，将收集到的所有数据和生成的候选样本作为时间变分自编码器模型的原始样本，进行全局数据增强。最后，构建了一个门控循环单元模型来预测多相泵的流量。实验结果表明，所提出的方法能够通过引入基于物理知识的增强数据来捕捉复杂的流动特性。

引言

多相泵是实现原油提取中油气水封闭混合传输的关键设备[[1], [2], [3]]。在时变条件下，泵腔和阀体中的油气水三相流表现出非稳态、不均匀、多尺度以及多物理场耦合的特性，这是由于复杂的界面动态行为与不规则阀运动的相互作用所致[1,3,4]。由此产生的气液空化现象和油水乳化会降低泵的效率并导致一些故障[[2], [3], [4], [5], [6], [7]]。建立多相泵的动态特性（如流量和相含量）与传输条件参数之间的关系，对于优化泵的结构和实时调整多相流状态是非常必要的。

已经使用了机理模型、计算流体动力学（CFD）模型和实验测量方法来描述多相流的特性。由于对多相流过程中相变、界面和流动不稳定性的物理知识了解有限，大多数现有的机理模型都描述的是稳态气液流动[[5], [6], [7], [8], [9], [10]]。然而，油气水三相流的行为更为复杂，包括油气水分层流动和油水乳化流动[2,4,11]。目前，CFD模型通常基于经验选择某种湍流模型[3,[6], [7], [8], [9], [10]]。实际上，单一模型不足以描述具有多种流动模式的整个动态过程。此外，为了有效捕捉不同时间尺度上的相间相互作用，通常需要高分辨率网格，这会导致计算时间和资源的增加。因此，仍然难以快速描绘不同条件下的多相流特性并实现多相流状态的实时监测。

鉴于有限的多相流测试技术无法从实验中获得大量可靠的数据，结合传统传感器和先进信息处理技术的测量方法受到了广泛关注。相关方法、小波分析、高斯过程回归、神经网络和深度学习建模工具等被用于流动模式识别、相分数检测、流量预测和流场重建[2,4,5,[11], [12], [13], [14], [15], [16], [17], [18], [19]]。然而，这些方法大多应用于管道中的气液两相流。只有少数研究基于阵列多传感器信息融合技术对管道中的油气水三相流流量进行了预测[11,18]。与管道中的流动特性不同，多相泵中的流动特性更为复杂，因为存在复杂的界面动态行为与多相泵运动部件的相互作用[2,19]。特别是对于高粘度和腐蚀性的原油，很难在泵腔内安装足够的传感器来收集足够的信息数据。在这种情况下，本文采用了数据增强技术来创建可用于多相泵三相流动态特性建模的数据。

最近，几种数据增强方法（如时间变分自编码器（TimeVAE）、时间生成对抗网络（TimeGAN）和时间去噪扩散概率模型（TimeDDP）因其强大的生成能力而被应用于不同任务的数据生成[[20], [21], [22], [23], [24], [25], [26], [27]]。它们通常学习时间序列数据的时间特征来生成相似的样本。实际上，不同工作条件下的三相流过程具有不同的周期性特征，因为多相泵的周期性运动各不相同。此外，每个周期内的流动过程具有不同的阶段特征。这意味着一个好的数据增强方案应该能够捕捉三相流的局部和全局动态信息。

与TimeGAN和TimeDDP相比，TimeVAE架构的主要优势在于它可以控制潜变量来生成过渡样本[20,21]。这有助于TimeVAE更好地捕捉不同条件下的三相流过程特征。然而，传统的TimeVAE数据增强方案可能需要更多的原始样本。因此，本文开发了一种基于物理知识的两阶段数据增强策略。在第一阶段，将过程知识和数据中的量化不确定性结合起来，对每种工况进行局部数据增强。在第二阶段，收集第一阶段中所有不同条件的现有数据，作为TimeVAE的原始数据，进行进一步的全局数据扩展。

具体内容组织如下：第2节探讨了多相泵中油气水三相流的特性。第3节提出了一种基于物理知识的两阶段数据增强策略，以丰富流动过程的动态信息。第4节通过比较几种模型的预测结果来证明所提方法的优越性。最后，第5节总结了本文的工作。

实验装置

如图1所示，为了获得实际的建模数据并验证所提方法的可行性，从中国某油田的一台往复式多相泵中进行了数据采集。来自液体管道的油水混合物和来自气体管道的气体在调节罐中充分混合，然后通过吸入口进入泵腔，再通过排出口排出。最终，加压的油气水混合物

三相流数据增强策略

基于上述概述，开发了一种基于物理知识的两阶段数据增强策略（如图3所示），以丰富建模信息。在第一阶段，考虑到图2所示的三相流过程的非线性和时间特性，结合了门控循环单元（GRU）和蒙特卡洛dropout（MCD）采样方法，构建了一个GRU-MCD模型，使用有限样本S =

{x_{m},{y_{m}}}_{m = 1}^{M}

来自实验装置。此外，过程

结果与讨论

从图1中的实验装置共收集了1080个样本，这些样本来自九种工作条件下的排放过程，表示为

S = (S_{1},?,S_{9}

。使用

S_{1},?,S_{6}

构建了一个GRU-MCD模型。为了验证数据增强的有效性，这里详细选择了三个测试集作为示例。它们分别是S₇（其中P_s = 0.4Mpa, β_s = 0.5, P_d = 2.0Mpa 和 θ = 180°–360°）、S₈（其中P_s = 0.4Mpa, β_s = 0.5, P_d = 1.5Mpa 和 θ = 180°–360°）以及S₉（其中P_s = 0.4Mpa, β_s）。

结论

所提出的基于物理知识的两阶段序列数据增强策略提供了有用的建模样本，用于描述多相流过程特性。将过程知识和过程数据中的量化不确定性与数据增强策略相结合，随后采用TimeVAE进行进一步的数据增强。由此，识别出具有复杂动态特性的区域并添加了增强数据。如何在线监测和调整多相流

CRediT作者贡献声明

刘安鹏：撰写——原始草稿，概念构思。邓红英：撰写——审稿与编辑，验证。刘毅：撰写——审稿与编辑，监督，方法论。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的财务利益或个人关系。

致谢

本研究得到了国家自然科学基金（中国）（项目编号：U23A20328）和浙江省自然科学基金的Baima Lake实验室联合基金（项目编号：LBMHD24F030001）的支持。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号