PhyCA-GAN：一种基于物理因果关系的注意力生成框架，用于检测能源输送管道中的不平衡泄漏现象

《Energy》：PhyCA-GAN: Physics-Causal Attention Generative Framework for Imbalanced Leak Detection in Energy Transportation Pipelines

【字体：大中小】 时间：2026年05月10日 来源：Energy 9.4

编辑推荐：

　　朱勇强|李帅勇|郎先明|刘亮重庆邮电大学计算机科学与技术学院，中国重庆400065摘要泄漏样本的稀缺性以及由此导致的类别不平衡是数据驱动的能源输送管道泄漏检测方法面临的主要挑战。为了解决这个问题，本文提出了物理因果注意力生成对抗网络（PhyCA-GAN），这是一种新颖的框架，它将

朱勇强|李帅勇|郎先明|刘亮

重庆邮电大学计算机科学与技术学院，中国重庆400065

摘要

泄漏样本的稀缺性以及由此导致的类别不平衡是数据驱动的能源输送管道泄漏检测方法面临的主要挑战。为了解决这个问题，本文提出了物理因果注意力生成对抗网络（PhyCA-GAN），这是一种新颖的框架，它将时空因果关系嵌入到生成模型中，以生成在统计上真实且在物理上也合理的泄漏样本。具体而言，该框架引入了一个运动先验编码器（KPE），通过一个可学习的知识库将物理先验与数据特征融合，从而为生成过程建立了严格的运动边界。为了捕捉复杂的信号动态，设计了一个物理分解的因果生成器（PDCG），将泄漏信号分离为宏观物理趋势和微观湍流细节。在这个生成器中嵌入了一种新颖的物理因果注意力机制，利用动态运动掩码来强制执行Saint-Venant传播约束并消除非物理的时空伪影。此外，一个物理不变的判别器（PID）将评估过程分为两部分，以确保符合统计真实性和物理守恒的法则。实验结果表明，PhyCA-GAN产生的合成数据优于现有的最佳基线，而使用它增强后的数据集显著提高了下游泄漏检测器的强度和准确性。

引言

跨区域石油和天然气运输依赖于能源输送管道，这使得泄漏检测成为能源安全中的一个重要问题[1]，[2]，[3]。尽管深度学习已经重新定义了这一领域，但其在地工业环境中的实施存在两个重大瓶颈。首先，大规模标记数据集的密集使用与现实世界中泄漏信息稀少且不平衡的情况不兼容[4]，[5]。其次，黑盒算法并不像系统可靠性和可解释性的严格工程标准所要求的那样透明[6]，[7]。因此，开发既准确又可信赖的模型——即使在数据不平衡的情况下——是将泄漏检测从简单的“感知”提升到“认知”的关键挑战。

解决管道泄漏检测数据不平衡的策略大致可以分为基于采样的方法和生成模型[8]，[9]，[10]。虽然采样方法（包括欠采样和过采样）在工业应用中占主导地位，但它们在处理时间序列数据方面存在固有的缺陷。这些方法通常只在数据层面进行重新平衡，而没有考虑管道信号中固有的时空相关性[11]，[12]；相比之下，生成模型是一种更有前景的方法。通过了解数据的潜在概率分布，它们希望能够创建高质量的合成样本，有效地解决数据不平衡问题。

随着人工智能的快速发展，生成模型已成为传统采样方法的有效替代方案，用于管道泄漏检测。主流模型主要包括变分自编码器（VAE）、扩散模型和GAN[13]，[14]。其中，VAE因其学习紧凑潜在表示的能力而被广泛研究[15]，[16]。例如，张等人[17]将VAE与迁移学习结合使用，创建了一个多任务模型，在少样本条件下成功进行了泄漏检测和定位。同样，参考文献[18]将对抗自编码器与生成网络结合，通过改进特征表示成功解决了泄漏检测中的数据不平衡和噪声问题；然而，尽管训练稳定且易于进行概率解释，VAE及其变体 tend to 产生缺乏细节真实度的样本，并且有后验崩溃的风险。这一瓶颈导致了最近对扩散模型的研究兴趣，扩散模型提供了更好的分布覆盖和生成多样性[19]，[20]；在管道应用中，基于扩散的方法显示出很大的有效性。杨等人[21]提出了一种基于扩散的数据增强方法，用于磁通量泄漏（MFL）数据。通过使用去噪过程生成包含缺陷类别信息的合成数据，该方法能够有效提高下游泄漏检测模型的性能；值得注意的是，使用物理约束也获得了关注。徐等人[22]将扩散模型与物理信息图卷积网络（DM-PIGCN）结合用于气体浓度场重建。参考文献[23]通过整合模拟和实验数据开发了一种新型扩散模型，能够生成某些类型缺陷的高保真信号；这些工作共同支持了扩散模型在工业场景中解决标记数据稀缺问题的潜力。

尽管扩散模型在生成质量方面表现良好，但高计算成本和推理延迟使其难以满足工业在线诊断的实时要求；相比之下，GAN在资源受限的边缘计算和实时系统中具有独特优势，因为它们的单步前向生成具有极高的效率[24]，[25]。然而，GAN也自然存在训练不稳定和模式崩溃的问题。为了克服这些问题，研究人员提出了不同的改进算法。例如，张等人[26]提出了一种双频跨特征扩散GAN。该模型可以利用单张真实图像生成多种自动标记的图像，并使用频率分解和特殊模块来提高图像生成质量，从而有效提高管道检测的准确性和可靠性。王等人[27]提出了子域对齐对抗自注意力网络，该网络利用时间相关性和原型对齐来优化长距离依赖性建模。同样，参考文献[28]提出了一种名为Res-CosGAN的数据增强方法，用于生成管道泄漏数据。其主要创新之处在于结合了残差模块和余弦相似性损失的生成器，极大地提高了合成数据的质量和训练效率。不幸的是，虽然这些方法非常重视提高统计真实度和分布多样性，但它们忽略了能源管道系统中固有的关键物理一致性约束。对于管道泄漏检测这一特定任务，需要高质量的生成数据来满足三项耦合约束：数据真实性、分布一致性和物理一致性。没有物理机制约束的生成数据将不可避免地无法突破诊断模型泛化性能和准确性的瓶颈。

本文提出PhyCA-GAN，以克服上述限制，并解决统计真实性和物理有效性之间的权衡。本文的主要贡献如下：

(1)
我们提出了PhyCA-GAN，这是一个为管道泄漏检测创建因果意识数据生成范式的新型框架。
(2)
我们设计了一种KPE，它超越了传统的硬编码约束。它提取可学习的运动先验作为生成过程的归纳偏差。
我们基于一种物理因果注意力机制创建了PDCG架构；这一创新是一种数学上可执行的信号传播限制，同时在物理上也有效，并减少了模式崩溃等生成问题。
我们提出了PID，以实现物理一致性和统计真实性的独立评估，该机制基于双分支架构和多尺度特征提取机制。

章节片段

提出的方法

管道泄漏样本生成在这方面面临一个主要挑战：当前的模型并不总是能够确保统计真实性和物理一致性。为了解决这一限制，我们提出了PhyCA-GAN，这是一种旨在合成在统计上真实且在物理上也一致的高保真泄漏样本的新型框架。这是通过共同优化三个基本部分实现的：KPE模块、PDCG模块和PID模块。

实验设置

本研究中使用的管道泄漏数据集来自一个专门的实验平台，用于验证所提出的模型（PhyCA-GAN）。该平台包括工业主机计算机、管道、储罐和辅助组件。管道的总长度为2800米，上游端的操作压力保持在1.8 MPa，下游端的操作压力保持在0.6 MPa。在管道的两端安装了声压传感器，用于记录声学信号

结论

本文介绍了PhyCA-GAN，以弥合数据驱动模型和管道泄漏诊断中的物理定律之间的差距。通过直接将时空因果关系构建到模型中，我们的框架生成了遵循流体动力学的高质量泄漏数据。特别是，KPE充当了物理指导。与仅融合特征的标准编码器不同，KPE从可学习的知识库中提取了明确的运动先验。这早在早期就设定了物理边界，确保了生成的

CRediT作者贡献声明

朱勇强：撰写 – 审稿与编辑，撰写 – 原始草稿，方法论，形式分析，数据整理。李帅勇：监督，资金获取，形式分析。郎先明：软件，数据整理，概念化。刘亮：撰写 – 审稿与编辑，软件，数据整理

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

致谢

本工作部分得到了重庆市科技创新关键研究与发展计划（编号CSTB2025TIAD-STX0030）、重庆市自然科学基金创新与发展联合基金（编号CSTB2024NSCQ-LZX0035）、重庆市教育委员会科技研究项目（编号KJZD-M202300605）、新重庆青年创新人才计划项目（编号CSTB2024NSCQ-QCXMX0053）以及重庆市技术创新专项项目的支持

摘要

引言

章节片段

提出的方法

实验设置

结论

CRediT作者贡献声明

利益冲突声明

致谢

热点排行