DG-LDM：一种双引导潜在扩散模型，用于不平衡故障诊断中的数据增强

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《ADVANCED ENGINEERING INFORMATICS》：DG-LDM: A Dual-Guided Latent Diffusion Model for data augmentation in imbalanced fault diagnosis

【字体：大中小】 时间：2026年02月10日 来源：ADVANCED ENGINEERING INFORMATICS 9.9

编辑推荐：

　　针对旋转机械故障诊断中的样本不平衡和数据稀缺问题，本文提出双指导潜在扩散模型（DG-LDM）。通过自注意力增强变分自编码器（SA-VAE）构建高效潜在空间，提取多尺度结构化特征；结合动态条件编码器（DCE）和SA-VAE的特征指导，创新设计并行多尺度膨胀交互模块（PMDIM），增强对复杂时序特征的捕捉能力。实验表明，DG-LDM在多个数据集上显著提升诊断精度，尤其在HIT轴承数据集达到98.13%的准确率。

岳文豪|王宏军

北京信息科学与技术大学机电工程学院，北京，100192，中国

摘要

旋转机械的智能故障诊断受到普遍存在的样本不平衡和数据稀缺问题的严重限制，导致诊断准确性显著降低。为了解决这一挑战，本文提出了一种创新的双引导潜在扩散模型（DG-LDM）。该模型采用自注意力增强变分自编码器（SA-VAE）来学习高效的潜在空间，提取多尺度、无噪声的结构化特征。随后，引入了具有双引导机制的扩散模型：一方面，动态条件编码器（DCE）通过分层特征调制确保生成样本与指定运行条件的精确匹配；另一方面，从SA-VAE提取的结构化特征基于信号物理提供了外部先验指导，保证了生成信号的质量。此外，设计的并行多尺度扩张交互模块（PMDIM）深度集成到U-Net主干网络中，显著增强了网络捕捉复杂时间序列特征的能力。在多个数据集上的广泛实验证明了所提出方法的优越性。特别是在高度复杂的HIT航空发动机轴承数据集上，提出的DG-LDM实现了98.13%的诊断准确性。这一定量结果证实了该模型在现实的高难度工业环境中的鲁棒性。

引言

旋转机械是现代工业制造的基石，其运行稳定性和可靠性对于确保生产安全和效率至关重要[1]，[2]。在这些复杂的机械系统中，轴承作为关键的支持和传输部件。轴承在高速和重载等恶劣条件下持续运行，是最容易发生故障的元件之一[3]，[4]。因此，开发高效精确的智能故障诊断（IFD）技术对于防止灾难性事故、优化维护策略和延长设备使用寿命具有深远的理论和工程意义[5]，[6]。

在工业4.0时代，基于深度学习（DL）的数据驱动方法从根本上重塑了IFD的格局，提供了强大的自动特征提取能力[7]，[8]。标准模型，包括卷积神经网络（CNNs）[9]和循环神经网络（RNNs）[10]，在有足够数据的支持下取得了显著的基准性能[11]。然而，在工业环境中部署这些模型时暴露了一个根本性瓶颈：它们依赖于大规模、类别平衡的标记数据的理想化前提[12]。与这一要求相反，现实世界的机械数据遵循长尾分布，其中健康状态占主导地位，故障发生是不可预测的。由此导致的故障样本稀缺[13]加剧了类别不平衡问题，使得少数故障类别的代表性严重不足[14]，[15]。不可避免地，这种不平衡引入了有偏的优化目标，导致DL模型在面对实际不平衡的测试场景时优先考虑多数类别[16]。

为了应对轴承诊断中数据稀缺和不平衡的双重挑战，数据增强被认为是一种直接且有效的策略。传统的重采样技术，如合成少数样本过采样技术（SMOTE）[17]，通过线性插值合成新样本。然而，这种方法难以捕捉故障信号的复杂非线性动态，通常产生的样本缺乏多样性，可能会模糊类别边界[18]。近年来，以生成对抗网络（GANs）[14]和变分自编码器（VAEs）[19]为代表的深度生成模型为数据增强提供了新的途径。

在优化这些架构用于故障诊断方面取得了显著进展。例如，Kim等人[20]提出了一个基于频谱引导的GAN（SGAN），采用密度-方向性采样策略来缓解模式崩溃并提高多样性。同样，Yang等人[21]开发了一个特征融合GAN（CE-FFGAN），结合了深度嵌入的类别信息和结构相似性损失，以稳定变速条件下的训练过程。其他工作将Transformer架构集成到GAN中，以改善信号中长距离依赖性的捕捉，从而有效提升不平衡数据上的诊断性能。此外，为了解决VAEs中生成样本模糊的问题，You等人[22]在VAE中引入了卷积块注意力模块（CBAM-VAE），以更好地捕捉阻抗信号中的局部微结构和峰值位置。尽管有这些结构上的改进，但固有的瓶颈仍然存在。对于基于GAN的方法，即使有复杂的正则化项，它们本质上仍然依赖于生成器和鉴别器之间的最小-最大博弈[20]，[23]。这种对抗过程难以收敛，通常无法捕捉数据的完整概率分布，导致模型忽略难以学习的故障模式。此外，如果没有明确的物理约束，GANs更倾向于欺骗鉴别器而不是遵循振动信号的基本物理定律（例如，冲击-衰减特性）。另一方面，基于VAE的方法在多样性和保真度之间难以权衡。由于VAEs旨在最大化数据似然的证据下界（ELBO），它们倾向于平均高频细节以最小化重建误差。在轴承故障诊断的背景下，这导致信号过度平滑，严重损害了关键诊断信息的保留，特别是瞬态脉冲和微妙的故障特征。

最近，去噪扩散概率模型（DDPMs）[24]，[25]作为一种强大的生成范式出现，因其出色的生成质量和稳定的训练动态而受到广泛关注。通过物理噪声注入的前向过程和学习的去噪反向过程，DDPMs可以生成具有前所未有质量和多样性的样本，并具有稳定的训练机制。这一优势迅速使它们成为数据增强研究的新前沿。DDPMs在故障诊断中的应用仍处于早期阶段，但已经展示了巨大的潜力。例如，Yang等人率先将DDPMs应用于生成不平衡的故障数据，成功验证了它们通过将振动信号转换为时频图像来生成高保真故障特征的有效性。随后，一系列研究开始探索DDPMs用于信号生成，如用于序列数据的时间序列DDPMs[26]和旨在提高效率的轻量级DDPMs，展示了它们的巨大潜力。这些工作为解决数据不平衡问题开辟了新的技术路径。

尽管DDPMs具有相当大的潜力，但将原本为计算机视觉设计的标准DDPMs直接应用于工业振动信号生成仍面临三个基本障碍。首先，标准DDPMs由于在高维信号空间中需要数千次迭代步骤而计算效率低下，这阻碍了实时部署[27]。尽管潜在扩散模型（LDMs）已被用于降低计算成本，但它们使用的标准自编码器主要是为图像设计的。它们的卷积架构在捕捉振动信号所需的长距离周期性和全局依赖性方面能力有限，可能导致潜在空间中关键故障物理信息的丢失。此外，标准DDPM的生成过程缺乏明确的约束，以确保输出信号遵循机械系统的基本物理定律（如周期性模式和冲击-衰减特性）[28]。此外，当前的条件机制往往过于简单，无法对复杂的多维运行条件（如变化的速度和负载）进行精确的细粒度控制。正如Guo等人[29]所指出的，通用的引导机制无法有效解耦这些相互关联的因素。最后，标准去噪网络往往忽略了振动信号的内在多尺度结构，经常遗漏高频瞬态冲击和低频周期成分的共存。

为了系统地解决这些挑战，本文提出了一种新颖的双引导潜在扩散模型（DG-LDM），这是一种专门为数据不平衡下的轴承故障诊断设计的高效数据增强框架。我们的工作旨在生成具有工作条件准确性和物理保真度的高质量故障样本。本文的主要贡献如下：

1.
高效的潜在扩散框架：为了解决计算瓶颈，我们将扩散过程从原始信号空间转移到低维潜在空间。这是通过一种新颖的自注意力增强变分自编码器（SA-VAE）实现的，该编码器专门设计用于学习振动信号的更具表现力和结构意识的表示，从根本上提高了效率。
2.
精细的双引导机制：为了确保物理保真度和精确的可控性，我们设计了一种双引导策略。内部动态条件引导由动态条件编码器（DCE）实现，基于特定运行条件进行细粒度控制。同时，外部结构先验引导将SA-VAE提取的多尺度特征直接注入去噪过程。这施加了稳健的物理约束，确保了信号保真度——这是以前方法中经常缺乏的方面。
3.
架构增强的去噪网络：为了使去噪网络能够有效响应复杂的双引导指令，我们通过集成并行多尺度扩张交互模块（PMDIM）来优化其主干网络，该模块通过并行多尺度扩张卷积操作，专门设计用于解耦和重建振动信号的复杂多尺度特征。

本文的其余部分组织如下：第2节介绍相关工作的背景。第3节详细阐述所提出的DG-LDM框架。第4节展示并讨论实验结果。最后，第5节总结本文。

部分摘录

去噪扩散概率模型（DDPM）

去噪扩散概率模型（DDPM）[30]是一类受非平衡热力学启发的深度生成模型。由于其能够生成高质量、多样化的样本以及与生成对抗网络（GANs）相比更稳定的训练过程，DDPM已成为生成建模领域的一个重要范式。本章将详细阐述DDPM的核心数学原理，包括其基本的前向和反向过程，以及

整体框架

DG-LDM的整体框架如图2所示。它构成了一个系统的数据增强解决方案，旨在生成既具有物理合理性又具有条件准确性的高保真故障信号。整个框架遵循“编码-生成-解码-诊断”的四阶段闭环过程：

1.
高效的潜在空间编码：原始振动信号
$x$

实验验证

为了全面评估所提出的DG-LDM框架的性能，本节概述了一系列详细的实验。我们首先对CWRU、PoliTO和HIT三个不同数据集生成的样本质量进行了深入的定性和定量评估。随后，为了验证模型在更接近实际工业条件的复杂场景中的有效性，我们在更具挑战性的数据集上进行了类别不平衡故障诊断实验

结论

为有效解决旋转机械智能故障诊断中普遍存在的样本不平衡和数据稀缺问题，本文提出了一种名为DG-LDM的创新数据增强框架。首先，使用SA-VAE构建了一个高效的低维潜在空间，从复杂的振动信号中提取多尺度、无噪声的结构化特征。随后，引入了具有新颖双引导机制的扩散模型主干

CRediT作者贡献声明

岳文豪：撰写——原始草稿、验证、方法论、概念化。王宏军：撰写——审阅与编辑、概念化、验证、监督、项目管理、资金获取。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

作者衷心感谢所有匿名审稿人的宝贵意见，这些意见极大地帮助改进了手稿。

王宏军报告称，他的工作得到了国家自然科学基金（编号：52575095）的部分资助，以及北京自然科学基金（编号：L258043、IS24076）的部分资助。

联系信箱：

粤ICP备09063491号

摘要

引言