QConvCDFA:一种基于二次卷积神经网络(quadratic CNN)和对比度驱动特征聚合(contrast-driven feature aggregation)的跨域故障检测模型

【字体: 时间:2026年03月08日 来源:Applied Soft Computing 6.6

编辑推荐:

  提出基于二次卷积神经网络(QCNN)与对比驱动特征聚合(CDFA)的轴承故障诊断模型,通过时频域独立处理、Transformer编码器建模长程依赖及动态加权跨域特征融合,显著提升噪声环境下的诊断准确性和鲁棒性,在四个轴承数据集验证中表现优异。

  
郭一鸣|王彦雪|李新明|李萌|王成明
北京土木工程与建筑大学机械电子与车辆工程学院,北京,100044,中国

摘要

当前的故障诊断方法面临着多源信号中的噪声干扰和特征融合不足等挑战。现有的单通道深度学习模型难以直接处理异构信号,而传统的数据融合策略在集成过程中常常会导致时频域特征的丢失。为了解决这些问题,本文提出了一种基于二次卷积神经网络(QCNN)的故障诊断模型,该模型结合了自适应噪声抑制和动态跨域特征融合。首先,应用快速傅里叶变换(FFT)将时域信号转换为频域信号。然后将时域和频域信号分别输入到QCNN层,在其中进行自适应噪声抑制和特征提取。随后,使用带有位置编码的Transformer编码器来建模故障相关特征之间的长距离依赖性。编码后的时域和频域特征被输入到对比驱动的特征聚合(CDFA)模块中。在该模块中,通过滑动窗口机制动态地对跨域特征进行加权并聚合,得到的表示结果再传递给深度学习分类器进行最终故障诊断。最后,通过在四个轴承数据集上进行的四项实验验证了所提出模型的性能。这些结果表明,QConvCDFA模型能够有效捕获时域和频域的关键特征。此外,与基准方法相比,该模型在诊断准确性和鲁棒性方面表现出更好的性能。

引言

旋转机械是机械工程系统的重要组成部分。然而,在复杂条件下长时间运行往往会导致轴承等关键部件的磨损和故障[1]。即使是在精密设备中的微小故障也可能导致严重的错误和巨大的经济损失[2]。因此,对旋转机械进行准确和及时的故障诊断至关重要[3]。
机器学习,特别是深度学习,在轴承故障诊断中得到了广泛应用。研究表明,一维卷积神经网络(1D-CNN)模型[4]、[5]可以直接处理一维时域信号。例如,宽深度卷积神经网络(WDCNN)在其第一层使用宽卷积核从一维轴承振动信号中提取初始特征。这种方法已在多个基准轴承故障数据集上得到验证,并显示出出色的诊断准确性[6]。由于WDCNN在轴承故障诊断中的显著优势,许多研究人员基于它提出了改进的网络架构,以实现更高效和准确的故障识别和分析[7]、[8]。此外,注意力机制也被引入到轴承状态监测中。这些机制使网络能够关注更具代表性的故障敏感特征,从而显著提高它们提取和表示关键信息的能力[8]。例如,注意力机制被结合到CNN-RNN混合架构中,其中CNN和循环单元共同建模局部特征和时间依赖性,注意力模块自适应地强调与故障相关的表示,以提高特征区分度[9]。深度学习和注意力机制被广泛认为是复杂感知任务的关键发展方向,这一观点在感知相关研究中得到了越来越多的体现[10]、[11]。
尽管深度学习在轴承故障诊断方面取得了显著突破[12]、[13],但仍存在几个关键挑战[12]、[13]。其中一个关键挑战在于模型的泛化能力和有效性。具体来说,现有的深度学习模型在干净或预处理过的数据上表现良好,通常能够达到90%以上的准确率。然而,当实际信号中存在强噪声时,它们的性能会显著下降,这对它们在实际工业场景中的可靠性构成了严重挑战。
一种创新的二次神经元方法[14],受到神经多样性的启发,用紧凑的二次函数结构替换了传统的线性内积。理论和实验研究都表明,二次神经网络在特征提取方面具有更强的表达能力[14]、[15]、[16]。利用这一优势,二次神经网络在噪声条件下表现出更强的抗噪能力,在轴承故障诊断中发挥着关键作用。
尽管可以从振动信号中直接提取与故障相关的特征,但这些特征通常对早期缺陷不敏感。因此,仅依赖这些特征可能无法反映轴承的真实健康状况,从而导致诊断和预测的不准确。
特征融合是一种广泛采用的策略,用于提高复杂环境中的感知性能,并已广泛应用于现代神经网络架构中。它不仅用于多传感器融合场景,也用于同一信号的多域表示融合[17]。例如,特征金字塔网络(FPN)[18]和U-Net[19]使用长距离跳跃连接结合了低级和高级特征。这种策略在保留高分辨率空间信息的同时丰富了语义内容,这对于语义分割和物体检测等任务至关重要。受此概念的启发,轴承故障诊断可以从时域和频域表示的整合中受益,使用基于Transformer的编码器和跨注意力机制来建模长距离依赖性并加强跨域特征交互[20]。这增强了轴承状态信息的表示丰富性,从而提高了故障诊断和预测的准确性。
尽管现有的1D-CNN和双通道CNN-Attention模型在受控实验环境中表现良好,但在强背景噪声存在的情况下,它们的准确性会显著下降。这限制了它们在实际工业应用中的适用性。传统的卷积核基于线性内积,因此难以捕捉故障信号中嵌入的高阶相关性。在受到不确定干扰的信号处理问题中,通常通过抑制或补偿主导误差源来提高鲁棒性[21]。尽管二次神经元提高了模型的表达能力和噪声抑制能力,但它们与时频特征融合机制的交互作用仍需进一步探索。当前的特征融合策略主要限于简单的连接或基于通道的加权,未能建立时域振动序列和频域表示之间的对比驱动增强。因此,模型对早期和弱故障仍然不敏感。为了解决这些限制,本文提出了一种轴承动态跨域特征融合方法。本研究的主要贡献如下:
(1) 本文提出了一种基于二次CNN和对比驱动特征聚合(QConvCDFA)的跨域故障检测模型。该模型使用参数逐渐增加的二次CNN提取特征,同时自适应地抑制噪声。此外,CDFA模块用于逐步整合局部和全局特征,从而提高诊断的可靠性和稳定性。
(2) 时域和频域信号分别输入到两个带有可学习相对位置编码和多头自注意力的Transformer编码器层中。这种架构不仅有效捕获了长距离依赖性,还强调了与故障相关的特征,同时减少了无关背景噪声的干扰。
(3) 提出了一种动态CDFA机制,能够同时捕获时域和频域的高分辨率浅层特征和深层全局表示,实现有效的跨域和跨层特征整合。
(4) 在四个轴承数据集——济南大学、沈阳工程学院、西安交通大学和北京土木工程与建筑大学——上进行的实验表明,即使在噪声条件下,所提出的方法也显著提高了诊断准确性和鲁棒性。
本文的其余部分组织如下:第2节提供了关于二次神经网络和跨注意力机制的背景信息。第3节详细描述了所提出的方法。第4节在三个公共数据集和一个私有数据集上对模型进行了实验验证。最后,第5节总结了本文。

小节片段

二次神经网络

近年来,深度学习的持续进步为新的方法论基础提供了支持。这些发展使得将多项式运算符集成到全连接和卷积神经网络成为可能。将多项式运算融入神经网络的方法通常可以分为两类:多项式结构和多项式神经元。多项式结构通过递归执行多项式展开来构建神经网络

方法论

旋转机械中的轴承故障会引起宽带脉冲加速度响应,从而改变获取的振动信号的统计分布特性。理论上,通过快速傅里叶变换(FFT)获得的频域表示能更有效地揭示与固有频率相关的故障特征。因此,频域特征在诊断旋转机械故障中起着重要作用。

准备工作

为了评估QConvCDFA模型在复杂条件下的噪声鲁棒性,向原始数据中添加了不同信噪比水平的高斯白噪声。这一程序评估了各种方法在噪声环境中的鲁棒性,并验证了所提模型在这些条件下的故障分类准确性。信噪比(SNR)定义如下:
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号