《Sensors and Actuators A: Physical》:Improved GCN with zero-shot learning for rolling bearing fault diagnosis
编辑推荐:
针对工业机械复杂工况下故障样本稀缺问题,本文提出融合深度自适应卷积神经网络(DACNN)与图卷积网络(GCN)的零样本故障诊断模型(GZSL)。通过标签平滑正则化优化损失函数,结合故障属性迁移机制实现未知类别的诊断,有效提升模型泛化能力。
Jinhua Wang|Wenbao Cao|Jie Cao|Yanhong Ma
兰州工业大学电气工程与信息工程学院,中国兰州730050
摘要
在实际工业机械的复杂运行环境中,波动的工作条件不仅导致故障数据稀缺,而且常常无法获得可用的样本,这影响了诊断的准确性和泛化能力。我们提出了一种方法,通过添加零样本学习(Zero-Shot Learning, GZSL)功能来增强图卷积网络(GCN)。首先,使用深度自适应卷积神经网络(DACNN)提取不同故障类型的特征。然后将这些特征输入到通过残差连接在一起的GCN中。此外,我们还引入了标签平滑(Label Smoothing, LS)正则化来改进原始损失函数。训练一个故障属性学习器来理解各种属性之间的关系。对于未知的故障类别,我们将其传递到故障属性层,在那里预测未知故障的属性,从而便于对这些未知类别进行诊断。
引言
状态监测和故障诊断对于旋转机械的正常和安全运行至关重要。滚动轴承作为工业机械的关键部件,在面对高负荷和高冲击力等恶劣工作条件时,极易发生故障。因此,轴承故障诊断和提前预测对于确保设备和人员的安全至关重要[1]。
近年来,随着大数据技术和人工智能的快速发展,基于数据驱动的故障诊断方法及其自动化推理成为研究热点[2],[3]。作为数据驱动故障诊断方法的典型代表,基于深度学习的深度学习(DL)模型因其强大的特征提取和非线性建模能力而在故障诊断领域受到了越来越多的关注[4],[5],[6]。然而,获得高质量模型需要丰富的标记样本数据集。但在实际工业环境中,收集足够的标记样本非常困难,这导致诊断模型的训练效果不佳,泛化能力较弱。
受图信号处理中卷积滤波定义的启发,近年来发展出了基于图卷积操作的图神经网络(GNN)理论。GNN[7]是一种结合深度学习和图建模的方法,已广泛应用于通信、生命科学、经济和金融等多个领域[8],因为它能够揭示深层拓扑信息。与CNN相比,GNN不仅扩展了输入信息,还减少了数据需求,因此在工业中更适用于解决数据收集困难和高标签收集成本的问题。目前,故障诊断领域通常使用监督学习或半监督学习,这需要足够的标记数据或少量未标记的训练数据。然而,在现实世界中,由于工作条件和生产环境的复杂性,故障数据收集非常困难,尤其是未知类别的故障和新兴故障往往难以捕捉和收集,从而增加了诊断的难度和复杂性。受迁移学习的启发,与监督学习不同,即使没有足够的标记样本,也可以有效识别和诊断未知类别。Palatucci和Hinton等人在2009年首次提出了零样本学习(Zero-Shot Learning, GZSL)概念,即在模型学习过程中训练集和测试集之间没有交集。在GZSL中,样本被分为可见类别和不可见类别,模型通过已知类别的样本进行训练,用于识别之前训练阶段未出现的类别[10]。为了更好地识别测试阶段的未知类别,零样本学习方法不仅从已知和未知类别的样本中学习判别特征,还通过语义属性建立它们之间的关系。Gao等人[11]将零样本学习应用于未知工作负载下的故障诊断,其中训练集和测试集具有相同的故障类别,但数据分布不同。然而,在样本稀缺或缺乏标记样本的情况下研究高精度轴承故障诊断具有挑战性。Xu等人[12]提出了一种用于轴承的零样本学习复合故障诊断模型,并设计了一种编码方法来表示单个故障和复合故障的语义。Xing等人[13]提出了一种针对机器未见过的复合故障的零样本智能诊断方法,即使在只有单个故障数据可用的情况下也能进行诊断。Fan等人[14]提出了基于属性融合的零样本故障诊断方法,该方法结合了贝叶斯故障属性迁移和多高斯假设下的属性迁移,以提高属性迁移能力。Lu等人[15]利用集成经验模态分解自动从振动信号中提取统计属性,并使用时间和频率域中的统计描述通过最大后验概率预测未见类别。然而,为了确保属性的准确性,手动构建和定义故障属性不仅需要更深入的知识,而且耗时较长,同时难以学习属性之间的相关性。其次,故障样本特征提取需要大量的先验知识作为辅助,提取信息的冗余会导致有效信息的部分丢失。
针对上述问题,结合零样本学习(ZSL)的思想,提出了一种结合DACNN网络和改进的图卷积神经网络的零样本故障诊断模型。该模型首先训练已知类别的故障以获取属性学习层,然后通过未知类别的样本迁移到故障属性层,最后通过余弦距离计算与故障类别的映射关系来实现故障诊断。其主要贡献如下:
- (1)
DACNN网络用于提取特征,通过注意力机制动态调整和捕获关键信息,并自动提取故障特征的丰富类别信息和灵活维度下的故障语义,以辅助故障诊断的特征学习过程。
- (2)
将图卷积神经网络与基于残差学习和非线性激活函数的零样本学习相结合,与传统仅依赖样本空间和类别空间的零样本学习方法不同,这种方法引入了属性空间,减少了传统零样本学习中对未知类别辅助信息的依赖。具体框架如图1所示。
- (3)
标签平滑正则化(Label Smoothing Regularization, LS)技术用于改进原始损失函数,使模型能够更好地适应不同工作条件下的数据,减少对已知类别的过度依赖,提高模型对未知故障数据的适应能力,从而提高模型的泛化能力。
章节片段
图卷积神经网络
图卷积网络(GCN)的基本理论最初由Kipf等人提出[16],目前大多数图卷积层都具有共同的框架,因为其滤波器参数可以在图结构的所有位置共享。对于网络中的图卷积层,目标是在图结构的数据上学习一个特征函数
零样本学习
零样本学习是小样本学习的一个分支,旨在解决传统机器学习模型无法识别未见类别的问题,即对模型未直接观察或训练过的类别或任务进行推理或预测[17]。在传统深度学习中,模型通常需要在训练期间接触所有可能的类别或任务以理解它们的特征和关系。然而,在零样本学习中,模型可以在没有这些信息的情况下进行学习
相关算法过程
本小节重点介绍故障诊断的每个步骤的细节,诊断步骤主要分为数据预处理、构建GCN模型和故障诊断。
实验验证
为了验证本文提出的方法,使用CWRU-bearing数据集[26]来验证零样本条件下的故障诊断性能。
结论
本文针对在可变工作条件下收集故障样本的挑战,提出了一种基于属性关联的故障诊断模型,该模型通过结合零样本学习方法成功将属性信息嵌入故障样本空间和类别空间,实现了已知类别故障属性向未知类别的迁移,从而实现了准确的故障诊断
CRediT作者贡献声明
Yanhong Ma:可视化、监督。Jinhua Wang:可视化、监督、数据整理、概念化。Jie Cao:可视化、监督、方法论。Wenbao Cao:写作——审稿与编辑、撰写——初稿、监督、软件、资源、调查、形式分析、数据整理。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文的研究工作。
Wang Jinhua是兰州工业大学电气工程与信息工程学院的教授,她的研究兴趣包括深度学习、工业应用的机器学习、预测性维护和故障诊断。