DEFINED:一种用于少样本类增量故障诊断的数据-知识协同框架

《Knowledge-Based Systems》:DEFINED: A Data-Knowledge Synergistic Framework for Few-Shot Class-Incremental Fault Diagnosis

【字体: 时间:2026年05月10日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  陈晨|肖胜思|王兆强|张泽明|胡长华 中国人民解放军火箭工程大学智能控制实验室,西安710025,中国 **摘要** 在复杂的运行环境中,机械系统可能会不断产生新的故障类型,而这些新出现故障的数据却非常稀缺。诊断模型必须快速学习这些新的、稀缺的故障类型,同时保持对现

  陈晨|肖胜思|王兆强|张泽明|胡长华
中国人民解放军火箭工程大学智能控制实验室,西安710025,中国

**摘要**
在复杂的运行环境中,机械系统可能会不断产生新的故障类型,而这些新出现故障的数据却非常稀缺。诊断模型必须快速学习这些新的、稀缺的故障类型,同时保持对现有故障的诊断能力,这使得开发一个稳定的诊断框架变得具有挑战性。基于类递增学习的诊断方法在新故障的表示上存在偏差,导致灾难性遗忘。此外,新出现故障数据的稀缺性还会导致过拟合,从而加剧灾难性遗忘。这些挑战正式被称为少样本类递增故障诊断(FS-CIFD),要求模型在数据有限的情况下,既要保留先前获得的诊断能力,又要不断适应新的故障类型。为了解决这个问题,我们提出了数据-知识协同框架(DEFINED),该框架将先验知识融入诊断过程中,有效地补充了稀缺样本的故障特征,并指导模型学习泛化表示。具体来说,我们提出了数据-知识协同校准模块,利用先验知识指导注意力机制纠正对新故障的表示偏差,从而减轻灾难性遗忘。此外,我们还构建了动态知识引导的伪递增任务,在新旧故障类型之间创建了一个更加泛化的表示空间。这使模型能够将其诊断能力扩展到未来的故障类型,从而减轻过拟合。DEFINED有效应对了FS-CIFD任务中的过拟合和灾难性遗忘挑战。在三个不同的数据集上的增量实验表明,其性能优于现有方法,即使在连续变化的运行条件下,准确率也能达到87.86%,比同类方法高出至少4.37%。

**引言**
由于长时间的运行周期和恶劣的工作环境,旋转机械容易出现故障,这些故障通常由累积的磨损和疲劳引起。这将导致整个设备的停机,甚至可能引起安全事故和重大经济损失[1]。因此,对旋转机械进行准确和高效的监测与故障诊断对于提高设备的运行可靠性和维护经济性具有重要意义[2,3]。近年来,深度学习(DL)在机械设备的预测与健康管理(PHM)领域取得了巨大成功,尤其是在智能故障诊断方面[[4], [5], [6]]。

目前,大多数基于DL的智能诊断方法遵循构建静态数据集进行模型训练的范式,即在训练阶段所有故障类型都已可用[5]。在实际的工业场景中,机械系统可能会不断产生新的故障类型,这带来了增量故障类型的挑战,并且很难提前收集所有潜在故障类型的数据[7]。当出现新的故障类型时,原有的诊断模型就不再有效,需要用新的故障数据来更新。然而,仅用新的故障数据训练模型可能会导致之前学到的故障类型的表现下降,这种现象通常被称为灾难性遗忘[8]。用之前遇到的所有故障类型的数据重新训练模型可以有效避免灾难性遗忘。然而,由于内存和隐私限制,获取所有先前发生的故障类型的数据往往是不现实的,而且重新训练既耗时又计算成本高昂。因此,理想的模型必须能够在保持识别先前发生故障的能力的同时,快速适应新的故障类型。这一要求被称为增量学习(IL),也称为持续学习,涉及稳定性与可塑性之间的困境[9],即获取新类别与保留旧类别之间的权衡。因此,开发支持IL并有效缓解稳定性与可塑性困境的增量智能诊断模型至关重要。

近年来,类递增学习(CIL)作为一种应对增量故障类型挑战的有希望的方法出现了。陈等人[8]设计了一个结合动态和稳定块的增量故障诊断框架。李等人[10]引入了增量对比学习来提取与轴承同质性和类间差异相关的特征,从而将故障诊断从单类扩展到多类故障模式。徐等人[11]开发了一个由全局和多尺度局部因果特征引导的因果广泛学习模型,用于增量机械故障诊断。该模型具有增量学习能力,通过扩展或调整原始权重来自我更新。何等人[12]提出了一种基于特征提升的持续学习方法,用于轴承故障诊断,其中新模块动态扩展以适应初始诊断模型输出与实际标签之间的残差。

上述方法在增量故障诊断方面取得了显著进展。然而,稳定性与可塑性困境仍未得到充分解决。具体来说,存在两个关键挑战:首先,现有方法通常假设初始阶段和增量阶段的数据都足够丰富。然而,在旋转机械的大部分使用寿命中,它们处于健康状态。当故障发生时,往往会导致紧急停机,从而导致故障数据的稀缺。这种稀缺性会导致过拟合,使得模型难以有效推断新的故障类别,从而降低整体性能。其次,在增量添加故障类型的过程中会发生灾难性遗忘,特别是对于样本数量有限的故障类型。总体而言,灾难性遗忘和过拟合是少样本类递增故障诊断(FS-CIFD)的两个核心挑战,这项任务要求模型在数据有限的情况下,平衡保留先前获得的诊断能力和不断适应新的故障类型。

因此,解决FS-CIFD问题并开发一个稳健的终身故障诊断模型至关重要。故障样本的稀缺性使得基于重放的类递增方法不再适用。为了解决这一挑战,胡等人[13]引入了一种特征扩展和重建方法。该方法采用模块化和可扩展的特征提取器,以实现新故障模式的连续表示学习。张等人[14]将多级知识蒸馏和紧凑-均匀-稀疏复合损失集成到原型网络中,以减轻灾难性遗忘和过拟合。何等人[15]使用连续卷积神经网络作为骨干模型,并引入了聚类损失以初始分类数据,同时实施记忆重放和蒸馏损失方法来减轻灾难性遗忘。遗憾的是,这些方法主要从数据角度解决FS-CIFD问题,灾难性遗忘和过拟合的问题尚未得到完全解决。有限的数据严重限制了模型学习新故障类别的能力,导致表示偏差,进而加剧了灾难性遗忘。此外,新故障类型引发的过拟合进一步恶化了灾难性遗忘。更重要的是,它们缺乏将领域先验知识融入诊断框架的能力——这在FS-CIFD任务中是一个重要限制,因为先验知识对于增强模型表示旋转机械故障的能力至关重要。

受到可解释AI(XAI)方法在工业智能诊断中成功应用的启发[16],信号处理中的先验知识在增强故障诊断模型方面起着关键作用[11,17,18]。为了解决FS-CIFD中的灾难性遗忘和过拟合问题,我们提出了数据-知识协同框架(DEFINED)。该框架结合了机械诊断中常用的信号统计知识,为有限数据提供补充的故障特征,指导模型学习泛化表示,从而在少样本类递增场景下提高故障诊断性能。DEFINED由两个主要组件组成。第一个是数据-知识协同校准模块(DKSCM),它利用先验知识校准少样本新故障的表示偏差并减轻灾难性遗忘。第二个是知识引导的伪递增学习范式,它提高了新任务的泛化能力并降低了过拟合的风险。通过这两个组件的协同作用,DEFINED有效应对了FS-CIFD任务中的过拟合和灾难性遗忘挑战,为模型应对未来的故障类型做好准备,并在遇到先前故障时保持稳健的诊断性能。

**我们的贡献总结如下:**
(1) 我们提出了一个用于FS-CIFD任务的新DEFINED框架,在诊断过程中利用信号统计知识。这种先验知识的整合补充了故障特征与领域专业知识,纠正了表示偏差,指导模型学习泛化表示,成功地解决了过拟合和灾难性遗忘的挑战,从而在样本稀缺的情况下实现了有效的类递增故障诊断。
(2) 为了解决新故障类型添加导致的表示偏差,我们开发了数据-知识协同校准模块DKSCM。与现有的校准方法不同,DKSCM利用知识提示持续指导注意力机制,重新校准新添加和先前学到的故障类型的表示。这使得模型能够学习更具辨别力的分类器,有效减轻灾难性遗忘。
(3) 为了提前为未来的故障类型做准备,我们引入了一种动态知识引导的伪递增学习范式。通过从现有数据构建伪递增诊断任务并将领域知识嵌入学习过程中,这种范式提高了模型对增量故障的适应能力,同时最小化了过拟合的风险。

本文的结构如下:第2节回顾了与FS-CIFD相关的研究现状。第3节详细介绍了提出的DEFINED的细节。第4节描述了实验设置并展示了验证和讨论结果。最后,第5节总结了本文。

**相关工作**
为了将本研究置于背景中,本节回顾了与FS-CIFD相关的工作,包括少样本学习(FSL)、类递增学习(CIL)和少样本类递增学习(FSCIL)。

**FS-CIFD任务的数据-知识协同框架**
第3.1节介绍了FS-CIFD任务的范式。第3.2节详细介绍了提出的数据-知识协同校准模块(DKSCM),该模块旨在校准新故障类别引入的偏差。第3.3节展示了如何构建伪递增任务,以帮助模型学习更通用的表示空间,从而适应新的故障类型。

**案例研究**
在本节中,我们首先介绍了三个不同的实验数据集,以及比较方法和实验细节,然后展示了实验结果——包括在不同数据集上的表现、在连续变化运行条件下的表现、知识敏感性分析和效率分析。

**结论**
本文提出了一个新颖的少样本类递增故障诊断框架DEFINED,用于解决轴承故障诊断中少样本故障类型的挑战。与经常面临灾难性遗忘和过拟合的现有增量故障诊断方法不同,所提出的DEFINED从稀缺样本中提取知识提示,并将其集成到校准学习过程中。这有效扩展了模型的泛化能力。

**未引用的参考文献**
[46]CRediT作者贡献声明
陈晨:撰写——原始草案、验证、项目管理、方法论、调查、形式分析、数据管理、概念化。
肖胜思:撰写——审阅与编辑、方法论、资金获取。
王兆强:撰写——审阅与编辑、验证、方法论。
张泽明:撰写——审阅与编辑、方法论、调查、概念化。
胡长华:撰写——审阅与编辑、验证、方法论、资金获取、数据管理。

**利益冲突声明**
作者声明他们没有已知的竞争性财务利益或个人关系,这些因素可能影响本文报告的工作。

**致谢**
本文的工作得到了中国国家重点研发计划(2024YFB3311204)、国家自然科学基金(编号62227814、62233017、62103433)以及陕西省“三名人才”计划(编号52205040)的支持。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号