核能是一种利用反应堆中的核能发电的显著能源。它已成为许多国家重要的电力供应来源,约占全球电力生产的20%[1]。然而,核能存在固有的风险和争议。值得注意的是,核事故可能对环境造成毁灭性破坏。近年来核能使用的增加引发了对其安全性的日益关注,尤其是与核泄漏相关的潜在危险[2]。
核主泵是百万千瓦核电站冷却系统中最重要的组件之一[3]。核主泵位于反应堆和蒸汽发生器之间,其功能是循环冷却剂,将热量从反应堆传递到蒸发器。该泵的任何异常泄漏都可能扰乱核电站设备的正常运行,并可能导致严重的核事故。
为了解决这个问题,研究人员一直在探索准确可靠的核电站密封件故障检测方法[4]。常用的技术包括流量补充、流量收集、压力衰减、肥皂泡和水泡泄漏检测、超声波泄漏检测、示踪剂泄漏检测、真空增压泄漏检测以及各种无损检测方法。然而,这些方法通常依赖专业检查员定期对核心密封件进行检测[5]。因此,这些方法耗时、劳动密集,并且无法提供实时监控,导致运营成本高昂。此外,缺乏监控的时期可能会增加泄漏和潜在灾难性事故的风险。因此,需要开发一种不需要完全依赖人类专业知识的连续监控方法。
深度学习是一种从大型数据集中挖掘有价值特征的成功范式,可以替代专家的经验,其在分类[6]、预测[7]和回归[8]等各种任务中的有效性已经得到证明。然而,当标记样本数量有限时,传统深度学习方法的性能会显著下降[9],[10]。在实际应用中,由于时间和成本的限制,获取大量标注数据可能面临挑战[11],[12]。此外,对于一些可能引发严重安全事故的故障,无法进行此类错误过程来收集故障数据[13]。因此,必须关注核电站密封件实际在线监控中零样本所带来的挑战。
最近,零样本学习(ZSL)因其解决零样本识别任务的前景而受到广泛关注[14]。ZSL依赖于辅助信息,包括属性[15]、语义表示[16]和知识图谱[17],将已知类别的知识转移到未见类别。例如,Lampert等人利用关于标记动物的“颜色”和“形状”属性的知识转移来对新动物进行分类,这被称为直接属性预测(DAP)[15]。Lampert等人还提出了间接属性预测(IAP)方法[18],该方法利用标签来学习属性。Romera-Paredes等人提出了一种简单的ZSL方法(ESZSL),在样本空间和标签空间之间添加了一个属性空间,并在属性空间和特征空间之间创建了一个新的映射来构建损失函数[19]。这些都是经典的基于属性的ZSL方法。此外,一些研究使用生成对抗网络(GAN)来辅助ZSL。例如,Narayan等人设计的TF-VAEGAN引入了一个回归器,希望增强生成的视觉特征[20]。如今,ZSL也被应用于工业信号处理。Feng等人利用故障描述作为辅助知识源,并应用从训练故障到目标故障的属性迁移,实现了工业故障的零样本诊断[21]。Hu等人提出了SCE,设计了一个Barlow矩阵以获得语义一致的空间[22]。通过从现有标记样本中学习相关辅助信息,ZSL可以预测训练时不可用的类别。然而,仅利用辅助信息来捕捉类别相关性具有相当大的挑战性。
目前,ZSL主要应用于图像分类任务。大多数方法旨在学习从视觉特征空间到语义特征空间,或从联合视觉和语义特征空间到共同对齐空间的映射。然而,这些方法(称为归纳ZSL(IZSL)并未充分利用未见样本的视觉和语义信息[23]。在核电站密封和其他组件故障场景中,有时会收集与关键安全事件相关的信号。由于这些故障的严重性以及通过实验方法获取故障信号的挑战,它们很难被准确诊断。以前的研究大多使用IZSL来诊断此类故障。但这种方法无法充分利用未标记的故障样本,导致分类时出现显著的领域偏移问题。最近,一些研究尝试使用半监督学习方法来解决这个问题[24]。对于ZSL,迁移零样本学习(TZSL)被认为是一种利用未标记数据特征来解决领域偏移问题的方法[23]。这种方法可以在训练期间学习未标记数据的分布特征,显著减轻领域偏移问题,从而便于对未标记数据进行分类。例如,Xian等人应用了一个编码器来捕获GAN的未见分布,称为f-VAEGAN[25]。Bo等人设计了STHS-WGAN,通过迭代使容易区分的未见类别参与GAN的训练,以改善未见样本的生成[26]。Wang等人提出了一个名为Bi-VAEGAN的模型[27]。它扩展了TF-VAEGAN[20]的想法,探索了其回归器中的未见数据信息。这些基于GAN的方法旨在训练生成器以生成未见样本。尽管这些GAN确实提高了最大分类准确率,但分类准确率存在较大波动。由于核能的高风险,确保检测泄漏的监控方法既准确又稳定至关重要。因此,这些方法不适合实际场景。
与图像不同,工业故障信号通常是复杂的时间域数据,其中关键信息通常嵌入在长序列中的特定时间段或频率内。人们认为,多层卷积提取的相关信息容易被忽略,但注意力模块常用于计算数据中不同位置之间的相关性[28]。因此,引入注意力机制可以帮助GAN专注于学习这些关键特征,如突变、异常或特定频谱范围内的信号。对于零样本故障诊断,这种方法可以提高合成故障信号的准确性和可解释性。然而,当注意力机制仅关注特征空间而不强制与语义属性保持一致时,零样本故障诊断中经常会发生领域偏移。因此,我们提出了一种双注意力引导的GAN(DAGAN)来解决核电站密封件的迁移零样本故障诊断问题。该方法利用构建的核电站主泵轴静态环的故障语义描述来构建属性空间,并利用振动信号样本来构建特征空间。然后使用双注意力机制训练生成器,以增强未见样本的生成。在训练过程中,将已见样本和未见样本分别输入模型,以便生成器生成更优质的未见样本。最后,我们使用生成的样本训练一个预测模型来对未见样本进行分类。
本文的主要贡献总结如下。
1.提出了一种新的TZSL方法,以减轻领域偏移并提高零样本故障诊断的分类准确性和稳定性。
2.我们提出了一种两阶段训练方法,首先使用已见数据训练生成模块和验证模块,然后利用Wasserstein距离构建损失函数来捕获未见分布,以减少领域偏移的影响。
3.提出了一种双注意力机制,同时关注属性空间和特征空间。这种设计旨在有效增强这两个空间之间的对齐,从而提高我们提出的DAGAN的训练稳定性。注意力机制提高了特征生成的可靠性,而在属性空间中构建损失函数间接提高了特征生成的准确性。
文章的其余部分结构如下。第2节介绍了基于GAN的ZSL理论。第3节详细阐述了所提出的方法。随后,第4节介绍了实验设置和结果分析。最后,第5节对整个工作进行了全面总结。