利用量子启发式的LSTM-Transformer框架进行风力涡轮机状态监测

《Energy Conversion and Management-X》：Wind turbine condition monitoring using a quantum-inspired LSTM-Transformer framework

【字体：大中小】 时间：2026年05月10日 来源：Energy Conversion and Management-X 7.6

编辑推荐：

　　张哲峰|韩星星|徐昌|马先东兰卡斯特大学工程学院，兰卡斯特，LA1 4YW，英国 **摘要** 状态监测和故障诊断在检测风力发电转换和生成系统中的早期问题方面发挥着关键作用，从而确保了系统的高效和可靠运行。本研究提出了一种新的状态监测框架，该框架将量子长短期记忆（

　　张哲峰|韩星星|徐昌|马先东
兰卡斯特大学工程学院，兰卡斯特，LA1 4YW，英国

**摘要**
状态监测和故障诊断在检测风力发电转换和生成系统中的早期问题方面发挥着关键作用，从而确保了系统的高效和可靠运行。本研究提出了一种新的状态监测框架，该框架将量子长短期记忆（QLSTM）网络与Transformer模型相结合，以实现强大的故障检测能力。与在欧几里得空间中运行的传统机器学习方法不同，基于变分量子电路的量子机器学习能够捕捉希尔伯特空间中变量之间的高阶交互，从而无需过多参数化即可明确地对复杂耦合进行建模。该框架还建立了选定输入变量与所需量子比特之间的关系，以优化量子模型架构。为了提高检测灵敏度，开发了一种基于贝叶斯推断的动态阈值方法和滑动窗口（BISW）机制，以适应残差中的短期变化和长期趋势。使用包含代表性风力涡轮机故障的实际SCADA数据对框架进行了验证，这些故障包括齿轮箱轴承、发电机绕组和俯仰控制系统故障。实验结果表明，所提出的QLSTM-Transformer-BISW模型在准确率上超过了基准方法，并分别在涡轮机停机前123.83小时、77.5小时和122.67小时成功检测到了故障，且未产生误报。这些发现表明，所提出的框架为智能可再生能源系统提供了量子机器学习的新范式。

**1. 引言**
故障检测（FD）在风力涡轮机（WTs）的状态监测（CM）中起着关键作用，能够及早识别异常行为，减少计划外停机时间，并提高维护效率[1]。随着运营监测数据的日益丰富，机器学习（ML）已成为WTs故障检测的关键方法。ML方法通常分为监督学习、无监督学习和强化学习。监督学习依赖于大量高质量标记样本来构建输入数据与其对应故障类型之间的映射模型。例如，[2]采用支持向量机（SVM）和对称谱特征来诊断齿轮箱中的齿轮裂纹故障，而[3]使用随机森林（RF）来识别WTs中的电气故障。类似地，[4]基于振动的时间和频率域特征训练RF分类器，实现了WT齿轮箱的高精度多类故障严重程度分类。作为ML的一个子集，深度学习进一步增强了非线性建模和自动特征提取能力。其中，卷积神经网络（CNNs）和循环神经网络在处理复杂WT数据方面表现出色。[5]提出了一种结合压缩感知的深度迁移学习CNN，用于检测WTs中的轴承和齿轮故障，准确率达到97.7%。[6]使用长短期记忆（LSTM）网络对多源传感器数据进行故障检测，准确率达到99.8%。然而，监督方法严重依赖于大量标记数据，而这些数据在现实世界的风电场操作中往往稀缺、不平衡且获取成本高昂。

为了减少对大量标记数据的依赖，许多半监督方法被提出并应用于WT故障检测，这些方法将少量标记样本与大量未标记样本结合起来。例如，[7]使用自动编码器（AE）和Transformer从正常运行数据中提取特征，并设计了一个带有对抗损失训练的半监督判别器，以有效利用标记和未标记数据。然而，当标记数据不平衡时，半监督方法可能会变得不稳定。[8]使用生成对抗网络生成代表性不足类的合成样本。[9]采用合成少数类过采样技术来平衡数据类别分布，而[10]使用仅需要少量故障样本的正样本-未标记学习框架。尽管如此，这些方法大多依赖于对样本质量或标签生成机制的强假设，其在复杂操作条件下的泛化能力可能会下降。

无监督学习不需要标记数据，特别适用于故障注释不足的WT场景。正常行为建模（NBM）是最广泛使用的方法之一，它可以在健康条件下学习系统的预期行为，并检测异常偏差。NBM的一个关键优势是可以使用已经在大多数商业风电场中可用的监控控制和数据采集（SCADA）数据来实现。例如，[11]提出了一种基于信息器的NBM进行传动系统监测，并通过双变量残差融合与信息器框架（DVI）构建了条件评估指标，实现了敏感的早期预警。类似地，[12]开发了一种基于Transformer的模型，结合统计动态阈值（TSDT），用于在变速条件下监测主轴承，实现了无误报的早期故障检测。在[13]中，使用LSTM基于SCADA数据建模正常模式，然后引入Kullback–Leibler散度来计算动态阈值进行故障检测。与静态阈值相比，动态阈值可以更好地适应数据分布和时间行为的変化，从而提高检测性能。除了阈值优化外，集成学习还可以通过提高NBM的准确性来进一步增强故障检测，例如，[14]开发了一种基于装袋的回归集成算法用于SCADA基 Gearbox温度预测，改进的预测准确性使得基于残差的故障检测更加可靠。尽管基于无监督ML的故障检测方法可以实现高准确率，但其模型的日益复杂性通常会导致性能提升有限，并且在处理大规模、高维和复杂数据集时计算成本较高。

强化学习（RL）通过与环境交互并接收反馈来学习最优决策策略[15]。在故障检测任务中，代理根据系统状态选择检测动作，并根据检测性能获得奖励。例如，[16]将旋转机械中的故障检测任务形式化为一个端到端任务，使用RL技术，结合堆叠AE和深度Q网络代理，在滚珠轴承测试集上实现了94.08%的准确率。然而，由于WT应用中真实故障样本的稀缺性，RL在训练期间经常面临奖励稀疏和收敛不稳定的问题。因此，关于WT故障检测的RL研究仍然有限。

量子机器学习（QML）利用量子计算原理，可以在相同的模型结构下比传统ML（CML）提高模型学习能力并实现更优异的性能[17]。例如，在金融领域，[18]使用量子神经网络（QNN）进行信用风险预测，评估中小企业的贷款违约可能性。在自然语言处理中，量子LSTM（QLSTM）已应用于社交媒体平台上的多语言词性标注，准确率高于传统LSTM模型[19]。在能源领域，QML应用包括使用量子SVM分类海上能源设备的环境影响[20]，以及将QNN与深度强化学习结合进行最优电网控制以减少碳排放[21]。在风能领域，量子遗传算法与最小二乘SVM结合使用，提高了齿轮箱故障检测的准确性[22]。一种结合QNN和深度神经网络（DNN）的混合方法在叶片故障检测中实现了比单独使用DNN高20%的准确率[23]。关于QML在WT CM中的潜在应用的全面综述可以在[24]中找到。尽管有这些进展，大多数现有的能源领域QML研究仍处于概念或算法层面，缺乏在真实工业系统上的系统验证。在WT CM的背景下，以前关于监督学习、半监督学习和无监督学习的研究主要集中在算法可行性或小规模故障案例上，没有提供集成的建模和检测框架。虽然这些研究经常报告在特定数据设置下的准确率改进，但它们很少探讨如何配置、优化和部署QML架构以用于实际CM任务。值得注意的是，基于传统DL架构的现有无监督方法在模型复杂性增加时显示出收益递减，因为它们在处理大规模、高度耦合的SCADA数据时的性能提升趋于饱和。因此，QML在实际WT故障检测中的潜在优势尚未得到系统证明。

为了克服这些限制，本研究提出了一个基于QML的无监督CM框架，该框架将QLSTM网络与Transformer结合，构建了一个混合NBM，并引入了基于贝叶斯推断和滑动窗口（BISW）的动态阈值机制，以实现自适应故障检测。这种设计增强了模型表示复杂多变量时间模式的能力，同时保持了计算效率，BISW方法为非平稳操作条件下的可靠故障检测提供了一种可解释的数据驱动策略。使用实际SCADA数据集的实验结果证明了所提方法的可行性和有效性，并为WT故障检测的QML配置提供了实际见解。本研究的主要贡献如下：
1. 据作者所知，这是首批探索将复杂的QML结构应用于WT故障检测的研究之一，展示了其在WT CM中的潜力。
2. 评估了输入变量对检测性能的影响，并建立了选定变量数量与所需量子比特数量之间的关系，为优化QML模型结构提供了实际见解。
3. 提出了一种混合NBM框架，将QLSTM和Transformer结合使用，有效捕获WT数据中变量之间的时间依赖性。
4. 提出了一种基于BISW的动态阈值方法，通过考虑残差中的短期变化和长期趋势来适应性地检测异常。此外，引入了识别真实故障并减少误报的标准。
5. 通过包含WT中代表性故障的实际SCADA数据的实验验证了该框架的有效性和鲁棒性。结果表明，我们的方法优于现有的最先进方法。

本文的其余部分组织如下：第2节提供背景知识，包括QML、QLSTM和Transformer的原理和特点。第3节描述了所提出的QLSTM-Transformer模型、故障阈值的确定以及整体框架。第4节展示了实验结果，包括通过最优选择量子比特数进行QML模型优化以及基于SCADA数据的比较分析。最后，第5节总结了研究的关键发现并概述了未来的研究方向。

**2. 初步知识**
2.1. 量子机器学习
QML结合了量子计算和CML的优势，旨在通过利用量子特性（如叠加、纠缠和并行性）来提高ML模型的性能[17]。借助量子计算的高效搜索和优化能力，QML在建模高维数据和捕捉复杂关系方面提供了理论改进[25]。这种整合不仅扩展了ML的应用范围，还为解决WT CM中的复杂任务（如故障检测）提供了一种新的范式。量子计算过程使用量子比特来存储信息。一个量子比特可以同时处于0和1的叠加态中，从而实现并行计算，显著加速了复杂问题（如搜索和优化）的解决[17]。类似于通过逻辑电路执行算法的经典计算机，量子计算的核心在于量子电路，后者通过应用一系列量子门（如Hadamard门和CNOT门）来操作量子状态[26]。为了使传统数据能够在量子计算中使用，采用了量子编码电路来处理传统数据。常见的量子编码方法包括幅度编码、角度编码和概率编码[27]。参数化量子电路（PQC）是QML的核心组件。PQC由这些带有可调参数的量子门组成，通过迭代优化来学习数据模式。PQC的架构类似于神经网络中的分层结构，其中每一层应用一系列具有可调参数的量子门来转换量子状态[28]。QML分为完全QML和量子增强ML[29]，前者完全依赖于量子电路（如量子生成对抗网络（QGAN）[30]，而后者则通过用量子电路替换CML的某些部分来工作。例如，在[31]中，量子深度强化学习中的输出动作计算由量子电路执行。由于当前硬件的限制，完全QML研究仍限于小规模数据集和模拟环境[29]，因此量子增强ML得到了更广泛的研究。

2.2.量子长短期记忆网络（QLSTM）通过用变分量子电路（VQCs）替换LSTM中的门计算来改进LSTM，这些VQCs是使用变分算法实现的光量子计算（PQC）[28]。图1展示了QLSTM的结构。每个VQC，记为VQCk，其中k（k = 1, 2, 3, 4, 5）代表LSTM中相应的门，它将之前的隐藏状态ht?1和当前输入xt的连接作为输入。遗忘门ft控制之前单元状态Ct?1的记忆保留，而输入门it决定了要纳入的新信息量。生成一个候选状态C?t来表示转换后的输入。这些信号共同更新单元状态Ct，然后通过输出门ot进一步过滤以产生新的隐藏状态ht。相应的操作在公式（1）-（6）中定义，其中C?t使用tanh函数缩放到（-1,1）范围内，⊙表示元素级操作。（1）ft=Sigmoid(VQC1([ht?1,xt]))（2）it=Sigmoid(VQC2([ht?1,xt]))（3）C?t=tanh(VQC3([ht?1,xt]))（4）Ct=ft⊙Ct?1+it⊙C?t（5）ot=Sigmoid(VQC4([ht?1,xt]))（6）ht=VQC5(ot⊙tanh(Ct)) 图2以一个4量子位的VQC为例进行了说明。该电路包括三个阶段：数据编码、PQC训练和测量，其中q0到q3表示电路中使用的四个量子位。下载：下载高分辨率图像（152KB）下载：下载全尺寸图像图1. QLSTM单元的结构。在数据编码阶段，每个量子位都被初始化为基态|0%，然后使用哈达玛门H转换为叠加态，并通过一对旋转门RY(xi)和RZ(xi)与SCADA输入xi进行编码。每个SCADA变量xi都被规范化并映射到特定的量子位qi上，变量值决定了编码层中对qi应用的旋转角度。得到的量子状态定义为（7）|ψencoded=∏i=1nRZ(xi)RY(xi)H|0。然后PQC层应用一系列CNOT门，记为Uentangle，以在各量子位之间引入纠缠，如图2中相邻量子位之间的蓝色加号连接所示。此操作之后是可训练的旋转RY(θi)，其中θi表示与第i个量子位相关的可训练参数。PQC的输出状态由（8）|ψpqc=∏i=1nRY(θi)Uentangle|ψencoded给出。最后，所有量子位都在计算基础上进行测量，产生形成电路传统输出的经典比特串结果，其中c0到c3分别代表对应于量子位q0到q3的测量结果。量子状态通过PQC演化到输出状态|ψpqc〉。在计算基础上测量时，状态坍缩为|?〉∈{|0〉,|1〉}?n之一。测量得到|?〉的概率由（9）P(|?〉)=|〈?|ψpqc〉|2给出，其中〈?|将最终状态投影到基态|?〉上。实际上，通过重复电路执行（射击）来从测量频率估计概率分布。对于分类任务，决策可以基于最可能的输出或归一化概率向量。对于时间建模，如本研究所示，我们计算测量分布的期望值以获得连续输出，然后将其传递给神经层进行故障检测（FD）。风电塔（WT）数据通常是多变量、非平稳且时间相关的，不同物理领域（包括热、机械、电和控制相关变量）之间存在内在耦合。因此，目标变量的时间演化不仅受到多个变量共同影响的控制，还受到它们之间相互作用的影响。这要求模型捕捉相关变量之间的耦合时间动态，而不仅仅是孤立的一对一关系。LSTM通过预定义的线性映射和逐点非线性来模拟这种依赖性。相比之下，QLSTM用在希尔伯特空间中运行的VQC替换了传统的门控过程，其中量子叠加增加了表示空间的维度，而量子纠缠增强了变量之间非线性关系的建模。因此，在相同的网络架构和超参数设置下，QLSTM比LSTM更适合建模WT数据中的耦合多变量动态。下载：下载高分辨率图像（237KB）下载：下载全尺寸图像图2. 以一个4量子位的VQC为例。（关于图中颜色参考的解释，请参阅本文的网页版本。）2.3. 变换器（Transformer）变换器是一种基于自注意力的序列建模网络架构，由编码器和解码器结构组成[32]。每层通常包含多头自注意力、前馈网络（FFN）、残差连接和层规范化。为了捕捉序列数据中的时间依赖性，引入了位置嵌入来提供关于令牌位置的信息[33]。然而，标准变换器在处理长序列和非平稳时间序列时可能效率低下，因为它们的计算成本高且适应时间动态的能力有限。为了克服这些限制，通过对变换器架构的关键组件进行修改提出了各种改进。Informer[34]通过引入针对长序列的稀疏自注意力机制来降低计算复杂性。在[35]中，使用门控循环单元替换变换器解码器以提高时间序列预测任务中的短期记忆建模。最近的努力集中在替换FFN上；例如[36]用堆叠的CNN模块替换了FFN，有效地捕捉了视觉表示中的局部空间依赖性。这些修改表明，变换器的模块化结构通过重新配置其子层允许灵活地适应特定领域的任务。3. 提出的方法3.1. 基于QLSTM的变换器图3展示了所提出的QLSTM-Transformer框架的整体架构，该模型采用序列到序列的结构，包括编码器和解码器。输入序列通过结构化的变量选择程序从SCADA数据构建。首先，通过单独训练每个候选变量并评估相应的决定系数R2来进行单变量消融实验。这提供了每个变量独立预测相关性的度量并产生初始排名。随后，通过逐步将排名靠前的变量纳入输入集来进行变量累积实验。这一步确定了平衡预测准确性和输入复杂性的特定场景变量子集。当框架应用于新的风力发电机、风电场或故障类型时，虽然具体的变量子集通常需要重新确定，但变量选择程序及其背后的物理原理保持不变。然后使用选定的变量构建模型数据集，其中SCADA数据被分割成重叠的滑动窗口，形成用于模型训练和验证的输入-输出对。每个窗口包含Tin个连续样本作为模型输入，以及随后的Tout个样本作为模型预测目标，其中Tin表示输入滑动窗口长度，Tout表示预测范围。每个窗口化的输入首先通过嵌入层进行转换，以使原始输入维度Cin与后续基于变换器的操作所需的统一模型维度dmodel对齐。设X=[x1,x2,…,xTin]?∈R^Tin×C^(in)表示多变量输入序列，Tin是输入窗口长度，C^(in)是选定的输入变量数量，xt∈R^(Cin)是时间步t的输入向量。值投影通过一个可学习的线性变换将每个xt映射到dmodel维的潜在表示：（10）etval=W^(emb)xt+b^(emb),t=1,2,…,Tin，其中W^(emb)∈R^(dmodel)×C^(in)是可学习的投影矩阵，b^(emb)∈R^(dmodel)是可学习的偏置向量，etval∈R^(dmodel)是时间步t的投影表示。参数W^(emb)和b^(emb)使用PyTorch中的默认初始化方案进行初始化。将所有投影向量堆叠得到值嵌入序列。（11）Eval=e^(1)val,e^(2)val,…,e^(Tin)val?∈R^(Tin)×dmodel。为了在维度对齐后保持时间顺序，在值嵌入中添加了固定的正弦位置编码（PE）。对于每个位置pos∈{1,2,…,Tin}和嵌入维度j∈{1,2,…,dmodel}，PE定义为（12）PE(pos,j)=sin(pos)/(10000j?1)^dmodel,j为奇数，cos(pos)/(10000j?2)^dmodel,j为偶数。等价地，使用半维度索引i∈{0,1,…,?dmodel/2??1}，编码可以写为（13）PE(pos,2i+1)=sin(pos)/(2^idmodel) （14）PE(pos,2i+2)=cos(pos)/(2^idmodel)。将所有位置的PE堆叠起来得到位置编码向量eposposer=∑(e^(1)pos,e^(2)pos,…,e^(Tin)pos)?∈R^(Tin)×dmodel。这种编码仅依赖于位置索引和嵌入维度，而在训练期间是固定的。最终的嵌入表示为（16）E=Eval+Eposer。这里，E∈R^(Tin)×dmodel是输入到编码器的最终输入嵌入序列，为后续的位置编码、自注意力和编码器处理提供了维度对齐的多变量输入表示，同时保留了时间顺序信息。编码器由多头自注意力层、通道注意力（CA）层和QLSTM单元组成。多头自注意力层首先捕获输入序列中不同时间步长之间的全局依赖性。然后应用通道注意力来选择性加权变量维度，强调与目标高度相关的特征，同时抑制噪声。与标准变换器不同，后者依赖于逐位置的前馈网络，所提出的模型用QLSTM单元替换了FFN，以增强循环建模能力。QLSTM通过隐藏状态转换捕捉时间依赖性，提供动态记忆，这对于建模非平稳时间序列数据特别有益。然后通过QLSTM单元处理注意力精炼的表示，生成隐藏状态序列Hi=[h1,h2,…,h^(Tin)，其中Hi表示第i个输入样本的编码时间特征，ht表示其在时间步t的潜在表示。解码器模仿编码器的设计，但排除了通道注意力以减少冗余。它首先对从编码器接收到的时间特征应用多头自注意力以捕捉目标序列中的相关性，然后使用QLSTM单元解码序列依赖性。最终预测通过全连接层生成，得到预测序列Y?i=[y?t,y?t+1,…,y?t+Tout]，其中y?t表示时间步t的预测值。与传统变换器相比，这种架构更适合建模SCADA数据的动态和多变量特性，有效地将时间依赖性学习与基于注意力的特征表示相结合，同时保持建模效率。最佳超参数通过网格搜索选择，这是一种传统的超参数优化方法。QLSTM-Transformer的最终配置如表1所示。表1. QLSTM-Transformer的超参数设置（也适用于LSTM-Transformer）。超参数值初始学习率0.001批量大小256训练周期数100时间窗口长度40预测长度6QLSTM/LSTM隐藏层大小128QLSTM/LSTM层数1编码器的自注意力头数16解码器的自注意力头数4优化器ADAM激活函数ReLU下载：下载高分辨率图像（506KB）下载：下载全尺寸图像图3. QLSTM-Transformer的结构。3.2. 贝叶斯推断和基于滑动窗口的（BISW）阈值方法为了实现稳健且敏感的故障检测（FD），提出了一种基于贝叶斯推断和滑动窗口统计的动态阈值方法。该方法首先对残差进行标准化，以构建统一的残差指标。在每个时间步t，残差定义为（17）rt=yt?y?t，其中yt是测量值，y?t是模型预测值。残差指标It定义为标准化残差的绝对值：（18）It=|rt?μ^norm/σ^norm|，其中μ^norm和σ^norm分别是残差的均值和标准差，是从已知健康周期计算得出的。公式（18）的目的是将原始残差转换为无量纲的偏差指标，参考健康残差分布。如果直接使用原始残差，目标变量之间的物理单位、数值范围和正常波动幅度之间的差异将直接被后续的阈值构建所继承，从而影响检测结果的一致性和可比性。相比之下，基于健康周期均值和标准差的标准化将残差表示为与健康基线的标准偏差数量，允许在不同变量和场景之间评估异常水平。与基于范围的归一化方法相比，这种方法不依赖于最大值和最小值来确定缩放区间，从而避免了极端值导致的比例压缩，并有助于保持弱早期偏差相对于正常波动的统计显著性。引入绝对值操作是因为FD关注的是与健康基线的偏差幅度，而不是偏差方向本身。在WT应用中，不同的故障机制可能导致残差正向或负向移动。通过采用绝对值操作，两种类型的异常偏差都一致地表示为偏差幅度，使其成为后续FD的更合适指标。为了确定系统是否运行异常，在每个时间步构建三个阈值来表征It的不同统计方面。第一个是贝叶斯阈值，它基于递归贝叶斯推断捕捉残差指标的长期分布[37]。它假设阈值θ遵循高斯分布：（19）θ～N(μ^(t?1),σ^(t?1)^2)，其中μ^(t?1)和σ^(t?1)^2是前一时间的后验估计。根据当前的观测结果，其可能性定义为 (20)It～N(θ,σlik2)，其中 σlik2 是假设的观测噪声方差，用于控制贝叶斯阈值更新对当前残差指标的响应强度。后验分布仍然保持高斯分布，更新后的参数由 (21)μt=σt?12It+σlik2μt?1σt?12+σlik2 给出，σt2=σt?12?σlik2σt?12+σlik2。在实验中，σlik2 固定为 1，因为敏感性分析表明这种设置在阈值适应性和误报抵抗性之间提供了良好的平衡。详细结果在第 4.7 节中报告。然后贝叶斯阈值定义为 (22)θtbayes=μt+z99.5%?σt，其中 z99.5% 是一个置信乘数，通常设置为 2.576，对应于在标准高斯分布假设下的 99.5% 单侧置信限 [38]。第二个是短期阈值，它使用长度为 Nt 的滑动窗口来捕捉残差指标的局部变化。窗口均值和标准差计算如下 (23)I?t=1Nt∑i=t?Nt+1tIi,st=1Nt∑i=t?Nt+1t(Ii?I?t)2。这里，Nt 表示用于估计残差指标短期均值和标准差的局部窗口长度。较小的窗口使阈值对近期波动更敏感，而较大的窗口则产生更平滑、更稳定的局部估计。在本研究中，窗口初始化为 48 个样本，相当于在 10 分钟 SCADA 采样下的 8 小时，这为捕捉短期变化提供了平衡的起点，而不会对孤立峰值过于敏感。短期阈值定义为 (24)θtshort=I?t+z99.5%?st。这个阈值能够及时响应瞬态偏差，并对 It 的快速波动敏感。第三个是静态参考阈值，它作为一个固定的下限，根据 [39] 中的示例，从健康运行期间计算得出。它定义为 (25)θstatic=μnorm+z99.5%?σnorm。这个阈值防止了过度敏感的警报，尤其是在其他方法在稳定运行期间可能低估阈值的情况下。最终的风力发电机 (FD) 阈值定义为上述三个阈值中的最大值，即 (26)θtfinal=maxθtbayes,θtshort,θstatic。这种融合规则确保在每个时间步，系统采用最保守的估计值。为了避免由于故障引起的残差指标导致更新损坏，贝叶斯参数 μt 和 σt2 仅在 It≤θtfinal 时更新。否则，保留之前的参数以保持鲁棒性。最后，如果残差指标连续超过阈值 M 个时间步，则声明发生故障：(27)∑i=t?M+1tI(Ii>θifinal)=M，其中 I(?) 是计数异常出现次数的函数。在我们的研究中，M 设定为 3，这意味着如果阈值连续超过 3 个样本（即考虑 10 分钟平均 SCADA 数据的 30 分钟），则检测到故障。使用这个标准可以减少可能由孤立峰值引起的误报，并确保只有持续异常才会触发故障警报。

3.3. 提出方法的总结
所提出的基于神经网络模型 (NBM) 的故障检测 (FD) 过程包括五个主要步骤：数据采集、数据预处理、变量选择、从残差确定阈值以及 FD。首先，收集来自风力发电机 (WT) SCADA 系统的原始数据，并清理掉错误值、异常值和噪声，以获得正常和健康的数据。然后，选择与故障信号密切相关的关键变量来生成无故障数据集，如第 3.1 节所描述。使用无故障数据集训练 QLSTM-Transformer 模型，该模型学习健康 SCADA 数据的模式。在 FD 过程中，将测试数据输入 QLSTM-Transformer 模型以获得预测值。计算测量值与预测值之间的残差作为残差指标，并与 BISW 阈值进行比较。如果残差指标持续超过故障阈值，则生成故障警报，如第 3.2 节所述。

4. 实验结果与评估
4.1. 数据描述
本研究使用了来自英国一个运营中的风电场的 SCADA 数据集，该风电场包括 26 台 WT，每台涡轮机有 128 个监控变量。SCADA 系统以十分钟为间隔处理和存储数据，这些数据用于本研究中的分析。数据集包括由各种类型的传感器记录的测量值，包括机械变量、电气输出、环境测量和温度读数。机械变量包括转子和发电机的速度以及俯仰角和扭矩。电气信号涵盖电压、电流、功率输出和运行频率。环境变量包括风速、方向和环境条件。温度数据记录了关键组件（如发电机、齿轮箱和主轴承）的温度。
这些 WT 经历了代表性的异常，包括齿轮箱轴承、发电机绕组和俯仰控制系统故障。这些故障是通过 SCADA 事件日志以及相关的警报和停机信息识别出来的。这些故障反映在给定风条件下的有功功率与预期响应的偏差上。对于健康的 WT，有功功率随风速呈典型的 S 形曲线变化。具体来说，功率从 3 m/s 的切入速度增加到 14 m/s 的额定速度，然后在 25 m/s 的切出速度附近稳定。例如，图 4 展示了在故障和无故障条件下功率曲线与风速的关系。从带有故障的功率曲线可以看出，这些 WT 在某些时刻由于齿轮箱轴承（图 4(a)）和发电机（图 4(b)）故障而以降低的功率输出运行。还观察到一个与控制相关的故障，实际俯仰角与其设定点有显著偏差。这种差异归因于俯仰电机转换器的故障，这影响了俯仰系统的响应，导致了不稳定的空气动力负载和功率波动。
如第 3.3 节所述，NBM 是使用无故障数据构建的。具体来说，从 SCADA 记录中提取健康运行数据来构建无故障数据集，而包含故障演变的数据段则保留用于 FD。然后通过最近的邻域插值替换异常点来清理无故障数据。总共使用了三个月的 SCADA 数据，共 12,960 个样本，以确保正常运行条件的统计代表性。得到的清理后的数据集作为模型训练和后续 FD 的输入。

下载：下载高分辨率图像（281KB）
下载：下载全尺寸图像(a)。
下载：下载高分辨率图像（308KB）
下载：下载全尺寸图像(b)。
图 4. 有 (a) 齿轮箱轴承故障和 (b) 发电机绕组故障的 WT 的功率曲线示例。左图：在故障条件下运行的涡轮机；右图：在无故障条件下运行的涡轮机。

4.2. QML 模型的优化
本节研究了输入变量和量子位数 (qubits) 数量如何影响 QLSTM-Transformer 的性能。它侧重于 QML 模型优化的两个关键方面：选择有效的输入变量和确定最佳量子位数以在选定的输入条件下最大化模型性能。这项研究对于准确的 FD 非常重要，并支持高效量子电路的设计。
对于齿轮箱轴承过热故障，选择了连接至转子的主速度轴上的‘温度 gearbox bearing 1’作为目标变量，因为它直接反映了热应力并对早期润滑或负载异常敏感。应用第 3.1 节详细介绍的变量选择过程来确定最相关的输入。根据 R2 贡献排名的前 10 个变量列在表 2 中。表 3 总结了改变输入变量数量对齿轮箱轴承 NBM 模型的 R2 和 RMSE（均方根误差）性能以及相应输入数量下的最佳量子位数产生的影响。当使用 6 个变量时，QLSTM-Transformer 实现了最高的 R2 分数和最低的 RMSE。因此，表 2 中的前 6 个变量被选为输入变量，相应的 QLSTM-Transformer 的最佳量子位数设置为 8。表 3 中还包含了 LSTM-Transformer 的性能以便进行比较。
对于发电机绕组过热故障，选择了定子相位 A 处的‘温度 generator L1’作为目标变量，因为它通常反映了绕组之间的热应力。应用了与齿轮箱案例相同的变量选择方法。表 4 列出了贡献最大的前 10 个输入变量，而表 5 总结了不同输入变量下的发电机绕组 NBM 性能以及相应的最佳量子位数。因此，表 4 中的前 8 个变量被选为输入变量，最佳量子位数设置为 8，用于处理发电机绕组过热故障。

表 2. 根据 R2 贡献排名的齿轮箱轴承过热故障的前 10 个变量。
排名变量名单位
1温度 gearbox bearing 2°C
2温度 gearbox 油底壳°C
3速度 generator rpm/min
4油压 gearbox bar
5温度 gearbox 油热交换器输出°C
6发电机速度 ST-RFC rpm/min
7发电机速度 ST-RFC（默认）rpm/min
8温度 cooling water generator 推进°C
9温度 cooling water generator 返回°C
10速度 rotor rpm/min

表 3. 用于齿轮箱轴承过热故障的 QLSTM-Transformer，还包括 LSTM-Transformer 进行比较。
变量数量LSTM-TransformerQLSTM-Transformer
最佳量子位数空单元R2RMSER2RMSE
空单元10.91241.70520.92291.53751020.91491.60960.91671.5073630.92111.58010.94831.3093840.93801.51770.94511.5033850.93951.40040.94671.3038660.94681.38990.95751.1280870.94421.34990.95101.25001080.94451.37530.95351.2524890.94671.33910.95051.29098100.94591.36530.94921.24046

对于俯仰控制故障，选择了变量 pitch converter temperature 1 作为目标变量。与齿轮箱轴承和发电机绕组案例不同，目标直接代表了机械或电气组件的热状况，而俯仰系统涉及一个机电控制过程，其中俯仰转换器的故障通常是异常的主要来源。俯仰转换器的温度提供了电气负载和冷却性能的可测量指标，这两者共同反映了转换器的运行状态。第 4.6 节进一步讨论了这一选择及其物理原理。如表 6 和表 7 所示，表 6 中列出的前 6 个变量被选为模型输入，俯仰控制故障分析的最佳量子位数确定为 6。

表 4. 根据 R2 贡献排名的发电机绕组过热故障的前 10 个变量。
排名变量名单位
1温度 generator L2°C
2风速m/s
3速度 rotor rpm/min
4有功功率kW
5温度 generator bearing（驱动端）°C
6温度 generator bearing（非驱动端）°C
7温度 cooling water generator 推进°C
8温度 cooling water generator 返回°C
9温度 outside°C
10速度 generator rpm/min

表 5. 用于发电机绕组过热故障的 QLSTM-Transformer，还包括 LSTM-Transformer 进行比较。
变量数量LSTM-TransformerQLSTM-Transformer
最佳量子位数空单元R2RMSER2RMSE
空单元10.91271.60020.90831.63451020.91851.48200.91601.49871030.92711.37220.92281.4189840.93581.30100.94071.2351850.93841.24280.94701.1876660.94261.21150.94951.1269870.94601.18530.95021.1038880.94971.12680.95181.0756890.94811.14920.95121.08954100.94741.16350.95001.10238

不同的故障场景预计会产生不同的输入子集，因为相应的目标组件受不同的物理机制和故障传播路径控制。尽管提出的变量选择策略是特定于场景的，但得到的变量子集并非随意选择的。在所有情况下，选定的变量遵循一致的物理原理，因为它们与目标组件密切相关，并受到热条件、负载、冷却、控制动作或相邻子系统状态的影响。提出策略的通用性在第 3.1 节中概述。
表 6. 根据 R2 贡献排名的俯仰控制故障的前 10 个变量。
排名变量名单位
1Pitch converter temperature 2°C
2风速m/s
3速度 rotor rpm/min
4Pitch converter temperature 3°C
5叶片角度 1°
6Pitch motor current 1A
7Pitch motor current 2A
8Pitch motor current 3A
9温度 outside°C

表 7. 用于俯仰控制故障的 QLSTM-Transformer，也包括 LSTM-Transformer 进行比较。
变量数量LSTM-TransformerQLSTM-Transformer
最佳量子位数空单元R2RMSER2RMSE
空单元10.88540.62760.88370.63221020.91990.52480.91570.5383830.95390.41540.94750.4310640.95630.40390.95260.4191650.96160.38690.96290.3751660.96750.36810.97910.3265670.96570.35580.97080.3372880.95910.42320.96540.3582690.95700.41060.95810.40674100.95190.42380.95340.41634

同样，选定的输入变量数量与量子位数设置之间的关系也是特定于场景的。随着输入变量数量的增加，R2 和 RMSE 通常会有所改善；然而，当选定的变量数量达到大约 6 到 8 个时，性能通常会达到峰值，这突显了有效变量选择的重要性。此外，当输入变量数量较少（少于 4 个）时，增加量子位数通常是有益的；而对于高维输入，适中的量子位数设置（通常为 6 到 8 个）就足以实现稳定的性能。这些结果表明了模型复杂性和性能之间的实际权衡。因此，本研究为使用 WT SCADA 数据进行建模时变量数量与量子位数之间的关系提供了实用的指导原则。

4.3. 消融研究
为了更清晰地分析各个组件的影响，对齿轮箱轴承故障案例进行了消融研究，系统地评估了 PE、编码器 CA 以及编码器和解码器中循环块替换对 NBM 性能的贡献。配置和相应的结果总结在表 8 中。从 M0 到 M2，逐步在普通 Transformer 中引入 PE 和 CA 一致地提高了模型性能。在此基础上，用 LSTM 替换编码器或解码器中的 FFN 可进一步提高性能，其中编码器侧的替换比解码器侧的替换更有效，如 M3 相对于 M4 的优越性所反映的那样。当编码器和解码器都采用LSTM时，M5的性能进一步优于单侧替换变体，表明在两侧引入传统的循环建模方法能更有效地加强时间依赖性的学习。将LSTM替换为QLSTM后，所有相应的变体都取得了比传统方法更好的结果。具体来说，M6和M7的表现分别优于M3和M4，这表明QLSTM带来了额外的性能提升，超出了混合架构本身所能实现的效果。同时，M8的表现优于M9，表明量子增强循环单元在应用于编码器时更为有效。最终，完整的提出架构M10取得了最佳的整体性能。总体而言，性能的提升源于三个组件的共同作用。首先，PE为注意力机制提供了必要的时间顺序信息。其次，编码器CA增强了信息变量的表达能力，同时抑制了冗余特征的干扰。第三，通过将FFN替换为QLSTM，模型在编码和解码过程中获得了更强的动态记忆和非线性耦合建模能力，尤其是在编码器端表现得更为明显。这些结果表明，提出架构中的每个模块都对NBM的性能有积极贡献，而QLSTM引入的量子增强时间表示方式带来了最大的收益，突显了QML在捕捉基于SCADA的NBM中的复杂时间依赖性和多变量非线性交互方面的潜力。

表8. 对PE、CA和QLSTM模块对提出架构贡献的消融研究。

模型ID | 位置编码 | 编码器通道注意力 | 解码器循环块
--- | ---------- | ------------- | -------------------
R2RMSE | 0 | No | FFN | FFN | Vanilla transformer
M1 | Yes | No | FFN | FFN | Vanilla transformer with PE
M2 | Yes | Yes | FFN | FFN | Vanilla transformer with PE and CA
M3 | Yes | Yes | LSTM | FFN | Replace encoder FFN with LSTM
M4 | Yes | Yes | FFN | LSTM | Replace decoder FFN with LSTM
M5 | Yes | Yes | LSTM | LSTM | Replace both FFNs with LSTM
M6 | Yes | Yes | QLSTM | FFN | Replace encoder FFN with QLSTM
M7 | Yes | Yes | FFN | QLSTM | Replace decoder FFN with QLSTM
M8 | Yes | Yes | QLSTM | LSTM | Encoder QLSTM and decoder LSTM
M9 | Yes | Yes | LSTMQLSTM | Encoder LSTM and decoder LSTM
M10 | Yes | Yes | QLSTMQLSTM | Full proposed model

4.5. 情况2：发电机故障
发电机绕组过热通常是由于润滑不足、逐渐磨损、突然的机械过载或冷却能力下降等潜在问题引起的。这些问题会增加轴承内的摩擦和热应力，导致持续的热量积累。随着摩擦损失的增加，机械能到电能的转换效率降低，产生的功率可能会偏离预期曲线。因此，发电机轴承温度常被视为早期退化的敏感指标及其对涡轮性能的影响。通过检查SCADA报警日志，发现该故障是由于冷却系统因油滤堵塞而导致的[40]。

6个选定的变量（见表2）反映了传动系统和它们之间耦合的关键热学、机械和润滑行为。“温度齿轮箱轴承2”连接到发电机的高速轴上，显示了在共同负载或冷却条件下的相关热趋势。“温度齿轮箱油底壳”测量整个油温，指示冷却性能和负载水平。“油压齿轮箱”反映了润滑质量，较低的压力可能会减少油膜厚度，从而导致局部加热。“温度齿轮箱油冷却器输出”显示了油在重新循环前被冷却的情况。“速度发电机”和“发电机速度ST-RFC”分别描述了发电机的转速以及转换器控制系统提供的参考发电机速度。这些输入有助于模型捕捉操作条件对温度变化的影响。

如表3所示，使用6个选定变量构建的QLSTM-Transformer模型在无故障数据集中的R2为0.9575，RMSE为1.1280，显示出在NBM中的强大性能。图5进一步直观地展示了模型预测值与测量值之间的紧密对齐，表明在健康条件下具有高建模精度。

为了评估所提出方法的FD性能，构建了一个包含齿轮箱故障的原始数据集。该数据集涵盖了大约8天直到维护停机的时间，共有1100个样本。根据SCADA事件日志，WT在样本点2513因齿轮箱轴承温度过高而停机。图6展示了QLSTM-Transformer对包含此故障的数据集的预测结果。在样本1800到2000之间以及样本点2400附近可以观察到预测值和测量值之间的显著偏差，表明了潜在的早期故障特征。图7显示了基于BISW阈值方法的检测结果，故障在样本1770被检测到，比事件日志中识别的停机时间提前了123.83小时。此外，当这种方法应用于无故障数据集时，没有报告任何误报，从而验证了其在正常条件下的稳健性和可靠性。

4.6. 情况3：调速控制故障
调速控制故障可能是由于转换器退化、电机电流不平衡或控制回路中的通信问题引起的。根据SCADA报警日志，出现了多次 rotor-brake hold-pressure 报警和发电机-rotor RPM（每分钟转数）传感器通信故障，表明机械制动和旋转速度反馈子系统都存在异常行为。这些耦合效应使发电机长时间处于过激和过载状态。持续的电气负载增加了铜损失，导致定子绕组中的持续热积累，最终导致高温故障。这一机制与文献中的发现一致，即持续的机械或电气异常会导致持续的过载和随后的绕组或转子过热[41]，[42]。因此，绕组温度被广泛认为是初始电气故障及其对发电性能影响的关键指标。

8个选定的变量（见表4）捕捉了影响目标变量“温度发电机L1”的主要热学、机械和电气因素。“温度发电机L2”测量了定子相位B的绕组温度，并与目标变量有很强的相关性。“风速”和“有功功率”反映了空气动力学输入和电力输出。较高的风速会增加机械负载，而较大的有功功率会导致更大的电流流动和更高的欧姆损耗。“速度转子”表示涡轮转子的旋转速度，反映了发电机所经历的机械应力。“温度发电机轴承（驱动端）”和“非驱动端”监测了轴两端的轴承温度，提供了从定子到传动系统的热传递的间接信号。“温度冷却水发电机进水”和“出水”代表了冷却系统的进出口温度，有助于评估冷却效果和热负荷。这些变量共同描述了发电机绕组的内部热状态，使绕组过热的准确预测成为可能。

如表5所示，使用8个选定变量构建的QLSTM-Transformer模型在NBM建模中的R2为0.9518，RMSE为1.0756。图8显示了无故障数据集的模型预测结果。尽管发电机绕组温度有显著波动，模型仍保持了高预测精度。

对于FD任务，选择了SCADA数据，涵盖了大约12天和1800个样本，直到维护停机。根据SCADA事件日志，WT在样本点1685因发电机绕组温度过高而停机。图9显示了该包含故障的数据集的模型预测结果。在样本1000到1200之间以及样本点1600附近，可以观察到测量值和预测值之间的显著偏差，表明了潜在的故障特征。图10显示了QLSTM-Transformer-BISW方法的FD结果，该方法在样本1220检测到了故障，比事件日志中记录的停机时间提前了大约77.5小时。当该方法应用于无故障数据集时，没有产生任何误报。这些结果表明，不同的融合规则在灵敏度和鲁棒性之间存在权衡：基于平均的规则通常会产生较低的阈值和较高的灵敏度，而更为保守的规则则更能抵抗由瞬态波动或局部阈值低估引起的误报[43], [44]。在这项研究中，用这些替代的融合规则替换方程(26)中的最大运算符表明，尽管较不保守的策略可能导致误报略微提前，但也会增加误报的倾向。因此，最终采用了最大运算符作为阈值融合规则，因为它在实际风力涡轮故障检测(WT FD)中提供了早期预警能力和抗误报能力之间的最佳平衡。

表9. 不同阈值融合规则在齿轮箱轴承故障案例上的比较。

融合规则提前小时数误报次数
最大值 123.83 无
平均值 137.67 有
加权平均值 138 有
中位数 123.83 有

4.7. 阈值参数的灵敏度分析
为了进一步评估BISW的鲁棒性，对三个与阈值相关的参数进行了灵敏度分析，即短期窗口长度Nt、假定的观测噪声方差σlik2和置信系数z。结果显示在图14中。上行显示了齿轮箱轴承故障案例的相应提前预警时间，而下行表示在无故障数据集上是否发生了误报。可以观察到，在测试范围内，Nt和σlik2的变化对最终检测结果影响很小。对于固定的z值，提前预警时间在不同Nt和σlik2的值下几乎保持不变，误报行为也是一致的。这表明所提出的BISW方法对Nt和σlik2的中等变化相对不敏感，支持了其在实际应用中的鲁棒性。

下载：下载高分辨率图片（463KB）
下载：下载全尺寸图片

图14. BISW阈值参数在齿轮箱轴承故障案例上的灵敏度分析。上行显示了不同Nt、σlik2和z组合下的提前预警时间。下行显示在相应参数设置下无故障数据集上是否发生了误报。相比之下，置信系数z对早期预警能力和误报抑制之间的权衡有明显影响。当z=2.33时，阈值变得不那么保守，该方法实现了最早的检测时间，为停机前的137.33小时。然而，在所有测试的Nt和σlik2组合下也引入了误报。当z=3.0时，阈值变更为保守，消除了误报，但将提前预警时间缩短至37.17小时。与这两种情况相比，z=2.576实现了更好的平衡。它在所有测试的Nt和σlik2值下保持零误报，同时仍提供了123.83小时的较长提前预警时间。因此，灵敏度分析表明z是控制BISW中灵敏度和鲁棒性之间权衡的主要参数，而Nt和σlik2在测试范围内的影响较小。基于这些结果，本研究采用了默认设置z=2.576，以及Nt=48和σlik2=1，作为实际故障检测的平衡且鲁棒的选择。

4.8. 性能比较
为了全面评估所提出的QLSTM-Transformer框架的有效性，采用了几种基线方法在NBM和FD中进行对比分析。在NBM方面，使用LSTM-Transformer和传统的LSTM及Transformer作为基线。所有模型都是基于第3.1节中描述的特征选择构建的，并通过网格搜索进行了调优。针对FD性能，将所提出的BISW方法与两种代表性的阈值策略和两种最先进(SOTA)方法进行了比较。第一种阈值方法是基于核密度估计(KDE)的动态阈值方法[45]，该方法通过建模预测值和残差的联合分布来生成数据驱动的阈值。第二种阈值方法是基于指数加权移动平均(EWMA)的静态阈值方法[39]，该方法应用从预定义样本窗口的平滑残差中得出的固定阈值。两种SOTA方法是DVI [11]和TSDT [12]，它们已在第1节中描述。

表10展示了四种模型在涡轮机上的NBM性能，对应于齿轮箱轴承、发电机绕组和俯仰控制故障。在R2和RMSE方面，QLSTM-Transformer始终取得了最佳结果，其次是LSTM-Transformer。传统的LSTM和Transformer单独使用时准确率较低，特别是Transformer在发电机故障的涡轮机上表现较差，RMSE达到了3.5101。这主要是因为LSTM难以捕捉扩展序列中的长期依赖关系，而标准Transformer在训练数据有限时无法学习稳定的时间模式。

表11比较了不同方法在齿轮箱轴承、发电机绕组和俯仰控制故障下的FD性能。所提出的方法在所有情况下都实现了最早的检测时间，分别为123.83小时、77.5小时和122.67小时，并且没有报告误报，显示了其高灵敏度和强鲁棒性。无故障数据中未发生误报归因于准确的NBM和鲁棒阈值设计的共同作用。QLSTM-Transformer的优越NBM准确性产生了更稳定的残差，而BISW策略抑制了由瞬态波动和阈值不稳定性引起的误报。这些结果表明，稳定的FD性能不仅取决于模型的准确性，还取决于阈值机制在不同运行条件下的鲁棒性。

应当注意的是，报告的提前时间是指相对于记录的停机时间的特定案例预警范围，而不是每个故障类型的统计稳定预警分布。由于本研究仅分析了每个故障场景的一个代表性案例，这些值不应被解释为普遍可重复的检测范围。然而，通过将它们与相应涡轮机子组件的维护时间尺度进行比较，可以理解其工程意义。现有文献报道了齿轮箱、发电机和转换器故障的代表性维修时间估计，分别为轻微维修、重大维修和完全更换三个维护级别。例如，它们报告的维修时间分别为齿轮箱故障7.9小时、21.9小时和231小时，发电机故障6.5小时、24.3小时和81.1小时，转换器故障6.9小时、13.6小时和56.5小时[46]。从这个角度来看，齿轮箱的预警时间123.83小时明显长于轻微维修和重大维修的报告时间尺度，但仍然短于完全更换的时间尺度。尽管如此，它仍然提供了足够长的提前时间来支持故障确认、检查计划、备件准备和提前维修组织。发电机的预警时间77.5小时明显长于轻微维修和重大维修的时间尺度，并且接近完全更换的时间尺度，表明在有利的维护条件下，可用的预警时间已经涵盖了大部分维护准备和干预过程。对于俯仰控制案例，由于目标变量反映了俯仰电机转换器的热状态，122.67小时的预警时间与转换器相关故障的报告维护时间尺度相比更为合适。因此，它通常足以支持维护准备和大多数与转换器相关的干预场景。然而，实际所需的维护级别取决于组件损坏的程度，因为轻微维修、重大维修和完全更换涉及的干预时间尺度显著不同[47]，[48]。

此外，基于BISW的阈值方法通常比基于KDE或EWMA的方法显示出更高的灵敏度。EWMA和KDE之间的比较表明，尽管EWMA方法经常实现更早的检测，但它们经常生成误报，而基于KDE的方法虽然更鲁棒，但缺乏足够的早期FD能力。因此，BISW在鲁棒性和灵敏性之间提供了更好的权衡。在计算时间方面，QLSTM-Transformer-BISW的每步运行时间为7.787毫秒，对于40个样本，其中40个样本对应于表1中定义的时间窗口长度，代表每次推断使用的SCADA样本点数；然而，它仍在毫秒范围内，可以支持实时应用。程序在配备Intel? Core? i5 - 12600 KF CPU @ 3.69 GHz和64 GB RAM的计算机上运行PyTorch 2.3.1平台。随着量子硬件和算法设计的不断发展，其计算成本预计将进一步降低。

表10. QLSTM-Transformer与基线模型之间的性能比较。

模型齿轮箱发电机俯仰
R2 RMS RMS
QLSTM-Transformer 0.9575 1.128 0.9518 1.075
LSTM-Transformer 0.9468 1.389 0.9497 1.1268
LSTM 0.9377 1.459 0.924 2.697
Transformer 0.9375 1.628 0.904 1.3510
Transformer 0.9375 1.628 0.953 40.416

表11. 不同故障和方法之间的故障检测时间和报警统计比较。

方法齿轮箱轴承发电机绕组俯仰控制
计算时间（毫秒）提前小时数误报次数提前小时数误报次数
QLSTM-Transformer-BISW 123.83 无 77.5 无 122.67 无 7.787
QLSTM-Transformer-KDE 120.83 无 70.5 无 77.33 无
QLSTM-Transformer-EWMA 123.17 是 77.5 是 22.16 是
LSTM-Transformer-BISW 109.67 无 75.5 无 68.83 无
LSTM-Transformer-KDE 37.17 是 29.17 否 37.83 否
LSTM-Transformer-EWMA 88.5 是 74.83 是 22.16 是
LSTM-BISW 92.33 是 32.5 否 121 否
LSTM-KDE 37.17 是 120.67 否 5.129
LSTM-EWMA 104.67 是 13 116.33 是 0.056
Transformer-BISW 109.67 是 76.83 否 120.83 否
Transformer-KDE 108.83 是 76.83 否 120.67 否
Transformer-EWMA 106.17 是 1.33 是 116.33 否

5. 结论
本文提出了一种用于风力涡轮机的无监督故障检测(WT)框架，该框架将QLSTM-Transformer模型与BISW阈值融合在一起。QLSTM-Transformer架构利用量子增强型时间建模，在健康条件下提高了SCADA信号的预测准确性。BISW方法通过结合短期变化和长期趋势自适应地构建动态阈值，从而能够在未标记数据中实现稳健的故障识别。在我们的研究中，QLSTM中使用的量子比特数是根据输入变量的维度和性能评估来确定的，以支持QML模型优化。采用了相对紧凑的量子编码来平衡模型性能和训练成本。结果表明，即使在量子比特数有限的情况下，QML模型也对建模精度有显著贡献，表明混合量子架构可以在资源受限的硬件下有效增强时间特征提取。在包含齿轮箱轴承、发电机绕组和俯仰控制故障的真实世界SCADA数据集上的实验评估表明，所提出的框架实现了最高的建模精度，NBM的R2值分别为0.9575、0.9518和0.9791。使用BISW方法，可以在涡轮机停机前123.83小时、77.5小时和122.67小时检测到故障，且没有产生误报。与基于KDE和EWMA的阈值相比，BISW在灵敏度和鲁棒性之间实现了更好的平衡。因此，所提出的QLSTM-Transformer-BISW方法在保持高检测灵敏度的同时有效抑制了误报，展示了在复杂运行条件下的强泛化能力和实际适用性。通过结合输入变量的最佳选择与量子模型优化所需的量子比特数之间的关系，所提出的框架是数据驱动的、可扩展的，适用于WT CM应用。未来的工作将探索通过集成多模态数据源来扩展其对多故障检测的能力。

CRediT作者贡献声明
张哲峰：撰写——原始草案、方法论、形式分析、数据管理、概念化。
韩星星：撰写——审阅与编辑、概念化。
徐昌：撰写——审阅与编辑、概念化。
马向东：撰写——审阅与编辑、监督、方法论、调查、资金获取。

资金来源
本工作部分得到了英国皇家学会国际交流项目IEC\NSFC\223091和英国工程与物理科学研究委员会(EPSRC)项目EP/V040561/1的支持。

热点排行