在数据稀缺和类别不平衡的情况下，对序列感知增强策略在真实运行中的AHU AFDD（空气处理单元自动故障检测）中的实证比较

《Expert Systems with Applications》：Empirical comparison of sequence-aware augmentation strategies for real operational AHU AFDD under data scarcity and class imbalance

【字体：大中小】 时间：2026年05月11日 来源：Expert Systems with Applications 7.5

编辑推荐：

　　王成贤伦敦大学学院环境设计与工程研究所，英国伦敦WC1H 0NN 摘要在自动化故障检测与诊断（AFDD）中，数据稀缺性和类别不平衡仍然是主要挑战，尤其是在使用来自建筑物的实际运行故障数据训练模型时。本研究通过实证比较了三种序列感知增强策略，用于在不同标记数据情况下对空气处

王成贤

伦敦大学学院环境设计与工程研究所，英国伦敦WC1H 0NN

摘要

在自动化故障检测与诊断（AFDD）中，数据稀缺性和类别不平衡仍然是主要挑战，尤其是在使用来自建筑物的实际运行故障数据训练模型时。本研究通过实证比较了三种序列感知增强策略，用于在不同标记数据情况下对空气处理单元（AHUs）的AFDD进行建模：仅使用时间序列（TS）的增强、仅使用Trans-CWGAN的增强以及混合策略。实验使用了来自13个AHUs的完全标记的实际运行数据集，标记数据的比例分别为30%、70%和100%，并评估了随机森林（RF）、TabTransformer和时域卷积网络（TCN）分类器的性能。结果表明，标签稀缺性是主要的性能瓶颈，原始基线的宏观F1分数从标记数据比例为70%时的89.8降到了30%时的69.3。在数据极度稀缺（30%）的情况下，混合策略取得了最高的平均预测性能（宏观F1分数：72.7；准确率：77.4），而仅使用TS的策略显示出更高的鲁棒性和对超参数设置的较低敏感性。仅使用Trans-CWGAN的策略在这种条件下是最不可靠的。在标记数据比例为70%和100%的情况下，增强的增量效益减小，性能趋于饱和。总体而言，研究结果表明增强效果强烈依赖于数据环境。对于这个单设施运行数据集，仅使用TS在数据极度稀缺的情况下提供了一个强大、稳定且低成本的实用基线，而混合策略则更适合在平均性能提升有限的条件下作为有条件的选择。

引言

空气处理单元（AHUs）是供暖、通风和空调（HVAC）系统的关键组成部分。它们为占用空间提供调节后的空气，并有助于调节室内温度、湿度、通风率和整体空气质量（Korolija等人，2013年；Wang，2025年；Korolija等人，2013年）。自动化故障检测与诊断（AFDD）系统持续跟踪AHU传感器和执行器的信号，以便及时发现异常运行和组件故障，从而采取纠正措施（Wang等人，2024年）。

许多AFDD研究依赖于监督机器学习方法，这些方法通常需要大型、标记良好的数据集才能获得一致的性能（Huang等人，2022年）。在真实建筑中，生成此类标记数据既昂贵又耗时，且真正的故障事件相对较少。因此，运行数据集通常规模较小且极度不平衡：正常情况占大多数记录，而故障类别出现频率较低且不均匀（Albayati等人，2022年；Singh等人，2022年；Chen等人，2023年）。这种不平衡会削弱模型的可靠性，降低故障检测性能，并限制其对未见运行场景的泛化能力（Zhong等人，2023年）。

为了缓解类别不平衡问题，最近的研究越来越多地转向数据增强。常用的两类技术包括：（i）合成少数类过采样技术（SMOTE）及其扩展，以及（ii）基于生成对抗网络（GANs）的增强方法。SMOTE因其易于实现和计算成本低而受到青睐，而基于GAN的方法能够生成高度真实的样本，捕捉复杂微妙的故障模式。然而，这些方法通常是为表格特征表示设计的，且经常在没有显式建模时间结构的情况下应用（Wang，2025年）。

对于AHU AFDD来说，保持时间序列特征至关重要，因为HVAC行为受到反馈控制、执行器动态和缓慢的热响应的影响。许多故障——如偏置传感器、卡住或漂移的风门以及调节不当的控制器——表现为随时间发展的趋势、振荡或延迟响应，而不是个别时间步骤中的孤立异常（Wang，2025年；Wang，2025年）。将每个时间戳视为独立表格记录的方法可能无法捕捉故障演变，并可能将短期控制动作误判为故障。尽管数据增强受到越来越多的关注，但许多先前研究仍然将运行日志作为独立样本处理，从而忽略了HVAC时间序列数据中的长期依赖性和上下文模式。

这些考虑促使对运行AHU AFDD的序列感知增强策略进行了有限的实证比较。本研究检验了三种增强策略：仅使用抖动、缩放和时间扭曲的TS增强；基于类别条件的序列合成的Trans-CWGAN增强；以及结合TS生成的种子样本和基于GAN的补充合成的混合策略。本研究并非将基于Transformer的生成器视为普遍优越的架构贡献，而是关注这些替代增强策略在真实运行环境中的不同标记数据下的表现。

因此，本研究通过使用完全标记的实际运行数据集，实证比较了三种序列感知增强策略，以缓解AHU AFDD中的数据稀缺性和类别不平衡问题。为了考察数据极度稀缺和相对标记丰富但仍然不平衡的情况，实验使用了相同数据集的30%、70%和100%的标记数据比例。本研究的主要贡献如下：

1)
本研究对三种序列感知增强策略进行了系统的实证比较，用于实际运行AHU AFDD：仅使用TS的增强、仅使用Trans-CWGAN的增强以及混合增强。
2)
比较是在单一设施中的13个AHUs在七种运行状态下的完全标记数据集上进行的，并使用了三种互补的分类器：随机森林（RF）、TabTransformer和时域卷积网络（TCN）。
3)
结果表明，增强效果强烈依赖于数据环境：在数据极度稀缺的情况下，仅使用TS的增强提供了强大且低成本的实用基线；混合增强仅提供有条件的平均性能提升；而仅使用Trans-CWGAN的增强是最不可靠的。

章节片段

使用实际运行数据的监督AFDD研究

HVAC系统中的AFDD研究通常依赖于三种主要类型的数据源：基于物理的仿真输出、受控实验室测试平台以及从实际建筑物收集的运行数据。每种数据源在实际性和真实性之间提供了不同的平衡。在早期的研究中，许多研究使用了通过第一性原理仿真模型生成的完全标记的数据集（Du等人，2014年；Lee等人，2019年；Montazeri和Kargar，2020年；Shahnazari等人，2019年；Tun等人

实验方法

第3节描述了用于比较数据稀缺和类别不平衡情况下AHU故障诊断的三种序列感知增强策略的实验方法。如图1所示，工作流程分为两部分。第3.1节介绍了用于扩展少数类故障类别同时保持时间特征的增强策略。

3.1.1节定义了三种保留标签的时间序列增强操作：抖动、缩放和时间扭曲。

数据集准备

实验增强设计使用了Wang（2025年）引入的实际AHU运行数据集。该数据集包含了同一设施内13个AHU在冷却和加热期间收集的测量数据。分析中使用了15个传感器变量，相应的传感器位置如图4所示。

所有测量数据都是按小时记录的。

Trans-CWGAN训练的损失曲线

在训练和监控（验证）阶段检查了生成器和判别器的损失轨迹，以识别Trans-CWGAN学习中的潜在不稳定性。该分析针对三种标记数据比例（

f = 30 % ， 70 %， a n d 100 %

）以及两种基于Trans-CWGAN的设置（仅使用Trans-CWGAN和混合策略）进行了分析。在预定义的Trans-CWGAN超参数网格（64种配置）下，共训练了384个Trans-CWGAN模型。

图6展示了

结论

本研究实证比较了三种用于缓解实际运行AHU AFDD中数据稀缺性和类别不平衡的序列感知增强策略：仅使用TS的增强、仅使用Trans-CWGAN的增强以及结合TS生成的种子样本和基于GAN的补充合成的混合策略。比较是在30%、70%和100%的标记数据比例下使用RF、TabTransformer和TCN分类器进行的。

最明显的发现是标签稀缺性是影响性能的主要因素

利益冲突声明

作者声明他们没有已知的竞争财务利益或个人关系，这些利益或关系可能会影响本文报告的工作。

摘要

引言