多变量时间序列异常检测(MTSAD)最近已成为一个重要的研究方向(Zamanzadeh Darban等人,2024年),在网络安全(Chen, Zhang, Qin, Fan, Jiang, Liang, Wen, Deng, 2024a; Ma, Nie, Guan, He, Gao, 2024年)、医疗保健(Niu等人,2025年)和交通(Lee, Lee, 2024年;Ren, Li, Peng, Chen, Tan, Wu, Shi, 2024年)等领域有广泛的应用。通过整合来自采集设备的多源监控信号生成多变量时间序列(MTS)数据,可以监测网络物理设备中的潜在故障和威胁,从而确保系统的稳定运行。然而,在大量正常样本中,异常样本通常很少,准确标记所有异常样本的成本往往非常高。因此,MTSAD主要依赖于无监督方法。
无监督方法主要分为基于机器学习(ML)和深度学习(DL)的方法。经典的机器学习方法,如局部异常因子(LOF)(Breunig等人,2000年)、一类支持向量机(OCSVM)(Sch?lkopf等人,1999年)和隔离森林(IF)(Liu等人,2012年),具有基本的异常检测能力。然而,这些方法基于正常数据是独立同分布的假设,这使得有效利用数据中的相关性信息变得困难。相比之下,基于DL的方法可以更好地利用MTS的时间和空间相关性特征。因此,基于DL的方法(Chen, Gao, Liu, Zhang, Diao, Wang, Lu, Meng, 2025年;Chen, Zhang, Ma, Liu, Ding, Li, He, Rajmohan, Lin, Zhang, 2023年;Dong, Wu, Zhang, Zhang, Wang, Long, 2023年;Xu, Wu, Wang, Long, 2022年)已成为主流的MTSAD方法。
基于DL的方法主要分为基于预测的方法(Deng, Hooi, 2021年;Wu, Hu, Liu, Zhou, Wang, Long, 2023年)和基于重建的方法(Audibert, Michiardi, Guyard, Marti, Zuluaga, 2020年;Chen, Zhang, Ma, Liu, Ding, Li, He, Rajmohan, Lin, Zhang, 2023年;Dong, Wu, Zhang, Zhang, Wang, Long, 2023年;Xu, Wu, Wang, Long, 2022年)。基于预测的方法使用历史数据来预测和识别偏离预测结果的时间点作为异常。然而,由于时间序列数据的不可预测性,针对长序列的预测模型受到时间模式漂移的显著影响,导致模型性能显著下降。相比之下,基于重建的方法表现出更好的性能。这些方法在潜在空间中学习正常数据的低维表示模式,通过潜在空间嵌入实现数据压缩和重建。通过有效利用序列中的上下文信息,基于重建的方法减轻了不可预测性的影响,从而在处理更复杂的时间模式时获得了更好的检测结果。
最近的研究(Cheng, Sheng, Wang, Sun, Xiao, Yang, Teng, Luan, Gao, 2025年;Qiu, Xie, Niu, Xiong, Gao, 2025年;Xu, Miao, Wang, Yu, Wang, 2024年)表明,通过掩码时间戳可以显著提高模型学习细粒度局部语义信息的能力。然而,数据中的固有污染和掩码操作引入的语义偏差(Dong等人,2023年)可能会干扰基于掩码重建的模型对正常模式信息的学习。
图1展示了PSM数据集的可视化。具体来说,图1(a)展示了三种常用的掩码操作,而图1(b)突出了训练数据中偏离正常模式的污染。使用特定值(如0)进行掩码可能会引入与时间序列数据分布无关的数值先验。尽管丢弃掩码数据可以避免无关数值先验的干扰,但它会导致原本不相邻的时间点看起来相邻,从而构建不准确的时间上下文。此外,受污染的实例(如噪声或异常)通常表现出与潜在全局分布强烈的局部相关性。因此,依赖于局部重建的掩码重建模型更容易受到这些异常模式的影响。因此,开发一种利用正常全局语义和异常局部结构的判别能力来抵消污染效应的异常检测方法至关重要。尽管对比学习方法可以提高学习高级语义信息的能力(Yu等人,2024年),但它们往往无法在正样本和负样本之间建立清晰的边界。这一缺点使得它们无法准确提取代表正常模式数据的典型特征信息。因此,有必要引入一种更有效的方法来构建正样本和负样本,以及损失函数的约束机制。
为了解决上述问题,MMR-CCL使用记忆模块存储全局相关性感知信息,从而指导掩码重建过程。这种方法确保了细粒度局部信息的提取,同时减轻了训练数据的语义特征与正常模式的偏差,这是掩码操作和受污染数据可能导致的。在掩码重建过程中,设计了一个记忆调节因子来量化数据中的全局和局部相关性差异。该因子使记忆模块优先存储具有更强全局相关性的正常模式信息。此外,MMR-CCL采用中心对比学习策略,使用完整窗口的重建结果作为中心锚定样本,在特征空间中形成正样本和负样本的精确差异分布。总之,本文的主要贡献可以总结如下:
•提出了一种用于MTSAD的记忆引导的掩码重建方法。具体来说,MMR-CCL引入了一个全局相关性感知的记忆模块。通过利用历史学习的全局相关性,该模块指导掩码重建过程,确保与正常模式的语义一致性,从而提高模型对正常行为的理解能力。此外,引入了一个记忆调节因子,根据正常数据和受污染数据的局部和全局相关性差异自适应调整损失权重,显著提高了模型在复杂环境中的鲁棒性。
•提出了一种记忆锚定的中心对比学习策略。全局视图的重建结果作为中心锚定样本。正样本通过掩码重建生成,负样本通过填充噪声创建。通过最大化正样本和负样本形成的向量与中心锚定样本之间的角度距离,增强了模型从正常数据中提取高级语义信息的能力。
•进行了全面而精心设计的实验研究。使用AUC-ROC、Fc1、F1PA%K和VUS-PR等指标评估了所提出方法和22种典型相关比较方法的性能。结果表明,MMR-CCL在所有数据集中都表现出优异的性能,并保持了稳定性。此外,消融研究和参数敏感性实验验证了MMR-CCL中每个模块设计的有效性。