KFS:基于KAN的自适应频率选择学习架构,用于长期时间序列预测

《ADVANCED ENGINEERING INFORMATICS》:KFS: KAN based adaptive frequency selection learning architecture for long-term time series forecasting

【字体: 时间:2026年02月17日 来源:ADVANCED ENGINEERING INFORMATICS 9.9

编辑推荐:

  多尺度时间序列预测中,提出基于Kolmogorov-Arnold网络(KAN)的自适应频率选择架构(KFS),通过频域能量分布选择主频分量、KAN学习跨尺度特征及时间嵌入对齐模块融合多尺度信息,有效抑制噪声干扰与异构频率分布问题,在多个真实数据集上达到SOTA性能。

  
吴长宁|吴高|蔡荣耀|刘勇|张可欣
浙江大学网络系统与控制研究所,中国杭州,310013

摘要

多尺度分解架构已成为时间序列预测中的主流方法。然而,现实世界中的时间序列在不同尺度上存在噪声干扰,而不同尺度频率成分之间的异构信息分布导致多尺度表示效果不佳。受Kolmogorov-Arnold网络(KAN)和Parseval定理的启发,我们提出了一种基于KAN的自适应频率选择学习架构(KFS)来应对这些挑战。该框架通过其FreK模块解决跨尺度噪声干扰和复杂模式建模问题,该模块在频谱域中进行基于能量分布的主导频率选择。同时,KAN实现了复杂的模式表示,而时间戳嵌入对齐则实现了跨尺度的时间表示同步。特征混合模块将特定尺度的模式与对齐的时间特征融合在一起。在多个真实世界时间序列数据集上的广泛实验表明,KFS作为一种简单而有效的架构,取得了先进的性能。我们的代码可在以下网站获取:https://github.com/wcnExplosion/KFS-main

引言

时间序列数据通过传感器或其他方式从各种来源收集,例如交通流量[1]、工业健康监测[2]、[3]、[4]、[5]、天气预报[6]、[7]、故障诊断、能源计算和金融分析[8]。作为时间序列数据分析中最关键的任务之一,时间序列预测受到了研究人员的广泛关注。通过研究时间序列来预测未来数据趋势,有助于人类做出许多重要决策。
传统的时间序列预测技术主要依赖于统计学习方法,如自回归积分移动平均(ARIMA)[9]模型和指数平滑。这些模型通常基于序列平稳性或线性趋势等强假设,这限制了它们在处理复杂非线性关系时的性能。近年来,深度学习模型逐渐成为主流,并由于强大的自动特征提取和复杂模式识别能力而达到了先进的准确性。这些深度学习方法主要包括基于CNN[10]、[11]、MLP[12]和Transformer[13]、[14]、[15]的方法。
由于现实世界和工程环境的复杂性,观察到的时间序列通常表现出复杂多样的模式。这些交织的模式导致复杂的依赖关系和大量的噪声污染,使得建立历史数据与未来变化之间的联系变得具有挑战性。为了捕捉复杂的时间模式,越来越多的研究专注于利用先验知识将时间序列分解为更简单的组成部分,作为预测的基础。例如,Autoformer[16]、DLinear[13]和FEDformer[17]将时间序列分解为趋势和季节性成分。在此基础上,TimeMixer[18]进一步引入了多尺度季节-趋势分解,强调了多尺度数据的重要性。最近的模型如TimesNet[19]和SparseTFT[20]专注于根据周期性长度将长序列分解为多个较短的子序列,从而能够分别建模时间模式内的周期间和周期内依赖关系。虽然这些方法从不同角度提取子序列以捕捉关键信息,但从原始序列直接分割出的子序列不可避免地保留了大量噪声,导致性能不佳。此外,现实世界时间序列的频域结构通常在不同尺度上受到不同程度的噪声干扰,频率成分的分布存在显著差异,这限制了直接学习的多尺度表示的有效性。这种现象可以归因于不同尺度上的异构信息分布,其中信息在频率或尺度成分之间的分布不均匀且不一致。
此外,尽管多尺度框架和趋势-季节性分解方法通过滑动窗口平均等技术在一定程度上减轻了高频噪声的影响,从而提高了预测性能。但这些方法主要在时间尺度上操作,忽略了难以消除的其他模式中嵌入的噪声,最终限制了模型的有效性。值得注意的是,时间序列包含多种频率成分,其中包括仅在频域中存在的噪声,这些噪声在其他领域难以减轻。这种固有的噪声对不同频率的影响不均匀,导致低幅度频率的信噪比降低,从而损害了模型的预测性能。在混合不同频率成分的同时减轻噪声干扰使得预测变得特别具有挑战性。上述分解方法启发我们设计了一个多尺度频率去噪混合框架,能够隔离不同的频率成分并过滤高信噪比的数据。然而,异构频率模式引入了复杂的表示挑战,通常导致结果不佳。幸运的是,Kolmogorov-Arnold网络(KAN)[21]最近在深度学习中受到了广泛关注,因为它具有强大的数据拟合能力和灵活性,显示出替代传统MLP的潜力。与MLP相比,KAN使用可学习的激活函数通过调整基函数来控制其拟合能力。此外,基于KAN的TimeKAN[22]在多个数据集中取得了先进的性能,展示了KAN在时间特征表示方面的显著潜力。这些考虑促使我们探索KAN在不同频率上表示模式,从而为预测提供更多信息。
受这些观察的启发,我们提出了基于KAN的自适应频率选择学习架构(KFS)来应对由噪声和混合数据模式引起的预测挑战。具体来说,KFS首先通过移动平均对数据中的成分进行分解。随后,FreK模块在多个尺度上进行频率选择以去除噪声,并利用KAN从去噪数据中学习特定尺度的时间特征。最后,混合模块将对齐和融合回望窗口中的时间戳嵌入与相应的尺度表示,实现跨尺度的时间表示对齐和集成,以精确建模时间特征。通过平均聚合不同尺度的特征,并通过简单的线性映射将其投影到所需的预测范围。凭借我们精心设计的架构,KFS在多个真实世界数据集的长期时间序列预测任务中取得了先进的性能。
我们的贡献可以总结如下:
  • 我们设计了一种基于能量分布的频率选择方法,有效提取了信噪比更高的成分。由此产生的FreK模块减少了噪声影响,实现了高效建模。
  • 我们提出了一种简单而有效的预测模型KFS,并开发了一个混合模块,用于对齐和融合多尺度时间序列及其对应的时间戳。
  • 全面的实验表明,我们的KFS在多个数据集的长期预测任务中取得了先进的性能,同时表现出出色的效率。

部分摘录

时间序列预测

近年来,用于时间序列预测(TSF)的深度学习方法受到了广泛关注,主要包括基于CNN、MLP和Transformer的方法。
基于CNN的方法通过卷积操作提取时间特征表示。例如,MICN[23]和TimesNet[19]通过策略性地调整其架构的感受野来提高序列建模的准确性。与CNN方法相比,基于Transformer的方法

动机

在物理世界中,时间序列数据来源于物理设备上的传感器或对现实世界关系的记录。这些测量数据由于获取方法、机械传输过程和记录机制等因素而包含不同程度的噪声干扰。这种噪声显著影响了时间序列分析任务的结果,特别是预测和异常检测。因此,开发减轻

架构概述

核心挑战在于解决与通道无关的信息的序列建模问题,同时有效减少噪声的影响。为此,我们提出了一种简单而有效的架构,即基于KAN的自适应频率选择学习架构(KFS),通过有机整合KAN来捕获多尺度通道无关特征和时间表示,从而提高预测准确性。KFS的总体架构如图2所示。

数据集和基线

我们在六个真实世界数据集上进行了长期预测实验:ETT系列[35]、电力[36]、天气[35]和交通[19]。根据以往研究[19]、[37]建立的协议,我们将ETT系列的数据集分为训练集、验证集和测试集,比例为6:2:2。对于其余数据集,比例为7:1:2。数据集的详细描述见表1。
我们仔细选择了时间领域的代表性模型作为基线

结论

在本文中,我们提出了一种基于KAN的时间序列预测模型(KFS),该模型结合了基于Parseval定理的频率选择性过滤方法,旨在解决数据噪声和复杂时间表示问题。所提出的模型采用了多尺度架构。在每个尺度上,模型根据频域中数据的能量分布进行数据过滤,同时使用KAN进行复杂数据表示学习。

CRediT作者贡献声明

吴长宁:撰写——原始草稿,软件开发,项目管理,方法论研究,数据分析,概念化。吴高:撰写——原始草稿,验证,数据分析,形式化分析。蔡荣耀:撰写——原始草稿,验证。刘勇:撰写——审稿与编辑,监督,资金获取。张可欣:撰写——审稿与编辑,监督,项目管理。

写作过程中生成式AI和AI辅助技术的声明

在准备这项工作时,作者使用了DeepSeek来改进语言。使用该工具后,作者根据需要审查和编辑了内容,并对发表文章的内容承担全部责任。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

致谢

本工作得到了国家自然科学基金(编号:62503419)和浙江“先锋”和“领头鹅”研发计划(编号:2026C02A1250)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号