TF-LLM:利用时频大型语言模型提升时间序列分析能力
《Neural Networks》:TF-LLM: Enhanced Time Series Analysis with Time-Frequency Large Language Models
【字体:
大
中
小
】
时间:2026年02月10日
来源:Neural Networks 6.3
编辑推荐:
时间序列分析中,传统方法难以平衡时域局部依赖与频域全局周期性。本文提出TF-LLM框架,融合时间域(TD)与频率域(FD)特征,结合大语言模型(LLM)与提示学习,实现多任务处理(预测/分类/填补/检测)。通过跨模态时频特征提取与LLM的语义推理能力结合,有效捕捉多尺度依赖,在7个基准数据集上验证其优于基线方法。
张宇航|于子同|戴明同|孙月|谭涛
大湾大学计算与信息技术学院,
摘要
近年来,预训练的大型语言模型(LLMs)逐渐被引入时间序列分析领域,研究人员观察到它们在多任务推理方面具有显著潜力,尤其是在处理复杂符号序列时。然而,如何有效地、深入地利用LLMs在时间序列数据中的上下文推理能力仍然是一个关键挑战。为了解决这一挑战,本研究提出了TF-LLM框架,用于处理时间序列中的各种任务,如预测、分类、插补和异常检测。我们创新地整合了时间和频率域的优势:频率表示简化了数据复杂性,并增强了全局和局部周期模式的捕捉能力,而时间建模则解决了细粒度依赖性问题,减轻了非平稳性的影响。此外,为了提升模型的推理能力,我们引入了提示学习来丰富输入的上下文信息,帮助LLMs更好地理解时间序列数据。我们在七个基准数据集上进行了广泛的多任务实验,涵盖了预测、分类、插补和异常检测等任务。结果表明,所提出的TF-LLM在处理复杂时间序列任务方面表现优于几种现有方法。
引言
时间序列分析在金融、医疗、能源和气象等领域得到广泛应用(Jin等人,2024年;Lim和Zohren,2021年;Shen等人,2023年;Xie等人,2025年;Zhang等人,2024年),其中数据反映了复杂的潜在机制和行为,使其成为决策过程中的关键工具。对这些数据的深入分析可以预测未来趋势、检测异常并提供实时决策支持。时间和频率域的整合在时间序列分析中变得越来越重要(Zhang等人,2022年)。时域(TD)表示侧重于捕捉局部依赖性(Yang和Hong,2022年),揭示了特定时间点和变量之间的动态变化,有助于识别短期趋势和突发异常。同时,频率域将数据转换为频率分量(Yi等人,2024年),使得能够全面分析全局周期性和长期依赖性,弥补了TD分析的局限性。然而,随着时间序列分析复杂性的增加,有效地整合时间和频率域信息并在多个尺度上进一步提升模型的推理能力变得至关重要。
近年来,LLMs因其强大的序列建模和推理能力而受到了跨学科的关注,为时间序列数据的深入探索和多任务处理提供了新的解决方案。它们在自然语言处理(NLP)(Fang等人,2024年)和计算机视觉(Ge等人,2024年;Xie等人,2024年;Ye等人,2025年)等领域展示了出色的推理和泛化能力。大型语言模型如GPT-2(Radford等人,2019年)、GPT-4(Achiam等人,2023年)、LLaMA-2(Touvron等人,2023年)和PaLM(Chowdhery等人,2023年)凭借其庞大的参数规模和广泛的预训练数据,在自然语言处理领域取得了重大进展。通过在大规模数据集上的预训练,这些模型学习了复杂模式,展现了出色的多任务推理和泛化能力,能够高效处理各种自然语言理解和生成任务。
尽管频率域(FD)分析在时间序列预测中的应用日益增多,但仍有许多潜力尚未被挖掘。例如,FEDformer(Zhou等人,2022年)通过结合频谱信息增强了特征提取,而TimesNet(Wu等人,2022年)利用时间卷积网络和快速傅里叶变换展示了频率域在捕捉复杂模式方面的优势。然而,FD模型的发展面临挑战。例如,传统的离散傅里叶变换涉及复数表示,这限制了深度学习技术的应用。此外,FD分析往往侧重于全局依赖性,可能忽略了短期高频信息,影响了其适用性。此外,传统的时间序列分析方法通常从单一模态的数值数据中提取信息,忽略了来自文本等其他模态的丰富上下文信息。因此,将LLMs应用于时间序列分析是一个新的研究方向。时间序列数据具有连续性和非平稳性等独特特征,有效地将这些特征与LLMs的模式识别能力结合起来是一个紧迫的问题。尽管最近的研究尝试将语言模型应用于时间序列任务(Jin等人,2023年),通常是通过将时间序列数据转换为文本输入或将时间序列与LLMs的文本嵌入对齐,但对多模态输入的探索仍然有限。例如,METS模型(Li等人,2024a)利用多模态数据,结合心电图时间序列和临床报告文本,以支持心血管疾病的预测和诊断。然而,METS主要关注医疗领域,限制了其适应其他时间序列任务的能力。此外,虽然某些线性模型(Zeng等人,2023年)、图神经网络(Jiang和Luo,2022年)和Transformer模型(Chen等人,2024年)在特定时间序列任务中表现出色,但当前的方法通常仅适用于短期预测或特定领域应用,在处理复杂的多任务分析时效果不佳。因此,当前研究的一个关键挑战是将LLMs的推理能力与时间和频率域的互补属性结合起来,开发一个统一的框架,以提高时间序列分析的准确性和鲁棒性。
因此,我们的研究动机是开发一个统一的框架,该框架利用LLMs的强大推理和生成能力,同时结合时间序列数据的独特时间和频谱特征,如图1(a)所示。我们的TF-LLM框架通过将提示学习与领域专家知识相结合,增强了时间序列数据处理的推理能力,有效克服了现有方法的局限性,并开辟了新的分析途径。利用LLMs,该框架统一了时间和频率域信息,提升了时间序列的分析和预测能力,同时捕捉了局部依赖性和全局模式。时域提供了对局部关系的深入分析,而频率域揭示了全局模式和周期特征。这种无缝集成使框架在多任务场景中表现出色。TF-LLM在预测、分类、插补和异常检测等任务中表现出色,将LLMs的优势扩展到了时间序列分析领域。时间和频率特征的结合提升了多任务环境中的适应性和推理能力,在金融、医疗和气象等领域显示出广泛的应用潜力。
本文的贡献如下:
•我们提出了一个统一的框架TF-LLM,能够同时处理四种任务:预测、分类、插补和异常检测,实现了集成式多任务处理。
•时间和频率域的结合增强了时间序列数据的处理能力。频率域捕捉了全局周期性和趋势,提高了异常检测的准确性,而时域关注局部关系并适应非平稳性。两者共同使模型能够有效捕捉多尺度依赖性,在多任务分析中表现出色。
•通过利用LLMs和提示学习,并结合专家知识,模型的推理和多任务能力得到了提升,包括预测、分类、插补和异常检测。LLM整合了时间和频率域信息,丰富了时间序列数据的表示,捕捉了局部依赖性和全局模式,展示了广泛的应用潜力。
章节摘录
时间和频率域中的时间序列分析
在时间序列分析中,TD方法(如ARIMA和LSTM)侧重于短期依赖性,但容易受到非平稳性的影响。FD方法通过频率分量分析全局趋势,但忽略了局部依赖性。多尺度方法结合了两者的优势来增强处理能力,例如短时傅里叶变换和连续小波变换等技术,尽管它们受到窗口和基函数选择的限制。多任务学习(MTL)也有
方法论
所提出模型的流程图如图2所示。在本研究中,我们选择GPT-2作为预训练的LLM来生成提示嵌入,以增强时间序列嵌入。选择它主要是因为其在模型容量和计算效率之间的良好平衡。它具有强大的上下文推理和自回归生成能力,而其相对轻量级的架构允许在训练和推理过程中有效控制计算成本。
实验
在预测、插补、异常检测和分类任务中,我们选择了19个真实世界的数据集(包括能源、天气、交通等),并将我们的模型与25个最先进的基线模型进行了比较。进行了广泛的实验来评估TF-LLM架构的性能。
讨论与结论
尽管所提出的TF-LLM框架在各种代表性的时间序列任务(包括预测、插补、异常检测和分类)中表现出优越的性能和强大的任务泛化能力,但在实际应用和适应性方面仍存在某些限制,这需要在未来的研究中进一步探索和改进。
首先,TF-LLM依赖于预训练的LLMs来进行任务表示和语义指导。尽管这项工作
CRediT作者贡献声明
张宇航:撰写——原始草稿、方法论、形式分析。于子同:撰写——审稿与编辑、监督、资金获取。戴明同:资源、数据管理、概念化。孙月:撰写——审稿与编辑、监督。谭涛:撰写——审稿与编辑、监督。
利益冲突声明
作者声明以下可能被视为潜在利益冲突的财务利益/个人关系:于子同报告获得了大湾大学的财务支持。于子同与大湾大学存在雇佣关系。如果还有其他作者,他们声明没有已知的可能会影响本文工作的财务利益或个人关系。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号