**RATE:一种基于风险意识的适应性长期时间序列预测方法**
《Neurocomputing》:RATE: A risk-aware adaptive long-term time series forecasting method
【字体:
大
中
小
】
时间:2026年03月02日
来源:Neurocomputing 6.5
编辑推荐:
长期时间序列预测中,现有模型因未有效分离稳定成分与风险信号,导致误差累积和可靠性下降。本文提出RATE模型,通过多尺度语义分解(MSD)分离稳定(趋势、季节、均值)和波动残差,双分支并行预测(稳定预测器SP与不确定性预测器UP),结合风险感知融合模块RAF动态调整权重,有效抑制误差累积并提升长期预测精度。实验表明RATE在8个基准数据集上显著优于SOTA模型。
侯晨宇|胡航格|姜钦凯|曹斌|范静
中国浙江工业大学计算机科学与技术学院,杭州
摘要
长期时间序列预测是一项关键且具有挑战性的任务,因为随着预测范围的延长,由于误差的累积和数据模式的变化,预测的可靠性会下降。尽管许多近期研究提出了新的方法来提高预测准确性,但大多数方法仍然存在误差累积的问题,这导致随着预测范围的增加,预测性能逐渐恶化。为了解决这一限制,我们提出了RATE——一种基于风险的时序预测模型(RATE),该模型明确地对预测不确定性进行建模,并将其作为风险信号来校准预测结果。RATE首先采用多尺度语义分解(MSD)技术,将输入序列分为稳定成分(水平、季节性和趋势)和波动性残差,从而将可预测的结构与复杂的高频动态分离出来。然后,一个双分支预测器并行运行:稳定性预测器(SP)从稳定成分生成初步预测,而不确定性预测器(UP)则对残差波动性进行建模,以在每个时间步骤生成校准后的预测结果和风险信号。最后,风险感知融合(RAF)模块利用风险信号动态地整合初步预测和校准后的预测结果,确保模型在强调稳定模式的同时,在高风险情况下进行选择性调整。在基准数据集上的实验表明,RATE的性能始终优于现有最先进模型,显著提高了长期预测的准确性。我们的代码可在以下链接公开获取:
https://anonymous.4open.science/r/RATE-2BFA引言
长期时间序列预测(LTSF)旨在根据历史观测数据预测目标变量的未来值,在许多实际应用中发挥着重要作用,例如能源管理[1]、金融决策[2]和环境监测[3]。深度学习的最新进展极大地提高了LTSF的性能。最先进的模型采用了精心设计的架构来捕捉时间依赖性,包括基于Transformer的方法(例如iTransformer [4]、PatchTST [5]、TwinsFormer [6])和MLP风格的架构(例如xPatch [7]、PatchMLP [8]、SparseTSF [9]、TimeMixer [10]、HDMixer [14]、CycleNet [15])。
尽管取得了这些进展,但在长预测范围内,预测准确性仍然显著下降。现有方法主要关注短期准确性,常常忽视了误差累积和长期预测中固有的不确定性所带来的影响。这种忽视削弱了预测的可靠性,尤其是在模型面临突然波动或异常趋势时。随着预测范围从几十步扩展到几百步,误差累积、数据非平稳性和序列突变等挑战变得更加突出,严重限制了模型的鲁棒性。如图1所示,包括iTransformer [4]、TimeMixer [10]、WPMixer [16]和SparseTSF [9]在内的主流模型生成的预测结果随时间逐渐偏离真实值。
这些观察结果引出了一个核心问题:
是否可以将预测可靠性的下降建模为一个动态的、可预测的风险信号?并且能否利用这一信号系统地校准预测行为?要回答这个问题,需要在三个维度上克服技术挑战:
- •
可预测结构与波动性波动的纠缠。在现实世界的时间序列中,稳定成分(如水平、季节性和趋势)通常与不规则的残差波动和突发冲击共存。如果这些异质性的变化源没有得到明确分离,风险估计就会变得非常复杂。结果,模型往往会将稳定模式误认为是不确定性,产生虚假的风险信号,从而削弱后续决策的可靠性。
- •
风险分布的非平稳性。长期预测中的风险本质上是非平稳的:预测误差的方差和分布形状会随时间和预测范围的变化而变化。实证序列经常表现出重尾分布[17]、波动聚集[18]和分布偏移[20]。这种动态特性使得简单的高斯假设或与预测范围无关的风险模型变得不适用,通常会导致在波动区域产生过度自信的估计,在稳定时期产生过于保守的估计。
- •
可解释的风险整合。风险的来源应该能够追溯到特定的成分、变量和时间步骤,并且它们对预测的影响应该是单调且可解释的。例如,较高的风险水平应该对应于更强的校准效果,以防止引入可能降低准确性的虚假相关性。因此,第三个挑战是以原则性的方式将风险信号应用于模型的预测机制中,建立风险与预测行为之间的明确关系,为可靠的预测提供坚实的基础。
为了解决这些挑战,我们提出了RATE——一种基于风险的自适应时序预测模型,它可以建模预测不确定性,并将其作为风险信号来校准预测结果,从而提高预测准确性。具体来说,为了解决第一个挑战,RATE首先使用多尺度语义分解(MSD)模块将输入序列分解为稳定成分(水平、季节性和趋势)以及波动性残差,后者被认为是风险的主要来源。在预测阶段,为了有效分离稳定模式的建模和非平稳风险,RATE采用了双分支并行架构:稳定性预测器(SP)生成稳定预测结果,而专门的不确定性预测器(UP)在趋势的背景下对残差进行建模,使其能够解释相对于宏观趋势的短期波动,从而产生调节融合强度的明确风险信号和相应的预测修正。最后,风险感知融合(RAF)模块引入了一种逐步的单权重融合门控机制,将风险信号转换为门控权重,动态调节校准预测和稳定预测之间的融合程度。通过控制每个时间步骤中校准预测的贡献,这种机制增强了模型决策过程的可解释性。这种创新架构将预测任务转变为一个由风险驱动的动态决策框架,使RATE不仅能够提供高精度的预测,还能在稳定模式和波动性不确定性之间自主平衡,从而在每个未来时间步骤生成更可靠和稳健的预测结果。我们的主要贡献总结如下:
- •
我们提出了一种新的预测框架,该框架明确地对预测风险进行建模,并将其作为校准信号用于初步预测。这种范式测量并将风险转化为一个动态的调节信号,指导何时以及如何调整预测,为更可靠的长期预测提供了原则性的途径。
- •
我们设计了RATE,这是一种双分支架构,它将稳定预测与残差风险估计分开,并通过一个单调的、风险感知的融合机制将它们结合起来。这种设计确保在稳定条件下预测结果保持稳健,同时在波动性条件下动态地结合风险驱动的修正,提供了可解释性和适应性。
- •
我们在八个长期预测基准和多个预测范围内进行了广泛的实验。结果表明,我们提出的方法在大多数设置中都显著提高了准确性,同时生成的不确定性信号与实际波动性高度一致,从而强调了其在非平稳风险下的可靠性。
相关工作
相关研究
近年来,传统的深度学习模型,特别是基于Transformer的架构,在解决长序列时间序列预测(LSTF)问题方面取得了显著进展。自2021年以来,提出了一系列创新模型,以降低计算复杂性、减少内存消耗,并增强捕捉内在时间属性(如趋势和季节性)的能力——超越了传统的Transformer。代表性的工作包括Informer
方法论
长期时间序列预测的主要目标是使用历史数据预测未来的值。一个关键挑战是预测可靠性的下降,这源于可预测模式与波动性动态的纠缠、风险的非平稳性以及缺乏将不确定性整合到预测中的机制。为了解决这个问题,本文提出了一种新的预测模型RATE——该模型分离了可预测的
基准测试
我们根据文献中建立的实验协议[11]、[21],在八个广泛使用的长期时间序列预测基准上评估了RATE。如表1所示,这些数据集包括ETT系列(ETTh1、ETTh2、ETTm1、ETTm2)、天气、电力、交通和交易所数据。四个ETT数据集(ETTh1、ETTh2、ETTm1、ETTm2)按照0.6:0.2:0.2的比例被划分为训练集、验证集和测试集。对于其余四个数据集(天气、电力、交通),
结论
在这项工作中,我们解决了长期时间序列预测性能下降的关键问题,这一问题源于现有模型无法明确考虑时变不确定性。我们引入了RATE架构,该架构将风险意识作为预测过程的核心组成部分。通过将输入信号分解为稳定成分和不确定成分,并通过一个单调的风险门控机制动态地融合它们,我们的模型学会了
CRediT作者贡献声明
侯晨宇:撰写——审阅与编辑,撰写——初稿,监督,资金获取,正式分析。胡航格:撰写——审阅与编辑,撰写——初稿,可视化,验证,监督,软件,资源,项目管理,方法论,调查,资金获取,正式分析,数据整理,概念化。姜钦凯:可视化,软件,资源,正式分析。曹斌:可视化,监督,方法论,调查。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
侯晨宇于2021年在中国浙江工业大学获得计算机科学与技术博士学位。他目前是浙江工业大学计算机科学学院的讲师。他的研究兴趣包括数据挖掘和服务计算。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号