动态图学习在股票预测中整合时间关系的应用

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年03月02日 来源：Expert Systems with Applications 7.5

编辑推荐：

　　股票预测中动态图神经网络DyG4TR通过整合DTW测距和领先滞后关系，结合动量效应与多切片架构捕捉时空依赖，在CSI500和NASDAQ100上实现20.98%的回报率提升。

张立峰|戴子月|曾倩茹|林年旺|夏宏杰|赵可宇|张萌|刘森|叶光楠|吴杰|柴洪峰

复旦大学计算机科学与人工智能学院，上海，200438，中国

摘要

由于金融市场的不确定性和波动性，股票预测是一项具有挑战性的任务。最近的研究越来越多地采用深度学习方法来模拟复杂的市场动态。股票市场的一个关键特征是相关公司之间的价格变动具有相互依赖性，这可以使用图神经网络自然地建模。现有方法的一个显著缺点是它们未能充分考虑股票之间的内在动态关系。这些关系可以通过两种不同的方式量化：一种是通过动态时间规整（DTW）测量的距离，另一种是领先-滞后关系。DTW是一种挖掘时间序列数据相似性的技术手段。领先-滞后关系是金融市场中的一个显著现象。为了解决这些限制，我们提出了动态图学习整合时间关系（DyG4TR）方法，该方法构建了动态关系，并引入了一种新的水平/垂直图学习架构来整合短期和长期的时间依赖性。此外，我们利用金融市场中的动量效应来捕捉股票预测中的动量特征，并独立计算每个时间片的损失，从而实现更准确的表示学习。通过挖掘时间序列数据中固有的内在和时间关系，我们的方法在不需要额外关系数据的情况下达到了最先进的性能。在CSI 500和NASDAQ 100指数上进行的实验表明，我们的方法有效地解决了动态和嘈杂市场环境中股票预测的相关挑战，回报率的最大提升达到了20.98%。

引言

股票预测在金融和机器学习研究领域都是一个关键任务。它的目标是通过分析历史市场数据和其他相关因素来预测未来的股票价格或动量。传统的股票预测方法主要使用时间序列分析和统计技术，包括Ariyo, Adewumi, & Ayo (2014)和Abarbanell & Bushee (1997)的技术分析方法；Penman (2013)；Yan & Zheng (2017)。

近年来，深度学习的进步催生了新的股票预测方法框架（Kumar, Jain, & Singh (2021); Sezer, Gudelek, & Ozbayoglu (2020); Zou et al. (2022)，以及各种提高预测性能的建模工具和架构（Chung et al. (2025); Zhao, Kong, & Shen (2023)）。股票预测的机器学习模型的发展已经取得了显著进展，从早期的循环神经网络（RNNs）（Selvin, Vinayakumar, Gopalakrishnan, Menon, & Soman (2017)）发展到更先进的图神经网络（GNNs）（Li et al. (2021); Sawhney, Agarwal, Wadhwa, & Shah (2020); Wang et al. (2022），包括静态和动态形式。早期的RNN方法，如LSTM网络，在捕捉序列数据的时间依赖性方面很有效，但在模拟不同公司之间的复杂相互依赖性方面存在不足。这些限制推动了基于GNN的股票预测方法的发展，这些方法明确利用图结构来表示股票之间的关系（Bukhari, Maqsood, & Sattar (2025）。早期的研究集中在静态GNN框架上，其中图是根据预定义的关系构建的，并在训练过程中保持不变，并在股票市场预测中显示出有希望的结果（Chen, Wei, & Huang (2018); Xia et al. (2024)）。最近的工作转向了动态关系建模，旨在更好地捕捉股票之间的时间依赖性，以提高预测性能（Lee, Ock, & Song (2025）。代表性的方法包括联合建模时间和关系信息（Feng et al. (2019); Liu et al. (2025)），采用基于相关性的邻接矩阵按月更新（Xiang, Cheng, Shang, Zhang, & Liang (2022)），以及构建每日演变的关系图（Qian et al. (2024)）。

然而，当前关于动态图神经网络的研究未能充分考虑股票之间的内在动态关系，这些关系可以从两个方面进行测量：一种是通过动态时间规整（DTW）（Sakoe (1971)）测量的距离，另一种是领先-滞后关系。DTW是一种挖掘时间序列数据相似性的技术。领先-滞后关系是金融市场中的一个显著现象，指的是相关股票之间的顺序价格变动（Chan (1992)。图1提供了GOOG和MSFT股价序列之间关系的全面分析。左下角的图表突出显示了在特定时间范围内两只股票之间的领先-滞后关系，表明MSFT的走势如何跟随GOOG。右下角的图表展示了DTW如何对齐时间序列以量化它们的相似性。黄线说明了DTW算法如何识别两个序列之间的最短对齐路径进行比较。该图表明，动态关系和时间依赖性对于准确的金融市场分析至关重要。

为了解决上述问题，我们设计了生成动态关系的方法，包括DTW和领先-滞后关系。随后，为了更全面地理解动态关系，我们从短期和长期的角度整合数据。因此，我们提出了一种新的水平/垂直信息整合图学习架构来处理动态图数据。此外，我们基于动量效应设计了动量特征（Johnson (2002）。动量效应指的是过去表现良好的股票在未来也倾向于表现良好的现象。然后，我们将动量特征与动态图一起输入到图模块中进行卷积。

这种综合方法为股票预测提供了一个稳健的框架。本文包括4个主要贡献：

•

内在动态关系发现：我们设计了关系提取模块来挖掘股票内部之间的动态关系，包括通过DTW测量的距离和领先-滞后关系，从而更全面地理解数据。

•

多切片信息整合：我们提出了一种新的水平/垂直信息整合图学习架构，可以从多个矩阵切片中学习。这种方法整合了短期和长期的动态关系。短期依赖性模块能够以更高的灵敏度捕捉动态信息，而长期依赖性学习模块则有助于减少噪声的影响。

•

合理利用金融效应：在金融市场中利用动量效应和领先-滞后效应，可以设计出既合理又可解释的特征。

•

有效的损失函数：通过端到端结构独立计算损失，确保每个时间片的表示尽可能精确，从而提高最终预测结果的准确性。

部分摘录

非图模型

早期的股票价格预测方法主要采用传统的机器学习方法。循环神经网络（RNNs），特别是长短期记忆（LSTM）网络（Hochreiter & Schmidhuber (1997），由于它们在处理序列数据方面的能力而成为最初使用的技术之一（Nelson, Pereira, & De Oliveira (2017）。认识到RNNs在捕捉不同公司之间的复杂相互依赖性方面的局限性，研究人员开始探索图

股票预测

给定时间t的金融时间序列数据以及股票i的回望窗口L，任务是预测

p_{i}^{t} = {p_{i}^{t}, p_{i}^{t}, \dots, p_{i}^{t}}

, 任务是预测

{\hat{p}}_{i}^{t}

在

t +1

天的价格，然后计算回报

{\hat{y}}_{i}^{t}

, 可以表示为：

{\hat{y}}_{i}^{t}

. 我们对价格进行标准化，以确保不同股票的数据处于相同的尺度。

图定义

图数据由一系列节点、边和节点特征组成

G = {V, E, X}

. 给定一系列股票实体，每个实体被视为一个节点v

方法论

模型的整体结构配置如图2所示。时间序列首先通过RNN编码器进行编码，然后进行分割。接下来，我们通过DTW在每个时间点生成图。然后，我们基于动量效应和领先-滞后效应设计特征提取方法。提取领先-滞后矩阵，并相应地计算相应的影响值。动量特征与DTW动态邻接矩阵一起被输入到

数据集

如表1所示，我们在CSI 500指数和纳斯达克100指数上进行了实验，数据来自Wind²。CSI 500指数包含500只成分股，是中国市场上最著名的指数之一。纳斯达克100指数包括在纳斯达克证券交易所上市的100家最大的非金融公司，是美国科技行业表现的关键指标。

结论与未来工作

本文提出了一种捕捉股票价格时间序列之间动态相互关系的方法。我们首先对时间序列进行编码并对其进行分割。接下来，我们展示了股票之间动态关系图的生成，并讨论了包括通过DTW测量的距离和领先-滞后效应在内的关系。随后，我们提出了垂直/水平图神经网络架构来分别捕捉短期和长期关系。

作者声明

张立峰：概念化、方法论、写作。

戴子月：方法论、验证、可视化、写作。

曾倩茹：方法论、数据整理、写作。

林年旺：验证、可视化、写作。

夏宏杰：方法论、资源。

赵可宇：数据整理、验证。

张萌：调查、可视化。

刘森：项目管理、监督。

叶光楠：监督、资源。

吴杰：资源、验证。

柴洪峰：监督。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

联系信箱：

粤ICP备09063491号

摘要

引言