由于股票价格时间序列具有复杂的统计特性,预测股票价格仍然是一项艰巨的任务。股票价格通常伴随着高水平的噪声,对外部宏观经济冲击、政策干预和投资者情绪变化非常敏感,并且经常受到市场崩盘或突然上涨等极端事件的干扰。这些时间序列本质上是非平稳的:它们的均值和方差会随时间演变,违反了许多传统计量经济模型的平稳假设(Wiley, 2011)。此外,明显的非线性依赖性和长记忆效应意味着过去的市场事件会对未来价格产生持久影响(Chen, Hussain, Cauteruccio, & Zhang, 2023)。波动聚集——即持续高或低方差时期——进一步增加了准确预测的难度(Patel, Shah, Thakkar, & Kotecha, 2015)。综上所述,这些内在复杂性凸显了需要专门且鲁棒的预测框架,以有效应对股票价格预测所面临的独特挑战。
早期研究采用了传统的机器学习技术,如决策树、支持向量机(SVM)和随机森林(Kara, Boyacioglu, Baykan, 2011, Kumar, Thenmozhi, 2006)。后续研究采用了深度架构,特别是卷积神经网络(CNN)和循环神经网络(RNN),其中长短期记忆(LSTM)单元因其捕捉时间依赖性的能力而受到特别关注(Fischer, Krauss, 2018, Hoseinzade, Haratizadeh, 2019)。然而,每个模型家族都有众所周知的局限性:基于树的模型和SVM模型对噪声敏感,无法表达长距离动态;而CNN和LSTM模型容易过拟合、超参数不稳定,并且处理非常长的序列时计算开销较大(Chen et al., 2023)。
为了克服这些限制,特别是在高效建模长距离依赖性方面,Transformer架构为时间序列预测开辟了新的途径,展示了其在建模全局模式方面的卓越能力(Wang, Chen, Zhang, & Zhang, 2022)。然而,传统的Transformer需要大量的数据和计算资源,并且仍然容易受到分布漂移和极端值异常的影响(Tay, Dehghani, Bahri, & Metzler, 2022)。最近的改进,例如iTransformer,通过针对序列数据定制架构部分缓解了这些缺陷(Liu et al., 2023);然而,要应对金融序列的完整复杂性,还需要进一步的进展。
平行研究探索了多模态预测,将文本新闻、社交媒体情绪或宏观经济指标与价格数据相结合(Cheng, Yang, Xiang, & Liu, 2022)。报告的收益通常是渐进的,多模态流程引入了对齐挑战、增加了计算成本,并且容易受到噪声或无关信号的影响(Lakkaraju et al., 2024)。此外,数据收集的高成本和新闻处理中的固有延迟往往限制了实际应用(Zhang, Sjarif, & Ibrahim, 2024a)。
虽然这些进展代表了重要的进步,但如何同时有效应对所有挑战仍然是一个未解决的问题,特别是非平稳性和适应性。为了弥合这些剩余的差距,我们提出了一个模块化的深度学习框架,该框架整合了RevIN、CNN、即插即用的Transformer变体和BiLSTM用于股价预测。可逆实例归一化(RevIN)减轻了非平稳性和极端市场事件的影响;CNN模块捕捉短期局部价格模式;可互换的Transformer模块(例如Transformer、iTransformer)有效学习长距离依赖性;双向LSTM(BiLSTM)层在两个方向上建模时间动态。这种模块化设计使得可以轻松集成新的Transformer架构,确保对未来创新的适应性。
我们的主要贡献总结如下。
- •
面向未来的模块化。 支持无缝插入任何Transformer变体,无需更改周围模块。
- •
在非平稳性下的鲁棒性。 RevIN显著降低了对市场制度转变、极端事件和规模变化的敏感性。
- •
高效的长序列建模。 RevIN–CNN –(Transformer变体)–BiLSTM级联实现了高预测准确性,并且计算成本可控。
- •
出色的跨市场泛化能力。 在四个不同的股票数据集上的实证结果表明,尽管训练和测试环境之间存在显著的分布差异,但仍能保持高预测准确性。