《Artificial Intelligence Science and Engineering》:Time-Series Stock Price Forecasting Based on Neural Networks: A Comprehensive Survey
编辑推荐:
本文针对传统方法在金融非线性时序数据预测中的局限性,系统综述了2015-2025年间基于神经网络的股价预测研究。作者将时序股价预测方法划分为NNs、RNNs、CNNs、Transformers四大类,深入分析了各类模型在不同市场条件下的性能表现,发现混合架构和注意力机制模型在波动市场中具有显著优势。该研究为金融时序预测领域提供了系统参考框架,并指明了融合外部信息与增强可解释性等重要发展方向。
随着金融市场的日益复杂和波动加剧,基于时间序列的股价预测已成为金融领域的关键研究方向。传统预测方法在处理非线性高维数据时面临显著局限,而神经网络凭借其强大的特征提取和模式识别能力展现出巨大潜力。尽管已有若干综述讨论了神经网络在股价预测中的应用,但往往缺乏对使用时序数据作为输入模型的详细考察,且未能涵盖最新研究进展。
为解决这一问题,澳大利亚悉尼科技大学人工智能研究所的Guangyang TIAN、哈马德·本·哈利法大学的Yin YANG以及悉尼科技大学的Shiping WEN三位学者在《Artificial Intelligence Science and Engineering》期刊上发表了题为《Time-Series Stock Price Forecasting Based on Neural Networks: A Comprehensive Survey》的综述论文。该研究系统回顾了2015-2025年间相关文献,将基于时序的股价预测方法分为四类:神经网络(NNs)、循环神经网络(RNNs)、卷积神经网络(CNNs)以及Transformer等新兴模型。
研究人员发现,金融市场是一个内在复杂且不断演化的系统,其行为不仅影响个人投资决策,还常常指导更广泛的国家经济战略。准确预测股价不仅具有财务回报,还能帮助投资者管理风险和制定战略决策。然而金融市场的波动性、非线性和多维复杂性使得精确预测特别具有挑战性。
在技术方法层面,本研究主要采用了文献系统综述法,对2015-2025年间相关研究进行了全面梳理。研究重点关注使用时序股价数据和相关技术指标作为输入的神经网络方法,建立了统一的评估框架,包括误差指标(MSE、RMSE、MAE、MAPE等)、相关性与回归系数(β、R2)、风险收益指标(ROI、Sharpe比率、VaR)以及分类指标(准确率、精确率、召回率、F1-score)四类评价体系。分析涵盖了来自全球多个市场的数据集,包括S&P 500、道琼斯指数、沪深300等主要股指。
神经网络模型的基础架构与金融应用
标准神经网络通过多层感知器结构处理非线性关系,其前向传播过程可表示为h(l)=σ(W(l)h(l-1)+b(l))。在金融预测中,PATEL等研究者采用趋势确定性数据预处理方法重组时间序列,有效抑制短期波动,使网络能专注于更广泛的市场模式。DIXON等将技术指标与宏观经济变量结合输入MLP,在CME市场预测中显示出比逻辑回归和SVM更可靠的趋势预测能力。
循环神经网络对时序依赖关系的建模突破
RNN通过隐藏状态ht=σh(Whxt+Uhht-1+bh)捕捉序列依赖性,但其在长程依赖建模上存在梯度消失问题。LSTM通过输入门、遗忘门和输出门机制克服这一局限,在S&P 500预测中展现出优于传统RNN的性能。GRU作为简化变体,将遗忘门和输入门合并为更新门,在保持性能的同时提升训练效率。注意力机制的引入进一步增强了模型对关键时间步的聚焦能力,如双阶段注意力RNN在NASDAQ-100预测中的优异表现。
卷积神经网络在局部模式识别中的优势
CNN通过卷积操作ht=∑i=0k-1wixt+i+b提取局部特征,特别擅长识别短期价格模式。KIRSCI等构建的三卷积层五全连接层CNN在台股指数和富时指数预测中有效保留了时序结构信息。混合架构如CNN-LSTM结合了CNN的局部特征提取能力和LSTM的长期依赖建模优势,在上证指数和黄金价格预测中均显示出更低的MAE和RMSE值。
Transformer模型对长程依赖关系建模的革命性影响
Transformer通过自注意力机制Attention(Q,K,V)=softmax(QKT/√dk)V实现全局依赖建模,摆脱了序列处理的限制。多头注意力机制进一步增强了模型对不同表示子空间的关注能力。位置编码的引入解决了序列顺序信息缺失问题。WANG等将Transformer应用于多个主要股市,显示出在捕捉股价长期关系方面的独特优势。RAMOS-PREZ等提出的Multi-Transformer通过集成多个Transformer层和bagging技术,在S&P 500波动率预测中优于传统GARCH模型。
研究结论表明,不同神经网络架构在股价预测中各具特色:标准NNs擅长处理非线性关系但难以建模时序依赖;RNNs及其变体通过循环连接捕捉序列结构,LSTM尤其适合跟踪渐进式市场变动;CNNs在识别短期模式方面表现突出;Transformers凭借自注意力机制在波动市场环境中展现出卓越性能。混合架构通过结合不同网络的优点,在各种市场条件下提供了预测性能、稳定性和实用性之间的最佳平衡。
讨论部分指出,尽管神经网络在股价预测中取得显著进展,但仍面临若干挑战。模型可解释性不足限制了其在需要透明决策的金融场景中的应用。数据质量问题如噪声和缺失值影响模型性能,而外部事件如政策变化和经济冲击则可能使基于历史数据的预测失效。过拟合问题在参数众多的大型模型中尤为突出。
未来研究方向包括开发更易解释的时序神经网络,整合外部信息源如新闻和社交媒体数据,以及继续探索混合架构的潜力。将大型语言模型与传统预测管道结合,利用其处理非结构化数据的能力,可能成为重要发展方向。同时,需要针对时序数据特点设计数据增强方法,构建包含市场压力时期的训练集,提升模型在异常环境下的稳定性。伦理和监管考量也将随着这些方法在金融决策中扮演更重要角色而日益凸显。
这项研究为基于时序的神经网络股价预测提供了系统综述,分析了各类模型在不同市场环境下的表现,并指明了解决当前局限性的未来研究方向,为研究者和实践者开发新工具和改进现有方法提供了重要参考。