有效市场假说(EMH)(Fama, 1970)认为所有可用信息都已充分反映在资产价格中,因此投资者无法基于已知信息持续获得超额回报。作为现代金融理论的基石,EMH影响了全球的投资策略、交易行为和监管框架(Basse, Klein, Vigne, Wegener, 2021, Li, Miu, 2022)。EMH的一个直接推论是随机游走假说,该假说认为资产价格按照类似随机游走的随机过程演变,这意味着未来的价格变化是独立且不可预测的(Godfrey, Granger, & Morgenstern, 1964)。因此,测试随机游走假说提供了一种严格且基础的市场效率评估方法。
大量的实证研究在不同市场检验了随机游走假说。早期研究主要集中在美国和西欧等成熟市场(Corovei, 2019, Erdem, Ulucak, 2016),而后续研究扩展到了信息不对称性和制度摩擦更为普遍的新兴市场(Shet, Padyala, Bommadevara, 2023, Wan, Shen, Zhang, 2023)。例如,Dias等人(2020)发现全球指数之间存在混合结果:道琼斯指数和上证综合指数拒绝了随机游走假说,而西班牙的IBEX35指数和爱尔兰的ISEQ指数则支持这一假说。在中国,Wan等人(2023)表明T+1交易机制改变了日内回报动态,导致了与随机游走行为不一致的系统性动量效应。类似的研究也在外汇(Lyu, 2022, Pincheira-Brown, Neumann, 2020)、商品(Joshi, Mehta, 2023, Mohanty, Mishra, 2020)和加密货币市场(Kang, Lee, Park, 2022, Palamalai, Kumar, Maity, 2021)中进行过。
传统的测试方法——如单位根检验、方差比检验和运行检验——主要评估金融时间序列的结构特征,关注平稳性、方差行为或序列相关性等属性(Aggarwal, 2019, Al Hamdooni, 2023, Altahtamouni, 2023, Karima, Mimoun, Moufdi, 2022, Kucukkaplan, Kiltc, Pazarci, Kar, 2023, Mallesha, Archana, 2023)。虽然这些方法在理论上严谨,但它们只能提供市场效率的间接证据,可能在反映实际的可预测性方面不够直观。
为了提供更直接和易于解释的评估方法,我们提出了“机器学习市场随机性测试”(MART)——这是一种基于预测性能的有效框架,通过预测准确性而非结构假设来评估市场效率。MART直接检验学习模型在预测资产回报时是否能够达到统计上显著的可预测性。如果模型的方向准确性显著超过随机基准(50%),则拒绝随机游走假说。在该框架中,传统的统计测试作为辅助验证工具,用于验证基于机器学习的结果的稳健性和可解释性,从而在经典计量经济学推断和数据驱动的预测评估之间建立了一致的桥梁。
在该框架中,我们使用两类代表性的机器学习模型——大型语言模型(LLM)和简单的前馈神经网络(NN)作为预测代理,以验证所提出的MART方法的有效性。我们的实验集中在少样本预测上,其中LLM仅提供有限的历史序列作为上下文。尽管LLM在推理和语言理解方面具有很强的泛化能力,但在高频金融预测中它们未能达到统计上显著的可预测性,表明仅凭语言知识无法有效转化为数值可预测性。
相比之下,嵌入在MART框架中的简单前馈NN在多个指数和频率上展示了统计上显著的预测准确性。为了进一步评估MART的稳健性,我们将基于NN的实现与Encompassing Test(Chong, Hendry, 1986, Darrat, Zhong, 2000)进行了比较,后者是一种现有的基于神经网络的随机游走假说测试方法。比较表明,MART提供了更准确和易于解释的随机性偏差证据,突显了其作为评估市场效率的基于预测性能的框架的优势。
本研究的主要贡献总结如下:
一种新颖的市场效率测试框架:我们提出了“机器学习市场随机性测试”(MART)框架,这是一种从机器学习角度评估随机游走假说的通用且基于预测的方法。
•LLM预测能力的实证验证:
通过系统的少样本实验,我们证明了大型语言模型(LLM)在高频金融预测中无法达到统计上显著的可预测性,突显了它们在噪声较大、信号较弱环境中的适应能力有限。•神经网络作为统计测试的直观补充:
在MART框架中,简单神经网络作为传统统计测试的有效补充,从更直观、基于可预测性的角度评估随机游走假说。•面向效率的LLM模块设计:
为了解决基于LLM的预测在计算和可扩展性方面的挑战,我们引入了一种基于概率的评估策略和紧凑的批量处理机制,大幅减少了令牌消耗,同时保持了统计有效性和模型间的可比性。•全面的统计和经济验证:
MART结合了正式的假设检验(通过三西格玛规则和准确性分布推断)以及来自主要全球股票指数的tick、1分钟、5分钟和15分钟数据集的累积回报分析,揭示了随机游走假说的频率依赖性偏差和具有经济意义的预测收益。本文的结构如下:第2节回顾了关于随机游走假说和机器学习模型在市场效率测试中的应用的相关研究。第3节详细介绍了所提出的MART框架,包括其神经网络和大型语言模型组件。第4节报告并讨论了不同频率水平的实证发现。最后,第5节总结了研究结果并提出了未来研究的潜在方向。