在高频比特币数据上的算法投资策略中,神经网络信息器的应用

【字体: 时间:2026年02月13日 来源:Expert Systems with Applications 7.5

编辑推荐:

  比特币高频自动交易策略研究:基于Informer模型与不同损失函数的实证分析,对比了5/15/30分钟数据下使用RMSE、GMADL、Quantile损失函数的Informer模型与传统技术指标策略的绩效,发现GMADL在高频场景表现更优,并构建了可复现的开源评估框架。

  
Filip Stefaniuk | Robert ?lepaczuk
华沙大学经济科学学院,D?uga街44/50号,00-241华沙,波兰

摘要

本文研究了使用Informer架构为高频比特币数据构建自动化交易策略的方法。提出了三种基于Informer模型的策略,并分别采用了不同的损失函数:均方根误差(RMSE)、广义平均绝对方向损失(GMADL)和分位数损失。这些策略与“买入并持有”基准策略以及两种基于技术指标的基准策略进行了对比评估。评估使用了不同频率的数据:5分钟、15分钟和30分钟的间隔,在6个不同的时间段内进行。尽管基于分位数损失的Informer模型并未超越基准策略,但另外两种模型的表现更好。使用RMSE损失的模型在处理高频数据时性能下降,而采用新型GMADL损失函数的模型则从高频数据中受益。当在5分钟间隔上进行训练时,该模型在大多数测试期间都优于其他策略。本研究的主要贡献在于应用和评估了RMSE、GMADL和分位数损失函数,并利用这些预测结果开发了自动化交易策略。研究结果表明,使用GMADL损失函数训练的Informer模型可以比“买入并持有”方法获得更好的交易效果。

引言

开发自动化交易策略是一项具有挑战性的任务,长期以来一直吸引着机构投资者和个人研究人员。随着计算能力的提升和机器学习(ML)的发展,越来越多的自动化算法被开发并应用于市场。据估计,目前70%到80%的市场交易是由自动化交易软件完成的(Yadav, 2015),预计这一比例在未来几年还会继续增加。
尽管过去许多系统能够处理日常市场数据,但在高频交易和先进计算能力的时代,这已经不够了。特别是在比特币等资产的交易中尤为明显。比特币(BTC)是一种去中心化的数字货币,允许通过比特币网络进行点对点交易,该网络使用区块链技术构建了一个安全的公共账本。它最初由一位或一群使用化名“中本聪”的人在2009年发布的一篇匿名白皮书中提出(Nakamoto, 2009)。自那时起,比特币的受欢迎程度不断提高,出现了许多促进比特币买卖的加密货币交易所。这种资产以其高波动性而闻名;例如,2017年比特币价格上涨了近20倍,达到19,497美元,随后下跌了84%;2021年比特币再次创下历史新高,达到63,314美元,但随后又跌至34,770美元,跌幅接近55%(1)。自从比特币现货ETF获得批准后,其价格波动性有所减弱。尽管如此,与更传统的投资工具相比,比特币的价格波动仍然很大。
本研究探讨了为比特币构建自动化交易策略的想法。基于2019年8月21日至2024年7月24日的高频比特币历史数据(5分钟、15分钟和30分钟间隔),提出了五种策略并进行评估。前两种策略作为基准策略,基于经典的技术指标,即移动平均收敛发散(MACD)和相对强弱指数(RSI)。其余三种策略则采用了Zhou等人(2021)提出的Informer模型,这是一种先进的基于注意力的神经网络模型,旨在有效处理长时间序列数据,从而根据模型预测结果选择交易头寸。
本研究旨在回答以下研究问题:
  • 问题:
    是否可以创建一种比“买入并持有”方法更高效的比特币交易算法?
  • 问题:
    Informer模型的信号是否可以帮助我们创建比基于技术指标的策略更高效的比特币交易策略?
  • 问题:
    选择机器学习模型的损失函数如何影响策略的表现?
  • 问题:
    使用更高频率的数据是否能够创建更高效的策略?
回答这些问题需要设计和实施一种方法来比较各种交易策略。这种比较是本研究的主要贡献。据我们所知,目前还没有其他研究使用分位数或GMADL损失函数训练Informer模型,并将其预测结果用于生成买卖信号以开发自动化交易策略(Michańków, Sakowski, & ?lepaczuk, 2024)。本研究对该方法进行了全面分析,包括与“买入并持有”策略和两种基于技术指标的策略的对比,使用了不同时间间隔的数据以及多个时间段的数据。最后,还进行了敏感性分析,以展示参数变化对测试策略表现的影响。此外,本研究还提供了一个开源的框架,用于高效比较交易策略,该框架可在GitLab上获取,便于重现研究结果(2)。
本研究的新颖之处不在于提出了一种新的架构或损失函数本身,而在于系统地将Informer模型与不同的损失函数(RMSE、分位数、GMADL)结合在一起,用于设计交易策略。虽然这些组件在文献中都曾被单独研究过,但据我们所知,这是首次将它们结合应用于高频比特币交易场景,并将其性能与基于技术指标的策略和“买入并持有”基准策略进行对比。
论文的结构如下:第2章回顾了相关文献,并简要概述了以往的类似研究。第3章解释了数据的获取和预处理过程,并分析了研究中使用的数据集。第4章正式定义了交易策略的概念,介绍了比较指标,并详细介绍了每种策略的细节。第5章展示了实验结果,详细说明了策略超参数的选择过程,并展示了策略评估的结果及敏感性分析。第7章总结了整个研究。

文献综述

金融市场效率的研究有着悠久的历史。多年来,研究人员一直在努力开发能够预测金融资产价格走势的算法,并基于这些信号创建自动化交易策略。开发出能够持续超越市场表现的自动化系统的概念非常吸引人,因此每年都有数千篇相关论文发表。

数据

本研究使用的数据涵盖了2019年8月21日至2024年7月24日期间BTC/USDT加密货币对的交易记录(共5年)。选择2019年8月作为起点是有意为之的。虽然早期年份的比特币历史价格数据是可获得的,但来自Binance等主要交易所的可靠分钟级数据仅从2019年中期开始才持续可用。在此之前的数据由于交易所停机等原因存在大量缺失和不一致之处。

方法论

本章描述了各种交易策略及其评估方法。为了公平比较各种策略,需要对每种策略进行明确定义,建立明确的比较标准,并确定用于比较策略不同方面的指标。这些内容在本章的开头部分(4.1)有详细说明。后续部分(4.2)介绍了研究中比较的策略。对于每种策略,都详细说明了如何选择交易头寸的机制。

实验

第4章中描述的评估框架和策略是在Python中实现的,并在Gitlab仓库中公开发布(20)。技术指标的计算使用了TA-lib库(21),Informer模型的训练使用了PytorchForecasting(22),而Informer的实现代码来自以下Github仓库(23)。

敏感性分析

对Informer模型参数的敏感性分析需要对每个修改后的参数重新训练模型,但由于计算成本较高,这超出了本研究的范围。不过,本节简要分析了影响策略超参数选择的因素对策略表现的影响。

结论

本研究旨在探索创建比特币自动化投资策略的不同方法。提出了五种策略,其中两种基于技术指标信号,三种基于Informer机器学习模型的预测。这些策略在六个不同的时间段内对BTC/USDT数据(5分钟、15分钟和30分钟间隔)进行了独立评估。对于每个数据窗口和每个频率,首先使用机器学习模型对策略进行了训练。

未引用的图表和表格

未引用的图表和表格:图1、图2、图3、图4、图5、图7、表8

CRediT作者贡献声明

Filip Stefaniuk:概念构思、数据整理、正式分析、研究调查、方法论设计、资源准备、软件开发、验证、数据可视化、初稿撰写、审稿与编辑。
Robert ?lepaczuk:概念构思、正式分析、研究调查、方法论设计、项目管理、监督工作、验证、审稿与编辑。

利益冲突声明

作者声明他们没有已知的财务利益冲突或个人关系可能影响本文的研究结果。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号