探索时间序列预测模型的碳足迹
《Journal of Cleaner Production》:Exploring the carbon footprint of time-series prediction models
【字体:
大
中
小
】
时间:2026年05月04日
来源:Journal of Cleaner Production 10
编辑推荐:
马晓琳|张成龙
韩国首尔国民大学商学院
摘要
人工智能(AI)正在迅速发展。然而,它通过大规模计算追求精确度(“红色AI”)引发了关于可持续性的担忧。尽管机器学习的最新进展显著提高了预测性能,但现有研究主要关注准确性,而很大程度上忽视了相关的环境成本。在高频率金融预
马晓琳|张成龙
韩国首尔国民大学商学院
摘要
人工智能(AI)正在迅速发展。然而,它通过大规模计算追求精确度(“红色AI”)引发了关于可持续性的担忧。尽管机器学习的最新进展显著提高了预测性能,但现有研究主要关注准确性,而很大程度上忽视了相关的环境成本。在高频率金融预测中,这种忽视尤其成问题,因为持续的模型训练和推理会产生大量的碳排放。为了解决这一差距,我们提出了一个二维评估框架,该框架同时评估预测性能和碳排放。利用比特币数据的1分钟间隔,并在模型架构(XGBoost、LSTM和Transformer)、硬件配置、数据量和学习策略上进行控制实验,我们对准确性-排放权衡进行了系统分析。结果表明,在同时考虑准确性和排放的情况下,LSTM是最有效的选择。值得注意的是,采用四步预测一步的配置在80,000个样本上进行了训练,表现出最佳性能,结合了高准确性和中等碳成本。这项工作挑战了两个常见假设:更大的数据集不一定能提高准确性,以及高性能图形处理单元并不总是更优越的,因为轻量级模型在通用硬件上可以更高效地运行。这些发现共同扩展了关于可持续AI的研究,强调了准确性和生态效应之间的权衡。总体而言,这项研究通过强调算法设计的生态效应,推进了对“绿色AI”的理解。这项工作强调了将环境考虑纳入AI实践的重要性,并将绿色发展纳入AI伦理,使得AI系统更加节能和可持续。
引言
时间序列分析在二十一世纪的数据挖掘中被广泛认为是具有挑战性的问题(Shin等人,2021年)。其方法能够跨多个领域进行预测,包括气象学、地震活动、金融市场和旅游业(Alsharef等人,2022年;Bi等人,2023年;Jin等人,2024年;Kim等人,2025年)。作为世界上最大和最有影响力的加密货币,比特币在金融预测中占据着独特的地位(Munim等人,2019年;Ranjan等人,2023年;Tripathy等人,2025年)。鉴于比特币价格对全球金融系统稳定性的潜在影响,对其进行高频率预测至关重要(Rodrigues和Machado,2025年)。尽管用于时间序列预测的机器学习模型发展迅速,但现有研究主要将预测准确性作为主要的优化目标。相比之下,对模型训练和部署的环境后果关注较少,特别是在高频率金融预测中,模型需要连续且大规模地运行。这种忽视造成了一个关键差距,因为准确性的提高往往是以更高的能源消耗和碳排放为代价的。这在现有文献中是一个被大大忽视的问题,这与可持续性和AI伦理的原则相悖。
在AI伦理方面,已经进行了大量关于公平性、透明度和隐私的研究(Kaur等人,2022年;van Wynsberghe,2021年)。然而,AI算法的环境影响却受到了有限的关注。全球零碳研究中心估计了ChatGPT的碳排放量。例如,自2022年11月30日ChatGPT-3部署后的前60天内,来自硬件制造、模型训练和运行的碳排放超过了814.61吨。要从大气中吸收这么多二氧化碳(CO2),需要种植超过65,000棵树。仅模型训练产生的552吨排放量就相当于126个丹麦家庭的年能源消耗量(Jobin等人,2019年;Kaur等人,2022年;van Wynsberghe,2021年)。DeepSeek的最新兴起进一步凸显了AI对环境的影响(Gibney,2025年)。DeepSeek因其开源和高性能特性而受到欢迎,其性能可与ChatGPT和类似模型相媲美,同时产生的能源消耗和碳排放远低于ChatGPT(Deng等人,2025年)。这种情况强调了开发更环保的AI解决方案和优先考虑可持续、环保的AI的紧迫性。同样,需要连续进行分钟或小时级别训练和学习的比特币预测模型也会产生大量碳排放。
文献回顾显示,目前关于AI模型碳排放的研究主要集中在医学成像、短文本识别和分类任务上(Anthony等人,2020年;Sulaimani和Starkey,2023年)。然而,时间序列预测模型的碳足迹尚未得到探索。此外,现有减少碳排放的研究主要集中在硬件和地理因素上。从硬件的角度来看,研究人员通过测量各种中央处理单元(CPU和GPU)的能源消耗来分析碳排放(Patterson等人,2022年)。在位置方面,一些研究比较了高碳强度和低碳强度地区(如英国和丹麦)的模型训练碳排放(Anthony等人,2020年)。其他研究则基于训练时段比较了碳排放,比较了高峰和非高峰电力消耗时间的结果(Sulaimani和Starkey,2023年)。对这些模型产生的碳排放的研究仍然有限。此外,先前的研究没有系统地考察关键建模选择(如模型架构、硬件配置、数据量和学习策略)如何共同影响预测性能和环境成本之间的权衡。因此,对于希望在实际应用中平衡准确性和可持续性的从业者来说,指导有限。
因此,这项工作解决了三个问题。关于第一个问题,4M框架(包括模型、机器、机械化和地图(Patterson等人,2022年)包含了针对机器学习的优化处理器,如张量处理单元(TPU)和高级GPU(例如V100和A100),提供了显著的效率提升。然而,分析是使用Transformer模型进行的,留下了其他模型类型是否也有类似结论的问题。此外,作者建议稀疏模型相对于密集模型可以将计算成本降低五到十倍。为了扩展这一研究方向,我们将基于树的模型——极端梯度提升机(XGBoost)——与两种广泛用于时间序列预测的深度学习架构(长短期记忆(LSTM)网络和Transformer)进行了比较,这在CodeCarbon碳排放监控模型选择中有所体现。这种比较使我们能够研究在相对简单和更复杂的模型家族之间,准确性和碳排放之间的平衡是否有所不同。尽管所考虑的时间序列模型比大型语言模型(LLM)小,但它们的连续高频率预测意味着预测准确性和碳排放之间的权衡会累积成具有经济意义的长期能源成本。
问题1:所有模型在高性能GPU上的表现都更好吗?硬件选择如何影响它们的碳排放?
第二个研究方向关注数据量的作用。许多学者和公司认为,在大规模数据集上训练模型可以确保准确性和稳定性,这是最近大规模语言模型发展的基础。此外,一些研究将每日低频数据与每5分钟更新一次的高频比特币价格数据进行了比较(Ranjan等人,2023年)。我们使用的是1分钟间隔的高频比特币数据,包含一百万个观测值。数据集被划分为不同大小的子集以分析数据量的影响,并应用了10折交叉验证程序来增强模型的稳健性。这种设计使我们能够系统地检查数据量、预测准确性和碳排放之间的关系。
问题2:增加数据量是否始终能提高预测准确性,这对碳排放有什么影响?
最后,我们考虑了学习方法在构建时间序列预测中的作用。对于机器学习来说,输入窗口的设计直接影响时间依赖性的捕获方式,这可能会影响准确性和能源消耗。
问题3:各种学习方法如何影响预测准确性和碳排放之间的权衡,哪种策略提供了最有利的平衡?
这项研究旨在挑战传统观点,即时间序列模型唯一考虑的是准确性。相反,这项工作引入了一个二维评估框架,平衡了准确性和碳排放。通过调整模型的学习方法和超参数,我们实现了性能和能源效率之间的最佳权衡。据我们所知,这是首次将环境考虑纳入高频比特币预测的实证研究,扩展了金融预测研究的范围,以符合更广泛的可持续性和AI伦理关切。该研究确立了一条可持续的AI发展路径,并鼓励AI企业和相关行业反思其企业社会责任。在大型AI模型快速发展的时代,培养所有权和责任感至关重要,以确保追求极端准确性不会导致过度的能源消耗。这项研究还为企提供了减少能源消耗的实际策略,有助于实现可持续AI发展的更广泛目标。
本文的其余部分结构如下。下一节回顾了关于碳排放的文献。第3节概述了研究方法。第4节展示了研究结果,并讨论了它们的意义和贡献。最后,提出了局限性和对未来工作的建议。
时间序列预测中的代表性模型范式
时间序列预测的最新进展产生了多种模型变体,特别是Transformer架构的扩展。例如Informer(Zhou等人,2021年)、EMFormer(H. Chen等人,2026年)和iTransformer(Huang和Zhang,2024年)通过修改注意力机制、序列分解或表示结构来增强长距离依赖性建模。它们已成功应用于多个领域,包括金融、能源等。
方法
为了研究比特币价格波动预测中的预测准确性和碳排放之间的关系,我们使用了XGBoost、LSTM和Transformer模型,并结合了CodeCarbon监控工具。该研究设计遵循了一个结构化的实验框架,包括三个控制实验,每个实验都隔离了特定变量,以便严格比较模型性能和相关碳成本。
方法论流程包括五个连续步骤:
研究1:比较不同GPU配置下的碳排放
研究1检查了在各种GPU环境下运行的XGBoost、LSTM和Transformer模型的碳排放。尽管单次训练运行的碳排放相对较低,但在现实的高频率预测场景中,由于模型频繁使用分钟级比特币数据进行重新训练或更新,总体碳足迹可能会变得相当大。由于大规模模型中的主要排放源是GPU消耗,因此了解这一点至关重要。
讨论
这项研究提供了对高频比特币价格预测中预测准确性和碳排放之间权衡的系统评估。结果表明,可持续性结果是由模型架构、硬件配置、数据量和学习策略共同决定的,而不仅仅是预测准确性。
研究结果与现有关于机器学习效率和可持续性的文献一致并进行了扩展。首先,一致的结果表明……
作者贡献声明
马晓琳:撰写——审稿与编辑、撰写——原始草稿、可视化、验证、方法论、调查、形式分析、数据管理、概念化。
张成龙:撰写——审稿与编辑、可视化、监督、项目管理、方法论、资金获取、概念化。
资助
本研究得到了韩国国家研究基金会(NRF)的资助(编号2025S1A5A800561611)和韩国政府(科学技术信息通信部)的高性能计算支持项目(编号N2025-0069)的资助。
利益冲突声明
我们没有已知的可能会影响本文报告工作的竞争性财务利益或个人关系。我们没有需要声明的利益冲突。
马晓琳是韩国首尔国民大学商学院的博士候选人,同时也与中国银川的宁夏理工学院有关联。她的研究兴趣包括媒体管理、大数据分析与需求预测、绿色AI和AI伦理。
电子邮件:hyolyn@kookmin.ac.kr
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号