提升多步骤水资源需求预测性能:静态特征、历史特征、未来特征及周期性特征的重要性分析

《Journal of Water Process Engineering》:Improving multi-step water demand forecasting performance: Static, past, future, and periodic feature importance

【字体: 时间:2026年02月09日 来源:Journal of Water Process Engineering 6.7

编辑推荐:

  多步水需求预测中,基于时空融合Transformer(TFT)的周期性增强模型(PE-TFT)通过引入傅里叶变换(FFT)提取24小时周期性特征,结合静态变量、历史观测变量和未来已知时间变量,实现了更优的可解释多步预测效果。摘要分隔符:

  
阮瑞|马亚灿|苏九洲|周晓|刘树明
合肥工业大学土木工程学院,中国合肥230009

摘要

准确的多步水需求预测对于优化供水系统的运行和调度至关重要。许多研究主要集中在单步预测上,而对影响预测性能的因素的深入分析尚未得到充分探索。本研究全面分析了水需求数据的特征,并结合了静态变量、过去观测到的变量以及已知的未来时间变量,使用时间融合变换器(TFT)模型进行可解释的多步预测。鉴于城市居民水需求的显著周期性变化,本研究还应用了快速傅里叶变换(FFT)来提取周期性子序列,并探讨了周期性对预测准确性的影响。所提出的周期性增强型TFT(PE-TFT)模型有效捕捉了水需求数据的周期性和复杂的时间特征。结果表明,PE-TFT模型在多步水需求预测方面表现出色,所有误差指标均优于现有研究的结果,实现了高准确性和可靠的可解释性。可解释性分析量化了静态变量、过去变量、未来变量和周期性变量在不同预测时间范围内对预测性能的差异性贡献。总体而言,“24小时周期性子序列”、“水需求”及其变换具有很强的预测影响力,而“高峰期”和“节假日”在多步预测中也起着相对重要的作用。

引言

人均水资源减少和人均水需求增加已成为全球性挑战,这引发了人们对供需平衡的担忧[1]。实现这一平衡需要高效监测和管理水资源分配系统(WDS),而水需求预测在其运行和规划中起着关键作用。准确的水需求预测使WDS能够实时分配资源,从而减少浪费并节约用水[2]。然而,由于水需求预测的复杂性、对天气和温度等协变量的依赖性以及消费者用水行为的不可预测性,这一任务本身就具有挑战性[3]。这些挑战促使了大量研究致力于提高预测准确性并确保可持续的水资源管理。
机器学习和深度学习作为计算机科学中的重要工具,在处理复杂和非线性数据集方面表现出色,因此非常适合用于水需求预测。因此,该领域的研究显著增加。机器学习模型,如支持向量回归(SVR)[4]和随机森林(RF)[5],通过非线性映射被证明在预测任务中有效。人工神经网络(ANN)[6]通过模仿生物神经网络的结构实现了准确的预测结果。在深度学习领域,循环神经网络(RNN)及其变体,如长短期记忆(LSTM)网络[7]和门控循环单元网络(GRUN)[8],由于能够通过循环结构捕捉时间依赖性,特别适用于时间序列数据建模。然而,在执行多步水需求预测任务时,这些模型在生成不同长度的满意输出方面存在局限性,主要是因为它们在捕捉序列中的长期依赖性方面存在不足[9]。为了解决这个问题,基于序列到序列框架的注意力机制开始受到关注。例如,Transformer[10]模型利用注意力机制关注所有输入位置并捕捉全局信息,从而实现任意长度的准确预测,使其适用于多步时间序列预测任务[11],[12]。Tian和Qian的[13]实验从实证上验证了这一点,其中Transformer模型在预测中国水需求方面优于LSTM,在7步预测中平均绝对百分比误差(MAPE)降低了23%。
另一种提高多步预测性能的有效方法是捕捉水需求中的周期性和趋势等特征。通过识别和提取这些模式,预测模型可以更好地理解数据中的潜在结构,从而得出更准确和可靠的预测结果[14]。常用方法包括傅里叶变换(FT)和集成经验模态分解(EEMD)。EEMD通过添加白噪声克服了传统经验模态分解(EMD)的模式混合问题,使其能够从非线性数据中清晰地提取不同频率或周期性特征。正如Zhao等人[15]的工作所示,引入EEMD显著提高了原始LSTM模型在预测洛阳未来几个月降水量时的预测准确性,R2提高了26.99%。FT通过假设信号可以表示为余弦波的组合,将时域数据转换为频域数据。这从频域角度提供了对数据结构的清晰理解,并有助于提取相应的周期性成分。快速傅里叶变换(FFT)是一种常用的计算方法,已应用于水需求数据的预处理阶段以提高预测准确性[16]。例如,Aswanuwath等人[17]使用FFT提取季节性成分,与未使用FFT的模型相比,MAPE提高了22.61%。然而,上述研究仍未对输入特征进行全面深入的分析,特别是数据的静态属性(如平均水需求)和已知的未来时间变量(如预测时间范围内的时间、节假日)。此外,它们也没有充分解释输入特征与输出之间的关系,这使这些技术被视为高风险的人工智能技术,并导致其在WDS中的禁用[18]。
为了解决预测过程中的透明度问题并提高模型性能,研究人员越来越关注可解释模型。这些模型旨在揭示传统方法的“黑箱”性质,并通过提供预测生成方式的透明解释来增加结果的可靠性。可解释模型通常分为两类[19]:(1)自解释模型,包括决策树和具有注意力机制的模型,其在决策过程中本质上是透明的;(2)模型不可知的解释方法,如局部可解释模型不可知解释(LIME)[20]和Shapley加性解释(SHAP)[21],它们通过独立于模型架构分析输入输出关系来提供可解释性。Pu等人[22]应用LIME方法分析了他们提出的多步水需求预测模型的可解释性,得出结论:周期内水需求、周期间水需求和温度对预测结果有积极影响,而降雨和湿度则有负面影响。然而,该方法仅提供事后解释,没有深入分析每个变量在模型推理中的作用,从而限制了其动态提高模型性能的能力。尽管自解释模型解决了上述局限性,但大多数方法仅关注过去观测到的变量,而忽略了静态变量或已知的未来时间变量。这阻碍了所有变量类型的全面利用,可能会限制模型的预测能力。基于注意力机制的动态交互方法可以为多类型变量提供更深入和全面的分析。
为了深入和全面地利用静态变量、过去观测到的变量和已知的未来时间变量来提高多步水需求预测性能,基于多头注意力机制的时间融合变换器(TFT)提供了一个有前景的解决方案[23]。TFT利用门控机制和变量选择模块来有效控制信息流并选择最相关的变量,从而提高预测性能。此外,它还使用可解释的自注意力层动态捕捉广泛的时间依赖性,并量化特定输入特征的贡献,提高了模型的可解释性。该模型通过系统考虑多个变量实现了高预测准确性,并通过可解释性分析提供了可靠的结果[24],[25]。基于这些优势,TFT近年来已广泛应用于各种实际预测任务[26],[27],[28],[29]。例如,多项研究使用TFT进行能源相关的时间序列预测,通过联合建模静态变量、过去观测到的变量和已知的未来时间变量,展示了其在捕捉复杂时间依赖性和提供可解释预测结果方面的有效性[30],[31]。在一项代表性研究中,Niu等人[19]应用TFT预测风力发电量,与Transformer相比,MAPE提高了21.3%。可解释性分析阐明了模型捕捉到的多个预测因子和时间动态的关键影响。值得注意的是,在实施TFT之前,提出了一种季节-趋势表示算法来捕捉风力发电数据的独特特征,提高了模型的预测性能。同样,Wu和Wang[32]也采用了在TFT建模之前明确捕捉时间结构的策略,提出了一个两阶段分解-TFT框架用于风速预测。通过使用基于EMD-EMD的方法分解原始序列并将重构的成分整合到TFT框架中,他们的混合模型实现了改进的预测性能,MAPE值降低了6.1–9.1%。他们的结果进一步表明,明确提取的时间成分(如季节-趋势结构、分解的子序列或其他结构化时间表示)在预测性能中起着关键作用。然而,尽管现有研究强调了时间成分的重要性,但它们并未明确解释时间序列数据的固有周期性成分如何影响TFT模型的预测性能,也不知道模型在预测过程中如何利用这些周期性成分。
为了利用周期性模式进行预测增强,并全面研究周期性特征及相关特性对TFT性能的影响,本研究通过提出周期性增强型TFT(PE-TFT)框架对原始TFT架构进行了改进。所提出的PE-TFT模型包含了三项核心创新:(1)准确捕捉水需求数据中的多尺度时间周期性,以量化各种周期性成分带来的预测性能提升;(2)系统研究静态变量、过去观测到的变量和已知未来时间变量的不同配置,以评估它们对多步水需求预测的影响;(3)提供可解释性分析,以阐明周期性成分和异构输入变量如何贡献于模型的预测。通过提供这些机制洞察,PE-TFT框架不仅提高了预测准确性,还为日常调度和运营规划提供了信息,同时支持有针对性的数据监控和更明智的供水系统运营决策。

数据描述和预处理

本研究使用的数据来自2024年第三届WDSA/CCWI联合会议的水需求预测竞赛(BWDF)。该竞赛提供了一组实际分区计量区(DMA)的城市水需求数据,以及区域特征和服务用户数量。根据竞赛指南,参赛团队需要预测一周的水需求数据,评估指标用于评估提交的结果。

基于快速傅里叶变换的周期性增强

为了最小化168步预测中的误差,准确捕捉数据中的周期性至关重要。方程(1)、(2)、(3)详细描述了水需求数据在时域和频域之间的相互转换过程。图5(a)展示了水需求数据的FFT谱,其中在0.0417的频率处观察到一个明显的峰值,对应于24小时的周期性(1/0.0417)。这一发现证实了FFT有效捕捉了

结论

本研究提出了PE-TFT框架,通过其可解释性架构全面研究了多步水需求预测中的关键预测变量,包括周期性特征、静态变量、过去观测到的变量和已知的未来时间变量。当应用于市中心附近具有混合商业和住宅区的DMA的实际水需求数据时,PE-TFT模型不仅在预测性能上超越了现有方法

CRediT作者贡献声明

阮瑞:撰写——原始草稿、可视化、验证、方法论、正式分析。马亚灿:可视化、方法论、正式分析。苏九洲:撰写——审稿与编辑、项目管理、资金获取。周晓:撰写——审稿与编辑、验证、概念化。刘树明:监督、项目管理。

利益冲突声明

作者声明以下可能被视为潜在利益冲突的财务利益/个人关系:
周晓报告称获得了中国国家自然科学基金的财务支持。苏九洲报告称获得了安徽省自然科学基金联合项目的财务支持。如果有其他作者,他们声明没有已知的财务利益或个人关系可能

致谢

本工作得到了中国国家自然科学基金(授权号52370098)和安徽省自然科学基金(授权号2208085US05和No. 2308085US05)的联合项目的财政支持。在准备本工作期间,作者使用了AI工具进行语言润色,以提高手稿的可读性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号