用于线性和循环时间序列的联合动态混合自回归模型,及其在风速和风向数据中的应用

《Applied Mathematical Modelling》:Joint dynamic mixture autoregressive model for linear and circular time series with application to wind speed and direction

【字体: 时间:2026年02月20日 来源:Applied Mathematical Modelling 5.1

编辑推荐:

  线性-圆形双变量时间序列的动态混合自回归建模研究提出JDMAR模型,结合混合von Mises自回归(圆形变量)和混合高斯自回归(线性变量),通过时间变动的混合概率捕捉动态交互,并验证其在风能数据中的有效性。

  
郑海涛|米贤辉|张毅|黄国清
西南交通大学数学学院,中国成都,610031

摘要

由线性和循环成分组成的双变量时间序列分析在许多科学领域中面临着显著的建模挑战。这些困难源于多重性、非平稳性和动态依赖性等复杂特性。本研究提出了一种专为这种复杂时间序列设计的联合动态混合自回归模型。该模型建立在条件建模结构中,其中循环成分遵循冯·米塞斯自回归过程的混合模型,而线性成分则受高斯自回归过程的混合模型控制。关键在于,利用时变混合概率来捕捉系统的动态演变以及两个变量之间的复杂相互作用。我们开发了一种高效的期望最大化算法用于参数估计,并建立了其渐近性质。通过蒙特卡洛模拟以及对风速和风向数据的实际应用验证了模型的性能。模拟结果证实了估计量的一致性和有效性,同时实证结果也展示了该模型对观测序列的复杂联合动态的出色拟合能力。最终,这种方法为线性和循环时间序列分析提供了一个灵活且强大的框架,具有广泛的适用性。

引言

包含线性变量和循环变量的圆柱形数据的统计建模[1]在应用数学和时间序列分析中提出了独特的挑战。这类数据结构在气象学、海洋学和能源科学等学科中至关重要,特别是在风能资源评估中,风速和风向之间的复杂耦合是一个关键因素。正如Fisher[2]、Mardia和Jupp[3]所建立的,这些变量的独特拓扑约束需要超越传统线性框架的专门建模技术。尽管在静态领域中方向分析已经相当成熟,但最近的综述表明,开发能够捕捉多重性和时变依赖性的圆柱形变量的灵活动态模型仍然是一个重要的未解决问题[1],[4]。
历史上,建模框架已经从单变量基础发展到多变量方法。对于线性序列,自回归积分移动平均(ARIMA)类及其相关的条件异方差模型(GARCH)提供了严格的理论基础[5],[6]。方向统计学的并行发展为角度周期性引入了包裹自回归过程[7]。然而,将这些领域整合到一个统一的联合模型中已被证明并非易事。早期的尝试,如角度-线性分布[8]或隐马尔可夫模型(HMM)[9],虽然有效地处理了某些静态或制度转换特征,但往往难以同时考虑边界连续性、不对称性和高频预测所需的连续显式自回归动态。最近,基于混合分布的时间序列建模方法取得了进展,包括贝叶斯推断的混合双自回归模型[10]和双带阈值混合自回归模型[11]。这些研究为将混合分布与自回归结构相结合提供了严格的框架,从而激发了将这种可解释的基于混合的动态模型扩展到圆柱形数据设置中的动力。
近年来,最先进的方法转向了多变量概率建模和计算智能方法。一种流行的方法是使用copula理论来构建灵活的依赖结构。例如,Wang等人[12]成功应用copulas对复杂地形中的联合概率密度进行了建模,Liu等人[13]利用它们对工程结构的疲劳寿命进行了评估。特别针对风能领域,Liu和Yan[14]采用了非参数copulas,并证明了这种方法可以显著改进风能评估的联合概率密度。还提出了其他框架来增强风能利用。例如,Yang等人[15]提出了基于风玫瑰图的联合模型。同时,机器学习技术也被广泛用于线性和循环变量。San等人[16]采用了CNN-LSTM等混合架构进行风速预测,而Tang等人[17]使用了多阶段深度学习模型,专注于短期风向预测。Karami等人[18]进一步强调了基于数据驱动解决方案的实际需求,他们使用运营数据进行了实时估计。最近,Li等人[19]提出了一种自适应时间Transformer,利用注意力机制来处理分布变化。此外,为了解决循环成分中固有的显著偏度和不对称性,Miyata等人[20]最近基于扩展的正弦偏态分布推导出了一类新的圆柱形模型。
尽管取得了这些进展,但在数学上可行且动态可解释的模型方面仍存在关键差距。基于静态copulas[12],[13],[14]和风玫瑰图框架[15]的方法虽然在静态领域捕捉复杂依赖结构方面非常强大,但往往缺乏描述条件分布时变演变的显式机制。相反,深度学习模型[16],[17],[18],[19]尽管预测准确,但作为黑箱系统,对物理调制机制的洞察有限。现有的理论模型,如隐马尔可夫模型[9],虽然能够成功捕捉制度转换,但在参数识别和连续时间依赖性方面常常遇到困难。混合自回归结构为建模湍流风态中常见的多模态条件密度提供了一个直观且数学上可行的框架。
为了解决这些限制,本研究提出了一种在条件概率框架内的联合动态混合自回归(JDMAR)模型,用于线性和循环变量。该模型受到最近气候学研究[21],[22],[23]中成功应用的分解策略的启发,明确地对循环变量条件下的线性变量进行了建模。与静态或纯潜在状态模型不同,所提出的JDMAR框架将时间依赖性直接纳入混合权重和组分参数中。具体来说,混合权重的动态更新基于逻辑链接函数,借鉴了混合自回归模型的方法论见解[24]。这种表述允许精确、可解释地描述循环状态如何调节线性动态,为分析圆柱形时间序列的多模态和非平稳特性提供了强大的数学工具。
本文的其余部分组织如下。第2节介绍了线性和循环变量的JDMAR构建、相应的参数估计方法以及估计量的渐近性质。第3节通过蒙特卡洛模拟研究评估了JDMAR方法的可靠性和一致性。第4节提出了一个案例研究,将模型应用于实际数据集,并将其性能与其他现有方法进行了比较。最后,第5节总结了主要发现。

部分摘录

冯·米塞斯分布

在统计文献中,圆柱形数据指的是循环变量和线性变量的组合[25]。具体来说,循环变量表示一个方向或周期性量,而线性变量表示其在连续尺度上的相应大小或值。冯·米塞斯分布类似于直线上的正态分布,是用于循环数据的最广泛使用的概率模型[2]。
冯·米塞斯分布有两个基本特征

模拟设置

为了全面评估JDMAR模型的参数估计性能,本节详细介绍了蒙特卡洛模拟研究的框架。该研究基于从预先指定的模型结构生成合成数据,并通过重复试验来评估估计结果。模拟的基本设置如下:
  • 1.
    在此模拟中,模型结构被指定为包括两个循环变量状态(

数据和评估指标

本研究的实证分析基于从气象测风塔收集的实际风速和风向数据。观测站点位于中国西北部的一个商业风电场,靠近甘肃和宁夏两省的边界。该地区地形复杂,风能资源丰富,是风能研究的代表性案例。数据集包括以固定采样间隔记录的风速和风向测量值

结论

本研究探讨了包含线性和循环变量的异构二维时间序列的联合动态。通过采用统计条件框架,我们描述了此类数据中固有的复杂关系、多重性和偏度。具体来说,将冯·米塞斯-高斯混合模型与广义线性结构相结合,以捕捉分布特征和动态转换。所提出的JDMAR模型通过多种方法得到了严格验证

CRediT作者贡献声明

郑海涛:撰写 – 审稿与编辑、监督、方法论、数据管理、概念化。米贤辉:撰写 – 原始草稿、软件、方法论、数据管理。张毅:软件。黄国清:撰写 – 审稿与编辑、监督、调查。

利益冲突声明

作者声明他们没有已知的可能会影响本文工作的财务利益或个人关系。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号