包含线性变量和循环变量的圆柱形数据的统计建模[1]在应用数学和时间序列分析中提出了独特的挑战。这类数据结构在气象学、海洋学和能源科学等学科中至关重要,特别是在风能资源评估中,风速和风向之间的复杂耦合是一个关键因素。正如Fisher[2]、Mardia和Jupp[3]所建立的,这些变量的独特拓扑约束需要超越传统线性框架的专门建模技术。尽管在静态领域中方向分析已经相当成熟,但最近的综述表明,开发能够捕捉多重性和时变依赖性的圆柱形变量的灵活动态模型仍然是一个重要的未解决问题[1],[4]。
历史上,建模框架已经从单变量基础发展到多变量方法。对于线性序列,自回归积分移动平均(ARIMA)类及其相关的条件异方差模型(GARCH)提供了严格的理论基础[5],[6]。方向统计学的并行发展为角度周期性引入了包裹自回归过程[7]。然而,将这些领域整合到一个统一的联合模型中已被证明并非易事。早期的尝试,如角度-线性分布[8]或隐马尔可夫模型(HMM)[9],虽然有效地处理了某些静态或制度转换特征,但往往难以同时考虑边界连续性、不对称性和高频预测所需的连续显式自回归动态。最近,基于混合分布的时间序列建模方法取得了进展,包括贝叶斯推断的混合双自回归模型[10]和双带阈值混合自回归模型[11]。这些研究为将混合分布与自回归结构相结合提供了严格的框架,从而激发了将这种可解释的基于混合的动态模型扩展到圆柱形数据设置中的动力。
近年来,最先进的方法转向了多变量概率建模和计算智能方法。一种流行的方法是使用copula理论来构建灵活的依赖结构。例如,Wang等人[12]成功应用copulas对复杂地形中的联合概率密度进行了建模,Liu等人[13]利用它们对工程结构的疲劳寿命进行了评估。特别针对风能领域,Liu和Yan[14]采用了非参数copulas,并证明了这种方法可以显著改进风能评估的联合概率密度。还提出了其他框架来增强风能利用。例如,Yang等人[15]提出了基于风玫瑰图的联合模型。同时,机器学习技术也被广泛用于线性和循环变量。San等人[16]采用了CNN-LSTM等混合架构进行风速预测,而Tang等人[17]使用了多阶段深度学习模型,专注于短期风向预测。Karami等人[18]进一步强调了基于数据驱动解决方案的实际需求,他们使用运营数据进行了实时估计。最近,Li等人[19]提出了一种自适应时间Transformer,利用注意力机制来处理分布变化。此外,为了解决循环成分中固有的显著偏度和不对称性,Miyata等人[20]最近基于扩展的正弦偏态分布推导出了一类新的圆柱形模型。
尽管取得了这些进展,但在数学上可行且动态可解释的模型方面仍存在关键差距。基于静态copulas[12],[13],[14]和风玫瑰图框架[15]的方法虽然在静态领域捕捉复杂依赖结构方面非常强大,但往往缺乏描述条件分布时变演变的显式机制。相反,深度学习模型[16],[17],[18],[19]尽管预测准确,但作为黑箱系统,对物理调制机制的洞察有限。现有的理论模型,如隐马尔可夫模型[9],虽然能够成功捕捉制度转换,但在参数识别和连续时间依赖性方面常常遇到困难。混合自回归结构为建模湍流风态中常见的多模态条件密度提供了一个直观且数学上可行的框架。
为了解决这些限制,本研究提出了一种在条件概率框架内的联合动态混合自回归(JDMAR)模型,用于线性和循环变量。该模型受到最近气候学研究[21],[22],[23]中成功应用的分解策略的启发,明确地对循环变量条件下的线性变量进行了建模。与静态或纯潜在状态模型不同,所提出的JDMAR框架将时间依赖性直接纳入混合权重和组分参数中。具体来说,混合权重的动态更新基于逻辑链接函数,借鉴了混合自回归模型的方法论见解[24]。这种表述允许精确、可解释地描述循环状态如何调节线性动态,为分析圆柱形时间序列的多模态和非平稳特性提供了强大的数学工具。
本文的其余部分组织如下。第2节介绍了线性和循环变量的JDMAR构建、相应的参数估计方法以及估计量的渐近性质。第3节通过蒙特卡洛模拟研究评估了JDMAR方法的可靠性和一致性。第4节提出了一个案例研究,将模型应用于实际数据集,并将其性能与其他现有方法进行了比较。最后,第5节总结了主要发现。