一种用于具有块结构和重复测量数据的贝叶斯时空功能模型及其在降水分析中的应用

《Environmetrics》:A Bayesian Spatiotemporal Functional Model for Data With Block Structure and Repeated Measures

【字体: 时间:2026年01月27日 来源:Environmetrics 1.7

编辑推荐:

  本文提出了一种新颖的贝叶斯时空功能回归模型,用于分析具有块结构(如ENSO气候相位)和重复测量(如多年观测)的复杂数据。该模型巧妙整合了固定和随机功能预测因子、通过Matérn类建模的空间协方差,并利用B样条基展开有效捕捉时空依赖性及块内相关性。研究基于巴西戈亚斯州21年降水数据,通过大量模拟验证了模型在参数估计、先验敏感性、样本量影响及预测性能方面的稳健性。结果表明,该框架能显著提升对ENSO等周期性气候现象影响降水变异的解析能力,为环境科学、农业规划及气候变化研究提供了重要的方法论进步。

  
1 引言
雨养农业是巴西主要的谷物生产系统,其土壤水分完全依赖于降水。因此,降水量的任何变化都会影响土壤水分供应,进而影响作物最终产量。气象数据集对于农业规划、管理和可持续性至关重要。然而,巴西作为大陆国家,地面气象站的可用性和分布有限,这为开发决策平台带来了挑战。降水估算由于其高度的空间和时间变异性而仍然是一个重大挑战。如果气候数据没有得到充分建模或拟合,可能会损害依赖这些信息的分层模型的有效性。为了克服这一差距,本研究引入了一种新颖的时空回归模型,该模型明确包含了代表反复出现的气候效应(如ENSO相位)的块结构,增强了模型捕捉此类现象对降水变异影响的能力。
2 具有块结构和重复测量的时空功能模型
本研究提出了一个结合了固定和随机效应曲线作为预测因子,同时适应重复测量块结构的时空模型。令Yijkt表示在块i内的第j次重复测量,在时间点t∈T和位置sk= (latk, lonk)观测到的值。该模型表述为包含整体均值函数、随机空间效应、随机时间效应和时空随机误差的加性结构。均值函数通过纬度、经度和时间维度上的三次B样条基的张量积展开进行平滑建模。空间和时间随机效应同样采用B样条基展开,其系数服从多元正态分布,协方差结构分别捕捉空间(如Matérn协方差)和时间相关性。模型进一步整合了块结构,以容纳同一气候相位(如ENSO块)内的重复测量之间的相关性。完整的协方差结构考虑了空间、时间、块效应以及残差误差的贡献。这种功能方法能够解释响应变量与时空条件之间的非线性关系,并有效纳入复杂的时空依赖结构。
3 贝叶斯方法
由于所提出模型的复杂性,其联合后验分布没有闭合形式。因此,采用贝叶斯方法进行推断,使用吉布斯采样器(Gibbs sampler)从联合后验分布中生成样本。对于没有闭合形式全条件分布的参数,在吉布斯采样器中结合了Metropolis-Hastings步骤。先验分布的选择至关重要,模拟研究表明,对于方差参数,逆伽马(Inverse Gamma)先验(形状参数0.001,尺度参数0.01)通常能产生更稳定和准确的估计。模型比较和参数(如Matérn协方差中的平滑度参数κ)选择使用边际伪似然对数(LPML)和偏差信息准则(DIC)等标准。为了处理高计算负载,利用了Rcpp和Armadillo包进行高效计算。
4 模拟研究
4.1 方差分量先验分布的敏感性分析
模拟研究评估了不同先验分布(逆伽马与缩放逆卡方)对模型方差分量估计的影响。结果表明,对于空间和时间效应的方差分量,逆伽马先验(形状参数0.01,尺度参数0.01)比缩放逆卡方先验产生更接近真实参数值的估计,后者往往使估计偏向零。而残差方差的估计对不同先验选择相对稳健。覆盖概率分析表明,逆伽马先验家族总体上能产生可接受的覆盖概率(通常>90%)。
4.2 位置数量和重复测量样本量的敏感性分析
研究了位置数量(S)和每个块内重复测量数量(ni)对参数估计的影响。增加S或ni通常会导致更精确和更稳定的固定效应参数估计。然而,对于空间和时间随机效应的方差分量,增加样本量并未显著提高估计精度,这可能是由于这些方差分量的代数复杂性所致。覆盖概率在所有场景下均保持较高水平(>90%),表明估计过程的质量良好。
4.3 参数κ的选择
评估了模型选择标准(LPML, DIC)从一组候选值中恢复Matérn相关结构中真实平滑度参数κ的能力。模拟结果表明,LPML和DIC标准在识别真实κ值方面非常有效,准确率超过98%,证明了这些标准在模型设定中的实用性。
4.4 时空功能模型的预测能力
通过从训练数据中留出位置或时间点,评估了模型的预测性能。计算了新观测值的后验预测分布。结果表明,95%的预测区间成功涵盖了大部分留出的测试数据。增加训练数据中的位置数量(S)或重复测量次数(ni)会导致更窄的预测区间,从而表明预测能力得到改善。即使对于未用于模型训练的位置(外推预测),预测区间也表现出良好的覆盖范围。
5 降水数据的应用:巴西戈亚斯州研究
将提出的模型应用于巴西戈亚斯州87个气象站1980年至2001年(21年)的月降水数据。根据海洋尼诺指数(ONI)将年份分类为厄尔尼诺(El Ni?o)、拉尼娜(La Ni?a)或中性(Neutral)块。模型配置使用B样基展开(例如,固定效应K1=12, K2=12, K3=9)并通过模型比较标准选择κ=0.2。后验估计显示,所有关键参数(如方差分量)的Gelman-Rubin统计量均接近1,表明马尔可夫链已收敛。模型成功捕捉了不同ENSO阶段(块)下降水的时空模式。功能箱线图显示了不同气候条件下不同的季节模式和降水峰值。
为了评估预测性能,将站点分为“训练兼预测”、“仅训练”和“测试”集。对于“训练兼预测”站,为未来时期(例如,2001-2002年中性,2002-2003年厄尔尼诺,2007-2008年拉尼娜)计算了预测区间。尽管区间较宽,但所有观测到的平均降水值都落在其各自的预测区间内。对于一个完全未参与训练的“测试”站,预测区间也表现出类似的良好覆盖性能,表明模型具有良好的外推能力。该模型不仅检测到年度降水的趋势,还揭示了这种变化在一年中并不均匀,并且随不同气候区域而变化。功能方法提供了更精确的降水估计,而贝叶斯视角允许构建可信区间,有助于农民决策(例如预测最小量和累积降水)和农业政策制定(例如通过数据插补重建不完整时间序列)。
6 结论
本研究引入了一个先进的时空功能回归模型,用于估计和预测具有块结构和重复测量的降水数据。该模型通过B样条基展开和贝叶斯推断,有效地捕捉了复杂的时空依赖性和块内相关性。模拟研究验证了模型在参数估计、模型选择和预测方面的稳健性。在巴西戈亚斯州降水数据上的应用成功捕捉了不同ENSO相位下的降水模式,并显示出良好的预测能力。该模型的方法学进展和实际应用价值,使其成为分析复杂时空气候数据和支持农业、环境管理决策的宝贵工具。其灵活性和准确性有助于应对与气候变异和资源效率相关的区域和全球挑战。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号