基于贝叶斯神经网络的季节性降水预测不确定性分解与量化研究

《Atmospheric Research》：Uncertainty decomposition and quantification of seasonal precipitation forecasting based on Bayesian neural networks

【字体：大中小】 时间：2026年02月08日 来源：Atmospheric Research 4.4

编辑推荐：

　　本研究针对季节性气候预测中固有的不确定性问题，利用贝叶斯神经网络（BNN）对基于TelNet模型的机器学习季节性预报（MLSF）进行了不确定性分解与量化。研究人员通过变分推断和蒙特卡洛（MC）丢弃法将TelNet重构为贝叶斯框架，分别使用ERA5再分析数据和CMIP6历史模拟进行训练，评估了连续（集合）和分类（三分位）预测策略。结果表明，ML-偶然不确定性（数据相关）平均比ML-认知不确定性（模型相关）高两个数量级，是预测不确定性的主要来源；CMIP6训练的模型虽具有较高的偶然不确定性，但校准性更好；连续目标训练的模型不确定性低于分类模型。该研究为季节性降水预测提供了可靠的不确定性量化方法，对提升气候预测的可靠性具有重要意义。

季节性气候预测对于农业规划、水资源管理和灾害预防至关重要，但由于气候系统的混沌本质和预测模型的局限性，这类预测始终伴随着显著的不确定性。传统的确定性预测无法提供概率信息，而概率预测虽然能表达不确定性，却很少对其来源进行深入分解和量化。在实际应用中，决策者不仅需要知道预测结果的可能范围，更需要了解这些不确定性有多少来自数据本身的随机性（偶然不确定性），有多少来自模型的不完善（认知不确定性）。这种分解对于改进模型、评估预测可靠性以及指导数据收集策略都具有关键意义。

近年来，基于机器学习的天气预测（MLWF）发展迅速，甚至在短中期预报中超越了传统的动力模型。然而，基于机器学习的季节性预报（MLSF）进展相对缓慢，主要瓶颈在于再分析和观测数据集的时间长度不足以训练稳健的模型。为了解决数据量不足的问题，一些研究尝试利用气候模型（如CMIP6）的长期模拟数据来训练MLSF模型，并取得了比单独使用再分析数据（如ERA5）更具技巧性的预报结果。但是，这些模拟数据本身固有的噪声可能会传播到机器学习模型中，从而影响预测的不确定性。目前，对于不同训练数据集（如CMIP6与ERA5）所引入的不确定性尚未有系统的量化分析。

为了填补这一研究空白，发表在《Atmospheric Research》上的这项研究，由Enzo Pinheiro和Taha B.M.J. Ouarda共同完成，他们创新性地将一种名为TelNet的季节性降水预测神经网络模型，通过贝叶斯框架进行重构，旨在精确量化并分解其预测不确定性。研究人员选择了预报技巧相对较高的南美洲作为研究区域，以提升研究的针对性和代表性。

为开展这项研究，作者主要应用了几个关键技术方法。首先，他们将确定性的TelNet模型转化为贝叶斯神经网络（BNN），核心是引入了因子化高斯潜变量分布，并采用变分推断（VI）来近似计算难以处理的后验分布，同时以蒙特卡洛（MC）丢弃法作为对比方案。其次，在模型架构中集成了变量选择网络（Variable Selection Network），该模块能动态地为不同气候指数分配实例级权重，有效处理小数据集上的特征选择问题。第三，研究采用了两种不同的预测目标表示策略：一种是生成季节性降水标准化异常的连续经验分布（基于连续排名概率评分CRPS损失），另一种是预测三分位类别（低于正常、接近正常、高于正常）的概率（基于负对数似然NLL损失）。第四，利用来自18个CMIP6模型的历史模拟（1851-1981）和ERA5再分析数据（1941-1981）分别训练模型，并在ERA5数据（1982-2002验证，2003-2023测试）上评估性能。最后，遵循Kwon等人（2020）的方法，将总预测不确定性分解为ML-偶然不确定性和ML-认知不确定性两个组成部分，并采用排序概率评分（RPS）和可靠性图等指标全面评估概率预报的准确性和校准度。

3.1. 不同实验设置下的不确定性比较

研究人员设计了八种不同的实验设置，结合了两种训练数据集（ERA5, CMIP6）、两种贝叶斯近似方法（变分推断/KL, MC丢弃）和两种预测目标（连续/ENS, 分类/Categ）。分析发现，ML-偶然不确定性在所有实验中都占主导地位，其量级平均比ML-认知不确定性高出约两个数量级。这表明，对于季节性降水预测，数据固有的随机性是不确定性的主要来源，而模型参数的不确定性贡献相对较小。具体而言，使用ERA5数据训练的模型通常表现出较低的偶然不确定性，但这可能是因为ERA5是单一的、物理一致的数据集，模型学习到的预测分布较窄；而使用包含多个模型的CMIP6模拟训练的模型，则由于不同模型间预测因子-预测对象关系的多样性，引入了更多的变异性，从而表现出更高的偶然不确定性。在预测目标类型方面，使用连续目标（ENS）训练的模型在大多数情况下比使用分类目标（Categ）的模型具有更低的偶然不确定性，因为离散化过程会导致信息丢失，增加预测的模糊性。

3.2. 概率准确性与校准性

概率准确性通过排序概率评分（RPS）进行评估。总体而言，基于CMIP6模拟训练的TelNet模型比基于ERA5训练的模型表现出更高的概率准确性（即更低的RPS）。特别是在使用连续排名概率评分（CRPS）损失函数时，CMIP6模型的性能最佳。可靠性分析显示，ERA5训练的模型虽然不确定性较低，但常常表现出过度自信，即预报概率高于实际观测到的频率，校准性较差。相反，CMIP6训练的模型，尽管偶然不确定性较高，但其概率预报与观测频率更为匹配，校准性更好。季节分析表明，无论哪种模型，在南半球夏季（DJF）的预报校准性均优于冬季（JJA），这与夏季ENSO等遥相关信号更强、可预报性更高是一致的。

3.3. 模型对不同海温强迫的响应

通过分析2015-2016年强厄尔尼诺（El Ni?o）、2007-2008年拉尼娜（La Ni?a）以及2012-2013年中性海温条件下的预报案例，研究人员考察了模型的响应特性。在强厄尔尼诺和拉尼娜事件中，所有模型都能大致捕捉到典型的降水异常空间分布型，但ERA5训练的模型通常给出更高的预报概率（显得更自信），而CMIP6训练的模型概率值相对较低，空间分布更为平滑。在不确定性的空间分布上，预报概率高的区域通常对应着低的ML-偶然不确定性，而ML-认知不确定性在整个空间场上始终维持在极低的水平。在中性年，各模型间的预报分歧增大，CMIP6训练的模型，尤其是使用分类目标的模型，倾向于给出接近气候态的概率分布，反映了在缺乏强海洋强迫时预测信心的不足。ERA5训练的模型则仍会在某些区域给出较高的概率。

本研究通过将TelNet模型置于贝叶斯框架下，成功地对季节性降水预测中的不确定性进行了分解和量化。核心结论指出，预测不确定性主要源于数据本身的特性（ML-偶然不确定性），而非模型参数的不确定性（ML-认知不确定性）。利用CMIP6多模型集合的长期模拟数据进行训练，虽然会引入一定的噪声导致较高的偶然不确定性，但能够产生校准性更好、在实际应用中可能更可靠的概率预报。相比之下，使用单一的ERA5再分析数据训练，虽然可能获得表面上看更“确定”的预报，但这些预报往往存在过度自信的问题，校准性不佳。此外，研究证实了使用连续目标变量优于分类目标变量，因为前者能保留更多信息，减少因离散化带来的不确定性。

这项研究的意义在于，它为评估和改进基于机器学习的季节性气候预报提供了一套系统的不确定性量化框架。研究结果强调，在选择训练数据时，需要权衡数据的“清洁度”（如ERA5）和数据的“广度”（如CMIP6多模型集合），后者对于获得经过良好校准的概率预报可能更为重要。同时，极低的认知不确定性也提示，在当前的数据量和模型结构下，参数不确定性已得到较好控制，未来降低预测不确定性的努力应更侧重于理解和减少数据中的噪声，以及探索更具信息量的预测因子。该方法为开发更可靠、可解释的季节性气候服务产品奠定了坚实基础。

热点排行

新闻专题