数值天气预报(NWP)是一种基于观测数据使用数学模型表示未来大气状态的主要天气预报方法。多年来,它通过物理过程表示的进步、模型初始化(包括同化)以及集合建模的引入而不断发展(Bauer等人,2015年)。然而,NWP也存在局限性,如预报误差和偏差。虽然预报偏差可能不可避免,但已经开发了几种使用机器学习模型的后处理技术来减轻这些偏差(Liu等人,2023年;Rojas-Campos等人,2023年;Yoshikane和Yoshimura,2022年;Zhang和Ye,2021年;Kudo,2022年;Peng等人,2020年;Tang等人,2021年;Salazar等人,2022年;Xu等人,2020年)。
日本气象厅(JMA)还引入了一种称为MSMG的后处理方法,用于校正中尺度模型(MSM)的误差。MSM具有更细的网格间距(5公里),并针对日本周边区域(JMA,2024年)。在MSMG中,JMA主要采用卡尔曼滤波器、频率偏差校正和神经网络等统计方法来减少MSM中的系统偏差。
本研究旨在使用MSM数据为包括平原、山区和岛屿在内的日本18个地点的降水、温度和风速(代表性气象变量)开发基于机器学习的后处理模型。将预测位置周围网格点的气象变量作为输入特征,并应用基于相关性分析的特征选择方法。在实验设置中,基于LightGBM的模型比测试的神经网络基线模型(包括复制的CNN基线)实现了更低的RMSE,并且在许多地点和预测提前时间内,其RMSE也普遍低于原始MSM预报结果以及JMA的后处理产品MSMG。在基于LightGBM的模型中,那些使用周围网格信息并进行基于相关性特征选择的模型在许多地点和预测提前时间内显示出最低的RMSE。
对于降水预测,我们进一步研究了基于Tweedie的损失函数和事件加权训练策略,这改善了某些地点和降雨阈值下的事件导向指标,尽管RMSE的提升效果有限。
several studies have developed post-processing models for precipitation using methods such as convolutional neural networks (CNNs), neural networks, and Support Vector Machines (Zhang and Ye, 2021; Liu et al., 2023; Rojas-Campos et al., 2023; Yoshikane and Yoshimura, 2022). Among them, Zhang and Ye (2021) conducted comparative experiments on machine learning models, input parameters, and training data periods for precipitation prediction and concluded that LightGBM provided the most balanced performance among the tested models.
在温度后处理模型方面,已经使用了CNN、神经网络和LightGBM(Kudo, 2022; Peng et al., 2020; Tang et al., 2021)。Kudo (2022)开发了一个针对日本关东地区的基于CNN的温度后处理模型,并证明了其优于JMA的MSMG。
利用神经网络和LightGBM也探索了风速后处理模型(Salazar et al., 2022; Tang et al., 2021; Xu et al., 2020)。Xu等人(2020)使用LightGBM进行风速预测,并分析了模型中派生的特征重要性。他们的研究表明,使用所有特征(包括各种天气元素)作为输入比仅使用风速特征的模型表现更好。
除了使用NWP输出外,一些研究还利用了现有天气预报服务的气象预报数据(Iwase and Takenawa, 2024; Tsipis et al., 2023)。Iwase和Takenawa(2024)使用LightGBM、XGBoost和神经网络等机器学习模型来预测山区的气温和降水。通过将周围天气预报数据作为输入变量,结果优于现有的天气预报服务。
在最近的机器学习研究中,深度学习方法在自然语言处理和图像识别等领域取得了显著进展。相比之下,对于表格数据,基于树的模型在准确性方面目前优于深度学习模型,并且需要较少的超参数调整成本(Shwartz-Ziv和Armon, 2022; Grinsztajn等人, 2022)。基于树的模型在处理NWP输出(通常涉及表格数据)时也展示了其效用(Zhang和Ye, 2021; Xu等人, 2020)。最近,Hieta和Partio(2025)报告称,基于树的梯度提升后处理方案(XGBoost)可以降低短期近地面预报的RMSE。
本文的其余部分安排如下:第2节定义了本研究使用的方法和数据。第3节展示了结果和讨论。最后,第4节总结了研究。