生成式扩散模型实现公里尺度对流允许模式的精准模拟与预报

《SCIENCE ADVANCES》:Kilometer-scale convection-allowing model emulation using generative diffusion modeling

【字体: 时间:2026年02月02日 来源:SCIENCE ADVANCES 12.5

编辑推荐:

  本文介绍了一种基于生成式扩散模型的StormCast系统,该研究针对公里尺度对流允许模式(CAM)计算成本高、预报时效性差的瓶颈问题,创新性地结合确定性回归与随机扩散方法,实现了对高分辨率快速更新同化系统(HRRR)的高精度模拟。研究结果表明,StormCast在1-6小时复合雷达反射率预报方面展现出与HRRR相当的技能,并能生成物理合理的对流系统演变,为区域公里尺度机器学习天气预报和未来气候灾害动力降尺度提供了新途径。

  
在天气预报领域,准确预测公里尺度的强对流天气始终是气象学家面临的重大挑战。这类天气系统——包括中尺度对流系统、超级单体、飑线、德雷科和飓风等——常引发极端大风、洪水、冰雹和龙卷风,仅在美国每年造成的经济损失就超过500亿美元。传统的数值天气预报模式虽然能够显式解析对流动力学,但需要惊人的计算资源,导致许多国家难以承担其运行成本,即便有能力运行的国家也不得不在分辨率和集合规模之间进行权衡。
近年来,机器学习模型在粗分辨率(约30公里)的全球天气预报中展现出巨大潜力,其速度比传统数值模型快四个数量级且技能相当。然而,将机器学习成功应用于公里尺度的大气模拟却非易事。这主要面临两大挑战:一是公里尺度的大气动力学远比30公里尺度复杂,流体运动更接近三维湍流,可预报性显著降低;二是现有公里尺度数据的时序分辨率(通常为1小时)不足以捕捉对流过程的快速演变,导致确定性机器学习模型容易产生过度平滑的预报结果,无法再现真实的湍流和风暴形成过程。
为了突破这些限制,研究人员在《科学进展》(Science Advances)上发表了一项创新研究,提出了名为StormCast的生成式扩散模型。该模型旨在精确模拟美国国家海洋和大气管理局(NOAA)最先进的3公里业务化对流允许模式——高分辨率快速更新同化系统(HRRR)。
StormCast的核心创新在于采用了两阶段建模策略。首先,它利用一个确定性模型(基于U-Net架构)来预测未来大气状态的条件均值,捕捉可预报的大尺度演变趋势。然后,引入一个生成式扩散模型来学习并模拟观测与确定性预报之间的残差,即那些难以确定性预测的、随机的中小尺度细节。这种结合使得StormCast能够以1小时为时间步长,自回归地预测99个公里尺度的状态变量,同时考虑26个天气尺度变量作为条件。特别值得一提的是,模型在大气边界层内设置了密集的垂直分辨率,以更好地捕捉对流的精细结构。
关键技术方法
研究团队利用2018年7月至2021年12月约3.5年的HRRR分析场作为训练数据,从中提取公里尺度的中尺度状态变量(Mt)。同时,使用ERA5再分析数据提供天气尺度的条件变量(St)。模型训练分为两个核心阶段:一是训练确定性回归网络Fθ,通过最小化均方误差损失来预测未来状态的条件期望值μt+1;二是训练随机扩散模型D?,其目标是学习在给定条件均值μt+1和当前状态Mt的情况下,残差rt+1的条件分布。扩散模型采用DDPM++ U-Net架构,在64颗NVIDIA H100 GPU上训练了约12万小时。在推理阶段,模型从高斯噪声开始,通过18步去噪采样生成残差,再与确定性预报叠加,最终得到包含随机性的完整预报结果。
研究结果
案例研究
通过具体的天气过程预报案例,展示了StormCast的实战能力。例如,在2024年5月29日12:00 UTC初始化的预报中,StormCast及其五成员集合的概率匹配平均(PMM)产品,在预报第1小时成功捕捉到了HRRR所遗漏的俄克拉荷马州中东部的大反射率区。至预报第6和第9小时,StormCast PMM在捕捉路易斯安那-密西西比边界最南端风暴的高反射率方面表现更优。另一个针对2024年5月16日00:00 UTC初始化的强冰雹事件案例显示,StormCast和HRRR均能预报出强对流风暴,但StormCast单个成员预报的对流单体分布随机性更强,而其PMM产品则能将强雷达回波更合理地整合。
降水预报
定量评估显示,StormCast在降水预报方面具有竞争力。对于20 dBZ(小雨)的阈值,StormCast的集合PMM在1-2小时预报时效内,对于3公里的小窗口尺寸,其分数技巧评分(FSS)显著优于HRRR。随着聚合窗口尺寸增大,优势虽减弱,但其技能在3-6小时预报内仍优于或相当于HRRR。在30 dBZ(中雨)阈值,StormCast PMM的技能与HRRR相当,而单个StormCast预测则系统性低于HRRR。在40 dBZ(大雨)阈值,两个模型均无显著可预报性。与HRRR滞后集合的比较进一步表明,StormCast PMM在最初3小时内对20 dBZ阈值的预报优于HRRR滞后集合。
功率谱和概率分布
对选定变量的功率谱和概率分布验证表明,在3小时预报时效上,StormCast能够产生总体上真实的光谱和分布,其输出与目标数据在统计特性上吻合良好。
降水上升气流的多元形态学
深入分析表明,StormCast能够生成物理上一致的对流动力学特征。例如,在分析模拟的夏季对流时,StormCast输出的峰值雷达反射率异常与显著的低层辐合(上升运动指示)以及延伸至2公里以上的正湿热焓异常在空间上共存,这与观测和云解析模拟的物理预期一致,表明模型成功捕获了潮湿上升气流、冷池形态等关键对流特征。
与数值对流允许集合预报的比较
与NCAR的MPAS模式五成员集合预报的初步比较显示,由于StormCast和HRRR使用了雷达同化的初始场,其在最初6小时内的预报技能显著高于未使用雷达初始化的MPAS集合。这表明利用观测信息初始化对短临预报至关重要。
研究结论与意义
该研究成功证明了生成式扩散模型在模拟公里尺度对流动力学方面的巨大潜力。StormCast不仅能够生成技能与业务化HRRR模型相媲美的降水预报,还能产生物理上合理的、包含中小尺度随机变化的多变量大气状态集合。其快速的推理速度使得生成大规模预报集合成为可能,从而为概率预报和灾害性天气早预警提供了经济高效的解决方案。
这项工作的重要意义在于,它为克服传统公里尺度数值天气预报的高计算成本瓶颈开辟了一条新路径。通过机器学习方法精确模拟对流允许模式,StormCast为改进区域天气预报和未来气候情景下的动力降尺度应用带来了新的机遇。研究也指出,未来的工作方向包括扩大训练数据量、改进集合校准、探索端到端的机器学习同化-预报系统,以及在不同区域和季节进行更广泛的评估,以进一步推动公里尺度机器学习天气预报的发展。

说明:根据您的要求,论文解读文章已撰写。由于您要求的总字数约为2000汉字,而上述解读文章(不包括小标题和此说明)的字数已接近您的要求,因此未再进一步扩展。文章严格基于文档内容,保留了所有专业术语、上下标(已用标签表示)和关键细节,并去除了原文中的文献引用和图示标识。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号