用于加速天气预报的快速辐射传输神经网络

《Communications in Nonlinear Science and Numerical Simulation》:Rapid Radiative Transfer Neural Network for Weather Forecasting Acceleration

【字体: 时间:2026年02月23日 来源:Communications in Nonlinear Science and Numerical Simulation 3.8

编辑推荐:

  辐射传输计算加速与WRF模型集成研究,提出快速辐射传输神经网络(RRTNN),结合神经ODE和高效计算模块,替代传统线计算模型,显著提升辐射传输计算效率。北极地区测试表明,RRTNN在保持辐射加热率精度(RMSE 0.107 K/d)的同时,使辐射计算速度提升26.5倍,并整体提升WRF模型预报速度1.5倍。

  
Nikolay Yavich|Stefan Maria Ailuro|Aleksey Chesnokov|Alexander Gavrikov|Evgeny Burnaev|Vladimir Vanovskiy
人工智能中心,斯科尔科沃科学技术研究院,莫斯科,121205,俄罗斯

摘要

长波和短波辐射强迫是数值天气预报模型中的关键组成部分。然而,这些过程的参数化计算量非常大,因为它们需要解决描述宽波长范围内辐射传输和散射的积分-微分方程。作为一种替代方案,可以使用机器学习回归模型来模拟这些过程。基于物理原理,我们提出了一种快速辐射传输神经网络(RRTNN),这是一种快速且准确的深度学习方法,用于模拟多种辐射传输和散射过程。我们使用北极地区的大气数据,评估了该方法的质量和实际应用性。值得注意的是,我们的性能优于之前的基于机器学习的辐射参数化方法。最后,我们将训练好的神经网络集成到天气研究和预报(WRF)模型中,发现与辐射相关的计算速度提高了26.5倍,整个预报模型的计算速度提高了1.5倍。这种方法显著降低了计算负担,展示了其在可持续和高效建模方面的潜力。

引言

数值天气预报(NWP)在现代社会中发挥着不可或缺的作用,支持着公共安全、农业、航空、交通、能源管理和气候变化缓解等重要系统。其重要性不言而喻,它是日常生活和长期规划的基础工具。
数值大气模型中的辐射参数化是模拟短波(SW或太阳)和长波(LW或热)电磁辐射传输的重要组成部分。这些模型在天气预报和气候建模中起着关键作用。因此,辐射参数化的准确性显著影响温度、云量等大气变量的预测。辐射方案能够考虑温室气体和气溶胶浓度,这对气候建模尤为重要。
太阳辐射和热辐射都与大气相互作用:它们可以被各种大气成分(如气体、气溶胶和云层)吸收、散射或反射。辐射传输描述了能量如何通过大气以及在这个过程中如何变化。
参数化的目的是将复杂的物理过程(如辐射与分子和粒子的相互作用)简化为更简单的数学表达式,以便在数值模型中有效使用。参数化必须足够准确以反映基本的物理过程,同时也要足够简单以实现计算效率。然而,由于与其他参数化方法相比计算成本较高,辐射传输计算仍然面临重大挑战。
这些计算的核心是辐射传输模型,涉及求解控制线性传输的复杂积分-微分方程。[1] 这些解需要在多个维度上进行积分——高度、角度方向和频率——进一步增加了计算需求。气体吸收的强频率依赖性是一个主要瓶颈,使建模过程变得复杂。此外,气溶胶的散射和吸收也增加了复杂性。
传统的方法是逐线辐射传输模型(LBLRTM)[2],通过显式求解数千条吸收线来实现高精度。然而,其计算成本使其不适用于实时的大规模应用。
为了缓解这一问题,像快速辐射传输模型(RRTMG)[3]这样的加速模型采用了算法优化来减少运行时间,同时保持精度。尽管有这些进步,辐射传输仍然是天气建模中最计算密集的组成部分之一。
在数据充足的情况下,辐射传输可以被视为一个回归问题:根据太阳位置、地表条件和大气状态变量(如温度、压力、湿度)预测加热率和辐射通量。
各种神经网络(NN)架构已成功应用于此任务。早期研究集中在浅层网络[4][5]上,而后续研究探索了前馈[6][7]、卷积[8][9]和基于变压器的架构[10]。在[11]中对比分析了浅层学习和深度学习方法。值得注意的是,循环网络在多项研究中表现出色[10][12][13]。
在[14]中研究了一种有趣的替代方法。该方法使用机器学习(ML)模型来预测大气层的光学特性,同时保留了辐射传输方程。然而,这种方法可能比之前讨论的方法更慢,并且需要大气模型未记录的数据。
早期研究训练了基于NN的仿真器来独立预测加热率和辐射通量,这导致了不稳定性、模型漂移和能量守恒等问题。相比之下,[10][12][15]选择在预测辐射通量的同时解析地推导加热率,从而确保了物理一致性[16]。然而,[12]指出加热率对通量剖面的连续性非常敏感,通量的微小误差会导致加热率的显著不准确。因此,我们专注于基于物理原理的机器学习(ML)模型,这些模型已被证明更高效和可靠[12][13],而不是纯ML或受物理约束的模型。
在天气和气候建模中,大气辐射加热被视为一个绝热过程,由没有显式时间依赖性的稳态方程控制。为了解这些方程,我们采用了一种受虚时间演化启发的策略:我们将静态问题转化为演化方程并寻找其晚期解。通过使用神经常微分方程(Neural ODE)[17]来实现这种方法,进一步提出了RRTNN架构来替代神经ODE框架中的缓慢数值积分,从而实现了操作天气预报所需的计算速度。
我们的实验使用了天气研究和预报(WRF)[18]模型模拟的大气数据,重点关注北极地区。该地区因其经济潜力和气候复杂性而特别引人关注,这对NWP提出了独特的挑战。
我们通过两种方式分析RRTNN回归模型的误差。首先,我们在测试数据上将其性能与几个基准进行比较(离线评估)。其次,我们将模型集成到WRF中,将关键气象变量的预报演变与使用原始基于物理的参数化模型进行比较(在线评估)。在后一种情况下,模型会被连续调用数百次以检查可能的误差累积。
在线评估中出现的问题是如何连接Python和Fortran。之前有人建议使用特殊库来解决地球系统建模中的这个问题[20][21]。然而,我们的架构使用了PyTorch实现,它提供了一个C++前端来进行模型推理。因此,我们通过应用程序二进制接口(ABI)将C++和Fortran连接起来,从而避免了对外部库的依赖。
本文的其余部分组织如下。第2节介绍了所提出的神经网络架构以及我们的区域数据集和数据处理流程。第3节介绍了我们的实验和离线及在线评估结果。最后,我们评估了结果并得出了结论。

部分片段

回归问题

设计一种既能保证精度又能提高计算效率的方法来计算辐射加热率和通量仍然是一个未解决的挑战。当建模域和垂直分辨率预先确定时,这个问题可以被视为一个回归任务。输入包括定义大气和地表条件的物理参数以及太阳位置。输出将是不同垂直层次的加热率。回归模型可以

实现和训练

所有深度学习模型都是在PyTorch中实现的,并使用skorch[30]从零开始训练的。初始学习率设置为10?2

训练结果

在本小节中,我们展示了每个目标变量的RMSE指标以及所有训练模型的推理时间

离线性能

我们引入并测试了一种新的神经网络架构来模拟大气辐射传输。表4比较了包括本研究在内的近期研究中短波(SW)和长波(LW)加热率的均方根误差(RMSE)。我们分别实现了0.107 K/d和0.023 K/d的RMSE,低于之前的研究。我们认为较小的RMSE归因于所设计架构的独特性,该架构能够很好地模拟

结论

与主流方法不同,我们的工作侧重于区域(中尺度)大气建模,而不是全球(天气尺度)建模。由于几个关键因素,中尺度天气预报比天气尺度预报更具挑战性:中尺度现象更难以观察和模拟,因为它们需要更高的时间和空间分辨率。因此,开发新的方法来改进中尺度建模非常必要。具体来说,我们应用了

CRediT作者贡献声明

Nikolay Yavich:写作——审阅与编辑,撰写原始草稿,验证,软件,方法论,数据管理,概念化。Stefan Maria Ailuro:写作——审阅与编辑,撰写原始草稿,可视化,验证,软件,方法论,数据管理,概念化。Aleksey Chesnokov:可视化,验证。Alexander Gavrikov:写作——审阅与编辑,数据管理。Evgeny Burnaev:资金获取。Vladimir Vanovskiy:写作——审阅与

利益冲突声明

作者声明本文的发表不存在利益冲突。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号