数值天气预报(NWP)在现代社会中发挥着不可或缺的作用,支持着公共安全、农业、航空、交通、能源管理和气候变化缓解等重要系统。其重要性不言而喻,它是日常生活和长期规划的基础工具。
数值大气模型中的辐射参数化是模拟短波(SW或太阳)和长波(LW或热)电磁辐射传输的重要组成部分。这些模型在天气预报和气候建模中起着关键作用。因此,辐射参数化的准确性显著影响温度、云量等大气变量的预测。辐射方案能够考虑温室气体和气溶胶浓度,这对气候建模尤为重要。
太阳辐射和热辐射都与大气相互作用:它们可以被各种大气成分(如气体、气溶胶和云层)吸收、散射或反射。辐射传输描述了能量如何通过大气以及在这个过程中如何变化。
参数化的目的是将复杂的物理过程(如辐射与分子和粒子的相互作用)简化为更简单的数学表达式,以便在数值模型中有效使用。参数化必须足够准确以反映基本的物理过程,同时也要足够简单以实现计算效率。然而,由于与其他参数化方法相比计算成本较高,辐射传输计算仍然面临重大挑战。
这些计算的核心是辐射传输模型,涉及求解控制线性传输的复杂积分-微分方程。[1] 这些解需要在多个维度上进行积分——高度、角度方向和频率——进一步增加了计算需求。气体吸收的强频率依赖性是一个主要瓶颈,使建模过程变得复杂。此外,气溶胶的散射和吸收也增加了复杂性。
传统的方法是逐线辐射传输模型(LBLRTM)[2],通过显式求解数千条吸收线来实现高精度。然而,其计算成本使其不适用于实时的大规模应用。
为了缓解这一问题,像快速辐射传输模型(RRTMG)[3]这样的加速模型采用了算法优化来减少运行时间,同时保持精度。尽管有这些进步,辐射传输仍然是天气建模中最计算密集的组成部分之一。
在数据充足的情况下,辐射传输可以被视为一个回归问题:根据太阳位置、地表条件和大气状态变量(如温度、压力、湿度)预测加热率和辐射通量。
各种神经网络(NN)架构已成功应用于此任务。早期研究集中在浅层网络[4][5]上,而后续研究探索了前馈[6][7]、卷积[8][9]和基于变压器的架构[10]。在[11]中对比分析了浅层学习和深度学习方法。值得注意的是,循环网络在多项研究中表现出色[10][12][13]。
在[14]中研究了一种有趣的替代方法。该方法使用机器学习(ML)模型来预测大气层的光学特性,同时保留了辐射传输方程。然而,这种方法可能比之前讨论的方法更慢,并且需要大气模型未记录的数据。
早期研究训练了基于NN的仿真器来独立预测加热率和辐射通量,这导致了不稳定性、模型漂移和能量守恒等问题。相比之下,[10][12][15]选择在预测辐射通量的同时解析地推导加热率,从而确保了物理一致性[16]。然而,[12]指出加热率对通量剖面的连续性非常敏感,通量的微小误差会导致加热率的显著不准确。因此,我们专注于基于物理原理的机器学习(ML)模型,这些模型已被证明更高效和可靠[12][13],而不是纯ML或受物理约束的模型。
在天气和气候建模中,大气辐射加热被视为一个绝热过程,由没有显式时间依赖性的稳态方程控制。为了解这些方程,我们采用了一种受虚时间演化启发的策略:我们将静态问题转化为演化方程并寻找其晚期解。通过使用神经常微分方程(Neural ODE)[17]来实现这种方法,进一步提出了RRTNN架构来替代神经ODE框架中的缓慢数值积分,从而实现了操作天气预报所需的计算速度。
我们的实验使用了天气研究和预报(WRF)[18]模型模拟的大气数据,重点关注北极地区。该地区因其经济潜力和气候复杂性而特别引人关注,这对NWP提出了独特的挑战。
我们通过两种方式分析RRTNN回归模型的误差。首先,我们在测试数据上将其性能与几个基准进行比较(离线评估)。其次,我们将模型集成到WRF中,将关键气象变量的预报演变与使用原始基于物理的参数化模型进行比较(在线评估)。在后一种情况下,模型会被连续调用数百次以检查可能的误差累积。
在线评估中出现的问题是如何连接Python和Fortran。之前有人建议使用特殊库来解决地球系统建模中的这个问题[20][21]。然而,我们的架构使用了PyTorch实现,它提供了一个C++前端来进行模型推理。因此,我们通过应用程序二进制接口(ABI)将C++和Fortran连接起来,从而避免了对外部库的依赖。
本文的其余部分组织如下。第2节介绍了所提出的神经网络架构以及我们的区域数据集和数据处理流程。第3节介绍了我们的实验和离线及在线评估结果。最后,我们评估了结果并得出了结论。