基于变压器的神经网络用于全球短距离沙尘天气预报

《Environmental Modelling & Software》:A Transformer-Based Neural Network for Global Short-Range Dust Forecasting

【字体: 时间:2026年01月29日 来源:Environmental Modelling & Software 4.6

编辑推荐:

  沙尘预测研究提出基于Transformer架构的短程沙尘预报模型DustReal,利用MERRA-2再分析数据每小时输出24小时预报,空间分辨率0.5°×0.625°。实验表明该模型在亚洲区域优于三个NWP沙尘预测系统,能准确捕捉沙尘时空演变特征,计算效率较传统NWP模型显著提升,为航空、太阳能等应用提供可靠预报工具。

  
杜世康|陈思宇|何嘉琪|傅宇|连露露
兰州大学地球与环境科学学院,中国兰州,730000

摘要

沙尘预报具有重要的科学和社会价值。传统的数值天气预报(NWP)模型通过求解模拟沙尘气溶胶物理化学过程的微分方程来预测沙尘。然而,初始条件和边界条件的不确定性,加上沙尘过程建模的复杂性,导致在准确性和计算成本方面都面临重大挑战。在这项研究中,我们介绍了DustReal,这是一种基于Transformer的短程沙尘预报模型,它利用深度学习来提高准确性和效率。DustReal以MERRA-2再分析数据为输入,生成未来24小时内地表沙尘浓度(DUSMASS)和550纳米处沙尘光学深度(DOD)的每小时预报,空间分辨率为0.5°×0.625°。在2022-2023年的独立测试集上的评估表明,DustReal具有出色的预报准确性,在捕捉沙尘事件的细尺度时空演变方面优于亚洲的三个业务化NWP沙尘预报系统。我们的结果表明,DustReal可以在传统NWP模型所需的计算成本的一小部分内提供高质量的沙尘预报。作为一种轻量级的基于深度学习的短程模型,DustReal为航空和太阳能等领域提供了实用的解决方案,促进了业务化沙尘预报系统的发展。

引言

作为最显著的大气灾害之一,沙尘暴主要发生在中纬度干旱和半干旱地区,北非、中亚和东亚是受影响最严重的地区(Bi等人,2024年;Hu等人,2019年)。强风将大量沙尘带入大气层,促进其长距离传输。这些事件不仅会降低空气质量及生态状况,还对人类健康、农业生产、交通运输和可再生能源行业构成严重威胁(Al-Sharafi等人,2024年;Kok等人,2023年;Schroedter-Homscheidt等人,2013年;Shao等人,2011年;Uno等人,2009年;Vallès-Casanova等人,2025年)。例如,细沙颗粒可以进入呼吸系统,损害心肺功能,引发呼吸系统和心血管疾病。能见度的急剧下降可能导致道路和空中交通中断,沙尘还会减弱太阳辐射,导致光伏发电量急剧下降,威胁电力系统的稳定性。鉴于这些广泛的影响,政府和国际组织越来越重视沙尘监测和早期预警。特别是近年来极端天气事件的频繁发生,使得开发高精度、近乎实时的短程沙尘系统成为当务之急(Alshammari等人,2022年;Jiao等人,2021年;Pang等人,2024年;Shao等人,2025年)。
在过去几十年中,数值天气预报(NWP)模型一直是沙尘预报的主要方法。研究人员通过将沙尘排放、传输和沉积过程整合到气象框架中,开发了许多系统。代表性的模型包括ECMWF/MACC、NCEP/NGAC、CUACE/Dust、JMA/MASINGAR和KMA/Adam3。这些模型能够以合理的精度再现沙尘爆发和传输过程,为沙尘评估和早期预警奠定了重要基础(Benedetti等人,2009年;Gong和Zhang,2008年;Lee等人,2019年;Lu等人,2016年、2016年;Morcrette等人,2009年;Tanaka等人,2003年)。然而,仍存在显著的限制。一方面,预报准确性受到初始条件和边界条件不确定性的限制;例如,地表风场或沙尘排放通量的误差会大大降低预报精度(Shao,2024年;Shao等人,2025年)。另一方面,NWP模型计算量大。为了满足业务化的时效性要求,它们通常会降低空间和时间分辨率,这限制了许多亚网格尺度物理过程的明确表示,如湍流沙尘抬升和小尺度对流,需要通过简化参数化来近似这些过程(Bauer等人,2015年;Gl?ser等人,2012年;Takemi,2012年)。此外,不同模型在沙尘排放参数化方面存在较大差异,包括阈值摩擦速度和颗粒属性,引入了显著的不确定性,仍然是预报误差的关键来源(Kamath等人,2022年;Shao,2024年;Zhang等人,2022年)。这些因素共同限制了基于NWP的沙尘预报的进一步改进。
短程预报的严格要求,包括高空间-时间分辨率和快速更新频率,激发了对数据驱动替代方案的探索。人工智能(AI)的快速发展,特别是深度学习,为短程沙尘预报提供了有希望的新途径(Bi等人,2023年;Kochkov等人,2024年;Lam等人,2023年;Price等人,2025年)。深度学习模型可以从历史数据中提取复杂的动态关系,并快速近似未来状态。许多研究表明,数据驱动的神经网络可以在保持较低计算成本的同时,部分缓解NWP模式的一些限制(Jones,2017年;Reichstein等人,2019年;Schultz等人,2021年)。卷积神经网络(CNN)在提取空间结构方面特别有效,已应用于雷达回波外推和温度预报等任务(SHI等人,2015年;Zhang等人,2025年)。循环神经网络(RNN),包括长短期记忆(LSTM)网络及其变体,非常适合时间序列预报,已用于风速预报、强降雨预测和天气预报(Ma等人,2022年;Shahid等人,2021年)。最近,Transformer因其时空注意力机制而受到越来越多的关注,这种机制天然适合捕捉长距离依赖性和全局特征(Dosovitskiy等人,2021年;Yan等人,2022年)。与RNN不同,Transformer支持并行序列处理,提高了训练和推理效率。通过结合CNN式的局部特征提取和基于注意力的依赖性建模的优势,基于Transformer的架构在天气预报中取得了优异的性能(Bi等人,2023年;K. Chen等人,2023年;L. Chen等人,2023年;Hu等人,2023年)。这些进展表明,基于Transformer的深度学习模型为在包括沙尘事件在内的具有挑战性的短程预报任务中实现速度和准确性提供了有前景的范式。
在本文中,我们介绍了DustReal,这是一种基于Transformer架构的全球短程沙尘预报模型。DustReal以MERRA-2再分析数据为输入,提供未来24小时内地表沙尘浓度(DUSMASS)和550纳米处沙尘光学深度(DOD)的预报,空间分辨率为0.5°×0.625°。该模型结合了长方体注意力机制来捕捉沙尘演变的时空动态。它在超过10万小时的历史再分析数据上进行了训练,以支持在不同沙尘条件下的泛化。结果表明,DustReal在亚洲的表现优于业务化NWP沙尘预报系统,并提供了快速的全球推理,使得高频更新和业务化部署成为可能。DustReal还可以适应需要可靠沙尘预报的航空和太阳能等领域。这项研究为下一代智能全球沙尘预报提供了实际步骤,并展示了AI在业务化环境预测中的有前景的应用。
本文的其余部分组织如下:第2节描述了使用的数据集和DustReal模型的详细信息。第3节展示了实验结果和与三个业务化NWP沙尘预报系统的比较。第4节讨论了局限性、不确定性考虑和潜在应用,第5节总结了研究。

数据集片段

数据集

MERRA-2(Modern-Era Retrospective analysis for Research and Applications,版本2)是由NASA的全球建模与同化办公室(GMAO)使用Goddard地球观测系统模型(GEOS)v5.12.4开发的全球大气再分析数据集(Gelaro等人,2017年)。它提供了自1980年至今的全面气象和气溶胶相关变量,空间分辨率约为0.5°×0.625°,时间分辨率为每小时一次。

确定性评估

图2比较了DustReal与CUACE/Dust、KMA/Adam3和JMA/MASINGAR在不同提前时间下的RMSE和ACC性能。结果表明,DustReal在所有预报变量和提前时间上均始终优于所有对比模型,在预报准确性和稳定性方面具有显著优势。对于DUSMASS,DustReal的RMSE值始终低于70 μg/m3,明显优于CUACE/Dust(170–220 μg/m3)和KMA/Adam3(70–120 μg/m3

讨论

DustReal的稳健预报准确性和快速推理能力证明了基于Transformer的架构在沙尘短程预报中的可行性和显著优势。在2022-2023年的独立测试集上的评估证实,DustReal能够捕捉沙尘的空间分布、传输路径和强度演变,并在1至24小时的提前时间内优于亚洲的三个NWP沙尘预报系统。这些结果进一步强化了

结论

沙尘气溶胶在陆地-大气系统中起着关键作用,不仅影响空气质量,还影响气候变化和大气辐射预算。然而,由于完全考虑与沙尘相关的所有物理过程所需的广泛时空尺度,NWP模型往往难以提供高分辨率的预报,同时还需要高性能的计算资源。为了解决这些挑战,DustReal基于分层Transformer神经网络构建

软件和数据可用性

DustReal使用Python库PyTorch 2.4.0实现。
开发者:杜世康
首次可用日期:2025年8月1日
所需软件:Ubuntu 22.04
编程语言:Python
本地安装和使用软件所需的数据通过云访问。请参阅数据可用性声明。

CRediT作者贡献声明

陈思宇:写作——审稿与编辑、验证、监督、方法论、概念化。杜世康:写作——审稿与编辑、初稿撰写、验证、软件、方法论、正式分析、概念化。傅宇:写作——审稿与编辑、验证、软件。何嘉琪:可视化、软件、概念化。连露露:写作——审稿与编辑、验证

未引用参考文献

陈等人,2023年。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

数据可用性

本研究使用的数据可在https://zenodo.org/records/16760495?token=eyJhbGciOiJIUzUxMiJ9.eyJpZCI6IjYyOWM1ZmQzLWUxOTItNGVjMi1iMjA3LWI1NmNhMmQ4OTRhYiIsImRhdGEiOnt9LCJyYW5kb20iOiJlMzRiZGNjNDEwODBkNDM2YTNlYmE1OTQ3ZWIzNWZiYyJ9.yclBvm67DGlPu0yJEN50NxaKFrKBthZPRFs5P5kq3aqy8JH1jWywCjc2zXF3-Yd5joL6qgPazHQ-6w8QEsa5Yg处公开获取。

利益冲突声明

? 作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

本工作得到了国家自然科学基金中国气象局联合资助(资助编号:U2242209),甘肃省自然科学基金(资助编号:24YFFA008和25ZDFA008),以及甘肃省自然科学基金的优秀博士生项目(23JRRA1162)的支持。我们还感谢兰州大学超级计算中心提供的计算支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号