MHATCN:整合局部模式和长距离依赖性以预测雪反照率
《Cold Regions Science and Technology》:MHATCN: Integrating local patterns and long-range dependencies for snow albedo forecasting
【字体:
大
中
小
】
时间:2026年03月01日
来源:Cold Regions Science and Technology 3.8
编辑推荐:
本研究提出一种结合时空卷积与多头发射机制的网络模型(MHATCN),用于预测喜马拉雅巴罗穆拉地区冬季雪地反照率。通过ERA5-Land高分辨率数据训练,模型在RMSE(0.029)、MAE(0.018)、R2(0.873)等指标上优于基线模型,并揭示了温度、辐射与蒸发对雪反照率的关键影响。
Rampunit Kumar | Aman Kumar Meena | Alok Saw | Divesh Kumar
独立研究员,印度班加罗尔
摘要
雪的反照率在调节地表能量平衡和气候过程中起着关键作用,尤其是在像喜马拉雅山脉这样的复杂山区环境中。然而,现有的雪反照率预测方法往往难以同时捕捉短期变化和长期时间依赖性。此外,这些方法在物理可解释性和模型在不同气象及空间条件下的稳健性评估方面也常常不足。为了解决这些问题,本研究通过整合多头注意力机制改进了现有的时间卷积网络(TCN)框架,并将该改进后的架构应用于印度查谟和克什米尔地区的巴拉穆拉(Baramulla)地区的雪反照率预测。该模型使用来自欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasts)的高分辨率ERA5-Land再分析数据进行了训练,数据覆盖了2019年至2021年的冬季月份(1月至2月)。数据集包含1,982,208个观测值,包括地表温度、雪密度、地表太阳辐射和蒸发量。通过将时间卷积模块与多头注意力机制相结合,所提出的架构能够有效捕捉雪与大气相互作用中的局部时间模式和长期依赖性。改进后的框架性能优于基线TCN-Transformer模型,其均方根误差(RMSE)为0.029,平均绝对误差(MAE)为0.018,决定系数(R2)为0.873,平均绝对百分比误差(MAPE)为2.56%,显示出更高的预测准确性和稳健性。研究还发现了雪反照率与气象变量之间的强相关性,其中温度呈现二次关系,辐射则呈现反线性趋势。
引言
喜马拉雅山脉常被称为“第三极”,储存了丰富的淡水资源,支撑着数百万人的生活(Immerzeel等人,2010年)。由于雪的高反射率,喜马拉雅地区的积雪在控制局部和区域气候方面起着关键作用(Jasrotia等人,2022年)。雪的反照率是指被雪表面反射的入射太阳辐射的比例,它控制着地表能量预算并影响融雪速率(Warren,1982年)。最近的研究报告称,由于气温升高,喜马拉雅地区的积雪覆盖面积正在减少(Bhambri等人,2011年;Singh等人,2023年)。雪反照率的变化直接影响融雪的时间和程度,进而影响水资源可用性、水力发电和农业生产力(Barnett等人,2005年)。在包括查谟和克什米尔在内的喜马拉雅西部地区,年际降雪量的显著变化进一步凸显了准确预测雪特性的必要性,以支持有效的水资源管理和灾害规划(Singh和Kumar,2011年)。
传统的雪反照率估算方法通常依赖于经验关系,但这些方法往往无法捕捉多个环境因素之间的复杂相互作用(Brun等人,1992年)。基于物理的雪模型能够更全面地描述雪过程,但需要大量的参数化和计算资源,这限制了它们的实际应用(Lehning等人,2006年)。尽管遥感技术提高了从太空监测雪反照率的能力,但这些技术受云层覆盖的影响较大,并且需要地面验证才能保证准确性(Dozier等人,2009年)。近年来,机器学习作为一种强大的环境预测工具崭露头角,因为它能够高效地检测大型数据集中的非线性模式(Reichstein等人,2019年)。然而,深度学习在喜马拉雅地区的雪反照率预测中的应用仍然有限。大多数现有研究集中在广泛的雪覆盖范围绘制或融雪预测上,而不是直接以高时间分辨率预测雪反照率(Nolin和Dozier,2000年)。
深度学习中的注意力机制通过使模型能够关注相关的时间依赖性,从而改变了序列建模的方式(Vaswani等人,2017年)。虽然循环架构如长短期记忆(LSTM)和门控循环单元(GRU)已被广泛用于环境时间序列预测,但基于卷积的时间模型在长期依赖性建模和计算效率方面表现更优(Bai等人,2018年)。例如,Yan等人(2023年)比较了基于LSTM和时间卷积网络(TCN)的波浪爬高预测方法,得出TCN在计算效率和预测非线性及极端波浪爬高事件方面始终优于LSTM(准确率>90%)。Yiheng等人(2025年)比较了TCN、GRU和随机森林(RF)在评估地震滑坡风险方面的表现,发现TCN模型在捕捉地震触发因素的时间依赖性方面表现最佳。尽管取得了这些进展,但在开发专门针对雪和冰应用的结合时间卷积和注意力机制的架构方面仍存在差距。许多现有的雪反照率研究仅限于短期的观测周期或依赖于低分辨率数据,这可能会掩盖雪粒大小、杂质含量和变质过程等重要的季节内变化(Smith等人,2021年;Wang & Li,2020年)。缺乏涵盖多个冬季季节的高分辨率综合数据集阻碍了稳健预测模型的发展。此外,大多数研究尚未充分考虑到喜马拉雅西部雪系统的独特特征,该地区的降水模式和地表能量平衡与其他山区不同(Dimri等人,2015年)。
本研究通过开发一种多头注意力增强型时间卷积网络(MHATCN)来填补这些空白,并将其应用于查谟和克什米尔的巴拉穆拉地区。本研究的具体目标包括:(i)开发一种结合时间卷积和多头注意力的先进深度学习架构用于雪反照率预测;(ii)评估模型在不同反照率范围和天气条件下的性能;(iii)分析雪反照率与关键环境因素(包括温度、辐射和蒸发量)之间的关系;(iv)评估模型预测在研究区域内的空间变异性。
研究区域
研究区域
本研究区域位于印度查谟和克什米尔西北部的巴拉穆拉地区。该地区纬度范围为32.96°N至35.83°N,经度范围为73.75°E至75.53°E,面积约为4190平方公里(图1)。它位于喜马拉雅西部区域,海拔高度从1551米到4568米不等,平均海拔约为2800米(Romshoo等人,2015年)。该地区具有温带气候,四季分明。冬季(12月至2月)降雪量较大。
模型架构
所提出的MHATCN通过时间卷积网络整合时间特征提取,并借鉴Transformer架构的思想引入选择性注意力机制,形成了一个能够捕捉雪反照率短期变化和长期趋势的混合框架。该架构包含多个相互连接的组件,逐步从输入的气象时间序列中提取和细化特征。输入层接收代表气象变量的12个特征。
整体模型性能
与基线TCN-Transformer相比,所提出的MHATCN在所有指标上均表现更好(表1)。MHATCN的RMSE为0.029,比基线的0.032降低了8.1%。考虑到基线的较高准确性,这一误差的减少具有重要意义,表明改进的注意力机制成功捕捉到了反照率演变中的额外模式。MAE也有显著提升,从基线模型的0.021降低到了0.018。
讨论
所开发的MHATCN架构证明了将时间卷积网络与多头注意力机制结合用于雪反照率预测的有效性。该模型在RMSE和MAE方面相比基线分别提高了8.1%和14.3%,尤其是考虑到基线模型本身已经具有较高的准确性。这些结果表明,注意力机制成功识别出了简单架构可能忽略的细微模式(Henderson等人,2018年)。
结论
本研究开发了一种多头注意力增强型时间卷积网络(MHATCN),用于预测雪反照率,并将其应用于印度查谟和克什米尔的巴拉穆拉地区。利用三年的高分辨率ECMWF再分析数据,这种结合时间卷积和注意力机制的混合架构优于基线模型,实现了0.029的RMSE、0.018的MAE、0.873的R2和2.56%的MAPE。分析揭示了影响雪反照率的关键因素。
CRediT作者贡献声明
Rampunit Kumar:撰写——原始草案、可视化、软件开发、方法论设计、数据分析、概念化。
Aman Kumar Meena:撰写——审阅与编辑。
Alok Saw:撰写——审阅与编辑。
Divesh Kumar:撰写——审阅与编辑。
资金支持
本研究未获得公共、商业或非营利部门的任何特定资助。
利益冲突声明
作者声明他们没有已知的可能会影响本文所述工作的竞争性财务利益或个人关系。
致谢
作者感谢欧洲中期天气预报中心通过Copernicus气候数据存储提供ERA5-Land再分析数据,以及开源深度学习社区,特别是PyTorch开发团队提供的计算资源。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号