编辑推荐:
PWV现在cast框架通过NTFT周期分解与BiLSTM残差预测融合,结合长期ERA5预训练与短期GNSS校准,显著提升铁路沿线复杂地形PWV预测精度,1-12小时RMSE分别1.4/2.0/3.0mm,MBE降低77%。
陈畅|刘艳萍|王勇|张云龙|孟向顺|池浩哲|何春瑞
天津城建大学地质与地理信息学院,中国天津300384
摘要
大气可降水量(PWV)是驱动极端天气事件(如强降水)的核心因素,这些事件直接威胁铁路运营安全。针对铁路沿线地形复杂、气候多变的地区对高精度PWV临近预报的迫切需求,本研究提出了一种创新的“内在周期剥离-天气残差预测”框架。通过应用正规时频变换(NTFT)精确识别并剥离PWV序列中的周期性背景场。随后,设计了一种基于双向长短期记忆(BiLSTM)网络和多头输出结构的深度学习预测器来预测残差。由于服务于铁路建设的CORS站点建立时间较短,无法收集深度学习所需的长期训练数据,本研究提出了“长期预训练+短期校准”策略,利用ERA5数据进行预训练,并结合本地GNSS观测数据进行微调以消除系统偏差。实验结果表明:经过局部化校准后,1小时、6小时和12小时的滚动预测的均方根误差(RMSE)分别为1.4毫米、2.0毫米和3.0毫米。与仅使用ERA5数据训练的基线模型相比,校准后的模型平均偏差误差(MBE)显著降低了77%。该框架有效捕捉极端天气期间的PWV突变,为铁路基础设施的高精度水文气象监测和预警提供了有力工具。
引言
大气可降水量(PWV)是驱动极端天气事件(如短期强降水)的核心物理因素(Manandhar等人,2016年;Ying等人,2022年)。这类事件是城市内涝和山洪等灾害的直接诱因,严重威胁社会安全和经济发展。对于穿越地形复杂、气候多变的地区的铁路线而言,高精度和高效率的PWV临近预报对于确保交通安全和提升气象灾害预警能力至关重要(Ochsner等人,2024年)。然而,PWV时间序列固有的强非线性和非平稳性,加上观测数据与模型数据之间的系统偏差,给现有预测模型捕捉突发天气变化和确保预测可靠性带来了瓶颈,仍有提升精度的空间。
作为大气水循环的关键变量,随着检测技术的发展,PWV的数据来源日益丰富,主要包括地面全球导航卫星系统(GNSS)、无线电探空仪、卫星遥感和再分析数据(Zhao等人,2025年;Xu等人,2023年;Wang等人,2023年)。其中,地面GNSS因其高精度、高时空分辨率和全天候能力,已成为获取高质量单点PWV时间序列的基准方法(Xu等人,2023年;Wang等人,2023年)。同时,以ERA5为代表的新一代再分析数据集凭借其全球覆盖和时空连续性,为长期、大规模的PWV研究提供了坚实的数据基础。它们在描述PWV趋势方面的可靠性已得到广泛验证(Zhou等人,2025年;Rani和Singh,2025年)。多源PWV数据的分析揭示了其与厄尔尼诺-南方涛动(ENSO)等气候事件的相关性(Zhao等人,2025年),并确认了PWV与降水之间的密切物理联系。因此,PWV预测已成为提高极端天气预报准确性的研究共识(Liu等人,2025年;Xu等人,2025年;Zhang等人,2022年;Liu等人,2022年;Liu等人,2024年)。
为了准确预测PWV,研究人员开发了从传统统计模型到现代人工智能模型的各种方法。早期的统计模型(如ARIMA)由于线性假设而难以捕捉PWV的复杂动态过程(Li等人,2025a;Yan等人,2024年)。近年来,以深度学习为代表的人工智能方法展现了巨大潜力。循环神经网络(RNN)、长短期记忆(LSTM)网络及其双向变体(BiLSTM)通过独特的门控和循环结构能够有效学习时间序列中的长期依赖性,显著提高预测性能(Li等人,2025a;Yan等人,2024年;Lu等人,2024年;Al-Eshmawy等人,2024年;Huang等人,2024年;Izanlou等人,2023年)。当前的前沿趋势是构建基于融合的混合深度学习模型。例如,Li等人(2025b)将时间卷积网络(TCN)与注意力机制相结合,实现了不同网络结构的互补优势,进一步增强了模型捕捉复杂时间特征的能力。然而,直接预测原始PWV序列是一个重大挑战:PWV序列包含大幅度的周期性变化和小幅度的随机天气扰动。在季节转换期间,由周期性因素驱动的PWV值会发生强烈变化,影响整体预测精度。
为了解决上述问题,出现了“分解-预测”策略。其核心思想是将复杂的非平稳PWV序列分解为多个相对平稳的子序列,从而降低后续预测模型的学习难度。变分模态分解(VMD)及其改进算法(如SVMD)是目前最广泛使用的技术。将这两种方法与混合深度学习模型结合的“分解-预测”范式已成为实现高精度预测的先进技术路径(Grigoriy等人,2021年;Menggang等人,2023年)。一些研究为了极致优化,采用小波变换(WT)对高频残差进行二次分解,以预测与突发天气变化最相关的信号成分。例如,Shangguan等人(2023年)结合小波分析(WA)、LSTM神经网络和自回归积分滑动平均(ARIMA)算法,形成了用于GNSS PWV预测的WLA模型,表现良好。然而,现有技术路径存在一个常被忽视的根本限制:无论是VMD还是SVMD,其本质都是基于信号自身特征的数学优化分解。这些方法旨在实现模态分离的最优性,但分解后的“趋势项”或“低频项”无法有效区分稳定的周期性成分和由特定天气或气候事件驱动的准周期信号。
正规时频变换(NTFT)作为一种新兴的非平稳信号处理工具,在其他地球物理领域也显示出巨大潜力。例如,Han等人(2025年)在重力潮汐研究中使用NTFT直观揭示了各种潮汐成分的频率和幅度的时变特征,获得了与传统方法相当精度的结果,且无需严格参数设置。Sun等人(2025年)进一步开发了一种基于NTFT的宽带信号提取方法,成功应用于南海海平面变化预测,其周期提取精度明显优于传统小波变换。这些研究充分证明了NTFT在处理复杂周期信号和精确分离周期成分方面的独特优势。
现有研究表明,PWV预测技术已发展到以“信号分解+混合深度学习”为中心的先进策略。然而,当前主流的信号分解方法本质上是数学优化过程,无法有效区分稳定的周期性成分和动态的气象准周期信号。这导致分解中的模态混合(或周期模糊),从而限制了深度学习模型捕捉真实天气扰动的有效性。为了解决这些问题,本研究提出了一种创新的混合预测模型,结合NTFT进行周期识别和深度学习进行非线性残差预测。最终PWV预测结果是通过将周期性成分的外推预测结果与残差成分的深度学习预测结果相加得到的。这为铁路沿线的气象安全保障提供了高精度的PWV预测工具。
研究区域
本项目聚焦于中国南部的主要铁路交通干线——广珠高铁所经过的区域。研究范围从北纬22.5°到22.75°,东经112°到112.5°,位于广东省中西部的珠江三角洲地区。该地区属于从山区向平原过渡的地带,地形起伏较大。该区域位于亚热带季风气候区,毗邻南海,是重要的交通通道
方法论
本章阐明了本研究中提出的“内在周期剥离-天气残差预测”框架的核心算法原理和具体实施策略(图2)。为了解决PWV序列的固有非线性和非平稳性问题,通过整合正规时频变换(NTFT)、小波变换(WT)、双向长短期记忆(BiLSTM)网络和局部微调策略,构建了一个系统解决方案。
周期识别和背景场建模结果
首先,使用FFT对长期ERA5 PWV序列进行了初步的频谱扫描,以确定周期识别的搜索范围。如图3所示,FFT频谱清晰地揭示了信号在整个时间域内的能量分布。
在FFT结果中,年度周期(约8760小时)、半年周期(约4380小时)和日周期(24小时)处出现了显著的能量峰值,证实了这些天文驱动的周期是主要成分
关于内在周期剥离对预测精度影响机制的讨论
实验结果表明,基于NTFT内在周期剥离的预测模型在所有预测提前时间内均显著优于无分解模型(VDirect)和基于VMD的数学分解模型(VVMD)。这种现象与信号分解的物理真实性密切相关。
VDirect模型的表现最差,因为原始PWV序列是强周期性背景场和随机天气的非线性叠加
结论
针对铁路沿线单点大气可降水量(PWV)的精确预测需求,本研究构建并验证了一种精炼的“内在周期剥离-天气残差预测”框架。提出了一种基于NTFT的物理背景剥离方法:利用NTFT,从长期ERA5数据中精确识别了七个内在物理周期,包括年度周期、半年周期、日周期和季节内振荡
未引用参考文献
Bubnov等人,2021年;Kou等人,2023年;Li等人,2022年;Wu等人,2023年;Xu等人,2022年;Yan等人,2024年。
CRediT作者贡献声明
陈畅:概念化、方法论、数据整理、验证、软件开发、初稿撰写。刘艳萍:监督、资金获取。王勇:正式分析、撰写与编辑。张云龙:调查。孟向顺:项目管理。池浩哲:资源协调。何春瑞:软件开发。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
术语表
- 缩写
- 全称
- PWV
- 可降水量
- GNSS
- 全球导航卫星系统
- NTFT
- 正规时频变换
- BiLSTM
- 双向长短期记忆
- ERA5
- 第五代欧洲中期天气预报中心(ECMWF)再分析数据
- VMD
- 变分模态分解
- FFT
- 快速傅里叶变换
- WT
- 小波变换
- RMSE
- 均方根误差
- MAE
- 平均绝对误差
- MBE
- 平均偏差误差