《Frontiers in Marine Science》:Machine learning based accurate storm surge peak and timing forecast in Pearl River Estuary
编辑推荐:
在全球气候变暖背景下,风暴增水对沿海城市的威胁日益加剧,亟需精准、及时的峰值水位及发生时刻预报。当前基于神经网络的预报方法中,门控循环单元(Gated Recurrent Unit, GRU)虽在序列预测中表现优异,但在较长预见期内常低估峰值幅度并产生时间偏差
在全球气候变暖背景下,风暴增水对沿海城市的威胁日益加剧,亟需精准、及时的峰值水位及发生时刻预报。当前基于神经网络的预报方法中,门控循环单元(Gated Recurrent Unit, GRU)虽在序列预测中表现优异,但在较长预见期内常低估峰值幅度并产生时间偏差。为此,研究人员利用2000—2023年珠江口9个验潮站的42个热带气旋(Tropical Cyclone, TC)增水数据,构建了单站GRU预报模型。为减少峰值低估,设计了迭代预报方案,结合经累积局部效应(Accumulated Local Effects, ALE)与相关系数筛选的TC参数;为校正峰值时间偏差,提出了基于TC峰值强度要素的支持向量回归(Support Vector Regression, SVR)模型,用于预测并修正峰值时间误差。此外,通过在模型中嵌入站点间空间信息与TC路径,探索了多站联合预报的可行性。留一法交叉验证(Leave-One-Out Cross-Validation, LOOCV)结果显示,在关键象限中引入TC位置、距离及34节风圈半径,可在12–18小时预见期将峰值误差(Peak Error, PE)降低27%,并在1–18小时内将均方根误差(Root Mean Square Error, RMSE)降低13%(共35个测试案例)。应用基于SVR的相位校正后,所有案例的平均时间误差(Timing Error, TE)降低了55%,RMSE较未校正预报减少了2.81%。与数值模式结果相比,台风“天鸽”(Hato)期间的水位序列RMSE降低了0.22米。多站联合预报结果表明,嵌入此类空间信息不仅提升了多个验潮站的预报技巧,也为历史数据稀缺的站点带来了增益。本研究提出了一种同时针对风暴增水峰值幅度和发生时刻的改进方法,显著提高了风暴增水预报的准确性与可靠性。
研究背景与意义
风暴增水是由强风与气压骤变引起的海面异常升降现象,若与天文高潮叠加,易引发严重沿海洪涝灾害。随着全球气候变暖、海平面上升及强热带气旋频率与强度增加,中国东南沿海城市面临更高的灾害风险。珠江口的粤港澳大湾区因其独特的地理与气候条件,尤其易受风暴增水影响,例如2017年台风“天鸽”造成24人死亡及直接经济损失121.8亿元。因此,提高风暴增水预警能力成为防灾减灾的关键。现有预报方法分为经验、数值及机器学习三类。经验方法依赖历史数据且稳健性不足;数值模式如ADCIRC、FVCOM等虽物理机制完善,但受强迫场不确定性和高计算成本限制;机器学习方法因计算效率高、可不断提升预报技能而被广泛应用,其中GRU在序列预测中表现优异,但仍存在峰值低估和时间偏差问题。针对珠江口,已有研究虽尝试改进RNN类模型,但峰值低估与时间偏差随预见期延长而加剧,尚未得到有效解决。
主要技术方法
研究人员收集了2000—2023年珠江口9个验潮站的逐时观测水位、TC最佳路径数据及站点气象变量,剔除潮汐成分得到净风暴增水序列。采用ALE分析与Pearson、Spearman相关系数筛选TC关键参数,将其与站点气象数据共同输入GRU模型,并通过贝叶斯优化选择超参数。针对峰值时间偏差,构建了以TC峰值强度相关参数为输入的SVR模型,预测TC强度峰值与增水峰值的时间差,并对GRU预报序列进行整体平移校正。评估指标包括RMSE、PE和TE。为检验稳健性,采用LOOCV对35个TC事件进行验证,并开展多站联合预报实验,引入TC方位作为空间特征,评估其在数据共享与无历史数据站点的适用性。
研究结果
4.1 长期连续预报
仅使用历史增水序列的GRU模型在常年预报中RMSE低于0.1米,但在TC事件中显著低估峰值,且误差随预见期延长而增加。例如,“天鸽”与“山竹”在18小时预见期的峰值低估分别达0.72米和0.51米,时间误差最大超过7小时。加入站点气象变量后,误差在不同案例中表现不一,说明单纯增加本地强迫信息无法稳定解决峰值与时间偏差。
4.2 极端增水预报的多策略比较
单次直接预报、两次直接预报与迭代预报三种策略中,迭代预报在峰值幅度与时间的准确性最优,但整体RMSE较高,原因是峰值前后的波形误差累积。迭代预报结合站点气象变量后,峰值误差显著降低,但时间偏差仍未完全消除。
4.3 TC要素的影响与集成预报
ALE与相关性分析将TC参数分为五组,其中次强相关组(SS组,含距离、经度、纬度及东北、西北象限34节风圈半径)在12–18小时预见期将PE降低约30%、RMSE降低17%。LOOCV显示,SS组的PE为0.22米(95% CI [0.13, 0.31]),优于仅用站点变量的0.30米。然而时间偏差依然存在,表明仅靠输入层增加TC信息不足以校正相位误差。
4.4 基于SVR的峰值时间预测
SVR模型以TC瞬时状态、强度峰与最小距离时间差、强度峰与本站最低气压时间差及平均移速为输入,训练集与独立测试集的ΔT预测误差分别为2.96小时和2.38小时。特征重要性分析表明,ΔT1与ΔT2是最关键因子。校正后,“天鸽”峰值时间误差从3.17小时降至0.48小时,全序列RMSE在18小时预见期降低42.9%。与高分辨率数值模式相比,校正后的RMSE降低0.22米。LOOCV结果显示,校正后TE由7.33小时降至3.31小时,RMSE由0.1317米降至0.1254米。
4.5 多站联合预报
引入TC方位作为空间特征后,多站联合模型的RMSE由0.35米降至0.32米。留一站点交叉验证表明,即使目标站点无任何历史训练数据,其9小时预见期RMSE为0.48米,接近单站模型(0.51米),证明空间信息可有效弥补数据稀缺问题。
讨论与结论
SS组TC参数通过提供位置和风场不对称性的物理约束,有效提高了长预见期的峰值精度。SVR相位校正解决了GRU预报的系统时间偏差,且无需依赖数值模式,大幅降低计算成本。研究同时指出,该方法对路径异常或快速衰减的TC仍存在较大误差,未来可引入物理方程正则化或按TC类型自适应调整输入。多站联合预报虽在GRU框架下取得初步成效,但空间泛化能力有限,未来可结合图神经网络(Graph Neural Network, GNN)以提升复杂地形下的预报性能。总体而言,该研究提出的双阶段混合方法在珠江口风暴增水峰值与时间的精准预报方面具有重要应用价值,并为数据稀缺区域的业务化预报提供了可行途径。论文发表于《Frontiers in Marine Science》。