一种统一的时频深度学习模型,用于复杂海况下的有效波高预测
《Ocean Engineering》:A unified time-frequency deep learning model for significant wave height forecasting in complex sea states
【字体:
大
中
小
】
时间:2026年05月10日
来源:Ocean Engineering 5.5
编辑推荐:
关成阳|邱丽洲|关青春|杜立斌|池永祥
山东科技大学海洋科学与工程学院,青岛,266590,中国
**摘要**
准确预测有效波高对海洋安全和工程至关重要,但这一目标仍受到海洋动力非平稳性的挑战。本研究提出了一种统一的深度学习框架,通过跨注意力机制(TFCA-Wave
关成阳|邱丽洲|关青春|杜立斌|池永祥
山东科技大学海洋科学与工程学院,青岛,266590,中国
**摘要**
准确预测有效波高对海洋安全和工程至关重要,但这一目标仍受到海洋动力非平稳性的挑战。本研究提出了一种统一的深度学习框架,通过跨注意力机制(TFCA-Wave)结合时域和频域表示方法,实现了时间依赖性和频谱特征的自适应融合。该框架采用TCN和GRU编码器提取时间依赖性,同时并行频谱分支捕获能量分布模式。这些异构特征通过跨注意力机制进行自适应融合,以关注主导频率成分和突然变化。在中国海域的三个沿海站点进行的评估表明,该模型在1至12小时的预测范围内,1小时预测的R2值可达0.987,12小时预测的R2值保持在0.77-0.79之间。值得注意的是,与混合基线模型相比,TFCA-Wave在12小时预测中可将RMSE降低约25-45%。此外,使用95%不确定性区间和Diebold-Mariano检验(p < 0.001)进行的不确定性量化证实了该模型在极端海况下的优越稳定性。这些结果表明,所提出的框架为海上作业的波浪预测和决策支持提供了一种可靠且准确的工具。
**引言**
海面波浪含有大量可预测的能量,为可再生能源发电、海岸抵御能力和海洋作业提供了巨大潜力。准确预测短期有效波高(SWH)对于波浪能转换调度、结构完整性评估、电力平滑、电网整合和航行安全至关重要。这一需求在中国沿海尤为突出,因为沿海省份占全国电力消费的一半以上,可靠的SWH预测直接支持海洋资源管理和操作风险缓解(Shen等人,2025年)。
在波浪预测领域,传统方法包括从经验性和半经验性公式到完全非线性的第三代频谱模型(如WAM、SWAN和WaveWatch III)(The WAM Group,1988年;Booij等人,1999年;Bidlot等人,2007年;Tolman,2009年)。这些模型基于风浪相互作用、非线性能量传递和频谱传播模拟波浪演变,提供了物理意义上的可解释输出。然而,它们对复杂物理参数的依赖性和庞大的计算资源限制了其在高频或实时预测中的应用。
近年来,机器学习的进步为数据驱动的波浪预测创造了新的机会。卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆(LSTM)网络、门控循环架构和基于注意力的模型都展示了改进的预测能力。早期研究主要依赖循环神经网络进行时间预测。Fan等人(2020年)直接将LSTM网络应用于风速和波浪变量(Hs、Wd、Ws)进行短期预测,而Ni和Ma(2020年)结合PCA和LSTM以纳入多种气象因素并减少输入维度。基于LSTM的seq2seq架构进一步提高了多步预测性能(Pirhooshyaran和Snyder,2020年)。为了在非平稳条件下增强鲁棒性,Sun等人(2020年)引入信号分解,将波浪信号分离成频段后进行LSTM建模。这些方法展示了深度循环架构的潜力,但受限于单一模型结构的依赖性和在极端或快速变化的海况下效果下降。
随着计算能力和数据可用性的提高,许多研究采用了多变量输入,并结合了空间和时间建模。CNN-LSTM架构被广泛用于同时捕捉空间特征和时间依赖性(Guan,2020年;Zhou等人,2021a,Zhou等人,2021b)。其他融合设计包括用于改善极端条件识别的Bi-GRU模型(Meng等人,2022年)、具有不确定性量化的并行LSTM-GRU框架(Wang和Ying,2023年),以及在中国南海和东海验证的注意力增强型CNN-BiLSTM网络(Wang等人,2022年)。轻量级架构如金字塔神经网络(Mahdavi-Meymand和Sulisz,2024年)和混合CLSTM-BiGRU系统(Ahmed等人,2024年)也表现出强劲性能。尽管这些模型提高了预测准确性和稳定性,但它们通常依赖于简单的特征串联,并缺乏深度跨模态交互或显式的多尺度时间建模机制。
为了更好地捕捉海洋波浪的内在多尺度特性,EMD、VMD和小波变换等分解方法越来越多地与深度网络相结合。例如ICEEMDAN-LSTM(Pang和Dong,2023年)、VMD-CNN(Zhang等人,2023年)、EMD-LSTM(Zhou等人,2021a,Zhou等人,2021b;Ma等人,2022年)以及VMD-LSTM或VMD-GRU变体(Fu等人,2023年;Zhao等人,2023年;Ding等人,2024年)。然而,这些多阶段流程通常采用基于分解的顺序建模框架,其中原始波浪信号首先被分解为多个组成部分,每个组成部分独立建模,然后重建最终输出,可能无法完全纳入表示波浪演变所必需的物理或频谱约束。
近年来,SWH预测研究逐渐从传统的时域建模扩展到包括频谱表示、注意力机制和多站点预测框架。在时频或分解增强建模方面,越来越多的研究表明,显式表示波浪信号的非平稳性和多尺度结构可能有助于提高预测性能。例如,Liu等人(2024年)提出了基于变压器的时空框架进行波浪预测,强调了注意力机制在建模空间和时间依赖性方面的潜力;Zhang等人(2025a,2025b)提出了AFE-TFNet,它将自适应特征提取与联合时频建模相结合用于SWH预测。他们的结果表明,与选定的基线模型相比,该模型在 medium 和长期预测方面具有更高的准确性和稳定性。Ma等人(2025年)进一步提出了MPST模型,以探索波浪预测中时间、空间和频率相关组件之间的非线性相互作用。这些方法增强了多频率组分的表示,并在极端或高度非平稳条件下提高了性能。
尽管有上述进展,当前的数据驱动SWH预测仍面临几个根本性限制:(1)短期局部特征和长期全局依赖性的整合不足;(2)频域信息在约束时频演变方面的应用有限;(3)浅层融合策略未能充分利用不同模态间的互补信息。最近尝试结合长短期时间相互作用(例如Wang等人,2025年)或将物理约束嵌入神经网络(例如OceanCastNet;Zhang等人,2024年;Kim等人,2025年)显示出有希望的方向,但在统一多尺度时频建模方面仍不完整。
受上述理论见解和挑战的启发,本研究提出了TFCA-Wave,一种用于有效波高预测的统一时频双路径架构。本研究的主要目标是开发一个有效的预测框架,结合利用时间动态和频谱信息来提高预测准确性和鲁棒性。次要目标是在不同气象条件下使用浮标观测和再分析数据集系统评估其预测性能,并检验学习到的时频表示的可解释性,以便更好地理解物理过程并提供更可靠的运营支持。
**主要贡献**
(1)开发了一种新的深度学习模型TFCA-Wave用于有效波高预测。通过将时间建模与频域约束相结合,该模型改进了多尺度波浪变异性的表示,并在复杂海况下提高了预测准确性。
(2)引入了跨注意力融合机制,有效整合时间和频谱特征,实现了异构表示之间的自适应交互,并提高了互补信息的提取。
(3)使用来自三个观测站点的数据集验证了该模型。实验结果证明了其在不同地理和气象条件下的强大鲁棒性、泛化能力和可靠性能。
**本文其余部分组织结构如下**
第2节介绍所提出的方法论。第3节介绍数据来源和性能评估指标。第4节描述数据预处理程序和模型参数设置。第5节比较基准模型并分析三个维度的预测性能。第6节总结本文。
**方法和数据**
所提出的TFCA-Wave模型在统一的时频框架内开发,其中时间和频谱表示共同使用。时间卷积网络(TCN)用于识别短期局部模式和多尺度波动,而门控循环单元(GRU)用于捕获更长时间的时间依赖性。同时,实值快速傅里叶变换(rFFT)和卷积神经网络(CNN)用于提取信息。
**数据描述**
为了训练所提出的模型并评估其预测准确性和泛化能力,选择了三个观测站点(图6):站点1(北纬18°,东经110°),站点2(北纬21°,东经114°)和站点3(北纬30°,东经122°)。这三个地点都具有显著的波浪能开发潜力,尽管每个站点具有不同的优势(Ma等人,2025年;Shen等人,2025年)。根据Shen等人(2025年)的定义,1.3–4.0米的SWH范围被认为是适合波浪能开发的波高。
**模型参数设置**
本节介绍了TFCA-Wave多变量混合模型的配置,该模型结合了时频跨注意力机制以改进短期有效波高(SWH)预测。详细说明了Cross-Attention模块的操作原理、双分支时频架构和相关的特征融合过程。表S5展示了TFCA-Wave的总体算法流程。所有实验均在Visual Studio Code中进行。
**预测结果可视化及模型性能比较**
在三个观测站点和四个预测时间范围(1小时、3小时、6小时和12小时)(表4、表5、表6;图9、图10、图11)的全面比较表明,所提出的TFCA-Wave在所有时间尺度上均实现了更高的准确性和更大的稳定性。
**结论**
本研究提出了TFCA Wave,一种用于非平稳和多尺度海洋条件下的有效波高预测的统一时频深度学习框架。该模型结合了TCN-GRU编码器、可学习的频谱分支和跨注意力机制,实现了联合时频特征建模。基于在三个沿海站点的实验,主要结论如下:
1. TFCA-Wave的性能优于五个基准模型,包括TCN-GRUC。
**作者贡献声明**
关成阳:撰写——原始草稿,验证,资金获取,正式分析,概念化。
邱丽洲:撰写——原始草稿,可视化,方法论,正式分析。
关青春:撰写——审稿与编辑,方法论,研究,资金获取。
杜立斌:撰写——审稿与编辑,验证,监督,资金获取。
池永祥:撰写——审稿与编辑,方法论,数据整理。
**代码可用性声明**
代码可向相应作者请求获得。
**利益冲突声明**
作者声明没有已知的财务利益或个人关系可能影响本文报告的工作。
**致谢**
本研究得到了国家自然科学基金(批准号42476246)、山东省自然科学基金(批准号ZR2025MS550;ZR201911170241)和中华人民共和国科学技术部(批准号2023YFE0201900)的资助。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号