提升年度尺度显著波高预测能力:对M5P决策树方法的全面性能评估

《Ocean Engineering》:Advancing annual-scale significant wave height prediction: A comprehensive skill assessment of M5P decision tree approach

【字体: 时间:2026年02月28日 来源:Ocean Engineering 5.5

编辑推荐:

  年尺度风浪显著高度预测中M5p决策树模型的优化与应用研究,基于ERA5再分析数据,通过对比决策树分析法和向后剔除法进行特征选择,发现风速是最关键预测因子,月度数据分割可将均方根误差降低30%,限制树深至5层可兼顾可解释性与预测精度,模型在12个月预报中RMSE降至0.059,相关系数达0.998,较未包含风速的传统模型性能更优,为海事安全、能源开发等提供高效可解释的预测工具。

  
孙振航|王思思|王丽君
广东海洋大学船舶与海洋工程学院,中国广东省湛江市524088

摘要

准确预测年度尺度上的显著风浪高度对于海上安全、海岸管理和可再生能源应用至关重要。尽管机器学习和数值模型提供了强大的工具,但它们的复杂性和计算需求往往限制了实际应用。本研究评估了M5p决策树这种计算效率高且易于解释的替代方法,使用来自北太平洋的ERA5再分析数据来预测风浪的显著高度。特征选择通过决策树分析进行,并与向后消除法进行了比较。结果表明,风速是最有影响力的预测因子,按月份对数据进行分段可以提高模型性能,使均方根误差(RMSE)降低多达30%,并提高预测准确性。将树深度限制在5层可以提高可解释性,同时保持相似的预测准确性。使用月度数据分段的M5P决策树模型表现最佳,其RMSE值低至0.059,相关系数为0.998,而排除风速的模型的RMSE值分别为0.130和0.989。研究表明,M5P决策树提供了一种实用、可解释且高效的风浪高度预测方法,在准确性和计算效率方面均优于传统模型。

引言

波高预测在海洋工程、海岸作业、海洋可再生能源提取和气候研究中至关重要。显著波高(SWH)影响海上平台的安全、海岸侵蚀缓解、波浪转换器的性能以及船舶航线(Ahmed等人,2022;Gao等人,2023;Yeganeh-Bakhtiary等人,2023b)。长期波高估计对于理解气候变化对海洋条件的影响尤为重要(Ali和Prasad,2019)。年度尺度的波预测有助于评估气候模式对沉积物输送、海滩侵蚀和海上能源产生的影响(Shamshirband等人,2020;Yeganeh-Bakhtiary等人,2023c)。可靠的年度尺度预测对于港口作业、疏浚活动、海上建设(Dodet等人,2019);航运和渔业(DeMott等人,2021);风能和波浪能发电场支持(Hosseinzadeh等人,2023;Song等人,2023;Gao等人,2025);以及海岸线管理和防洪策略(Fontán-Bouzas等人,2022)的季节性调整是必要的。
已经开发了多种波高预测方法,大致分为经验方法、统计方法、数值方法和基于机器学习(ML)的方法。基于观测和回归的经验和统计模型已被用于根据历史数据集简化波高预测(Abbasi,2019;Salah,2017)。虽然这些方法计算成本较低,但它们在捕捉非线性相互作用和复杂波浪现象方面存在局限性(De Gracia等人,2019;Yeganeh-Bakhtiary等人,2023c)。
数值波预测模型,如WAM(Wamdi Group,1988)、SWAN(Booij等人,1999)和WW3(Tolman,1991,2009),已被广泛用于波高预测。这些模型整合了风、流速和水深数据,提供了广泛空间和时间尺度上的可靠波高预测(Zhang等人,2019)。然而,计算强度高、依赖大量气象数据、近岸性能差以及在水深变化迅速的区域难以进行高分辨率预测,限制了这些模型的应用(Behnood等人,2017;Blaifi等人,2018;Karniadakis等人,2021;Mehrabi等人,2021;Rudin,2019)。
机器学习通过解决数值和经验方法的局限性,彻底改变了波高预测。人工神经网络(ANN)、支持向量机(SVM)和长短期记忆(LSTM)等技术展示了卓越的准确性和适应性(Shamshirband等人,2020)。这些方法利用历史数据集和气象输入来提高预测准确性(Pedregosa等人,2011;Hu等人,2020;Sarker,2021)。此外,深度学习模型,如ConvLSTM,结合了空间和时间数据,提高了预测准确性,特别是在短期预测方面(Song等人,2022)。然而,基于ML的方法面临重大挑战,包括过拟合风险(Shi等人,2015)和缺乏可解释性(Wang等人,2021)。
M5p决策树(DT)是一种混合ML模型,它将决策树与线性回归相结合,使其在波高预测中非常有效(Jrab等人,2024)。这种结构使M5P DT能够有效建模非线性关系,同时提供可解释的线性方程(Dastourani等人,2013)。与提到的ML模型不同,M5P DT提供了一种结构化、可解释的方法,同时保持计算效率(Sadeghifar等人,2022)。M5P DT能够处理多种输入类型,利用了其他多种模型的优势,使其成为开发预测模型的强大工具。这种灵活性增强了其在不同数据集和复杂预测任务中的适用性,进一步提高了其在数据驱动决策中的实用性(Nourani和Molajou,2017)。最近的研究证明了M5P DT在气候参数预测中的有效性(Nourani等人,2019a)。Nhu等人(2020)使用M5p预测了伊朗Zrebar湖的每日水位。Yeganeh-Bakhtiary等人(2022)应用M5P DT预测未来气候变化情景下的气象条件。Yeganeh-Bakhtiary等人(2023a)在另一项研究中使用M5P DT预测了未来的降雨和温度趋势。此外,M5P DT还应用于波浪能开发和河流交汇处的冲刷深度预测(Balouchi等人,2015)。
然而,M5p在年度尺度波预测中的应用仍然很大程度上未得到探索。本研究旨在通过评估M5P DT在1个月、3个月、6个月和12个月的中期时间尺度上的预测能力来填补这一研究空白。本研究利用M5p决策树(M5P DT)模型,使用北太平洋的ERA5再分析数据来评估年度尺度上的显著风浪高度(SHWW)预测及其相关性。详细的研究方法,包括特征选择、场景设计(数据划分和DT深度)和模型评估,在第2节中介绍。
与许多专注于最大化短期预测准确性的机器学习研究不同,本研究旨在提供工程视角的见解,探讨数据量、时间组织和模型复杂性如何共同影响年度尺度波预测能力。因此,本研究的新颖之处不在于算法修改,而在于为长期波预测应用中部署可解释的决策树模型建立实用指南。因此,本研究没有引入额外的机器学习基准,因为此类比较超出了定义的范围。在本研究中,“年度尺度预测”指的是长达一年的预测范围(1-12个月),而不是多年气候变异性的分析。重点是在工程和运营建模框架内,评估模型行为、鲁棒性和预测能力,从月度到年度尺度逐渐增加。

研究方法

研究方法

M5P DT是一种多功能且强大的工具,可用于气候和波高预测,它在准确性、可解释性和计算效率之间取得了平衡。本研究首先使用M5P DT选择重要特征,然后根据“数据分离”和“树深度”两种情景预测风浪的显著高度。模型的开发和评估使用了ERA5再分析数据,并通过各种方法进行了评估

结果与讨论

本节展示了基于数据分段和决策树深度的特征选择步骤和场景分析的结果。

结论

本研究全面评估了M5P DT模型在年度尺度SHWW预测方面的性能,重点关注特征选择、数据分段和模型复杂性。
本研究在当前文献的基础上,通过将重点从基于准确性的模型竞争转向工程导向的模型行为分析,推动了波高预测的研究进展。尽管许多近期研究优先考虑使用复杂ML架构的短期预测性能,但

CRediT作者贡献声明

孙振航:写作——审稿与编辑、可视化、软件、资源、方法论、调查。王思思:写作——审稿与编辑、资源、方法论、调查、正式分析、数据整理。王丽君:写作——初稿撰写、监督、项目管理、资金获取、正式分析、概念化。

资助

本工作部分得到了国家自然科学基金(资助编号:52171346、52571405和52271361)、广东省南海海洋养殖智能装备重点实验室(资助编号:2023B1212030003)以及广东省普通高校重点领域项目(资助编号:2024ZDZX3054)的支持。

利益冲突声明

作者声明没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。

致谢

不适用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号