使用CASGP-X框架,对沿生物海岸线的近岸波浪进行可解释且基于概率的建模

《Ocean Engineering》:Explainable and probabilistic nearshore wave modeling along living shorelines using a CASGP-X framework

【字体: 时间:2026年03月05日 来源:Ocean Engineering 5.5

编辑推荐:

  可解释概率框架CASGP-X通过级联稀疏高斯过程回归与SHAP解释,实现了近岸水深、有效波高和峰值周期的多变量预测,在特拉华湾试验中展现出高精度(d和Hs)和可靠的不确定性区间(95%置信区间),支持生岸防护工程的风险决策与传感器优化。

  
王楠|刘星宇|乔月|游在金
中国辽宁省大连市大连海事大学导航学院

摘要

准确可靠的近岸波浪特征描述对于评估生态海岸线的防护性能和长期韧性至关重要。本研究开发了一个可解释的概率框架CASGP-X,该框架结合了级联稀疏高斯过程回归架构、显式的不确定性量化以及SHapley加性解释(SHAP)方法,共同预测水深(d)、有效波高(Hs)和峰周期(Tp)。在特拉华湾上部建造的牡蛎礁保护海岸系统的实验结果表明,该框架具有很强的预测能力,在平静条件和东北风暴事件下,对d和Hs的预测精度较高,对Tp的预测也较为满意。CASGP-X生成的95%预测区间校准良好,其宽度随风速、潮汐和风暴强度的变化而变化,有助于基于不确定性进行决策。

引言

特拉华湾及其河口系统位于美国大西洋中部海岸,是世界上人口最密集的沿海地区之一,是近岸鱼类和贝类的关键栖息地(Oleynik等人,2024年)。然而,由于长期受到强风、波浪和风暴潮的影响,海岸线以每年0.1至1米的速度侵蚀(Kukulka等人,2017年)。近年来,为了恢复和保护退化的海岸生态系统,生态海岸线作为一种替代或补充方案逐渐受到重视(Long等人,2024年;Xu等人,2024年;Li X等人,2025年;Gu等人,2025年;Hou和Gao,2026年)。这些生态海岸线已在美国大西洋沿岸的河口和海湾得到应用,并在全球范围内引起关注和采用(Smith等人,2020a年;Sutton-Grier等人,2015年;Wang等人,2021年)。现有研究表明,生态海岸线的防护效果和长期生态效益不仅取决于其局部结构形式,还与入射波能量和波功率有关(Gao等人,2021年)。因此,对周围波功率的长期监测至关重要(Everett等人,2019年;Sanford和Gao,2018年)。然而,目前的研究主要依赖于有限地点的短期现场观测或特定风暴事件后的分析,在时间覆盖范围和代表性方面存在局限性(La Peyre等人,2022年;Smith等人,2020b年)。鉴于长期观测数据的高成本和维护难度,需要利用波浪模型来重建生态海岸线周围的长期波浪条件,例如数值模型(如Booij等人,1999年)和基于软计算的海浪模型(如Parker和Hill,2017年)。
长期以来,基于物理的数值模型(如SWAN和WAVEWATCH III(WW3)被广泛用于海岸波浪和水动力模拟研究(如Sapiega等人,2023年;Al Azad和Marsooli,2024年;Chen等人,2018年;Pareja-Roman等人,2019年;Chen等人,2025年;Sun等人,2025年;Zhu等人,2023年)。尽管这些模型在大多数操作条件下通常能产生可靠的模拟结果,但其预测精度高度依赖于关键输入和参数设置,如边界条件、风场强迫和底部摩擦。与这些因素相关的不确定性可能会在建模系统中累积,导致模拟波浪场的较大不确定性(Rogers等人,2007年;Samiksha等人,2021年;Siadatmousavi等人,2016年)。因此,最近的研究将不确定性量化纳入近岸波浪模拟中,以评估预测可靠性并支持基于风险的工程决策。例如,Nikishova等人(2017年)使用不确定性传播和Sobol敏感性分析量化了SWAN模拟中的不确定性,发现风场强迫是预测不确定性的主要来源。Kumar等人(2026年)比较了SWAN和WW3在风暴潮模拟中的不确定性,发现SWAN系统性地低估了风暴潮高度和风暴潮功率,而WW3更接近ERA5的预测结果,但在南大洋等高能量区域则倾向于高估。此外,WW3生成的置信区间较窄,表明其整体可靠性更高。尽管这些模型具有物理真实性,但数值模型的不确定性量化通常计算成本较高,因此不适用于高分辨率的长期模拟或快速情景分析。这些局限性激发了对高效、易于适应的数据驱动和基于机器学习的波浪建模方法的研究兴趣。
近年来,人工神经网络、支持向量机、长短期记忆网络、贝叶斯网络和决策树等机器学习方法被广泛应用于基于软计算的海浪模拟模型中(Chen等人,2023年;Guo等人,2025年;Lee等人,2021年;Wei和Davison,2022a,2022b;Wu等人,2020年)。这些数据驱动模型能够捕捉环境驱动因素与波浪响应之间的复杂非线性关系,同时无需显式求解控制物理方程即可快速预测。然而,大多数基于机器学习的波浪模型主要关注点估计,在极端海况或样本稀少的气象事件下往往存在较大偏差(Gao等人,2024年)。在这种情况下,模型输出可能过于自信,提供的关于预测可靠性的信息有限。因此,海岸和海洋工程应用的需求从单纯追求准确性指标转向要求对预测不确定性和相关风险进行可信的表征。这种转变强调了模型不仅需要提供预测值,还需要指示可能的结果范围及其置信水平,从而实现基于风险的决策(Cerqueira和Torgo,2024年;D?skeland等人,2025年;Kar等人,2024年;Lee等人,2025年;Ouyang等人,2024年;Xie和Zhang,2025年)。概率回归框架因此受到越来越多的关注,因为它们能够通过明确表示模型不确定性和数据噪声来实现不确定性感知的预测。然而,许多现有的概率方法在计算可扩展性和适用于长时间序列或多变量海岸数据集方面面临实际挑战。这促使人们开发出高效、可扩展的概率学习框架,能够在保留不确定性量化能力的同时适用于实际的近岸波浪预测应用(Kendall和Gal,2017年;Yu等人,2025年)。
除了预测准确性和不确定性量化之外,在海岸工程应用中,还需要了解哪些环境驱动因素对模型输出影响最大,尤其是在复杂、动态的近岸条件下。这种可解释性对于诊断模型行为、理解物理机制以及设计有效的观测或干预策略至关重要。为了满足这一需求,最近的研究引入了能够在单个样本层面解释预测的可解释机器学习技术,如SHapley加性解释(SHAP)方法、LIME、Anchors和集成梯度(Lundberg和Lee,2017年;Ribeiro等人,2016年,2018年;Luo和Xu,2024年;Sundararajan等人,2017年;Wang等人,2026年;Xu等人,2024年)。然而,大多数现有研究将不确定性量化和可解释性视为独立的部分,通常单独应用或作为事后分析步骤。这种碎片化的方法限制了联合评估预测置信度及其潜在驱动因素的能力。在这种情况下,在统一的框架内整合不确定性感知的预测与特征归因仍然是一个未解决的挑战。
本研究开发了一个名为CASGP-X的预测框架,该框架明确整合了不确定性量化和可解释性,用于生态海岸线环境中的近岸波浪预测。通过将概率建模与基于SHAP的解释相结合,所提出的方法为单个预测提供了校准的置信区间和特征级别的洞察力,从而能够在不同的潮汐条件下进行特定地点的驱动因素分析。为此,构建了一个三阶段级联稀疏高斯过程回归(SGPR)框架,依次预测水深(d)、有效波高(Hs)和峰周期(Tp),沿着主要的物理过程链进行预测。与传统基于物理的数值模型和黑盒机器学习方法相比,所提出的框架提供了具有高计算效率的统一预测-不确定性-解释输出。它还使得从短期近岸观测中可扩展地推断长期波浪特性,为生态海岸线评估、近岸灾害缓解和海洋工程设计提供了透明可靠的数据驱动工具。本研究的主要贡献有三个方面:
  • (1)
    我们开发了CASGP-X,这是一个可解释的概率框架,它结合了三阶段级联SGPR架构,依次预测水深、有效波高和峰周期,提供了与潮汐-深度调制和随后的波浪转换在结构上一致的多变量预测。
  • (2)
    我们在SGPR框架中引入了显式的不确定性量化模块,实现了具有校准的95%预测区间和随时间变化的置信信息的概率预测,支持基于不确定性的海岸应用,包括在风暴驱动的非平稳条件下的决策和基于置信度的模型集成。
  • (3)
    我们在每个预测阶段都结合了基于SHAP的可解释性,提供了样本级别和站点级别的驱动因素归因,包括潮汐分层分析和站点组特征重要性。这为了解哪些环境输入对模型输出影响最大提供了透明且实用的洞察力,为观测网络设计和传感器部署优化提供了指导。
  • 研究区域

    研究区域

    特拉华湾上部是多项基于自然的海岸线保护计划的重点区域,旨在减轻海岸侵蚀并增强对极端事件的韧性。2016年,在Money Island Marina和Gandys Beach之间约900米的范围内实施了一个生态海岸线项目。该项目旨在促进盐沼恢复,并为2012年飓风Sandy严重影响的内陆地区提供额外保护,同时

    模型预测性能

    使用WG3和WG5站点的d、Hs和Tp的预测值与观测值之间的测试集比较,评估了基于SGPR框架的预测性能。这些模型预测与观测值之间的成对比较在图3中以散点图的形式呈现,其中实线表示完美一致的1:1线。总体而言,模型在所有变量上均表现出强大的性能,尤其是对d和Hs的预测精度非常高。

    波浪预测中的不确定性量化

    为了评估CASGP-X框架生成的预测区间的可靠性和准确性,采用了两个互补的指标:PICP和MPIW。PICP衡量在给定名义置信水平下被预测区间捕获的观测值的比例,从而反映了区间的可靠性;而MPIW量化了预测区间的平均宽度,并表征了预测的准确性。

    结论

    生态海岸线和近岸环境中的生态海岸线越来越多地被用于减轻侵蚀、减弱波浪能量并增强海岸韧性。然而,由于潮汐水平、风场强迫、浅水过程和波浪-结构相互作用之间的强非线性交互作用,准确描述这些环境中的近岸波浪动态仍然具有挑战性。本研究旨在开发一个可解释且具有不确定性感知的数据驱动框架,以预测关键参数

    CRediT作者贡献声明

    王楠:撰写——审稿与编辑、监督、方法论、资金获取。刘星宇:撰写——初稿、可视化。乔月:撰写——初稿、验证。游在金:撰写——审稿与编辑、方法论、资金获取。

    利益冲突声明

    作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。

    致谢

    感谢中国国家重点研发计划(2023YFC3007900)和中央高校基本科研业务费(3132025661)的资助。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号