基于PCMCI驱动的融合因果神经网络的可解释性南海有效波高预测

《Journal of Ocean Engineering and Science》：Interpretable Significant Wave Height Prediction in the South China Sea Using PCMCI-Driven Fused Causal Neural Networks

【字体：大中小】 时间：2026年06月06日 来源：Journal of Ocean Engineering and Science 11.8

编辑推荐：

　　准确预测有效波高（Significant Wave Height, SWH）在海洋灾害预警中具有关键作用。然而，主流基于人工智能（Artificial Intelligence, AI）的预测方法通常未能充分挖掘现有先验知识，从而在一定程度上限制了其输出结果的

准确预测有效波高（Significant Wave Height, SWH）在海洋灾害预警中具有关键作用。然而，主流基于人工智能（Artificial Intelligence, AI）的预测方法通常未能充分挖掘现有先验知识，从而在一定程度上限制了其输出结果的准确性与可靠性。为解决该问题，本研究建立了一个融合Peter and Clark矩条件独立性（Peter and Clark Momentary Conditional Independence, PCMCI）的智能SWH预测框架，并系统评估了将因果分析引入区域海浪预报的可行性。实验结果表明，基于因果特征选择的卷积长短期记忆网络（Convolutional Long Short-Term Memory with causal feature selection, ConvLSTM_FS）和基于因果特征选择的卷积序列到序列模型（Convolutional sequence-to-sequence with causal feature selection, ConvSeq2Seq_FS）均优于其未进行特征选择的对应模型，且ConvLSTM_FS在所有对比模型中于5小时及更短预报时效取得了最低均方根误差（Root Mean Squared Error, RMSE）。此外，融入额外因果权重单元结构及因果强度输入的因果卷积序列到序列模型（Causal-Convolutional sequence-to-sequence, C-ConvSeq2Seq）在6小时及以上预报时效表现出更优的预报性能。与次优的ConvSeq2Seq_FS模型相比，C-ConvSeq2Seq模型的RMSE降低了1.33%–3.48%。基于不同模型在不同预报时效上的互补优势，本研究进一步提出了特征因果时序自适应卷积模型（Feature-Causal Temporal Adaptive Convolutional, FCTA-Conv），该模型融合了ConvLSTM_FS和C-ConvSeq2Seq，集成了ConvLSTM_FS在短时效预报中的优势以及C-ConvSeq2Seq在长时效预报中的优势。上述发现表明，将因果分析融入时空SWH预测框架可有效提升模型性能。

海洋波浪的精准预测对诸多领域具有至关重要的意义，包括优化海洋船舶的水动力性能、提升可再生能源利用效率、增强海洋灾害预警系统的可靠性以及保障海洋工程项目的作业安全。这一基础性研究需求推动了全球波浪预测技术的持续发展。当前，数值模拟与机器学习是SWH预测的两大主流技术范式。传统数值模型（如SWAN、WaveWatch III、MASNUM和ECMWF）通过求解波作用量平衡方程实现波浪预报，但其预测精度受到物理机制认知不完整、参数输入不确定性以及对近岸边界条件高度敏感性等因素的严重制约。近年来，以卷积长短期记忆网络（ConvLSTM）和序列到序列模型（Seq2Seq）为代表的数据驱动深度学习方法在波浪预测中展现出优越的非线性拟合能力与计算效率，避免了物理过程的复杂数学建模。此外，基于动态自适应小波的模糊框架在延伸期波高预测中表现优异，特征堆叠集成学习模型通过提升波浪预测精度有效提高了波浪能发电场效率，轻量级循环神经网络也实现了海洋波高场的高精度稀疏到完整重构，为空间波浪预报提供了轻量高效的解决方案。

数据驱动模型往往存在可解释性不足的问题。为缓解这一缺陷，融合物理与数据驱动的方法逐渐成为有希望的研究方向。物理信息神经网络（Physics-Informed Neural Networks, PINNs）在海洋领域得到广泛应用，该框架将物理方程嵌入损失函数以确保模型输出符合已知物理规律。例如，Zhu等人将浅水方程融入PINNs以改进风暴潮预报，Wang等人将波频散关系引入长短期记忆网络以实现波周期与波长的同步预测。Google研究与欧洲中期天气预报中心（ECMWF）联合开发的NeuralGCM结合物理方程与人工智能，以极低计算资源实现高效的1–15天天气预报。除物理约束学习外，因果推断是提升模型可解释性的另一有效途径。已有研究表明，将因果关系信息融入深度学习模型能有效改善土壤湿度估算、风速预测和湿地甲烷排放建模等多种环境应用的预测性能，通常通过损失函数约束、结构优化以及基于统计推断因果联系的特征选择等因果引导策略实现。当这些因果结构嵌入循环神经网络架构时，模型能更好地优先关注目标变量的关键驱动因素。然而，当前因果推断方法的应用仍主要局限于水文领域，在海洋科学尤其是区域波浪预测中，明确融合因果推理与深度学习的预报框架仍然稀缺。

在此背景下，本研究探索了将因果推断引入SWH预测的可行性，开发了一个因果信息驱动的预测框架。研究聚焦于两个主要目标：一是利用PCMCI方法从观测数据中识别关键因果驱动因子，以增进对SWH与环境变量间复杂相互作用的理解；二是通过面向模型的特征选择和因果引导的结构设计，提升基于AI模型的预测准确性和可解释性。为实现这些目标，研究人员首先应用PCMCI算法量化SWH与相关环境因素之间的滞后和同步因果关系，得到一组主导因果特征及其对应的因果强度。在此基础上，提出了FCTA-Conv预测框架，该框架由两个互补子模型组成：基于因果特征选择的卷积长短期记忆网络（ConvLSTM_FS）和因果卷积序列到序列模型（C-ConvSeq2Seq）。对于5小时及以下的预报时效，FCTA-Conv模型采用ConvLSTM_FS的结果作为输出；对于超过5小时的预报时效，则输出C-ConvSeq2Seq的结果。ConvLSTM_FS模型融入了基于因果关系的特征选择和递归预测策略，剔除了与SWH因果关联较弱的变量，在短时效预报中表现强劲。C-ConvSeq2Seq模型则采用编码器-解码器架构，并增设因果权重模块，将PCMCI衍生的因果强度用于对不同时间步的输入特征进行加权，赋予与SWH具有强因果影响的变量更高关注度，从而为长时效预测提供明显优势。由于机器学习模型性能高度依赖于超参数选择，该研究利用贝叶斯优化（Bayesian Optimization, BO）对模型超参数进行调优。此外，为验证因果关系的可信度，研究人员进一步采用Shapley可加性解释（Shapley Additive Explanations, SHAP）对模型进行可解释性分析，对比PCMCI因果推断结果与SHAP分析结论的一致性。

**研究数据来源与区域**

本研究使用的ERA5数据集由ECMWF提供，涵盖1940年至今的全球海洋气象变量。该数据集基于物理模型，融合多源实地和卫星观测数据，通过数据同化技术生成全球一致的气象场。本研究使用的变量包括：有效波高（SWH）、平均波向（Mean Wave Direction, MWD）、平均波周期（Mean Wave Period, MWP）、平均海平面气压（Sea Level Pressure, SLP）、地表气压（Surface Pressure, SP）、海表温度（Sea Surface Temperature, SST）、2米温度（2-m temperature, T2m）、10米U风分量（10-m U wind component, U10）、10米V风分量（10-m V wind component, V10），以及由U10和V10计算得到的10米风速（WS）和10米风向（WD）。研究数据集的时间分辨率为1小时，空间分辨率为0.5°×0.5°。此外，热带气旋最佳路径数据来自中国气象局热带气旋数据中心，记录自1949年以来西北太平洋盆地每个热带气旋每6小时的位置和强度信息。研究区域为南海（0–25°N，105–125°E），该海域作为西太平洋大型低纬度边缘海，因其独特的地形多样性、季风驱动的环流系统以及频繁的热带气旋活动，成为区域SWH预报和因果推断研究的理想试验场。为验证ERA5再分析数据集的可靠性，研究采用了来自中国台湾中央气象署的浮标观测数据进行对比分析，结果显示ERA5的SWH数据与浮标站数据高度一致。

**因果推断方法与因果关联分析**

SWH的动态变化受多个环境因素相互作用的影响。因果推断方法有助于识别滞后和同期因果关系，这对构建准确的SWH预测模型至关重要。PCMCI算法由Runge等人提出，是原始PC算法的扩展版本。与依赖严格马尔可夫条件和因果充分性假设（可能导致伪因果联系）的PC算法不同，PCMCI方法通过引入矩条件独立性（Momentary Conditional Independence, MCI）检验，能有效解决线性和非线性时间序列数据中自相关引起的伪相关问题。对于包含m个变量的时间序列数据集，PCMCI算法通过两个核心步骤执行因果推断：首先是PC条件选择步骤，利用PC算法为m维时间序列X^t=(X^t₁,…,X^t_m)中每个变量推导父集P(X^t_j)的超集估计P^(X^t_j)；其次是MCI检验步骤，以步骤(1)得到的父集P(X^t_j)作为条件集，对所有变量对(X^t-τ_i,X^t_j)进行检验。本研究采用偏相关检验统计量评估条件独立性的存在，显著性阈值设定为0.01，偏相关检验统计量即定义为因果强度。

本研究采用PCMCI计算南海各格点处SWH与环境变量之间的滞后和同期因果关联，并提取相应的因果特征及其强度。敏感性实验表明模型在6小时输入时间步时达到最优预报性能，因此计算了t-5至t时刻的环境变量与t+1时刻SWH之间的因果特征和因果强度。结果显示，MWD、T2m、SST和WD的空间分布频率最低，其中WD与SWH的因果关联频率在大多数时间步和区域接近0；而MWP、SWH和WS的出现频率相对较高，这与海浪由风驱动以及波周期与SWH强相关的物理事实一致。随着计算因果强度的时间间隔缩短，区域平均因果强度逐渐从0.00–0.02（最远时间间隔t-5至t+1）增加到0.00–0.81（最近时间间隔t至t+1），表明各环境变量对SWH的因果影响随间隔缩短而增强。WS和MWP在同一时间间隔的所有环境变量中始终保持相对较强的因果强度，而SWH从t-5至t-3保持0.01的因果强度，在t-2上升至0.06，在t-1和t分别进一步增至0.19和0.81，成为当前时间间隔中因果强度最高的变量。综合分析表明，历史MWP、SWH和WS与未来SWH存在强因果关联，而MWD、T2m、SST和WD的因果关联始终较弱甚至可忽略。

**模型构建与消融实验**

完整的实验流程首先对2021–2024年的变量进行min-max归一化处理，然后利用PCMCI方法分析南海各格点处SWH与环境因素之间的时滞和同步因果关联，提取相应因果特征及其强度，注意因果推断过程仅使用训练集数据以避免信息泄露。研究采用均方误差（MSE）、均方根误差（RMSE）、决定系数（R2）、平均绝对百分比误差（MAPE）和平均误差（ME）作为评估指标，并利用贝叶斯优化对ConvLSTM、ConvSeq2Seq和C-ConvSeq2Seq模型的超参数进行调优，以验证集上的MSE作为选择最优模型的准则。模型训练设置500个epoch，采用自适应矩估计（Adam）优化器，并引入早停机制和动态学习率调整机制以缓解过拟合。

ConvLSTM模型通过改进长短期记忆网络和卷积神经网络提出，能有效捕捉时空特征。C-ConvSeq2Seq模型在ConvSeq2Seq基础上增设因果权重单元：首先使用softmax函数将因果强度CS^t沿通道维度归一化至[0,1]范围；随后将归一化的CS^t与输入特征X^t相乘得到因果加权特征X^tcs；最后通过卷积和非线性激活函数增强其捕捉时空和非线性变化的能力。为研究输入时间步对模型预测性能的影响，研究使用从过去1小时到10小时的不同时间步作为ConvSeq2Seq模型的输入，每个实验配置实施10次重复运行，并进一步进行10000次重采样的非参数Bootstrap分析。结果表明模型在输入时间步为6时整体RMSE最小，因此所有模型统一采用从t-5到t的特征集作为输入变量。值得注意的是，ConvLSTM在训练阶段仅预测下一时间步的SWH，在推理阶段采用自回归滚动预测；而ConvSeq2Seq和C-ConvSeq2Seq在训练和推理中保持一致，直接输出未来1–24小时的SWH预报序列。此外，C-ConvSeq2Seq模型的输入除特征X外还包括因果强度CS，在编码器组件中对应各时间步的因果强度CSⁿ（n∈[t-5,t]），在解码器组件中由于每次迭代仅预测下一时间步的结果，因果强度输入固定为CS^t（t与t+1之间的时空因果强度）。

**消融实验结果分析**

为证明贝叶斯优化算法的有效性，研究设计了固定超参数的对照实验。结果显示，引入BO后所有模型的RMSE均降低：BO-ConvLSTM、BO-ConvSeq2Seq和BO-C-ConvSeq2Seq相对于无BO的基线模型分别实现了12.329%、4.124%和6.077%的性能提升。

在各预报时效下不同模型的性能分析表明：含因果特征选择的ConvLSTM_FS和ConvSeq2Seq_FS在所有预报时效上均优于使用全部变量的对应模型，证明了因果特征选择的有效性。为进一步消除输入特征数量减少对模型性能的干扰，研究补充了控制一致输入维度的平行消融实验，结果表明保留PCMCI识别的强因果特征的模型在相同输入维度各组中表现最优，说明性能提升更可能归因于因果特征选择而非单纯的输入维度简化。与ConvLSTM（及ConvLSTM_FS）相比，配备编码器-解码器结构的ConvSeq2Seq（及ConvSeq2Seq_FS）在3小时及以上预报时效表现更好（6小时及以上优势更明显），但在短时效预报中存在不足，表明编码器-解码器结构对长时效具有更优建模能力而在短时效 forecasting 中效果较差；相反，基于自回归滚动预测的ConvLSTM模型在短时效预报中展现显著优势。此外，虽然ConvLSTM_FS在短于6小时的预报时效中表现最优，但C-ConvSeq2Seq在6小时及以上预报时效中表现最佳。在1–5小时预报时效，C-ConvSeq2Seq未显示出改进，但随着预报时效增加，其性能逐渐接近ConvSeq2Seq_FS。超过6小时后，RMSE、R2和MAPE的改善率分别呈现"先增后稳"、"逐渐增加"和"先升后降"的趋势，改善范围分别为1.328%–3.478%、0.047%–0.910%和1.217%–7.278%。

基于SHAP分析对1–5小时短时效负改善率原因的探究显示，MWD在所有输入时间步的累积贡献从1小时预报时效的1.21%逐渐增加到24小时预报时效的4.60%。ConvSeq2Seq_FS直接排除了MWD特征，因此在MWD影响较弱的短时效中表现更好；而C-ConvSeq2Seq对MWD赋予权重，在短时效中干扰了模型性能，但随着预报时效延长，MWD重要性增加，其纳入反而有助于提升预报性能。为验证切换阈值的鲁棒性，研究采用严格的三折时间序列交叉验证：将数据集按时间顺序分为三个互不重叠的折（Fold 1：2021–2022年训练、2023年验证；Fold 2：2021+2023年训练、2022年验证；Fold 3：2022–2023年训练、2021年验证），2024年数据作为不参与交叉验证的独立测试集。结果表明选择5小时作为两个子模型间性能切换边界可获得最低整体RMSE。因此，为同时利用短时效和长时效预报优势，本研究提出FCTA-Conv模型，融合ConvLSTM_FS的滚动预测结构（短时效优势）和C-ConvSeq2Seq的编码器-解码器结构及因果权重单元（长时效优势），从而在整个预报时效范围内实现均衡优异的性能。

**FCTA-Conv模型性能验证与极端海况分析**

为定量直观验证FCTA-Conv模型的性能，研究构建了FCTA-Conv、时间卷积网络（Temporal Convolutional Networks, TCN）和Transformer在五个典型预报时效（1 h、3 h、6 h、12 h和24 h）的预测值与观测值散点密度图。结果显示，所有三种模型均随预报时效延长呈现一致的退化趋势：散点逐渐偏离理想1:1对角线，预测误差显著增大，预测值与观测值的拟合程度持续降低。其中Transformer模型散点离散度相对较大，尤其在长时效条件下；TCN模型取得中等预测性能；而FCTA-Conv模型的散点在各时效下总体更为集中且最接近对角线，在正常和极端波况下均保持最高的预测精度和稳定性。

为评估FCTA-Conv模型的空间预测能力和鲁棒性，研究系统分析了其在正常和极端海况下的预报性能。正常海况指2024年测试数据集的非台风期，极端海况对应2024年台风穿越南海的时期（共16个台风）。在两种海况下，FCTA-Conv模型的预测误差均随预报时效延长而一致增大，RMSE从3小时到24小时显著上升，反映了波浪可预报性随预报时效延长而 inherent 衰减。红色标记区域在所有时效和两种情景下均呈现持续的SWH高估，可能与该区域复杂的近岸地形和增强的非线性波底相互作用有关。正常海况下整体ME显著较低，极端海况下则显著较高。台风期间强风场的快速演变放大了波浪演变的非线本性，导致预测与观测之间偏差增大。极端海况下南海西北部出现明显的空间差异：该区域呈现广泛的SWH低估，尤其在长时效（12和24小时）更为突出，而正常海况下不存在这种系统性低估。

尽管台风期间误差升高，FCTA-Conv模型仍保持了SWH的整体空间结构和稳定性能，证实因果增强框架不仅提升了正常条件下的精度，也增强了极端海洋事件期间的鲁棒性。以2024年9月5日12:00台风YAGI为典型案例的空间预报细节分析显示：在3小时和12小时短至中时效，FCTA-Conv模型准确捕捉了台风中心附近高波核心的位置、强度和空间分布，与ERA5参考数据高度一致；但随预报时效延长至24小时，模型表征极端大浪强度和空间覆盖的能力显著下降，预报精度明显降低。偏差演变的空间分析揭示：3小时时效，模型在台风眼北部海域呈现显著的SWH低估，而台风外围大部分区域以高估为主；随预报时效从3小时增至12小时和24小时，台风眼附近及核心高波区域的低估程度持续加剧，伴随系统性偏差的累积放大，凸显了模型在长时效预报极端峰值波浪方面的局限。

**因果强度有效性与SHAP分析**

为验证因果强度输入的有效性，研究在相同超参数设置下训练了三种不同因果强度类型的C-ConvSeq2Seq模型：PCMCI计算的因果强度、全部设为1的因果强度、以及随机生成的因果强度。实验结果表明，使用PCMCI计算因果强度的模型在3小时及以上时效取得最低RMSE；因果强度全设为1的模型在1–2小时时效表现最佳，其他时效中等；随机生成因果强度的模型在所有时效中RMSE最高。这一结果与C-ConvSeq2Seq在1–5小时时效出现负改善率的现象一致，表明因果强度的引入可能在短时效预报中干扰模型性能，但在长时效预报中显著改善性能。

为进一步验证PCMCI识别的因果联系，研究对C-ConvSeq2Seq模型的输入特征进行了SHAP分析。结果显示，在SWH预报中，历史SWH贡献最高，占所有环境变量的45%，其次为WS（18%）、MWP（10%）、U10（9%）和V10（6%），该排序与PCMCI方法得到的因果强度总体一致，表明模型基本反映了因果推断揭示的变量关系。值得注意的是，MWD在PCMCI分析中因果强度较低，但在SHAP分析中贡献略高于其他因果强度相似的变量，这种差异主要源于两种方法时间尺度的不同：PCMCI量化单时间步的瞬时因果强度，而SHAP分析累积所有预报时效的特征贡献。MWD对下一时间步SWH的瞬时影响较弱，但其对长时效预报的累积贡献不可忽视，因其包含的波浪传播方向信息对南海复杂地形下波场的空间演变施加重要约束。

**研究局限与未来工作**

尽管FCTA-Conv模型在区域波浪预报中表现优异，仍存在一定局限：极端海况下预报能力有限，FCTA-Conv在台风等极端海况下的预报误差仍显著高于正常海况，后续可考虑分别构建常规和极端海洋状态的情景专用模型；因果强度缺乏动态更新机制，本研究基于固定训练集进行PCMCI因果推断，训练过程中未动态调整因果关系，未来可引入动态因果发现技术；缺乏高分辨率和实测数据，本研究基于ERA5再分析数据，其空间分辨率（0.5°×0.5°）可能无法捕捉中小尺度海气相互作用过程，未来可整合更高分辨率的遥感、浮标或数值模拟数据；多尺度波浪相互作用考虑不足，当前模型主要关注环境变量与SWH的直接因果关系，未显式纳入波谱特征或不同频率波分量之间的跨尺度相互作用，后续可尝试结合谱分解方法与多尺度因果建模；缺乏与其他因果发现方法的交叉验证，本研究仅采用PCMCI算法进行因果关系识别和量化，未比较不同因果推断方法的性能。

**研究结论**

本研究系统评估了将因果分析引入区域波浪预报的可行性，构建了融合PCMCI因果推断的智能SWH预测框架，在南海利用ConvLSTM_FS、ConvSeq2Seq_FS和C-ConvSeq2Seq等模型开展了多组对比实验和可解释性分析。研究的方法学创新在于提出了因果权重单元——独立于传统ConvLSTM单元的神经网络模块，可将定量因果先验知识注入模型架构；并构建了融合ConvLSTM_FS短时效优势和C-ConvSeq2Seq长时效优势的FCTA-Conv模型。主要结论如下：因果特征选择和因果权重单元均能提升模型性能，ConvLSTM_FS和ConvSeq2Seq_FS通过选择关键因果变量显著提高了预报精度，C-ConvSeq2Seq进一步引入因果权重单元结构和因果强度输入，在6小时及以上时效取得最优表现；滚动预测结构和编码器-解码器结构分别在短时效和长时效预报中各具优势；贝叶斯优化显著提升了所有模型的预报性能；PCMCI因果推断和SHAP可解释性分析共同确认了历史SWH、WS和MWP对未来SWH具有显著因果关联和预测贡献，增强了模型可解释性并为特征工程提供了理论基础。总之，本研究从方法构建、性能验证和机理解释三方面系统验证了因果分析在AI区域波浪预报中的有效性和重要性，提出的FCTA-Conv不仅为南海波浪预报提供了新范式，也为发展可解释、高性能的海洋环境预报模型提供了新思路和技术路径。

热点排行