基于层次化交叉注意力Transformer的剩余航行时间预测模型：结合AIS（自动船舶识别）数据和天气信息

《Ocean Engineering》：Hierarchical Cross-Attention Transformer for Remaining Voyage Time prediction using AIS and weather data

【字体：大中小】 时间：2026年05月02日 来源：Ocean Engineering 5.5

编辑推荐：

　　李相硕|李元熙韩国船舶与海洋工程研究所（KRISO），大田市裕城区裕城大路1312号，34103，韩国 **摘要** 在准时制（JIT）到达的背景下，准确预测船舶的到达时间对于优化航行计划和港口资源协调至关重要。本研究提出了一种分层交叉注意力Transformer

　　李相硕|李元熙
韩国船舶与海洋工程研究所（KRISO），大田市裕城区裕城大路1312号，34103，韩国

**摘要**
在准时制（JIT）到达的背景下，准确预测船舶的到达时间对于优化航行计划和港口资源协调至关重要。本研究提出了一种分层交叉注意力Transformer模型，用于剩余航行时间（RVT）的预测，该模型整合了自动识别系统（AIS）轨迹、静态船舶参数和海洋天气数据。与传统基于Transformer的方法不同，这些方法将航行视为一个平坦的序列进行处理，而所提出的架构将航行序列划分为时间段，并使用共享的局部Transformer编码器来捕捉段落内的动态变化。全局Transformer编码器汇总段落级别的表示，以模拟段落间的依赖关系，而交叉注意力机制则动态地将静态船舶属性与时间特征融合在一起。该模型使用前往釜山港的航行数据集进行了评估，并与几种机器学习和深度学习基线模型进行了比较。实验结果表明，所提出的模型的平均绝对误差（MAE）为29.35分钟，在各种指标上均优于评估的基线模型。此外，还进行了到达时间对齐分析，以研究预测精度与船舶在低速区域停留时间之间的关系。结果表明，顺序RVT预测有潜力减少不必要的等待时间，从而提高海上物流的运营效率。

**1. 引言**
海运行业目前正在努力遵守旨在减少温室气体排放的环境法规（UNCTAD，2025年）。国际海事组织（IMO）已将运营效率确定为实现这些目标的关键途径（IMO，2023年）。在提出的运营措施中，准时制（JIT）到达概念越来越受到关注，作为一种通过将船舶到达时间与泊位可用性和港口服务准备状态对齐来减少可避免的燃料消耗的方法（IMO，2021年）。当到达时间不确定时，船舶往往会采取保守的运营策略，在航行早期保持较高的巡航速度，在接近港口时经历闲置期。这种运营模式削弱了JIT到达的潜在效率提升。尽管IMO基于历史运营分析报告了JIT到达的潜在好处（IMO，2022年），但由于航行过程中缺乏可靠的到达时间预测性，其实际应用仍然有限。

从船舶运营的角度来看，JIT到达策略的有效性从根本上取决于预测船舶在航行过程中的到达时间的能力，通常表示为预计到达时间（ETA）（Poulsen等人，2022年）。在顺序预测环境中，ETA可以等效地表示为剩余航行时间（RVT），即当前时间戳与最终到达时间之间的时间差。在船舶运营能效措施中，基于速度管理的策略（包括低速航行、航行执行和天气路由）一直被认为是提高运营效率的有效方法（Choi等人，2023年；Lee等人，2021年）。这种有效性主要归因于船舶速度与燃料消耗之间的高度非线性关系，这种关系通常被近似为速度的三次方（Bassam等人，2023年；Rehmatulla和Smith，2015年）。为了补偿到达时间的不确定性而以不必要的高巡航速度运营船舶会导致燃料消耗增加和运营效率降低（Dalheim和Steen，2021年）。在这种运营背景下，准确的RVT预测为在整个长距离航行过程中保持稳定和节能的速度剖面提供了技术基础。从港口和码头的角度来看，准确的RVT信息也至关重要。可靠的到达时间预测支持泊位分配计划、引航调度和码头资源的协调，从而减少港口方面的运营不确定性（Yu等人，2018年；H. Zhang等人，2025年）。多项研究表明，不准确或延迟的ETA更新会在码头操作中传播干扰，导致泊位利用不足和拥堵增加（Kolley等人，2023年）。因此，准确的到达时间预测将船舶侧的速度管理与港口侧运营规划联系起来，从而实现协调的JIT到达策略。

随着自动识别系统（AIS）数据的广泛可用性，大量文献研究了船舶到达时间估计的方法。早期研究主要采用统计技术和传统的机器学习模型，包括k-最近邻（k-NN）、支持向量回归（SVR）以及基于树的集成方法，如随机森林和梯度提升（Salleh等人，2017年；Xu等人，2022年；Lei等人，2024年）。这些方法通过利用历史轨迹模式建立了数据驱动的ETA估计基线；然而，它们捕捉长距离航行中的复杂非线性时间依赖关系的能力仍然有限。随着深度学习的发展，引入了更先进的架构来解决这些限制。循环神经网络（RNNs），特别是长短期记忆（LSTM）网络，由于其保持时间依赖性的能力而被广泛用于将AIS轨迹建模为序列时间序列数据（Tang等人，2022年）。最近的研究进一步探索了混合集成框架和基于图的神经网络架构，通过结合空间和关系信息来提高预测精度（Saber等人，2025年）。同时，一些研究专注于受限的运营环境，如内陆水道和狭窄通道，以明确考虑局部交通和导航限制（Wu等人，2020年；Lei等人，2024年）。

尽管在这些方法论上取得了进展，现有ETA预测研究中仍然存在两个普遍的限制。首先，许多模型将整个航行视为一个单一的均匀序列，这限制了它们同时捕捉长距离运输的全球背景和接近港口时的精细操作行为的能力（Maervoet等人，2024年；Shin和Yang，2025年）。其次，尽管风、波浪和海洋流等环境因素对船舶性能的影响已有充分记录，但这些变量通常通过静态特征连接或后期融合来纳入模型。这样的公式限制了模型学习环境条件与船舶操作动态之间时变相互作用的能力（Lang等人，2024年）。为了解决这些限制，本研究提出了一种分层交叉注意力Transformer架构用于RVT预测。与将整个航行视为平坦序列的传统基于Transformer的方法不同，所提出的模型将输入分解为不重叠的时间段，每个时间段都由共享的局部Transformer编码器进行编码，以捕捉段落内的动态变化。然后，全局Transformer编码器汇总这些段落级别的表示，以模拟整个航行的段落间依赖关系。在全局层，采用交叉注意力机制将静态船舶属性与时间表示融合在一起，其中顺序特征作为查询，船舶属性提供键和值。这种公式允许船舶特定特征在航行阶段的变化，与应用统一条件的静态连接方法形成对比。该模型将AIS轨迹数据与时间对齐的海洋天气变量相结合，并且仅依赖于航行过程中可观察到的信息，确保了无需码头侧运营数据的实际适用性。到达时间预测被构建为一个RVT预测问题，允许在航行过程中逐步进行顺序更新。通过提高RVT预测的准确性，这种方法为分析到达时间对齐和顺序航行更新下的等待时间行为提供了预测基础。

**2. 相关工作**
船舶预计到达时间（ETA）的预测是海上物流中的核心任务，因为准确的到达时间信息直接影响港口运营、泊位分配和物流协调。早期研究主要通过分析到达准时性和延迟模式来解决ETA相关的决策支持问题，而不是估计连续的到达时间。Kim等人（2017年）通过结合历史到达记录和实时运营信息来研究船舶延迟的早期检测，而Salleh等人（2017年）提出了一种基于模糊规则的贝叶斯网络来预测班轮运输中的到达准时性。随着自动识别系统（AIS）的广泛采用，大规模获取高分辨率船舶轨迹数据成为可能，显著推动了ETA预测研究的发展。Yu等人（2018年）使用AIS数据证明了ETA预测可以为集装箱码头带来运营效益，而Alessandrini等人（2018年）将ETA估计视为一个基于轨迹的问题，通过从AIS记录中识别相似的历史轨迹，建立了基于船舶运动模式的数据驱动框架。后续研究通过结合路线意识和基于监督的回归建模扩展了基于AIS的ETA预测。Wu等人（2020年）使用AIS衍生的运动学特征估计了狭窄通道中的船舶行驶时间，并展示了路线特定特征在受限水道中的影响。在相关方向上，El Mekkaoui等人（2020年）将ETA预测构建为一个基于AIS特征的监督学习问题，并评估了基于神经网络的模型。此外，Park等人（2021年）提出了一个基于路径查找的ETA预测系统，明确考虑了导航路线和几何约束，强调了路线结构在结构化导航环境中准确预测到达时间的重要性。

随着机器学习技术的成熟，大量研究调查了作为回归问题制定的基于学习的ETA模型。集成学习方法，如随机森林和梯度提升，通过捕捉船舶速度、剩余距离和船舶特性之间的非线性关系，展示了强大的预测性能（Evmides等人，2024年；Arbabkhah等人，2024年）。随着大规模AIS时间序列数据的日益可用，基于序列建模的深度学习方法得到了积极探索。循环神经网络（RNNs），特别是长短期记忆（LSTM）架构，由于其捕捉时间依赖性的能力而被广泛用于建模AIS轨迹（Tang等人，2022年）。最近的研究进一步探索了混合集成框架和基于图的神经网络架构，通过结合空间和关系信息来提高预测精度（Saber等人，2025年）。同时，一些研究专注于受限的运营环境，如内陆水道和狭窄通道，以明确考虑局部交通和导航限制（Wu等人，2020年；Lei等人，2024年）。

尽管在这些方法论上取得了进展，现有ETA预测研究中仍然存在两个普遍的限制。首先，许多模型将整个航行视为一个单一的均匀序列，这限制了它们同时捕捉长距离运输的全球背景和接近港口时的精细操作行为的能力（Maervoet等人，2024年；Shin和Yang，2025年）。其次，尽管风、波浪和海洋流等环境因素对船舶性能的影响已有充分记录，但这些变量通常通过静态特征连接或后期融合来纳入模型。这样的公式限制了模型学习环境条件与船舶操作动态之间时变相互作用的能力（Lang等人，2024年）。为了解决这些限制，本研究提出了一种分层交叉注意力Transformer架构用于RVT预测。与将整个航行视为平坦序列的传统基于Transformer的方法不同，所提出的模型将输入分解为不重叠的时间段，每个时间段都由共享的局部Transformer编码器进行编码，以捕捉段落内的动态变化。然后，全局Transformer编码器汇总这些段落级别的表示，以模拟整个航行的段落间依赖关系。在全局层，采用交叉注意力机制将静态船舶属性与时间表示融合在一起，其中顺序特征作为查询，船舶属性提供键和值。这种公式允许船舶特定特征在航行阶段的变化，与应用统一条件的静态连接方法形成对比。该模型将AIS轨迹数据与时间对齐的海洋天气变量相结合，并且仅依赖于航行过程中可观察到的信息，确保了无需码头侧运营数据的实际适用性。到达时间预测被构建为一个RVT预测问题，允许在航行过程中逐步进行顺序更新。通过提高RVT预测的准确性，这种方法为分析到达时间对齐和顺序航行更新下的等待时间行为提供了预测基础。

**3. 本研究的主要贡献**
• 本研究提出了一种分层交叉注意力Transformer架构，将航行序列分解为时间段，通过共享的局部Transformer编码器编码段落内的动态变化，并通过具有基于交叉注意力的全局编码器建模段落间依赖关系。
• 本研究将到达时间预测构建为一个多源顺序学习问题，整合了AIS轨迹、静态船舶属性和时间对齐的海洋天气变量。
• 本研究通过基于运动的聚类定义了等待状态，并引入了到达时间对齐公式，以定量分析预测精度与等待时间变化之间的关系。这些限制突显了需要模型来（i）明确捕捉长距离航行中的多尺度时间动态，以及（ii）通过结构化的交互机制整合异构信息，包括船舶属性和环境变量，而不是静态连接。为了解决这些挑战，下一节将介绍一种分层交叉注意力Transformer架构，该架构旨在模拟多尺度航行动态和结构化特征交互，以预测到达时间。下载：下载高分辨率图像（758KB）下载：下载全尺寸图像图1. 分层交叉注意力Transformer模型的整体架构。3. 方法论3.1. 概述图1展示了所提出的分层交叉注意力Transformer模型用于剩余航行时间（RVT）预测的整体架构。该模型通过三个阶段处理航行序列。首先，输入序列被划分为时间段，每个段落由共享的局部Transformer编码器编码以捕捉段落内的动态。其次，段落级表示通过全局Transformer编码器聚合，该编码器模拟段落间的依赖性，并使用交叉注意力机制将静态船舶属性融合到时间表示中。第三，聚合后的表示被传递给回归头以产生RVT预测。本节还介绍了后续操作分析中使用的等待状态识别和到达时间对齐公式。与循环神经网络（RNN）（如LSTM（Hochreiter和Schmidhuber，1997）和GRU）不同，后者通过隐藏状态传播逐步处理序列，所提出的模型完全基于Transformer架构（Vaswani等人，2017），它依赖于自注意力机制来并行捕获所有时间步的时间依赖性。这种设计避免了RNN方法中固有的序列瓶颈和梯度消失问题。3.2. 局部段落编码器设序列输入特征为Xseq∈RL×din，其中L表示观察到的时间步数，din表示输入特征向量的维度。这些特征包括动态AIS派生的变量（例如，对地速度、对地航向和位置信息），以及当可用时，时间对齐的环境变量。具体来说，在每个时间步，AIS运动学特征和匹配的环境变量被连接成一个特征向量，如第4.3节所述。这个连接后的向量构成了Xseq，它直接输入到线性投影层。首先应用线性投影将原始特征映射到Transformer潜在空间，然后进行缩放和位置编码：(1)Eseq=Linear(Xseq)?dmodel，(2)Eseq′=PositionalEncoding(Eseq)，其中dmodel是嵌入维度。缩放因子稳定了后续注意力操作中点积的大小，位置编码注入了时间顺序信息。嵌入的序列被划分为N个不重叠的段落{S1,…,SN}，每个段落Si∈RLseg×dmodel代表航行的一个连续阶段。每个段落由具有Nlocal层的共享局部Transformer编码器处理。每个层由多头自注意力（MHA）子层和逐位置前馈网络（FFN）组成：(3)Zi(l)=LayerNorm(Si(l?1)+MHA(Si(l?1))，(4)Si(l)=LayerNorm(Zi(l)+FFN(Zi(l)))，其中Si(0)=Si。缩放后的点积注意力（Vaswani等人，2017）定义为：(5)Attention(Q,K,V)=SoftmaxQKTdkV，其中dk是键向量的维度。多头注意力将其扩展到h个并行头：(6)headi=Attention(XWiQ,XWiK,XWiV)，(7)MHA(X)=Concat(head1,…,headh)WO，其中WiQ, WiK, WiV是可学习的投影矩阵，WO是输出投影。FFN定义为：(8)FFN(x)=ReLU(xW1+b1)W2+b2。处理后，从每个段落中提取第一个标记的输出作为摘要向量si，形成段落摘要序列：(9)Ssumm=[s1,…,sN]。3.3. 全局编码器与交叉注意力融合段落级摘要Ssumm由全局Transformer编码器处理，以捕捉整个航行的段落间依赖性。在全局层面，通过交叉注意力机制（Vaswani等人，2017）结合静态船舶属性Xstatic（包括船舶类型和主要尺寸）。静态属性被投影为键和值表示：(10)Kstatic=XstaticWSK,Vstatic=XstaticWSV，其中WSK和WSV是可学习的投影矩阵。设Sg(l)表示第l层的全球表示，Sg(0)=Ssumm。每个全局层应用自注意力，然后是交叉注意力：(11)Sg′=LayerNorm(Sg(l?1)+Self-Attention(Sg(l?1))，(12)Sg(l)=LayerNorm(Sg′+Cross-Attention(Sg′,Kstatic,Vstatic))，其中序列表示作为查询，静态船舶属性提供键和值。这种公式允许船舶特定特征的影响在航行段落中变化，使模型能够根据船舶属性适应性地调整段落间依赖性。3.4. 剩余航行时间预测最终的全局表示Sg(Nglobal)=[g1,…,gN]通过全局平均池化聚合：(13)Sfinal=1N∑i=1Ngi，其中Sfinal代表航行级描述符。使用多层感知器（MLP）回归头来预测RVT：(14)RVT?prediction=W2?ReLU(W1Sfinal+b1)+b2，其中W1,b1和W2,b2是可学习的参数。模型端到端训练以最小化预测RVT值和观测RVT值之间的回归损失。3.5. 等待状态识别和到达时间对齐除了预测模型外，本小节还定义了后续操作分析中使用的量：等待状态识别和到达时间对齐。为了量化船舶在进入港口之前的停留行为，使用K均值聚类对AIS派生的纬度、经度和SOG进行了分段。这些变量共同捕获了空间位置和运动强度，使得数据驱动地分离活跃导航和低速静止行为成为可能。使用肘部方法确定了簇的数量，并选择了K=4。在得到的簇中，有一组簇的特征是相对于其他簇持续的低SOG值。设Clow表示这个簇。基于Clow观测的空间分布定义了一个低速区域，使用每个空间维度的平均值±1.96标准差。每次航行的等待时间计算为船舶位置落在该区域内的累积持续时间。为了研究RVT预测如何影响航行时间，定义了一个到达时间对齐场景。在这个假设场景中，假设船舶调整其途中速度，以便在模型预测的时间而不是观测到的到达时间到达。时间步t的计划速度定义为：(15)Vplanned(t)=Dremaining(t)RVT(t)，其中Dremaining(t)表示剩余的航线距离，RVT(t)是模型预测的剩余航行时间。使用这个公式，在假设船舶遵循模型对齐的到达时间表的情况下推导出隐含的等待时间。这种构建使得可以在不修改底层轨迹数据的情况下，定量比较在低速区域内的观测停留时间和模型对齐的停留时间。4. 数据本节描述了用于预测前往釜山港船舶的剩余航行时间（RVT）的数据集。数据包括（i）基于AIS的船舶轨迹和静态船舶属性，以及（ii）从NOAA/NCEI获得的网格化海洋环境变量。该节进一步详细介绍了用于构建固定长度序列样本和RVT标签的预处理流程。4.1. 船舶数据4.1.1. 数据集构建和特征定义我们使用前往釜山航行的AIS消息构建了主要数据集。原始AIS数据集包含大约479万个位置报告，这些报告来自2023年3月至8月期间的3884艘独特船舶（通过海事移动服务标识MMSI识别）。每个原始AIS记录包含34个字段，包括位置变量（纬度、经度）、运动学变量（SOG、COG、航向、转向率）、船舶详细信息（船舶类型、长度、宽度、吃水深度）和行政元数据（目的地、预计到达时间、国旗）。根据目的地字段过滤出前往釜山的航行后，从这些船舶中识别出7402次单独的航行（一艘船舶在研究期间可能进行多次前往釜山的航行）。数据集涵盖了长距离跨洋航行（例如，从东南亚或中东出发）和较短的区域航行（例如，从日本或中国港口出发），观测到的RVT值范围大约为0.4到100小时（表1）。为了在多个航行阶段训练序列模型，应用了滑动窗口提取方案，窗口宽度固定为L=64个观测值，步长为1个观测值。在航行的每个符合条件的时间步，收集最近的64个AIS观测值以形成单个训练样本，相应的RVT计算为目标标签。当之前的观测值少于64个时（即，在航行的早期），序列在开头进行零填充。这种方法有两个目的：（i）它通过为每次航行生成多个样本来增加训练集，每个样本反映不同的进展阶段；（ii）它使模型能够学习阶段依赖的预测行为，因为早期航行的样本包含较短的有效历史，而后期航行的样本携带更丰富的时间上下文。在提取第一个样本之前，每次航行需要至少20个有效的AIS观测值。选择窗口宽度L=64是为了平衡时间覆盖范围和计算效率：对于正在航行的船舶，典型的AIS报告间隔为3-10分钟，64个观测值覆盖大约3-10小时的航行历史，为捕获导航模式提供足够的上下文，同时保持输入维度对于基于Transformer的模型来说是可管理的。在应用第4.3节描述的异常值和质量过滤器后，该方案产生了29,496个序列样本，随后将其分为训练（70%）、验证（15%）和测试（15%）子集。图2可视化了15,000个提取的轨迹段子的代表性子集，展示了典型的入港路线和空间覆盖范围。每个训练样本包括序列特征和静态特征。序列输入Xseq∈RL×dseq由动态AIS变量（纬度、经度、对地速度（SOG）和对地航向（COG）组成，其中L表示固定的序列长度。静态属性Xstatic包括船舶类型、长度和宽度，代表在整个航行过程中保持不变的船舶特定特征。下载：下载高分辨率图像（738KB）下载：下载全尺寸图像图2. 从处理后的数据集中提取的15,000个轨迹段的代表性样本，展示了前往釜山港的入港船舶路线。预测目标是剩余航行时间（RVT），定义为当前观测时间与船舶首次进入釜山港地理围栏之间的时间间隔（以小时计）。根据本研究中的数据集构建，RVT是基于由纬度34.80°–35.35°和经度128.725°–129.175°定义的矩形地理围栏计算的。每次航行的到达时间被确定为首次进入该地理围栏的时间戳，相应地为每个样本计算RVT标签。4.1.2. 数据分布和特征图3展示了已识别的前往釜山航行的RVT分布以及主要船舶类型的分布。表1、表2报告了在应用第4.3节描述的异常值和质量过滤器之前计算的航行级RVT统计信息。计数值对应于识别的前往釜山航行的数量（总共7402次，来自3884艘独特船舶）。在整个前往釜山的航行集中，平均RVT约为36.8小时，中位数为35.3小时，值范围从0.4到100小时（表1）。集装箱船、普通货船和干散货船构成了数据集的大部分。如表2所示，集装箱船和普通货船的平均RVT值接近整体平均值，而干散货船的平均RVT略短（大约34.5小时），表明船舶类型之间存在操作差异。表3展示了用于说明本研究中使用的特征结构和典型值的训练样本示例。每个样本包括在滑动窗口的最新时间步观察到的序列特征、静态船舶属性和相应的RVT标签。序列特征包括四个AIS派生的运动学变量——纬度（Lat）、经度（Lon）、对地速度（SOG）和对地航向（COG）——以及七个环境变量：风向（WD，°）、风速（WS，m/s）、能见度（Vis，%）、气温（AT，°C）、海表温度（SST，°C）、有效波高（WH，m）和涌浪高度（SH，m）。船舶类型通过独热编码进行编码，而数值静态属性（如长度（L，m）和宽度（W，m）通过最小-最大缩放进行标准化。表1. 过滤前所有识别的前往釜山航行的RVT统计（以小时计）。空白单元格计数平均值标准差最小值最大值总计740236.8024.450.3914.4935.3353.0899.99表2. 过滤前前三种船舶类型的RVT统计（以小时计）。空白单元格计数平均值标准差最小值最大值集装箱503137.0523.940.3915.6735.6852.0899.99普通货船175036.8925.750.5812.4235.9355.6499.99干散货船62134.5124.630.6613.2930.7552.3899.80表3. 训练样本的代表性示例（显示每个序列的最新时间步的值）。#AIS运动学天气变量静态属性目标空白单元格纬度LonSOGCOGWDWSVisATSSTWHSH类型L（m）W（m）RVT（h）133.42135.9214.0227.314410.29822.624.02.802.00集装箱1412228.1234.24125.1814.8113.82302.09616.415.31.002.00集装箱1452214.9332.97127.0616.052.51503.09817.819.21.001.00集装箱3144810.0下载：下载高分辨率图像（139KB）下载：下载全尺寸图像(a)。总体分布。下载：下载高分辨率图像（141KB）下载：下载全尺寸图像(b)。集装箱船。下载：下载高分辨率图像（141KB）下载：下载全尺寸图像(c)。普通货船。下载：下载高分辨率图像（147KB）下载：下载全尺寸图像(d)。干散货船。图3. 所有提取样本的剩余航行时间（RVT）分布及按船舶类型划分。红色虚线表示平均值，绿色实线表示中位数。4.2. 天气数据为了考虑环境对船舶航行时间的影响，我们整合了由国家海洋和大气管理局（NOAA）的国家环境信息中心（NCEI）提供的海洋天气数据。该数据集提供了标准化的全球再分析场数据，这些数据能够捕捉与航行相关的风力和波浪条件。如图4所示，天气数据集覆盖了东北亚地区，包括通往釜山港的主要航线。主要规格如下：（i）空间分辨率为0.25°×0.25°（在中纬度地区大约为28公里），（ii）时间分辨率为6小时（00:00、06:00、12:00和18:00 UTC）。本研究使用的环境变量包括风向（由u和v分量表示）、风速、能见度、空气温度、海面温度、有效波高和涌浪高度。波浪条件对于RVT（船舶到港时间）预测尤为重要，因为它们会影响船舶速度和燃油消耗。图5展示了研究期间（2022年1月至2023年12月）平均有效波高的空间分布。在此分析中，WMO海况代码（0-9）编码的波浪信息被转换为以米为单位的代表波高。结果显示，朝鲜半岛以东的公海区域和东海的波浪高度较高，而黄海和釜山附近的朝鲜海峡等半封闭海域的波浪条件较为平静。

下载：下载高分辨率图片（559KB）
下载：下载全尺寸图片

图4. 来自NCEI观测数据的东北亚地区风速（m/s）的空间分布（2022年1月1日00:00 UTC）。

下载：下载高分辨率图片（338KB）
下载：下载全尺寸图片

图5. 来自NCEI观测数据的东北亚地区平均有效波高（m）的空间分布（2022年1月至2023年12月）。

4.3. 数据预处理
为了将原始数据转换为模型可用的输入，我们采用了以下预处理步骤。首先，通过基于KD树的最近邻搜索（Bentley, 1975, Virtanen et al., 2020）将AIS数据与NCEI天气场数据合并，为每个AIS观测值分配最近的时空天气记录。具体来说，NCEI天气记录按观测小时分组，并为每个小时组在（纬度，经度）坐标上构建一个KD树。对于每个AIS观测值，时间戳被四舍五入到最接近的小时，然后查询相应的小时KD树以获取空间上最接近的天气站。匹配后，使用沿每次航行的时间轴的线性插值填充天气场中剩余的缺失值。通过这种匹配，每个AIS观测值增加了七个环境变量（风向、风速、能见度、空气温度、海面温度、有效波高和涌浪高度），形成了一个统一的时间步长特征向量。因此，序列输入Xseq∈RL×dseq由AIS派生的运动变量（纬度、经度、SOG、COG）与每个时间步长的匹配天气变量连接而成，当包含天气数据时dseq=11，而在不包含天气数据的简化设置中dseq=4。这种时间步长的连接确保了环境条件与船舶运动状态在时间上对齐，并由每个段的局部Transformer编码器共同处理。其次，通过过滤包含“BUSAN”或“PUS”的记录来识别前往釜山的航行。到达时间定义为首次进入釜山地理围栏（纬度34.80°–35.35°，经度128.725°–129.175°）的时间，RVT标签计算为到达该事件剩余的时间。第三，排除总持续时间超过48小时或AIS轨迹点少于20个的航行，因为这些被视为异常值或低质量轨迹。48小时的阈值是一个基于领域知识的截止点，用于排除由于长时间锚泊、路线偏离或航行中操作变化导致的异常长持续时间，这些情况不代表正常的入港通行模式。至少20个轨迹点的最小阈值确保每个航行包含足够的时间信息以进行有意义的序列建模。第四，使用固定的最大序列长度L=64生成序列样本。在每个时间步长，使用最近的64个观测值；当观测值较少时，在开头进行零填充。零填充是在开头（左填充）而不是在结尾进行，以便最近观测值——这些观测值对RVT的预测信号最强——始终位于序列的末尾，从而保持不同有效长度样本之间的时间对齐。数据集的平均有效序列长度约为36个观测值，表明大多数样本包含大量非填充内容。第五，使用min–max缩放将数值变量归一化到[0,1]范围内：(16)Xscaled=X?Xmin/Xmax?Xmin，其中Xmin和Xmax表示在训练分割上计算的特征最小值和最大值。分类的船舶类型变量使用独热编码进行编码。处理后的数据集被划分为训练集、验证集和测试集，比例分别为70%、15%和15%。

图6总结了上述端到端的数据预处理流程，从原始AIS和天气数据到模型可用的序列和静态输入。

下载：下载高分辨率图片（820KB）
下载：下载全尺寸图片

图6. 数据预处理流程的流程图。六个阶段将原始AIS观测值和NCEI天气记录转换为固定长度的序列输入和用于模型训练和评估的静态船舶属性。

5. 实验结果与分析
本节评估了所提出的分层交叉注意力Transformer与基线机器学习和深度学习模型在釜山港RVT预测方面的性能。主要比较在两种输入设置下进行：（i）包含天气变量；（ii）不包含天气变量，同时保持预测目标和评估协议不变。除了总体准确性外，分析还研究了预测误差特征，并考察了在准时（JIT）规划假设下RVT预测的运营影响，特别关注等待时间的减少。

5.1. 实验设置
为了评估所提出的架构，所有模型都使用相同的数据分割、预处理程序和评估指标进行了训练和测试。包括四种机器学习模型作为非序列回归参考。Ridge回归被用作具有L2正则化的线性模型。Random Forest被用作基于装袋的集成方法，能够建模非线性特征交互。XGBoost和LightGBM被包括为梯度提升框架，它们以分阶段的方式构建决策树，通常用于表格回归问题。对于序列建模，实现了一个隐藏层大小为128的两层长短期记忆（LSTM）网络作为循环基线。LSTM处理序列AIS特征，并生成一个隐藏表示，然后与静态船舶属性结合进行最终的RVT回归。这种配置使得可以直接比较循环建模和本研究中评估的基于Transformer的架构。为了与最近为时间序列任务设计的Transformer架构进行比较，我们还包括了两个外部基线。Informer采用ProbSparse自注意力来通过仅选择具有最高稀疏度得分的顶级查询来降低标准注意力的二次复杂性（Zhou et al., 2021）。我们实现了一个仅编码器的变体，该变体通过逐步减半各层的序列长度来进行蒸馏，然后通过连接和回归头进行静态特征融合。PatchTST将时间序列分割成子序列级别的片段，并对结果片段序列应用Transformer编码器（Nie et al., 2023）。由于原始的通道独立设计不支持多变量交叉特征交互，我们采用了一种修改后的公式，首先将多变量输入投影到共享的嵌入空间，然后再进行片段分割，从而能够联合建模运动和环境特征。所有深度学习模型都在PyTorch中实现，机器学习基线使用Scikit-learn、XGBoost和LightGBM实现。实验在配备Intel Xeon Gold 6226R CPU、128 GB RAM和NVIDIA Tesla V100 GPU（32 GB）的服务器上进行。

为了减少过拟合，对深度学习和梯度提升模型应用了基于验证损失的提前停止。主要超参数总结在表4中。除非另有说明，否则深度学习模型使用Adam优化器进行训练，批量大小为64。对于Transformer系列模型，使用学习率10^-4和丢弃率0.1。对于LSTM基线，使用学习率10^-3。对于梯度提升模型，估计器的数量和最大深度在回归基准测试中常用的范围内选择。为了确保公平比较，采用了以下超参数选择协议。对于深度学习模型，所有Transformer系列变体共享一组共同的架构维度（嵌入维度dmodel=256，注意力头数h=8），因此性能差异主要反映架构设计选择而非容量差异。训练协议也是一致的：所有深度学习模型都使用AdamW优化器进行训练，批量大小为64，以及基于验证损失的相同提前停止标准，最大训练周期为500个周期。学习率和模型特定的结构参数（例如，编码器层的数量）基于在验证集上的初步实验进行选择。对于机器学习基线，XGBoost和LightGBM使用最多1000个估计器和基于验证的提前停止来防止过拟合，而Random Forest和Ridge回归使用回归基准测试文献中常见的标准参数范围。所有模型都使用相同的数据分割、预处理流程和评估指标进行评估，以保持可比性。主要超参数总结在表4和表5中。

预测准确性使用平均绝对误差（MAE）和均方根误差（RMSE）进行评估：(17)MAE=1/N∑i=1N|yi?y?i|，(18)RMSE=1/N∑i=1N(yi?y?i)2，其中yi和y?i分别表示样本i的真实RVT和预测RVT，N是测试样本的数量。所有误差均以分钟为单位报告。

表4. 模型超参数摘要。

表4. 模型超参数

组别模型名称参数值
深度学习分层交叉注意力Transformer 学习率 10^-4 层数/头数 4/8 丢弃率 0.1
LSTM 学习率 10^-3 层数/隐藏层 2/128
机器学习 XGBoost/LightGBM 估计器数量 200 学习率 0.1 最大深度 5
Random Forest 估计器数量 100 最大深度 10
Ridge Alpha (α) 1.0

表5. 所提出的分层交叉注意力Transformer的详细超参数

类别参数值
架构嵌入维度（dmodel） 256
注意力头数（h） 8
FFN隐藏维度 dmodel×4 (1024)
片段长度（Lseg） 8
片段数量（N） 8
局部编码器层（Nlocal） 1
全局编码器层（Nglobal） 2
MLP隐藏维度 256
丢弃率 0.1
训练器 AdamW 学习率 10^-4 批量大小 64
最大周期 500
提前停止耐心 20
损失函数 MSE

输入序列长度（L） 64
序列特征（dseq） 11（含天气）/4（不含）
静态特征（dstatic） 4

此外，还报告了选定分析的决定系数（R2）：(19)R2=1?∑i=1N(yi?y?i)2/∑i=1N(yi?y?)2，其中y?表示真实RVT值的平均值。

5.2. 预测性能和特征消融
本节对所提出的分层交叉注意力Transformer和几个基线模型进行了全面评估。为了严格评估模型的能力，我们在两种主要条件下分析了其性能：一种是包含海洋环境变量的完整配置，另一种是仅关注运动和静态数据的简化配置。

5.2.1. 包含天气变量的整体性能
实验的主要目标是使用完整的特征集评估预测性能，该特征集包括AIS轨迹、静态船舶属性和海洋天气变量。表6总结了结果，图7可视化了所有评估模型的MAE和RMSE。为了验证报告的测试集性能不是过拟合的产物，我们使用相同的最佳检查点在训练和验证分割上评估了所提出的模型。训练MAE为24.00分钟，验证MAE为29.71分钟，验证MAE与训练MAE的比率为1.24。验证MAE（29.71）和测试MAE（29.35）之间的接近一致性表明了稳定的泛化能力和没有显著的过拟合或数据泄露。在训练过程中使用了20个周期的提前停止来防止过拟合。

表6. 包含天气变量的保留测试集（总样本的15%，N=4425）上的整体模型性能

模型类型模型名称 MAE（分钟） RMSE（分钟）
深度学习分层交叉注意力Transformer 29.35 40.06
交叉注意力Transformer 30.02 43.11
Informer（ProbSparse） 32.03 45.08
分层Transformer 34.62 48.68
PatchTST 35.73 54.77
LSTM 37.66 50.92
简单串联Transformer 42.66 55.60
机器学习 XGBoost 51.42 74.58
LightGBM 62.25 124.60
Random Forest 72.67 108.86
Ridge 26 9.87 34.61

下载：下载高分辨率图片（377KB）
下载：下载全尺寸图片

图7. 整体模型性能比较。深度学习模型在所有评估模型中始终表现最佳。

表6显示，分层交叉注意力Transformer实现了最低的MAE（29.35分钟）和RMSE（40.06分钟）。其次是交叉注意力Transformer，MAE为30.02分钟。Informer编码器（ProbSparse注意力）的MAE为32.03分钟，基于片段的Transformer（PatchTST）的MAE为35.73分钟。其他深度学习模型的MAE值在34.62到42.66分钟之间。在相同的特征配置下，机器学习基线的MAE值介于51.42到269.87分钟之间。在MAE和RMSE指标上，深度学习模型的预测误差都低于评估的机器学习基线。在深度学习组内，分层交叉注意力配置的误差低于LSTM和简单串联Transformer。Transformer变体之间的差异表明，用于整合静态船舶属性的策略影响了预测性能。特别是在表示学习过程中，基于交叉注意力的条件化可能允许通过特定于船舶的特征来调节连续航行特征，这与在这种设置中观察到的预测误差减少是一致的。值得注意的是，所提出的模型表现优于Informer和PatchTST，这两种模型是最初为时间序列预测设计的Transformer架构。Informer的ProbSparse注意力降低了计算复杂性，但没有结合层次化的时间结构或基于交叉注意力的静态特征条件化。PatchTST的基于补丁的时间分割与我们的层次化方法在概念上有相似之处；然而，它缺乏与静态船舶属性的显式跨模态融合，这限制了其在多变量回归设置中的有效性。5.2.2. 特征消融：海洋天气变量的影响为了检查环境因素（包括风速、波高和海洋电流）的贡献，我们通过从输入特征集中排除这些变量来进行消融研究，同时保持模型架构和训练过程不变。这个实验隔离了显式环境信息对RVT预测的影响。表7展示了在消融配置下的结果，图8可视化了包含和不包含天气变量时的相应MAE值。对于所有评估的模型，移除环境输入导致预测误差增加。对于Hierarchical Cross-Attention Transformer，MAE从29.35分钟增加到35.58分钟。其他Transformer变体和LSTM基线也观察到了类似的增加。PatchTST的天气消融效应更为显著，其MAE从35.73分钟增加到44.91分钟（+25.7%），而Informer的MAE从32.03分钟增加到40.24分钟（+25.6%）。这归因于基于补丁的标记化机制：每个时间步只有四个来自AIS的运动学特征，每个补丁包含的信息有限，当有更丰富的多变量输入时，PatchTST利用的局部时间聚合的优势就降低了。Informer的MAE也从32.03分钟增加到40.24分钟。这种模式表明，在当前数据集中，环境变量提供了超出AIS派生的运动学特征和静态船舶属性的额外预测信息。表7. 不包含天气变量时的整体模型性能。模型类型模型名称MAE（分钟）RMSE（分钟）R2深度学习Hierarchical Cross-Attention Transformer35.5848.250.9954Cross-Attention Transformer37.1549.810.9892Informer (ProbSparse)40.2459.900.9854Hierarchical Transformer42.1565.500.9893LSTM49.7469.250.9601PatchTST44.9161.910.9844机器学习XGBoost63.2093.050.9134LightGBM69.88139.440.9015RandomForest81.78126.040.8432Ridge280.54359.530.5110下载：下载高分辨率图像（244KB）下载：下载全尺寸图像图8. 消融研究（MAE）：排除天气变量后的性能变化。环境条件通过风阻、波浪诱导的运动和海洋电流等机制与船舶地面速度（SOG）的变化物理相关。这些效应可能无法仅通过轨迹坐标和静态船舶特征完全捕捉，特别是在长距离航行中，累积的环境暴露会影响船舶运动。尽管排除了天气变量，层次化交叉注意力配置仍然是评估方法中误差最低的模型。在消融设置下，其MAE（35.58分钟）仍然低于Hierarchical Transformer（42.15分钟）和LSTM（49.74分钟），保持了在全特征配置下观察到的相对顺序。Informer在没有天气数据的情况下保持了有竞争力的性能（MAE 40.24分钟），而PatchTST也显示出适度的增加至44.91分钟。值得注意的是，当输入特征较少时，PatchTST的基于补丁的标记化效果较差，因为每个补丁中仅包含四个运动学变量（纬度、经度、SOG、COG），与包含天气的完整十一个维度输入相比，捕获的局部时间模式不那么明显。图9. 使用肘部方法获得的惯性曲线。后续分析采用了K=4的配置。下载：下载高分辨率图像（408KB）下载：下载全尺寸图像(a). 全海域视图。(b). 放大的地理围栏视图。图10. 使用K-means聚类（K=4）进行海域分割。(a) 显示了航行路径的整体分割，其中等待状态簇（簇0）用红色突出显示。(b) 提供了用虚线边界包围的低速区域的放大视图，用于计算停留时间。5.3. RVT预测的操作可靠性虽然聚合指标提供了预测准确性的总体衡量，但剩余航行时间（RVT）预测的实际效用还取决于逐步误差的分布和稳定性。本小节分析了所提出的Hierarchical Cross-Attention Transformer的预测误差的统计特性。表8总结了误差分布。该模型的平均误差（偏差）为-13.33分钟，表明平均倾向于更早的到达预测。与数据集中的典型航行时间相比，这种偏差的大小保持较小。中位数绝对误差为24.90分钟，表明一半的预测与真实值的偏差小于大约25分钟。基于容忍度的可靠性提供了关于误差分散的额外见解。大约57.39%的预测落在±30分钟的范围内，88.94%落在±60分钟的范围内。第90和第95百分位的误差分别为61.91分钟和78.47分钟。这些百分位数表明，在评估的数据集中，较大偏差仅限于相对较小的样本部分。表8. 所提出模型（Hierarchical Cross-Attention Transformer）的预测误差分布。一般误差统计基于容忍度的可靠性指标值指标值平均误差（偏差）-13.33分钟在±30分钟内57.39%中位数绝对误差31.29分钟在±60分钟内88.94%第90百分位61.91分钟MAPE7.52%第95百分位78.47分钟这些统计特性为以下小节中介绍的到达时间对齐分析提供了定量基础。结果描述了在评估数据集下的误差行为，并不意味着实时操作部署。5.4. 等待状态识别结果和低速区域本小节介绍了第3.5节中描述的运动状态分割的结果。应用K=4对来自AIS的纬度、经度和地面速度（SOG）特征进行了K-means聚类。图9显示了使用肘部方法获得的惯性曲线。后续分析采用了K=4的配置。K-means算法应用于三个特征——纬度、经度和地面速度（SOG）——这些特征共同编码了每个AIS观测值的空间位置和运动状态。这种组合允许聚类区分地理上重叠但行为上不同的状态（例如，以巡航速度通过港口接近区域的船舶与在同一区域以接近零的速度抛锚的船舶）。图11显示了观察到的和模型对齐的等待时间分布。下载：下载高分辨率图像（408KB）下载：下载全尺寸图像图12. 速度分布比较。（蓝色：实际，红色：模型预测）。图13. 代表性航行的逐步RVT预测比较。选择了八个案例来涵盖不同的操作条件，初始RVT范围从大约25小时到40小时，预测步骤范围从28步到80步。表9总结了结果簇的统计特性。在四个簇中，簇0的平均SOG（0.83节）显著低于其他簇，其余簇的平均速度范围从12.85节到13.75节。簇0的标准差也相对较小，表明低速行为较为集中。簇0占总观测值的16.8%。簇0的相对较大的标准差（1.59节）与其较低的平均值（0.83节）相比，反映了该簇中存在异常观测值。这些异常值对应于在其他方面保持静止但出现短暂速度波动的船舶——例如，在抛锚重新定位期间缓慢操纵或由于洋流引起的短时间漂移事件。由于K-means将每个观测值分配给最近的质心，因此在抛锚和缓慢航行之间的某些过渡点可能会被包含在簇0中。然而，随后应用的空间边界定义（±1.96标准差）通过将低速区域限制在地理上集中的区域内，减轻了这些异常值的影响。图10可视化了簇的空间分布。低速簇（簇0）在港口接近区域附近形成了一个地理上集中的区域，而其余簇则沿着航行路线分布。图10(b)中的虚线边界代表了用于计算停留时间的低速区域。图9. K-means簇的统计摘要（K=4）。簇平均SOG（节）标准差（节）比例（%）00.831.5916.8113.632.7726.3213.752.8818.9312.852.4938.0这些结果确认了仅使用基于运动的特征，聚类程序有效地分离了低速保持行为和活跃导航状态，而无需依赖预定义的港口边界。5.5. 到达时间对齐和等待时间减少分析使用第5.4节中识别的等待状态区域，我们评估了在到达时间对齐假设下RVT预测的影响。此分析将低速区域内观察到的停留时间与从模型预测的RVT值得出的推断停留时间进行了比较。表10总结了观察到的航行的平均等待时间和模型对齐情景下的平均等待时间。在基于所提出的Hierarchical Cross-Attention Transformer的到达时间对齐假设下，观察到的平均停留时间为136.11分钟。相应的推断等待时间减少到66.65分钟，平均减少了69.46分钟。图11展示了两种条件下的等待时间分布。观察到的分布显示出明显的右尾，表明有航行在低速区域内停留时间较长。相比之下，模型对齐的分布更接近零，反映了根据预测的RVT调整到达时间后停留时间的减少。图11. 根据到达时间对齐的参考平均等待时间（分钟）减少（分钟）观察到的航行136.11–提出的模型（对齐）66.6569.46为了进一步研究到达时间对齐的特性，我们分析了从预测的RVT值得出的推断速度剖面。根据方程（15）计算的时间步t的计划速度，使用了剩余的路线距离和模型预测的RVT。表11报告了观察到的速度和模型得出的计划速度的摘要统计。平均计划速度（13.66节）与观察到的平均速度（13.23节）接近，表明到达时间对齐不需要显著改变平均巡航速度。然而，计划速度的标准差（9.36节）显著大于观察到的速度（2.54节），反映了逐步RVT更新引起的速度时间调整。图12展示了观察到的速度和计划速度的实证分布。计划速度的更广泛分布表明随着时间步骤的不同而变化较大，这是由于对更新后的RVT预测的动态调整。尽管如此，中心趋势仍然与观察到的巡航速度相当，表明对齐情景主要是在时间上重新分配速度，而不是增加整体速度水平。图11. 观察到的速度和模型对齐的计划速度的速度统计。参考平均速度（节）标准差（节）观察到的速度13.232.54模型对齐的计划速度13.669.36到达时间对齐情景的燃油消耗影响涉及两个竞争因素。在海洋工程中，排水型船舶的燃油消耗与速度大致呈立方关系（F∝V3）（Psaraftis和Kontovas，2013年；Adland等人，2020年）。一方面，到达时间对齐将港口接近区域的平均低速停留时间减少了69.46分钟（第5.5节），这将减少等待或缓慢操纵阶段的燃油消耗。另一方面，如图12所示，计划速度分布比观察到的剖面具有更大的变化性，非线性的立方关系意味着更可变的速度剖面比在相同平均速度下的均匀剖面导致更高的燃油成本。因此，净燃油影响取决于这两种效应之间的平衡。此外，为了有意义的量化燃油消耗，需要船舶特定的发动机性能曲线和推进特性，这些在用于本研究的基于AIS的数据集中不可用。通过与船舶运营商或分类协会的合作，并在现实的速度剖面平滑约束下进行燃油消耗分析，被认为是未来工作的优先事项。5.6. 案例研究：逐步RVT预测为了评估个别航行的逐步预测行为，图13比较了基线模型和所提出模型预测的RVT轨迹与真实值。选择了八个航行案例来代表不同的操作条件。案例（a）、（c）和（d）的初始RVT超过35小时，跨越超过55个预测步骤，代表较长时间的航行。案例（g）和（h）也以较高的初始RVT（大约38-40小时）开始，但在少于35个步骤内完成，表明平均速度较高或路线更直接。案例（e）代表一个中等范围的航行，初始RVT大约为35小时，大约有38个步骤。案例(b)和(f)对应于初始剩余航行时间(RVT)低于26小时的短途航行。这种选择确保了定性分析能够涵盖广泛的航行时长和运营模式，而不仅仅依赖于单一的代表性场景。这种定性分析通过展示预测顺序更新时的时间稳定性和偏差模式，补充了总体指标。在所有代表性案例中，LSTM基线模型表现出明显的波动性，包括突然的峰值和下降，表明其对短期波动敏感。标准Transformer模型产生的轨迹更为平滑；然而，有几个案例在航行中后期显示出系统性的偏差。相比之下，所提出的模型在大多数情况下与真实轨迹的偏差较小，并且在出现短暂偏差后能够更平滑地进行时间调整。这种行为与第3节中描述的层次结构和交叉注意力机制一致。表12总结了代表性航行的R2分数。所提出的模型在所有八个案例中均获得了最高的R2分数，证实了其在不同航行场景下的优越逐步预测能力。这些结果支持了图13中的定性观察结果，表明无论航行时长如何，预测行为都是稳定且准确的。

表12. 代表性案例研究航行的R2分数总结。每个案例的最高分数以粗体标出。

| 案例 | LSTM | Transformer | Cross-Attn | Hierarchical | Informer | Patch | TSTXGBoost | LightGBM | Proposed |
|---------------|---------|---------|------------|---------|---------|---------|---------|---------|
| (a) | 0.9470 | 0.9926 | 0.9896 | 0.9841 | 0.9909 | 0.9762 | 0.9847 | 0.9908 |
| (b) | 0.8498 | 0.9593 | 0.9593 | 0.9420 | 0.9727 | 0.9653 | 0.9722 | 0.9746 |
| (c) | 0.8752 | 0.9532 | 0.9270 | 0.9521 | 0.9507 | 0.9497 | 0.9313 | 0.8996 |
| (d) | 0.8258 | 0.9893 | 0.9918 | 0.9864 | 0.9952 | 0.9944 | 0.9742 | 0.8309 |
| (e) | 0.9736 | 0.9910 | 0.9958 | 0.9897 | 0.9976 | 0.9954 | 0.9944 | 0.9968 |
| (f) | 0.8967 | 0.9611 | 0.9719 | 0.9623 | 0.9771 | 0.9824 | 0.9659 | 0.9770 |
| (g) | 0.8926 | 0.9865 | 0.9903 | 0.9842 | 0.9895 | 0.9960 | 0.9835 | 0.9900 |
| (h) | 0.9846 | 0.9941 | 0.9959 | 0.9875 | 0.9970 | 0.9974 | 0.9944 | 0.9976 |

**结论**
本研究解决了使用连续AIS数据预测远距离航行中船舶剩余航行时间(RVT)的挑战。准确的到达时间预测对于船舶侧的速度管理和港口侧的操作协调至关重要。为了改进逐步更新下的RVT预测，我们提出并评估了一种层次化交叉注意力Transformer架构，该架构整合了AIS轨迹、静态船舶属性和时间对齐的海事天气信息。实验结果表明，深度学习方法在RVT预测方面优于传统的机器学习模型。在评估的架构中，所提出的层次化交叉注意力Transformer模型实现了最低的误差，平均绝对误差(MAE)为29.35分钟。结果表明，明确建模层次化时间结构可以提高处理长航程序列时的预测性能。此外，结合海事天气变量比仅依赖运动学AIS特征的模型提高了准确性。
除了总体准确性指标外，本研究还探讨了在到达时间对齐假设下RVT预测的运营影响。在这种分析场景下，与观测到的航行相比，识别出的低速区域内的平均停留时间减少了69.46分钟。这一发现说明了改进的RVT预测如何影响航行执行过程中的等待时间模式，尽管这种对齐场景代表的是一个受控的分析环境，而非实时应用。
总体而言，研究结果强调了多尺度时间建模和异构航行信息结构化整合对于长预测期到达时间预测的重要性。到达时间对齐分析揭示了两个相互竞争的燃油消耗因素：靠近港口时的等待时间减少以及由于逐步RVT更新导致的速度变化增加。在现实的速度剖面平滑策略下量化净燃油影响仍然是一个未解决的问题，被认为是未来研究的重点。未来的研究还可以通过引入额外的上下文变量（如实时港口拥堵指标）以及评估模型在更广泛地理区域和不同运营环境下的泛化能力来扩展这项工作。

**CRediT作者贡献声明**
Sangseok Lee：撰写——原始草稿、可视化、软件、方法论、数据整理、概念化。
Wonhee Lee：撰写——审阅与编辑、验证、软件、调查、概念化。

**关于写作过程中生成式AI和AI辅助技术的声明**
在准备这项工作时，作者使用了Gemini（Google）和Claude（Anthropic）来提高手稿的可读性和语言表达。使用这些工具后，作者根据需要审阅和编辑了内容，并对已发表文章的内容负全责。

热点排行