《TRANSPORTATION RESEARCH PART C-EMERGING TECHNOLOGIES》:A multi-dimensional feature-optimized deep learning framework with self-adaptive attention for container throughput forecasting in sea-rail intermodal systems
编辑推荐:
海铁联运集装箱吞吐量预测面临数据稀疏性、多维非线性关系及模型特征融合不足等挑战,本文提出基于统计的指标筛选框架与BO-WACNN-LSTM-SA混合模型。通过贝叶斯优化自动调参、CNN特征提取与加权、LSTM时序建模及SA全局依赖强化,构建多级特征过滤机制,在真实数据验证中误差率最低,且经迁移测试、消融实验及滚动时序交叉验证均表现优异,为多式联运资源调度提供决策支持。
李文鑫|王宇宏浩|郭敬伟|李德宏
湖北师范大学龙忠实验室,中国湖北省襄阳市441000
摘要
准确预测海铁联运中的集装箱吞吐量可以有效减少货物周转时间和能源消耗,从而实现多式联运的成本降低和效率提升。尽管深度学习模型是解决集装箱吞吐量预测问题的有效手段,但它们仍面临一些重大挑战,例如难以学习多维数据之间的复杂非线性关系。因此,本文构建了一个基于统计学的系统性指标选择框架,并提出了一种新颖的混合深度学习预测模型,该模型整合了贝叶斯优化(BO)、卷积神经网络(CNN)、长短期记忆(LSTM)和自注意力(SA),并进一步配备了一种权重分配方法(WA)来优化卷积层的特征提取。利用真实世界数据,我们构建了BO-WACNN-LSTM-SA模型,并与基准模型进行了全面的比较分析。结果表明,所提出的模型在所有比较模型中具有最低的预测误差。此外,我们还通过迁移性测试、消融研究和时间序列交叉验证验证了该架构的鲁棒性和泛化能力。结果表明,WA和SA通过在不同阶段处理特征重要性来优化模型,它们分别作用于输入和模型内部,形成了多层次的信息过滤机制,从而显著提高了回归预测的准确性。这些研究成果可以为海铁联运中的集装箱运输计划制定和运输资源分配提供参考,有利于多式联运的早期布局和调度。
引言
随着全球供应链的日益融合以及对跨国商品流动需求的增长,作为海上和陆地运输关键枢纽的港口处理了大量集装箱转运任务。作为一种重要的多式联运方式,海铁联运因其适合长距离运输、低成本和低碳排放而成为连接内陆、沿海和国际市场的核心手段(Cheng和Chen,2025)。然而,由于多种因素的影响,海铁联运正面临效率低下等挑战(Guo等人,2025b;Li等人,2024)。这些问题不仅导致港口拥堵和货物损失,还导致设备和运输能力利用率不足,从而阻碍了海铁联运的发展(Liu等人,2025b)。在这种背景下,准确可靠的海铁联运集装箱吞吐量预测变得至关重要。
时间序列预测研究已从传统的统计模型(SM)发展到复杂的混合深度学习架构,这些模型在非线性拟合和序列建模方面的能力持续提升(Khan等人,2020;Dotse等人,2024)。然而,当将这些方法应用于海铁联运集装箱吞吐量预测任务时,由于数据采样频率低、数据稀疏以及多因素相互作用,这一任务带来了额外的挑战。海铁联运的集装箱吞吐量不仅受到数据特征(如季节性和长尾分布)的影响(Chu等人,2025),还受到包括运输网络、区域经济和贸易政策在内的多维因素之间复杂非线性依赖性的影响(Milenkovi?等人,2021)。此外,数据稀疏且采样时间频率低,进一步增加了预测的复杂性(Zhang等人,2023)。从方法论角度来看,传统统计模型难以捕捉这些复杂关系(Munim等人,2023);机器学习(ML)方法在时间建模方面的能力有限(Ohana-Levi等人,2022;Tang等人,2019a);深度学习(DL)模型在有效平衡局部特征和全局依赖性方面也常常不足(Xu等人,2025b)。尽管整合了多种优势的混合DL模型表现出色(Kontopoulou等人,2023;Abbaspour等人,2020),但在海铁联运预测背景下仍面临三个关键问题。首先,在复杂数据结构下有效的信息提取不足。当前的预测方法主要关注挖掘内在数据模式,缺乏系统整合关键外部因素的框架(Dai等人,2024;Wang等人,2024b)。其次,特征工程与模型之间的兼容性不佳。海铁联运操作的低数据收集频率和相关数据使得满足复杂DL模型的数据需求变得困难。第三,现有模型架构在融合局部特征提取与长距离依赖性建模方面仍存在不足(Wu等人,2024a)。这些问题共同限制了海铁联运集装箱吞吐量预测的准确性和模型的鲁棒性。
为了解决上述三个核心挑战,本文提出了一种海铁联运集装箱吞吐量预测框架。本研究的核心贡献体现在以下三个方面:
•本研究提出了一种针对集装箱吞吐量预测的系统性指标选择和增强方法。具体而言,我们设计了一个两阶段指标筛选程序,结合相关性分析来提高指标质量,并引入基于相关性的权重分配(WA)策略,为模型训练提供更高质量的输入。
•本研究开发了一种名为BO-WACNN-LSTM-SA的混合预测模型,专门用于集装箱吞吐量预测。WA模块根据特征与目标变量之间的相关性计算权重。通过抑制冗余特征并强化关键特征,为卷积神经网络(CNN)的局部特征提取提供了高质量的基础。自注意力(SA)模块根据时间依赖性计算权重,捕捉长距离全局相关性,以弥补长短期记忆(LSTM)在全局感知方面的局限性。这两个模块的结合实现了特征提取的协同增强。此外,贝叶斯优化(BO)被用来识别最优超参数,进一步提升模型的预测性能。
•本研究使用真实世界案例验证了所提出的BO-WACNN-LSTM-SA模型的有效性,并通过比较多种类型的模型进行了验证。此外,还通过时间序列k折交叉验证方法验证了模型的鲁棒性和泛化能力。最后,我们在上海港和深圳港进行了额外的吞吐量预测实验,以验证模型的迁移性。最后,通过消融研究确认了WA和SA模块之间的协同机制以及整个架构组合的有效性。
本文的其余部分安排如下:第2节简要回顾了预测模型选择策略的相关文献。第3节详细阐述了必要的定义和提出的方法。第4节描述了实验过程,包括数据处理、完整网络结构的构建、超参数优化以及为验证模型性能而进行的多次实验。第5节总结了研究结果。
模型驱动的集装箱吞吐量预测模型
早期的吞吐量预测研究主要采用统计方法,如自回归积分滑动平均(ARIMA)模型和灰色预测模型来捕捉线性关系。这些方法仅依赖于目标变量的历史值,并应用线性分解技术来捕捉趋势和季节性。当数据大致平稳时,这些方法的表现令人印象深刻。例如,在单变量集装箱吞吐量预测任务中,Huang等人
问题陈述
集装箱吞吐量容易受到各种外部因素的影响,运输的复杂性和不确定性使得准确预测变得困难。我们需要对其核心特征和难点有深入的理解,以便更好地解决这些问题。
一方面,数据本身具有高度异质性。吞吐量表现出多种周期性和强烈的季节性波动,受到气候、市场需求季节性变化等因素的影响
案例研究
在第4.1节中,我们描述了数据来源和指标选择方法。在第4.2节中,我们对收集的数据进行了处理。在第4.3节中,我们详细解释了BO-WACNN-LSTM-SA的整体架构和参数选择。在第4.4节中,我们将处理后的数据输入到构建的模型中并获得实验结果。在第4.5节中,我们从多个维度分析了模型的性能,包括迁移性
结论
本研究结合了CNN模型的特征提取能力和LSTM模型的时间序列处理能力,并使用CNN模型的输出作为LSTM模型的输入来构建CNN-LSTM模型。为了提高模型的预测准确性,采用了贝叶斯优化(BO)来选择超参数。同时,提出了一种数据标准化方法,以帮助卷积层更有效地提取特征,并使用自注意力(SA)来处理内部
声明和声明
本手稿尚未在其他地方部分或全部发表,也未被其他期刊考虑。所有研究参与者均提供了知情同意,研究设计已获得相关伦理审查委员会的批准。不存在需要声明的利益冲突。
CRediT作者贡献声明
李文鑫:写作 – 审稿与编辑、原始草稿撰写、软件开发、方法论设计、数据管理、概念构建。王宇宏浩:写作 – 审稿与编辑、验证、方法论设计、数据管理。郭敬伟:写作 – 审稿与编辑、监督。李德宏:写作 – 审稿与编辑、监督。