《Neural Networks》:Adaptive Dynamic Spatial-temporal Graph Convolutional Neural Network for Traffic Flow Prediction
编辑推荐:
自适应动态时空图卷积网络模型结合多头注意力机制和动态邻接矩阵,以及Mamba框架有效捕捉长期时间依赖和空间动态关系,在四个真实交通数据集上验证优于基线模型。
余江|胡明茂|龚爱红|兰艳飞|龚青山|李帅宇|王旭|姚正浩
湖北汽车工业学院机械工程学院,十堰,442002,中国
摘要
准确高效的交通流量预测对于智慧城市的建设至关重要。交通流量数据表现出复杂的时空依赖性,且节点之间的权重可能会因出行模式和节点属性的变化而动态调整。然而,现有的预测模型主要依赖于静态邻接矩阵和复杂的时间序列模型,这限制了模型的性能。我们提出了一种创新的交通流量预测方法——自适应动态时空图卷积网络(ADSTGCN),以解决这一问题。具体而言,我们结合了多头注意力机制和自适应动态邻接矩阵来构建两个动态时空提取模块,并将其与图卷积网络(GCN)集成,以克服静态邻接矩阵在捕捉节点间动态时空相关性方面的局限性。在时间维度提取层面,我们引入了Mamba模型来模拟交通流量数据中的长期时间序列,有效提取相关的时间信息。我们在四个真实世界的公共交通数据集上进行了广泛的对比实验,结果表明,与其他基线模型相比,我们的模型具有最高的预测准确性,展示了其在交通流量预测方面的巨大潜力。
引言
近年来,汽车数量的激增给城市交通系统带来了巨大压力。智能交通系统(ITS)的快速发展缓解了交通拥堵,提高了道路效率,并显著提升了公众的出行便利性(Haydari和Yilmaz,2020年)。预测交通流量的能力是智能交通系统(ITS)的一个基本方面。准确的预测可以帮助政府机构更有效地规划道路基础设施,并使交通管理部门能够及时、有根据地调整道路状况。这为智慧城市的建设提供了宝贵的科学参考。
为了预测未来的交通流量,必须考虑多个因素,包括历史交通数据(如交通流量、平均速度和道路占用率)、环境信息以及个人的出行习惯。然而,这些数据集显示出复杂的时空依赖性(Sun等人,2024年)。因此,从交通数据流中准确高效地提取相关信息并建立预测模型是交通流量预测中的一个重大挑战。
早期的交通流量预测方法主要依赖于数学和统计方法,如历史平均值(HA)方法和自回归积分滑动平均(ARIMA)模型(Williams和Hoel,2003年)。这些模型将收集的交通流量数据视为时间序列,并通过探索历史时间序列数据中的隐藏关系来估计特定观测点的未来交通流量。由于它们过度依赖特征工程并且捕捉复杂非线性关系的能力有限,这些模型在预测性能上存在一定的局限性。近年来,随着先进的数据收集技术的出现和人工智能的应用,深度学习方法在交通流量预测中得到了广泛应用。最初的方法使用卷积神经网络(CNN)从交通流量数据中提取时空依赖性(Yin等人,2021年)。然而,CNN在处理非欧几里得空间数据时存在一定的局限性。图卷积网络(GCN)的引入部分解决了这些缺点。GCN能够有效提取节点间的空间相关信息,在处理交通流量等非欧几里得空间数据时表现出更好的性能(Bruna等人,2013年)。然而,基于GCN的方法未能完全考虑交通网络中节点间的动态依赖性,从而限制了预测的准确性。
在时间相关特征提取方面,包括循环神经网络(RNN)、长短期记忆网络(LSTM)及其变体门控循环单元(GRU)在内的时间序列预测方法已被广泛使用,并取得了良好的效果。然而,传统的时间序列方法计算复杂度高,并且在训练过程中容易遇到梯度消失或爆炸等问题。因此,我们在交通流量预测中继续面临以下挑战:
首先,交通网络中节点间的空间依赖关系具有高度动态性,因为不同节点之间的相互依赖性会因出行行为和地理属性等因素而变化。因此,有效捕捉交通网络内的动态时空依赖性是一个重大挑战。例如,如图1(b)所示,道路节点A和B在早高峰时段的相关性很强,但在其他时段则减弱。此外,如图1(c)所示,地理位置相距较远的道路节点C和D可能由于地理属性的影响而表现出相似的交通流量趋势,反映了交通系统中节点间的动态依赖性。然而,现有模型主要采用静态方法来构建交通流量预测模型,这限制了它们捕捉交通流量数据动态特性的能力。
其次,交通流量数据表现出高度的时间依赖性,准确高效地建模长期时间关系是一个重大挑战。先前的研究表明,基于时间序列模型的方法(如RNN和LSTM网络)往往需要大量训练,并且在建模长期时空关系时经常遇到梯度爆炸或消失等问题,这会使训练过程变得复杂。尽管基于变换器的方法有助于解决其中的一些问题,但它们在训练过程中需要大量的计算资源和时间。
为了解决上述挑战,我们提出了一种创新的交通流量预测方法,即自适应动态时空图卷积神经网络模型(ADSTGCN)。该方法采用数据驱动的方法重建节点的动态时空图,用动态时空图替代传统的静态空间邻接矩阵来捕捉交通流量数据中的动态时空相关性。此外,为了确保有效捕捉数据中的长期时间依赖性,我们引入了一种新的时间序列预测方法——Mamba框架,用于建模交通流量数据中的时间关系,从而提升模型的预测性能。本文的主要贡献如下:
- 我们提出了一种基于数据驱动的新颖动态时空图。通过将周期性交通流量数据作为输入,我们利用多头图注意力机制和时间扩张卷积模块构建空间和时间动态连通性图。然后将得到的动态连通性图与两个独立的GCN模块集成,形成注意力图卷积网络(Att-GCN)和时间动态卷积图网络(TDCM-GCN)。这种方法有效捕捉了交通网络时间和空间维度中的潜在动态依赖性。
- 我们开发了一种高效的动态时空交通流量预测模型ADSTGCN。为了建模时间关系,我们使用Mamba模型来捕捉数据中的长期依赖性。该方法降低了计算复杂性,提高了模型的训练效率,同时保持了预测的准确性,相比RNN、变换器和其他类似技术的时间序列建模方法。为了建模空间关系,提取的时间序列数据同时输入到Att-GCN和TDCM-GCN中以捕捉时空依赖性。上述模块的输出合并后,通过全连接层生成最终预测结果。
- 我们在四个真实世界的交通数据集上进行了广泛实验,以评估模型的预测准确性和性能。结果表明,我们的模型在预测准确性和性能上优于基线模型,展示了其在交通流量预测方面的巨大潜力。
相关研究
近年来,从交通流量数据中有效提取时空特征已成为交通流量预测的主要研究焦点。鉴于CNN在图像识别方面的出色表现,许多研究人员探索了将传统卷积应用于图数据的方法。Bruna等人(Bruna等人,2013年)将图论与深度神经网络结合,设计了GCN模型。该模型促进了图上的信息传播和特征提取。
ADSTGCN
为了解决时间序列模型在处理长期依赖性方面的挑战以及GCN无法捕捉空间动态性的问题,我们提出了一种新的交通流量预测模型:状态空间动态时空图卷积网络(ADSTGCN)。
如图2所示,ADSTGCN主要由数据嵌入层、时间特征提取层、时空动态特征提取层、动态时空图卷积层和预测层组成。
数据集
我们在四个公开可用的真实世界高速公路交通数据集上进行了实验:PeMS03、PeMS04、PeMS07和PeMS08。这些数据集由加州交通部门收集,其中包含真实世界的高速公路交通流量数据(Song等人,2020年)。传感器每30秒记录一次数据,并每5分钟汇总一次,捕获交通流量、平均速度和平均占用率等特征,以及地理位置和时间切片信息。
PeMS03数据集包含
结论
本文提出了一种自适应动态时空交通流量预测模型(ADSTGCN)用于交通流量预测。具体来说,我们使用Mamba模型来捕捉交通流量数据中的长期时间依赖性。此外,我们利用多头注意力机制和动态邻接矩阵(TDCM)开发了两个动态的、自适应的图卷积模块来捕捉交通流量数据中的动态相关性。我们在四个数据集上进行了广泛的实验
CRediT作者贡献声明
余江:撰写——初稿。
胡明茂:撰写——审稿与编辑。
龚爱红:资源支持。
兰艳飞:撰写——审稿与编辑。
龚青山:资金获取。
李帅宇:方法论。
王旭:方法论。
姚正浩:方法论。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
致谢
本工作得到了国家自然科学基金(52375508)和湖北省教育厅重点项目(D20211803)以及湖北汽车工业学院博士基金(BK202001)的支持。