《Engineering Applications of Artificial Intelligence》:Two halves make a whole: A novel grid–graph contrastive alignment framework of spatiotemporal features in traffic flow prediction
编辑推荐:
准确的交通流预测对于城市智能交通管理至关重要,这是智慧城市基础设施中的重要工程应用。为预测各城市区域的交通状态,需同时考虑局部与全局交通依赖性。现有研究基于网格(grid-based)或图(graph-based)范式分别处理这两种依赖性。然而,网格范式在表征
准确的交通流预测对于城市智能交通管理至关重要,这是智慧城市基础设施中的重要工程应用。为预测各城市区域的交通状态,需同时考虑局部与全局交通依赖性。现有研究基于网格(grid-based)或图(graph-based)范式分别处理这两种依赖性。然而,网格范式在表征全局依赖性方面存在不足,而图范式在表征局部依赖性方面存在不足。为同时 leveraging 两种范式的优势,研究人员提出了一种新的人工智能(AI)框架——网格-图对比对齐网络(Grid-Graph Contrastive Alignment Network,GGCAN),通过对比对齐方案融合基于网格和基于图的表示。研究人员还引入了方向感知卷积模块(direction-aware convolutional block)以增强局部特征学习,以及动态图卷积模块(dynamic graph convolutional block)以细化全局特征建模。这些组件构成了该研究的核心人工智能创新。在工程应用领域,研究人员将GGCAN应用于真实城市交通预测,并在两个大规模公共数据集上进行了评估:北京出租车流数据集(TaxiBJ)和纽约市自行车流数据集(BikeNYC)。实验结果表明,GGCAN持续优于现有先进方法,验证了其在智能交通管理中的实际有效性。此外,所提出的框架具有可推广性,在交通流之外的其他时空预测任务中也具有应用前景。
## 研究背景与问题
准确的交通流预测是智能交通系统(Intelligent Transportation Systems, ITS)的基石。在现代城市中,预测动态出行模式的能力能够实现更主动的交通管理、缓解系统性拥堵,并支持更安全高效的交通运营。例如,洛杉矶自动交通监控与控制(Automated Traffic Surveillance and Control, ATSAC)系统将路口延误降低超过32%,车辆排放减少约3%;广东新博高速公路采用基于人工智能的系统实现了96.3%的交通流预测准确率。交通流预测问题的常见做法是将城市划分为空间网格,基于每个网格自身及其他网格的历史交通流预测未来的交通状态。现有方法可分为两类:一类采用基于网格的方法,通常利用卷积神经网络(Convolutional Neural Networks, CNN)捕捉局部空间依赖性和短程时间动态性,但可能忽略非局部影响和长程相关性;另一类采用基于图的方法,将城市区域表示为通过交通或功能关系连接的节点,使图神经网络(Graph Neural Networks, GNN)能够捕捉全局交互和时间演化的空间依赖性,但可能因节点抽象粒度较粗而丢失精细的局部模式。在实际交通预测中,干扰和需求激增往往超出局部邻域传播。例如,干道瓶颈处的拥堵回溢可通过主要走廊快速影响多个非相邻区域,而附近网格仍保持相对稳定。这种实际脱节推动了网格-图融合的研究,但现有融合框架可能存在表征不匹配和融合效率低下的问题,因为CNN和GNN特征在结构和空间推理机制上存在差异,导致融合框架中存在语义不一致性。语义一致性要求对于任意两个时空交通状态,不同视角之间的相似度应保持一致,即两个视角必须在哪些交通状态相似、哪些不相似的问题上达成一致。因此,亟需一种显式对齐机制来确保两个视角一致地描述同一底层交通状态。
## 研究内容与核心创新
为应对上述研究空白,研究人员提出了网格-图对比对齐网络(GGCAN)。该框架将基于网格和基于图的时空表征整合于统一的对比对齐方法中。具体而言,该框架通过减少CNN提取特征与GNN提取特征之间的差异实现局部匹配,并通过流量的一致性正则化实现全局匹配。这种对齐增强了局部与全局表征之间的相互理解。此外,为更好地捕捉表征交通流的各向异性局部传播和时间动态全局交互,研究人员引入了两个专用模块:局部方向感知卷积模块(Local Direction-Aware Convolutional Block, LD-Conv),通过沿四个方向的卷积提取精细的方向依赖性;以及动态全局图卷积模块(Dynamic Global Graph Convolutional Block, DG-GCN),利用动态可学习的邻接矩阵建模演化的区域间相关性。研究人员在TaxiBJ和BikeNYC两个公共大规模城市数据集上进行了大量实验,结果表明GGCAN持续优于现有先进基线方法。即使与网格-图融合方法相比,GGCAN也显示出明显优势,验证了对齐驱动架构的有效性。消融研究进一步证实了各组件的有效性:移除对比对齐导致性能显著下降,将自适应融合替换为静态策略则准确性降低。方向感知卷积和动态图模块分别对捕捉局部各向异性和全局时间变异性贡献显著。这些发现凸显了使每种建模方法贡献其独特优势的重要性。
## 主要技术方法
GGCAN框架从两个互补视角学习时空表征:网格视角(基于CNN)和图视角(基于GNN)。研究人员将历史观测组织为三个时间片段——邻近性(closeness)、周期性(periodicity)和趋势性(trend)——分别捕捉短期动态、日周期规律和周模式。对于每个时间片段,GGCAN采用两个并行分支处理输入。局部分支通过LD-Conv模块处理网格数据,该模块使用四个方向(水平、垂直、对角线、反对角线)的卷积核捕捉各向异性传播模式,能够区分交通拥堵在不同方向上的扩散差异。全局分支通过DG-GCN模块处理图数据,该模块基于动态可学习的邻接矩阵捕捉区域间相关性,邻接矩阵随时间动态更新以反映交通关系的演化。两个分支的输出通过对比对齐机制进行融合:局部匹配通过最小化CNN与GNN特征之间的分布差异实现,全局匹配通过对预测流量施加一致性约束实现。最后,自适应融合策略根据输入动态调整两个视角的权重,生成最终预测。
实验数据来源包括:TaxiBJ数据集基于北京市出租车GPS数据,采样频率为每30分钟,划分为32×32的空间网格;BikeNYC数据集基于纽约市自行车共享轨迹数据。
## 研究结果
**GGCAN总体架构**:如图1所示,GGCAN通过网格视角和图视角两个互补分支学习时空表征。网格视角利用CNN捕捉局部空间模式,图视角利用GNN捕捉全局空间依赖,两者通过对比对齐机制实现语义一致的特征融合。
**局部方向感知卷积模块(LD-Conv)**:传统CNN使用标准卷积核,将各方向的特征同等对待,无法区分交通流在不同方向上的传播差异。研究人员设计的LD-Conv模块采用四个方向的卷积核分别提取水平、垂直、对角线和反对角线方向的特征,并通过注意力机制动态加权各方向的重要性。该模块能够有效捕捉各向异性的局部传播模式,如主干道上的双向不对称流量、交叉路口的转向偏好等精细模式。
**动态全局图卷积模块(DG-GCN)**:现有图方法多使用静态预定义邻接矩阵,无法反映城市交通关系的动态演化。DG-GCN模块通过可学习的参数生成动态邻接矩阵,能够根据历史交通数据自适应调整区域间的连接权重,捕捉事件驱动的空间关系变化。该模块同时建模时间维度上的动态性,通过门控机制控制历史信息的保留与更新。
**对比对齐机制**:该机制包含两个层次。局部匹配层面,研究人员采用最大均值差异(Maximum Mean Discrepancy, MMD)约束CNN与GNN特征分布的一致性,使得两个视角对相似交通状态产生相似的特征表示。全局匹配层面,研究人员对两个分支的预测流量施加L
2一致性约束,确保最终预测值不会因视角差异而产生显著偏离。这种双重对齐有效缓解了网格表征与图表征之间的语义不一致问题。
**自适应融合策略**:不同于简单的拼接或加权平均,研究人员设计的自适应融合机制根据输入数据的动态特性调整两个视角的融合权重。在局部模式显著的场景(如早高峰的单向通勤流)中增强网格视角的权重,在全局依赖重要的场景(如大型活动散场时的跨区域流)中增强图视角的权重。
**实验评估与消融分析**:在TaxiBJ和BikeNYC数据集上的实验表明,GGCAN在多个评价指标上持续优于现有先进方法。与最佳基线相比,GGCAN在TaxiBJ数据集上的均方根误差(Root Mean Square Error, RMSE)降低约8%-12%,在BikeNYC数据集上降低约10%-15%。与网格-图融合方法相比,GGCAN的优势验证了对齐驱动设计的有效性。消融研究显示:移除对比对齐模块导致两个数据集上的性能均显著下降,表明语义对齐对融合质量至关重要;将自适应融合替换为静态等权重策略,性能有所降低;单独移除LD-Conv或DG-GCN模块,模型分别丧失局部精细建模能力和全局动态建模能力,验证了各组件的必要性。
## 讨论与结论
研究人员在讨论中指出,GGCAN的核心优势在于通过显式对齐机制解决了网格表征与图表征之间的语义不一致问题,使两种范式能够实现"强强协同"而非简单组合。LD-Conv模块对局部各向异性模式的捕捉能力和DG-GCN模块对全局动态关系的建模能力,共同支撑了框架在复杂交通场景下的优异表现。该框架的通用性使其可拓展至其他时空预测任务,如人群流动预测、环境质量预测等。
**结论**:在该研究中,研究人员提出了GGCAN,一种新颖的深度学习框架,该框架将基于网格和基于图的时空表征整合于统一的对比对齐范式下,用于交通流预测。为有效捕捉局部移动模式,研究人员引入了方向感知卷积模块,用于建模空间网格内的各向异性传播。为捕捉时间演化的全局依赖性,研究人员设计了动态图卷积模块,通过精细的可学习邻接矩阵自适应地建模区域间相关性。