编辑推荐:
城市轨道交通(URT)网络日益庞大,对起讫点(OD)需求进行精准预测是支持规划、调度和车队管理的关键。然而,现有模型难以应对网络结构动态变化、多种时空依赖性混杂以及列车延误/取消等运营不确定性。为此,研究人员开展了一项题为“Multi-Graph Inductive Representation Learning for Large-Scale Urban Rail Demand Prediction under Disruptions”的研究,提出一种名为mGraphSAGE的多图归纳表示学习框架。该模型将每个OD对表示为多个图中的节点,以捕捉不同的时空相关性,并显式纳入运营可靠性信息。实验表明,该模型在哥本哈根URT系统的三个网络规模上均优于基线,RMSE降低高达5%,证明了其在大型及受干扰URT环境下的适用性与鲁棒性。
随着城市不断扩张,城市轨道交通(URT)网络也日益庞大。准确的乘客起讫点(OD)需求预测,对于支持线路规划、列车调度、车队管理等运营决策至关重要,这直接关系到市民的生活质量、经济生产效率和环境的可持续性。然而,现实中的预测任务充满了挑战:URT网络结构复杂,乘客出行行为多变,而且OD需求数据存在严重的“部分可观测性”——一次行程只有在其完成后才能被完整记录,这意味着在预测时刻,我们掌握的信息可能是不完整的。更棘手的是,城市轨道交通的日常运营并非总是风平浪静,列车延误、班次取消等意外事件时有发生,这些运营不确定性会显著影响乘客的出行选择和行为模式,从而给需求预测带来巨大波动。尽管基于图神经网络(GNN)的模型在交通预测中展现出潜力,但它们通常依赖单一的、预定义的空间图,难以区分OD对之间不同类型的时空依赖关系,并且在应对大规模网络和动态变化的拓扑结构时,其扩展性(可扩展性)也面临考验。为了填补这些研究空白,来自丹麦技术大学(DTU)的研究团队提出了一种新颖的解决方案。
为了攻克上述难题,研究人员开发了一个名为mGraphSAGE(多图归纳表示学习)的预测框架。其核心是利用图归纳表示学习技术,为大规模URT网络构建一个既具备可扩展性,又在各种运营可靠性场景下保持鲁棒性的短期OD需求预测模型。关键技术方法包括:1) 多图建模:不再使用单一图,而是构建了四个互补的图来刻画OD对之间不同的时空与服务关联,包括基于时间序列相似性的时序相关图、基于OD对质心距离的空间图,以及分别基于起点站和终点站距离的局部空间图。2) 归纳式学习:采用GraphSAGE式的归纳学习范式,通过采样和聚合邻居节点的特征来学习节点表示,这使得模型能够泛化到未见过的OD对或动态变化的网络结构,无需重新训练。3) 特征工程:除了利用历史OD聚合需求(Xt)和已完成行程(Dt)来捕捉趋势性和周期性,还独创性地引入了12个与系统运营可靠性相关的特征(fs),如过去一小时内在起终点站各线路的列车数量、平均延误和取消比例,以显式建模运营中断的影响。模型在涵盖不同网络规模的哥本哈根S-train系统真实数据上进行了验证。
研究结果
- •
3.1. 研究问题与特征:本节明确了OD预测中部分可观测性的挑战,并定义了用于预测的输入特征。核心是将每个时间间隔t的OD需求分解为已完成行程dti和从起点站出发但未完成的行程pto。模型利用过去8个时间间隔的聚合需求{Xt, ..., Xt-7}和已完成行程{Dt, ..., Dt-7}来捕捉短期趋势,并结合星期几(fw)、时间区间(ft)等特征捕捉日/周周期性。此外,还设计了节点ID特征(fid)和前述的12个运营可靠性特征(fs)。
- •
3.2. URT中的OD图:本节阐述了本研究的图构建思路。与传统的将车站作为节点、客流量作为边的网络图不同,本研究创新性地将每一个OD对本身建模为图中的一个节点。这样做显著降低了图的规模和复杂度,使得在大规模网络上进行高效的节点(即OD对)级预测成为可能。
- •
3.3. mGraphSAGE模型:本节详细介绍了所提出的模型。
- •
3.3.1. 建模OD对间的时空相关性:为全面捕捉关系,研究构建了四个图:1) 基于动态时间规整(DTW)距离的时序相关图(Gt),连接具有相似历史需求模式的OD对;2) 基于OD对质心欧氏距离的质心距离图(Gs),捕捉整体空间邻近性;3) 基于起点站距离的起点距离图(Go)和4)基于终点站距离的终点距离图(Gd),用以捕捉局部空间关联。
- •
3.3.2. 用于OD预测的多图归纳学习:模型在四个图上并行运行GraphSAGE层。对于每个节点(OD对),在每一层中,模型从其在不同图中的邻居节点采样并聚合特征信息。这些从不同图学习到的节点表示最终被拼接起来,通过一个全连接网络进行融合,并输出对下一个时间间隔的OD需求预测值。
- •
4. 计算实验:通过在哥本哈根URT系统的大、中、小三种网络规模数据集上的实验,mGraphSAGE与多种基线模型(包括历史平均、向量自回归、LSTM、图卷积网络等)进行了比较。评估指标包括均方根误差(RMSE)和平均绝对误差(MAE)。结果表明,mGraphSAGE在所有网络尺度上均 consistently(持续地)取得了最佳性能,RMSE最高降低了5%。特别是在包含运营中断(延误和取消)的场景下,mGraphSAGE的表现显著优于其他模型,证明了其引入运营可靠性特征的有效性和模型整体的鲁棒性。消融实验进一步证实,多图设计和运营可靠性特征的加入都对性能提升有重要贡献。
研究结论与意义
本研究针对大规模城市轨道交通网络中,在运营不确定性下的起讫点需求预测难题,提出了一个创新的多图归纳表示学习框架mGraphSAGE。该研究的主要贡献和结论包括:第一,提出了一种可扩展的归纳式OD对层级预测框架,将每个OD对表示为节点,能够适应动态演化的网络条件。第二,引入了多图表示法,通过四个互补的图捕捉了OD对之间不同的时空与服务依赖关系,实现了更具表达力的需求建模。第三,显式地整合了运营可靠性信息(如列车延误和取消),显著提升了模型在受干扰运营条件下的预测鲁棒性。实验证明,该模型在真实城轨网络数据上,在预测精度和鲁棒性方面均优于现有的机器学习基线模型。
这项研究的意义在于,它推动了OD需求预测方法向更贴近实际运营环境的方向发展。mGraphSAGE框架不仅能够处理大规模、复杂的网络结构,还能有效应对日常运营中不可避免的中断事件,为交通运营商提供更可靠、更及时的数据驱动决策支持。例如,基于更准确的短期OD预测,运营商可以更主动地管理列车时刻表和运力以应对扰动,通过动态资源分配优化运营效率,并通过减少过度拥挤和提供及时旅行信息来提升乘客体验。该研究发表于《Computers 》期刊,为构建更具韧性(resilience)和适应性的城市轨道交通系统提供了有力的方法论工具。