编辑推荐:
基于多模式交通需求估计与因果干预分析,本文提出MCDVAE框架,通过变分自编码器实现潜在空间分解,结合图基离散选择模型捕捉跨模式交互,并利用结构因果模型进行干预模拟。实证表明该框架显著提升需求估计精度,为多模式交通系统决策提供可解释工具。
张永义|陶英华|江颖|丁凡|张俊义
东南大学交通学院,中国江苏省南京市211189
摘要
准确估计多模式出行需求及其对干预措施的响应是交通规划和管理中的关键任务。现有方法在考虑出行模式之间的复杂非线性交互作用以及推断干预措施的因果有效性方面存在局限性。为克服这些局限性,我们提出了一个多模式因果解耦变分自编码器(MCDVAE)框架,该框架将因果解耦表示学习与多模式生成建模相结合,用于预测性需求估计和干预效果评估。所提出的MCDVAE在结构化的潜在空间中区分了特定模式和通用模式变量,并利用基于图的离散选择模型(GDCM)来解释不同模式之间的交互效应。在分析干预效果时,我们使用结构因果模型(SCM)对因果关系进行编码,通过潜在空间中的针对性干预模拟假设情景。使用真实世界的多模式出行数据集进行的实证验证表明,与现有方法相比,MCDVAE在需求估计方面提高了准确性。反事实实验进一步凸显了其在干预模拟方面的能力。通过将因果推断与生成建模相结合,本研究为多模式交通系统中的主动决策提供了一个实用且可解释的工具。
引言
有效的交通规划和管理不仅依赖于准确的需求预测,还依赖于评估干预措施如何影响出行行为和交通系统。理解系统对外部事件(如公交车站关闭如何影响出行分布、票价调整如何改变出行方式选择,或外部因素(例如极端天气)如何改变出行流量)的响应对于交通管理至关重要(Fu等人,2014年;Lepage和Morency,2021年)。然而,许多传统模型和工具,包括调查、专家意见和情景模拟,通常只关注单一模式。其中一些模型还假设出行模式需求与外部事件之间存在线性和单向关系(Song等人,2024年;Xiong等人,2020年;Zhang等人,2022年)。
多模式出行需求估计可以通过捕捉不同出行模式之间的交互作用来全面描绘整体出行模式(Benam等人,2023年;Hussain等人,2022年;Li等人,2020年)。与单一模式模型相比,多模式方法考虑了在服务变化、价格变动或可达性变化时出行模式之间的需求转移(Liang等人,2022年)。离散选择模型(DCM)在理论上适合表示出行模式之间的替代和竞争(Huan等人,2024年),但它们面临数据稀疏、相关误差下的不稳定性以及内生性问题(Han等人,2022年;Hussain等人,2022年)等方法论挑战。
深度学习模型已成为模拟出行活动中复杂和非线性模式的有前景的工具(Feng等人,2022年;Xiong等人,2020年)。利用大规模数据,深度神经网络能够有效地从时间序列出行数据中学习,并结合旅行时间、成本和旅行者的社会经济属性等多种输入,以提高预测准确性(Fu等人,2020年;Xiong等人,2020年)。然而,这些方法主要关注预测准确性和统计关联,而在多模式需求估计中对因果机制的整合有限(S. Li等人,2024b;Suter等人,2018年)。虽然可解释的AI技术(如SHAP、LIME和注意力可视化)提高了可解释性(Dwivedi等人,2023年;Khemakhem等人,2020年),但它们通常依赖于事后测试,并且缺乏明确的因果结构,这限制了它们在政策评估和干预分析中的应用。
此外,识别出行行为关键因素之间的因果联系对于评估假设干预下的出行需求响应非常重要(Brathwaite和Walker,2018年)。反事实推断使研究人员能够估计在替代情景下会发生什么(Li等人,2024b;Pearl,2009年)。在这方面,交通领域的因果推断是一个具有挑战性的问题,因为大多数研究依赖于观察数据而非实验数据,这使得难以识别干预机制、解决未观察到的混杂因素,并预测尚未实施的政策干预的效果(Brathwaite和Walker,2018年)。因此,现有的交通评估严重依赖于历史事件数据和情景模拟(Brathwaite和Walker,2018年;D’Cruz等人,2020年;Lavasani等人,2017年),这需要强假设和广泛的专家输入(Huan等人,2024年)。相反,生成式人工智能(GAI)模型作为一种数据驱动的替代方法,可以从历史观察中学习潜在因素的解耦表示(Sohn等人,2015年;Zhang等人,2022年)。由于GAI通常假设潜在变量之间具有强独立性并且缺乏对这些潜在变量的控制能力,因此往往难以操纵特定的因果因素并分离它们的效果(Wang等人,2024年)。
本研究旨在将解耦表示学习与因果推断和干预结合用于多模式出行需求的估计。我们提出了一个多模式因果解耦变分自编码器(MCDVAE)框架,该框架将因果解耦表示学习与多模式生成建模相结合,以实现准确的出行需求估计和可解释的反事实推断。MCDVAE的核心是变分自编码器(VAE),它通过概率编码和解码学习多模式出行需求的结构化潜在表示。这种概率结构规范了潜在空间,有助于区分通用模式和特定模式变量。此外,在MCDVAE框架内,基于图的离散选择模型(GDCM)估计不同出行模式之间的替代和交互作用,而结构因果模型(SCM)定义潜在变量之间的因果关系并预测潜在空间中因果干预的结果。这些模型在MCDVAE框架中的整合使决策者能够进行反事实模拟并评估针对性干预对多模式出行需求的影响。本研究的主要贡献如下:
a)我们提出了MCDVAE,引入了因果解耦,区分了特定模式和通用模式的潜在变量,并通过SCM将这些变量联系起来,以明确编码出行模式之间的因果依赖性。
b)我们将SCM和GDCM结合在统一的VAE潜在空间中,同时实现因果可解释性和捕捉多模式替代和竞争效应。
c)我们提供了首个用于多模式出行需求建模的因果生成框架之一,并通过实证研究和反事实干预分析证明了其有效性。
本文的其余部分组织如下:第2节回顾了多模式出行需求建模和因果表示学习的相关工作。第3节介绍了所提出的MCDVAE框架及其组成部分。第4节介绍了实验设计和城际多模式OD出行数据。第5节通过评估模型性能和详细说明反事实结果来验证该框架。第6节总结了研究并概述了未来的研究方向。
部分摘录
多模式出行需求估计
多模式出行需求估计旨在分析和预测使用不同出行模式的总需求。与单一模式分析相比,多模式估计不仅考虑了特定模式的属性,还考虑了模式切换机制和模式之间的网络交互。
传统的出行需求估计方法包括回归分析、引力模型和四步法(Tamin和Willumsen,1989年)。这些方法依赖于明确定义的功能
方法论
本文提出了一个MCDVAE(多模式因果解耦变分自编码器)框架,用于多模式出行需求估计,该框架结合了变分自编码器(VAE)、因果解耦表示(CDR)和多模式选择模型。如图1所示,VAE(组件(a)和(d):编码器和解码器)设置了具有结构化概率分布的编码潜在表示,增强了出行需求估计的泛化和解耦能力。CDR(组件(b):
数据
本研究使用了2021年7月4日至7月10日期间在中国江苏省收集的手机信号数据。这些数据包括该省所有城市在三个时间间隔内的各种出行模式的OD交通流量,用于提取城际出行并识别出行模式(Ding等人,2024年)。数据预处理后,获得了8,736条OD记录,涵盖了7天内13个城市和每天8个时间间隔(即连续的3小时时间段)
模型性能评估
所提出的MCDVAE模型与几个基线模型进行了比较,如表2所示,使用RMSE和sMAPE指标评估了四种出行模式。表3报告了多次训练运行的平均估计误差,并提供了MCDVAE模型和基线模型的估计误差。传统的四步法模型在所有模式中显示出最大的误差,表明其在估计多模式出行需求方面的局限性。相比之下,深度学习模型(如MTLSTM和MRGNN)
结论
本研究提出了一个用于多模式出行需求预测性和干预效果评估的新框架。我们开发了MCDVAE方法,结合了基于离散选择的多任务学习、因果解耦表示学习和VAE,以应对多模式出行的复杂需求。这种联合分析有助于克服不同出行模式及其潜在因果因素之间的非线性交互挑战。MCDVAE模型与
CRediT作者贡献声明
张永义:撰写——原始草稿、可视化、验证、方法论、概念化。陶英华:撰写——审阅与编辑、撰写——原始草稿、验证、形式分析。江颖:撰写——审阅与编辑、概念化。丁凡:资金获取、数据管理。张俊义:撰写——审阅与编辑、资源协调、资金获取、概念化。
利益冲突声明
作者声明他们没有已知的可能会影响本文报告工作的竞争性财务利益或个人关系。
致谢
本研究得到了国家自然科学基金(资助编号:52202386和42501238)、中国工程院(资助编号:2024BEL01009)以及江苏省科技计划专项基金(资助编号:BE2023021-2)的支持。