《TRANSPORTATION RESEARCH PART D-TRANSPORT AND ENVIRONMENT》:Quantifying built environment effects on intermodal transit trip patterns at grid level
编辑推荐:
基于北京智能卡数据,本研究提出LDA-ANN框架解析跨式交通出行模式与建成环境的关系,揭示空间时间特征及非线性阈值效应,为公交地铁协同发展提供策略。
雷佳友|何明伟|何敏|史壮斌|何越仁|刘阳|钱慧敏
昆明理工大学交通工程学院,中国云南省昆明市镜明南路727号650500
摘要
了解多模式公共交通出行模式对于推进公交与地铁的整合至关重要。然而,大多数现有研究关注的是总体公共交通乘客量,而关于多模式公共交通出行特征以及建成环境(BE)对其影响的实证证据仍然有限。为了解决这一差距,本研究提出了一个基于概率主题建模-人工神经网络(ANN)的框架,利用来自中国北京的一周大规模智能卡数据,识别具有代表性的多模式公共交通出行模式,并研究它们与建成环境的相互作用。多维潜在狄利克雷分配(LDA)模型提取了网格级别的模式,揭示了五种具有概率解释的时空特征。通过SHapley加性解释(SHAP)解释的多输入多输出ANN揭示了建成环境与出行模式分布之间的复杂非线性关系和阈值效应。研究结果表明,建成环境对出行模式分布的影响与其对总体乘客量的影响不同,为协调公交与地铁的发展提供了新的见解,并为有针对性的整合策略提供了依据。
引言
快速的城市化加剧了诸如拥堵、空气污染、能源消耗和噪音等挑战,尤其是在高密度城市中。因此,高质量的公共交通被广泛认为是可持续城市发展的基石(Yang等人,2018年;Dillman等人,2021年;Wimbadi等人,2021年)。尽管由于地铁系统具有高容量、高速度和可靠性而在全球范围内迅速扩展(Gan等人,2020年),但其巨大的建设和运营成本限制了其空间覆盖范围。将地铁与灵活的地表交通模式相结合是一种有效的策略,可以扩大服务范围并提高网络连通性。多模式出行结合了单次出行中的多种交通方式,克服了单一交通方式的固有局限性(Qin和Sun,2022年)。凭借其灵活性、相对较高的容量和较低的费用,公交车成为地铁系统的主要接驳方式(Chen等人,2022b)。加强公交与地铁的整合为长途出行提供了一种经济且可持续的替代方案(Chen等人,2021年)。因此,促进地铁和公交服务之间的有效协调对于提高公共交通系统的效率和竞争力至关重要(Zhang等人,2024年)。研究多模式公共交通出行可以揭示不同系统之间的行为协作,为促进公交与地铁的整合和推动可持续出行提供重要见解。
现有研究已经对单模式公共交通出行(Cui等人,2025年;Güler,2025年;Zhang等人,2025b)以及地铁系统与其他交通模式(如共享单车、出租车和网约车服务)的整合(Cheng等人,2022年;Jin等人,2022b;Chen等人,2023a)给予了相当多的关注。相比之下,公交与地铁的出行在文献中仍然相对较少被探索(Shi和Zeng,2025年)。单模式出行与多模式出行在可及性和出行特征上的差异强调了分别研究多模式公共交通出行的重要性(Chen等人,2021年;Lei等人,2024年)。现有研究已经识别出了公交与地铁之间的换乘行为(Munizaga和Palma,2012年),并研究了换乘乘客量的关键决定因素(Shi和Zeng,2025年)以及换乘率(Wu等人,2022年)。然而,很少有研究系统地研究具有代表性的多模式公共交通出行模式或分析其时空特征。因此,仍有几个关键问题尚未得到解答:多模式公共交通出行是否表现出不同的模式?它们的时空分布是什么?哪些因素影响了这些分布,以及影响的方式是什么?回答这些问题有助于更深入地理解公交与地铁的协调机制,并为制定更有效的多模式公共交通政策提供依据。因此,本研究重点探索具有代表性的出行模式并分析其背后的决定因素。
已经提出了多种方法来识别出行和活动模式,包括基于规则的方法和机器学习模型。基于规则的方法在准确性和泛化能力方面存在局限性(Fu等人,2025年),这促使人们越来越多地采用机器学习方法,以获得更客观和精确的结果。考虑到个体内部和个体之间的差异,层次化建模框架变得必要(Zhao等人,2020年)。然而,传统的聚类、主成分分析和隐马尔可夫模型等技术通常不足以处理层次化和分组数据(Aminpour和Saidi,2025年)。在本研究中,应用潜在狄利克雷分配(LDA)在网格级别识别具有代表性的多模式公共交通出行模式。为了克服传统LDA仅提取单一维度主题的局限性,采用了改进的多维LDA模型(Zhao等人,2020年),以揭示多模式公共交通出行的潜在时空结构。
大量证据表明,建成环境(BE)显著影响了出行行为。然而,大多数公共交通研究关注的是总体乘客量,而BE对不同出行模式分布的影响仍不够深入。现有的出行模式研究通常分别建模单一模式或多个模式(Wu等人,2022年;Bi等人,2024年),这限制了模式之间的直接比较,并可能导致结果不一致。方法上,这些研究主要使用线性模型,这本质上忽略了潜在的非线性关系。机器学习和可解释AI的进步提供了捕捉解释变量与结果变量之间细粒度关系的机会(Cao,2025年)。基于这一能力,本研究开发了一个多输出人工神经网络(ANN),共同建模建成环境与多种出行模式分布之间的关系,为公交与地铁的无缝整合提供了新的见解。
本研究有三个主要贡献。首先,尽管对公交与地铁系统整合的研究很多,但对多模式公共交通出行模式的结构特征了解仍然不足。我们通过应用一个语义可解释的多维LDA框架来填补这一空白,该框架将空间单元概念化为分析文档,并根据它们的时空属性从多天的智能卡数据中提取具有代表性的多模式出行模式。其次,超越了目前主要关注建成环境如何影响总体乘客量的焦点,本研究直接研究了建成环境与潜在多模式出行模式结构之间的关系。通过将分析视角从出行量转移到行为构成上,我们揭示了土地利用配置影响公共交通行为的机制,从而为城市交通规划和政策提供了基于行为的视角。最后,现有研究通常分别建模不同的出行模式并假设线性关系,这种做法可能导致不同模式之间的估计不一致,并忽略了广泛认可的非线性和阈值效应。为了解决这些限制,我们开发了一个多输出ANN回归框架,在统一的非线性框架内共同估计所有多模式公共交通出行模式的决定因素。这种方法增强了模式之间的可比性,并更准确地捕捉了建成环境影响多模式出行行为的复杂方式。
本文的其余部分组织如下。第2节回顾了相关文献。第3节概述了研究背景和数据来源。第4节详细介绍了方法论框架。第5节报告了实证发现并进行了讨论。第6节总结了主要结论。
研究片段
出行模式的识别与分析
探索出行模式旨在揭示塑造居民出行决策过程的复杂动态和潜在因素(Fu等人,2025年),从而为有针对性的交通项目提供支持(Pieroni等人,2021年)。信息和通信技术的进步通过提供大规模轨迹和出行数据的访问能力,从根本上重塑了出行模式分析。例如,Gong等人(2016年)使用上海的出租车轨迹数据来推断出行
研究区域
中国首都北京是本研究的案例研究对象。这座城市位于中国北部,由16个行政区组成,面积约为16,410平方公里。截至2019年,北京的常住人口已超过2000万。从城市空间结构来看,北京历史上呈现出单中心形态,天安门广场及其周边地区为核心区域。长期以来,城市发展主要局限于
方法论
本研究使用的方法论工作流程如图3所示,包括四个主要阶段。首先,从智能卡数据中提取多模式公共交通出行,并将其映射到相应的空间单元,同时提取建成环境(BE)信息。其次,应用多维LDA模型来识别潜在的多模式公共交通出行模式,产生两个输出:(1)每个空间单元内的模式概率分布;(2)出行特征的分布
多模式公共交通出行模式的提取
多维LDA模型(第4.1节)在Python中实现,用于识别多模式公共交通出行模式。鉴于数据集和选定的超参数,需要选择适当的模式数量Z。这种选择需要在准确性和可解释性之间取得平衡(Bi等人,2024年;Aminpour和Saidi,2025年)。更多的模式可以提高拟合度,但会增加复杂性并可能产生代表性不足的主题,而较少的模式可以在较小的成本下提高代表性
结论
多模式公共交通出行直接反映了公交与地铁服务之间的协调。分析它们的潜在模式和驱动机制可以加深我们对公共交通乘客量的理解,并为改进服务提供依据、提高运营效率和系统整合提供信息。与以往仅关注个体层面模式识别或直接建模公共交通乘客量与建成环境之间关系的研究不同,本研究引入了一个LDA-ANN框架
CRediT作者贡献声明
雷佳友:撰写——原始草稿、可视化、软件开发、方法论设计、调查、数据分析、概念化。何明伟:撰写——审稿与编辑、可视化、监督、方法论设计、资金筹集、数据分析、概念化。何敏:监督、方法论设计、数据分析、概念化。史壮斌:撰写——审稿与编辑、方法论设计、概念化。何越仁:验证、方法论设计、数据分析。刘阳:验证
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文的研究结果。
致谢
本研究得到了中国国家自然科学基金(项目编号72361015、52202381)和昆明理工大学哲学与社会科学创新团队(项目编号KGZSCXTD2025001)的支持。我们感谢编辑和匿名审稿人的评论和建议,这些评论和建议有助于改进本文。