为了迫切减少温室气体排放、缓解城市交通拥堵(Shen等人,2020年)和促进环境可持续性(Tian等人,2020年),发展可持续的城市和交通系统已成为当代城市规划和政策讨论中的核心重点(Delle Donne等人,2025年)。尽管通过实施以公共交通为导向的发展(TOD)等举措取得了实质性进展,但仍存在许多未解决的挑战。许多城市的基础设施尚未完全适应可持续交通的发展需求(Abdullah等人,2024年);公众对低碳出行方式的认知、接受度和行为转变仍然有限(Baig等人,2025年);关于可持续交通政策的公平性和包容性问题(Yang等人,2025年)仍然是一个关键问题。同时,包括拼车平台、共享电动汽车、自动驾驶出租车甚至未来可能发展的飞行汽车在内的多种新型出行方式的出现和普及,进一步多样化了居民的出行选择,导致出行行为变得越来越复杂和动态(Liu等人,2025年;Rossolov等人,2025年)。这些变化强调了从总体层面评估交通系统转向更细致地理解区域出行结构的必要性。具体来说,系统地研究不同交通方式在区域内的使用模式、描述出行结构在空间和时间尺度上的异质性和动态性,以及阐明驱动出行行为变化的根本机制是至关重要的。这些分析对于制定促进可持续出行方式并推动城市发展的有针对性的低碳出行政策至关重要(Jia等人,2017年;Wang等人,2025年)。此外,对区域出行结构的更深入理解可以支持设计考虑空间异质性、社会公平性和行为多样性的本地化干预措施,从而推进交通可持续性和气候适应性的更广泛目标(Yang等人,2020年)。
越来越多的研究正在探讨驱动居民出行行为变化的机制,旨在促进低碳出行方式的采用并优化出行结构(Liu等人,2017年;Xuan & Zheng,2024年;Yu等人,2023年)。现有研究主要集中在以下领域:(1)基于个人属性、出行偏好和建成环境等多维因素,确定影响居民选择低碳交通方式的决定因素(Schimohr等人,2025年);(2)开发和评估鼓励低碳出行行为的策略,包括公共意识活动、经济激励和政策干预的影响(Chen等人,2022年)。尽管取得了这些进展,但在改善居民的低碳出行结构方面仍存在几个关键挑战。
首先,现有研究缺乏对区域差异的考虑。尽管先前的研究表明不同区域的出行行为存在显著差异(Aston等人,2021年),但当前的努力主要集中在城市范围或宏观层面的空间规划和交通优化分析上。这往往忽略了局部建成环境特征和交通基础设施差异的影响,而这些因素在塑造特定区域的出行结构中起着关键作用。其次,大多数现有研究仅依赖于个体层面的出行调查数据(Andani等人,2021年),这些数据的样本量通常有限。这些有限的样本往往缺乏进行复杂建模所需的统计能力,尤其是在高级统计或机器学习背景下。
此外,尽管机器学习和离散选择模型已被广泛用于研究出行行为的变化(Hagenauer & Helbich,2017年),但这些方法存在明显局限性。具体来说,传统模型难以处理非结构化数据,无法充分利用文本、图像和地理空间数据等跨模态来源。这些数据对于涵盖影响居民出行行为的各种因素至关重要。此外,传统模型未能充分解决在空间和时间异质性背景下的出行行为的动态方面,其中模式因土地使用、基础设施和社会人口统计特征而异。例如,模式因地区和时间而显著不同,受到土地使用、基础设施和社会人口统计因素的影响。然而,它们通常依赖于静态假设或过于简化的时空表示,导致预测存在偏差或不完整。相比之下,LLM的最新进展为这些挑战提供了有希望的解决方案。LLM通过对多样化数据集的广泛预训练,能够自动捕捉复杂的语义模式,并将多模态信息整合到一个统一的表示空间中。这使得LLM特别适合于出行行为建模,能够将多种来源无缝整合到一个统一的框架中。
为了填补这些空白,本研究利用多源数据提出了一个基于LLM的框架来评估和估计区域出行结构。与传统方法相比,本研究的贡献如下:首先,本研究整合了多种跨模态数据来源,包括客观的地理空间数据、主观调查数据和多模态出行数据。通过应用多语义学习方法,将影响区域出行结构的各种主观和客观因素映射到一个统一的语义空间中,从而全面描述了影响居民出行行为的决定因素。其次,所提出的基于LLM的估计框架通过广泛的预训练数据捕捉复杂的语义模式,有效克服了传统模型在识别出行行为的空间时间特征方面的局限性,例如由于土地使用、基础设施和社会人口统计特征等因素导致的不同区域和时间的出行方式使用变化。该方法显著提高了空间差异化城市区域的出行方式结构的预测精度,特别是在估计模式份额和捕捉出行行为的空间异质性方面。即使在样本量较小的情况下,它也表现出强大的性能,验证了其鲁棒性和泛化能力。此外,传统的深度学习框架用于出行结构估计通常需要大型、标注的数据集、手工制作的多模态特征管道,并且模型决策的可解释性有限。相比之下,本研究将多源输入重新构造成语言,使LLM能够自然地整合文本化图像、地理空间指标和出行信号,并通过领域感知的提示产生合理的输出。这种设计既满足了数据需求,也克服了传统深度学习的黑盒限制,从而明确了我们的贡献超出了单纯的精度提升。
为了解决现有研究的空白并符合研究目标,本文试图回答以下三个问题:(1)如何在街道层面系统地聚合和标准化相关特征,以构建评估区域出行结构的指标系统,以及变化如何影响出行结构?(2)本研究如何克服静态和聚合估计方法的局限性,开发一种精细的方法来准确描述微观空间层面的区域出行结构?(3)在数据有限的条件下,基于大型语言模型(LLM)的框架如何有效整合多源和多模态数据,以减少小样本或空间覆盖不足带来的偏差,从而提高区域出行结构估计的可靠性和可解释性?
总体而言,所提出的框架在整合跨模态数据源方面表现出先进的能力——包括地理空间指标、街道级图像、公共交通使用和出行轨迹。通过利用多语义表示学习和微调的LLM,该方法捕捉了传统模型通常无法识别的复杂时空模式。这使得我们能够更全面地理解出行选择的根本决定因素,并支持对异质区域中的出行模式结构进行细致的评估。其在数据稀缺环境中的有效性也确保了其在不同城市环境中的广泛应用,提供了一个可扩展的解决方案,以解决空间异质性和出行行为的动态性质——这些通常是限制传统建模方法的限制。
基于此基础,本文的结构如下:第2节回顾了关于居民出行行为和相关建模方法的现有文献。第3节详细介绍了跨模态数据融合和基于LLM的模型构建的方法论。第4节案例研究和第5节整体性能部分,使用北京作为案例研究,展示了所提出框架的实证验证,包括模型比较和结果分析。第6节提供了对出行结构的解释,并讨论了政策含义。最后,第7节总结了本文并概述了未来研究的方向。