马尔可夫性质是建模和分析驾驶过程的基本假设。该性质指出,在顺序决策过程中,任何给定时间的决策仅取决于当前状态,而与之前的状态历史无关(Chen等人,2010b)。满足马尔可夫性质的顺序决策过程称为马尔可夫决策过程(MP)。根据这一定义,我们可以推断出符合马尔可夫性质的驾驶过程的特点是车辆的行动完全由其当前的运动状态变量和周围交通条件决定,而不依赖于其历史行为或状态。这种性质假设了一个无记忆的驾驶过程,简化了驾驶行为分析、建模和仿真的输入。
许多过去的研究采用了马尔可夫性质。例如,在研究和分析人类驾驶行为时,基于马尔可夫性质探讨了车辆决策与状态之间的关系。最具代表性的例子包括车辆跟随模型,如Newell模型(Newell,2002年)、Gipps模型(Ciuffo等人,2012年)和智能驾驶模型(IDM,Chen等人,2010a年)。尽管这些模型在方法上有所不同,但都假设了马尔可夫性质。此外,这些车辆跟随模型中的关键参数校准也是基于这一假设对轨迹数据进行的拟合。
在轨迹预测研究中,总是根据当前状态来预测车辆的未来位置和速度,这也体现了马尔可夫性质的应用。例如,Rathore等人(2019年)提出了一个可扩展的基于聚类和马尔可夫的框架,用于短期和长期轨迹预测;Shin和Sunwoo(2018年)提出了一种基于马尔可夫的车辆速度预测算法。
在自动驾驶车辆(AVs)的安全性测试工作中,也利用了马尔可夫性质来生成背景人工驾驶车辆(HVs)的轨迹。Feng等人(2023年)在密集的深度强化学习方法中使用了MP来训练背景代理,并通过移除非安全关键状态和重新连接关键状态来增强训练数据中的信息密度。其他研究也提出了类似的性质和假设(Feng等人,2021年;Yan等人,2023年)。
然而,一些研究指出了基于马尔可夫性质模型的局限性。驾驶行为本质上是多方面的,许多因素会影响决策过程及随之产生的行为。多项研究表明,结合当前状态以及部分历史状态可以更准确地预测驾驶行为。Wang等人(2017年)建立了一个基于深度学习的车辆跟随模型,并证明结合过去10秒的状态可以最准确地预测未来行为;Pei等人(2016年)提出了一个具有伽马分布记忆效应的车辆跟随模型,显示出良好的模型准确性;Zhang等人(2023年)通过在不同尺度上结合历史信息改进了贝叶斯动态回归车辆跟随模型的性能。因此,马尔可夫性质并不总是能最准确地描述驾驶行为。在驾驶行为相关研究中,验证这一假设的有效性至关重要。
目前很少有研究验证马尔可夫性质。如前所述,大多数现有研究集中在确定应将多少历史信息纳入特定模型架构以最大化预测准确性上。这些努力主要旨在通过引入记忆来提高准确性。然而,模型准确性取决于两个相互关联的因素:模型的构建方式以及提供的历史信息的范围。因此,关于是否需要引入记忆的结论本质上具有模型特定性,不能在不同建模方法之间推广。无论模型形式或预测性能如何,目前缺乏一种可重复的、基于轨迹数据的测试方法来确定真实世界驾驶过程是否遵循马尔可夫性质,甚至无法确定如果存在这种结构的话,其马尔可夫依赖的阶数。
在交通领域,关于验证马尔可夫性质的研究有限。Shi等人(2016年)对驾驶周期数据进行了全面的马尔可夫分析,证明了城市网络中宏观交通流量指标演变具有马尔可夫性质,但这种分析并未针对微观车辆轨迹和驾驶行为。由于缺乏严格分析和实证证据来确认马尔可夫性质在驾驶行为中的适用性,文献中存在显著空白。这一空白是由于目前缺乏有效的方法来定量描述和检测驾驶行为中的马尔可夫性质。
在统计学领域,已经建立了多种统计方法来验证时间序列序列中马尔可夫性质的存在。Zhang等人(2010年)使用基于卡方统计的方法证明了年度降雨数据中的马尔可夫性质;Chen等人(2010b年)开发了一种基于条件特征函数(CCF)的频率域方法来测试马尔可夫性质,并在金融时间序列应用中取得了有希望的结果;Shi等人(2020年)提出了一种前向-后向学习程序来测试顺序决策中的马尔可夫假设,并将其应用于移动健康研究的真实数据集;Zhou等人(2023年)提出了一种用于高维时间序列的非参数马尔可夫性质检验方法。显然,目前有许多成熟的统计方法可用于测试时间序列数据中的马尔可夫性质。这些方法已在气象学、医疗保健和金融等多个领域得到广泛应用。然而,迄今为止,尚未有研究验证这些方法是否适用于驾驶轨迹,也未使用类似方法来检验驾驶行为数据中是否存在马尔可夫性质。
除了验证驾驶行为是否遵循马尔可夫性质外,比较AVs和HVs之间的马尔可夫性质差异也是一个重要的研究空白。直观上,AVs依靠先进的算法和传感器输入来基于实时数据做出决策,这可能导致其驾驶行为模式与人类驾驶员显著不同。另一方面,人类驾驶员能够将过去的知识、经验和直觉融入决策过程。认知领域的多项研究表明,人类驾驶员的决策过程涉及复杂的感知、理解和信息处理。人类驾驶员的决策主要基于时间积累的信息(Huang等人,2025年;Li等人,2024年)。这些发现突显了AVs和HVs在决策逻辑上的根本差异。然而,据我们所知,以往的研究尚未直接探讨AVs和HVs之间的马尔可夫性质差异。现有的类似研究通常依赖于单一类型车辆的轨迹数据来探讨所需的历史信息量。例如,Wang等人(2017年)仅使用了NGSIM数据集中的人类驾驶员数据,而Pei等人(2016年)分析了中国北京城市道路上的驾驶数据。
在这项研究中,我们从统计测试的角度研究了驾驶行为的马尔可夫性质。我们使用了来自公共数据集的AVs和HVs的轨迹。需要注意的是,我们的分析目前仅关注车辆跟随轨迹数据,这使我们能够比较AVs和HVs在稳定流量下的纯车辆跟随行为的马尔可夫性质差异。分析重点在于检验马尔可夫性质、确定马尔可夫阶数以及计算表现出马尔可夫性质的轨迹比例。我们的研究结果表明,HVs的马尔可夫性质通常比AVs弱,HVs的马尔可夫轨迹比例更低,马尔可夫阶数也更高。据我们所知,这是首次尝试从统计角度研究车辆轨迹的马尔可夫性质。这项工作的结果将对未来的相关研究以及交通流模型和仿真器产生重要影响。
本文的其余部分结构如下:第2节全面描述了本研究解决的问题,包括MP的定义和考虑的具体车辆跟随场景;第3节详细解释了本研究采用的统计方法;第4节介绍了使用的轨迹数据,包括数据集描述和数据处理程序;第5节报告了分析获得的统计结果;第6节详细讨论了结果,并对未来研究方向提供了简要见解;最后,第7节总结了整个研究。