评估驾驶行为中的马尔可夫特性：来自统计测试的见解

《TRANSPORTATION RESEARCH PART E-LOGISTICS AND TRANSPORTATION REVIEW》：Assessing Markov property in driving behaviors: Insights from statistical tests

【字体：大中小】 时间：2026年02月15日 来源：TRANSPORTATION RESEARCH PART E-LOGISTICS AND TRANSPORTATION REVIEW 8.8

编辑推荐：

　　自动驾驶与人类驾驶车辆轨迹的Markov属性统计验证。基于公开轨迹数据，运用Kolmogorov-Smirnov和Brown-Forsythe检验分析Markov特性，发现自动驾驶车辆轨迹Markov属性显著优于人类驾驶，表现为更高比例符合一阶Markov且阶数更低。研究证实Markov假设在车路协同模型和交通仿真中的适用边界，揭示人车决策机制的本质差异。

郑莉|孟浩明|马成远|马科|李晓鹏

美国威斯康星大学麦迪逊分校土木与环境工程系，麦迪逊，WI 53706

摘要

马尔可夫性质是大多数关于车辆驾驶行为研究的基础假设，它认为未来状态仅取决于当前状态，而不依赖于之前的状态序列。本研究验证了自动驾驶车辆（AVs）和人工驾驶车辆（HVs）的轨迹是否具有马尔可夫性质。我们采用了一种统计方法来检验时间序列数据是否具有马尔可夫特性，并进一步引入了Kolmogorov–Smirnov检验和Brown–Forsythe检验来分析AVs和HVs在马尔可夫性质上的差异。基于多个公开的轨迹数据集，我们通过严格的统计测试研究了不同类型车辆的马尔可夫性质的存在及其阶数。研究结果表明，与HVs相比，AVs的轨迹通常具有更强的马尔可夫性质，符合马尔可夫性质的比例更高，且马尔可夫阶数更低。相反，HVs的轨迹在决策过程中表现出更大的变异性和异质性，这反映了人类驾驶所涉及的复杂感知和信息处理过程。这些发现对驾驶行为模型、交通流模型和交通仿真系统的开发具有重要意义。此外，本研究还展示了使用统计方法检验驾驶轨迹数据中马尔可夫性质存在的可行性。

引言

马尔可夫性质是建模和分析驾驶过程的基本假设。该性质指出，在顺序决策过程中，任何给定时间的决策仅取决于当前状态，而与之前的状态历史无关（Chen等人，2010b）。满足马尔可夫性质的顺序决策过程称为马尔可夫决策过程（MP）。根据这一定义，我们可以推断出符合马尔可夫性质的驾驶过程的特点是车辆的行动完全由其当前的运动状态变量和周围交通条件决定，而不依赖于其历史行为或状态。这种性质假设了一个无记忆的驾驶过程，简化了驾驶行为分析、建模和仿真的输入。

许多过去的研究采用了马尔可夫性质。例如，在研究和分析人类驾驶行为时，基于马尔可夫性质探讨了车辆决策与状态之间的关系。最具代表性的例子包括车辆跟随模型，如Newell模型（Newell，2002年）、Gipps模型（Ciuffo等人，2012年）和智能驾驶模型（IDM，Chen等人，2010a年）。尽管这些模型在方法上有所不同，但都假设了马尔可夫性质。此外，这些车辆跟随模型中的关键参数校准也是基于这一假设对轨迹数据进行的拟合。

在轨迹预测研究中，总是根据当前状态来预测车辆的未来位置和速度，这也体现了马尔可夫性质的应用。例如，Rathore等人（2019年）提出了一个可扩展的基于聚类和马尔可夫的框架，用于短期和长期轨迹预测；Shin和Sunwoo（2018年）提出了一种基于马尔可夫的车辆速度预测算法。

在自动驾驶车辆（AVs）的安全性测试工作中，也利用了马尔可夫性质来生成背景人工驾驶车辆（HVs）的轨迹。Feng等人（2023年）在密集的深度强化学习方法中使用了MP来训练背景代理，并通过移除非安全关键状态和重新连接关键状态来增强训练数据中的信息密度。其他研究也提出了类似的性质和假设（Feng等人，2021年；Yan等人，2023年）。

然而，一些研究指出了基于马尔可夫性质模型的局限性。驾驶行为本质上是多方面的，许多因素会影响决策过程及随之产生的行为。多项研究表明，结合当前状态以及部分历史状态可以更准确地预测驾驶行为。Wang等人（2017年）建立了一个基于深度学习的车辆跟随模型，并证明结合过去10秒的状态可以最准确地预测未来行为；Pei等人（2016年）提出了一个具有伽马分布记忆效应的车辆跟随模型，显示出良好的模型准确性；Zhang等人（2023年）通过在不同尺度上结合历史信息改进了贝叶斯动态回归车辆跟随模型的性能。因此，马尔可夫性质并不总是能最准确地描述驾驶行为。在驾驶行为相关研究中，验证这一假设的有效性至关重要。

目前很少有研究验证马尔可夫性质。如前所述，大多数现有研究集中在确定应将多少历史信息纳入特定模型架构以最大化预测准确性上。这些努力主要旨在通过引入记忆来提高准确性。然而，模型准确性取决于两个相互关联的因素：模型的构建方式以及提供的历史信息的范围。因此，关于是否需要引入记忆的结论本质上具有模型特定性，不能在不同建模方法之间推广。无论模型形式或预测性能如何，目前缺乏一种可重复的、基于轨迹数据的测试方法来确定真实世界驾驶过程是否遵循马尔可夫性质，甚至无法确定如果存在这种结构的话，其马尔可夫依赖的阶数。

在交通领域，关于验证马尔可夫性质的研究有限。Shi等人（2016年）对驾驶周期数据进行了全面的马尔可夫分析，证明了城市网络中宏观交通流量指标演变具有马尔可夫性质，但这种分析并未针对微观车辆轨迹和驾驶行为。由于缺乏严格分析和实证证据来确认马尔可夫性质在驾驶行为中的适用性，文献中存在显著空白。这一空白是由于目前缺乏有效的方法来定量描述和检测驾驶行为中的马尔可夫性质。

在统计学领域，已经建立了多种统计方法来验证时间序列序列中马尔可夫性质的存在。Zhang等人（2010年）使用基于卡方统计的方法证明了年度降雨数据中的马尔可夫性质；Chen等人（2010b年）开发了一种基于条件特征函数（CCF）的频率域方法来测试马尔可夫性质，并在金融时间序列应用中取得了有希望的结果；Shi等人（2020年）提出了一种前向-后向学习程序来测试顺序决策中的马尔可夫假设，并将其应用于移动健康研究的真实数据集；Zhou等人（2023年）提出了一种用于高维时间序列的非参数马尔可夫性质检验方法。显然，目前有许多成熟的统计方法可用于测试时间序列数据中的马尔可夫性质。这些方法已在气象学、医疗保健和金融等多个领域得到广泛应用。然而，迄今为止，尚未有研究验证这些方法是否适用于驾驶轨迹，也未使用类似方法来检验驾驶行为数据中是否存在马尔可夫性质。

除了验证驾驶行为是否遵循马尔可夫性质外，比较AVs和HVs之间的马尔可夫性质差异也是一个重要的研究空白。直观上，AVs依靠先进的算法和传感器输入来基于实时数据做出决策，这可能导致其驾驶行为模式与人类驾驶员显著不同。另一方面，人类驾驶员能够将过去的知识、经验和直觉融入决策过程。认知领域的多项研究表明，人类驾驶员的决策过程涉及复杂的感知、理解和信息处理。人类驾驶员的决策主要基于时间积累的信息（Huang等人，2025年；Li等人，2024年）。这些发现突显了AVs和HVs在决策逻辑上的根本差异。然而，据我们所知，以往的研究尚未直接探讨AVs和HVs之间的马尔可夫性质差异。现有的类似研究通常依赖于单一类型车辆的轨迹数据来探讨所需的历史信息量。例如，Wang等人（2017年）仅使用了NGSIM数据集中的人类驾驶员数据，而Pei等人（2016年）分析了中国北京城市道路上的驾驶数据。

在这项研究中，我们从统计测试的角度研究了驾驶行为的马尔可夫性质。我们使用了来自公共数据集的AVs和HVs的轨迹。需要注意的是，我们的分析目前仅关注车辆跟随轨迹数据，这使我们能够比较AVs和HVs在稳定流量下的纯车辆跟随行为的马尔可夫性质差异。分析重点在于检验马尔可夫性质、确定马尔可夫阶数以及计算表现出马尔可夫性质的轨迹比例。我们的研究结果表明，HVs的马尔可夫性质通常比AVs弱，HVs的马尔可夫轨迹比例更低，马尔可夫阶数也更高。据我们所知，这是首次尝试从统计角度研究车辆轨迹的马尔可夫性质。这项工作的结果将对未来的相关研究以及交通流模型和仿真器产生重要影响。

本文的其余部分结构如下：第2节全面描述了本研究解决的问题，包括MP的定义和考虑的具体车辆跟随场景；第3节详细解释了本研究采用的统计方法；第4节介绍了使用的轨迹数据，包括数据集描述和数据处理程序；第5节报告了分析获得的统计结果；第6节详细讨论了结果，并对未来研究方向提供了简要见解；最后，第7节总结了整个研究。

部分摘录

问题描述

在本节中，我们提供了本研究考虑问题的基本描述。首先解释了构成我们分析基础的马尔可夫性质概念，然后介绍了用于验证驾驶行为中马尔可夫性质的场景。本节使用的符号见表1。

图1概念性地展示了本研究的核心问题。图1（a）描绘了MP和高阶马尔可夫决策过程

方法论

本节首先介绍了用于验证车辆轨迹马尔可夫性质的统计测试方法，然后介绍了用于确定AV和HVs轨迹之间马尔可夫性质是否存在显著差异的Kolmogorov–Smirnov检验（KS检验）和Brown–Forsythe检验（BF检验）方法。

轨迹数据

本节提供了本研究中使用的轨迹数据集和数据处理细节。同时提供了所使用轨迹的总结。

结果

本节讨论了对三个数据集中的车辆跟随轨迹进行的马尔可夫性质统计测试结果。结果包括对马尔可夫性质的分析、确定的马尔可夫过程阶数，以及表现出马尔可夫性质的轨迹比例（包括HVs和AVs）。KS检验和BF检验的结果也分别列出。

讨论

本节深入分析了本研究得出的结论，包括AVs和HVs之间观察到的更大异质性的根本原因、其他车辆类型的马尔可夫性质，以及这些发现对交通领域未来研究的影响。

结论

本研究引入了一个统计测试框架来验证车辆轨迹数据中的马尔可夫性质。利用公共数据集中的轨迹数据，我们进行了广泛的统计测试，以确定马尔可夫假设是否成立及其在不同类型驾驶行为中的适用程度。

根据本研究的结果，AVs和HVs在马尔可夫性质方面存在明显差异。AVs的轨迹通常表现出更强的马尔可夫性质

作者贡献声明

郑莉：撰写 – 审稿与编辑，撰写 – 原稿，可视化，方法论，调查。孟浩明：软件。马成远：撰写 – 审稿与编辑，概念化。马科：概念化。李晓鹏：资金获取，概念化。

利益冲突声明

本工作得到了美国国家科学基金会（NSF）的支持，授予编号为2313578和2343167的资助。我们感谢NSF的支持。此外，我们也感谢威斯康星大学麦迪逊分校的高性能计算中心（CHTC）的支持。CHTC提供的分布式高性能计算资源对本研究中所有统计测试的完成至关重要。作者声明他们没有已知的

摘要

引言

部分摘录

问题描述

方法论

轨迹数据

结果

讨论

结论

作者贡献声明

利益冲突声明

热点排行

新闻专题