基于现实场景的自主车辆轨迹控制、路径规划与碰撞避免技术

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Expert Systems with Applications》：Realistic scenario-based trajectory control, path planning, and collision avoidance for autonomous vehicles

【字体：大中小】 时间：2026年03月17日 来源：Expert Systems with Applications 7.5

编辑推荐：

　　自动驾驶系统通过融合强化学习与多目标优化算法（SDQ-MSF）及自适应前瞻系统（ALAS），实现复杂路况下的精准轨迹跟踪（误差0.12米）和动态安全控制。ALAS根据车速和道路曲率动态调整前瞻距离，优化路径规划效率。实验验证SDQ-MSF在保持30-35km/h稳定车速的同时，碰撞率降至2.1%，并优于DRL-PTP和GAN-TPM等现有方法。

K.B. 斯里·萨蒂亚 | S. 马诺吉·库马尔

计算机科学与工程系，KPR 工程技术学院，阿拉苏尔，哥印拜陀，泰米尔纳德邦 641407，印度

摘要

自动驾驶领域受到了广泛关注，因为它有望提高道路安全，使驾驶更加轻松便捷。然而实际上，高速公路的情况非常复杂，需要实时预测和避免碰撞、正确的路径控制以及在动态条件下的自适应路径规划。传统的基于规则和基于控制的学习技术在处理非线性车辆动力学方面表现不佳，也不够灵活，无法应对不确定的情况。为了解决这些问题，本研究提出了一种结合强化学习与进化策略的 Spline 差分进化深度 Q 学习（SDQ-MSF）模型，以提高跟踪的准确性和稳定性。此外，还集成了一种自适应前瞻系统（ALAS），该系统可以根据车辆的速度和曲率动态调整预览距离。实验结果表明，SDQ-MSF 模型的跟踪误差较低（0.12 米），碰撞率较低（2.1%），这意味着该模型在跟踪控制方面具有高精度，并且安全性更高。该模型能够保持恒定速度（30–35 公里/小时），并且在 700 次训练后能够在 2–5 米的范围内快速到达目标位置。这些结果证明了该模型在面对挑战时的有效性和机动性。借助配备 ALAS 的改进 SDQ-MSF 算法，提供了一种改进的、可扩展的自动驾驶车辆导航模型，实现了更高的准确性、稳定性和对动态驾驶需求的及时响应。

引言

自动驾驶是一项革命性技术，有望提高道路安全，减少交通拥堵，并让不会开车的人也能出行。随着学术界和工业界的兴趣日益增加，人们迫切需要开发能够在复杂和动态环境中工作的智能系统（Hosseinian & Mirzahossein, 2024）。尽管取得了许多进展，但现有自动驾驶车辆在现实高速公路环境中的轨迹精度、碰撞预测、避障以及快速路径规划等方面仍面临挑战（Suk et al., 2024）。尽管基于规则和监督学习的传统方法在结构化环境中有效，但在非线性车辆动力学、快速决策和非均匀交通条件下可能失效。此外，上述方法大多依赖于预先确定的规则或大型标记数据集，限制了其实时应用的灵活性（Liao et al., 2025）。目前存在的许多模型主要集中在单一目标优化上，如车道保持或速度控制，而没有考虑其他因素，如能源效率、乘坐舒适性和安全性（Hosseinian et al., 2024）。实际环境中的速度变化、范围、时间延迟、抖动和燃油变化等因素进一步增加了挑战性，这些都直接威胁到系统的稳定性和安全性（Tarhini et al., 2024）。因此，需要一个能够同时协调多种目标的智能控制系统。强化学习与进化算法和多目标优化算法的结合为建立适应性强、数据驱动的自动驾驶导航框架提供了坚实的基础（Bécsi, 2024）。在自动驾驶导航方法方面已经取得了许多进展，包括碰撞避免、路径规划和连接性。风险感知控制器（RAC）结合了基于模型的碰撞预测和强化学习，可以在自主导航时降低碰撞风险，并确保车辆与所有对象（V2X）之间的通信，从而实现情境感知（Candela et al., 2023）。基于深度强化学习的碰撞避免系统（DRL-CAS）鼓励使用智能避障策略，通过与路边单元的实时连接获取环境更新，从而保障道路使用者的安全（Chen et al., 2024）。协作碰撞避免系统（CCAS）采用深度学习方法通过 V2V 链路增强车辆间的通信和协调避障机制（Farhat et al., 2024）。深度 Q 网络和深度确定性策略梯度（DQN-DDPG）允许车辆在城市环境中与其他车辆进行交互，通过信号和物体检测进行导航（Tsai et al., 2026）。混合人工势场和模糊模型预测控制（HAPF-FMPC）方法通过内部系统连接同时处理障碍物的路径规划和方向跟随（Feng et al., 2023）。基于强化学习的预测轨迹规划（RL-PTP）通过交通信号信息的基础设施到车辆（I2V）通信实现交叉口的适应性轨迹规划和增强机动性（Zhang et al., 2023）；深度强化学习动态路径规划（DRL-DPP）利用实时决策和接近传感器网络的连接性在陌生动态环境中导航（Hu et al., 2023）。TriPField 模型（三维势场）通过障碍物感知和传感器融合以及车辆内部通信更新局部路径规划（Ji et al., 2023）。生成对抗网络轨迹预测模型（GAN-TPM）基于历史驾驶习惯和多源数据聚合预测未来行驶路线，确保连接性（Hsu et al., 2023），而历史交互特征融合网络（HIFF-Net）利用 V2X 通信预测车辆路径，提高时空交互的连接性（Zuo et al., 2023）。更先进的端到端深度学习框架（EEDLF）实现了实时车道检测和路径预测，提高了自动驾驶系统的感知和控制功能，由传感器和外部模块的持续数据流驱动（Lee & Liu, 2023）。

在基于场景的高速公路自动驾驶 MPC 框架中包含了一个交互式多模型卡尔曼滤波器，用于预测交通参与者的行为并生成一组可信的交互场景。控制器明确考虑了安全性、舒适性和交通规则，并通过包含最坏情况进行了递归可行性验证（Zhang et al., 2024）。局部规划结合了基于样条平滑的优化路径 A，使用多项式提高障碍物避障效果和路径平滑度。实际实验验证了控制精度的提升和响应时间的减少（Chen et al., 2025）。多目标优化在自动驾驶车辆控制中变得非常重要，需要在安全性、舒适性和能源/效率之间进行权衡。一些最新论文中使用了多目标优化或 MPC 与学习的组合来平衡相互冲突的目标（例如能源与行驶时间或稳定性与舒适性），并且生成轨迹的平滑度和效率存在物理差异（Jiang et al., 2024）。研究的主要问题如图 1 所示。

尽管自动驾驶技术有所改进，但现有系统仍缺乏集成性、灵活性和有效的多目标优化。为了填补这些空白，本研究提出了使用 ALAS 和多目标 Superb Fairy-wren 优化算法（MSFWOA）的 SDQ-MSF 模型。因此，探讨了以下研究问题：

1.

一个集成轨迹跟踪、碰撞预测和路径规划的统一控制框架如何提高自动驾驶车辆在动态环境中的安全性和适应性？

2.

自动驾驶系统的稳定性、乘坐舒适性和能源效率如何响应多目标优化算法（如 MSFWOA）的使用？

3.

如何利用强化学习模型，并结合进化策略和自适应预览机制，实时处理多智能体自动驾驶车辆的问题？

虽然提出的框架中的各个元素（包括深度 Q 学习、多目标优化和样条插值）已经成熟，但这项工作的独特之处在于将它们相互整合并分层，以控制自动驾驶车辆。特别是，该框架为学习、优化和轨迹表示分配了独立且互补的功能，从而实现偏转、安全性、稳定性和对变化驾驶环境的适应性的联合优化。据我们所知，此前尚未有将基于样条的进化优化、基于强化学习的碰撞避免和自适应前瞻路径规划如此紧密整合到单一控制系统中的报道。

•
本研究提出了 SDQ-MSF 模型，以提高在动态高速公路条件下的轨迹跟踪准确性和韧性。同时引入了基于驾驶参数的深度 Q 学习架构，用于触发预防措施。这些模型通过智能和自适应决策提高了自动驾驶车辆的安全性、控制和能源效率。
•
为了确保自动驾驶的稳定性、效率和安全性，本研究使用 MSFWOA 来平衡控制策略。MSFWOA 通过有效探索和利用这些策略，在混合条件下表现良好，并生成适用于动态和实时环境的平衡控制策略。
•
ALAS 系统根据车辆速度和道路曲率调整预览距离，从而及时纠正和控制路径，特别是在高速转弯和急转弯时，实现更安全、响应更快的自动驾驶。
•
一种自上而下的控制架构，将经过验证的学习和优化方法整合在一起，以实现轨迹跟踪、碰撞避免和自动驾驶中的自适应路径规划的共同目标。

本文的结构如下：第 2 节介绍自动驾驶车辆的系统模型，第 3 节讨论实验结果，第 4 节深入分析这些结果，第 5 节对全文进行总结。

节选内容

自动驾驶车辆控制系统框架

将各种算法整合到建议的框架中的必要性在于自动驾驶任务具有高度不同的要求。差分进化（DE）用于优化轨迹的样条参数，因为它在连续非凸搜索空间中有效。深度 Q 学习（DQL）用于碰撞预测和避免，因为它允许在动态和不确定的环境中做出决策。

结果与讨论

提出的 SDQ-MSF 框架在配备 NVIDIA RTX 3090 显卡（GPU）和 128 GB RAM 的高性能计算实验室中实现，以确保在复杂和动态交通模拟下快速高效地训练深度强化学习模型。

表 1 展示了 SDQ-MSF 模型的配置。开发环境使用 Python 3.9 和 TensorFlow 2.4，配置在 GPU 上运行，以辅助大型模型的训练。

所开发模型的消融研究

为了评估 SDQ-MSF 框架的有效性，通过与现有模型进行比较来评估其核心功能，包括轨迹控制、跟踪精度和碰撞避免性能。通过消融研究进一步探讨了 SDQ-MSF 框架中每个组件的价值，具体方法是禁用某些组件而保留其他组件。

SDQ-MSF 框架的性能讨论

表 7 显示 SDQ-MSF 框架在自动驾驶车辆性能方面更为有效，跟踪误差降低到 0.12 米，碰撞率降低到 2.1%，优于 RL-PTP（0.38 米，12.5%）和 GAN-TPM（0.31 米，10.4%）。该框架能够保持恒定速度（30–35 公里/小时），并通过使用 MSFWOA 作为多目标优化器和 ALAS 作为自适应路径规划器实现高效的目标收敛（2–5 米，700 次训练）。这些发现证明了

结论

本研究提出了 SDQ-MSF 框架，以提高自动驾驶中轨迹跟踪的准确性和控制的稳健性。该框架具有动态性，可以根据道路曲率和速度调整预览距离，通过集成 ALAS、强化学习和进化优化来实现稳定和自适应的路径规划。DQL 用于基于距离差和速度的实时碰撞预测和避免。

CRediT 作者贡献声明

K.B. 斯里·萨蒂亚：概念化、方法论、验证。S. 马诺吉·库马尔：项目管理、监督、调查。

资助

本研究未获得公共部门、商业部门或非营利组织的任何特定资助。

利益冲突声明

作者声明没有已知的利益冲突或个人关系可能影响本文所述的工作。

致谢

无。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号