自动驾驶是一项革命性技术,有望提高道路安全,减少交通拥堵,并让不会开车的人也能出行。随着学术界和工业界的兴趣日益增加,人们迫切需要开发能够在复杂和动态环境中工作的智能系统(Hosseinian & Mirzahossein, 2024)。尽管取得了许多进展,但现有自动驾驶车辆在现实高速公路环境中的轨迹精度、碰撞预测、避障以及快速路径规划等方面仍面临挑战(Suk et al., 2024)。尽管基于规则和监督学习的传统方法在结构化环境中有效,但在非线性车辆动力学、快速决策和非均匀交通条件下可能失效。此外,上述方法大多依赖于预先确定的规则或大型标记数据集,限制了其实时应用的灵活性(Liao et al., 2025)。目前存在的许多模型主要集中在单一目标优化上,如车道保持或速度控制,而没有考虑其他因素,如能源效率、乘坐舒适性和安全性(Hosseinian et al., 2024)。实际环境中的速度变化、范围、时间延迟、抖动和燃油变化等因素进一步增加了挑战性,这些都直接威胁到系统的稳定性和安全性(Tarhini et al., 2024)。因此,需要一个能够同时协调多种目标的智能控制系统。强化学习与进化算法和多目标优化算法的结合为建立适应性强、数据驱动的自动驾驶导航框架提供了坚实的基础(Bécsi, 2024)。在自动驾驶导航方法方面已经取得了许多进展,包括碰撞避免、路径规划和连接性。风险感知控制器(RAC)结合了基于模型的碰撞预测和强化学习,可以在自主导航时降低碰撞风险,并确保车辆与所有对象(V2X)之间的通信,从而实现情境感知(Candela et al., 2023)。基于深度强化学习的碰撞避免系统(DRL-CAS)鼓励使用智能避障策略,通过与路边单元的实时连接获取环境更新,从而保障道路使用者的安全(Chen et al., 2024)。协作碰撞避免系统(CCAS)采用深度学习方法通过 V2V 链路增强车辆间的通信和协调避障机制(Farhat et al., 2024)。深度 Q 网络和深度确定性策略梯度(DQN-DDPG)允许车辆在城市环境中与其他车辆进行交互,通过信号和物体检测进行导航(Tsai et al., 2026)。混合人工势场和模糊模型预测控制(HAPF-FMPC)方法通过内部系统连接同时处理障碍物的路径规划和方向跟随(Feng et al., 2023)。基于强化学习的预测轨迹规划(RL-PTP)通过交通信号信息的基础设施到车辆(I2V)通信实现交叉口的适应性轨迹规划和增强机动性(Zhang et al., 2023);深度强化学习动态路径规划(DRL-DPP)利用实时决策和接近传感器网络的连接性在陌生动态环境中导航(Hu et al., 2023)。TriPField 模型(三维势场)通过障碍物感知和传感器融合以及车辆内部通信更新局部路径规划(Ji et al., 2023)。生成对抗网络轨迹预测模型(GAN-TPM)基于历史驾驶习惯和多源数据聚合预测未来行驶路线,确保连接性(Hsu et al., 2023),而历史交互特征融合网络(HIFF-Net)利用 V2X 通信预测车辆路径,提高时空交互的连接性(Zuo et al., 2023)。更先进的端到端深度学习框架(EEDLF)实现了实时车道检测和路径预测,提高了自动驾驶系统的感知和控制功能,由传感器和外部模块的持续数据流驱动(Lee & Liu, 2023)。
在基于场景的高速公路自动驾驶 MPC 框架中包含了一个交互式多模型卡尔曼滤波器,用于预测交通参与者的行为并生成一组可信的交互场景。控制器明确考虑了安全性、舒适性和交通规则,并通过包含最坏情况进行了递归可行性验证(Zhang et al., 2024)。局部规划结合了基于样条平滑的优化路径 A,使用多项式提高障碍物避障效果和路径平滑度。实际实验验证了控制精度的提升和响应时间的减少(Chen et al., 2025)。多目标优化在自动驾驶车辆控制中变得非常重要,需要在安全性、舒适性和能源/效率之间进行权衡。一些最新论文中使用了多目标优化或 MPC 与学习的组合来平衡相互冲突的目标(例如能源与行驶时间或稳定性与舒适性),并且生成轨迹的平滑度和效率存在物理差异(Jiang et al., 2024)。研究的主要问题如图 1 所示。
尽管自动驾驶技术有所改进,但现有系统仍缺乏集成性、灵活性和有效的多目标优化。为了填补这些空白,本研究提出了使用 ALAS 和多目标 Superb Fairy-wren 优化算法(MSFWOA)的 SDQ-MSF 模型。因此,探讨了以下研究问题:
1.一个集成轨迹跟踪、碰撞预测和路径规划的统一控制框架如何提高自动驾驶车辆在动态环境中的安全性和适应性?
2.自动驾驶系统的稳定性、乘坐舒适性和能源效率如何响应多目标优化算法(如 MSFWOA)的使用?
3.如何利用强化学习模型,并结合进化策略和自适应预览机制,实时处理多智能体自动驾驶车辆的问题?
虽然提出的框架中的各个元素(包括深度 Q 学习、多目标优化和样条插值)已经成熟,但这项工作的独特之处在于将它们相互整合并分层,以控制自动驾驶车辆。特别是,该框架为学习、优化和轨迹表示分配了独立且互补的功能,从而实现偏转、安全性、稳定性和对变化驾驶环境的适应性的联合优化。据我们所知,此前尚未有将基于样条的进化优化、基于强化学习的碰撞避免和自适应前瞻路径规划如此紧密整合到单一控制系统中的报道。
- •
本研究提出了 SDQ-MSF 模型,以提高在动态高速公路条件下的轨迹跟踪准确性和韧性。同时引入了基于驾驶参数的深度 Q 学习架构,用于触发预防措施。这些模型通过智能和自适应决策提高了自动驾驶车辆的安全性、控制和能源效率。
- •
为了确保自动驾驶的稳定性、效率和安全性,本研究使用 MSFWOA 来平衡控制策略。MSFWOA 通过有效探索和利用这些策略,在混合条件下表现良好,并生成适用于动态和实时环境的平衡控制策略。
- •
ALAS 系统根据车辆速度和道路曲率调整预览距离,从而及时纠正和控制路径,特别是在高速转弯和急转弯时,实现更安全、响应更快的自动驾驶。
- •
一种自上而下的控制架构,将经过验证的学习和优化方法整合在一起,以实现轨迹跟踪、碰撞避免和自动驾驶中的自适应路径规划的共同目标。
本文的结构如下:第 2 节介绍自动驾驶车辆的系统模型,第 3 节讨论实验结果,第 4 节深入分析这些结果,第 5 节对全文进行总结。