《Accident Analysis & Prevention》:Decision-Making of automated vehicles under diverse risky pedestrian crossing behaviors
编辑推荐:
针对无控制中段交通场景中高风险行人行为的自动驾驶决策问题,本研究提出融合极坐标遮挡感知分析与风险感知强化学习的决策框架,通过高保真多智能体仿真平台验证其在复杂场景下提升安全性和控制平滑度,并平衡安全与效率,为自动驾驶安全部署提供新见解。
Xu Chen | Hao Wang
中国东南大学城市智能交通系统江苏省重点实验室,南京 211189
摘要
不受控制的道路中间区域经常与较高的交通冲突率相关,但往往缺乏有效的缓解措施。危险的行人过街行为,如乱穿马路、分心行走以及从遮挡区域突然冲出,再加上多样的驾驶风格,进一步复杂化了自动驾驶车辆(AV)的决策过程。然而,大多数现有研究都集中在简化的场景上,很少考虑复杂的实际情况。这一差距限制了当前自动驾驶车辆在城市环境中的决策研究的真实性和适用性。为了解决这些问题,一个高保真的多智能体仿真平台模拟了自动驾驶车辆、人工驾驶车辆以及具有不同危险过街行为的行人之间的动态互动。一种基于极坐标扇区分析的通用能见度建模方法模拟了由于遮挡物导致的多个智能体的感知限制。在此基础上,开发了一个基于深度强化学习(DRL)的决策框架,将风险评估与安全过滤相结合。该框架动态地将环境风险纳入自动驾驶车辆的行为策略中,并在执行过程中使用安全过滤器来纠正或替换不安全的动作。实验结果表明,所提出的方法在存在遮挡物或分心的行人的复杂场景中显著提高了安全裕度和控制平稳性。与基于规则的以及不了解风险的DRL基线方法相比,学习到的策略表现出更强的预见性行为,并在安全性和交通效率之间取得了更好的平衡。这些发现突显了风险感知DRL在管理高度不确定和交互式的城市驾驶环境中的潜力。该方法为自动驾驶车辆在现实世界交通中的安全部署提供了新的见解。
引言
行人安全仍然是城市交通管理中的一个核心挑战。不受控制的道路中间区域尤其危险。在美国弗吉尼亚州,大约70%的行人死亡事故发生在道路中间区域的交叉口(Xie等人,2024年)。全球也报告了类似的趋势。道路中间区域通常缺乏明确的过街规则和适当的过街设施(Zhang等人,2025年)。因此,行人与车辆之间的互动具有高度不可预测性(Zhang等人,2023a)。危险的行人过街行为,如乱穿马路和因分心而突然进入道路的情况经常发生(Zhu等人,2022年;Zhang等人,2023b)。这些行为显著降低了人类驾驶员和自动驾驶系统有效感知、预测和响应的能力。此外,城市中行驶缓慢的车辆和路边停车经常阻挡视线,进一步增加了突然碰撞的风险(Lu等人,2024年;Chen等人,2025a)。在这样复杂的环境中,危险的行人过街行为对交通安全构成了重大挑战,需要针对性的解决方案。
自动驾驶技术的进步为减轻与行人相关的风险创造了机会(El Hamdani等人,2020年;Utriainen,2021年)。当前的自动驾驶车辆(AV)通常依赖预编程的防御策略,优先让行以最大化安全性(Li和Sun,2018年;Chen等人,2025b)。虽然这些保守的响应在减少碰撞方面有效,但可能导致安全与效率之间的权衡:在潜在的冲突场景中过于谨慎的行为会导致交通效率明显下降。随着实时感知和行人行为预测技术的改进,更加交互式的决策策略正在出现(Zhao等人,2021年;Chen等人,2025b)。这些方法旨在根据预期的行人行为动态调整车辆行为,寻求安全与效率之间的更好平衡。然而,这些方法仍然难以考虑隐藏的风险,特别是在视觉遮挡频繁的城市环境中。
深度强化学习(DRL)为自动驾驶车辆的决策提供了一个有前景的替代方案(Chae等人,2017年)。通过与环境的持续互动,DRL智能体即使在部分可观察的情况下也能学习到最优行为(Mnih等人,2015年)。先前的研究已经证明了DRL在信号化交叉口和标记人行横道等结构化场景中的有效性(Trumpp等人,2022年;Shabestary和Abdulhai,2022年)。然而,仍然存在两个关键限制。首先,许多研究假设完全可观察性,忽略了遮挡物对关键安全决策的影响。其次,场景通常被简化,忽略了现实世界城市环境的复杂性,包括频繁的规则违反、多智能体互动和动态能见度变化。关键的研究缺口在于开发出在具有遮挡物和不可预测行人行为的复杂城市环境中仍然安全和高效的决策方法。
因此,本研究旨在通过引入更丰富的交互动态和更适应性的决策框架来解决现有的差距。具体来说,开发了一个真实的城市交通仿真环境,以模拟涉及危险行人过街行为和遮挡相关因素的复杂互动。该环境涵盖了各种此类行为和风险,包括单间隙和连续间隙过街、分心行走以及从遮挡区域突然冲出的行为。它还结合了关键的交通特征,包括混合的行人与车辆流量、多样的驾驶风格(包括保守型和交互型)以及路边停车。提出了一种基于遮挡的能见度算法,用于模拟所有道路用户因视觉障碍造成的视线盲区。基于这个环境,提出了一个风险感知的DRL框架,它整合了多源感知数据并实时评估环境风险。此外,还添加了一个安全过滤器作为策略级别的约束,以筛选和抑制危险行为,而不会显著降低交通效率。本研究的主要贡献如下:
- •
提出了一种基于极坐标扇区遮挡分析的通用能见度检测方法,以准确表示所有道路用户的感知限制。
- •
开发了一个高保真的道路中间区域交互环境,以捕捉包括多样化的危险行人过街行为、动态遮挡和异质交通行为在内的关键现实世界复杂性。
- •
设计并验证了一个具有集成安全过滤器的风险感知DRL框架,在动态和非结构化条件下展示了在平衡安全性和效率方面的强大性能。
本文的其余部分组织如下。第2节回顾了相关文献。第3节介绍了整体建模框架,包括遮挡建模、智能体行为建模和基于DRL的决策算法。第4节描述了实验设置和结果。第5节总结了本文,讨论了当前的局限性,并概述了未来研究的方向。
部分片段
危险的行人过街行为和建模
在不受控制的道路中间区域,危险的行人过街行为通常包括在未标记的人行横道外过街、分心行走(例如使用手机或耳机)以及从遮挡区域突然进入道路(Anik等人,2021年)。这些行为违反了时间和空间的规定。这些行为在行人流量较大且过街设施不足的住宅区和商业区最为常见(Anik等人,2021年;Xie等人)
概念框架
本研究提出的概念框架聚焦于城市道路中间区域的场景(见图2)。研究地点是中国南京景峰购物中心前的一个道路段落。两侧的商业用地产生了强烈的过街需求,而指定的过街设施不足。因此,行人在出现间隙的任何地方都会过街。一些行人会分心(例如使用手机或佩戴耳机)。此外,SUV和厢式货车等车辆也会影响视线
实验
为了评估所提出的风险感知SAC策略在各种危险行人过街行为下的表现,使用CARLA平台(Dosovitskiy等人,2017年)开发了一个高保真的城市交通仿真环境。CARLA先进的3D可视化和场景回放功能为实验监控和结果验证提供了坚实的基础。测试地点是一条120米长、三车道的单行道,带有与人行道,复制了收集数据中观察到的真实世界条件。
结论和未来研究
本研究关注不受控制的道路中间区域中的高风险交通互动。核心挑战在于应对由行人违规、分心和视觉遮挡引入的现实世界安全风险。为了捕捉这些复杂性,开发了一个高保真的仿真环境,整合了多层行为和感知不确定性。在此基础上,提出了一个强化学习框架,该框架结合了风险评估和安全措施
CRediT作者贡献声明
Xu Chen:写作——审阅与编辑、撰写原始草稿、可视化、验证、软件、方法论、概念化。Hao Wang:写作——审阅与编辑、监督、概念化。
利益冲突声明
作者声明他们没有已知的可能会影响本文工作的竞争性财务利益或个人关系。
致谢
本研究得到了国家自然科学基金(编号:52472341)的支持。