在交织的异质性和交互效应下对两车碰撞严重程度进行建模:从可靠性和系统安全的角度出发

【字体: 时间:2026年02月14日 来源:Reliability Engineering & System Safety 11

编辑推荐:

  两车事故中驾驶员受伤机制研究采用多树SHAP分析与随机参数Logit模型融合框架,基于深圳2018-2020年两车碰撞数据,通过跨模型稳定性检验识别稳健主效应及交互候选项,嵌入RPLHM实现异质性交互效应建模,结合场景模拟量化风险差异,揭示碰撞角色与新能源车/新手司机交互作用对受伤的影响,为精准安全干预提供数据支撑。

  
罗强|唐祖干
江西科技大学机电工程学院,中国赣州,341000

摘要

理解两车相撞中驾驶员的受伤结果仍然具有挑战性,因为交互效应和未观察到的异质性以复杂且依赖于场景的方式共同塑造了受伤风险。尽管最近的研究结合了基于机器学习的SHAP和随机参数logit结构模型,但大多数混合框架依赖于单一的学习算法,并且定性解释交互效应或将它们视为固定效应,这限制了它们捕捉异质交互机制的能力。为了解决这些限制,本研究开发了一个以稳定性为导向的混合框架,该框架将基于XGBoost、CatBoost、随机森林和Extra Trees的多树SHAP分析与具有均值异质性的随机参数logit模型相结合,使用了来自中国深圳的两车相撞数据。强调跨模型和交叉折叠的一致性,以识别稳健的主效应和交互候选项,减少模型特定的偏差。采用类别加权、以AUC-PR为导向的评估和概率阈值优化来应对严重的类别不平衡问题。结果表明,追尾事故是最容易导致受伤的事故类型之一,且受伤严重程度高度依赖于具体情境。被撞×追尾交互作用表现出显著的随机变化,其平均效应受到学习者驾驶员状态和新能车的系统调节,直接证明了交互效应和异质性是相互交织的。基于场景的概率模拟进一步揭示了在不同驾驶员-车辆-碰撞角色组合中预测的受伤风险的显著变化。通过将稳定的交互效应作为异质组成部分嵌入到计量经济框架中,本研究提高了混合事故严重性模型的稳健性和可解释性,并为有针对性的风险评估和干预提供了定量基础。

引言

确保城市道路交通系统的安全仍然是可靠性工程和事故预防中的一个基本挑战。根据世界卫生组织的数据,道路交通伤害继续是全球死亡和重伤的主要原因之一,低收入和中等收入国家承担了不成比例的负担[1]。作为一个快速机动化的发展中国家,中国在过去二十年里经历了前所未有的道路交通暴露增长,特别是在大城市中,密集的交通状况和复杂的驾驶环境大大增加了事故风险和相关伤害结果。中国的快速机动化导致注册机动车数量从2005年的约3160万辆增加到2024年的超过3.46万辆,2024年共有59,280人死亡和254,112人受伤[2]。然而,中国的交通事故死亡率仍然比发达国家高出数倍[1],这突显了中国在减轻事故风险和保护道路交通系统中人类生命方面面临的更大挑战。
两车相撞占城市交通事故的很大比例,也是中国最常见的碰撞类型之一。在城市交通环境中,机动车之间的碰撞占两车相撞的大多数。例如,在中国最大的大都市之一深圳,涉及两辆或更多车辆的碰撞占所有报告事故的74.8%,56.6%的死亡事故和75.1%的受伤事故[3]。在这一类别中,大多数事故只涉及两辆机动车,表明两车相撞是车辆间碰撞的主要组成部分。在美国也观察到了类似的模式,2012年至2018年间,两车相撞占所有报告事故的60%以上,并导致超过70%的相关伤亡[4,5]。两车相撞是城市交通系统中一个占主导地位且分析上具有挑战性的事故类型,因为受伤严重程度同时受到涉及驾驶员和车辆的行为和特征以及不对称影响角色的影响。这些由交互作用驱动的特征在中国大城市中得到了放大,这些城市的特点是交通密度高、车辆种类多样和新兴车辆技术涌现,这突显了需要先进的建模方法来捕捉两车相撞伤害严重性中的未观察到的异质性和交互效应。
以往关于两车相撞伤害严重性的研究已经确定了与驾驶员特征、车辆属性、碰撞配置和道路环境相关的多种影响因素,如表1所总结的。虽然这些研究提供了有价值的见解,但大多数分析仅关注单个因素的平均效应,并隐含地假设它们是加性的关系。然而,两车相撞中的受伤结果往往受到交互机制的影响,其中一个因素的效果取决于另一个因素的存在(例如,碰撞角色与事故类型的结合),以及未观察到的异质性,即同一因素可能在不同驾驶员或事故情境中对受伤风险产生不同的影响。忽略这些机制可能导致不完整甚至误导性的解释,特别是在评估对安全决策至关重要的特定场景风险时。
为了解决这些挑战,近年来越来越多地采用了结合机器学习技术和计量经济模型的混合建模框架[[6], [7], [8], [9]]。该框架有效地利用了两部分的互补优势:基于树的机器学习模型与Shapley加性解释(SHAP)相结合,能够揭示非线性模式和潜在的交互效应,而随机参数logit模型提供统计推断并解释未观察到的异质性。
然而,现有文献中仍存在几个重要的限制。首先,大多数混合研究依赖于单一的基于树的模型来识别重要变量和交互效应,使得发现结果对模型特定的结构和训练实现敏感,从而限制了基于SHAP的交互发现的稳健性。其次,尽管SHAP已被广泛用于探索交互效应,但这些效应通常通过可视化和定性解释进行检验,或者作为固定参数纳入离散选择模型中,对其潜在的异质性及其与未观察到的异质性的相互作用考虑不足。第三,即使对异质效应进行了建模,也很少有研究将这些由交互作用驱动的异质性转化为明确的、基于场景的受伤风险剖面,以支持系统层面的风险评估和以可靠性为导向的安全决策。
这些限制在中国等快速城市化的地区尤为重要。这些地区的新兴车辆技术、异质化的驾驶员群体和密集的交通环境可能会产生高度依赖于具体情境的伤害机制,这些机制无法仅通过平均或固定的交互效应来充分捕捉。
为了解决这些差距,本研究开发了一个以稳定性为导向的混合SHAP–RPLHM框架,使用来自中国深圳(2018-2020年)的警方报告的两车相撞数据来分析驾驶员的受伤结果。在识别主效应和交互候选项的阶段,该框架通过跨多个基于树的机器学习模型应用SHAP分析来强调跨模型的稳定性,包括极端梯度提升(XGBoost)、分类提升(CatBoost)、随机森林(RF)和Extra Trees(ET)。具体来说,只有在不同树结构中一致出现的效应才会被保留下来,用于后续的计量经济分析。然后,这些稳定的交互项被明确嵌入到具有均值异质性的随机参数logit模型(RPLHM)中,允许交互效应在驾驶员和车辆组之间系统地变化。最后,进行基于场景的概率模拟,将复杂的交互-异质性结构转化为量化的、与政策相关的受伤风险度量。
本研究的主要贡献有三点。
  • (1)
    该研究开发了一个以稳定性为导向的混合建模框架,将多树基于SHAP的分析与RPLHM相结合,使得能够比单一模型基于SHAP的方法更稳健地识别主效应和交互候选项。
  • (2)
    与之前依赖于基于SHAP的可视化或将交互项视为固定效应的混合研究不同,本研究在RPLHM中明确将关键交互效应建模为异质性的,提供了实证证据,表明在两车相撞的伤害严重性中,交互效应和未观察到的异质性是相互交织的,而不是独立的机制。
  • (3)
    通过基于场景的概率模拟,估计出的异质交互效应被转化为在不同碰撞配置和驾驶员-车辆组合下的可解释的受伤风险分布,提供了支持系统层面安全评估和设计有针对性干预措施的定量、与风险相关的见解。
本文的其余部分结构如下。第2节提供了关于两车相撞伤害严重性和考虑交互效应的事故伤害严重性分析的先前研究概述。第3节描述了警方记录的事故并展示了变量的汇总统计信息。第4节介绍了两车相撞中驾驶员伤害严重性的建模方法。第5节展示了模型估计和结果。第6节列出了建议的安全对策,第7节提出了未来研究的建议。

节选

两车相撞的伤害严重性

已经从不同角度对两车相撞的伤害严重性进行了大量研究,并在许多方面取得了实质性成果。先前的研究有效地说明了与两车相撞伤害严重性相关的各种安全相关因素。这些因素包括时间属性、碰撞相关元素、车辆特征、驾驶员人口统计信息以及环境和道路条件,如表1所示。

数据和描述

本研究使用的数据集包括2018年至2020年间在中国深圳发生的两车相撞事件。分析仅关注涉及四轮或更多轮子的两辆机动车的碰撞,而涉及摩托车、电动自行车、行人、三轮车、拖拉机以及单车和多车相撞的事件被排除在外。所有事故记录均遵循中国公安部的统一报告标准。

框架

采用了一种基于混合多树的SHAP分析和随机参数logit(RPL)的建模框架来研究两车相撞中的驾驶员伤害严重性机制。工作流程如图1所示,包括基于多树SHAP分析的特征发现阶段和计量经济推断阶段。

多树基于SHAP分析的规范和结果

本节介绍了多树基于SHAP分析阶段的结果,该阶段作为在计量经济建模之前识别稳健主效应和交互候选项的稳定性导向的筛选过程。其目的不仅是在严重类别不平衡的情况下实现满意的预测性能,还要确保后续的交互分析基于在模型结构和数据划分中稳定的效应。

推荐的安全对策

基于以稳定性为导向的混合SHAP–RPLHM框架建模结果,可以提出几种有针对性的安全对策来降低两车相撞中的驾驶员受伤风险。总体而言,研究结果表明,伤害严重性是由事故类型、碰撞角色、驾驶员责任、车辆特征和未观察到的异质性的综合效应所决定的,而不是由孤立因素决定的。因此,有效的安全策略应采用综合方法

结论

本研究通过开发一个以稳定性为导向的混合SHAP–RPLHM框架来研究两车相撞中的驾驶员伤害严重性,该框架结合了多树机器学习模型和SHAP解释及RPLHM。利用来自中国深圳的全面事故数据集,本研究旨在揭示影响伤害严重性的关键因素,以及这些因素之间的交互效应及其在不同驾驶员和车辆组中的异质性影响。

CRediT作者贡献声明

罗强:写作 – 审稿与编辑、可视化、方法论、正式分析。唐祖干:写作 – 审稿与编辑、初稿撰写、可视化、方法论、正式分析。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号