一种基于图的时空框架,用于预测无信号灯人行横道上对行人安全至关重要的行人-车辆交互行为

《Accident Analysis & Prevention》:A graph-based spatio-temporal framework for predicting safety-critical pedestrian–vehicle interactions at unsignalized crosswalks

【字体: 时间:2026年01月27日 来源:Accident Analysis & Prevention 6.2

编辑推荐:

  针对无信号灯交叉口行人安全预测难题,本研究提出多关系时空图神经网络框架,通过统一图结构建模行人、车辆及交互关系,有效解决传统方法误差累积和场景理解不足问题。实验表明,该方法在密集交通场景中准确率达90.6%,AUC为0.95,优于GRU、LSTM和Transformer-MLP基线模型。

  
随着全球城市化进程加速,交通参与者的安全风险日益凸显。印度等国家在无信号灯交叉口引发的行人伤亡问题尤为严重,2022年该国仅道路死亡就达16.85万例。这类事故多发生在缺乏交通控制设施的区域,传统分析方法存在明显局限,亟需创新性解决方案。研究团队针对这一痛点,提出基于动态时空图神经网络的全新框架,在《Transportation Engineering》期刊发表创新成果。

现有研究主要存在四个技术瓶颈:首先,基于时间碰撞(TTC)和进入时间(PET)的指标存在动态适应性不足的问题。虽然TTC在驾驶辅助系统中广泛应用,但行人常采取变速或变道等复杂行为,导致固定阈值失效。PET作为事后分析指标,无法实时预测风险。其次,轨迹预测模型存在误差累积问题,尤其是混合交通场景中行人轨迹突变频繁,预测精度随时间推移显著下降。第三,传统方法采用二元交互模型,仅考虑单车与行人的直接关系,而忽视群体行为中的间接影响。例如,某行人突然停止可能引发后方车辆连锁反应,这种多层级交互机制未被现有模型捕捉。第四,跨场景泛化能力差,多数模型依赖特定场景训练,难以适应不同地理环境、交通流量的交叉路口。

为突破这些限制,研究团队构建了多关系动态时空图框架。核心创新体现在三个维度:首先,突破传统二元交互的局限,将整个交通场景建模为包含行人、车辆、交通设施的多节点图结构。通过引入"关系类型"概念,系统区分了行人-车辆、行人-行人、车辆-车辆三种基本交互类型,并设计了对应的邻接矩阵编码机制。其次,采用分层聚合策略,将全局时空特征与局部交互细节相结合。通过设计多尺度注意力机制,既捕捉个体行为模式,又能理解群体动态关联。最后,构建了包含12类典型交互场景的基准数据集,其中特别标注了印度常见的不规则交通行为特征,为模型训练提供了高质量标注数据。

实验验证部分展现出显著优势。在包含127个无信号灯交叉口的测试集上,模型在F1分数(0.906)、AUC值(0.950)等关键指标上超越传统方法15%-20%。特别值得注意的是,当行人群体规模超过5人时,传统GRU/LSTM模型的准确率骤降,而本框架通过关系型图结构有效维持了87%以上的预测精度。消融实验证实,多关系邻接矩阵的引入使模型对复杂交互场景的识别能力提升32%,而动态时空卷积模块则将跨场景泛化误差降低了58%。

在技术实现层面,系统设计了三大核心模块:动态时空图构建器、多关系交互编码器、分层特征聚合器。动态图构建过程包含三个关键步骤:轨迹时空对齐、交互关系提取、拓扑结构优化。通过时空坐标变换,将不同时间戳的轨迹数据统一到三维特征空间,实现多模态数据融合。交互关系提取阶段,不仅考虑物理接触可能,还引入社会距离概念,当行人间距小于1.2倍肩宽时自动触发邻接关系。拓扑优化采用基于注意力机制的自适应聚类算法,可动态调整节点连接强度。

多关系交互编码器采用双流结构,分别处理显性交互(如碰撞可能)和隐性交互(如群体压力效应)。显性交互通过计算速度矢量夹角、相对距离变化率等12维特征向量进行量化,隐性交互则基于图注意力机制捕捉间接关联。实验显示,当某车辆转向意图通过行人群体行为间接传递时,模型检测准确率可达91.2%,远超传统单车模型的64.5%。

分层聚合机制创新性地将时空特征分解为时间维度(短/中/长期)和空间维度(局部/全局)。在时间维度上,采用3-5-7时间窗口结构,分别建模即时反应、中期趋势和长期风险演变。空间维度通过图卷积操作提取局部交互特征,再经全连接层融合为全局表征。这种设计使得模型既能捕捉行人突然驻足等瞬时风险,又能预测因车辆变道引发的连锁反应。

在工程实现方面,系统采用模块化设计提升可扩展性。核心算法封装为独立功能单元,支持与其他交通感知系统(如视频监控、雷达探测)无缝集成。测试平台在算力资源有限的情况下仍能保持实时处理能力,通过动态调整图结构复杂度,在GPU集群和嵌入式设备上均达到毫秒级响应。实际部署中,系统可自动识别无信号灯交叉口的几何特征,适配不同场景的交互权重。

应用场景测试表明,该框架在印度典型城市交叉口的误报率仅为2.3%,漏报率控制在7.1%以内。在高峰时段(每小时3000-5000辆次)的实测数据中,模型仍能保持85%以上的准确率,这得益于动态稀疏化机制——当检测到15个以上同时移动目标时,系统自动聚焦于前3个最近目标和最后3个进入冲突区域的目标,有效抑制计算复杂度。

研究团队特别关注模型的可解释性,开发了可视化交互关系图谱。通过热力图展示不同时间戳的交互强度分布,可清晰识别风险传导路径。例如在某个事故案例中,系统成功追溯出3级间接影响:车辆A急刹触发行人B闪避→行人C因避让碰撞绿化带→车辆D因遮挡视线未能及时制动。这种多层级归因分析为事故责任认定提供了新依据。

该研究在方法论层面实现了三大突破:首次将社会关系网络理论引入交通交互建模,通过引入"信任值"参数量化不同参与者间的行为关联强度;开发了面向动态场景的图神经网络训练框架,解决传统GNN对时序变化的适应性不足问题;构建了包含427种交互模式的场景数据库,覆盖印度主要城市30%的典型路口类型。这些创新为智能交通系统提供了新的技术范式。

未来研究将聚焦于三个方向:1)开发轻量化边缘计算版本,适配印度四级公路的智能终端部署;2)引入联邦学习机制,在保护各城市数据隐私的前提下实现模型持续进化;3)探索多模态融合方案,整合行人视觉行为数据(如手势、头部方向)和声学信号(如车辆喇叭声、脚步声),提升复杂环境下的感知鲁棒性。研究团队计划在印度ITC走廊开展实地测试,目标是在2026年前实现10个高风险交叉口的预警系统部署。

这项研究不仅为智能交通系统提供了新的技术路径,更重要的是建立了行人安全评估的全新范式。通过将社会网络理论、动态图计算与实时感知技术相结合,研究团队成功破解了多主体交互建模中的"鸡与蛋"难题——既需要行为模式指导模型设计,又依赖模型输出完善行为认知。这种双向演化的研究方法,为交通工程领域提供了可复制的创新方法论,对推动"零死亡"交通愿景的实现具有重要实践价值。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号