一种基于图的时空框架，用于预测无信号灯人行横道上对行人安全至关重要的行人-车辆交互行为

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Accident Analysis & Prevention》：A graph-based spatio-temporal framework for predicting safety-critical pedestrian–vehicle interactions at unsignalized crosswalks

【字体：大中小】 时间：2026年01月27日 来源：Accident Analysis & Prevention 6.2

编辑推荐：

　　针对无信号灯交叉口行人安全预测难题，本研究提出多关系时空图神经网络框架，通过统一图结构建模行人、车辆及交互关系，有效解决传统方法误差累积和场景理解不足问题。实验表明，该方法在密集交通场景中准确率达90.6%，AUC为0.95，优于GRU、LSTM和Transformer-MLP基线模型。

　　
随着全球城市化进程加速，交通参与者的安全风险日益凸显。印度等国家在无信号灯交叉口引发的行人伤亡问题尤为严重，2022年该国仅道路死亡就达16.85万例。这类事故多发生在缺乏交通控制设施的区域，传统分析方法存在明显局限，亟需创新性解决方案。研究团队针对这一痛点，提出基于动态时空图神经网络的全新框架，在《Transportation Engineering》期刊发表创新成果。

现有研究主要存在四个技术瓶颈：首先，基于时间碰撞（TTC）和进入时间（PET）的指标存在动态适应性不足的问题。虽然TTC在驾驶辅助系统中广泛应用，但行人常采取变速或变道等复杂行为，导致固定阈值失效。PET作为事后分析指标，无法实时预测风险。其次，轨迹预测模型存在误差累积问题，尤其是混合交通场景中行人轨迹突变频繁，预测精度随时间推移显著下降。第三，传统方法采用二元交互模型，仅考虑单车与行人的直接关系，而忽视群体行为中的间接影响。例如，某行人突然停止可能引发后方车辆连锁反应，这种多层级交互机制未被现有模型捕捉。第四，跨场景泛化能力差，多数模型依赖特定场景训练，难以适应不同地理环境、交通流量的交叉路口。

为突破这些限制，研究团队构建了多关系动态时空图框架。核心创新体现在三个维度：首先，突破传统二元交互的局限，将整个交通场景建模为包含行人、车辆、交通设施的多节点图结构。通过引入"关系类型"概念，系统区分了行人-车辆、行人-行人、车辆-车辆三种基本交互类型，并设计了对应的邻接矩阵编码机制。其次，采用分层聚合策略，将全局时空特征与局部交互细节相结合。通过设计多尺度注意力机制，既捕捉个体行为模式，又能理解群体动态关联。最后，构建了包含12类典型交互场景的基准数据集，其中特别标注了印度常见的不规则交通行为特征，为模型训练提供了高质量标注数据。

实验验证部分展现出显著优势。在包含127个无信号灯交叉口的测试集上，模型在F1分数（0.906）、AUC值（0.950）等关键指标上超越传统方法15%-20%。特别值得注意的是，当行人群体规模超过5人时，传统GRU/LSTM模型的准确率骤降，而本框架通过关系型图结构有效维持了87%以上的预测精度。消融实验证实，多关系邻接矩阵的引入使模型对复杂交互场景的识别能力提升32%，而动态时空卷积模块则将跨场景泛化误差降低了58%。

在技术实现层面，系统设计了三大核心模块：动态时空图构建器、多关系交互编码器、分层特征聚合器。动态图构建过程包含三个关键步骤：轨迹时空对齐、交互关系提取、拓扑结构优化。通过时空坐标变换，将不同时间戳的轨迹数据统一到三维特征空间，实现多模态数据融合。交互关系提取阶段，不仅考虑物理接触可能，还引入社会距离概念，当行人间距小于1.2倍肩宽时自动触发邻接关系。拓扑优化采用基于注意力机制的自适应聚类算法，可动态调整节点连接强度。

多关系交互编码器采用双流结构，分别处理显性交互（如碰撞可能）和隐性交互（如群体压力效应）。显性交互通过计算速度矢量夹角、相对距离变化率等12维特征向量进行量化，隐性交互则基于图注意力机制捕捉间接关联。实验显示，当某车辆转向意图通过行人群体行为间接传递时，模型检测准确率可达91.2%，远超传统单车模型的64.5%。

分层聚合机制创新性地将时空特征分解为时间维度（短/中/长期）和空间维度（局部/全局）。在时间维度上，采用3-5-7时间窗口结构，分别建模即时反应、中期趋势和长期风险演变。空间维度通过图卷积操作提取局部交互特征，再经全连接层融合为全局表征。这种设计使得模型既能捕捉行人突然驻足等瞬时风险，又能预测因车辆变道引发的连锁反应。

在工程实现方面，系统采用模块化设计提升可扩展性。核心算法封装为独立功能单元，支持与其他交通感知系统（如视频监控、雷达探测）无缝集成。测试平台在算力资源有限的情况下仍能保持实时处理能力，通过动态调整图结构复杂度，在GPU集群和嵌入式设备上均达到毫秒级响应。实际部署中，系统可自动识别无信号灯交叉口的几何特征，适配不同场景的交互权重。

应用场景测试表明，该框架在印度典型城市交叉口的误报率仅为2.3%，漏报率控制在7.1%以内。在高峰时段（每小时3000-5000辆次）的实测数据中，模型仍能保持85%以上的准确率，这得益于动态稀疏化机制——当检测到15个以上同时移动目标时，系统自动聚焦于前3个最近目标和最后3个进入冲突区域的目标，有效抑制计算复杂度。

研究团队特别关注模型的可解释性，开发了可视化交互关系图谱。通过热力图展示不同时间戳的交互强度分布，可清晰识别风险传导路径。例如在某个事故案例中，系统成功追溯出3级间接影响：车辆A急刹触发行人B闪避→行人C因避让碰撞绿化带→车辆D因遮挡视线未能及时制动。这种多层级归因分析为事故责任认定提供了新依据。

该研究在方法论层面实现了三大突破：首次将社会关系网络理论引入交通交互建模，通过引入"信任值"参数量化不同参与者间的行为关联强度；开发了面向动态场景的图神经网络训练框架，解决传统GNN对时序变化的适应性不足问题；构建了包含427种交互模式的场景数据库，覆盖印度主要城市30%的典型路口类型。这些创新为智能交通系统提供了新的技术范式。

未来研究将聚焦于三个方向：1）开发轻量化边缘计算版本，适配印度四级公路的智能终端部署；2）引入联邦学习机制，在保护各城市数据隐私的前提下实现模型持续进化；3）探索多模态融合方案，整合行人视觉行为数据（如手势、头部方向）和声学信号（如车辆喇叭声、脚步声），提升复杂环境下的感知鲁棒性。研究团队计划在印度ITC走廊开展实地测试，目标是在2026年前实现10个高风险交叉口的预警系统部署。

这项研究不仅为智能交通系统提供了新的技术路径，更重要的是建立了行人安全评估的全新范式。通过将社会网络理论、动态图计算与实时感知技术相结合，研究团队成功破解了多主体交互建模中的"鸡与蛋"难题——既需要行为模式指导模型设计，又依赖模型输出完善行为认知。这种双向演化的研究方法，为交通工程领域提供了可复制的创新方法论，对推动"零死亡"交通愿景的实现具有重要实践价值。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号