编辑推荐:
交通拥堵预测模型需解决回归模型的保守偏见及分类模型的输入自相关问题,STG-LAL框架通过统计特征和可解释架构(VSN、LAL)实现高效分类,并集成在线学习机制应对概念漂移,PeMS04/08实验验证其优越性。
Jingwei Zhao|Fumin Zou|Qiqin Cai|Shukun Lai|Yongyu Luo
福建工业大学汽车电子与电动驱动重点实验室,中国福建省福州市350118
摘要
现有的回归模型优化了全局损失,因此倾向于拟合主导的自由流状态,这在统计上抑制了对罕见拥堵状态的预测。同时,依赖于历史速度序列的分类模型存在高输入自相关性,导致预测惯性以及突发状态转换的检测延迟。为了解决这些挑战,我们提出了STG-LAL,这是一个基于特征的在线分类框架。通过排除原始速度输入,STG-LAL使用聚合的统计特征,通过一个可解释的架构直接映射拥堵状态,该架构结合了变量选择网络(VSN)和可学习激活层(LAL)。此外,还集成了一种增量在线学习机制以适应概念漂移。在基准数据集(PeMS04和PeMS08)上的广泛实验表明,STG-LAL在平衡的分类性能和鲁棒性方面显著优于现有最佳技术(SOTA)。
引言
准确的交通拥堵预测对于在快速城市化背景下优化智能交通系统(ITS)至关重要[1]。早期识别拥堵演变有助于有效的信号控制和运营效率。尽管时空图神经网络(STGNN)通过捕获道路网络拓扑和时间序列依赖性来改进交通建模[2]、[3],但大多数先前的工作将交通预测视为一个回归问题(例如,预测速度或流量)。当应用于拥堵决策时,这些方法面临固有的结构挑战。
首先,交通数据遵循长尾分布,其中拥堵现象较为稀少[4]。最小化全局误差(例如MAE/RMSE)的现有最佳技术回归模型[5]倾向于回归到平均值(自由流状态)。这种“保守偏差”在长期预测中虽然精度高,但对关键拥堵事件的召回率却很低。在安全关键的操作中,漏检拥堵往往比误报更加昂贵。
其次,尽管存在一些分类模型[6],但它们通常依赖于历史速度序列。这导致了两个问题:(1)“天真预测”陷阱:速度序列中的高自相关性使模型重复之前的状态,从而失去对动态变化的敏感性。(2)特征误导:在突然发生拥堵时,历史速度数据变成了噪声,而不是有效的信号,延迟了模型对情况急剧恶化的响应[7]。
实际应用面临传感器故障、数据包丢失和信号噪声等不确定性。现有模型往往过度拟合完整的时空背景;在数据退化情况下,它们可能退化为预测主导的自由流类别。此外,交通系统表现出非平稳性,事故或天气引起的概念漂移会降低静态模型的性能[8]、[9]。另外,STGNN的“黑箱”特性缺乏制定可信政策所需的可解释性[10]。
为了解决这些限制,本文提出了STG-LAL,这是一个基于特征的在线分类框架。我们假设排除历史速度序列可以减少惯性。通过使用统计流量/占用特征和成本敏感的训练,模型可以更好地处理长尾拥堵类别。STG-LAL采用轻量级架构支持高效的在线学习,确保适应概念漂移。
主要贡献总结如下:
•基于特征的范式和鲁棒性:
我们验证了排除历史速度的范式。实验表明,在压力测试(例如80%的特征缺失)下,依赖统计特征显著提高了噪声鲁棒性和分类平衡(F1分数)。 •平衡的分类性能:
在不平衡的交通数据集上使用成本敏感的学习,STG-LAL克服了回归模型的统计偏差,在关键少数类拥堵类别上实现了更优的性能。•在线适应性:
实现了增量学习框架。STG-LAL的轻量级架构能够高效更新,以对抗概念漂移,确保在动态环境中的长期可行性。•可解释的架构:
设计结合了变量选择网络(VSN)、可学习激活层(LAL)和门控残差网络(GRN),通过内置的门控和注意力机制提供决策透明度。本文的其余部分组织如下。第2节回顾了时空图神经网络和交通状态分类的相关工作。第3节正式定义了交通拥堵预测问题。第4节详细介绍了提出的STG-LAL框架及其核心组件。第5节介绍了实验设置、比较结果和鲁棒性分析。最后,第6节总结了本文并概述了未来的研究方向。
部分摘录
时空图神经网络
近年来,时空预测受到了广泛关注。综合评论系统地总结了从传统统计方法到先进深度学习框架的演变,涵盖了向自动机器学习(AutoML)的过渡以及图神经网络中的新兴趋势[11]、[12]、[13]。
结合图神经网络(GNNs)[14]来处理空间依赖性,并使用序列模型处理时间依赖性,STGNNs已成为主流方法
问题定义
本研究将交通拥堵预测问题形式化为一个基于多源异构特征的多类分类任务。给定一个图
对于观测窗口内包含时间步长t的任何节点vi?∈?V,有一组聚合的观测特征向量X(i)
STG-LAL架构
为了解决在排除历史速度序列输入的约束下进行交通拥堵状态分类的挑战,本文提出了一个端到端的深度学习框架STG-LAL。如图1所示,STG-LAL通过多阶段架构融合了异构特征(流量、占用率、静态属性和图结构)。核心工作流程遵循“独立特征表示 → 自适应特征选择 → 深度学习”的设计理念
数据描述和预处理
为了全面评估所提出的模型,我们使用了来自Caltrans性能测量系统(PeMS)的两个广泛采用的公共交通数据集:PeMS04和PeMS08。
选择这两个数据集是有策略的:PeMS04(旧金山湾区)代表一个复杂、高度连接的城市网格,拥堵频繁;而PeMS08(圣贝纳迪诺)则捕捉到具有不同流量动态的郊区拓扑。这种多样性确保了评估涵盖了不同的空间
结论
为了解决现有模型在长尾分布和非理想环境下的保守预测偏差和结构脆弱性问题,我们提出了STG-LAL,这是一个基于特征的在线时空图分类框架。与基于回归的方法不同,STG-LAL直接将鲁棒的统计特征映射到离散的拥堵状态。通过集成变量选择网络(VSN)、可学习激活层(LAL)和解耦的图结构学习,它实现了
CRediT作者贡献声明
Jingwei Zhao:写作 – 审稿与编辑,撰写原始草稿,可视化,验证,监督,数据管理,概念化。Fumin Zou:项目管理,资金获取,正式分析。Qiqin Cai:写作 – 审稿与编辑,监督,正式分析。Shukun Lai:调查,资金获取,正式分析。Yongyu Luo:项目管理,调查,资金获取。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。