利用结构化补丁学习突破多层感知器的局限,用于交通流量预测

《Engineering Applications of Artificial Intelligence》:Breaking multilayer perceptron limitations for traffic flow forecasting with structured patch learning

【字体: 时间:2026年03月04日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  时空预测模型SPMLP通过分层时间片建模和图结构MLP模块,有效解决传统MLP在时空特征融合中的局限性,提升预测精度与计算效率。

  
孙伟|王功|高俊波|王春宇|张志豪
上海海事大学信息工程学院,上海,201306,中国

摘要

Transformer神经网络和多层感知器(MLP)架构是多变量时空序列建模中的两种主导范式。虽然Transformer在捕捉复杂依赖关系方面表现出色,但其注意力机制会导致较高的计算成本,限制了实际应用。MLP方法在结构上简单且推理效率高,但现有方法通常依赖于扁平化的建模过程,难以捕捉交通数据中的层次化时间模式。此外,空间和时间组件之间缺乏结构解耦,常常导致表示相互纠缠,降低了整体建模效果。为了解决这些问题,我们提出了一种结构化的纯MLP模型,称为结构化补丁多层感知器(SPMLP),用于交通流量预测。该模型采用具有重叠滑动窗口的时间补丁多层感知器从局部到全局尺度提取层次化时间特征,并使用图结构多层感知器捕捉预定义空间图上的节点依赖关系。轻量级线性融合将空间和时间表示整合到统一的时空背景下。在标准交通流量基准测试中的广泛实验表明,SPMLP在预测准确性和计算效率方面均优于强大的基线模型,突显了结构化多层感知器架构在智能交通系统中进行实时交通预测的实用性。

引言

准确的交通预测在提高城市流动性、缓解拥堵和优化交通基础设施方面发挥着关键作用,从而有助于提升城市整体生活质量和经济活力(Wen等人,2017年)。实时预测使得自适应交通信号控制(Vlahogianni等人,2014年)、动态路线规划(Yuan等人,2011年)和拥堵定价等智能应用成为可能,这些对于智慧城市的运行至关重要。
深度学习的最新进展显著改善了对交通数据中复杂时空依赖关系的建模,促进了更准确和可扩展的预测框架的发展。在时间领域,传统的统计模型(如自回归(AR)和向量自回归(VAR)(Chen等人,2001年)逐渐被神经网络方法取代。循环架构,包括长短期记忆(LSTM)(Hochreiter和Schmidhuber,1997年)和门控循环单元(GRU)(Cho等人,2014年),被广泛用于捕捉时间动态。最近,Transformer神经网络模型(Sun等人,2023年;Jin等人,2023年;Chen等人,2025年)在学习长距离时间依赖关系方面表现出色。然而,它们的自注意力机制引入了大量的计算开销,限制了在大规模交通预测任务中的可扩展性。
在空间方面,图神经网络(GNN)已成为建模道路网络拓扑的事实标准。诸如自适应图卷积(Bai等人,2020年;Xue等人,2025年)、动态图卷积(Li等人,2023年;Xiao等人,2024年)和分层注意力GNN(Zheng等人,2020年;Geng等人,2024年;Tang等人,2025年)等变体在学习空间相关性方面显示出强大的能力。然而,它们的复杂性不断增加,导致在高密度和大规模图上的内存和计算成本上升,此时边际性能提升趋于减弱。
这些限制促使人们关注强调架构简单性和推理效率的轻量级预测方法。线性模型和多层感知器(MLP)模型作为有前景的替代方案出现,提供了具有竞争力的性能,同时大幅减少了资源需求。例如,STID(Shao等人,2022a)采用周期性时间嵌入与MLP预测器结合形成轻量级基线,而DLinear(Zeng等人,2023年)通过显式分解时间趋势展示了在分布变化下的鲁棒性。在空间领域,使用多层感知器构建的简化图建模策略(Hu等人,2021年)减少了了对重型消息传递的依赖,提高了大规模网络的可扩展性。
尽管计算效率高,现有的MLP时空模型仍面临两个根本挑战。首先,大多数方法采用扁平化建模流程,难以捕捉交通数据中的多层次时间动态,限制了它们表示局部模式和长期趋势的能力。其次,时间和空间特征通常被联合编码,没有明确的结构解耦,使得模型难以独立学习时间演化和空间拓扑的异构特征和相互作用。
为了解决这些挑战,我们提出了一种完全基于多层感知器的时空预测框架,称为结构化补丁多层感知器(SPMLP)。与之前的扁平MLP架构不同,SPMLP引入了具有重叠滑动窗口的分层时间补丁建模和平滑一致性对齐,有效学习了连续和多尺度的时间动态。同时,空间和时间模块被视为结构上解耦的组件,允许独立且高效地建模异构模式。具体来说,SPMLP采用时间补丁多层感知器模块提取层次化时间表示,以及图结构多层感知器模块来建模预定义空间图上的节点依赖关系。最后,采用轻量级线性融合模块将时空表示整合在一起,而不会引入额外的建模复杂性。我们的主要贡献总结如下:
  • 我们设计了一个模块化的时间补丁多层感知器模块,将时间嵌入划分为重叠的滑动窗口,并使用分层MLP层进行处理,从而实现从局部到全局尺度的多层次时间动态建模。进一步引入了平滑一致性正则化损失,以增强时间连续性和鲁棒性。
  • 我们使用统一的MLP框架构建了一个空间多层感知器模块,用于编码预定义的图结构,简化了空间建模,同时保持了表示效果和可扩展性。
  • 我们设计了一个轻量级线性时空融合模块,能够在避免耦合引起的复杂性的同时,高效整合时间和空间特征。
  • 我们开发了SPMLP,这是一个结构透明且完全基于MLP的预测模型。在四个基准交通数据集上的广泛实验表明,它在准确性、可扩展性和可解释性方面具有良好的平衡,突显了结构化MLP架构在时空预测中的潜力。

章节片段

时间序列预测

时间序列预测方法逐渐从传统的线性统计模型发展到深度学习方法。早期模型主要依赖于捕捉多变量序列之间的线性关系,具有良好的可解释性和低训练成本,但其线性假设限制了它们有效描述复杂非线性动态的能力,尤其是在长期预测任务中。
随着建模需求的增加,研究人员逐渐转向更

初步介绍和问题定义

交通预测旨在根据从部署在交通网络中的N个传感器节点收集的历史多变量时间序列数据来估计未来的交通状况。道路网络被正式建模为一个有向图G=(V, E, A< />,其中V={v1, v2, , vN}表示节点集,每个节点代表一个传感器位置或道路段。E表示表示节点之间物理连接的有向边集。邻接矩阵ARN×N编码了空间邻近性

整体架构

为了以高效和可解释的方式捕捉结构化时间动态和空间相关性,我们提出了一种轻量级预测架构,称为结构化补丁多层感知器(SPMLP)。该模型旨在平衡表示能力和结构简洁性。图1展示了所提出框架的整体架构。
步骤1:我们首先从原始交通时间序列中提取时间嵌入,并将其分割成

数据集

实验在四个公开可用的数据集上进行,每个数据集包含数以万计的时间序列记录和数百个传感器节点:PEMS03、PEMS04、PEMS07和PEMS08。这些数据集是交通预测领域广泛使用的公共基准(Song等人,2020年),分别对应加州的四个不同区域。所有四个数据集的时间间隔为5分钟,每小时产生12个时间帧。所有数据均来自加州性能测量系统(PeMS)(

可视化

为了全面评估所提出的SPMLP模型的性能,我们对预测的交通流量与真实值进行了详细的视觉比较。基于PEMS08数据集,我们选择了2016年8月26日至27日的代表性时期,并分析了位于不同功能区域的两个传感器,传感器18和传感器102。如图9所示,这两个传感器展示了显著不同的交通模式。传感器18显示出平滑且周期性的流量动态,这可能

结论

本文提出了一个基于结构化补丁多层感知器的统一时空交通预测框架,旨在在模型简洁性、计算效率和建模效果之间实现良好的平衡。通过引入重叠的时间补丁分割和平滑一致性正则化机制,所提出的方法增强了时间特征提取的连续性和鲁棒性。在空间方面,该框架利用了

CRediT作者贡献声明

孙伟:撰写——审稿与编辑,项目管理,概念化。王功:撰写——初稿,可视化。高俊波:撰写——审稿与编辑。王春宇:验证。张志豪:验证。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号