城市交通模式的可视化分析:基于蜂窝信号数据的TMSeer系统开发与应用

《Visual Informatics》:TMSeer: Visual analysis of city-level travel modes using cellular signaling data

【字体: 时间:2026年03月09日 来源:Visual Informatics 3.9

编辑推荐:

  本文为解决城市级居民多模式出行行为分析的难题,推荐研究人员开发的名为“TMSeer”的可视化分析系统。该系统基于大规模蜂窝信号数据(CSD),结合规则启发式与高斯混合模型(GMM)无监督识别出行模式,并通过增强桑基图、混合径向图等新颖可视化设计,支持对汽车、公交、骑行、步行四种模式的时空分布、区域流量及路径效率进行交互式探索。案例研究与专家访谈验证了该系统在城市交通规划与管理中的有效性与实用性。

  
随着经济与科技的快速发展,城市居民的出行选择日益多样化,但深入了解人群的具体出行行为,例如是开车、坐公交、骑行还是步行,对于城市规划、交通管理乃至商业决策都至关重要。传统的问卷调查耗时费力且信息粗略,出租车数据又无法覆盖步行、骑行等多种模式。幸运的是,随着手机的普及,被动采集的蜂窝信号数据(CSD)以其覆盖广、成本低的优势,为大规模分析居民出行模式提供了前所未有的机会。然而,挑战也随之而来:海量、稀疏且复杂的CSD数据难以直接探索;不同出行模式(如汽车、公交、骑行、步行)时空特性差异大,比较分析困难;更重要的是,从稀疏的基站定位数据中准确推断出行方式本身存在很大的不确定性。
为了应对这些挑战,中山大学的研究团队在《Visual Informatics》期刊上发表了他们的研究成果,提出了名为“TMSeer”的可视化分析系统。该系统旨在帮助领域专家探索CSD,并对城市级的多模式出行行为进行深入分析。研究人员首先设计了一套结合规则启发式(RBH)和高斯混合模型(GMM)的无监督方法,从CSD中推断出行模式,并利用GMM的概率输出来评估识别结果的不确定性。接着,他们设计了一系列新颖的可视化视图来实现对数据和出行模式的交互式、多层次探索:包括展示城市交通空间热力图的地图视图、基于时钟和方向隐喻的混合径向图来展示区域层面不同出行模式流量的区域视图,以及用于可视化区域间不同模式详细路径的路径视图。其中,增强的桑基图结合新颖的“波段”设计,可以直观展示路径上不同出行模式的构成与旅行效率。通过两个真实数据案例研究和专家访谈,验证了TMSeer在分析居民出行模式和城市流动性方面的有效性与可用性。
为开展此项研究,作者采用了几个关键技术方法。数据处理方面,对原始CSD进行清洗,并基于停留和移动状态提取出行片段(Trip)。在出行模式识别上,提出了一种结合规则启发式(基于3公里行程距离的初筛)和高斯混合模型(GMM)的无监督聚类方法,并利用信息熵量化识别结果的不确定性。为分析区域间路径,采用了基于K-means的基站位置聚合、基于历史轨迹特征概率和图遍历的轨迹插值算法,并构建行程图(TripGraph)进行路径重要性分析(如PageRank)。可视化系统则基于Vue.js和Flask框架开发,集成了热力图、混合径向图、增强桑基图等多种视图,并支持基于出行模式、时间和不确定性阈值的交互式过滤。
研究结果
1. 系统设计与实现
研究人员设计并实现了TMSeer系统,其流水线包括数据预处理、数据建模和可视化探索三个阶段。系统界面由控制面板、地图视图、区域视图和路径视图四个协调视图组成,支持对过滤后的出行数据进行多角度探索。
2. 数据与出行模式识别
研究使用了中国广东省佛山市的CSD(涉及244,928名用户)及公交线路数据。提出了一种基于行程距离、轨迹速度、接近公交线路程度等特征的RBH-GMM混合识别方法。该方法不依赖商业地图API,并能通过GMM的输出概率评估结果的不确定性。控制面板中的平行坐标图和不确定性分布直方图为用户提供了评估和筛选识别结果的线索。
3. 轨迹插值与路径分析
为补偿CSD轨迹的稀疏性,支持详细的路径探索,研究提出了一种基于图的轨迹插值方法。该方法对基站进行聚类,并基于历史轨迹的运动特征(如耗时、流量、起讫点)构建概率模型,通过搜索最可能路径来插值。基于插值结果构建行程图(TripGraph),可运用PageRank算法发现路径中的重要或异常路段。
4. 可视化与交互探索
TMSeer通过四个核心视图支持探索:控制面板用于按模式、时间、不确定性筛选行程;地图视图通过热力图和流量线展示城市级交通的时空概览;区域视图通过混合径向图展示焦点区域在不同时间、不同方向上的进出流量及模式构成;路径视图则通过增强的桑基图及其波段设计,直观比较不同出行模式在选定区域间路径上的流量分布、旅行时间和效率差异。
5. 案例评估
研究通过两个案例展示了TMSeer的实用性。案例一聚焦于识别早晚高峰时段通勤出行的主要模式及其时空模式,发现了公交和私家车在不同时段的优势区域。案例二深入分析了两个特定区域间的连接路径,通过路径视图比较了不同出行模式(尤其是公交与私家车)的旅行效率,识别出了可能存在拥堵或效率低下的路段。专家访谈结果表明,TMSeer能有效支持对多模式出行的时空模式分析、不确定性评估和路径效率比较,对城市规划和管理具有实际价值。
研究结论与意义
本研究成功开发了TMSeer这一针对蜂窝信号数据的可视化分析系统,为城市级多模式出行行为分析提供了有效的解决方案。其主要贡献在于:第一,提出了一个结合RBH和GMM的无监督出行模式识别框架,并能量化结果的不确定性;第二,设计并实现了包含地图视图、混合径向图区域视图和增强桑基图路径视图的协调可视化系统,支持对大规模、多维度CSD数据的交互式探索;第三,通过真实数据案例和专家访谈,验证了系统在帮助理解城市交通模式、比较不同出行方式效率、以及支持交通规划决策方面的能力和价值。
这项研究的意义在于,它架起了海量、稀疏的移动通信数据与城市交通精细化分析需求之间的桥梁。通过将先进的机器学习方法与直观的可视化分析相结合,TMSeer使得领域专家能够介入分析循环,利用其专业知识对自动算法产生的结果进行校验、探索和深度挖掘,从而在出行模式识别存在固有不确定性的情况下,仍能获得可靠、深入的洞察。该工作为利用被动移动数据支持智慧城市交通规划、管理及政策制定提供了一个有力的工具范例,推动了数据驱动的城市计算与可视化分析的融合。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号