受物种形成关系启发的自适应节点聚合与稀疏移动群体感知中的数据推理
《Knowledge-Based Systems》:Speciation Relations-inspired Adaptive Node Aggregation and Data Reasoning in Sparse Mobile Crowdsensing
【字体:
大
中
小
】
时间:2026年01月13日
来源:Knowledge-Based Systems 7.6
编辑推荐:
基于生物物种分化关系的图卷积神经网络在稀疏移动众包感知中有效整合时空关联并降低计算复杂度,实验证明其精度显著优于传统方法。
贾刘|王健|赵国生|何冠志
哈尔滨工业大学计算机科学与技术学院,中国哈尔滨 150080
摘要
作为高效的数据收集范式,稀疏移动众包可以利用有限的感知数据来重建完整的时空信息,在智能城市的环境监测和资源优化中具有重要的应用价值。然而,传统方法在数据补全任务中存在明显的局限性。由于未能充分挖掘复杂的数据关系,这些方法难以从稀疏数据中有效重建完整的时空信息,而处理大规模稀疏感知数据的高计算复杂性导致效率低下。为了解决这个问题,本文提出了一种受生物物种形成关系启发的图卷积神经网络(Bio-GCN)用于稀疏感知图的补全。首先,通过模拟生态物种形成机制,将感知数据的时间、空间和非时空相关性建模为三种类型的关系:同域、邻域和异域,并构建稀疏单元图以捕获复杂的时空特征。其次,设计了一种自适应节点聚合机制,根据这三种关系动态聚合稀疏单元图的节点,从而通过减少节点数量来降低计算复杂性。最后,将自适应节点聚合模块集成到图卷积神经网络架构中,实现了稀疏单元图的高效补全。实验结果表明,Bio-GCN在Leuvenair和Indian Cities AQI数据集上的平均绝对误差、平均相对误差和均方根误差显著优于基线方法,证明了其在稀疏数据补全方面的优越性。此外,自适应节点聚合机制显著提高了计算效率,为大规模稀疏感知任务提供了实用的解决方案。
引言
近年来,5G、物联网(IoT)和人工智能(AI)等技术的快速发展显著提高了城市生活的便利性,但也迫切需要高质量的数据。移动众包(MCS)[1]通过整合智能设备的传感器技术和人类的积极参与,成为智能城市中一种有前景的数据收集范式,能够高效地收集和处理数据。然而,由于感知任务规模庞大、持续时间长且覆盖范围广[2],实时招募足够多的用户来覆盖整个地图变得不切实际。稀疏移动众包(SMCS)[3]创新性地提出了“由稀疏数据驱动的全球感知”这一核心理念,通过时空推理算法从少数关键用户收集的碎片化数据中重建完整的城市感知图,这不仅显著减轻了用户和设备的负担,还降低了数据收集的时间和成本。尽管SMCS在城市感知方面展现出巨大潜力,但不均匀的数据分布、复杂的时空相关性和推理噪声干扰等挑战仍然限制了数据推理质量的提升。
人类通过分析实体之间的多维关联来进行知识推理,以推断缺失的信息,这一过程是模拟思维的基本形式之一[4]。受这种认知机制的启发,通过图嵌入技术将感知单元转换为图结构,可以有效地捕获感知数据之间的复杂关联,并利用图结构的优势高效推断缺失的感知数据,从而提高数据补全的准确性和效率。物种形成[5]是自然选择的重要机制,可分为同域、邻域和异域物种形成,描述了不同空间和时间尺度上的物种进化关系。在任何给定的环境中,一个物种总是与其他具有相似特征的物种共同进化[6]。同样,感知数据与时间、空间和环境因素之间存在强相关性。同一位置相邻时间点的数据通常高度相关,且空间上越接近的区域,感知数据越相似,它们也与区域特征密切相关。例如,在城市空气质量数据中,同一区域内相邻时间点的数据具有连续性,而市中心和郊区的数据差异显著,但相邻郊区的数据分布相似。受物种形成关系的启发,SMCS中的每个感知单元被视为一个生物群体,感知单元之间的时间相关性、空间相关性和非时空相关性分别被建模为同域、邻域和异域关系,如图1所示。这种基于物种形成关系的建模通过模拟自然选择中的物种形成机制,实现了感知数据时空相关性的有效建模,从而优化了数据收集、分析和预测的准确性,为智能城市和物联网应用提供了重要的技术支持。
图神经网络(GNN)[7]是一种专门用于处理图结构数据的深度学习模型,近年来在复杂时空数据建模领域显示出显著优势,其中图卷积神经网络(GCN)[8]可以通过高效的信息聚合机制有效捕获节点之间的复杂关系,结合图的拓扑结构和节点特征,从而实现稀疏数据的高效推理和补全。为了解决SMCS的挑战并提高时空数据推理的效率,我们提出了一种受生物物种形成启发的图卷积神经网络方法(Bio-GCN)。该方法在构建感知单元图时考虑了感知单元之间的同域、邻域和异域关系,以更有效地捕获复杂的时空相关性。此外,Bio-GCN在GCN中加入了自适应节点聚合机制,包括同域、邻域和异域节点聚合,通过动态调整聚合权重显著降低了计算工作量并提高了计算效率。本研究的主要贡献如下:
(1)提出了一种基于GCN的端到端时空数据推理框架。通过将离散的感知单元嵌入图结构中,构建了一个结构化且可学习的推理框架,突破了传统基于规则的插值的局限性,为建模复杂时空数据提供了新思路,并显著提高了推理的灵活性和准确性。
(2)设计了一种基于物种形成的感知单元关系建模创新方法。通过协同建模同域(时间相关性)、邻域(空间相关性)和异域(非时空相关性)关系,克服了传统时空最近邻建模的局限性,全面揭示了感知数据的复杂关联结构。
(3)开发了一种动态自适应节点聚合模块。通过有机整合同域、邻域和异域聚合三种策略,实现了多维信息的协同处理,有效平衡了推理准确性和计算效率,同时保持了模型的轻量级,使模型能够高效处理大规模稀疏感知数据。
相关工作
MCS的数据获取通常面临感知资源有限的挑战,这使得大规模用户部署难以实现。为了解决这个问题,SMCS应运而生,其核心思想是通过挖掘子区域之间的时空相关性并利用少量关键感知数据来推断全局信息。Wang L等人[9]正式提出了SMCS的通用框架,包括单元选择、数据推理和数据质量评估三个阶段。
系统模型和问题表述
在本文中,我们假设参与者基于城市众包从有限区域内收集数据,并研究如何从稀疏数据中推断完整数据的问题。
在目标感知区域中,最小的单元区域称为一个单元。在每个单元内,所有位置的感知值是均匀的[27]。给定整个城市感知区域被划分为N个单元,整个感知任务时间被划分为T个时间段。目标是获得互补的感知数据
基于物种形成关系建模和图卷积神经网络的数据推理方法
在本节中,介绍了基于生物物种形成关系的图卷积神经网络的设计细节,以实现数据推理框架,如图2所示,包括稀疏单元图构建、自适应节点聚合和感知图重建三个部分,具体如下:
(1)首先,模拟物种形成中的种群结构,将感知数据的时间、空间和非时空相关性建模为同域、
实验设置和数据集
本研究中的所有实验均使用PyTorch框架(版本2.11.0)进行。所有代码在配备AMD Ryzen 7 4800U处理器(8核,16线程,基础频率1.80 GHz)和集成Radeon Graphics的同一设备上的Python 3.7环境中执行。该设备配置有16.0 GB的RAM,并运行64位Windows操作系统。在验证Bio-GCN的有效性时,使用了以下两个数据集:
(1)Leuvenair[32]是一个公民科学项目
结论
在稀疏移动众包中,数据推理补全可以有效补偿数据收集的时空稀疏性,提高感知准确性和资源利用效率,从而在资源有限的情况下实现高效和高质量的环境感知。我们提出了一种基于生物物种形成关系的时空数据推理方法,用于完成稀疏数据推理任务。Bio-GCN有效地捕获了
CRediT作者贡献声明
贾刘:撰写——原始草稿、可视化、验证、软件、方法论、调查。王健:撰写——审阅与编辑、撰写——原始草稿、方法论、调查、资金获取、概念化。赵国生:撰写——审阅与编辑、监督。何冠志:撰写——原始草稿、验证、方法论、调查。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。
致谢
本研究工作得到了国家自然科学基金(61403109)和黑龙江省自然科学基金(PL2024F012)的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号