一种基于图神经网络(GNN)的插值方法,用于利用物联网(IoT)数据提升空气污染预测的准确性
《Atmospheric Environment》:A GNN-based interpolation method for enhancing air pollution prediction based on Internet of Things (IoT) data
【字体:
大
中
小
】
时间:2026年02月08日
来源:Atmospheric Environment 3.7
编辑推荐:
本研究提出一种结合图卷积网络(GCN)和长短期记忆网络(LSTM)的新框架,用于建模城市空气污染的时空动态。通过整合欧氏距离、土地利用和海拔差异的复合邻接矩阵,GCN-LSTM模型在PM10浓度插值和预测中表现出优于传统LSTM和克里金法的精度。
黄秀妍(Suyeon Hwang)| 朴镇宇(Jinwoo Park)| 周怡婷(Yi-Ting Chu)| 崔真武(Jinmu Choi)
韩国首尔庆熙大学气候-社会科学融合系
摘要 在复杂的环境背景下,准确模拟城市空气污染对于制定有效的预测和监管策略至关重要。本研究提出了一种新的框架,利用混合图卷积网络-长短期记忆网络(GCN–LSTM)架构来模拟城市空气污染的时空动态。该模型能够捕捉颗粒物(PM10)的时间变化规律,同时通过结合海拔、土地覆盖类型和欧几里得距离的复合邻接矩阵来处理空间关系。利用“智能首尔物联数据”(Smart Seoul Data of Things, S-DoT),GCN–LSTM模型在插值精度上优于传统的LSTM和克里金(kriging)模型,显示出其在复杂城市环境中的潜力。这一框架为在多样化和环境复杂的城市环境中进行可靠的空气质量预测和监管奠定了基础。
引言 近年来,基于传感器的高精度数据收集技术取得了显著进展,尤其是针对空气污染的研究,因为空气污染直接影响生活质量(Tuomisto等人,2008年)。据预测,到2050年,室外空气污染将导致全球65%的死亡病例(Lieveld等人,2015年;Almetwally等人,2020年)。物联网(IoT)已被广泛用于监测多个地点的实时空气污染水平(Sharma等人,2021年)。基于物联网传感器的系统因其易于安装和管理而受到重视,在成本和效率方面改进了传统的空气污染数据收集方法(Peltier等人,2021年)。此外,这些系统的快速发展使得空气污染数据分析(Ayturan等人,2018年)和未来污染物浓度预测(Silva和Holanda,2022年)变得更加精确和可靠。
近年来,城市空气质量研究越来越多地采用深度学习技术进行数据插值、预测和特征选择(Qi等人,2018年)。深度学习模型利用深层神经网络架构,能够有效处理大规模数据集并捕捉复杂的关系,从而得出准确的结果(LeCun等人,2015年)。这使得深度学习成为预测空气污染的宝贵工具,而空气污染是一个受物理、化学和时空相互作用影响的现象(Bekkar等人,2021年)。在深度学习模型中,长短期记忆网络(LSTM)和卷积神经网络(CNN)在空气污染建模中尤为突出(Le等人,2020年;Ji等人,2024年)。LSTM网络适用于模拟长期依赖关系,因此非常适合处理空气污染等时间序列现象(Ayturan等人,2018年;Drewill和Al-Bahadili,2022年)。另一方面,CNN在计算机视觉领域应用广泛,通过卷积层提取空间关系,从而有效识别空气质量数据中的空间特征(LeCun等人,2015年;Le等人,2020年;Zhang等人,2016年;Samal等人,2021年)。
图神经网络(Graph Neural Networks, GNN)作为CNN的补充方案正在兴起(Asif等人,2021年)。虽然CNN适用于欧几里得空间数据(如图像或网格),但在处理非欧几里得空间关系时存在局限性(Zhao等人,2019年)。GNN通过建模复杂的拓扑关系解决了这一问题。特别是图卷积网络(Graph Convolutional Networks, GCN)通过将卷积操作应用于图数据,擅长捕捉节点特征及其空间关系(Zhang等人,2019年)。GCN使用邻接矩阵表示节点之间的空间结构(Guan等人,2024年)。近期研究探索了将GCN与时间学习模块结合,以分析时空数据,形成了时空GNN(ST-GNN)框架(Yu等人,2017年;Zhao等人,2019年;Bai等人,2021年;Zhu等人,2021年,2022年)。例如,Zhao等人(2019年)提出了时间图卷积网络(Temporal Graph Convolutional Network, T-GCN),该模型可用于交通预测、海平面监测(Zhou等人,2023年)和水质评估(Liu等人,2023年)等多种领域。在许多ST-GNN应用中,邻接矩阵是根据物理距离或网络拓扑预先构建的(Yu等人,2017年),而其他研究则通过图结构学习来优化连通性,或明确纳入节点/边属性以丰富信息传递(Wang等人,2020年;Bikram等人,2024年;Tan等人,2024年)。
尽管将GCN和RNN结合使用有望提高空气污染预测和插值的准确性,但其在空气污染研究中的应用仍然有限。据我们所知,Guan等人(2024年)是该领域为数不多的采用此类模型的研究之一。他们使用T-GCN模型预测了PM2.5的每小时浓度。然而,该研究仅依赖欧几里得距离来表示空间依赖性,忽略了其他影响空气污染的因素,如土地利用模式和海拔高度(Sun等人,2019年;Kim和Hong,2022年;Wang等人,2022年)。在大气环境领域,观测站分布不均以及地形的影响使得构建邻接矩阵成为模型性能和解释的关键因素(Guan等人,2024年;Chabalala等人,2026年);因此,先前的研究在定义站间连通性时考虑了海拔差异并应用了距离阈值(Chabalala等人,2026年)。除了海拔高度外,土地覆盖类型和土地利用也是重要的空间因素,它们与排放源、再悬浮过程以及局部源汇的特性密切相关,从而显著影响PM10的空间分布(Zhang和Zhao,2019年;Danek等人,2022年;Kim等人,2022年)。受这些领域考虑的启发,并基于Chabalala等人(2026年)的图构建逻辑,本研究提出了一种复合邻接矩阵,除了基于距离的邻近性外,还整合了海拔差异和土地覆盖相似性。
本研究提出了一个结合GCN和LSTM的新框架,以改进空气污染的插值和预测。GCN将使用反映距离、土地覆盖类型和海拔高度的邻接矩阵处理来自物联网传感器的数据。LSTM将计算每个传感器的每小时空气污染浓度。具体而言,本研究探讨了以下研究问题:(1)所提出的GCN–LSTM模型在插值和预测空气质量数据方面与现有模型相比如何?(2)在邻接矩阵中加入土地利用和海拔高度(除了欧几里得距离)对模型性能有何影响?
部分内容摘要 概念框架 我们的概念框架包括以下步骤:1)数据准备,2)复合邻接矩阵生成,3)GCN–LSTM模型训练用于PM10浓度插值,4)模型验证(图1)。首先,计算传感器位置之间的相似性以生成复合邻接矩阵,作为GCN模型的输入数据,同时还包括PM10浓度数据。随后,计算每个传感器的每小时平均PM10浓度数据
数据 本案例研究聚焦于韩国首尔的三个区域:江南(Gangnam, GN)、松坡(Songpa, SP)和瑞草(Seocho, SC),我们使用了三个数据集进行分析。首先,从韩国首尔市政府获取了2023年1月2日00:00至12月24日23:00的每小时平均PM10浓度数据(
https://data.seoul.go.kr/ )。具体来说,我们使用了“智能首尔物联数据”(Smart Seoul Data of Things, S-DoT)传感器收集的PM10数据,这些传感器属于物联网
讨论 本研究采用结合GCN和LSTM网络的模型,以增强对S-DoT(首尔物联网传感器部署)数据的处理和利用。选择PM10作为分析目标污染物。总体而言,该模型在整个研究区域内实现了较低的插值误差(MAE和RMSE),大多数相关系数(R)超过0.7,表明插值精度较高。然而,部分误差较大的传感器在研究区域内分布较为分散
结论 本研究提出了一种模型架构,用于综合考虑空气污染的时空动态。GCN–LSTM模型结合了LSTM网络(捕捉颗粒物现象的时间变化规律)和GCN(模拟浓度空间分布)。为了总结输入数据中传感器之间的空间关系,引入了复合邻接矩阵,其中包含了海拔差异和土地覆盖类型以及欧几里得距离
CRediT作者贡献声明 崔真武(Jinmu Choi): 撰写——审稿与编辑、监督、项目管理、资金获取、概念构思。周怡婷(Yi-Ting Chu): 正式分析、可视化、撰写——审稿与编辑。黄秀妍(Suyeon Hwang): 撰写——初稿撰写、可视化、验证、软件开发、方法论设计、正式分析、数据整理、概念构思。朴镇宇(Jinwoo Park): 撰写——审稿与编辑、初稿撰写、监督、正式分析
未引用参考文献 Almetwally等人,2020年;Drewil和Al-Bahadili,2022年;Kim和Hong,2021年;Lelieveld等人,2015年;McHugh等人,2021年;Tan等人,2023年。
利益冲突声明 作者声明没有已知的财务利益或个人关系可能影响本文的研究结果。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号