基于地理空间的NMHC浓度估算方法:利用集成堆叠地理人工智能算法提升空气质量评估水平

《Journal of Hazardous Materials》:Geospatial-Based Estimation of NMHC Concentrations Through an Ensemble Stacking Geo-AI Algorithm to Advance Air Quality Assessment

【字体: 时间:2026年01月22日 来源:Journal of Hazardous Materials 11.3

编辑推荐:

  基于地理空间人工智能的台湾非甲烷烃浓度估算方法研究,整合34个监测站2015-2021年数据,比较统计模型、深度学习及多种机器学习算法,发现集成堆叠模型(R2=0.820)最优,揭示城市住宅区及部分山区为热点,沿海和农村浓度较低,方法有效支持空气质量管理。

  
Thia Prahesti|Aji Kusumaning Asri|Yu-Ting Zeng|Chien-Hao Sung|Chieh-Ying Chen|Chia-Wei Hsu|Ta-Chih Hsiao|Kai-Hsien Chi|Wei Jie Seow|Shih-Chun Candice Lung|Chih-Da Wu
台湾成功大学测绘系,台南市,701

摘要

非甲烷烃(NMHCs)是一类挥发性有机化合物,在大气化学中起着关键作用,它们是臭氧和二次有机气溶胶(SOAs)的前体。尽管这些化合物对环境和健康具有重要意义,但由于监测网络分布稀疏,基于地理空间的NMHC浓度估算仍然有限。为了解决这一问题,本研究提出了一个改进的地理空间框架,通过整合2015年6月至2021年间34个监测站的日数据来估算台湾的NMHC浓度,最后一年用于外部验证。评估了四种主要的建模方法,包括统计模型(土地利用回归,LUR)、深度学习(深度神经网络,DNN)、单一机器学习模型(极端梯度提升(XGBR)、梯度提升回归器(GBR)、LightGBM回归器(LGBMR)、CatBoost回归器(CBR)和随机森林回归器(RFR),以及集成堆叠模型。表现最佳的是集成堆叠模型,它结合了五种单一机器学习算法。该集成框架取得了出色的预测性能(R2 = 0.820),优于LUR模型(R2 = 0.441)和DNN模型(R2 = 0.708)。关键预测因子包括纯住宅区、NO?、O?、水体、道路网络、风速以及其他土地利用和气象变量,反映了人为排放和大气过程的综合影响。基于地理空间的估算地图显示了明显的空间模式和可识别的NMHC热点区域,城市住宅区和某些山区浓度较高,而沿海和农村地区的浓度较低,这可能是由于通风较好且排放源较少。尽管在COVID-19疫情期间排放暂时减少,但所选模型仍能持续捕捉到时间趋势,显示出较强的稳健性。总体而言,本研究证明了集成堆叠方法可以有效改进NMHC的地理空间估算,为空气质量管理、环境监测和暴露评估提供了有价值的见解。

引言

非甲烷烃(NMHC)是指总烃(THC)中排除甲烷(CH?)的部分,是大气中挥发性有机化合物(VOC)的主要组成部分(美国环境保护署,2005年)。这些NMHC是高度活性的有机物质,在太阳辐射下能与氮氧化物(NO?)发生光化学反应,从而生成地面臭氧(O?)(美国环境保护署,2005年;阿尔伯塔省政府,2015年)。人为产生的NMHC排放主要来自车辆交通、工业活动和化石燃料燃烧,是大气中烃负荷的主要来源(Song等人,2012年;Stewart等人,2021年;Wang等人,2015年)。这些排放对居住在石油和天然气设施附近的人群构成了急性和慢性健康风险,影响神经、血液和发育健康(McKenzie等人,2018年)。台湾的长期流行病学研究进一步表明,即使考虑到PM?.?和臭氧的共暴露,环境NMHC暴露也与尿膀胱癌、缺血性中风和呼吸系统疾病的风险增加有关(Qiu等人,2020年;Zhang等人,2019年;Zhang等人,2022年)。全球范围内,NMHC排放受到诸如美国《清洁空气法》和欧盟Euro 7法规等框架的监管;而在台湾,环境部对工业和消费产品的VOC排放进行监管,以减少NMHC水平和臭氧生成(Dornoff & Rodríguez,2024年;环境部,2019年;国家可持续发展委员会(NCSD),2022年)。
尽管NMHC分布广泛并对健康产生不利影响,但基于地理空间的估算仍然有限。Doris等人(2024年)开发了土地利用回归(LUR)模型来估算苯、甲苯、乙苯和二甲苯(BTEX),但NMHC的代表性不足,频繁的未检测到数据降低了模型的可靠性。基于多元线性回归的LUR模型易于解释且直接,但在捕捉非线性关系和复杂相互作用方面存在局限性。在这种情况下,包括深度学习和机器学习在内的人工智能(AI)方法提供了更大的灵活性,并通常在环境暴露建模中实现更高的预测准确性(Hu等人,2022年;Vachon等人,2024年;Zhong等人,2024年)。深度神经网络(DNN)作为一种深度学习形式,已被应用于台湾的时空空气污染物估算,在74个站点生成了72小时的PM?.?预测,与传统化学传输模型相比偏差显著降低(Kow等人,2022年)。随机森林和梯度提升等机器学习算法能够捕捉非线性关系并整合多种环境预测因子,从而提高烃类估算的准确性(Balamurugan等人,2023年;Kaveh等人,2025年;Ren等人,2020年)。例如,时空极端梯度提升(XGBoost)模型结合环境和时空数据,生成了高分辨率的烃类地图,包括VOC,具有较高的预测准确性(R2 = 0.73)和较低的计算成本(Lu等人,2023年)。此外,以往的研究还应用了多种机器学习模型的集成方法来估算主要污染物,预测准确性R2值超过0.80(Arowosegbe等人,2022年;Hsu等人,2022年;Lai等人,2022年;Requia等人,2020年)。迄今为止,尚未使用集成堆叠方法进行NMHC的地理空间估算,这是一个重要的方法论空白。
鉴于NMHC的健康影响、监管重要性和现有的科学空白,本研究旨在使用基于地理空间人工智能(GeoAI)的框架来估算台湾的NMHC浓度,以推进空气质量评估。该研究比较了四种NMHC估算方法:LUR模型、DNN模型、单一机器学习模型(如随机森林和梯度提升),以及集成多种算法的集成堆叠模型,以利用它们的互补优势。然后选择表现最佳的模型来生成基于地理空间的NMHC估算。这种方法克服了以往NMHC模型的局限性,提供了高分辨率和可靠的估算结果,揭示了详细的空间模式,并识别了对空气质量管理、环境监测和风险评估至关重要的NMHC热点区域。重要的是,这项研究代表了GeoAI技术在台湾乃至全球NMHC估算中的先进应用,考虑了地区特有的特征,如密集的城市化、多样的排放源和独特的气象条件。通过建立这一框架,该研究推进了NMHC暴露的地理空间表征,并增强了全球对空气质量的科学理解。

研究区域

本研究在台湾本岛(北纬21°53′–25°18′,东经119°18′–124°34′)进行,位于中国东南部和菲律宾北部之间的西太平洋。作为一个受东亚季风系统影响的亚热带岛屿,台湾的气象条件具有季节性变化,这显著影响了全年的大气污染模式(Kishcha等人,2018年;Tsao和Hsieh,2023年)。该岛东部以山区为特征

NMHC浓度的描述性统计

图2显示了主要数据集和外部验证数据集按空气质量区(AQZ)划分的月平均NMHC浓度,揭示了明显的季节性和时间变化。主要数据集中NMHC浓度最高出现在2016年3月(0.288 ppm),最低出现在2020年6月(0.103 ppm)。总体而言,结果显示出一致的季节性模式,夏季浓度较低,冬季和春季浓度较高

讨论

本研究提出了一种基于Geo-AI的地理空间方法,用于估算台湾的NMHC浓度,整合了LUR、DNN和单一机器学习模型,以推进该地区的空气质量评估。这种方法实现了高分辨率制图,揭示了详细的空间分布和明显的NMHC热点区域。这些模式突出了排放集中的区域,这对于空气质量管理、环境监测和公共卫生评估至关重要。

结论

本研究证明了使用集成堆叠方法基于地理空间估算台湾NMHC浓度的可行性,标志着机器学习在该地区地理空间NMHC建模中的先进应用,从而推进了台湾的空气质量评估。研究利用了2015年6月至2021年的日监测数据,最后一年用于外部验证。集成堆叠模型取得了出色的预测性能(R2 = 0.820),明显

未引用的参考文献

(台湾环境保护部监测与信息司,2024年;台湾环境部,2019年;台湾环境部,2024年;台湾内政部,2025年;台湾国家可持续发展委员会(NCSD),2022年;Nguyen等人,2025年;台北市政府环境保护局,2023年)

CRediT作者贡献声明

Kai-Hsien Chi:资源提供,概念构思。Ta-Chih Hsiao:资源提供,概念构思。Wei Jie Seow:资源提供,概念构思。Chien-Hao Sung:资源提供。Yu-Ting Zeng:软件提供,方法论制定,数据整理。Chia-Wei Hsu:资源提供。Chieh-Ying Chen:资源提供。Chih-Da Wu:撰写——审稿与编辑,监督,资金获取,概念构思。Shih-Chun Candice Lung:资源提供,概念构思。Aji Kusumaning Asri:撰写——审稿与编辑,软件提供,

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。

致谢

本研究得到了台湾国家科学技术委员会(NSTC 113-2121-M-006-010 -; 114-2119-M-006 -010 -; 114-2123-M-001 -006 -; 114-2121-M-006 -001)和台湾教育部的“高等教育Sprout项目”的支持。此外,本研究还得到了高雄医科大学精准环境医学研究中心的支持,该研究中心属于“高等教育特色领域研究计划”的一部分
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号