可解释的机器学习揭示了在中国四川省南部一个典型城市中,各种来源和气象条件对PM2.5污染的影响

《Atmospheric Environment》:Explainable machine learning reveals the effect of sources and meteorology on PM 2.5 pollution in a typical city of Southern Sichuan, China

【字体: 时间:2026年02月18日 来源:Atmospheric Environment 3.7

编辑推荐:

  PM2.5污染形成机制研究:基于机器学习与SHAP-PMF耦合模型分析Luzhou地区2023年污染特征,揭示次生离子(NO3-、SO4^2-、NH4+)主导作用,气象条件(低温高湿)与工业排放协同加剧污染,提出精准减排与气象干预策略。

  
王秀丽|李婷婷|马梦涵|白希贤|孙文欣|朱仁成
郑州大学数学与统计学院,中国郑州,450001

摘要

近年来,中国四川省南部城市群,尤其是泸州,经历了严重的PM2.5污染。明确PM2.5的主要成因对于遏制其进一步恶化至关重要。本研究采用机器学习(ML)模型结合Shapley加性解释(SHAP)和正矩阵分解(PMF)技术,探讨了2023年1月至12月期间各种因素(包括气象因素、化学成分和污染源)对泸州PM2.5形成的影响。研究发现,二次离子(NO3、SO4和NH4)在污染条件下对PM2.5的积累具有显著影响。气象因素,尤其是低温和高湿度,通过抑制污染物扩散和促进二次气溶胶的形成,进一步加剧了污染。污染源分析显示,二次气溶胶(46.5%)和工业排放(22.2%)是主要污染源,但在严重污染期间,工业和燃烧源的影响显著增强。这些结果表明,二次气溶胶的形成在不利气象条件下被放大,成为泸州PM2.5污染的主要驱动因素。因此,研究结果为优先控制前体物质排放和在寒冷静止天气期间采取及时干预措施提供了科学依据。

引言

细颗粒物(PM2.5,空气动力学直径≤2.5μm)作为一种典型的大气污染物,因其对健康和环境的危害而受到广泛关注。自2013年中国实施一系列清洁空气行动以来,PM2.5污染显著减少。尽管在空气污染预防和控制方面取得了一定成果,但它仍然是中国的主要空气污染物,并且污染趋势仍在加剧(Qu等人,2010年;Li等人,2017年;Huang等人,2023年)。PM2.5的形成涉及复杂的物理和化学过程,主要受人为排放、大气化学反应、传输机制和气象条件的影响(Shang等人,2021年)。研究表明,PM2.5可以直接由人类排放产生,或由其前体物质(SO2、NOx、VOCs等)通过大气化学反应生成二次气溶胶,然后通过凝结和分布形成PM2.5(Mikhailov等人,2015年)。此外,气象条件通过影响PM2的生成、传输和沉积,在污染物积累和扩散中起重要作用。例如,高湿度促进气态前体物质向颗粒相的转化,而风向和风速则驱动污染物的跨区域传输(Chen等人,2020年)。PM2.5的预防和控制重点关注其时空分布、形成机制、社会经济因素、多污染物污染和污染源分配(Song等人,2024年)。PM2.5及其影响因素之间存在复杂的非线性关系和协同作用机制。由于研究的复杂性和区域的异质性,传统的现场方法(如二次有机气溶胶生成潜力(SOAP)在量化因素对PM2形成的贡献方面存在局限性。因此,需要引入更高效和稳健的模型来探索PM2的形成机制(Fan等人,2005年;Belis等人,2013年)。与传统统计方法不同,机器学习(ML)模型因其在处理复杂非线性问题方面的出色表现而逐渐应用于空气污染研究(Yang等人,2021年;Cheng等人,2023年;Alkhodaidi等人,2024年)。然而,ML模型的“黑箱”特性使得难以量化输入特征对结果的影响。为此,开发了基于博弈论的Shapley加性解释(SHAP)工具,可以有效量化输入特征对模型预测的贡献(Wang等人,2023年;Zhang等人,2024年;Peng等人,2023年)。近年来,ML结合SHAP在PM2.5污染研究中取得了一系列进展。Wu等人(2022年)应用ML预测北京PM2浓度,并利用SHAP量化不同气象条件的影响。他们的分析表明,气象对PM2浓度的影响因季节而异。Hou等人(2022年)应用ML结合SHAP解释了COVID-19疫情期间中国PM2污染的主要因素,发现气象是主要驱动因素。Zhang等人(2025年)结合机器学习和因果推断量化了重大事件期间当地控制措施对城市空气质量的影响,展示了复杂情景下的先进归因方法。然而,大多数研究集中在南部中心城市或PM2污染严重的典型北方城市。四川盆地内非中心城市的PM2污染形成机制的适用性仍有待研究。
四川盆地的独特地形和气象条件导致其大气环流和热动力学与其他地区存在显著差异,从而容易发生大规模、严重的PM2污染事件(Lu等人,2022年)。作为四川盆地的核心区域,成都和重庆的PM2污染已得到广泛研究。例如,在以成都为代表的西部平原城市聚集区,Tao等人(2016年)分析了PM2的化学成分和污染源。Lu等人(2022年)研究了重庆地区冬季持续严重PM2污染的机制,揭示了驱动此类污染事件的大气物理和化学过程之间的内在耦合。Xian等人(2024年)量化了2002–2020年四川盆地冬季PM2污染源的演变,强调了气象和排放变化的关键作用。四川盆地南部城市聚集区(包括自贡、泸州、宜宾和内江)是第二大污染集群,其经济高度依赖高能耗和制造业,这些行业是PM2污染的主要来源。为了了解这一问题,Cao等人(2021年)分析了PM2的化学特性并进行了污染源分配。泸州位于长江和沱江的交汇处,处于四川盆地主要污染物传输走廊的战略位置,是区域空气质量的关键接收和混合区(Mo等人,2023年)。作为四川盆地第二大经济体(Zhang等人,2024年),泸州长期面临严重的PM2污染问题(Zhang等人,2020年;Tang等人,2017年;He等人,2020年)。2022–2023年,泸州是四川盆地PM2污染最严重的城市(Sun等人,2025年),当前的PM2污染问题仍然严重。本研究以2023年为研究对象,提供了反映疫情后经济恢复的标准化排放数据,为当前的污染控制策略提供了参考(Lu等人,2025年)。我们采用了一种能够快速准确评估气象因素、化学成分和污染源分配(通过正矩阵分解(PMF)模型)对PM2形成影响的方法。基于研究区域的PM2污染相关数据,结合ML模型和SHAP方法,本研究旨在:(1)提供量化和分析PM2气象和化学驱动因素影响的方法和案例;(2)量化气象因素、化学成分和污染源对不同PM2浓度水平的贡献;(3)建立PMF-SHAP耦合框架,提高污染源信息的可解释性和精度。这不仅为研究区域缓解PM2污染提供了精确措施,也为中国其他城市提供了参考。

研究区域概述

研究区域位于四川省东南部(28.87°N,105.44°E)(图1),介于云南-贵州高原和四川盆地之间。该地区具有亚热带湿润季风气候,季节性特征明显。南部地形较高,北部较低,海拔差近1700米,形成了独特的三维气候特征。产业结构以第二产业为主。

污染物和气象概述

图3展示了PM2.5及其主要化学成分(包括碳质、离子、岩石质和金属)的时间序列以及气象因素(温度、海平面高度、相对湿度、风速和降雨量)。空白部分表示数据预处理阶段的无效数据。整个时期的平均PM2浓度为42μg/m3,不仅超过了中国国家标准(35μg/m3),也高于2020年泸州的记录水平(38μg/m3)。

结论

基于2023年1月至12月四川南部典型城市的观测数据,本研究使用ML模型结合SHAP算法,探讨了气象因素、化学成分和通过PMF分配的污染源对泸州PM2污染形成的影响。最终预测结果显示,ML学习模型能够准确捕捉和解释观测期间PM2的变化。

作者贡献声明

王秀丽:撰写 – 审稿与编辑,撰写 – 原稿,方法论,数据管理。李婷婷:撰写 – 审稿与编辑,撰写 – 原稿,方法论。马梦涵:撰写 – 原稿,可视化,软件开发,数据管理。白希贤:撰写 – 审稿与编辑,监督,概念构思。孙文欣:方法论,数据管理。朱仁成:撰写 – 审稿与编辑,监督,数据管理。

利益冲突声明

作者声明没有已知的财务利益或个人关系可能影响本文的研究结果。
致谢
本研究部分得到了河南省自然科学基金(项目编号:242300421668)河南省高等学校青年教师培训计划(项目编号:2025GGJS002)以及郑州国家超级计算中心的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号