多目标机器学习在健康导向的O3和PM2.5控制中的应用：整合挥发性有机化合物（VOC）的光化学消耗及来源解析

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Hazardous Materials》：Multi-objective machine learning for health-oriented O 3 and PM 2.5 control: Integrating VOC photochemical consumption and source apportionment

【字体：大中小】 时间：2026年02月18日 来源：Journal of Hazardous Materials 11.3

编辑推荐：

　　臭氧与PM2.5协同污染形成机制及健康导向减排策略研究。基于绍兴市2023年全年的观测数据，构建了融合OBM、Multi-CatBoost和PMF的多目标分析框架，揭示了VOC光化学反应消耗率达22.1%，NO2在16-35.6μg/m3浓度区间呈现促进O3生成与硝酸盐气溶胶形成的双重效应，并证实VOC减排可降低AQHI 19.27%-34.67%。

贾鸿远|姚森|唐新达|郑牧强|董旭轩|范凤娟|杨树森|张汉宇

中原工业大学智能能源与环境学院，中国郑州，450007

摘要

臭氧（O₃）和细颗粒物（PM_2.5）的复合污染对中国空气质量管理构成了严峻挑战。本研究开发了一个综合的多目标分析框架，结合了基于观测的模型（OBM）、多任务机器学习（Multi-CatBoost）和正矩阵分解（PMF），系统地评估了2023年绍兴市O₃和PM_2.5的协同形成机制。采用改进的光化学老化参数化方法量化了挥发性有机化合物（VOC）的大气消耗量，发现初始VOC浓度的22.1%在传输过程中被光化学消耗。Multi-CatBoost模型在预测两种污染物的浓度方面表现出良好的性能（R² = 0.91），并通过联合优化揭示了污染物之间的协同机制，显著提高了跨介质前体物质（如NO₂对PM_2.5的重要性，增加了86.7%）。SHAP分析确定了控制O₃-PM_2.5形成权衡的浓度依赖性阈值，NO₂在浓度低于16?μg/m³时促进O₃的形成，而在浓度高于35.6?μg/m³时则有利于硝酸盐气溶胶的形成。基于空气质量健康指数（AQHI）的健康导向敏感性分析表明，在所有污染情景下，减少VOC是最优策略，完全减少VOC可使AQHI降低19.27%-34.67%，远超减少NOx的效果（0.20%-4.60%）。通过SHAP交互重分配分析（SIRA）框架进行的源特定分析确定，工业排放和生物质燃烧是优先控制目标，两者共同贡献了55.8%的AQHI改善潜力。本研究为制定针对复合污染的控制策略提供了新的范例。

引言

近年来，中国在大气污染控制方面取得了显著进展，PM_2.5浓度持续下降。然而，臭氧（O₃）污染日益严重，O₃和PM_2.5的复合污染已成为制约空气质量改善的关键瓶颈[1]，[2]。作为挥发性有机化合物（VOCs）和氮氧化物（NOx）等前体物质衍生的二次污染物，O₃和PM_2.5在其形成过程中表现出复杂的耦合机制，并在大气光化学过程中相互影响[3]，[4]，[5]。这种复杂的协同效应使得单一污染物控制策略难以实现整体空气质量改善，迫切需要开发能够同时考虑O₃和PM_2.5协同形成机制的综合性评估方法。

作为O₃和二次有机气溶胶（SOA）的关键前体，VOCs在大气传输过程中会发生光化学反应，导致其浓度相比初始排放量有所降低[6]，[7]，[8]。目前估计初始VOC浓度的方法包括使用同系物对的物种比例法[7]，[9]，[10]，[11]，生物源VOC的顺序反应模型[12]，[13]，以及基于观测的模型（OBM）模拟[14]，[15]，[16]。在这些基础方法的基础上，最近的研究越来越多地将光化学老化参数化与机器学习技术相结合，以实现更准确的源归因和臭氧敏感性评估[17]，[18]。

机器学习（ML）模型在O₃和PM_2.5的预测、形成机制分析以及源-受体关系识别方面表现出优越性能，在计算效率和捕捉非线性相互作用方面优于传统的化学传输模型（CTMs）[19]，[20]，[21]。基于博弈论的归因方法SHapley Additive exPlanations（SHAP）已成为揭示大气污染研究中关键驱动因素和非线性响应阈值的核心工具[22]，[23]。最近，多任务学习框架因通过参数共享捕捉相关任务之间的正/负传递而受到关注，显著提高了泛化性能[24]，[25]，[26]，[27]，[28]，[29]。为了量化不同污染源对O₃和PM_2.5的贡献，现有研究通过多种途径结合了ML、SHAP和正矩阵分解（PMF），包括将PMF结果输入ML模型，独立使用PMF和SHAP，或将SHAP交互值与PMF因子谱结合[30]，[31]，[32]，[33]，[34]，[35]，[36]，[37]。这些集成方法已被证明对单一污染源归因分析有效。

同时，空气质量健康指数（AQHI）通过流行病学加权的累积风险，比传统的空气质量指数（AQI）更准确地反映了多污染物对健康的威胁[38]，[39]，[40]，[41]，[42]。基于CTMs和OBM构建的传统经验动力学建模方法（EKMA）存在计算成本高和模型假设限制的问题[43]，[44]，[45]，[46]，而基于机器学习的EKMA作为一种有前景的替代方法，最近的研究表明PM_2.5污染可以调节臭氧形成对各种来源VOC排放的响应[33]，[47]。

尽管在这些方法上取得了进展，但目前研究中仍存在关键差距。首先，现有研究主要使用单一目标机器学习模型独立预测O₃或PM_2.5[17]，[18]，[33]，[36]，[37]，[48]，未能捕捉复合污染中固有的共同特征表示和污染物之间的协同机制；多任务学习在联合优化O₃-PM_2.5预测方面的潜力尚未得到探索。其次，当前的ML-SHAP-PMF集成方法主要采用顺序工作流程，将PMF结果输入ML模型[36]，[37]或独立使用它们，缺乏能够同时量化O₃和PM_2.5的源特定贡献的系统性框架，并通过并行模块化策略实现个别污染源的梯度减少敏感性分析。第三，基于机器学习的EKMA研究仅关注单一污染物（通常是O₃）的敏感性分析，未纳入健康风险指标[33]，为考虑复合污染的联合健康影响的减排策略提供了有限的指导。

为了解决这些限制，本研究开发了一个创新的多目标分析框架：（1）基于多任务学习的Multi-CatBoost模型，通过共享特征学习联合优化O₃和PM_2.5的预测，系统地重构特征重要性，以增强跨介质前体的识别并揭示控制O₃-PM_2.5形成权衡的浓度依赖性阈值；（2）AQHI-EKMA框架，同时构建O₃、PM_2.5和综合健康风险的敏感性曲线，基于流行病学加权的健康指标而不是单一污染物浓度，实现特定情景下的最优减排路径识别；（3）将我们之前开发的SHAP交互重分配分析（SIRA）框架[16]扩展到多目标情景，通过并行模块化策略整合PMF源分配与多目标EKMA，实现对六个单独污染源的梯度减少敏感性分析，并量化它们对健康风险改善的贡献。

本研究以长江三角洲地区的绍兴市为研究对象，基于2023年的全年VOC测量数据、常规污染物数据和气象数据。旨在开发一个创新的多目标分析框架，系统评估VOC大气光化学消耗对O₃和PM_2.5协同形成的影响，并根据健康风险指标制定差异化的减排策略。

研究区域和数据

空气污染物样本采集自绍兴市国家空气质量监测站（位于北部地区，坐标30.0764°N, 120.6153°E）的屋顶（4层）。本研究使用了四种类型的数据：挥发性有机化合物（VOC）测量数据、常规污染物测量数据、气象数据和光解速率数据。VOC数据集包括来自快速在线监测系统（TH-PKU300B；武汉天虹仪器有限公司）的VOC测量结果（详细信息

污染物的时空分布特征

绍兴市研究期间的气象和污染物数据如图2(a-d)所示。研究期间，平均污染物浓度分别为O₃ 67.00±45.30?μg/m³，PM_2.5 30.91±25.05?μg/m³，NO 3.87±9.86?μg/m³，NO₂ 29.81±20.58?μg/m³，AVOC 20.51±9.70 ppb。气象条件显示平均温度为18.01±9.49°C，相对湿度为69.38±18.74%，边界层高度为467.60±424.32?m，风速为2.32±1.16?m/s，主要风向来自北方

结论

本研究建立了一个综合的多目标分析框架，结合了基于观测的模型（OBM）、多任务学习（Multi-CatBoost）和正矩阵分解（PMF），以研究绍兴市O₃-PM_2.5复合污染的协同形成机制。改进的光化学老化参数化表明，初始VOC浓度的22.1%在传输过程中被消耗，消耗后的浓度与观测值（r = -0.214）相比显示出更强的O₃相关性（r = 0.294）。Multi-CatBoost模型实现了可靠的

环境意义

传统策略忽视了O₃-PM_2.5的协同形成机制和综合健康风险。大多数研究使用单一目标模型独立预测每种污染物，未能通过共享特征学习捕捉污染物之间的协同机制。本研究开发了一个综合框架，结合了基于观测的模型、多目标多任务学习（Multi-CatBoost）和PMF分析来揭示这些协同机制。结果表明，VOC

作者贡献声明

姚森：项目监督、项目管理、资金获取、数据管理。贾鸿远：撰写初稿、可视化、软件开发。郑牧强：数据调查、数据管理。唐新达：撰写、审稿与编辑、验证。范凤娟：资源获取、数据调查。董旭轩：正式分析、数据管理。张汉宇：资金获取。杨树森：撰写、审稿与编辑。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文的研究结果。

联系信箱：

粤ICP备09063491号

摘要

引言

研究区域和数据

研究区域和数据

污染物的时空分布特征

结论

环境意义

作者贡献声明

利益冲突声明

热点排行