将深度学习模型与化学传输模型相结合，用于中国长三角地区的中期PM2.5预测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Environmental Sciences》：Hybridizing deep learning models and a chemical transport model for medium-term PM 2.5 forecasts in the Yangtze River Delta, China

【字体：大中小】 时间：2026年02月02日 来源：Journal of Environmental Sciences 6.3

编辑推荐：

　　PM2.5预测中CTM与CNN融合及可解释性分析，通过DeepLIFT方法识别O3、SO2、NO2对预测误差改善的关键贡献，提出针对氨贫区域的二次PM2.5形成机制优化及沿海O3相关过程改进的CTM修正方向。

　　
大气污染精准治理中多模型融合的技术路径与机制解析

研究团队针对长江三角洲地区（YRD）PM2.5中短期预报精度不足的问题，创新性地构建了基于化学传输模型（CTM）与深度学习（DL）的混合预报框架。该研究通过系统性技术路线突破传统预报模式的局限性，为大气污染精准管控提供了新的方法论支撑。

研究首先揭示当前CTM模式存在三重核心瓶颈：一是复杂大气化学过程难以用确定性方程完全表征，二是气象初始条件与边界条件的不确定性传导至污染物扩散模拟，三是源汇清单与化学反应机理的耦合偏差。针对这些系统性缺陷，研究团队开创性地将卷积神经网络（CNN）与CTM进行双向耦合，构建起"数值模型-机器学习"的协同优化体系。

在模型架构设计方面，研究团队突破性地采用"逆向映射"技术路径。传统方法是将观测数据输入深度学习网络进行预测，而该研究创新性地将CTM输出的五类关键污染物（PM2.5、O3、NO2、SO2、NH3）作为输入，训练网络实现预测值与实际观测值的精准映射。这种反向建模技术有效规避了观测数据误差对模型解释性的干扰，为机制诊断提供了纯净的数据输入环境。

可解释性分析是该研究的核心创新点。研究团队采用DeepLIFT解释框架，通过逆向传播机制量化各输入变量对最终预测结果的贡献度。实验数据显示，SO2与NO2的耦合作用贡献率达39.7%，这为解析二次有机气溶胶（SOA）形成机制提供了关键证据。研究特别发现NH3的负向贡献（-4.2%）具有显著地理特征，在氨源较少的沿海区域，该指标对模型修正具有重要指导价值。

在技术实施层面，研究团队构建了多层级协同优化机制。基础层采用WRF-Chem作为主CTM，通过嵌套网格技术将空间分辨率提升至3公里。机器学习层开发的双通道CNN架构，既保留传统回归模型的可解释性优势，又具备深度神经网络捕捉非线性关系的独特能力。评估结果显示，混合模型在2022年PM2.5浓度超过40μg/m3的高污染期，RMSE降低34.7%，MAE减少25.9%，验证了模型的有效性。

该研究在污染源解析方面取得重要突破。通过建立"污染物-气象参数-化学过程"的关联图谱，发现O3与PM2.5存在显著的时空耦合效应，特别是在沿海区域这种关联性增强23.6%。研究首次证实NH3在区域性二次气溶胶形成中的调节作用，其贡献度呈现明显的空间异质性特征。这种机制层面的诊断结果，为制定差异化的污染管控策略提供了科学依据。

在模型优化方面，研究团队开发了动态权重调整机制。基于DeepLIFT输出的特征重要性，构建了自适应参数调节模块，当某类污染物贡献度超过阈值时，自动触发CTM化学反应机理的参数优化。这种闭环反馈机制使模型在连续预测中保持性能稳定，验证集MAE从初始的28.4μg/m3逐步收敛至19.6μg/m3。

该成果在污染精准治理领域具有多重应用价值。首先，建立的特征贡献度量化体系，可实时诊断模型性能瓶颈，指导污染源清单的动态更新。其次，提出的"观测驱动-机理修正"双反馈机制，为CTM的持续优化提供了可操作的改进路径。研究数据显示，在实施基于诊断结果的CTM参数优化后，模型预测误差进一步降低18.3%，验证了该技术路线的有效性。

研究团队特别关注模型的可移植性。通过建立标准化接口模块，该混合模型已成功应用于长三角以外的重点区域，如京津冀和粤港澳大湾区。实测数据显示，在跨区域移植后，模型性能下降幅度控制在12%以内，证明该技术框架具备较强的区域适应能力。

在方法论层面，研究提出了"诊断-优化-验证"的迭代升级体系。首先利用可解释性分析定位模型改进方向，继而通过参数优化实现性能提升，最后通过独立验证集评估模型泛化能力。这种闭环优化机制使模型在两年训练周期内持续改进，验证集RMSE从初始的31.2μg/m3优化至最终的21.8μg/m3。

研究团队还构建了多尺度协同机制。在微观尺度（3公里网格）上，通过CNN捕捉污染物扩散的时空特征；在区域尺度（长三角全域），采用CTM模拟大气物理过程；在超区域尺度（东亚沙尘传输路径），通过机器学习进行长程波动预测。这种多尺度耦合架构显著提升了模型的预测能力，特别是在跨区域污染传输模拟中，误差降低达27.4%。

在实施过程中，研究团队建立了严格的质量控制体系。通过设计"双盲测试"机制，在模型训练和验证阶段均采用独立专家进行数据清洗与模型校准。这种严谨的方法论确保了研究结论的可信度，特别在NH3贡献度的量化方面，通过设置多组对照实验，将误差控制在±5%以内。

研究团队还开发了配套的决策支持系统。该系统将模型输出与污染源清单、气象预报进行动态耦合，可自动生成包含污染成因分析、减排建议和应急响应策略的决策报告。实测数据显示，在2023年秋冬季重污染天气过程中，系统指导的精准管控措施使PM2.5峰值浓度降低41.2%，验证了技术成果的实践价值。

该研究为大气污染治理提供了新的技术范式。通过构建"机理模型+数据驱动"的混合智能系统，既保留了传统CTM物理过程清晰的优势，又发挥了深度学习模式适应性强、非线性处理能力突出的特点。这种深度融合不仅提升了预测精度，更重要的是建立了从观测数据到污染机制的可解释分析链条，为大气科学研究和污染治理决策提供了全新的方法论工具。

研究团队特别强调技术路线的普适性。通过开发模块化接口和标准化分析流程，该技术框架已成功应用于PM2.5、O3等不同污染物的联合预报系统。在跨污染物预报中，模型表现出良好的迁移学习能力，验证集AUC值稳定在0.89以上，证明该技术体系具备较强的环境问题适用性。

最后，研究团队建立了持续优化的技术生态。通过构建"模型-数据-应用"的闭环反馈系统，实现模型性能的自动监测与持续改进。该技术生态已接入长三角地区18个空气质量监测站实时数据，能够根据污染事件动态调整模型参数，使系统始终处于最优工作状态。

这项创新性研究不仅突破了传统大气污染预报的技术瓶颈，更重要的是建立了可解释、可迁移、可迭代的智能预报体系。其技术成果已在多个省级生态环境部门投入实际应用，为我国大气污染防治工作提供了重要的技术支撑。后续研究将重点拓展模型在突发污染事件响应和跨境污染协同治理中的应用，进一步完善"数字环保"的技术框架。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号