《Atmospheric Environment》:Inverse identification of a passive scalar source of pollution in large areas
编辑推荐:
大气污染源逆识别框架融合随机建模与HoSVD及机器学习代理模型,在新加坡区域900小时模拟中实现稀疏传感器数据的高精度污染场重建,多目标优化结合高斯过程回归与Levenberg-Marquardt算法将计算效率提升至30分钟内完成,支持实时部署与高维扩展。
阿明·阿马尔(Amine Ammar)|弗朗西斯科·奇内斯塔(Francisco Chinesta)
LAMPA实验室及ESI小组负责人,法国昂热市Ronceray大道2号,邮编49035,BP 93525,艺术与工艺技术学院(Institut des Arts et Metiers de Technologie)
摘要
本文提出了一种新颖且计算效率高的框架,用于逆向识别大气污染源,特别关注其在复杂环境中的实时应用能力。所提出的方法结合了污染物扩散的随机建模、高阶奇异值分解(HoSVD)和基于机器学习的替代模型。以新加坡地区为中心的案例研究证明了该方法能够从稀疏的传感器数据中准确重建污染场,模拟时间跨度为900小时。该方法采用多目标优化策略,利用高斯过程回归(特别是回归任务在相对低维的参数空间中进行)来近似参数模式,并通过Levenberg–Marquardt算法进行污染源定位。结果表明,定位误差保持在空间网格分辨率的一小部分范围内,整个计算流程(从模拟到优化)在标准桌面硬件上可在30分钟内完成。这种效率使得该方法能够频繁或连续地应用于运行监测系统。该框架的模块化设计使其能够扩展到更高维的参数空间,适用于广泛的环境监测应用。
引言
新加坡面临着一系列跨界大气威胁,包括来自印度尼西亚森林火灾的烟雾、火山灰云以及邻近地区的工业排放。这些环境危害可能导致空气污染水平危险地升高,对公共健康构成严重风险,扰乱日常生活,并可能损坏关键基础设施。尽管该国拥有先进的环境监测能力,但目前的监测系统(主要是地面监测)仍不足以实现大规模的早期检测。这一限制阻碍了及时响应和缓解措施,尤其是在污染物源自国境之外的情况下。新的检测技术必须提高新加坡预测和管理这些跨界空气质量挑战的能力。
识别空气污染源是空气质量管理的核心挑战,无论是在城市环境还是室内环境中。逆向建模通过结合测量数据和基于物理的模型,提供了一种原理性的方法来追踪污染源的来源。实践中通常使用四种主要方法:贝叶斯/伴随概率方法(B. Rajkovic等人,2008年;Rajkovi?等人,2010年;Borivoj Rajkovic等人,2008年;Hong-Liang Zhang等人,2024年;Liu和Zhai,2007年;Xue和Zhai,2017年)、基于采样的贝叶斯方案(如MCMC,Hong-Liang Zhang等人,2024年)、整合异构测量的伴随方程方法(Penenko等人,2022年),以及用于实时应用的简化模型(B. Rajkovic等人,2008年;Rajkovi?等人,2010年;Bady等人,2009年;Ben Salem等人,2013年;Ben Salem等人,2014年)。在室内环境中,伴随概率方法能够用少量传感器实现快速定位(Liu和Zhai,2007年);比较研究表明,逆向建模在污染源定位方面优于反向轨迹统计方法(Fang等人,2018年)。
除了这些核心方法外,还有几项改进措施旨在提高估计的准确性和鲁棒性:针对复杂传输情况的逆时间推进算法和遗传算法(Bady等人,2009年;Khlaifi等人,2009年),以及将神经替代模型与优化相结合的混合方案,以减少运行时间而不降低准确性(Borah和Bhattacharjya,2015年)。
然而,仍然存在一些持久性的障碍,可以分为两类:(i)数据/模型的不确定性;(ii)计算负担。在不确定性方面,低成本传感器和异构数据流会导致噪声和偏差(Chi Zhang等人,2024年;Ambert等人,2023年),因此需要数据融合和过滤策略(Chi Zhang等人,2024年;Zeng等人,2020年)。在成本方面,解决完整的3D传输和复杂物理问题非常昂贵(Penenko等人,2023年);操作/工业环境需要高分辨率输出(Akbari Lakeh等人,2025年);而时间敏感的室内跟踪则受到运行时间限制(Zeng等人,2020年)。
从结构上看,传统公式通常依赖于简化假设(例如,已知释放时间/单一污染源),这限制了其在现实多污染源环境中的适用性(B. Rajkovic等人,2008年)。尽管概率质量函数(PMF)被广泛用于污染源分配,但它可能收敛缓慢且在因子分辨率上存在主观性(Qiaoli Wang等人,2025年)。等终性进一步增加了识别的复杂性(Pan等人,2025年);对流动/扩散参数的敏感性削弱了鲁棒性(Dahmardan等人,2025年);稀疏/不准确的测量数据和次优的站点选择会放大非唯一性并降低性能(Zeng等人,2018年;Valencia等人,2021年;Zhai和Liu,2017年;Amiri等人,2019年;Onyari和Taigbenu,2015年)。
另一个限制是外部有效性:许多算法仍在理想化条件下进行验证,忽略了真实的城市/工业复杂性(Wang等人,2022年;Xue和Zhai,2017年);在实际应用中部署这些算法通常需要详细的形态学和环境输入(Xue和Zhai,2017年);而病态问题通常需要正则化(例如,Tikhonov方法),这会引入偏差/调整问题(Roberti等人,2007年;Onyari和Taigbenu,2015年)。
最近的研究进一步强调了大规模自然事件对区域空气质量的影响。特别是,亚洲沙尘暴已被证明会严重阻碍污染控制工作,并将矿物气溶胶输送数千公里,影响东亚的主要人口中心(Guochen Wang等人,2025年)。除了这些大规模现象外,最近的研究表明,机器学习结合因果推断为解析亚洲大城市的复杂污染信号提供了强大的工具(Zhang等人,2025年)。此外,基于PMF的高分辨率污染源分配研究表明,精细化学测量对于理解城市污染源的时间变化性至关重要(Wang等人,2018年)。
在这项工作中,我们在之前概述的各种挑战中重点关注两个方面。首先是降低计算成本。我们提出了一种能够实时运行且数值成本显著降低的方法,允许随着时间的推移进行连续的数据更新和迭代模拟。每次数据更新都会触发一个新的优化过程。本文的第二个贡献是实施了多目标优化标准。如前所述,逆问题是不适定的,基于单目标优化的方法在准确定位污染源时经常遇到困难,这主要是由于目标函数中存在多个局部最小值。使用多目标优化框架有助于克服这些挑战,实现更准确和稳健的污染源定位。
值得注意的是,我们在许多工作中都专注于偏微分方程中的参数问题研究,通过侵入式方法寻求以分离表示的解决方案。其中可以提到Kazemzadeh-Parsi等人(2021年)和Pasquale等人(2024年)的工作。然而,在本研究中,我们受到了一种非侵入式解决策略的启发,该策略采用了我们在Ammar等人(2024年)之前发表的概念。
在引言之后,方法论部分介绍了所使用的数学工具及其在污染源识别问题中的应用。随后,我们介绍了基于新加坡地区及其周边实际风场测量的案例研究。最后,我们展示了结果并说明了我们方法的数学特点。
案例研究片段
直接模拟
在我们的方法中,污染由变量表示,并假设其遵循对流-扩散方程。考虑到较大的地理范围,污染物扩散在二维平面上进行建模。尽管如此,将模型扩展到三维并不会在实现或计算时间上带来显著挑战。污染动态由对流速度场控制,该速度场来自气象数据。
案例研究的示例结果
在本节中,我们展示了基于新加坡周边地理区域的示例结果。研究区域从新加坡以西818公里延伸到东630公里,从公里向南延伸到公里以北。该区域被划分为个点,形成了一个规则的50×50网格。
在这些网格点上,每小时从气象记录中收集风速数据。我们选择了一个时间为小时的时间窗口,相当于略多于一个月的时间。
结论
本研究提出了一种新颖且计算效率高的框架,用于逆向识别污染源,特别关注其在复杂环境中的实时应用能力和鲁棒性。通过结合污染物扩散的随机建模、高阶奇异值分解(HoSVD)和基于机器学习的替代模型方法,我们证明了从稀疏数据中准确重建污染源位置的可行性。
CRediT作者贡献声明
阿明·阿马尔(Amine Ammar): 负责撰写——原始草稿、软件和方法论。
弗朗西斯科·奇内斯塔(Francisco Chinesta): 负责审稿与编辑、方法论。
未引用参考文献
Joseph等人(2014年)
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
致谢
这项研究是DesCartes计划的一部分,得到了新加坡总理办公室的国家研究基金会在其Campus for Research Excellence and Technological Enterprise(CREATE)计划下的支持。