迈向一个整合气候变化、空气污染、社会经济因素与人类健康的人工智能基础模型

《Environmental Science & Technology》:Toward an AI Foundation Model Integrating Climate Change, Air Pollution, Socioeconomics, and Human Health

【字体: 时间:2026年02月06日 来源:Environmental Science & Technology 11.3

编辑推荐:

  空气污染与气候变化对全球健康的影响及整合模型研究。现有模型通过多学科数据融合(气候、排放、社会经济)和混合架构(Transformer+GNN)实现健康负担预测,但面临数据碎片化、高收入国家数据主导及模型可重复性差等问题。提出CASH-FM框架整合卫星监测、地面传感器、气象与健康数据,支持污染事件预测、健康归因及政策情景模拟,强调跨学科协作与标准化数据共享的必要性。

  

特刊

作为《环境科学与技术》(Environmental Science & Technology)“环境科学与技术60周年”特刊的一部分发表。

人类健康、空气污染和气候变化之间存在复杂的相互作用,这些相互作用也与社会经济发展密切相关。虽然工业发展和城市扩张推动了经济增长,但同时也显著加剧了空气质量恶化、呼吸系统疾病和过早死亡问题。越来越多的证据表明,空气污染给全球健康带来了沉重负担。在全球范围内,几乎所有人口(99%)所呼吸的空气都超出了世界卫生组织(https://www.who.int)规定的空气质量标准。暴露于环境和家庭空气污染每年导致约700万人过早死亡。(1)预计在本世纪,温度升高将超过空气污染,成为至少20%世界人口面临的主要健康威胁。(2)此外,极端热浪的加剧是气候变化中最紧迫且最不公平的挑战之一,它可能通过扰乱全球供应链来破坏全球经济。(3)在评估全球疾病负担(GBD)时,社会人口统计指数(SDI)——一个综合衡量人均收入、教育和总生育率的指标——是预测趋势的关键。(4)为了进行这种大规模评估,需要采用复杂的方法,整合人口统计指数、风险暴露因素、流行病学函数和经济模拟来进行全面评估。例如,研究人员通过结合气候预测、流行病学函数以及混合投入产出模型和可计算一般均衡(CGE)贸易模型,开发出了一个综合分析框架。(3)为了预测204个国家(2022-2050年)的全球疾病负担,研究人员开发了一个结合混合效应死亡模型和残差校正的框架,并使用贝叶斯模型预测了68种风险因素的未来影响。(4)尽管这种方法的复杂性(包括多阶段结构、跨学科数据和众多假设)提高了预测能力,但也限制了其可重复性和透明度。复现这些研究的难度凸显了标准化数据共享、简化建模方法以及明确量化不确定性的迫切需求。

开发集成分析基础模型的紧迫性


机器学习(ML)在环境健康应用中展现出了巨大潜力。(5)例如,中国基于AI的全国性评估显示,许多地区的细颗粒物(PM2.5)和臭氧浓度仍然处于危险水平。(6)然而,当前的ML实现方法在应对空气污染问题的系统性方面存在根本性局限。鉴于许多空气污染物的普遍性和动态性,现有的分析方法仍然零散且不足以应对这一挑战。传统的ML方法通常在狭窄的问题领域内运作,每次新任务都需要重新训练,并且难以有效整合不同类型的数据。(7)
最近在AI基础模型方面的突破为协调大气保护与人类健康目标提供了前所未有的可能性。AI研究正从机器学习和深度学习(DL)转向基础模型,这些模型在大量数据上进行预训练,可以通过微调适应各种下游任务。(8?10)在环境科学中,基础模型主要指的是在多样化、多模态环境数据上预训练的大规模AI模型,它们能够学习地球系统过程的通用表示方法。与传统针对特定任务的模型不同,这些模型可以作为可适应的框架,用于污染评估和气候影响分析等多种应用。通过整合气候、遥感、污染和社会经济数据,这些模型强调了跨尺度泛化和基于场景的预测能力,从而支持可持续的环境决策制定。例如,Aurora就是一个在海量地球物理数据集上预训练的基础模型,它在预测天气、极端事件和空气质量方面取得了领先性能,且计算成本仅为传统方法的几分之一,实现了可扩展和高效的环境预测。(10)我们认为,当前的危机要求超越渐进式改进,而AI基础模型通过整合多种数据类型(包括空气质量测量数据、排放清单、气象参数和人口健康结果),为该领域的发展指明了方向。

迈向集成AI基础模型


有充分证据表明,结合全球分布的监测数据、合成数据生成技术和隐私保护的模型训练可以克服数据敏感性和空间偏见带来的限制。(10)最近,医学AI领域也在向基础模型方向发展。例如,Global RETFound联盟旨在构建首个真正全球性的医学基础模型,该模型基于来自100多个国家的超过1亿张视网膜底片图像进行训练,以捕捉广泛的表型和人口多样性。(11)因此,我们提出开发一个结合气候变化、空气污染、社会经济因素和人类疾病负担(CASH-FM)的基础模型(图1)。CASH-FM可以基于Transformer或图神经网络(GNN)架构构建,通过统一框架处理这些多模态数据。这些架构能够捕捉序列数据流中的复杂时间依赖关系,从而实现稳健的污染健康动态预测。该模型旨在支持具体应用,如环境健康风险评估、气候健康预警、政策效益量化以及地理空间智能资源分配,展示了其在研究和决策支持中的实际应用潜力。这种设计优先考虑了三个关键目标:
(1)

多模态数据融合。CASH-FM整合了卫星遥感、地面传感器测量数据、排放清单、气象数据和健康统计等多源数据,以识别污染热点并量化健康负担。例如,将高分辨率PM2.5暴露数据集与医院入院记录相结合,可以揭示污染事件对健康的急性影响。(12)

(2)

多尺度预测能力。从街道级别的暴露评估到区域政策规划,CASH-FM应支持在不同排放控制策略下的健康结果预测。基于像Aurora这样的基础模型,(10)它可以模拟复杂的污染扩散动态和人口暴露情况,为传统化学传输模型提供快速、经济高效的替代方案。(13)

(3)

公共卫生决策支持。除了预测之外,CASH-FM还应作为政策制定者和医疗提供者的决策支持工具。它提出的干预措施能够在公共卫生效益和经济成本之间取得平衡,指导有针对性的空气质量建议、资源分配和基于证据的清洁能源转型。

图1

图1. 双架构CASH-FM基础模型的示意图。上层路径使用Transformer和U-Net处理网格化的多源数据,实现高分辨率的时空预测。下层路径利用多尺度图神经网络(GNN)对地理区域进行编码,捕捉复杂的空间交互关系。这些互补的架构为环境健康应用提供了通用且具有地理空间意识的决策支持。图标来自Flaticon(https://www.flaticon.com/),使用符合平台许可条款。

下载MS PowerPoint幻灯片

机遇与挑战


减轻环境和社会经济因素对健康的负面影响需要超越渐进式改进的解决方案。我们提出的CASH-FM模型可以预测污染事件、确定健康负担的来源,并评估政策方案。然而,仍存在关键挑战,如监测数据碎片化以及主要基于高收入国家数据训练的模型存在的多源偏差问题。透明的治理机制、联邦学习架构以及科学界、政策界和AI社区的共同努力对于将此类模型发展为全球公共产品至关重要。我们认为,这种方法可以将空气质量管理和气候管理重新定义为不仅限于监管任务,而是促进人口健康和地球福祉的基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号