街道层面的环境细颗粒物与结核病:基于机器学习和贝叶斯方法的时空分析

《Environmental Pollution》:Street-level ambient fine particulate matter and tuberculosis: A machine learning and Bayesian spatiotemporal analysis

【字体: 时间:2026年02月15日 来源:Environmental Pollution 7.3

编辑推荐:

  短时PM2.5暴露通过空间异质性影响济南结核病发病率,滞后3天每增10μg/m3使IRR达1.02,老年女性农村居民及冷季风险更显著。

  
廖园|丹门|李华晨|李一凡|刘毅
中国山东省济南市山东大学公共卫生学院生物统计学系

摘要

结核病(TB)仍然是全球传染病导致死亡的主要原因之一,然而关于短期环境细颗粒物(PM2.5)暴露与细空间尺度上结核病发病率之间关联的证据仍然有限。我们研究了中国济南短期PM2.5暴露与结核病发病之间的街级关联,涉及2015年至2019年间共8,291例新诊断的活动性结核病病例。使用极端梯度提升(XGBoost)模型结合地理信息系统(GIS)估算了每日街级PM2.5浓度。应用带有人口偏移的贝叶斯分层时空模型来量化暴露-反应关系,并报告了发病率比(IRRs)。按年龄、性别、季节和居住地点进行了分层分析。结果表明,PM2.5浓度每增加10 μg/m3,在3天滞后时与更高的结核病发病率相关(IRR = 1.02,95% CI:1.01-1.03),这种效应持续到6天滞后时(IRR = 1.01,95% CI:1.00-1.02)。亚组分析显示,在老年人(≥65岁)、女性、农村居民以及寒冷季节(11月至4月)中效应更为显著。敏感性分析和SHAP分析证实了研究结果的稳健性以及暴露模型的可解释性。这些发现强调了需要采取有针对性的公共卫生干预措施,优先保护高风险亚群(老年人、女性和农村居民),并在寒冷季节加强污染控制以减轻结核病负担。

引言

结核病(TB)是一种由结核分枝杆菌(Mtb)引起的慢性呼吸道传染病。它仍然是全球十大死因之一,尤其是作为最致命的单病原体传染病,其致死率甚至高于获得性免疫缺陷综合征(AIDS)(世界卫生组织,2024年)。根据世界卫生组织的全球结核病报告,2023年全球有1080万新发结核病病例,导致125万人死亡(世界卫生组织,2024年)。在发展中国家,结核病尤为严重,因为医疗资源分配不均和预防控制体系薄弱加剧了感染风险和健康影响(Dye等人,2013年;Ramsay等人,2023年)。中国是结核病负担第三重的国家,2023年报告了741,000例新发病例(发病率:每10万人52例)和27,469例死亡病例,占全球总数的6.8%,仅低于印度(26%)和印度尼西亚(10%)(Chen等人,2025年)。由于结核病的成因复杂,且主要通过空气传播,因此为了更好地控制其流行,全面了解潜在的环境高风险因素与结核病加重之间的机制具有重要的临床和公共卫生意义(Bloom等人,2017年)。
环境空气污染是一个重要的环境风险因素,也是呼吸健康的关键决定因素。越来越多的证据表明,其免疫调节效应会损害宿主防御能力,从而增加对传染病的易感性并加剧其严重程度(Santos等人,2021年)。在大气混合物的各种成分中,细颗粒物(PM2.5,空气动力学直径≤2.5 μm)主要来源于燃烧过程、工业排放和车辆交通,具有较高的致病性(Fuller等人,2022年;Sigsgaard & Hoffmann,2024年)。由于其细小的空气动力学尺寸和高表面酸性,PM2.5有助于有毒化合物深入肺部实质并滞留,几乎占下呼吸道总颗粒沉积量的96%(Lin等人,2007年;Sarkar等人,2017年)。一些分析证实了PM2.5与呼吸系统疾病发病率/死亡率之间的暴露-反应关系(Cheng-hui,2022年;Dominici等人,2006年;Yan等人,2022年;Zanobetti等人,2009年)。例如,Zanobetti等人(2009年)的研究表明,PM2.5浓度每增加10 μg/m3,2天内平均浓度每增加10 μg/m3,呼吸系统疾病的发病率增加2.07%(95% CI:1.20-2.95)。与急性呼吸道疾病不同,结核病通常具有漫长的临床过程,从无症状潜伏期到活动性疾病的转变受宿主免疫完整性的影响(Cox等人,2008年)。新兴的生物学证据表明,PM2.5暴露可能会破坏这种微妙的平衡,可能增加初次感染风险和疾病进展(Makrufardi等人,2024年)。这是通过抑制肺泡巨噬细胞衍生的免疫反应和加重气道炎症来实现的,从而扰乱了宿主-病原体的基本相互作用(Huang等人,2020b;Popovic等人,2019年;Torres等人,2019年)。因此,全面评估暴露-疾病关联对于指导有针对性的预防策略和减轻高风险人群的结核病负担至关重要。
然而,关于PM2.5与结核病发病率之间关联的现有研究结果并不一致。一项基于2000年至2019年数据的美国研究表明,生物质和煤炭燃烧产生的PM2.5与大多数种族群体的结核病发病率呈正相关,其中PM2.5中的硫酸盐成分被认为是影响所有人群结核病发病率的最重要因素(Zhu等人,2025年)。此外,中国海南的一项病例交叉研究也发现,PM2.5浓度每增加一个四分位数范围(IQR),0-8天滞后期间活动性结核病的住院风险增加1.16倍(95% CI:1.04-1.28)(Zhu等人,2023年)。另外,中国合肥的一项时间序列研究显示,PM2.5浓度每增加10 μg/m3,3天滞后时结核病门诊就诊的最大特定相对风险(RR)为1.06(95% CI:1.00-1.12),而13天滞后时的累积RR为1.56(95% CI:1.06-2.30)(Huang等人,2020a)。然而,中国北京的一项七年时间序列研究并未发现PM2.5与结核病风险之间存在统计学上的显著关联(Sun等人,2023b)。虽然一项整合了中国、韩国和美国17项研究的荟萃分析表明长期暴露于空气污染物可能会增加结核病风险,但短期暴露没有显著效果(Xiang等人,2021年)。先前研究结果的差异可能源于多种因素。一个可能的原因是PM2.5的主要来源和化学成分在不同地区存在显著差异,例如硫酸盐、黑碳和有机物的比例不同,这可能导致毒性效应的变化,包括影响结核病易感性的机制。因此,从低污染地区得出的PM2.5对呼吸系统疾病影响的估计可能无法直接推广(Cao等人,2018年;Carey等人,2016年)。此外,复杂的混杂因素也可能导致研究结果不一致。结核病发病率本身受到多种人口统计学(如性别、年龄、居住地)和社会健康因素(如医疗资源分配)的影响(Carey等人,2016年;Nock等人,2003年)。全球疾病负担(GBD)显示,男性结核病发病率始终高于女性,且存在明显的年龄特定模式(Yang等人,2024年)。Kapwata等人(2022年)还展示了结核病发病率与医院床位可用性等医疗资源指标之间的负相关。
更重要的是,空气污染暴露评估方法的局限性构成了主要障碍。大多数现有研究依赖于区域平均暴露估计,这些估计往往缺乏足够的时空分辨率。其他传统方法,如最近邻平均法(Nock等人,2003年)或概率加权法(Bell,1986年),不足以准确捕捉污染物浓度的空间和时间异质性,导致区域暴露估计偏差(Peptenatu等人,2024年;Su等人,2024年)。这些局限性常常掩盖了关键的暴露梯度和潜在的疾病热点,阻碍了对高风险人群的准确识别,并可能掩盖或扭曲真实的暴露-反应关系(Kim等人,2020年;Su等人,2024年)。为了克服这些挑战,已经开发了许多更复杂的暴露建模方法。机器学习(ML)和时空框架的最新进展通过整合多源数据(如土地利用和气象变量)显著提高了污染物估计的精度(Abdillah等人,2025年;Singh等人,2020年;Smith等人,2016年)。例如,深度学习和集成学习算法可以有效捕捉复杂的非线性关系和局部尺度异质性,从而减少暴露分类错误(Abdillah等人,2024年;Wei等人,2024年)。此外,贝叶斯时空分层模型的整合有助于明确考虑残余的空间模式和时间趋势。这为将疾病动态与环境梯度联系起来提供了严格的统计框架(Alas等人,2022年;Sun等人,2023年)。尽管有这些方法上的进步,但很少有研究将高精度的基于ML的指标与贝叶斯框架结合起来研究结核病发病率。
在这项研究中,我们整合了中国济南的高分辨率多源数据(空气污染、气象、环境和人口数据),结合地理信息系统(GIS)和机器学习算法开发了一个高精度的PM2.5预测模型。然后利用贝叶斯时空分层模型,我们旨在实现三个关键目标:(1)量化街级尺度上短期PM2.5暴露对结核病发病的时空异质效应;(2)阐明PM2.5滞后效应的关键时间窗口;(3)识别易感人群的特征。最终,这项研究旨在推进空气污染和结核病发病的协同治理,为精准预防和公共卫生政策制定提供科学指导。

研究区域

本研究在中国山东省省会济南(35.95°N-37.54°N,116.22°E-117.97°E)进行。济南位于山东省中部山区北部,总面积为10,244平方公里。该地区空气污染严重,2019年的年均PM2.5浓度为53.80 μg/m3,是中国二级国家标准的1.5倍。这种污染的主要原因是该市大量的机动车

描述性统计

2015年至2019年间,中国济南共登记了8,291例结核病病例。其中,5,521例(66.59%)为男性,2,770例(33.41%)为女性;6,336例(76.42%)年龄<65岁,1,955例(23.58%)≥65岁;3,770例(45.47%)居住在农村地区,而4,521例(54.53%)居住在城市地区;温暖季节的病例数(52.20%)多于寒冷季节(47.80%)。细菌学检测显示5,580例(67.30%)结果为阴性,2,711例(32.70%)结果为阳性。
表2总结了PM2.5的描述性统计信息

讨论

在这项研究中,我们利用了中国济南的监测空气污染浓度、气象、地理和人口数据,结合GIS和ML构建了一个网格化的PM2.5暴露预测模型。然后我们采用了INLA实现的时空贝叶斯分层模型,该模型能够在处理高维数据时减少贝叶斯算法的计算负担,以探讨短期PM2.5暴露与8,291例结核病病例之间的关联。

结论

本研究表明,短期暴露于PM2.5显著增加了结核病发病率,每增加10 μg/m3,在3天滞后时风险增加1.92%(IRR = 1.02,95% CI:1.01-1.03)。在0-7天的暴露窗口内,累积风险持续上升,达到2.40%(IRR = 1.02,95% CI:1.01-1.04)。我们发现易感性存在显著异质性:老年人(≥65岁)在3天滞后时风险增加1.62%(IRR = 1.02,95% CI:1.01-1.02);女性表现出更多的

作者贡献声明

廖园:撰写——原始草稿、可视化、验证、正式分析、数据管理。刘毅:撰写——审阅与编辑、监督、资源管理、项目协调、概念构思。丹门:方法论。李一凡:软件开发。李华晨:调查研究、概念构思

未引用的参考文献

Chikovore等人,2020年;Chong等人,2022年;Di等人,2016年;Guo等人,2023年;Jones和Qin,2022年;Kami′nska,2018年;Li等人,2022年;Rue等人,2009年;Schaufnagel等人,2019年;Song,2017年;Sui等人,2022年;Sun等人,2023a;Wang等人,2021a;Zhang等人,2022年。

资助

本工作得到了国家自然科学基金(编号:2023YFC2604400和82103948)的支持。资助者在研究设计、数据收集与分析、发表决定或手稿准备方面没有发挥作用。

利益冲突声明

? 作者声明他们没有已知的可能会影响本文报告工作的竞争性财务利益或个人关系。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号