空气污染与健康队列研究中的潜在过度调整偏差:一项方法学研究
《International Journal of Hygiene and Environmental Health》:Potential over-adjustment bias in cohort studies of air pollution and health: A methodological study
【字体:
大
中
小
】
时间:2026年02月12日
来源:International Journal of Hygiene and Environmental Health 4.4
编辑推荐:
本研究通过系统回顾分析2021-2023年发表的高影响力期刊中175项队列研究,发现69.7%存在潜在过度调整,尤其是BMI等中介变量。采用DAG方法的研究过度调整比例降低至42.3%,但仍有不当应用。强调需规范DAG使用以避免偏差。
罗汉|高银燕|徐伟佳|孙辉|吴音心音
中南大学湘雅公共卫生学院流行病学与生物统计学系,中国长沙
摘要
目的
在因果推断研究中,混杂因素的调整至关重要;然而,过度调整(即过度的统计调整)可能会使因果效应的估计产生偏差。这一问题在环境健康影响研究中较为普遍,但尚未得到足够的重视。本研究旨在探讨当前在研究长期空气污染暴露与健康结果之间关系时存在的过度调整现象。
方法
我们检索了2021年1月至2023年10月期间发表在高影响力期刊上的队列研究,这些研究调查了长期环境空气污染暴露(包括细颗粒物、一氧化碳、氮氧化物、臭氧、二氧化硫)与健康结果之间的关系。两位审稿人独立筛选了相关研究并提取了相关信息。根据改进的析取因果标准(Modified Disjunctive Cause Criterion)识别出可能的过度调整情况。对所有数据进行了描述性分析。
结果
共纳入了175项研究。仅有26项(14.9%)使用了有向无环图(DAG)进行变量选择。超过一半的研究(122项,69.7%)存在潜在的过度调整;其中,120项(68.6%)调整了中介变量,2项(1.1%)同时调整了中介变量和混杂变量。最常被调整的中介变量是体重指数(98项,56.0%)和高血压(25项,14.3%)。使用DAG的研究中,过度调整的比例显著较低(42.3% vs 74.5%)。
结论
大量关于空气污染与健康的队列研究存在潜在的过度调整现象,只有少数研究使用DAG进行混杂因素选择以缓解这一问题。我们强调避免潜在过度调整的重要性,并倡导按照既定的方法学指南正确使用DAG,以降低过度调整的风险并提高未来研究的有效性。
引言
空气污染是对人类健康的一个公认的环境威胁(Goshua等人,2022年)。根据世界卫生组织(WHO)的数据,每年约有240万人死于与空气污染相关的疾病(Sierra-Vargas和Teran,2012年)。2021年的全球疾病负担研究将环境PM2.5确定为全球死亡率和伤残调整生命年的主要风险因素(Clark等人,2025年)。此外,空气污染是多种疾病的风险因素,如缺血性心脏病、急性下呼吸道感染和肺癌(Chen和Hoek,2020年)。
队列研究是常用于探讨空气污染与健康结果之间潜在因果关系的研究设计之一。尽管基于地理空间的卫星技术的进步提高了暴露测量的准确性(Hoek等人,2008年),但由于混杂偏倚的存在,建立这种因果关系仍然具有挑战性,这严重威胁了因果推断的有效性(Hemkens等人,2018年)。为了可靠地从观察数据中估计暴露-结果关联,适当调整相关混杂变量是必不可少的(VanderWeele,2019年)。
正确识别潜在的混杂因素是因果推断的关键第一步。错误的识别可能导致不适当的调整,尤其是过度调整,即对中介变量和混杂变量的过度调整,这可能会引入偏差并影响估计的暴露-结果关系的有效性(Schisterman等人,2009年)。有向无环图(DAG)是一种有效的方法,可以可视化变量之间的假设因果结构(Feeney等人,2025年),系统地组织复杂的因果关系并识别潜在的混杂因素,从而有助于避免过度调整(Tennant等人,2021a)。然而,在环境流行病学研究中正确应用DAG进行混杂因素调整的情况仍然有限(Gao等人,2025年)。
在空气污染与健康的研究中,过度调整往往没有得到足够的重视,其普遍性可能部分解释了为什么报告的空气污染与健康结果之间的因果关系的强度甚至存在争议(Mortimer等人,2022年;Liang等人,2014年)。例如,两项研究调查了中国人群中PM2.5与心血管疾病(CVD)之间的关联,得出了不同的结论:一项使用了DAG进行变量选择(Liu等人,2022年),而另一项则没有(Liu等人,2021年)。后者不恰当地调整了体重指数(BMI)这一中介变量,导致关联程度被低估(风险比[HR] 1.12,95% CI 1.06–1.21),而基于DAG的估计值为HR 1.29,95% CI 1.15–1.45)。
因此,本研究旨在调查长期空气污染暴露与健康结果研究中潜在过度调整的程度,并为未来研究提供减少过度调整的建议。
文献检索
文献检索
我们在PubMed中检索了探讨长期环境空气污染健康影响的队列研究。考虑到工作量较大,我们仅纳入了2021年1月1日至2023年10月2日(研究开始的时间点)期间发表的研究。检索策略包括常见空气污染物(环境细颗粒物(PM2.5)、一氧化碳(CO)、氮氧化物(NOx)、臭氧(O3)和二氧化硫(SO2)以及研究设计(队列研究)的相关关键词,并限制为英文出版物。
结果
初步文献检索共得到4132条记录。文献检索的详细信息见附加文件1中的表S1。排除了排名前10%的JCR百分位数之外的3742项研究,去除了重复项并筛选了标题和摘要后,评估了213篇全文研究。最终纳入了175项研究(图2)。
讨论
这项针对175项高影响力研究的文献调查发现,尽管有长期的建议和原则来避免这种偏差,但超过一半的研究仍存在通过调整中介变量而导致的潜在过度调整(van Zwieten等人,2022年,2024年)。此外,在采用推荐方法(如DAG)的研究中,仍观察到较高的潜在过度调整比例,这表明DAG的使用可能存在不当。
尽管系统化的方法有所改进
启示
鉴于长期空气污染研究中潜在过度调整的普遍性,我们敦促作者和编辑更加重视适当的混杂因素识别和调整。在假设驱动和病因学研究中,建议混杂因素的选择应基于先前的知识(Sourial等人,2019年),并强调使用DAG(van Zwieten等人,2022年)。此外,应遵守DAG构建的既定建议(Feeney等人,2025年;
优势与局限性
据我们所知,这是第一项研究长期空气污染与健康研究中潜在过度调整的研究。我们的发现突显了这一问题的普遍性,并强调了加强方法学严谨性的必要性。
需要承认几个局限性。首先,我们的分析仅关注了潜在的过度调整,而没有评估不必要的调整或调整不足,因为:i) 确认不必要的调整需要更强的证据
结论
大量关于空气污染与健康的队列研究存在潜在的过度调整,少数研究使用了DAG来指导混杂因素的选择。即使使用了DAG,有时也可能应用不当。这些做法共同威胁了因果推断的有效性。我们建议明确变量之间的时间关系,以更好地定义它们的因果作用,并避免潜在的过度调整。我们强调这一问题的重要性,并倡导
CRediT作者贡献声明
罗汉:撰写——审阅与编辑,撰写——初稿,方法学,调查,正式分析,数据管理,概念构建。高银燕:撰写——审阅与编辑,方法学,概念构建。徐伟佳:调查,正式分析。孙辉:方法学,概念构建。吴音心音:撰写——审阅与编辑,方法学,概念构建。
数据和材料的可用性
本研究生成或分析的所有数据均包含在本文及其补充信息文件中。
致谢
感谢研究小组成员的帮助。同时感谢ChatGPT在语言润色方面的帮助。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号