《Frontiers in Oncology》:Comparative effectiveness of low-dose CT lung cancer screening among high-risk non-smoking female subgroups and males in China
1 引言
肺癌是全球癌症相关发病率和死亡率的主要原因。2022年全球约有250万新发病例和180万死亡病例归因于肺癌。男性肺癌发病率约为女性的两倍,但性别差距正在缩小,男性肺癌年龄标准化发病率(ASIR)每年下降7.4%,而女性则每年上升0.9%。值得注意的是,女性肺癌发病率的上升在亚洲尤为明显,中国女性肺癌发病率年增长率高达8.3%。
观察性研究证据表明,被动吸烟、氡气、PM2.5、肺癌家族史和激素异常会增加非吸烟者的肺癌风险,但因果推断仍需更高质量的研究验证。低剂量计算机断层扫描(LDCT)筛查可将重度吸烟人群的肺癌死亡率降低20%至24%。然而,中国肺癌的流行病学格局呈现出独特特征,非吸烟女性发病率显著上升。因此,中国肺癌筛查指南已扩展到吸烟之外,纳入了职业暴露、被动吸烟、慢性阻塞性肺疾病(COPD)和肺癌家族史等其他风险因素。尽管如此,支持这些非吸烟风险因素的证据仍然有限,真实世界的筛查效果需要进一步验证。关于在非吸烟女性人群中实施LDCT筛查的可行性,包括筛查依从性、阳性率、肺癌检出率和潜在的过度诊断风险等关键问题仍然存在。
新兴的亚洲研究揭示了LDCT筛查在非吸烟者中的有效性。最近发表在JAMA上的一项研究报告称,中国非吸烟者(1.6%)和吸烟者(2.0-2.3%)的肺癌检出率相当,非吸烟者的早期检测率更高(93.2% vs. 80.4%)。中国台湾的非吸烟者肺癌筛查试验(TALENT)采用了包含非吸烟特异性因素的增强风险分层,结果显示第一年随访中的基线肺癌检出率为2.6%,超过了NLST的1.1%。亚洲女性非吸烟者筛查研究(FANSS)和韩国队列研究也报告了非吸烟女性侵袭性肺癌的较高检出率。这些发现共同证实了在非吸烟者中实施LDCT筛查的临床可行性。然而,较高的肺癌检出率可能引发对过度诊断的担忧。徐等人的研究揭示了LDCT筛查在中国人群中,尤其是在非吸烟女性中,导致了肺腺癌的显著过度诊断。过度诊断率随时间推移从2011-2015年的22%上升到2016-2020年的50%。这种过度诊断的可能性使患者面临不必要的干预风险和随之而来的心理困扰。因此,在非吸烟者中实施LDCT筛查的可行性,需要在其风险-获益背景下的国际讨论框架内进行。由此产生的一个关键优先事项是制定更精确的风险分层策略。
中国城市癌症筛查计划(CanSPUC)于2012年启动,是一项政府资助的、基于高危人群的城市筛查项目,覆盖28个省份,针对肺癌、乳腺癌、结直肠癌、肝癌和上消化道癌(食道癌和胃癌)五大主要癌症。该计划旨在实施结合一级、二级和三级预防策略的综合方法,以全面提升人口健康水平。根据癌症风险评估问卷的结果,参与者按其风险水平进行分类。高危个体被建议接受相应的癌症筛查,其中肺癌高危人群在指定的三级医院接受LDCT扫描。
本研究报告了2019年4月至2024年12月期间中国城市癌症筛查计划(CanSPUC)在浙江省的肺癌筛查结果。我们比较了非吸烟女性和男性在关键筛查指标上的表现,包括LDCT依从性、阳性率、肺癌检出率和假阳性率。本研究旨在解决两个关键目标:第一,通过评估非吸烟女性是否获得与男性相当的筛查益处来评价当前筛查指南;第二,通过识别非吸烟女性中的高危亚组并比较不同风险特征的筛查效率和产出,来完善风险分层。本研究的目的是为未来制定量身定制且有效的肺癌筛查策略提供证据。
2 材料与方法
2.1 研究设计与数据来源
我们在CanSPUC项目框架下进行了一项横断面研究。浙江省年龄在45-74岁、无肺癌症状、过去5年内未参加其他癌症筛查项目的居民有资格参加CanSPUC项目。数据收集使用标准化的癌症风险评估问卷,由经过培训的访调员通过电话或面对面访谈进行。所有收集的数据都输入到集中式数据管理系统中。为确保数据质量,实施了自动一致性检查,并为每位参与者分配唯一标识符,以便于链接和跟踪所有后续信息。进入CanSPUC队列后,符合以下条件之一的个体将被建议接受LDCT筛查:(a)有至少20包-年吸烟史且为当前吸烟者或过去15年内戒烟的前吸烟者;(b)诊断为慢性阻塞性肺疾病(COPD)或有弥漫性间质性肺纤维化病史;(c)有超过五年接触一种或多种职业致癌物(石棉、氡、铍、铀、铬、镉、镍、硅、柴油尾气、烟灰或烟灰渣)的历史;(d)非吸烟女性,暴露于符合上述(a)条件的同住家庭成员或同室同事的二手烟。高危非吸烟女性和高危男性均被纳入当前研究。显示研究人群招募过程的流程图见图1。
肺癌相关检查和临床结果的数据来源于医院病历、浙江省区域医疗保险系统和浙江省肿瘤登记处。所有数据通过国家癌症防治网络(NCPCN)的基于网络的管理系统安全传输到国家癌症中心(NCC)的协调中心。该项目获得了中国医学科学院北京协和医学院国家癌症中心/肿瘤医院以及参与医院的伦理委员会批准。
2.2 结局定义
研究结局包括:1)LDCT依从性,定义为所有被确定为肺癌高危的个体在风险评估日期后3个月内完成LDCT筛查的比例;2)LDCT阳性率,定义为接受LDCT筛查的高危个体中出现阳性结果的比例,阳性发现包括疑似肺癌或高危阳性结节(实性或部分实性结节≥8 mm;非实性结节≥15 mm);3)肺癌检出率,定义为通过LDCT筛查的每1000名高危个体中经病理活检(金标准)确诊的肺癌病例数;4)假阳性率,定义为LDCT结果阳性但通过金标准验证或后续随访确认未患肺癌的个体比例。缺乏明确验证的阳性筛查结果参与者被排除在此分析之外,如果这些病例并非随机缺失,则可能引入选择偏倚。
2.3 变量定义
研究的因素包括年龄;体重指数(定义为体重公斤数除以身高米数的平方);教育水平;被动吸烟(详见"研究设计与数据来源"部分"肺癌风险评估"标准4);职业接触有害物质;肺癌家族史;COPD病史;高血压;高脂血症和糖尿病。
关于女性生殖因素,本研究包括五个变量:(1)初潮年龄,<13岁和>16岁定义为异常;(2)绝经年龄,<43岁和>52岁定义为异常;(3)生育期,定义为绝经年龄减去初潮年龄,<30岁和>35岁视为异常;(4)首次活产年龄,<20岁和>25岁定义为异常;(5)母乳喂养持续时间,<7周和>12周定义为异常。具有≥2项异常指标的女性被定义为存在激素异常,该临界值通过敏感性分析验证为最优。女性生殖因素异常的临界值参考了CKB数据库。
2.4 统计分析
在研究人群特征的描述性分析中,我们使用百分比、均值和标准差(SDs)来描述整个队列以及按研究组(非吸烟女性组和男性组)的情况。鉴于我们主要结局的二分类性质以及为了直接估计风险比(RRs),我们采用多变量稳健(修正)Poisson回归模型来生成调整后的RRs(aRRs)。选择该方法是因为对于我们的研究结局而言,相对风险(RR)是比比值比(OR)更直接且临床可解释的效应测量指标。具体来说,当结局并不罕见时(例如,我们的筛查依从性和阳性率结局超过10%),逻辑回归得出的OR会显著高估RR。修正Poisson回归通过提供直接且稳健的RR估计值来避免这种高估。风险比针对年龄、BMI、教育水平、被动吸烟、职业接触有害物质、结核病史、COPD病史、肺癌家族史、高血压、高脂血症和糖尿病进行了调整。虽然这种调整增强了我们估计的内部有效性,但我们承认由于未测量或测量不完善的因素(例如,遗传易感性、室内空气污染)可能存在残余混杂。为了将我们的发现置于背景中,我们讨论了这种混杂对结果解释的潜在影响。所有统计分析和图形可视化均使用R 4.4.1进行。所有检验均为双侧,P ≤ 0.05被认为具有统计学意义。
3 结果
3.1 研究人群特征
如图1所示,2019-2024年期间,CanSPUC队列共招募了224,046名合格参与者。排除风险评估问卷不完整的参与者(n=9,587)、风险评估结果显示非肺癌高危的参与者(n=123,591)以及吸烟女性(n=2,071)后,最终分析纳入了88,797名肺癌高危参与者。肺癌高危人群的特征见表1,包括人口统计学特征、生活方式因素、基线合并症和女性生殖因素。总体而言,入组人群中男性和非吸烟女性比例几乎相等(50.9% vs. 49.1%)。男性中,6,988例(15.5%)为非吸烟者。平均年龄为61.6岁(SD = 6.7岁),大多数(86.3%)年龄在51至70岁之间。
3.2 非吸烟女性、非吸烟男性和吸烟男性肺癌筛查的比较获益
在88,797名被确定为肺癌高危的个体中,有54,333人按照项目建议完成了LDCT筛查,总体参与率为61.2%。与非吸烟女性相比,非吸烟男性和吸烟男性表现出不同的筛查模式。非吸烟男性的LDCT依从性显著较低(aRR=0.82, 95% CI 0.79-0.85),阳性率降低(aRR=0.83, 95% CI 0.70-0.98),肺癌检出率大幅下降(aRR=0.57, 95% CI 0.37-0.86),而假阳性率相当(aRR=1.04, 95% CI 0.87-1.24)(图2)。相比之下,吸烟男性的依从性显著更高(aRR=1.22, 95% CI 1.20-1.24),阳性率升高(aRR=1.12, 95% CI 1.04-1.20),肺癌检出率增加(aRR=1.36, 95% CI 1.17-1.57),假阳性率相似(aRR=1.02, 95% CI 0.94-1.10)(图2)。总体而言,与非吸烟女性相比,筛查结局因男性吸烟状况而异:非吸烟男性在所有指标上均表现出 consistently 较低的比率,而吸烟男性则显示出显著更高的依从性、阳性率和肺癌检出率。
3.3 非吸烟女性肺癌的风险分层
在本研究中,将激素异常定义为具有≥2项生殖因素异常,是在敏感性分析后确定的最佳临界值。通过比较激素异常的三种定义(≥1、≥2和≥3项异常)的详细敏感性分析,验证了≥2定义的合理性。结果表明,原始定义(≥2项异常)在多个指标上表现最优:优越的风险区分度(RR = 1.41 vs. ≥1/≥3定义的1.12/1.34)、均衡的人群覆盖率(55.0% vs. 85.9%/23.7%)以及改进的模型拟合优度。这些发现共同证实了使用≥2项异常作为风险分层阈值的稳健性和流行病学适当性。
图3显示了识别非吸烟女性肺癌检出风险因素的多变量稳健(修正)Poisson回归分析结果。构建了四个模型:模型1和模型2分别调整了被动吸烟和激素异常。被动吸烟与肺癌风险显著增加46%相关,而激素异常与风险升高39%相关。完全调整的模型3证实,被动吸烟和激素异常都是非吸烟女性肺癌的独立危险因素。模型4评估了被动吸烟和激素异常之间的交互作用,未发现显著的相乘交互作用(aRR=0.89, 95% CI 0.46-1.66, p=0.710)。基于这两个因素,将非吸烟女性分为四个不同的风险组:低风险组(无任何因素)、中风险组(仅有被动吸烟)、中风险组(仅有激素异常)和高风险组(两者兼有)。
3.4 四个非吸烟女性亚组与男性组(全体男性组和吸烟男性组)肺癌筛查的比较获益
图4比较了不同风险分层的非吸烟女性亚组与男性组之间的四个关键筛查指标。在调整了年龄、BMI、教育水平、被动吸烟、职业接触有害物质、结核病史、COPD病史、肺癌家族史、高血压、高脂血症和糖尿病后。与全体男性相比,大多数非吸烟女性亚组的筛查指标显著较低。然而,同时具有被动吸烟和激素异常的高危亚组在肺癌检出率(aRR=0.93, 95% CI 0.77-1.13)和假阳性率(aRR=0.95, 95% CI 0.85-1.07)方面无统计学显著差异。类似地,仅有激素异常的亚组在肺癌检出率方面也显示出无显著差异(aRR=0.58, 95% CI 0.31-1.10)。
当与吸烟男性进行具体比较时,出现了相似的模式。同时具有两个因素的高危亚组在肺癌检出率(aRR=0.88, 95% CI 0.72-1.07)和假阳性率(aRR=0.96, 95% CI 0.85-1.07)方面保持无统计学显著差异,而仅有激素异常的亚组在检出率方面也显示出无显著差异(aRR=0.55, 95% CI 0.29-1.03)。总的来说,这些发现识别出一个定义明确的高危非吸烟女性亚组,其特征是同时存在被动吸烟和激素异常。该亚组在肺癌检出率和假阳性率方面的筛查结局与男性人群相比无统计学显著差异。
4 讨论
本研究比较了肺癌高危非吸烟女性和男性一次性LDCT筛查的效果。关键指标包括LDCT依从性、阳性率、肺癌检出率和假阳性率。非吸烟女性在所有四个指标上的比率均显著低于吸烟男性,这表明当前筛查标准在应用于女性时存在局限性。受此发现启发,我们进一步采用了风险因素富集策略,揭示了非吸烟女性群体内部的显著异质性。多变量修正Poisson回归确定被动吸烟和激素异常是非吸烟女性肺癌的独立危险因素。基于这两个因素的风险分层显示,同时表现出两种风险因素的非吸烟女性在LDCT依从性、阳性率、肺癌检出率或假阳性率方面与男性(包括吸烟男性)相比无显著差异。这些发现表明,同时存在被动吸烟暴露和激素异常的非吸烟女性可能以与男性相当的方式从LDCT筛查中获益。
我们的研究揭示了高危个体LDCT筛查依从性的显著差异。非吸烟女性的依从率(56.6%)显著低于吸烟男性(69.4%),非吸烟男性的参与率最低(45.4%)。调整后的分析证实了这些模式,表明非吸烟男性的依从性显著降低(aRR=0.82, 95% CI 0.79-0.85),而吸烟男性的依从性升高(aRR=1.22, 95% CI 1.20-1.24)。这些差异可能部分归因于普遍的健康信念,因为肺癌长期以来主要与吸烟和男性性别相关。这种认知可能导致非吸烟女性,尤其是非吸烟男性低估其个人风险,从而导致参与率较低。除了风险认知外,性别间健康寻求行为的差异以及系统性障碍,如后勤挑战或与非吸烟者相关性较低的筛查推广,也可能促成这些差异。值得注意的是,该高危队列的总体LDCT依从性较早期国家筛查项目报告率有显著改善。观察到的比率超过了2013-2018年河南省CanSPUC(40.2%)、浙江省(48.2%)以及该时期的全国平均水平(35.6%)。这种显著增长可能反映了公众癌症筛查意识的提高以及当前筛查项目组织和实施的优化。
男性肺癌主要由烟草暴露驱动,通常表现为中央型鳞状细胞癌,影像学特征更明显。相比之下,非吸烟女性的肺癌可能由遗传易感性、激素影响或其他环境因素驱动,通常表现出惰性生物学行为,早期影像学发现细微,如磨玻璃结节。这种病理学特征可能导致了她们较低的阳性率和肺癌检出率。我们研究中观察到的高假阳性率与高危人群初始LDCT筛查的既定模式一致,NLST第一轮假阳性率为96.2%就证明了这一点。非吸烟女性中同时观察到的较低假阳性率表明筛查特异性更高,提示当前标准捕获了许多非高危个体。这些发现强调了风险分层策略以细化筛查目标人群的必要性。
在本研究中,多变量修正Poisson回归分析表明,被动吸烟和激素异常均独立增加了高危非吸烟女性的肺癌风险,且这些因素之间没有交互作用的证据。国际癌症研究机构(IARC)和美国国立卫生研究院已将二手烟(SHS)归类为1类致癌物。倪等人的一项荟萃分析报告称,归因于被动吸烟的肺癌合并相对风险为1.40(95% CI: 1.08-1.82),并证明了显著的剂量反应关系,风险随着被动吸烟持续时间、强度和累积年数的增加而上升。然而,二手烟导致肺癌发生的潜在生物学机制需要进一步研究。与有吸烟史的男性肺癌相比,非吸烟女性肺癌表现出独特的流行病学和生物学特征。最近的综述强调,雌激素,特别是通过雌激素受体β(ERβ),在非小细胞肺癌(NSCLC)中塑造促肿瘤微环境方面起着关键作用,影响各种免疫细胞的功能,并导致肿瘤进展和免疫治疗反应的差异,这为流行病学研究中观察到的激素关联提供了合理的生物学基础。先前来自英国生物银行前瞻性队列的证据发现,过早绝经、较短的生育期和较早的首次生育年龄与女性肺癌风险升高相关。随后,中国嘉道理生物银行一项针对女性非吸烟者的大型前瞻性调查揭示了外源性激素暴露和母乳喂养相关的独特风险模式。这项后期研究发现,口服避孕药的使用与肺癌风险增加相关,而每个孩子较长的母乳喂养持续时间与风险降低相关。然而,这些发现来自具有异质性人群和有限激素测量的观察性研究。未来的研究应优先采用具有标准化内分泌评估的前瞻性设计来解决这些局限性。
研究表明,同时具有被动吸烟和激素异常的非吸烟女性,在所有四个关键LDCT筛查指标上与男性(包括吸烟男性)相比无统计学显著差异。这表明,这一特定的女性亚组不仅携带与男性相当的肺癌风险,而且通过LDCT实现了相似的筛查效果。这些发现得到了一项包含13项亚洲研究的荟萃分析的支持,该分析显示非吸烟女性与高危前吸烟男性的诊断率相当(RR = 1.02, 95% CI: 0.94-1.11),同时非吸烟者的早期检测率显著更高(82.4% vs. 50.6%),死亡率更低(HR = 0.59, 95% CI: 0.42-0.83)。因此,我们建议这一明确界定的女性亚组应考虑获得与男性人群相似的LDCT筛查推荐。此外,这个定义明确的亚组提供了具体的变量,可以整合到人工智能驱动的筛查工具中,以在临床和公共卫生领域自动高效地识别高危个体。
本研究存在一些局限性。首先,由于所有参与者均仅来自浙江省,我们的发现推广到其他地区、种族或社会经济背景的适用性可能有限。其次,确诊肺癌病例的临床随访仍在进行中;因此,尚无法获得全面的疾病特征(如完整的癌症分期数据)进行分析。第三,激素异常的分类主要基于自我报告的生殖史,这可能存在回忆偏倚。第四,我们缺乏遗传易感性和特定烟草产品类型的数据,这些是重要的未测量混杂因素。尽管多变量调整增强了我们估计的内部有效性,但我们承认由于其他未测量或测量不完善的因素(如室内空气污染)可能存在残余混杂。未来的研究应旨在整合激素水平的直接生化评估、基因图谱和详细的吸烟史,以验证和提高这种风险因素分类的准确性。
总之,当前肺癌筛查标准对女性人群的适用性有限,表现为非吸烟女性的LDCT依从性、阳性率和检出率均显著低于吸烟男性。关键的是,我们识别出一个定义明确的非吸烟女性亚组,其特征是同时存在被动吸烟暴露和激素异常。该亚组表现出的筛查结局与男性观察到的结局无统计学显著差异。这一发现为制定更精确、风险分层的筛查标准提供了实证证据,这些标准能更好地解释肺癌风险和临床表现的性别特异性差异。