《Frontiers in Immunology》:Occupational silica exposure drives systemic immune dysregulation and tumor microenvironment susceptibility: evidence from a real-world study
编辑推荐:
这篇综述整合了机器学习、体外实验与多组学分析,系统阐明了职业性二氧化硅暴露通过驱动单核/巨噬细胞NF-κB/IL-6炎症信号通路上调癌胚抗原(CEA),并促进肿瘤微环境(TME)重塑的分子机制,为职业暴露人群的癌症早期风险预警提供了可解释的生物标志物预测框架与干预新思路。
机器学习模型预测与解释
研究基于中国安徽省5482名产业工人的职业健康监测数据,构建了14种机器学习模型以预测癌胚抗原(CEA)阳性状态。结果表明,基于集成学习的CatBoost模型在测试集中表现最优,其受试者工作特征曲线下面积(AUC)、灵敏度和特异性均优于其他模型。决策曲线分析(DCA)进一步证实,CatBoost模型在广泛的阈值概率范围内能为识别CEA阳性高风险个体提供最高的临床净获益。
为增强模型的可解释性,研究采用SHAP框架量化了各特征对预测的贡献。分析显示,在众多血液学参数与职业暴露因素中,单核细胞/淋巴细胞比值(MLR)是对CEA阳性最重要的预测因子,凸显了系统性免疫失衡的核心作用。在职业暴露因素中,二氧化硅(SiO2)粉尘的SHAP贡献值最高,显著高于二氧化氮、煤尘和一氧化碳等其他暴露。SHAP依赖性分析进一步揭示,二氧化硅暴露与CEA阳性之间的关联呈明显的非线性特征,表现为阈值效应及高暴露水平下显著的个体间异质性,提示二氧化硅可能扮演了风险放大器的角色。
中介分析为上述关联提供了潜在的生物学通路解释。研究发现,MLR、中性粒细胞百分比、淋巴细胞百分比、中性粒细胞/淋巴细胞比值(NLR)及系统性免疫炎症指数(SII)等多个炎症指标,在二氧化硅暴露与CEA升高之间均显示出显著的中介效应。其中,MLR的中介效应占比最大,支持了“单核细胞主导的炎症活化是连接职业性二氧化硅暴露与CEA水平升高的关键机制环节”这一假说。
体外验证二氧化硅诱导的炎症反应与旁分泌调控
为验证计算模型揭示的机制,研究进行了体外实验。结果显示,二氧化硅纳米颗粒以剂量依赖性方式强烈激活人单核细胞系THP-1,显著上调白细胞介素-6(IL-6)、白细胞介素-1β(IL-1β)和肿瘤坏死因子-α(TNF-α)的mRNA表达。蛋白质印迹分析证实,二氧化硅处理可浓度依赖性地上调NF-κB p65蛋白表达,而使用NF-κB抑制剂BAY 11-7082预处理能显著抑制这种激活。
有趣的是,直接使用二氧化硅处理结直肠癌(CRC)细胞系HT29和Caco-2,仅引起CEA表达的轻微变化,未呈现明确的剂量反应关系。然而,用二氧化硅刺激后的THP-1细胞条件培养基处理CRC细胞,则能剂量依赖性地显著上调CEA的mRNA和蛋白分泌水平。这表明二氧化硅并非直接作用于肿瘤细胞,而是通过激活免疫细胞释放可溶性因子来间接调控CEA。
进一步的因果验证实验支持了这一炎症旁分泌轴。在THP-1细胞侧使用NF-κB抑制剂,或在CRC细胞侧使用IL-6中和抗体,均能部分逆转条件培养基诱导的CEA上调。这证实了二氧化硅通过激活单核细胞的NF-κB通路,促进IL-6等细胞因子分泌,进而以旁分泌方式驱动肿瘤细胞CEA表达的分子机制。
多组学分析识别核心基因并构建预后模型
研究通过整合比较毒物基因组学数据库(CTD)中的二氧化硅相关基因和GeneCards数据库中的结直肠癌相关基因,识别出42个重叠基因,它们可能作为连接环境暴露与肿瘤发生的分子桥梁。蛋白质-蛋白质相互作用(PPI)网络分析揭示了这些基因之间高度互联,并识别出包括AKT1、TNF、TGFB1、IL1B、MMP9、MMP2、FN1、ICAM1、PECAM1和CDH5在内的关键枢纽基因,这些基因在炎症反应、细胞外基质重塑和内皮功能调控中发挥核心作用。
基于这些核心基因构建的风险评分模型,在TCGA-CRC和GSE39582两个独立的结直肠癌队列中均显示出显著的预后预测价值。多变量Cox回归分析表明,该基因特征与患者的总生存期(OS)显著相关。在TCGA-CRC队列中,Kaplan-Meier生存分析显示高风险组患者的总体生存率显著低于低风险组。时间依赖性ROC曲线和决策曲线分析进一步证实了该模型在预测1年、3年、5年生存率方面具有良好的判别能力和临床净获益。
单细胞转录组解析肿瘤微环境重塑
为在单细胞水平上提供二氧化硅塑造肿瘤微环境易感性的证据,研究分析了GSE161277单细胞RNA测序(scRNA-seq)数据集。质量控制后,通过统一流形逼近与投影(UMAP)可视化揭示了结直肠癌样本中清晰的细胞群体,包括T细胞、B细胞、单核细胞、巨噬细胞、中性粒细胞、成纤维细胞、内皮细胞和上皮细胞等。
重点分析了与炎症和粘附相关的关键基因表达模式。比较分析显示,在结直肠癌样本的细胞中,ICAM1、TGFB1和IL1B的表达显著上调。特征图显示这些基因在特定的免疫和基质区室中富集,而非均匀表达,提示存在局部微环境激活。小提琴图分析进一步证实了这些基因在CRC样本中的表达水平显著高于对照组。这些单细胞层面的结果提供了直接证据,表明结直肠癌的特征是协调的免疫和基质转录重编程,与持续的炎症激活状态一致。粘附分子和细胞因子相关基因的富集,支持了“系统性免疫失调(可能由慢性职业暴露触发)有助于肿瘤微环境重塑,从而为肿瘤相关生物标志物升高和疾病进展创造许可性环境”这一模型。
讨论与展望
本研究通过整合真实世界数据、机器学习、体外实验与多组学分析,描绘了职业性二氧化硅暴露通过炎症介导的通路上调癌胚抗原(CEA)的机制与计算框架。从计算视角看,集成学习模型的优异表现凸显了捕捉职业暴露、血液学参数和系统性炎症指数之间非线性多维交互的重要性。SHAP模型的可解释性进一步揭示了以MLR为代表的炎症相关特征是连接特定职业毒素与CEA升高的关键介质。
从生物学机制看,二氧化硅颗粒被肺泡区的单核/巨噬细胞吞噬后,激活NF-κB轴,导致IL-6等促炎细胞因子上调和分泌。这些细胞因子通过旁分泌作用激活肿瘤细胞内的JAK/STAT3等通路,进而上调CEA等肿瘤标志物的表达。这一过程将系统性免疫失调确立为连接职业暴露与早期癌症风险的关键中间环节。
本研究具有多重意义:首先,将CEA纳入职业监测项目可促进高危人群的早期识别;其次,利用可解释模型能透明阐述暴露-生物标志物关系,加强监管问责并实现个性化风险评估;第三,明确炎症作为关键介质,为靶向免疫微环境的干预策略(如抗炎或细胞因子调控)铺平了道路。研究亦存在局限,如暴露数据基于监管阈值的二元分类、缺乏吸烟状况等潜在混杂因素信息、THP-1细胞系模型的普适性限制以及需要外部队列验证模型稳健性等。
总之,本研究支持“职业性二氧化硅暴露通过炎症驱动的旁分泌信号促进CEA升高”的模型。整合机器学习、分子生物学和暴露科学,为揭示环境致癌物与早期风险生物标志物之间的隐藏联系提供了有力范式。未来研究应将此方法扩展至其他暴露物,并探索动态CEA监测在职业暴露队列中的预后价值。