《Frontiers in Immunology》:A machine learning approach to a nine-SNP immunogenetic score for prognostic stratification in cervical cancer
编辑推荐:
本研究通过整合9个功能性细胞因子SNP(TNF-α、IL-1β、IFN-γ、IL-1RN、IL-10、IL-6)构建多基因风险评分(PRS),结合主成分分析(PCA)和随机森林(Random Forest)等机器学习算法,首次在突尼斯人群队列中建立了宫颈癌(CC)的免疫遗传分层模型,发现高风险遗传特征与总生存期显著相关(HR 2.45),为个体化预后评估提供了新策略。
引言
尽管筛查手段普及和HPV疫苗推广,宫颈癌仍是全球女性癌症相关死亡的主要原因。人乳头瘤病毒(HPV)感染是主要致病因素,但宿主免疫相关遗传变异在临床异质性中起关键作用。既往候选基因研究多聚焦单一基因,而多基因联合作用机制尚不明确。本研究基于突尼斯人群队列,通过整合9个免疫相关SNP和机器学习方法,探索宫颈癌的免疫遗传分层模型。
患者与方法
研究纳入130例经组织学确诊的突尼斯宫颈癌患者,采集外周血样本提取DNA。针对9个功能性SNP进行基因分型:TNF-α(rs361525,rs1800629)、IL-1β(rs16944)、IFN-γ(rs2430561)、IL-1RN(rs2234663)、IL-10(rs3024490,rs1800872,rs1800871)和IL-6(rs1474348)。采用主成分分析(PCA)、多维标度法(MDS)、K均值聚类和随机森林模型分析遗传特征与预后的关联。多基因风险评分(PRS)通过累加风险等位基因计算。
结果
免疫遗传特征分析
71.5%患者携带≥4个SNP变异,20%患者存在7-SNP高危遗传特征(rs1800629-A、rs16944-C、rs2430561-A、rs2234663-L、rs3024490-T、rs1800872-A、rs1800871-T)。分层聚类识别三个遗传亚群:Cluster 1(3.4%)、Cluster 2(20.5%)和Cluster 3(76.1%),呈现不同的基因型共分离模式。
临床关联性
TNF-α -238A等位基因与腺癌风险呈边界相关(OR 4.57,p=0.050),而IL-1β -511T等位基因显示保护作用(OR 0.45,p=0.049)。随机森林模型提示IFN-γ rs2430561是FIGO分期的首要预测因子。PRS与总生存期显著相关(HR 2.45,p<0.001),且在多变量分析中保持独立性。
多维度建模
PCA显示IL-10和TNF-α变异解释38.5%遗传方差。通路富集分析揭示TNF-α信号、IL-10抗炎通路和IL-1细胞因子通路的协同作用。蛋白互作网络显示IL-1α/IL-1β/IL-1R1轴为核心炎症枢纽。
讨论
本研究提出宫颈癌的免疫遗传多基因作用模型,强调细胞因子平衡(如TNF-α/IL-10轴)而非单一通路主导疾病异质性。基因-环境交互作用(如IL-1RN VNTR与吸烟、家族史关联)进一步细化风险分层。局限性包括样本量较小、缺乏HPV分型数据和独立验证队列。未来需整合基因组学与肿瘤微环境数据优化预测模型。
结论
九SNP免疫遗传评分系统通过机器学习算法实现宫颈癌预后分层,为资源有限地区的精准防治提供潜在工具。后续需在多中心队列中验证模型的临床适用性。