《Frontiers in Immunology》:Development and validation of an interpretable machine learning model identify the lactylation-related protein SUSD3 as a prognostic and therapeutic biomarker for breast cancer
编辑推荐:
本文通过整合单细胞RNA测序(scRNA-seq)、空间转录组学等多组学数据,结合10种机器学习算法构建了乳腺癌乳酸化相关基因预后指数(LAGPI)模型,首次揭示SUSD3通过调控乳酸化修饰促进乳腺癌恶性进展及免疫逃逸,为个体化免疫治疗策略提供了新型生物标志物与靶点。
引言
乳腺癌作为女性癌症相关死亡的主要原因,其分子亚型的异质性对精准医疗提出严峻挑战。乳酸化是一种新发现的蛋白质翻译后修饰,在肿瘤生物学中扮演重要角色,但其在乳腺癌发生发展中的具体作用机制尚不明确。本研究旨在通过多组学整合分析揭示乳酸化相关基因的临床意义,并构建可预测预后的机器学习模型。
材料与方法
研究从TISCH、TCGA、GEO等公共数据库获取乳腺癌单细胞RNA测序、转录组及空间转录组数据。通过文献挖掘鉴定336个乳酸化相关基因,利用GSVA算法评估不同细胞类型的乳酸化评分。采用共识聚类将患者分为3个乳酸化亚型,并通过ssGSEA和多种算法评估免疫浸润特征。基于差异表达基因,结合随机生存森林等10种机器学习算法构建预后模型,利用SHAP分析关键基因贡献度。实验验证包括免疫组化、Western blot、细胞功能实验等。
结果
单细胞图谱显示乳腺癌微环境中13种细胞类型具有显著异质性,其中浆细胞乳酸化活性最低,而上皮细胞、内皮细胞等呈现高乳酸化特征。高乳酸化组细胞间通讯更强,内皮细胞和单核/巨噬细胞为关键信号枢纽。基于35个乳酸化预后相关基因的聚类分析将患者分为3个亚型,其中C亚型富集于MTORC1信号通路、G2/M检查点等增殖相关通路。突变分析显示TP53在B亚型突变率最高。机器学习模型筛选出13个核心基因(包括SUSD3、G6PD、FBXL6等),随机森林模型在验证集中C-index达0.696。空间转录组学发现SUSD3与成纤维细胞分布呈正相关,实验证实SUSD3过表达可增强乳腺癌细胞增殖、迁移能力并促进乳酸化修饰。
讨论
本研究首次将乳酸化修饰特征与机器学习相结合,构建的LAGPI模型能有效预测乳腺癌患者生存结局及免疫治疗响应。SUSD3作为关键基因与成纤维细胞相互作用,可能通过调控肿瘤微环境乳酸化水平影响疾病进展。模型揭示的高风险组具有高肿瘤突变负荷和低免疫浸润特征,为免疫耐药机制研究提供新方向。未来需通过多中心临床验证及功能实验进一步阐明乳酸化修饰的分子机制。