整合单细胞分辨率肿瘤微环境生态系统与多组学的深度学习模型(SCMO)改善结直肠癌患者生存预测与精准治疗靶点发现

《Journal of Translational Medicine》:SCMO: a deep learning model integrating the single-cell resolution TME ecosystem and multi-omics for survival prediction in CRC patients

【字体: 时间:2026年02月21日 来源:Journal of Translational Medicine 7.5

编辑推荐:

  本研究开发了一个名为SCMO(整合单细胞分辨率肿瘤微环境生态系统与多组学数据)的深度学习模型,用于提升结直肠癌(CRC)患者的生存预测。该方法通过解卷积(deconvolve)大量转录组数据,重建单细胞水平的肿瘤微环境(TME)特征,并将其与临床、基因组、转录组和微生物(MIC)等多组学数据相结合。研究鉴定了13个与生存相关的TME特征,开发了具有强预测性能的模型(C-index = 0.762),并通过可解释性算法发现了TRAP1这一潜在治疗靶点,进而在体外验证了化合物柴胡皂苷A(saikosaponin A)的抗癌活性,为CRC的预后评估和个体化治疗提供了新视角。

  
结直肠癌与精准预后
结直肠癌(CRC)是全球范围内发病率和死亡率均居前列的恶性肿瘤,精准的生存预后预测对于指导临床决策至关重要。尽管组织水平的多组学数据已被广泛应用于生存预测,但其有限的分辨率难以捕捉肿瘤的异质性。单细胞RNA测序(scRNA-seq)技术能够在细胞分辨率下解析肿瘤微环境(TME),为个体化预后评估提供了支持。
构建CRC特异性TME图谱与生存相关特征发现
本研究收集了213个CRC scRNA-seq样本,构建了一个包含339,060个细胞的CRC特异性TME图谱。利用该图谱作为参考,通过EcoTyper算法对来自TCGA-CRC队列的大量RNA测序数据(bulk RNA-seq)进行解卷积,重建了TME特征。研究者从该特异性图谱中鉴定出13个与生存相关的TME特征,包括12个细胞状态和一个多细胞生态系统(E15)。解卷积结果显示,超过98%的TME特征在多个独立的bulk RNA-seq队列中被成功重建,证明了该图谱的稳健性。单因素Cox分析表明,这些特征与TCGA-CRC队列患者的总体生存显著相关,其中E15(由巨噬细胞、成纤维细胞等多种细胞类型构成)与不良预后相关,其丰度能有效对患者进行风险分层。
SCMO预测模型的构建与性能评估
研究者整合了从TCGA-CRC队列中提取的TME特征、RNA表达谱、DNA突变数据和微生物丰度数据,通过自归一化神经网络(SNN)构建了深度学习模型SCMO。模型在训练集和测试集上都展现了优异的预测性能,一致性指数(C-index)达到0.762,优于随机生存森林(RSF)、生存支持向量机(SVM)、梯度提升机(GBM)、CoxBoost、DeepHit和DeepOmix等现有方法。在时间依赖性ROC曲线分析中,SCMO在1年、3年和5年生存预测的曲线下面积(AUC)分别为0.752、0.772和0.869(训练集)以及0.639、0.756和0.772(测试集),显示出强大的长期预后预测能力。此外,研究将SCMO框架应用于其他五种癌症类型(CESC、BRCA、BLCA、ESCA、HNSC),模型均表现良好,证明了其跨癌种的稳健性和可扩展性。
TME特征的生物学功能与空间分布解析
为了提升模型的可解释性,研究者利用整合梯度算法分析了SCMO中关键特征的贡献。分析发现,TME特征的平均贡献度高于其他组学特征,解释了其加入能进一步提升模型性能的原因。对生存相关细胞状态的基因本体论(GO)功能富集分析揭示了它们在肿瘤发生发展中的潜在作用,例如内皮细胞状态S10富集了血管生成调控,成纤维细胞状态S03富集了肌肉系统过程。特别地,对E15生态系统内的细胞间通讯分析显示,COLLAGEN通路的信号传导被显著激活,这可能通过诱导上皮间质转化(EMT)来促进肿瘤细胞迁移和侵袭。通过分析空间转录组(ST)数据,研究者发现E15在高级别(G3)肿瘤中更为富集,且其空间聚集程度显著高于低级别(G1)肿瘤,进一步证实了E15作为不良预后标志的空间生物学基础。
关键多组学特征的识别与功能网络
整合梯度算法识别出对各组学层预测贡献度最高的特征,包括RNA层面的ORC1、拷贝数变异层面的TCF7L2、突变层面的CSMD2以及微生物层面的具核梭杆菌(Fusobacterium)等。为了探究微生物对预后的影响,研究者构建了一个包含582个节点和1,824条边的“微生物-代谢物-蛋白”多层互作网络,其中Fusobacterium在网络中具有较高的节点中心度。京都基因与基因组百科全书(KEGG)通路富集分析表明,网络中的代谢物和蛋白节点主要富集在氨基酸代谢、糖代谢和能量代谢等通路,提示肿瘤内微生物可能通过调节宿主代谢重编程影响TME。
SCMO指导下的患者风险分层与治疗策略探索
根据SCMO模型计算的风险评分中位数,CRC患者被分为高风险组和低风险组。风险评分能够有效区分患者预后,并且在共识分子分型(CMS)系统的CMS4亚型内部,进一步区分出预后较好和较差的亚群,显示出对现有分类系统的细化能力。分析显示,高风险组患者免疫检查点(如HHLA2)的表达水平较低,呈现出“免疫冷”表型,这可能与其对常用化疗药物(如5-氟尿嘧啶)的敏感性降低有关,提示了治疗挑战。
发现潜在治疗靶点与天然化合物筛选
为了探索高风险患者的新治疗策略,研究者利用疾病相关差异表达基因通过CMap算法筛选了HERB中药数据库中的天然化合物。同时,整合梯度分析将肿瘤坏死因子受体相关蛋白1(TRAP1)鉴定为关键特征。随后的分子对接预测了天然化合物与TRAP1蛋白(PDB: 7U8X)的结合模式。在49个有潜力的化合物中,羟基红花黄色素A(hydroxysafflor yellow A)和柴胡皂苷A(saikosaponin A)与TRAP1 ATP结合位点的结合模式优于已知抑制剂,并形成了丰富的氢键网络。
体外实验验证柴胡皂苷A的抗癌活性
免疫组化分析证实,CRC肿瘤组织中TRAP1蛋白表达显著高于癌旁正常组织。体外实验表明,与已知的TRAP1抑制剂TRAP1-IN-1类似,使用20 μM柴胡皂苷A处理HT29、HCT116和SW480细胞系24小时后,能显著诱导活性氧(ROS)水平上升,抑制细胞活力,并促进细胞凋亡。进一步的蛋白质印迹分析显示,柴胡皂苷A能诱导TRAP1的客户蛋白NDUFS1、谷氨酰胺酶-1和Sirt3发生选择性降解,这与已知TRAP1抑制剂的作用机制一致,证实了柴胡皂苷A通过靶向TRAP1发挥其抗癌活性。
SCMO-Lite:面向临床转化的简化模型
考虑到获取完整多组学数据的临床挑战,研究者基于SCMO模型识别出的12个高权重、且有充分文献支持与CRC进展相关的多组学特征(如DNAJB8、TTN、CSMD2、TCF7L2、Oribacterium等),开发了一个简化的多变量Cox回归模型(SCMO-Lite)。该模型在TCGA-CRC内部训练/测试集以及两个独立的外部验证队列中均表现出稳健的风险分层能力,并可通过整合年龄、性别、肿瘤分期等临床参数构建诺谟图(Nomogram),用于预测患者的1年、3年和5年生存概率,显示出良好的临床转化潜力。
结论与展望
SCMO框架通过整合单细胞分辨率TME特征与多组学数据,显著提升了CRC生存预测的准确性,并具有良好的生物学可解释性。它揭示的TME生态系统空间模式、鉴定的关键预后特征(如TRAP1)以及发现的潜在治疗药物(柴胡皂苷A),为理解CRC生物学和开发新的精准治疗策略提供了新见解。未来,随着液体活检(如循环游离DNA)等更多生物标志物的加入,以及模型在更大规模空间转录组数据中的验证,SCMO框架有望得到进一步完善,并为肿瘤预后预测和个性化治疗开辟新的道路。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号