《HUMAN MUTATION》:Decoding the Sphingolipid Landscape of Clear Cell Renal Cell Carcinoma: A Single-Cell-Guided Prognostic Model Built With 101 Machine Learning
编辑推荐:
背景:透明细胞肾细胞癌(clear cell renal cell carcinoma, ccRCC)是肾癌最常见的组织学亚型,在进展、转移及治疗反应方面表现出显著异质性。鞘脂代谢(sphingolipid metabolism)已被证实是肿瘤进展及肿瘤微环境
背景:透明细胞肾细胞癌(clear cell renal cell carcinoma, ccRCC)是肾癌最常见的组织学亚型,在进展、转移及治疗反应方面表现出显著异质性。鞘脂代谢(sphingolipid metabolism)已被证实是肿瘤进展及肿瘤微环境(tumor microenvironment, TME)的重要调控因子,但其在ccRCC中细胞状态特异性的作用机制尚不清楚。
方法:研究人员整合了来自多个队列的公共数据集,包括来自基因表达综合数据库(Gene Expression Omnibus, GEO)的单细胞RNA测序数据,以及来自Xena、ArrayExpress和国际癌症基因组联盟(International Cancer Genome Consortium, ICGC)的批量转录组和临床数据。采用非负矩阵分解(nonnegative matrix factorization, NMF)解析细胞异质性,识别不同细胞亚群中与鞘脂代谢相关的特征基因。通过筛选101种机器学习组合构建预后模型,并在独立队列中进行验证。补充分析包括免疫特征分析、通路富集、药物敏感性预测、蛋白质-蛋白质相互作用网络分析及突变谱分析。
结果:单细胞分析在ccRCC中鉴定出代表9种主要细胞类型的23个细胞簇,并进一步在免疫和基质区室内解析出多个由鞘脂代谢相关元基因定义的亚簇。基于这些特征,研究人员评估了101种机器学习组合,最终使用Lasso+SuperPC模型建立了包含12个基因的预后特征。该模型在独立队列中表现出稳定的预后性能,优于传统临床变量,并且与独特的免疫特征、预测的治疗脆弱性及突变相关的基因组特征相关。
结论:本研究提供了一个单细胞指导的框架,用于理解ccRCC微环境中鞘脂代谢相关的异质性,并建立了一个12基因预后特征,在风险分层和治疗优先级排序方面具有潜在价值。
研究背景与意义
透明细胞肾细胞癌(ccRCC)约占肾脏恶性肿瘤的80%,是泌尿系统第二大常见恶性肿瘤,其发病率逐年上升,因高复发率和高死亡率对患者生存构成严重威胁,同时也给医疗系统带来沉重经济负担。尽管手术、靶向治疗和免疫治疗已取得一定进展,但ccRCC患者的临床结局仍存在高度异质性,尤其在疾病进展、转移潜能及治疗反应性方面差异显著。目前ccRCC的预后评估主要依赖临床病理特征,难以充分捕捉导致患者结局各异的分子及微环境多样性。鞘脂作为细胞膜的重要组成成分,不仅维持结构稳定,还参与调控细胞信号传导、增殖和凋亡等关键生理过程。鞘脂代谢失调已被证实与多种肿瘤的发生发展密切相关,可通过破坏细胞膜结构、干扰细胞信号通路促进肿瘤进展,并在肿瘤微环境(TME)中发挥重要调控作用,影响肿瘤细胞与周围基质的相互作用,包括增殖、侵袭、转移、血管生成及耐药性等过程。然而,鞘脂代谢在ccRCC中的精确分子机制及其对免疫治疗的影响尚未明确,亟需深入探究以阐明其具体作用通路及在免疫治疗应答中的潜在调控角色。
在此背景下,研究人员旨在通过整合单细胞转录组分析与非负矩阵分解(NMF)技术,系统解析ccRCC微环境中鞘脂代谢调控的细胞异质性,并在此基础上开发基于鞘脂代谢相关特征基因的预后评分模型,以改善患者风险分层并为个体化治疗策略提供依据。该研究成果已发表于《HUMAN MUTATION》。
关键技术方法
研究人员整合了来自GEO、UCSC Xena、ICGC及ArrayExpress数据库的多队列公共数据。其中,ccRCC单细胞RNA测序数据来自GEO,包含3个肿瘤样本和1个正常样本;批量RNA测序训练集来自UCSC Xena,测试集来自ICGC,独立验证集来自ArrayExpress。体细胞突变数据来自TCGA-KIRC队列。研究采用Seurat进行单细胞数据处理与聚类,利用NMF解析细胞内异质性并识别鞘脂代谢相关特征基因,通过SCENIC分析转录因子活性,系统比较101种机器学习算法组合构建并筛选最优预后模型,结合CIBERSORT和ssGSEA进行免疫细胞浸润与功能分析,并开展GO、KEGG通路富集、药物敏感性预测、蛋白质-蛋白质相互作用网络构建及体细胞突变分析。
研究结果
3.1 ccRCC肿瘤微环境细胞中鞘脂代谢相关基因的分布
研究人员通过质量控制与批次校正,在ccRCC单细胞数据中鉴定出23个细胞簇,注释为T细胞、上皮细胞、巨噬细胞、NK细胞、单核细胞、平滑肌细胞、内皮细胞、肥大细胞和B细胞共9种主要细胞类型。细胞通讯分析显示上皮细胞、巨噬细胞、单核细胞、内皮细胞和平滑肌细胞间存在较强相互作用,而T细胞、NK细胞、肥大细胞和B细胞通讯较弱。同时,研究人员可视化了鞘脂代谢相关基因在各细胞类型中的表达模式。
3.2 ccRCC中NK细胞的免疫细胞动力学与鞘脂基因调控
从单细胞数据中分离出1132个NK细胞,时序轨迹分析显示GLA、SPHK2和B4GALT6等多个鞘脂代谢相关基因在NK细胞发育过程中逐渐上调,而ORMDL1、ASAH1、PLPP1和APOE显著下调。NMF聚类识别出6个鞘脂代谢相关元基因定义的NK细胞亚簇及1个非鞘脂相关簇。细胞通讯分析表明SUMF2介导的NK细胞亚簇与上皮细胞通讯强度最高。SCENIC分析显示各亚簇转录因子活性存在显著差异,ORMDL1+NK-C1亚簇表现出最高的转录因子活性,且KEGG富集显示该亚簇在产热与氧化磷酸化通路显著富集,提示其可能处于代谢活跃状态。
3.3 T细胞中鞘脂代谢相关基因的表达与功能动态
从单细胞数据中鉴定出5304个T细胞并分离出CD8+T细胞,时序轨迹分析显示CD8+T细胞存在单一发育状态,其亚群在发育时间线上呈动态变化。NMF聚类识别出9个鞘脂代谢相关元基因定义的CD8+T细胞亚簇及2个非相关簇。细胞通讯分析显示各T细胞亚簇与上皮细胞相互作用强度相对均匀。SCENIC分析揭示各亚簇受不同转录调控程序支配,免疫抑制因子表达谱各异,SUMF2+CD8+T-C1亚簇表达水平较高。T细胞功能评分显示ASAH1+CD8+T-C4亚簇在耗竭与细胞毒性方面得分均较高,而ORMDL1+CD8+T-C6和SCP2+CD8+T-C8亚簇得分较低,提示T细胞亚群存在显著功能异质性。
3.4 ccRCC中鞘脂代谢相关基因调控的巨噬细胞
从单细胞数据中分离出2892个巨噬细胞,时序轨迹分析显示多数鞘脂代谢相关基因在巨噬细胞发育中后期表达上调,SUMF2和DEGS2上调,而SPTLC3和DEGS1在晚期显著下调。NMF分析识别出3个鞘脂代谢相关元基因定义的巨噬细胞亚簇及2个非相关簇。细胞通讯分析显示PSAP+Mac-C2亚簇与上皮细胞通讯最强。M1/M2评分显示PSAP+Mac-C2亚簇M1型(促炎)巨噬细胞特征更显著,SPTLC2+Mac-C1亚簇则与M2型(抗炎)巨噬细胞关联更强,所有巨噬细胞亚簇均表现出较高的M1评分。代谢通路富集分析显示PSAP+Mac-C2亚簇在类固醇合成、淀粉与蔗糖代谢及三羧酸循环通路显著富集。
3.5 单核细胞、肥大细胞、内皮细胞和平滑肌细胞中鞘脂代谢相关基因的介导作用
单核细胞聚类识别出ORMDL1+Mono-C1、SPTLC2+Mono-C2及2个非相关亚簇,各亚簇与上皮细胞均存在较强通讯。肥大细胞聚类识别出ABCA1+Mast-C1、GALC+Mast-C2及1个非相关亚簇,但与上皮细胞通讯较弱。内皮细胞聚类识别出PLPP3+Endo-C1、ORMDL1+Endo-C2及2个非相关亚簇,与上皮细胞通讯较强。平滑肌细胞聚类识别出S1PR3+SMC-C1、NPC2+SMC-C2、APOE+SMC-C3及1个非相关亚簇,与上皮细胞通讯较强,其中NPC2+SMC-C2相互作用最显著。
3.6 鞘脂代谢相关NMF亚簇在ccRCC中的预后意义
批量水平分析显示正常组整体鞘脂代谢相关基因表达显著高于肿瘤组,而多数元基因定义亚簇在肿瘤组中富集更高。Kaplan-Meier生存分析确定多个具有显著预后价值的NMF亚簇,其中ORMDL2+CD8+T-C5与不良预后相关,其余亚簇与较好预后相关,该结果在独立队列中得到验证。
3.7 鞘脂代谢相关NMF亚簇对ccRCC免疫治疗的影响及膀胱癌队列验证
在预测免疫治疗应答分析中,PLPP3+Endo-C1、ORMDL1+Endo-C2和ORMDL1+NK-C1在预测无应答组得分显著更高。膀胱癌免疫治疗队列分析显示SCP2+CD8+T-C8、PLPP3+Endo-C1和S1PR3+SMC-C1亚簇在无应答组得分更高。膀胱癌队列生存分析则显示NPC2+CD8+T-C2、PLPP3+Endo-C1和S1PR3+SMC-C1与不良预后相关,而在ccRCC中与较好预后相关,提示相同细胞亚群在不同癌种中可能发挥不同作用。
3.8 101种机器学习算法组合模型的构建与验证
研究人员基于16个NMF亚簇元基因,在训练集中筛选101种机器学习组合,最终选择Lasso+SuperPC组合模型作为最优模型,包含SUMF2、APOE、ORMDL1、ORMDL2、TECR、DEGS1、GLTP、ABCA1、SCP2、ASAH1、GALC和PLPP3共12个鞘脂代谢相关特征基因。风险评分将患者分为高低风险组,生存分析显示两组预后差异显著。时间依赖性ROC曲线显示该模型1年、3年和5年AUC分别为0.734、0.712和0.704,优于其他临床变量。
3.9 列线图的开发与模型的临床效用
单因素和多因素Cox分析证实风险评分是独立于年龄、分级和分期的预后预测因子。基于此开发的列线图可预测患者1年、3年和5年生存概率,校准曲线显示预测值与观测值一致性良好,ROC曲线显示列线图AUC达0.808,优于单一风险评分及其他临床特征。
3.10 免疫细胞浸润预测与免疫功能评估
免疫分型显示不同免疫亚型风险差异显著。TIDE评分显示高风险组免疫逃逸可能性更大,免疫治疗应答可能更差。CIBERSORT分析显示低风险组CD4记忆静息T细胞、静息NK细胞、单核细胞和M1/M2巨噬细胞浸润更高,高风险组浆细胞、CD8 T细胞、调节性T细胞(Tregs)和M0巨噬细胞浸润更高。免疫功能分析显示高风险组在抗原提呈细胞共抑制、炎症促进和T细胞共抑制方面得分更高。
3.11 预测性靶向药物敏感性分析
药物敏感性预测显示高风险组对阿昔替尼、硼替佐米、顺铂、达拉菲尼、雷帕霉素和索拉非尼的预计IC50值更低,低风组对ABT737、阿法替尼、AZD3759、厄洛替尼、JQ1和奥希替尼的预计IC50值更低,提示风险分层可辅助候选药物优先级排序。
3.12 鞘脂代谢相关特征基因的富集分析与蛋白质互作网络
GO富集显示生物过程主要涉及鞘脂代谢过程和膜脂质代谢过程,细胞组分主要与棕榈酰转移酶复合物和溶酶体腔相关,分子功能主要与鞘脂转运活性和胆固醇结合相关。KEGG富集显示鞘脂代谢、脂肪酸代谢和鞘脂信号通路显著富集。STRING数据库构建的蛋白质-蛋白质相互作用网络识别出ASAH1、DEGS1、PLPP3和GALC为核心基因。针对ORMDL1的分析显示其为风险基因,高表达与不良预后相关,并与特定免疫细胞浸润丰度相关。
3.13 TCGA-KIRC的突变图谱与负荷
TCGA-KIRC突变谱以错义突变为主,VHL、PBRM1、SETD2、BAP1和TTN为高频突变基因。高风险组总突变计数和非同义突变计数均显著高于低风险组,提示高鞘脂代谢相关特征基因评分患者倾向于携带更高的体细胞突变负荷。
讨论与结论
讨论部分指出,该研究首次系统解析了ccRCC中鞘脂代谢介导的肿瘤微环境模式,并通过101种机器学习算法构建了基于单细胞NMF亚簇元基因的预后模型。研究发现鞘脂代谢通过调控NK细胞、T细胞和巨噬细胞的代谢状态与转录活性,影响肿瘤免疫稳态,其中ORMDL1定义的NK细胞亚簇可能通过激活氧化磷酸化和产热通路及IRF1等转录因子促进肿瘤进展;PSAP定义的巨噬细胞亚簇则通过能量、脂质和葡萄糖代谢通路与M1样功能状态相关,影响肿瘤免疫微环境。研究还揭示了上皮细胞和免疫/基质细胞在鞘脂代谢背景下的双向信号调控模式,其中MIF和SPP1等信号分子发挥重要作用。此外,研究强调了肿瘤异质性的复杂性,相同细胞亚群在不同癌种中可发挥相反作用。研究局限性在于依赖公共数据可能无法完全覆盖患者异质性,且为回顾性分析,需前瞻性临床研究进一步验证。
结论部分总结,本研究通过单细胞NMF全面表征了ccRCC中鞘脂代谢调控的肿瘤微环境,揭示了免疫细胞在鞘脂代谢背景下通过肿瘤-免疫互作促进免疫逃逸的机制,为免疫治疗研究提供了新视角。同时,基于101种机器学习组合开发的预后模型可有效改善ccRCC患者风险分层与结局预测,深化了对ccRCC免疫相关机制及代谢相关治疗脆弱性的理解,并为未来生物标志物指导的治疗策略和功能性验证提供了候选生物标志物与潜在治疗靶点。