《Human Genetics》:??Integrating machine learning and spatial transcriptomics uncovers shared immunomodulatory deubiquitinases in MAFLD and HCC
编辑推荐:
针对肝细胞癌(HCC)早期筛查难、预后评估不精准及免疫治疗响应预测缺乏有效标志物的问题,研究人员整合机器学习与空间转录组学技术,筛选MAFLD与HCC共有去泛素化酶(DUBs),构建去泛素化评分(DUBS)。结果显示低DUBS患者生存获益显著且对免疫治疗更敏感,核心基因EIF3F具跨疾病诊断价值,为HCC精准诊疗提供新靶点与工具。
在全球癌症版图中,肝细胞癌(HCC)堪称“沉默的杀手”——它位列全球恶性肿瘤发病率第七位、癌症相关死亡率第三位,每年新增病例约占所有恶性肿瘤的5%。更棘手的是,HCC起病隐匿,早期缺乏特异性症状,约60%的患者确诊时已处于中晚期,错失了根治性治疗的最佳时机。尽管近年来靶向联合免疫治疗的突破改写了HCC的治疗格局,但仍有30%-40%的患者对一线治疗方案原发性耐药,整体预后依然不容乐观。
这一困境的背后,代谢功能障碍相关脂肪肝病(MAFLD)的角色不容忽视。流行病学数据显示,MAFLD已成为驱动HCC发病率持续上升的首要因素,约48.7%的HCC病例与MAFLD相关。但与病毒性肝炎等独立致癌因素不同,MAFLD更多扮演“共病助推器”的角色——仅12.4%的HCC以MAFLD为唯一病因。这种复杂的共病关系提示,单纯针对单一疾病的诊疗策略难以应对HCC的高度异质性,亟需从分子层面解析MAFLD与HCC的共享调控网络,为早期筛查、预后评估和精准治疗提供新思路。
在此背景下,去泛素化酶(DUBs)进入了研究者的视野。作为蛋白质稳态的关键调控者,DUBs通过水解底物上的泛素链,逆转泛素化修饰的生物学效应,广泛参与脂代谢重编程、炎症微环境重塑等关键病理过程。已有研究证实,RPN11、USP家族成员等DUBs在MAFLD的脂质代谢紊乱和HCC的细胞增殖、干性维持中发挥重要作用,但尚未发现同时调控两种疾病进展的“双功能”DUBs分子。能否通过多组学整合分析,锁定MAFLD-HCC共病过程中的核心DUBs调控节点,并基于此构建具有临床转化价值的预后评估体系?这正是本研究试图回答的核心问题。
为解答上述问题,研究团队开展了一项整合多组学分析与实验验证的系统研究。他们首先从公共数据库获取MAFLD和HCC的基因表达矩阵及临床信息,通过差异表达分析和12种机器学习算法组合筛选共有DUBs;随后基于TCGA-LIHC、LIRI-JP和GSE116174三个独立HCC队列,构建由4个核心DUBs组成的去泛素化评分(DUBS)系统;并通过多维度肿瘤微环境分析、药物敏感性预测、单细胞及空间转录组学解析,结合体外细胞实验和体内动物模型验证,全面阐释DUBS的临床价值及核心基因EIF3F的致癌机制。
在技术方法层面,研究主要依托以下关键技术:一是多队列数据整合分析,涵盖GEO、TCGA、ICGC等数据库的MAFLD和HCC转录组数据,以及两个抗PD-1/PD-L1治疗的黑色素瘤队列用于免疫治疗响应验证;二是机器学习模型构建,采用Lasso、随机森林等12种算法筛选特征基因,通过10折交叉验证优化模型性能;三是多维度肿瘤微环境评估,整合TIDE(肿瘤免疫功能障碍与排斥)、IPS(免疫表型评分)、ESTIMATE等算法量化免疫细胞浸润、基质评分及免疫检查点表达;四是药物敏感性分析,基于GDSC(癌症药物敏感性基因组学)和CTRP(癌症治疗反应门户)数据库预测化疗药物响应,并通过分子对接模拟核心蛋白与小分子药物的相互作用;五是单细胞RNA测序与空间转录组学分析,利用Seurat、CellChat等工具解析肿瘤微环境的细胞组成及空间分布特征;六是体外功能实验(包括Western Blot、伤口愈合、Transwell、CCK-8、克隆形成实验)和体内裸鼠皮下移植瘤模型,验证核心基因EIF3F对HCC恶性表型的调控作用。
研究结果部分,各模块结论如下:
Shared gene identification in MAFLD and HCC:通过TCGA-LIHC和GSE135251队列的交叉差异分析,筛选出31个MAFLD与HCC共有的差异表达DUBs;经12种机器学习算法比较,Lasso+LDA组合模型表现最优(训练集和验证集AUC均>0.7),最终锁定15个具有关键调控潜力的DUBs,其中多数在癌组织中呈上调趋势。
Establishment of DUBS:对15个DUBs进行单变量Cox回归分析,筛选出10个与HCC预后显著相关的分子;进一步通过多变量Cox比例风险模型,构建包含USP39、USP32、OTUB2和EIF3F的DUBS系统,计算公式为DUBS = Exp(USP39)×0.069 + Exp(USP32)×0.075 + Exp(OTUB2)×0.238 + Exp(EIF3F)×0.014。SHAP(沙普利加性解释)分析证实核心基因表达与预后预测效能正相关;在TCGA-LIHC、ICGC和GSE116174三个独立队列中,低DUBS组患者总生存期均显著延长。通路富集显示,高DUBS组细胞周期调控、DNA复制等增殖相关通路过度激活,低DUBS组脂质代谢、氧化磷酸化等代谢通路持续活跃。
Analysis of DUBS prognostic model’s diagnostic value across diseases and clinical translation:单变量和多变量Cox回归均证实DUBS是HCC的独立预后危险因素,高DUBS与肿瘤恶性程度正相关。诊断价值分析显示,USP39(AUC=0.965)、EIF3F(AUC=0.887)、OTUB2(AUC=0.930)在HCC鉴别诊断中表现优异;OTUB2(AUC=0.870)、USP32(AUC=0.761)、EIF3F(AUC=0.731)在早期MAFLD识别中具高诊断效能,其中OTUB2和EIF3F是跨两种疾病的关键诊断标志物。基于DUBS构建的列线图模型整合了分子标志物与临床特征,为个体化预后管理提供了量化工具。
Analysis of hot tumor phenotype reveals mechanisms underlying immunotherapy sensitization in low-DUBS group patients:在两个独立的抗PD-1/PD-L1治疗队列中,低DUBS患者总生存期和无进展生存期均显著更长,且完全缓解/部分缓解(CR/PR)亚组DUBS评分低于疾病稳定/进展(SD/PD)亚组。TIDE分析显示低DUBS组免疫逃逸预测值更低,MSI(微卫星不稳定性)水平显著升高;基于Thorsson免疫分类,C3亚型(Th17/Th1特征主导)患者预后优于C1亚型(血管生成特征主导)。IPS分析证实,无论靶向PD-1还是CTLA4,低DUBS组均表现出更强的治疗敏感性。肿瘤微环境评估显示,低DUBS组基质评分、免疫评分及综合评估值均显著升高,呈现典型的“热肿瘤”表型——免疫细胞浸润丰富、微环境活跃。
Clinical application value of DUBS core genes in drug sensitivity prediction and combination therapy for HCC:药物敏感性分析显示,甲氨蝶呤、伏立诺他、tubastatin A的响应与OTUB2表达正相关,与EIF3F表达负相关;阿西替尼、多柔比星、依托泊苷、丝裂霉素、长春新碱的敏感性也与OTUB2表达正相关。DUBS分组模型中,5-氟尿嘧啶、阿法替尼、吉非替尼、厄洛替尼、达沙替尼、环磷酰胺在低DUBS组疗效更优,顺铂、吉西他滨、阿西替尼、伊立替康在高DUBS组响应更佳。分子对接模拟显示,索拉非尼、多纳非尼、多柔比星、瑞戈非尼、仑伐替尼、吉西他滨均可与EIF3F蛋白结合,其中索拉非尼因高结合亲和力和HepG2细胞低IC50值,可能通过靶向EIF3F发挥选择性抗HCC作用。
Spatial transcriptomics elucidates EIF3F associated microenvironmental heterogeneity as a determinant of combination therapy outcomes in HCC:单细胞转录组图谱显示HCC包含13个细胞亚群,分属5大类细胞类型,EIF3F在大多数细胞谱系中表达显著升高,这一泛细胞分布模式经空间转录组验证。细胞间通讯网络分析发现NK细胞信号活性最强,CD74-CXCR4分子对为核心信号枢纽。空间转录组原位分析显示,靶向-免疫联合治疗敏感组EIF3F表达较低,耐药组则显著富集,提示EIF3F可调控治疗敏感性。
Pan-cancer expression-prognosis associations and immunotherapy response prediction of DUBS core genes:泛癌分析显示,OTUB2、USP32、USP39在大多数癌症类型中上调,EIF3F在CHOL(胆管癌)、COAD(结肠癌)、GBM(胶质母细胞瘤)、KIRC(肾透明细胞癌)、KIRP(肾乳头状细胞癌)、LIHC(肝细胞癌)、PRAD(前列腺癌)、READ(直肠癌)、THCA(甲状腺癌)中特异性高表达。生存分析表明,高EIF3F表达与ACC(肾上腺皮质癌)、LIHC、PCPG(嗜铬细胞瘤和副神经节瘤)不良预后相关;OTUB2是CESC(宫颈癌)、LIHC、MESO(间皮瘤)、PCPG、SARC(肉瘤)的风险因素;USP32提示KICH(肾嫌色细胞癌)、KIRP、LIHC、PCPG、UCEC(子宫内膜癌)预后较差;USP39在ACC、KICH、KIRC、KIRP、LAML(急性髓系白血病)、LGG(脑低级别胶质瘤)、LIHC、MESO、PAAD(胰腺导管腺癌)、PCPG、UCEC等11种癌症中与风险显著相关。免疫治疗响应预测显示,BLCA(膀胱癌)、BRCA(乳腺癌)、HNSC(头颈部鳞状细胞癌)、KIRC、PRAD、THCA的高DUBS组更敏感,而GBM、LGG、LUAD(肺腺癌)、SARC的低DUBS组响应更佳。
Validation of EIF3F expression:Western Blot检测显示,EIF3F在HCC细胞系Huh7、HepG2中表达显著高于肝星状细胞LX-2,在C3A细胞中表达较低,因此选择Huh7和HepG2进行后续功能研究。
Effects and mechanisms of EIF3F gene knockdown on malignant phenotypes in HCC:通过shRNA构建EIF3F稳定敲低细胞系,Western Blot证实蛋白表达显著抑制。功能实验显示,敲低EIF3F后,Huh7和HepG2细胞的迁移速率降低(伤口愈合实验)、克隆形成能力下降(平板克隆实验)、Transwell侵袭细胞数减少、CCK-8检测显示48小时内细胞增殖受抑,证实EIF3F通过协同调控迁移、侵袭和增殖促进HCC恶性进展。
In vivo experiment:裸鼠皮下移植瘤模型显示,shEIF3F组的肿瘤体积和重量较对照组显著降低,肿瘤重量下降6.8倍,表明EIF3F敲低在体内可显著抑制HCC生长。
研究结论与讨论部分强调,本研究首次系统解析了MAFLD-HCC共病过程中DUBs介导的分子调控网络,构建的DUBS系统不仅是可靠的HCC独立预后标志物,还能精准预测免疫治疗响应和化疗药物敏感性,为个体化分层治疗提供了客观依据。核心基因EIF3F兼具MAFLD与HCC的跨疾病诊断价值,其通过稳定ACSL4(长链脂酰辅酶A合成酶4)促进脂肪酸生物合成,并通过调控CD8+T细胞功能塑造免疫抑制微环境,是潜在的精准治疗靶点。尽管研究未开展前瞻性临床样本验证和候选药物体内疗效评价,但其多组学整合分析策略和DUBS系统的临床转化潜力,为HCC的早期筛查、预后监测和治疗方案优化提供了新的分子工具和理论支撑,未来需通过多中心前瞻性临床试验进一步验证其应用价值。