《Hormones & Cancer》:Construction of a prognostic model based on protein post-translational modification genes for prediction of immune characteristics and therapeutic response in hepatocellular carcinoma
编辑推荐:
为应对肝细胞癌(HCC)患者预后差异大、免疫治疗效果难预测的临床挑战,本研究聚焦于蛋白质翻译后修饰(PTM)基因,利用生物信息学与机器学习方法,成功构建了一个基于9个关键基因的HCC预后模型。该模型不仅能精准预测患者生存,还能有效区分高低风险组在免疫细胞浸润、肿瘤突变负荷(TMB)及免疫/化疗敏感性等方面的差异,并通过体外实验验证了ANAPC7与SAMD1的关键促癌功能。该研究为HCC的个体化精准治疗提供了新工具。
肝细胞癌(Hepatocellular carcinoma, HCC)是全球范围内最常见的原发性肝癌,其发病率与死亡率居高不下,严重威胁人类健康。尽管近年来外科手术、局部消融、介入治疗以及系统性治疗(包括靶向药物和免疫检查点抑制剂)取得了长足进步,但HCC患者整体预后依然不容乐观,个体差异巨大。为何有些患者对免疫疗法反应良好,而另一些则毫无反应?如何更早、更准确地预测患者的疾病进展和生存结局,从而制定出更加个性化的治疗方案?这些是横亘在临床医生和研究者面前的棘手难题。
在细胞内部,蛋白质的功能并不仅仅由其氨基酸序列决定。蛋白质翻译后修饰(Protein post-translational modification, PTM),即在蛋白质合成后对其进行的化学修饰(如磷酸化、乙酰化、泛素化等),是调控蛋白质活性、定位、稳定性及相互作用的关键机制,深刻影响着细胞的几乎所有生命活动。近年来,越来越多的证据表明,异常的PTM过程与肿瘤的发生、发展、转移及治疗抵抗密切相关。然而,在HCC领域,系统性地挖掘PTM相关基因的预后价值,并利用它们构建一个能够同时预测患者生存和对免疫治疗反应的综合模型,仍是一片亟待探索的蓝海。
为了填补这一空白,研究者们在《Hormones》上发表了他们的最新成果。他们提出,如果能从浩如烟海的PTM相关基因中,筛选出与HCC预后最核心的那一部分,并以此为基础构建一个可靠的预测模型,将有望为临床决策提供全新的、强有力的量化工具。这不仅有助于识别高危患者,还能提前预估患者对不同治疗策略(尤其是近年来火热的免疫疗法)的潜在获益,实现从“千人一方”到“一人一策”的精准医疗转变。
研究者们开展了一项多层次的综合性研究。首先,他们从权威的分子特征数据库(MsigDB)中获取了PTM相关基因集。接着,运用加权基因共表达网络分析(WGCNA)和单变量Cox回归分析,从庞大的基因列表中初步筛选出与HCC患者生存显著相关的候选基因。为了构建最优的预后模型,研究团队没有局限于单一算法,而是颇具匠心地评估了多达101种不同的机器学习算法组合,力求找到预测性能最稳定、最强大的模型架构。最终,他们利用筛选出的9个核心PTM基因,构建了预后模型。为确保模型的可靠性与泛化能力,研究使用了一个独立的外部验证数据集来检验其预测准确性。模型构建完成后,研究并未止步于单纯的生存预测。团队进一步深入探索了根据模型划分出的高危组和低危组患者在生物学本质上的差异,包括其富集的生物学功能、肿瘤免疫微环境的特征(如免疫细胞浸润水平)、肿瘤突变负荷(Tumor mutation burden, TMB)的高低,以及对免疫治疗和多种化疗药物的敏感性差异。最后,为了从功能层面验证模型关键基因的作用,研究者选取了其中两个基因——ANAPC7和SAMD1,在体外进行了细胞功能实验,探究它们在HCC进展中的具体角色。
主要技术方法
本研究主要运用了生物信息学与基础实验相结合的策略。关键技术包括:1. 数据获取与处理:从公共数据库(如TCGA、ICGC等,具体队列来源文中未明确标注)获取HCC患者的基因表达谱与临床随访数据。2. 特征基因筛选:采用加权基因共表达网络分析(WGCNA)和单变量Cox比例风险回归分析,从PTM基因集中初筛预后相关基因。3. 模型构建与验证:通过系统评估101种机器学习算法组合(如LASSO、随机森林、支持向量机等及其集成)构建预后风险评分模型,并使用独立数据集进行外部验证。4. 多组学关联分析:分析风险评分与基因组突变(肿瘤突变负荷,TMB)、免疫微环境(免疫细胞浸润评分)、药物敏感性(基于GDSC数据库)等的关联。5. 体外功能验证:使用细胞系进行基因敲低或过表达实验,通过CCK-8、Transwell等实验检测肝癌细胞的增殖、侵袭和迁移能力。
研究结果
- •
鉴定出23个预后相关的PTM基因并构建高精度预后模型
通过WGCNA和单变量Cox回归分析,研究团队从PTM基因集中成功鉴定出23个与HCC患者总生存期显著相关的基因。在此基础上,进一步利用机器学习方法优选出9个关键基因,构建了预后风险评分模型。外部独立验证的结果表明,该模型在预测HCC患者生存结局方面表现出高度的准确性,能够有效区分预后良好和预后不良的患者。
- •
高低风险组展现出广泛的生物学与治疗反应差异
根据模型计算的风险评分,患者被分为高风险组和低风险组。深入分析发现,两组患者在多个层面上存在显著区别:1) 生物学功能:基因集富集分析(GSEA)显示,两组富集的信号通路和生物学过程不同,提示其驱动肿瘤发展的内在机制存在异质性。2) 免疫微环境:低风险组的肿瘤免疫细胞浸润水平总体更高,免疫活性更强。3) 基因组特征:高风险组具有更高的肿瘤突变负荷(TMB)。4) 治疗敏感性:在药物敏感性分析中,低风险组患者对免疫检查点抑制剂(如抗PD-1/L1疗法)和某些化疗药物(如索拉非尼、阿霉素等)表现出更高的预测敏感性,而高风险组则可能对另一些化疗药物更敏感。
- •
体外实验证实ANAPC7与SAMD1的促癌功能
为了验证模型关键基因的生物学功能,研究者对ANAPC7和SAMD1进行了体外实验。实验结果表明,在HCC细胞中敲低ANAPC7或SAMD1的表达后,肝癌细胞的增殖能力、侵袭能力以及迁移能力均受到显著抑制。这从功能层面证实了这两个PTM相关基因在促进HCC恶性进展中的重要作用,为它们作为潜在的治疗靶点提供了实验依据。
结论与意义
本研究成功构建并验证了一个基于蛋白质翻译后修饰(PTM)基因的肝细胞癌(HCC)预后预测模型。该模型的核心价值在于其“一石二鸟”的预测能力:它不仅能够准确评估HCC患者的长期生存风险,还能有效预测患者对免疫治疗及化疗的潜在反应性。通过该模型划分出的高风险组和低风险组,在肿瘤的生物学特性、免疫状态、基因组稳定性和药物敏感性方面均存在本质差异,这为理解HCC的异质性提供了新的视角。此外,对关键基因ANAPC7和SAMD1的功能验证,不仅增强了模型的可信度,也揭示了新的潜在治疗靶点。
这项研究的最大意义在于将基础生物学概念(PTM)与临床迫切的预测需求(预后与治疗反应)通过先进的生物信息学和机器学习技术紧密连接起来。它提供的是一个兼具科学性、实用性和前瞻性的“决策支持工具”,而非仅仅是一个预后指标。在精准医疗时代,该模型有望辅助临床医生更早地识别出那些可能从强化治疗或特定免疫疗法中获益的高危患者,同时避免对低危患者进行过度治疗,从而真正实现个体化、精准化的HCC临床管理,改善患者生存质量与预后。该研究为HCC乃至其他肿瘤的研究范式提供了有益借鉴。