《Cancer Research Communications》:Survival analysis for NAPY subtypes in Tempus stage IV patients with SCLC. ...
Open Access
编辑推荐:
本文在大型真实世界小细胞肺癌(SCLC)队列中,通过解析关键转录因子(NEUROD1、ASCL1、POU2F3、YAP1,合称NAPY)的下游转录程序,开发了基于机器学习(ML)的高精度分类模型。该模型在临床样本和细胞系中预测准确率高达约90%,为SCLC的分子分型提供了兼具功能稳健性的诊断新算法。研究进一步利用RosettaSX(癌症通路签名)分析揭示了不同NAPY亚型间在分子通路、免疫浸润等方面的显著差异,并明确了SCLC-P亚型与低T效应细胞分数是独立的预后不良生物标志物。这些发现为SCLC的精准诊断和预后评估提供了重要依据。
小细胞肺癌(SCLC)是一种极具侵袭性、进展迅速的恶性肿瘤,约占肺癌病例的15%,其中晚期患者的预后极差。 该疾病可根据四个关键转录因子(TF)的表达,即NEUROD1、ASCL1、POU2F3和YAP1,分为四种主要分子亚型,统称为NAPY分型。尽管这种分型已被广泛认可,但目前仍缺乏标准化的诊断流程来确定这些亚型,导致研究间的可比较性和可重复性受限。因此,开发一种稳健的分子分型方法对于揭示亚型间的预后差异、指导精准治疗至关重要。
研究团队利用来自460名真实世界SCLC患者的新型队列的转录组和基因组测序数据, 深入探究了与四个关键TF相关的下游基因表达程序。他们首先基于这四个TF的严格表达标准,为332个样本分配了NAPY标签。为了建立不依赖于这四个TF基因本身表达的分类模型,研究者从整个基因集中,为每个NAPY亚型分别提取了20个特异性最高的基因,构成了四个下游转录程序签名。这4×20个基因被用作特征,通过一种嵌套交叉验证(nested CV)的方法来训练支持向量机(SVM)分类器,以预测SCLC的NAPY亚型。
这个基于下游转录程序的机器学习(ML)模型展现出卓越的分类性能。 在内部验证中,其在Tempus队列的保留数据上平均准确率达到了90%。更重要的是,模型在外部独立数据集上同样表现出色:在癌症细胞系百科全书(CCLE)的SCLC细胞系中准确率为92%,在George等人(2015年)的肿瘤数据集中准确率为79%。模型的稳健性得到了有力证实,所选择的特征基因与已知的、通过染色质免疫沉淀测序(ChIP-seq)确定的TF靶基因高度重叠。这些结果清晰地表明,与TF相关的下游转录程序能够在不同的SCLC生物样本类型中一致地区分四种分子亚型。
为了提升亚型判定的可靠性,研究者提出了一种共识分类诊断算法。 该方法要求一个NAPY TF的高表达必须与其下游表达特征的高信号相匹配。在最初的460个样本中,有383个(83%)样本的TF表达基础分类与ML签名基础分类达成了一致,形成了“共识NAPY亚型”集,用于后续的深入分析。这383个样本的分布为:SCLC-A占39%,SCLC-N占31%,SCLC-P占9%,SCLC-Y占21%。该算法有效减少了对边界病例的分类不确定性,为临床样本的亚型鉴定提供了更可靠的方案。
在明确亚型分类后,研究者利用RosettaSX癌症通路签名库,系统地评估了不同NAPY亚型间的分子表型差异。 分析发现:
- •
神经内分泌与增殖特征:SCLC-N和SCLC-A亚型表现出更强的神经内分泌特征和更高的细胞增殖活性,这与已知的神经内分泌癌症特性一致,并且对铂类和拓扑替康等化疗药物更为敏感。
- •
免疫与炎症特征:SCLC-Y亚型显示出最强的免疫/炎症相关信号,例如高干扰素(IFN)信号和巨噬细胞浸润特征,这与之前提出的将其称为“炎症型”(SCLC-I)的观点相符。然而,高免疫特征并非SCLC-Y所独有,在其他亚型中也存在。
- •
关键信号通路活性:不同亚型在关键致癌通路上存在偏好。例如,SCLC-Y亚型在表皮生长因子受体(EGFR)、Hippo、PI3K/AKT/mTOR以及上皮-间质转化(EMT)相关通路上更为活跃。SCLC-P亚型则与MYC信号通路的高活性密切相关。而NOTCH信号通路,作为神经内分泌分化的负调控因子,在神经内分泌表型强(SCLC-A/N)的亚型中活性较低。WNT通路在SCLC-N和SCLC-Y亚型中更为活跃,该通路与化疗耐药相关。
在基因组层面, 对383个共识样本的分析揭示了SCLC中常见的基因组改变,例如TP53(95%)和RB1(74%)的几乎普遍失活。然而,除MYCL扩增在SCLC-A亚型中显著富集(P=0.02)以及RET突变在SCLC-Y亚型中有较高趋势(P=0.08)外,大多数基因组变异与NAPY亚型之间没有显著的排他性关联。这表明NAPY表达亚型是一种与常见DNA层面改变互补的分类体系。
研究最重要的临床转化发现之一,是明确了特定分子表型的预后价值。 通过对IV期患者的生存分析(无论治疗方式如何,以及专门接受化疗联合免疫检查点抑制剂(化疗+ICI)治疗的患者),研究者发现:
- •
SCLC-P亚型预后最差。与SCLC-A和SCLC-N亚型相比,SCLC-P亚型患者的总生存期(OS)显著缩短,是独立的预后不良因素。
- •
T效应细胞(T-effector)基因表达特征是积极的预后标志物。 低T效应细胞评分是OS不良的独立预测因子。
- •
在化疗+ICI治疗队列中,男性也是一个不良预后因素。
在多变量Cox比例风险模型中,SCLC-P亚型、男性性别和低T效应细胞评分均保持其独立的预后意义,共同构成了一个潜在的多因子预后评估模型。
综上所述, 本研究通过挖掘NAPY关键转录因子的下游转录程序,成功构建了一个高精度、可跨平台验证的机器学习分类模型,为SCLC的分子分型提供了功能稳健的新工具。所提出的共识分类算法增强了亚型判定的可靠性。全面的通路分析从系统层面描绘了不同NAPY亚型的分子特征图谱。最终,研究成功鉴定了SCLC-P亚型和低T效应细胞分数作为SCLC,特别是晚期SCLC的独立预后生物标志物,为未来个体化治疗策略的制定和临床试验的患者分层提供了重要的科学依据。