
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多模态深度学习在非小细胞肺癌的生存预测和生物标志物发现中的应用
《BioData Mining》:Multimodal deep learning for survival prediction and biomarker discovery in non-small cell lung cancer
【字体: 大 中 小 】 时间:2026年02月22日 来源:BioData Mining 6.1
编辑推荐:
本研究构建多模态深度学习框架,整合病理切片、基因组及临床数据,预测非小细胞肺癌5年预后并发现新生物标志物(TPTE突变、miRNA簇扩增及RIPK4-IL10RB共缺失),验证模型性能达AUC 0.98,C-index提升至0.71,为临床应用提供可靠工具。
深度学习(DL)正在革新临床应用中的高维数据分析方法,多模态技术在对整合多样化数据集和提高预测准确性方面展现出巨大潜力。然而,其在预后评估中的应用,尤其是对于非小细胞肺癌(NSCLC),仍然较为有限。
本研究分析了来自多个数据库的2,366名NSCLC患者的整片切片成像(WSI)数据、下一代测序(NGS)结果以及临床特征。开发了一种名为“顺序自适应注意力机制”(SeAttn)的模型来处理WSI图像,同时多个深度学习模型被用于分析遗传和临床数据。通过基于COX模型的深度学习方法将多模态特征结合起来,以预测患者的长期预后。使用100个验证样本(N = 100)和101个测试样本(N = 101)来验证模型的性能。
SeAttn模型在测试队列中对NSCLC组织亚型的预测准确率达到了0.98(P < 0.0001)。单独来看,WSI、临床和遗传特征在测试队列中的预后预测一致性指数(C-index)为0.55–0.67。结合多模态特征后,测试队列的C-index提升至0.71(P = 0.002)。该模型能够准确预测患者诊断后5年内的预后(所有时间依赖性AUC的统计显著性均< i>P < 0.05),并且能够根据患者的总体生存情况对其进行分层分析(P = 0.012)。SeAttn模型在比较亚型分类模型和预后模型时表现出注意力分布的变化,并揭示了影响生存差异的免疫热区和免疫冷区特征。研究还鉴定并验证了新的预后标志物,包括TPTE突变、微RNA簇扩增以及RIPK4-IL10RB共缺失现象。
这一多模态深度学习框架展示了其在NSCLC预后预测方面的强大能力,通过整合临床、遗传和影像数据,能够提供准确的生存估计并识别生物标志物。这些发现凸显了多模态深度学习技术在更广泛癌症应用中的可扩展性。
深度学习(DL)正在革新临床应用中的高维数据分析方法,多模态技术在对整合多样化数据集和提高预测准确性方面展现出巨大潜力。然而,其在预后评估中的应用,尤其是对于非小细胞肺癌(NSCLC),仍然较为有限。
本研究分析了来自多个数据库的2,366名NSCLC患者的整片切片成像(WSI)数据、下一代测序(NGS)结果以及临床特征。开发了一种名为“顺序自适应注意力机制”(SeAttn)的模型来处理WSI图像,同时多个深度学习模型被用于分析遗传和临床数据。通过基于COX模型的深度学习方法将多模态特征结合起来,以预测患者的长期预后。使用100个验证样本(N = 100)和101个测试样本(N = 101)来验证模型的性能。
SeAttn模型在测试队列中对NSCLC组织亚型的预测准确率达到了0.98(P < 0.0001)。单独来看,WSI、临床和遗传特征在测试队列中的预后预测一致性指数(C-index)为0.55–0.67。结合多模态特征后,测试队列的C-index提升至0.71(P = 0.002)。该模型能够准确预测患者诊断后5年内的预后(所有时间依赖性AUC的统计显著性均< i>P < 0.05),并且能够根据患者的总体生存情况对其进行分层分析(P = 0.012)。SeAttn模型在比较亚型分类模型和预后模型时表现出注意力分布的变化,并揭示了影响生存差异的免疫热区和免疫冷区特征。研究还鉴定并验证了新的预后标志物,包括TPTE突变、微RNA簇扩增以及RIPK4-IL10RB共缺失现象。
这一多模态深度学习框架展示了其在NSCLC预后预测方面的强大能力,通过整合临床、遗传和影像数据,能够提供准确的生存估计并识别生物标志物。这些发现凸显了多模态深度学习技术在更广泛癌症应用中的可扩展性。