
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多维蛋白质组学和可解释的AI特征选择技术帮助识别了血浆中跨平台的肺癌分子标志物
《Communications Medicine》:Multidimensional proteomics and explainable AI feature selection identify cross-platform lung cancer molecular signature in blood plasma
【字体: 大 中 小 】 时间:2026年06月07日 来源:Communications Medicine 6.3
编辑推荐:
摘要背景尽管已有低剂量计算机断层扫描(LDCT)可用于高风险人群的肺癌筛查,肺癌仍是全球癌症死亡的主要原因。方法为了开发一种方法并识别可用于多种平台的肺癌血液蛋白标志物,我们结合了数据独立获取质谱技术(DIA-MS)和邻近扩展测定法(PEA),以及基于可解释人工智能(XAI)的机
尽管已有低剂量计算机断层扫描(LDCT)可用于高风险人群的肺癌筛查,肺癌仍是全球癌症死亡的主要原因。
为了开发一种方法并识别可用于多种平台的肺癌血液蛋白标志物,我们结合了数据独立获取质谱技术(DIA-MS)和邻近扩展测定法(PEA),以及基于可解释人工智能(XAI)的机器学习(ML)技术来进行血浆生物标志物的发现。利用490名肺癌患者和124名匹配对照组的样本,我们训练了机器学习模型来预测肺癌,并利用XAI技术分析了模型中一致的特征网络。随后,我们引入了一种基于DNA适配体的蛋白质组学方法来评估跨平台的一致性,并定义了一个跨平台的标志物特征。该标志物特征随后通过外部队列进行了验证。
研究表明,在80/20%的训练/验证数据分割下,机器学习模型在DIA-MS和PEA技术中的AUC分别为0.91 [95% CI: 0.88-0.93] 和 0.97 [95% CI: 0.92-0.98]。XAI技术进一步分析了与趋化性、细胞黏附、伤口愈合和免疫反应相关的特征网络。基于DNA适配体的蛋白质组学方法识别出的跨平台标志物特征在DIA-MS和PEA技术中的性能分别为0.88 [95% CI: 0.80-0.90] 和 0.88 [95% CI: 0.81-0.95]。在外部队列中的验证表明,该标志物特征能够有效区分肺癌患者和对照组。
本研究结合了多维蛋白质组学与XAI-ML技术,成功开发出了用于肺癌的跨平台生物标志物特征识别方法。