利用MALDI-TOF质谱与机器学习方法结合的血清肽组学技术用于原发性肝癌的诊断

《ANALYTICAL AND BIOANALYTICAL CHEMISTRY》:Serum peptidomics by MALDI-TOF MS coupled with machine learning approaches for diagnosis of primary liver cancer

【字体: 时间:2026年01月25日 来源:ANALYTICAL AND BIOANALYTICAL CHEMISTRY 3.8

编辑推荐:

  肝癌诊断策略通过整合高 throughput 血清多肽组学、化学计量工具与机器学习算法开发,基于433例肝癌患者和145例健康对照的MALDI-TOF MS数据分析,采用PLS-DA、随机森林和LASSO筛选出12个关键特征,支持向量机(SVM)模型灵敏度达99%,并利用SHAP方法解释模型,为大规模筛查提供临床参考。

  

摘要

原发性肝癌(PLC)是全球最常见的恶性肿瘤之一。由于其发病隐匿,70%至80的患者在晚期才被诊断出来。只有约20%的患者在早期出现可检测的症状,这种缺乏明显早期征兆的情况预示着预后较差。在这项研究中,通过整合高通量血清肽组学、化学计量学工具和机器学习(ML)算法,开发出了一种用于PLC的诊断策略。共纳入了433份PLC患者的血清样本和145份健康对照组(HC)的血清样本,并使用基质辅助激光解吸/电离飞行时间质谱法(MALDI-TOF MS)进行了分析。首先对原始质谱数据进行了预处理,然后从“指纹”分析的角度研究了PLC组和HC组之间的整体模式相似性和差异。特征选择采用了偏最小二乘判别分析(PLS-DA)、随机森林(RF)和最小绝对值收缩选择算子(LASSO)算法。这三种算法的结合识别出了12个对PLC诊断具有高代表性和区分能力的关键特征。这些特征有助于后续使用九种ML算法构建和评估模型。其中,基于支持向量机(SVM)的模型表现出最佳的判别性能,其灵敏度、准确率和特异性分别为99%、95%和95%。Shapley加性解释(SHAP)方法被用来对特征重要性进行排序,并进一步解释SVM模型的诊断机制。该方法在PLC的大规模筛查和检测中具有一定的应用潜力,并提供了相应的临床参考价值。

图形摘要

原发性肝癌(PLC)是全球最常见的恶性肿瘤之一。由于其发病隐匿,70%至80的患者在晚期才被诊断出来。只有约20%的患者在早期出现可检测的症状,这种缺乏明显早期征兆的情况预示着预后较差。在这项研究中,通过整合高通量血清肽组学、化学计量学工具和机器学习(ML)算法,开发出了一种用于PLC的诊断策略。共纳入了433份PLC患者的血清样本和145份健康对照组(HC)的血清样本,并使用基质辅助激光解吸/电离飞行时间质谱法(MALDI-TOF MS)进行了分析。首先对原始质谱数据进行了预处理,然后从“指纹”分析的角度研究了PLC组和HC组之间的整体模式相似性和差异。特征选择采用了偏最小二乘判别分析(PLS-DA)、随机森林(RF)和最小绝对值收缩选择算子(LASSO)算法。这三种算法的结合识别出了12个对PLC诊断具有高代表性和区分能力的关键特征。这些特征有助于后续使用九种ML算法构建和评估模型。其中,基于支持向量机(SVM)的模型表现出最佳的判别性能,其灵敏度、准确率和特异性分别为99%、95%和95%。Shapley加性解释(SHAP)方法被用来对特征重要性进行排序,并进一步解释SVM模型的诊断机制。该方法在PLC的大规模筛查和检测中具有一定的应用潜力,并提供了相应的临床参考价值。

图形摘要

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号