
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的肝硬化临床决策支持系统:一种结合可解释人工智能技术的肠道微生物组网络预测模型
《BMC Gastroenterology》:Machine learning-driven clinical decision support for liver cirrhosis: a gut microbiome-based web prediction model with explainable AI integration
【字体: 大 中 小 】 时间:2026年05月07日 来源:BMC Gastroenterology 2.6
编辑推荐:
摘要背景肝硬化(LC)是一种全球范围内普遍存在的慢性肝病。现有的肝硬化诊断方法在安全性和可及性方面仍存在局限性。我们的目标是利用肠道微生物开发出一个可解释的机器学习(ML)预测模型,并将其作为基于网络的临床决策支持工具进行部署。方法数据来自PubMed和BioProject数据库
肝硬化(LC)是一种全球范围内普遍存在的慢性肝病。现有的肝硬化诊断方法在安全性和可及性方面仍存在局限性。我们的目标是利用肠道微生物开发出一个可解释的机器学习(ML)预测模型,并将其作为基于网络的临床决策支持工具进行部署。
数据来自PubMed和BioProject数据库。通过生物信息学重新分析和判别分析效应量(LEfSe)分析初步识别出与肝硬化相关的关键菌属。随后使用最小绝对收缩选择算法(LASSO)进行特征选择。将这些独立的数据集合并成一个综合数据集,并对其进行五折交叉验证和留一法(LODO)分析。通过接收者操作特征曲线下面积(AUC)等指标评估模型性能,并选择最优模型。利用SHapley加性解释(SHAP)方法解释最优模型的决策机制,并使用Streamlit框架将该模型部署为Web应用程序。
最终我们纳入了11个与肝硬化相关的数据集。研究发现Veillonella、Lachnospira、Romboutsia、Akkermansia、Erysipelatoclostridium、Prevotella、UCG.005和Streptococcus等菌属是区分肝硬化患者和健康对照组的关键预测因子。随机森林(RF)模型表现出最佳的预测性能(五折交叉验证的AUC为0.875,95%置信区间:0.823–0.905;LODO分析的AUC为0.793,95%置信区间:0.702–0.940),并被开发成了在线肝硬化预测工具。
这种可解释的RF模型及其基于网络的实现方式有潜力为医疗专业人员提供决策支持,并有望成为肝硬化筛查和早期临床干预的宝贵辅助工具。
肝硬化(LC)是一种全球范围内普遍存在的慢性肝病。现有的肝硬化诊断方法在安全性和可及性方面仍存在局限性。我们的目标是利用肠道微生物开发出一个可解释的机器学习(ML)预测模型,并将其作为基于网络的临床决策支持工具进行部署。
数据来自PubMed和BioProject数据库。通过生物信息学重新分析和判别分析效应量(LEfSe)分析初步识别出与肝硬化相关的关键菌属。随后使用最小绝对收缩选择算法(LASSO)进行特征选择。将这些独立的数据集合并成一个综合数据集,并对其进行五折交叉验证和留一法(LODO)分析。通过接收者操作特征曲线下面积(AUC)等指标评估模型性能,并选择最优模型。利用SHapley加性解释(SHAP)方法解释最优模型的决策机制,并使用Streamlit框架将该模型部署为Web应用程序。
最终我们纳入了11个与肝硬化相关的数据集。研究发现Veillonella、Lachnospira、Romboutsia、Akkermansia、Erysipelatoclostridium、Prevotella、UCG.005和Streptococcus等菌属是区分肝硬化患者和健康对照组的关键预测因子。随机森林(RF)模型表现出最佳的预测性能(五折交叉验证的AUC为0.875,95%置信区间:0.823–0.905;LODO分析的AUC为0.793,95%置信区间:0.702–0.940),并被开发成了在线肝硬化预测工具。
这种可解释的RF模型及其基于网络的实现方式有潜力为医疗专业人员提供决策支持,并有望成为肝硬化筛查和早期临床干预的宝贵辅助工具。