
-
生物通官微
陪你抓住生命科技
跳动的脉搏
“超级学习者”模型能够预测缺血性中风重症患者的院内死亡风险:模型的开发与国际验证
《BMC Medical Informatics and Decision Making》:Superlearner can predict in-hospital mortality risk in critically ill patients with ischemic stroke: development and international validation
【字体: 大 中 小 】 时间:2026年05月11日 来源:BMC Medical Informatics and Decision Making 3.8
编辑推荐:
摘要背景患有缺血性中风的危重患者在医院内的死亡率很高。早期和准确预测死亡风险有助于及时进行风险分层,并改善重症监护管理。本研究旨在使用多中心数据集开发并外部验证基于机器学习的预测模型。方法我们从MIMIC-IV(n=3,568)、eICU-CRD(n=2,535)和同济大学医院(
患有缺血性中风的危重患者在医院内的死亡率很高。早期和准确预测死亡风险有助于及时进行风险分层,并改善重症监护管理。本研究旨在使用多中心数据集开发并外部验证基于机器学习的预测模型。
我们从MIMIC-IV(n=3,568)、eICU-CRD(n=2,535)和同济大学医院(TJUH,n=144)中提取数据。通过多变量逻辑回归确定了8个预测因子用于模型构建。训练并评估了5种算法:随机森林(Random Forest)、XGBoost、LightGBM、逻辑回归(Logistic Regression)和集成模型SuperLearner。使用接收者操作特征曲线下面积(AUROC)、敏感性、特异性、F1分数和校准来评估模型性能。DeLong测试比较了SuperLearner与四个基础模型的AUROC。决策曲线分析(DCA)用于评估临床效用。
SuperLearner表现出最强的区分能力,在MIMIC-IV中的AUROC为0.80(95%置信区间:0.75–0.85),在eICU-CRD中为0.82(95%置信区间:0.80–0.84),在TJUH中为0.76(95%置信区间:0.64–0.87)。各数据集的敏感性和特异性范围分别为0.70至0.83和0.68至0.82,优于四个基线模型(所有p<0.05)。校准曲线显示预测结果与观察结果之间有合理的一致性,尽管在极端概率值处存在偏差。DCA表明在广泛的阈值范围内具有净临床效益,而轻微的波动表明在较高阈值处可能存在过度估计。
SuperLearner模型在三个独立队列中展现了稳健且一致的预测性能。虽然它在早期预测危重缺血性中风患者的死亡风险方面具有潜在效用,但其临床应用需要进一步的前瞻性验证和实际应用研究。
患有缺血性中风的危重患者在医院内的死亡率很高。早期和准确预测死亡风险有助于及时进行风险分层,并改善重症监护管理。本研究旨在使用多中心数据集开发并外部验证基于机器学习的预测模型。
我们从MIMIC-IV(n=3,568)、eICU-CRD(n=2,535)和同济大学医院(TJUH,n=144)中提取数据。通过多变量逻辑回归确定了8个预测因子用于模型构建。训练并评估了5种算法:随机森林(Random Forest)、XGBoost、LightGBM、逻辑回归(Logistic Regression)和集成模型SuperLearner。使用接收者操作特征曲线下面积(AUROC)、敏感性、特异性、F1分数和校准来评估模型性能。DeLong测试比较了SuperLearner与四个基础模型的AUROC。决策曲线分析(DCA)用于评估临床效用。
SuperLearner表现出最强的区分能力,在MIMIC-IV中的AUROC为0.80(95%置信区间:0.75–0.85),在eICU-CRD中为0.82(95%置信区间:0.80–0.84),在TJUH中为0.76(95%置信区间:0.64–0.87)。各数据集的敏感性和特异性范围分别为0.70至0.83和0.68至0.82,优于四个基线模型(所有p<0.05)。校准曲线显示预测结果与观察结果之间有合理的一致性,尽管在极端概率值处存在偏差。DCA表明在广泛的阈值范围内具有净临床效益,而轻微的波动表明在较高阈值处可能存在过度估计。
SuperLearner模型在三个独立队列中展现了稳健且一致的预测性能。虽然它在早期预测危重缺血性中风患者的死亡风险方面具有潜在效用,但其临床应用需要进一步的前瞻性验证和实际应用研究。
生物通微信公众号