
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习方法在预测与自杀相关结果方面的诊断准确性:一项荟萃分析
《Annals of General Psychiatry》:Diagnostic accuracy of machine learning approaches for suicide?related outcomes: a meta?analysis
【字体: 大 中 小 】 时间:2026年05月10日 来源:Annals of General Psychiatry 3.1
编辑推荐:
摘要目的这项诊断测试准确性元分析旨在为预测自杀相关结果的机器学习(ML)模型提供临床可解释的估计值(灵敏度、特异性、似然比(LR)、预测值(PV)和测试后概率。方法对PubMed、Embase、PsycINFO和Web of Science进行了系统性搜索,确定了2010年1月至
这项诊断测试准确性元分析旨在为预测自杀相关结果的机器学习(ML)模型提供临床可解释的估计值(灵敏度、特异性、似然比(LR)、预测值(PV)和测试后概率。
对PubMed、Embase、PsycINFO和Web of Science进行了系统性搜索,确定了2010年1月至2024年12月期间发表的研究。符合条件的研究采用单门设计(横断面或纵向研究),至少包括100名参与者,并报告了机器学习算法的诊断性能指标(如灵敏度、特异性、接收者操作曲线下面积(AUC))。研究的模型包括支持向量机(SVM)、逻辑回归、随机森林、XGBoost、人工神经网络(ANN)、梯度提升和集成方法。两位评审员独立提取数据。使用双变量随机效应模型计算了灵敏度、特异性、阳性预测值(PPV)、阴性预测值(NPV)和AUC的汇总估计值。采用QUADAS-2方法评估了偏倚风险。
在筛选的500条记录中,有22项研究符合纳入标准。集成模型显示出最高的汇总AUC(0.95;95%置信区间,0.92–0.96),特异性为0.97(95%置信区间,0.95–0.98),灵敏度为0.50(95%置信区间,0.29–0.71)。梯度提升和集成方法在总体上表现出较强的区分能力;具体模型的估计值在结果部分有所报告。当预测试概率为25%时,阳性结果的测试后概率从64%(逻辑回归)到88%(集成模型)不等。
机器学习方法在异质性临床人群中对自杀相关结果的诊断准确性显示出良好的前景。然而,由于原始研究很少报告特定诊断或结果的性能,因此不应将这些发现推广到特定疾病或自杀死亡率。未来的研究应结合按诊断分层和按结果分组的验证,以明确其临床适用性。
这项诊断测试准确性元分析旨在为预测自杀相关结果的机器学习(ML)模型提供临床可解释的估计值(灵敏度、特异性、似然比(LR)、预测值(PV)和测试后概率。
对PubMed、Embase、PsycINFO和Web of Science进行了系统性搜索,确定了2010年1月至2024年12月期间发表的研究。符合条件的研究采用单门设计(横断面或纵向研究),至少包括100名参与者,并报告了机器学习算法的诊断性能指标(如灵敏度、特异性、接收者操作曲线下面积(AUC)。研究的模型包括支持向量机(SVM)、逻辑回归、随机森林、XGBoost、人工神经网络(ANN)、梯度提升和集成方法。两位评审员独立提取数据。使用双变量随机效应模型计算了灵敏度、特异性、阳性预测值(PPV)、阴性预测值(NPV)和AUC的汇总估计值。采用QUADAS-2方法评估了偏倚风险。
在筛选的500条记录中,有22项研究符合纳入标准。集成模型显示出最高的汇总AUC(0.95;95%置信区间,0.92–0.96),特异性为0.97(95%置信区间,0.95–0.98),灵敏度为0.50(95%置信区间,0.29–0.71)。梯度提升和集成方法在总体上表现出较强的区分能力;具体模型的估计值在结果部分有所报告。当预测试概率为25%时,阳性结果的测试后概率从64%(逻辑回归)到88%(集成模型)不等。
机器学习方法在异质性临床人群中对自杀相关结果的诊断准确性显示出良好的前景。然而,由于原始研究很少报告特定诊断或结果的性能,因此不应将这些发现推广到特定疾病或自杀死亡率。未来的研究应结合按诊断分层和按结果分组的验证,以明确其临床适用性。