
-
生物通官微
陪你抓住生命科技
跳动的脉搏
构建并验证一个可解释的机器学习模型,用于预测老年人的健康促进行为:一项多中心研究
《Prevention Science》:Building and Validating an Explainable Machine Learning Model for Predicting Health-Promoting Behaviors in Older Adults: A Multicenter Study
【字体: 大 中 小 】 时间:2026年03月25日 来源:Prevention Science 2.7
编辑推荐:
健康促进行为评估与可解释机器学习模型开发。基于上海、江苏、山东781名老年人多中心数据,构建并验证随机梯度提升树(SGBT)预测模型,显示AUC 0.891,校准良好(Brier score 0.103),决策曲线分析(DCA)显示临床获益显著。关键预测因素包括互联网技能、教育水平及功能独立性,研究成果为精准健康干预提供工具支持。
在人口老龄化的背景下,增强老年人的健康促进行为(HPBs)对于慢性疾病管理和健康老龄化至关重要。准确评估个体的健康促进行为水平有助于制定个性化的干预措施。本研究旨在利用多中心数据识别影响老年人健康促进行为的因素,并开发并验证一个可解释的机器学习(ML)模型用于预测。2024年6月至2025年9月期间,我们在上海、江苏和山东的781名老年人中进行了多中心横断面研究。收集的数据包括社会人口统计学特征、健康状况、社区体育设施情况、手机使用熟练程度和互联网技能。上海(n=319)和山东(n=228)中心的数据构成了训练集,而江苏中心(n=234)的数据则构成了独立的外部测试集。模型区分能力通过接收者操作特征曲线下面积(AUC)、准确性、特异性、阳性预测值(PPV)、阴性预测值(NPV)、召回率和F1分数进行评估。校准能力通过Hosmer–Lemeshow检验和Brier分数进行评估,临床效用通过决策曲线分析(DCA)进行评估。参与者的平均年龄为61.79±11.54岁。根据健康促进行为水平,436名(55.8%)参与者被归类为健康促进行为组,345名(44.2%)被归类为非健康促进行为组。在外部测试集中,随机梯度提升树(SGBT)模型表现出最佳性能,曲线下面积(AUC)为0.891(95% CI,0.848–0.951),校准效果优异(Brier分数=0.103),且校准曲线与理想曲线非常吻合。其他指标包括准确性(0.895)、特异性(0.867)、PPV(0.897)、NPV(0.892)、召回率(0.917)和F1分数(0.907)。决策曲线分析显示,在广泛的概率阈值范围内(0–0.6),该模型具有较高的净临床效益。SHAP分析阐明了每个特征的贡献,并部署了一个用户友好的在线预测平台。我们开发了一个高性能、可解释的机器学习模型来预测老年人的健康促进行为,并系统地识别了关键预测因素,如互联网使用熟练程度、教育水平和功能独立性。这一工具可以帮助医疗专业人员快速评估健康促进行为水平,从而更精准地提供健康信息和服务。
在人口老龄化的背景下,增强老年人的健康促进行为(HPBs)对于慢性疾病管理和健康老龄化至关重要。准确评估个体的健康促进行为水平有助于制定个性化的干预措施。本研究旨在利用多中心数据识别影响老年人健康促进行为的因素,并开发并验证一个可解释的机器学习(ML)模型用于预测。2024年6月至2025年9月期间,我们在上海、江苏和山东的781名老年人中进行了多中心横断面研究。收集的数据包括社会人口统计学特征、健康状况、社区体育设施情况、手机使用熟练程度和互联网技能。上海(n=319)和山东(n=228)中心的数据构成了训练集,而江苏中心(n=234)的数据则构成了独立的外部测试集。模型区分能力通过接收者操作特征曲线下面积(AUC)、准确性、特异性、阳性预测值(PPV)、阴性预测值(NPV)、召回率和F1分数进行评估。校准能力通过Hosmer–Lemeshow检验和Brier分数进行评估,临床效用通过决策曲线分析(DCA)进行评估。参与者的平均年龄为61.79±11.54岁。根据健康促进行为水平,436名(55.8%)参与者被归类为健康促进行为组,345名(44.2%)被归类为非健康促进行为组。在外部测试集中,随机梯度提升树(SGBT)模型表现出最佳性能,曲线下面积(AUC)为0.891(95% CI,0.848–0.951),校准效果优异(Brier分数=0.103),且校准曲线与理想曲线非常吻合。其他指标包括准确性(0.895)、特异性(0.867)、PPV(0.897)、NPV(0.892)、召回率(0.917)和F1分数(0.907)。决策曲线分析显示,在广泛的概率阈值范围内(0–0.6),该模型具有较高的净临床效益。SHAP分析阐明了每个特征的贡献,并部署了一个用户友好的在线预测平台。我们开发了一个高性能、可解释的机器学习模型来预测老年人的健康促进行为,并系统地识别了关键预测因素,如互联网使用熟练程度、教育水平和功能独立性。这一工具可以帮助医疗专业人员快速评估健康促进行为水平,从而更精准地提供健康信息和服务。