基于机器学习建立并验证急性心肌梗死合并糖尿病患者院内死亡风险预测模型

《Frontiers in Cardiovascular Medicine》：Establishment and validation of a machine learning-based predictive model for in-hospital mortality risk in acute myocardial infarction patients complicated with diabetes mellitus

【字体：大中小】 时间：2026年06月01日 来源：Frontiers in Cardiovascular Medicine 2.9

编辑推荐：

　　目的：开发并验证一种基于机器学习（Machine Learning, ML）的预测模型，用于评估并发糖尿病（Diabetes Mellitus, DM）的急性心肌梗死（Acute Myocardial Infarction, AMI）患者的院内死亡风险。方法

目的：开发并验证一种基于机器学习（Machine Learning, ML）的预测模型，用于评估并发糖尿病（Diabetes Mellitus, DM）的急性心肌梗死（Acute Myocardial Infarction, AMI）患者的院内死亡风险。方法：这项回顾性研究纳入了来自川北医学院附属医院和MIMIC-IV数据库的AMI合并DM患者。研究人员通过LASSO回归和Boruta算法共同识别出的变量被选为最终特征集。利用MIMIC-IV数据库，基于这些共同变量构建了包含七种机器学习算法的预测模型。通过在内部和外部验证集中使用广泛的指标对这些模型的综合性能进行评估，以确定优选模型。最后，采用SHapley Additive exPlanations (SHAP) 方法对优选模型的特征贡献进行定量分析和可视化展示。结果：本研究通过两种不同的变量选择方法识别出七个预测因子，包括心率（Heart Rate, HR）、中性粒细胞计数（Neutrophil Count, NEUT）、单核细胞计数（Monocyte Count, MONO）、中性粒细胞与淋巴细胞比值（Neutrophil-to-Lymphocyte Ratio, NLR）、血清白蛋白（Serum Albumin, ALB）、总胆红素（Total Bilirubin, TBiL）和尿素氮（Blood Urea Nitrogen, BUN）。基于这些预测因子构建了七种不同的ML模型。内部和外部验证集的多指标综合性能评估显示，基于XGBoost的模型获得了数值上最高的AUC（曲线下面积），被选为优选模型。通过采用SHAP方法对该模型进行可视化解释，显著增强了院内死亡预测模型的可解释性和临床可信度。该模型在识别高危患者和实施早期干预措施方面能够提供有价值的辅助支持。结论：研究人员开发了可解释的机器学习模型来预测并发DM的AMI患者的院内死亡风险，从而深入了解各种特征对预测结果的影响。因此，该模型可作为局限于与我们研究队列相似临床环境中的探索性和辅助性风险分层工具，并不旨在用于广泛推广的临床应用。

研究背景与意义

心血管疾病（Cardiovascular Disease, CVD）是全球人类健康面临的主要挑战，也是全球主要的致死原因。其中，急性心肌梗死（AMI）因其突发性强、进展迅速且致死率高，构成了严重的公共卫生负担。糖尿病（DM）作为一种全球性流行病，不仅是AMI的独立危险因素，且在住院AMI患者中合并率高达约30%。临床证据表明，合并DM的AMI患者往往伴有更严重的冠状动脉病变和心肌损伤，其院内及长期死亡率显著高于非糖尿病患者，风险可增加至两倍。

尽管既往研究多采用传统的Logistic回归或Cox比例风险回归模型进行疾病预测，但这些传统统计方法在处理大规模、高维度且包含非线性关系的医疗数据时存在局限性，无法高效解析复杂的交互作用。随着人工智能的发展，机器学习（ML）算法在处理此类大数据时展现出卓越性能，能够显著提升预测模型的准确性。然而，针对特定人群——即合并DM的AMI患者院内死亡风险的专门预测模型仍较为匮乏。因此，开展此项研究旨在通过先进的机器学习技术，构建并验证一个高精度的预测模型，辅助临床医生早期识别高危患者，从而实施及时的干预措施，改善患者预后。该研究成果已发表在《Frontiers in Cardiovascular Medicine》。

关键技术方法

研究人员开展了一项回顾性双中心研究，数据来源于美国MIMIC-IV数据库（作为训练集和内部验证集）以及中国川北医学院附属医院的电子病历系统（作为外部验证集）。经过严格的纳入与排除标准筛选，最终分别纳入969例和477例患者。

在数据处理阶段，研究人员首先剔除了缺失率超过30%的变量，并对剩余缺失数据采用随机森林（Random Forest, RF）算法进行插补。随后，利用Z-score方法对连续变量进行标准化处理，并应用合成少数类过采样技术（SMOTE）缓解类别不平衡问题。在特征筛选环节，研究人员同时采用了最小绝对收缩和选择算子（LASSO）回归和Boruta算法，将两者共同选出的特征作为最终建模变量。

基于筛选出的特征，研究人员构建了七种机器学习预测模型，包括Logistic回归（LR）、K近邻（KNN）、支持向量机（SVM）、决策树（DT）、轻量级梯度提升机（LightGBM）、自适应增强（AdaBoost）和极限梯度提升（XGBoost）。模型性能通过接收者操作特征曲线下面积（AUC）、准确率、敏感性、特异性等多项指标进行全面评估，并采用SHapley Additive exPlanations（SHAP）方法对最优模型进行全局和局部的可解释性分析。

研究结果

基线特征

研究对训练集（678例）、内部验证集（291例）和外部验证集（477例）的基线数据进行了详细比较。结果显示，存活组与非存活组在年龄、心率（HR）、呼吸频率、多项实验室指标（如白细胞计数、中性粒细胞计数、单核细胞计数、NLR、血清白蛋白、尿素氮、总胆红素等）以及并发症（如心力衰竭、肝病）和治疗药物（如抗血小板药、ACEI/ARB）方面均存在显著差异。这些差异为后续的特征选择和模型构建提供了坚实的数据基础。

特征选择

为了验证预测模型的普适性，研究人员在模型训练阶段并行采用了LASSO回归和Boruta算法进行特征筛选。LASSO回归筛选出10个变量，Boruta算法也识别出10个变量。最终，两种方法稳定重叠选出的7个变量被确定为构建预测模型的核心特征，分别是：心率（HR）、中性粒细胞计数（NEUT）、单核细胞计数（MONO）、中性粒细胞与淋巴细胞比值（NLR）、血清白蛋白、总胆红素（TBiL）和尿素氮（BUN）。这7个指标表现出良好的代表性和预测价值。

模型性能

研究人员对七种ML模型的预测性能进行了全面评估。在所有模型中，基于XGBoost的模型表现最为优异。在训练集中，其AUC达到0.907；在内部验证集中，AUC为0.873；在外部验证集中，AUC为0.845，优于其他六种算法。此外，XGBoost模型的校准曲线贴近理想曲线，Hosmer-Lemeshow检验的P值均大于0.05，表明模型预测概率与实际观测结果具有良好的一致性。决策曲线分析（DCA）也证实该模型具有较高的临床净获益。亚组分析进一步表明，该模型在不同年龄（≥65岁与<65岁）和性别（男/女）人群中均保持了稳定的判别能力（AUC均≥0.816）。

模型解释

为了克服机器学习模型的“黑箱”属性，研究人员引入SHAP方法对XGBoost模型进行了解释。特征重要性排序显示，血清白蛋白是最重要的预测因子，其次是尿素氮（BUN）、单核细胞计数（MONO）、NLR、心率（HR）、总胆红素（TBiL）和中性粒细胞计数（NEUT）。

SHAP依赖图揭示了各特征对预测结果的具体影响方向：血清白蛋白水平升高会降低院内死亡风险（保护因素）；而尿素氮、单核细胞计数、NLR、心率、总胆红素和中性粒细胞计数水平的升高则与死亡风险增加呈正相关。此外，通过个体案例分析（力图），研究人员展示了如何结合不同特征的SHAP值来量化特定患者的死亡风险，实现了从全局到个体的全方位模型解释。

讨论与结论

讨论

研究人员在讨论部分深入分析了入选预测因子的病理生理机制。炎症指标（如NLR、中性粒细胞计数、单核细胞计数）的升高反映了机体强烈的应激和炎症反应，这与动脉粥样硬化斑块的不稳定性及血栓形成密切相关。心率加快不仅增加心肌耗氧量，还可能导致舒张期缩短，加剧心肌缺血损伤。血清白蛋白降低既是营养不良的标志，也意味着机体抗氧化能力下降和修复能力受损。尿素氮升高通常提示肾功能受损或肾灌注不足，反映心输出量下降或充血性心力衰竭。总胆红素在急性期升高则可能反映了严重的血栓负荷、冠状动脉无复流现象或继发性肝淤血。

研究还探讨了SMOTE过采样技术的影响，发现虽然该技术略微提高了内部验证集的敏感性，但对整体AUC和阳性预测值（PPV）的提升有限，这主要受限于低事件发生率。此外，研究人员客观指出了本研究的局限性，包括回顾性设计的固有偏倚、MIMIC-IV数据库中缺乏心电图及超声心动图等关键临床参数、数据缺失值处理可能带来的不确定性，以及外部验证集为单中心数据可能限制模型的广泛推广。

结论

综上所述，研究人员基于双中心数据，利用七种机器学习算法成功开发了一套用于预测合并糖尿病的急性心肌梗死患者院内死亡风险的预测模型。经过多指标综合评估，基于XGBoost的模型在本研究特定的单一划分验证中表现出色，被选为优选模型。通过应用SHAP方法对模型进行可视化解释，显著提升了模型特征对预测结果贡献度的可解释性及其临床可信度。该模型可为同类人群中的早期风险识别提供辅助参考，但其定位仅限于探索性和辅助性风险分层工具，应结合其他临床指标进行综合判断。