《Cardiovascular Therapeutics》:Interpretable Machine Learning Model for Predicting 30-Day Readmission in Advanced Heart Failure Patients: Synergistic Assessment of Inflammatory and Metabolic Biomarkers
编辑推荐:
本文构建并验证了一种创新的可解释机器学习模型,用于预测晚期心力衰竭(AdHF)患者的30天再住院风险。研究集成C反应蛋白(CRP)、甘油三酯-葡萄糖-体质量指数(TYG-BMI)和中性粒细胞-淋巴细胞比值(NLR)等关键炎症与代谢标志物,结合临床与合并症信息,开发出高性能的随机森林(RF)模型(AUC=0.85)。通过SHAP(SHapley Additive exPlanations)值解释和动态列线图,为临床医生提供了直观的风险分层和个性化干预决策工具,有助于优化心衰患者出院后管理、降低医疗负担。
1. 引言
晚期心力衰竭(AdHF)是心血管疾病的终末期表型,具有心功能严重受损、进行性心肌重构和多器官功能障碍的特点。流行病学数据显示,AdHF约占所有心力衰竭病例的1%–10%,其患病率持续上升。尽管心室辅助装置和心脏移植的应用改善了部分患者的生存率,但AdHF仍与高再入院率、急剧升高的医疗费用和不良临床结局密切相关。再入院事件不仅意味着心脏失代偿,还与多种合并症(如急性肾损伤、感染和神经激素系统过度激活)紧密相关。值得注意的是,AdHF患者的再入院风险存在显著的异质性,准确预测需要综合考虑社会人口学因素、合并症、炎症及代谢生物标志物和处方药物等多种因素。因此,开发基于多维指标的高精度预测工具已成为优化AdHF风险分层和管理的关键挑战。
炎症反应和代谢失调在心力衰竭进展中起着关键作用。在众多炎症标志物中,C反应蛋白(CRP)与加速的心室重构和再入院风险增加独立相关。近年来,中性粒细胞-淋巴细胞比值(NLR)和血小板-淋巴细胞比值(PLR)等新型炎症指标因其能反映全身性炎症和免疫失衡而受到越来越多的关注。研究表明,NLR水平升高与心力衰竭患者炎症标志物增加显著相关,并与更高的全因死亡率和心衰相关住院等更差结局相关。在代谢失调方面,甘油三酯-葡萄糖(TyG)指数及其衍生指标甘油三酯-葡萄糖-体质量指数(TYG-BMI)已被证实是评估胰岛素抵抗和脂毒性心肌损伤的有效标志物。此前的一项研究将TYG-BMI确定为冠心病合并心力衰竭患者的重要预后指标,显示其与全因死亡和心衰再入院存在非线性关联。然而,迄今为止的大多数研究孤立地分析了这些生物标志物,或采用了简单的统计模型,专门针对AdHF人群的研究有限。这种方法忽视了这些因素之间复杂的相互作用和非线性关联。
可解释机器学习提供了一种变革性的方法来揭示这些生物标志物之间的关系。与传统的回归模型不同,某些机器学习算法,特别是基于树的集成方法,如随机森林和极端梯度提升,可以有效地通过SHAP值进行解释。SHAP提供了一个理论基础框架,用于量化每个预测因子对个体预测结果的贡献。本研究创新性地将炎症和代谢标志物整合到一个可解释的机器学习框架中,以预测AdHF患者的30天再入院风险。通过阐明这些标志物的协同效应并开发在线预测模型,本工作旨在推进个性化精准医学策略的实施。
2. 方法
2.1. 研究设计与数据来源
本研究为回顾性队列研究,使用徐州医科大学附属医院的电子病历数据。此外,从上海市第十人民医院获取了一个独立的外部验证队列,以评估模型的普适性和稳健性。患者数据回顾性收集自2015年1月至2024年12月,涵盖重症监护病房和心内科的入院患者。随访期至出院后30天。为保护患者隐私,所有数据均经过匿名化处理,并严格遵守数据保护法规。研究方案符合《赫尔辛基宣言》,并获得了徐州医科大学附属医院和上海市第十人民医院机构审查委员会的伦理批准。鉴于研究的回顾性性质及对现有临床记录的依赖,伦理审查委员会豁免了知情同意的要求。
纳入标准为:符合2018年欧洲心脏病学会心力衰竭协会关于AdHF诊断标准的患者;年龄≥18岁。排除标准包括:出院后30天内失访;关键变量缺失值>30%;预期寿命<30天的终末期恶性肿瘤;以及既往接受过心脏移植。
2.2. 变量定义
本研究共纳入了47个可能影响结局的变量,涵盖社会人口学特征、生命体征、治疗、超声心动图结果、处方药物、实验室结果、合并症以及炎症和代谢生物标志物。炎症指标包括NLR、PLR、单核细胞-淋巴细胞比值、全身免疫炎症指数和全身炎症反应指数。代谢标志物包括TyG指数和TYG-BMI。所有血液学和生化指标的血液样本均在入院后24小时内采集。从这些样本中得出的实验室结果均被纳入分析。合并症数量定义为出院诊断中记录的原发性慢性疾病的数量,限于以下八种临床相关疾病:高血压、心肌梗死、心房颤动、脑卒中、糖尿病、慢性阻塞性肺疾病、慢性肾病和贫血。这些指标的计算公式在文档中明确列出。
2.3. 机器学习模型开发与评估
机器学习流程在Python中实现,包括数据分割、过采样、特征选择、模型训练、性能评估和可解释性分析。数据预处理涉及使用链式方程多元插补法处理缺失值,随后进行特征标准化。数据集以7:3的比例随机分为训练集和验证集。为了解决类别不平衡问题,仅在训练集内应用合成少数类过采样技术,确保验证集在模型训练过程中不受影响。变量选择和降维则通过采用十倍交叉验证的最小绝对收缩和选择算子来实现。LASSO特征选择仅在训练集内进行,以避免数据泄漏。经过LASSO特征选择后,我们实现了七种机器学习算法:随机森林、决策树、极端梯度提升、支持向量机、逻辑回归、轻量梯度提升机和多层感知机。
每个模型的预测性能通过一系列综合指标进行评估,包括受试者工作特征曲线下面积、精确率-召回率曲线下面积、校准图、决策曲线分析、总体准确率、灵敏度、特异度、阳性预测值、阴性预测值、F1分数和Brier分数。
2.4. 可解释性分析与动态列线图创建
对于模型的可解释性分析,采用SHAP方法进行全局解释。通过计算每个特征的SHAP值,量化每个特征对预测结果的贡献程度,揭示各类指标与再入院风险之间的潜在关联。
动态列线图的开发使用R语言完成。基于模型训练和评估结果,进一步绘制了动态列线图,将关键预测因素整合到一个可视化决策工具中。列线图通过评分系统量化每个变量的权重,实现对患者30天再入院概率的个性化预测,并协助临床风险分层和决策。
2.5. 统计分析
所有描述性和单变量分析均使用SPSS进行。连续变量以均值±标准差(正态分布)或中位数与四分位间距(非正态分布)表示。分类变量以计数和百分比汇总。组间比较采用独立样本t检验或Mann-Whitney U检验(连续变量),以及卡方检验或Fisher精确检验(分类变量)。p值<0.05被认为具有统计学显著性。
3. 结果
3.1. 研究人群
研究初始筛选了899名患者,应用排除标准后最终纳入769名。其中,238名患者经历了30天再入院,而531名没有。比较分析显示,再入院组年龄更大,身体质量指数略高,纽约心功能分级IV级的患者比例更高。心房颤动在该组中更常见,合并≥2种合并症的比例也更高。同时,血管紧张素转换酶抑制剂/血管紧张素受体阻滞剂/血管紧张素受体脑啡肽酶抑制剂和β-受体阻滞剂的使用率较低。上述所有变量均显示出显著差异。炎症标志物(包括NLR、PLR、MLR、SII、SIRI和CRP)在再入院组中均显著升高。此外,血清肌酐和B型利钠肽水平也更高。TYG-BMI在再入院组中略高,接近统计学显著性,值得在建模框架内进一步探讨。研究流程图和详细的基线特征表提供了完整的概览。
3.2. 特征选择
本研究采用LASSO回归进行特征选择。年龄和合并症数量表现出相对较大的系数值,表明它们在预测30天再入院风险中作用突出。在炎症和代谢指标中,NLR、CRP和TYG-BMI影响特别显著,它们都是反映患者整体状况的重要生理标志物。此外,血管紧张素转换酶抑制剂/血管紧张素受体阻滞剂/血管紧张素受体脑啡肽酶抑制剂的使用、心房颤动的存在以及纽约心功能分级也被保留为关键预测因子,共同支持准确的再入院预测。
3.3. 机器学习模型的性能
七种机器学习模型在预测30天再入院方面表现出显著差异。随机森林模型取得了最佳的整体性能,AUC为0.85,显著优于决策树和逻辑回归模型。具体而言,随机森林模型的准确率为0.79,灵敏度为0.79,特异度为0.78,并且具有最低的Brier分数,表明预测误差最小。校准分析显示,随机森林的预测概率与观察到的结果高度匹配,与理想校准曲线高度一致。此外,随机森林模型在精确率-召回率曲线下面积方面也表现最佳。极端梯度提升和轻量梯度提升机表现出与随机森林相当但略逊一筹的性能。支持向量机和多层感知机取得了中等的预测性能。综合评估AUC、预测准确性和校准可靠性,随机森林被选为后续可解释性分析的核心模型。决策曲线分析显示,在大多数临床相关阈值概率下,随机森林模型比“全干预”和“不干预”策略提供了更高的净收益。
3.4. 模型的外部验证
为了评估最终随机森林模型的普适性,使用来自上海市第十人民医院的495名AdHF患者数据进行了独立的外部验证。推导队列和外部验证队列的基线特征比较显示,纳入模型开发的所有八个变量均无统计学显著差异,表明两个队列之间具有良好的可比性。在外部验证队列中,随机森林模型展现了稳健的普适性,AUC为0.76。随机森林还在所有七种模型中实现了最高的准确率、特异度和最低的Brier分数。校准图进一步表明,随机森林在外部队列中保持了良好的概率校准。这些发现证实了随机森林模型的优越性不仅限于推导队列,还延伸至独立的外部人群。
3.5. 最优模型的全局可解释性
采用SHAP分析对最优随机森林模型进行全局解释,旨在量化每个特征对AdHF患者30天再入院风险预测的贡献。平均绝对SHAP值条形图显示了每个变量对模型输出的平均影响。SHAP值点图展示了SHAP值的分布,点颜色反映特征大小,其位置表示对预测结果影响的方向和大小。CRP和TYG-BMI成为最具影响力的预测因子;较高的值与较大的正SHAP值相关,表明对再入院风险有强烈的正向贡献。虽然单个低值的CRP或合并症数量由于与其他高风险特征的复杂交互作用偶尔会呈现正的SHAP值,但总体趋势显示了一个清晰的正面关联:这些变量水平的增加持续地与升高的SHAP贡献相关联。这些发现强调了炎症和代谢紊乱在AdHF相关再入院中的关键作用。其他重要变量,包括年龄、纽约心功能分级、NLR、合并症数量和心房颤动,也与再入院风险呈正相关。值得注意的是,“使用血管紧张素转换酶抑制剂/血管紧张素受体阻滞剂/血管紧张素受体脑啡肽酶抑制剂”在较高特征水平时主要与负SHAP值相关,暗示其对再入院可能具有保护作用。总体而言,SHAP图全面展示了炎症标志物、代谢负担、临床状态、合并症和治疗干预如何共同影响模型的预测,为理解潜在机制提供了宝贵见解。
3.6. 动态列线图的临床效用
通过整合包括CRP、TYG-BMI和年龄在内的八个关键预测因子,开发了一个动态列线图,为AdHF患者的30天再入院风险提供实时、个体化评估。这个交互式工具允许用户通过滑块或文本框调整输入值,系统会自动计算相应的风险概率。在线演示提供了参数变化如何影响预测结果的直观可视化。例如,考虑一名76岁的AdHF患者,其CRP为51 mg/L,TYG-BMI为225,纽约心功能分级IV级,NLR为30,有五种合并症,患有心房颤动,且未使用血管紧张素转换酶抑制剂/血管紧张素受体阻滞剂/血管紧张素受体脑啡肽酶抑制剂。输入这些值后,该工具估计其30天再入院风险为81.50%。该模型可以帮助临床医生针对高风险个体定制干预措施,从而支持个性化管理。
3.7. 补充结果
为了提供额外的方法学透明度和支持研究结果的稳健性,研究包含了几张补充表格。补充表格S1详细列出了最终随机森林模型中使用的完整超参数集。补充表格S2展示了推导队列和外部验证队列之间基线特征的比较,证明在关键临床和生物标志物变量上具有良好的可比性。补充表格S3总结了所有机器学习模型在外部验证队列中的预测性能,进一步证实了随机森林模型的优越和稳定性能。
4. 讨论
再入院不仅给医疗系统带来沉重负担,也与不良的长期结局密切相关。在AdHF患者中,疾病管理的复杂性因其多系统功能障碍和临床病程的波动性而进一步加剧。本研究重点关注AdHF患者出院后30天内的再入院,结果显示再入院率为30.9%,略高于此前报道的心衰患者再入院率。这些发现凸显了对这一高危人群加强出院规划和个体化干预的迫切需求。通过利用多种机器学习算法,本研究确定随机森林在区分度、校准度和普适性方面是最稳健的模型。随机森林的优越性能增强了风险分层的精确性,并为支持高危患者的早期干预和优化资源配置提供了有价值的见解。
在众多预测因子中,炎症和代谢生物标志物在本研究中表现出特别强的预测价值。CRP不仅反映全身性炎症激活,还与心肌损伤、心室重构和免疫失调密切相关。在本研究中,CRP在SHAP分析中贡献度最高,强化了其作为短期不良结局关键生物标志物的作用。NLR是另一个关键的炎症指标,整合了炎症和免疫反应的信息。先前的研究表明,NLR水平升高与心力衰竭患者再入院风险增加密切相关,并且与AdHF患者的1年全因死亡率显著相关。我们的研究结果揭示了NLR升高与30天再入院风险之间的正相关关系,表明免疫炎症失衡可能在AdHF的病理生理学中起促进作用。在代谢方面,TYG-BMI作为胰岛素抵抗和脂毒性负担的复合标志物,也在预测模型中成为重要贡献者。先前的多项研究已证明其在心血管风险分层中的效用,我们的结果进一步证实了其与再入院风险的非线性关联,支持其作为监测代谢压力的有价值的工具。
除了炎症和代谢标志物,年龄和纽约心功能分级作为基线状况和心衰严重程度的关键指标,在本研究中显示出稳定的预测价值。老年患者常常表现出免疫功能受损和多病共存,这些都显著增加了再入院的风险。我们观察到,较高的年龄和更晚期的纽约心功能分级与再入院风险增加显著相关。值得注意的是,左心室射血分数在我们的模型中并未成为预测因子,这可能反映了其在大多数患者已表现出严重收缩功能降低的AdHF人群中区分能力有限。此外,作为多病共存的指标,心房颤动和合并症数量也与短期再入院密切相关。作为心衰患者的常见心律失常,心房颤动不仅会加重心功能不全,还可能因抗凝治疗相关的出血并发症和治疗依从性差而增加再入院风险。我们的研究进一步揭示,具有两种或以上合并症的患者再入院风险显著升高,突显了多病共存对临床管理构成的巨大负担。最后,使用血管紧张素转换酶抑制剂/血管紧张素受体阻滞剂/血管紧张素受体脑啡肽酶抑制剂与较低的再入院风险相关,这与先前的研究一致。这类药物通过减少神经激素激活、降低心脏后负荷和改善左心室重构,有助于延缓心衰进展。SHAP分析也表明了这些药物可能具有保护作用。
5. 局限性
本研究有几个局限性。首先,研究是回顾性的,容易存在选择偏倚和未测量的混杂因素。然而,考虑到AdHF发病率低,且需要足够的30天再入院事件来开发可靠的预测模型,采用2015年至2024年的回顾性设计是必要的。其次,较长的研究周期可能引入了临床实践的时间异质性,因为心衰治疗手段在此期间不断发展。为了最大程度减少与治疗策略演变相关的潜在偏倚,我们采用了严格的内部验证程序,并进行了外部验证。第三,仅纳入了入院时测量的炎症和代谢生物标志物。尽管系列测量及其动态轨迹可能提供增量的预后价值,但我们的主要目标是开发一个基于入院信息的模型,以实现早期风险分层和及时的临床决策。第四,尽管SMOTE仅应用于训练集,但它可能影响了特征的联合分布,可能导致轻微的校准偏差。第五,虽然N末端B型利钠肽前体和超敏肌钙蛋白是心衰中公认的预后生物标志物,但在研究期间,本机构常规测量的是BNP而非NT-proBNP。肌钙蛋白检测并未在所有患者中统一进行,导致高缺失率,因此无法纳入分析。
6. 结论
本研究为AdHF患者开发了一个30天再入院风险预测模型,其中随机森林模型表现最佳。炎症和代谢标志物,以及年龄、纽约心功能分级、心房颤动、合并症数量和药物使用等临床变量是关键预测因子。SHAP分析增强了模型的可解释性,动态列线图实现了实时风险评估。该模型为AdHF患者的个体化风险评估和目标干预提供了一个实用工具。