基于机器学习的PNI与SII联合评估在糖代谢分层下危重心脑血管病患者死亡率预测中的多中心研究

《Frontiers in Nutrition》:Multicenter evaluation of prognostic nutritional index and systemic immune-inflammation index in predicting mortality among critically ill cardiovascular and cerebrovascular patients with varied glucose metabolism: a machine learning-based cohort study

【字体: 时间:2026年02月03日 来源:Frontiers in Nutrition 5.1

编辑推荐:

  本研究创新性地将预后营养指数(PNI)与全身免疫炎症指数(SII)相结合,利用机器学习模型,系统评估了其在不同糖代谢状态(正常糖调节NGR、糖尿病前期Pre-DM、糖尿病DM)的危重心脑血管病患者中预测28天及90天全因死亡率的价值。研究发现PNI与死亡率呈负相关,SII则呈正相关,联合模型(PNI+SII)的预测效能显著优于单一指标及传统评分(如APACHE II),尤其在Pre-DM患者中表现最佳(AUC=0.775)。外部验证证实了模型的强泛化能力,为临床精准风险分层和个性化干预提供了重要工具。

  
1 引言
心血管和脑血管疾病是全球范围内导致死亡和残疾的主要原因,对公共健康构成严重威胁。危重心脑血管疾病患者因其病情复杂多变、并发症频发、全因死亡率高等特点,在临床实践中受到特别关注。准确预测此类患者的全因死亡率对于优化临床治疗决策、合理分配医疗资源以及改善患者预后具有至关重要的意义。然而,由于心脑血管疾病涉及众多复杂的病理生理机制,并受到多因素相互作用的影响,实现危重患者全因死亡率的准确预测一直是临床研究领域的主要挑战之一。
血糖代谢状态在人体生理功能中扮演基础调节角色,其失调与心脑血管疾病的发生、发展及预后密切相关。临床上观察到的血糖代谢状态,包括正常血糖、糖耐量异常和糖尿病,可通过改变血管内皮功能、影响血液流变学特性、触发氧化应激反应以及调节炎症介质释放等多种途径,诱导心脑血管系统损伤。大量研究证实,与血糖代谢正常者相比,伴有血糖代谢异常的心脑血管疾病患者往往表现出更差的临床结局,全因死亡率显著增加。然而,针对不同血糖代谢状态分层的危重心脑血管患者全因死亡率的精细化预测模型仍相对匮乏,无法满足临床精准医学的迫切需求。
全身免疫炎症指数(SII)作为反映机体免疫炎症状态的关键标志物,已越来越多地应用于评估各种疾病条件下的疾病进展和预后。通过纳入关键血细胞成分的定量变化,SII多维度地捕捉了免疫与炎症之间的相互作用,从而说明机体的免疫炎症状态如何影响疾病的发生和进展。这为临床医生评估疾病严重程度提供了可量化的参考。与此同时,预后营养指数(PNI)整合了血清白蛋白水平和淋巴细胞计数,综合反映了患者的营养状况和潜在的炎症活动性。它也被证实与心脑血管疾病的预后密切相关。尽管在个别研究中已证明其预测价值,但单独使用SII或PNI预测危重心脑血管患者的全因死亡率存在固有局限性。两者均无法完全或准确地涵盖影响患者结局的多方面因素,容易产生预测偏差。
随着信息技术日益深入地融入医学领域,机器学习凭借其在数据挖掘、模式识别和预测分析方面的卓越能力,已越来越多地成为医学研究的强大工具。在此背景下,本研究旨在利用机器学习方法对PNI和SII进行整合评估,以开发针对不同血糖代谢状态下危重心脑血管疾病患者全因死亡率的预测模型。此举旨在为临床实践提供更科学、准确且具有临床可操作性的决策依据,从而加强医疗管理并改善该患者群体的预后结局。
2 方法与研究对象
2.1 数据来源
这项观察性队列研究采用了对从Medical Information Mart for Intensive Care IV (MIMIC-IV v3.1)数据库中提取的临床数据进行回顾性分析的方法。作为一个公开可访问的资源库,MIMIC-IV包含了美国马萨诸塞州波士顿贝斯以色列女执事医疗中心(BIDMC)记录的超过190,000名患者和450,000次住院记录的全面临床数据,时间跨度为2008年至2019年,共12年。值得注意的是,为保护患者隐私,MIMIC-IV特别对入院时间戳(包括确切入院日期、住院顺序及相关信息)进行了去标识化处理,使得研究人员无法确定个体患者的具体入院年份。研究方案获得了麻省理工学院机构审查委员会的批准(认证ID:66829613)。鉴于预先存在的医疗记录已去标识化,知情同意过程被豁免。
2.2 研究人群
通过人工审查ICD-9和ICD-10编码来识别危重心脑血管疾病患者。在MIMIC-IV数据库中,ICD-9和ICD-10编码是临床医生在住院结束时分配的出院诊断代码。这些代码已针对计费、行政管理和流行病学目的进行了标准化,反映了特定住院事件的最终诊断。排除标准如下:(1)首次入院时年龄<18岁;(2)ICU住院时间<24小时;(3)数据不完整,特别是关于血小板、白蛋白、中性粒细胞和淋巴细胞的数据。对于有多次入院记录的危重患者,仅将首次住院事件纳入分析。
2.3 数据提取
使用结构化查询语言(SQL)通过Navicat Premium (v16.3.11)进行数据提取,重点关注五个领域:
人口统计学数据:年龄(岁)、性别(n, %)。
生命体征:心率(次/分, HR)、呼吸频率(次/分, RR)、平均动脉压(mmHg, MAP)、氧饱和度(%, SpO2)。
实验室参数:血红蛋白(g/dL, Hb)、血小板(109/L, Plt)、红细胞(×106/μL, RBC)、白细胞(K/μL, WBC)、钾(mEq/L)、钠(mEq/L)、血糖(mg/dL)、凝血酶原时间(秒, PT)、肌酐(mg/dL)、血尿素氮(mg/dL, BUN)。
合并症:高血压(HTN)、慢性阻塞性肺疾病(COPD)、肝硬化(LC)、急性肾损伤(AKI)、慢性肾脏病(CKD)、正常血糖调节(NGR)、糖尿病前期(Pre-DM)、糖尿病(DM)。
临床严重程度评分:序贯器官衰竭评估(SOFA)、急性生理学与慢性健康状况评价II(APACHE II评分)、查尔森合并症指数(CCI)。
PNI和SII的计算公式如下:
PNI: 10 × 血清白蛋白 (g/dL) + 0.005 × 外周血淋巴细胞总数 (/mm3)。
SII: 血小板计数 (×109/L) × 中性粒细胞 (×109/L) / 淋巴细胞 (×109/L)。
2.4 亚组分类标准
参与者根据既定的血糖代谢诊断标准分为三个不同的队列:正常血糖调节(NGR)、糖尿病前期(Pre-DM)和糖尿病(DM)。NGR组包括HbA1c水平<5.7%且无糖尿病病史的个体。Pre-DM队列包括HbA1c水平在5.7%(含)至6.5%之间且无糖尿病病史的患者。DM组包括有糖尿病病史或HbA1c水平≥6.5%的患者。
生命体征(心率、呼吸频率、体温)和所有其他变量定义为ICU入院后24小时内首次测量的数值。这种方法确保了在重症监护室(ICU)任何可能改变这些参数的干预措施之前,能够捕捉到基线生理状态。缺失数据比例≥20%的变量被排除,以减少潜在偏倚;对于缺失数据比例<20%的变量,使用多重插补法填补缺失值。
2.5 结局指标
主要结局是28天全因死亡率,次要结局是90天全因死亡率。
2.6 统计分析
参与者根据PNI和SII的三分位数分为高分组和低分组(PNI: <36.10, 36.10–43.40, >43.40;SII: <1013.4, 1013.40–2257.70, >2257.70)。最高三分位数组定义为“高”,较低两个三分位数组归类为“低”。通过Shapiro–Wilk检验评估连续变量的正态性。呈正态分布的变量,以均数±标准差(SD)报告,使用独立样本t检验或单因素方差分析(ANOVA)进行分析。非正态分布的变量,以中位数[四分位距(IQR)]报告,使用Wilcoxon秩和检验进行比较。分类变量以计数(百分比)报告,使用χ2检验或Fisher精确检验进行分析。使用方差膨胀因子(VIF)评估多重共线性,VIF>5的变量从多变量分析中排除。构建Kaplan–Meier(KM)曲线以估计累积全因死亡风险。Cox比例风险回归模型分三步实施:模型1(未调整);模型2(调整年龄和性别);模型3(调整年龄、性别、HTN、AKI、LC、HB、RBC、WBC、PT、BUN)。协变量的选择基于临床相关指标和在单变量分析中显示显著性的指标,并控制了共线性(VIF<5)。进行限制性立方样条(RCS)分析以探讨PNI和SII与结局的剂量-反应关系。通过Schoenfeld残差验证比例风险假设。利用受试者工作特征(ROC)曲线比较各种指标的预测性能,通过曲线下面积(AUC)、敏感性和特异性进行衡量。最后,进行敏感性分析以评估研究结果的稳健性,排除协变量数据不完整的患者以及至少经历过一次低血糖发作的患者。
对于机器学习驱动的预测建模,采用Boruta算法对28天死亡率的特征重要性进行排序。然后将数据集随机划分为训练集(80%)和测试集(20%)。基于选定的特征,构建了五个模型:逻辑回归(LR)、随机森林(RF)、极限梯度提升(XGBoost)、轻量级梯度提升机(LightGBM)和类别提升(CatBoost)。这些算法的选择刻意代表了不同复杂度和可解释性水平的互补建模策略。逻辑回归作为经典的线性模型,提供了透明度和易于临床解释的优点,便于理解关联的方向和幅度。相比之下,基于树的集成方法和梯度提升方法(RF、XGBoost、LightGBM和CatBoost)非常适合模拟非线性关系和高阶特征交互,同时保持对多重共线性、异常值和中等样本量的稳健性。总的来说,这种组合允许平衡评估预测性能、模型稳定性和临床可解释性,同时减轻过拟合风险。通过诸如ROC曲线下面积(AUC)、准确度、特异性、敏感性和F1分数等指标评估模型性能。根据这些指标确定的最佳模型,进一步使用SHapley加性解释(SHAP)进行阐述,以识别关键预测因素。所有分析均使用Python 3.9.12、SPSS 26.0和DecisionLnnc 1.0进行。统计学显著性定义为双尾p值<0.05。
3 结果
3.1 患者基线特征
本研究共纳入1,698名危重心脑血管疾病患者,包括生存组1,469例和非生存组229例。基线特征总结显示,PNI和SII在组间存在显著差异(均p<0.001)。总人群的中位PNI为39.8(IQR, 33.9–45.5),生存组较高(40.4, 34.5–45.8),非生存组显著较低(36.1, 30.7–42.1),提示PNI降低与死亡风险升高相关。总人群中位SII为1492.7(IQR, 791.3–2861.1),非生存组(2195.3, 1123.4–4036.0)显著高于生存组(1403.5, 772.8–2674.7),表明免疫炎症过度激活加剧不良预后。人口学特征方面,总人群中位年龄为69.0岁(IQR, 59.0–78.0),非生存组年龄显著更大(71.0岁, 62.0–82.0, p=0.007)。女性占总人口的38.2%(649/1698),组间无显著差异(p=0.215)。合并症方面,HTN、LC和AKI的分布存在显著差异(均p<0.05)。非生存组AKI比例为67.7%(155/229),显著高于生存组(44.3%, 651/1469)。非生存组LC比例(10.0%, 23/229)也显著高于生存组(4.6%, 68/1469),提示肝功能失代偿可能破坏代谢和免疫稳态,从而增加死亡风险。生命体征和实验室参数方面,HR、RR和MAP在两组间差异显著(均p<0.05)。非生存组表现出更快的HR(91 bpm, 77–102)、更高的RR(20 bpm, 18–26)和更低的MAP(84 mmHg, 71–98),反映了循环和呼吸代偿失衡。此外,Hb、RBC和WBC存在显著差异(均p<0.05),非生存组Hb和RBC水平较低,而WBC、血糖、肌酐和血尿素氮水平较高。临床评分系统方面,非生存组的SOFA评分、APACHE II评分和CCI均显著更高(均p<0.001)。
3.2 PNI和SII与不同血糖代谢状态患者死亡率的关联
3.2.1 使用KM曲线检验PNI和SII单独及联合与不同血糖代谢状态患者28天死亡率的关联
Kaplan–Meier生存曲线从多个维度展示了基于指标分层对危重心脑血管疾病患者全因死亡风险的影响。在NGR亚组中,PNI分层分析显示T3组生存概率最高,T1组最低(p<0.0001),表明在NGR患者中较高的PNI与较低的死亡风险密切相关。SII分层分析显示T3组生存概率最低(p=0.0015),提示高炎症状态预示NGR患者预后较差。联合PNI+SII表型分层显示“高PNI+低SII”表型生存最佳,“低PNI+高SII”表型最差(p=0.0025),验证了“高营养-低炎症”的协同保护作用,并凸显了联合评估优于单一指标的预测价值。
在Pre-DM亚组中,PNI分层分析显示T3组仍保持生存优势,但曲线分离程度弱于NGR亚组(p=0.0045),提示在Pre-DM阶段,PNI的保护作用持续存在但受到代谢紊乱的修饰,效能略有降低。SII分层分析显示曲线分离极小(p=0.99),反映了当处于过渡性代谢状态时,SII预测力的稳定性下降,可能源于炎症与葡萄糖代谢紊乱之间更复杂的相互作用。联合PNI+SII表型分层仍然有效,但分离程度弱于NGR亚组(p=0.039),表明联合表型的预测力在Pre-DM中持续存在但受到代谢异常的影响。
在DM亚组中,PNI分层分析显示曲线分离程度较窄,但T3组仍优于T1组(p=0.049),表明PNI的预测价值在DM患者中并未完全丧失。SII分层分析显示T3组生存率急剧下降(p<0.0001),提示高SII的致死效应在DM患者中被放大,糖尿病的慢性炎症背景增强了SII的预后价值。联合PNI+SII表型分层显示“低PNI+高SII”表型死亡风险最高,“高PNI+低SII”表型保持高生存概率(p=0.0016),表明即使在DM患者中,联合表型分层也能细化预后评估,由于PNI和SII变异更大,效果更为明显。
总之,这些KM曲线从生存分析的角度验证了:1. PNI和SII对危重心脑血管疾病患者的预后具有预测价值;2. 该价值受血糖代谢状态调节;3. 联合评估的预测性能更优。
3.2.2 使用COX回归探讨PNI和SII与不同血糖代谢状态患者28天和90天死亡率的关联
使用Cox回归模型研究了PNI联合SII与危重心脑血管疾病患者28天和90天全因死亡率的关系,并按血糖代谢状态进行了分层分析。在28天全因死亡率分析中,PNI与死亡风险呈显著负相关(即较高的PNI对应较低的死亡风险)。在总人群中,T2和T3亚组的风险均低于T1参考亚组,在模型1和模型3中观察到稳定的关联。在NGR患者中保护作用更强(模型1: T2, HR=0.457; T3, HR=0.251),T3在模型3中仍显著。在Pre-DM患者中,仅T3与风险显著降低相关(模型1: HR=0.318; 模型3: HR=0.472),而T2接近显著性。在DM患者中,T3的保护作用在模型1中存在(HR=0.591),但在模型3中减弱(HR=0.957),在所有人群中观察到显著趋势。相比之下,SII与死亡风险呈正相关(即较高的SII对应较高的风险)。在总人群中,仅T3显著高于T1(模型1: HR=2.360; 模型3: HR=2.072)。在NGR患者中,T3与风险升高相关(模型1: HR=2.089; 模型3: HR=1.905)。在Pre-DM患者中,T3在模型2中显著(HR=2.045)。在DM患者中,T3的风险尤为突出(模型1: HR=2.770; 模型3: HR=2.126)。在所有人群中未观察到T2的显著关联,但注意到显著趋势。90天分析揭示了相似的趋势:关于PNI的负相关,在总人群中,T3与较低风险相关(模型1: HR=0.666; 模型3: HR=0.590),T2在模型3中也达到显著性(HR=0.755)。在NGR患者中,T3发挥强保护作用(模型1: HR=0.482; 模型3: HR=0.415),T2在模型3中显著(HR=0.606)。在Pre-DM患者中,仅T3与风险显著降低相关(模型1: HR=0.473; 模型3: HR=0.423),存在显著趋势。在DM患者中未发现显著关联。关于SII的正相关,在总人群、NGR患者和DM患者中,T3的风险高于T1(总人群: 模型1, HR=1.842; 模型3, HR=1.925; NGR患者: 模型1, HR=2.049; 模型3, HR=1.850; DM患者: 模型1, HR=1.726; 模型3, HR=1.830),观察到显著趋势。在Pre-DM患者中,T3在模型3中显著(HR=2.415),伴有显著趋势。所有分析表明这些关联受血糖代谢状态调节,PNI的预测价值在DM患者中减弱。
总之,PNI与28天和90天全因死亡率呈负相关,在总人群、NGR患者和Pre-DM患者中存在稳定关联。在DM患者中,与28天死亡率的关联显著,但与90天死亡率无关。SII与死亡风险呈正相关,在所有人群中存在稳定关联,尤其是在NGR患者、DM患者和总人群中。大多数关联在调整协变量后仍保持显著,提示PNI和SII可作为不同血糖代谢状态下危重心脑血管疾病患者死亡风险的潜在预测因子。
3.2.3 使用COX回归探讨PNI联合SII与不同血糖代谢状态患者28天和90天死亡率的关联
使用Cox回归模型研究了联合PNI和SII与危重心脑血管疾病患者28天和90天全因死亡率的关系,并按血糖代谢状态进行了分层。分组标准如下:第1组(低SII和高PNI),第2组(低SII和低PNI),第3组(高SII和高PNI),第4组(高SII和低PNI)。
对于28天死亡率分析:在模型1中,第3组(HR=2.659)和第4组(HR=2.171)的死亡风险显著高于参考组(p<0.05),观察到剂量反应效应(趋势HR=1.30, p<0.001)。在调整年龄、性别和其他混杂因素后(模型3),第3组(HR=1.50)和第4组(HR=1.41)仍保持显著,但趋势强度减弱(HR=1.15, p=0.002)。在亚组分析中,NGR患者的模型3显示仅第4组风险显著升高(HR=1.81, p=0.034);Pre-DM患者中,第3组表现出显著风险(HR=2.04, p=0.005);然而,在DM患者中,调整后所有组间均无统计学差异。
对于90天死亡率分析:在总人群的模型3中,第3组(HR=1.46)和第4组(HR=1.40)保持显著关联(p<0.01),趋势持续存在(HR=1.13, p=0.001)。在NGR患者中,模型3显示第3组(HR=1.57)和第4组(HR=1.75)风险显著增加(p<0.05)。对于Pre-DM患者,第3组(HR=1.57)和第4组(HR=1.72)接近显著性(p=0.043–0.050)。在DM患者中,仅第4组显示显著风险(HR=1.45, p=0.047),趋势未达到统计学显著性(p=0.083)。
总之,联合评估PNI和SII与危重心脑血管疾病患者的短期(28天)和中期(90天)死亡率独立且正相关,尤其在NGR和Pre-DM患者中表现出更稳定的预测性能。死亡风险随着组别严重程度的增加(第3-4组)而增加,表明存在显著的剂量反应效应。尽管一些关联在调整混杂因素后减弱,但在总人群和非糖尿病亚组中趋势仍然稳健。值得注意的是,在多变量调整后,DM患者的关联显著减弱(28天趋势消失,90天仅单个组保持显著),提示高血糖可能干扰炎症-营养指数的预测效能。
3.2.4 使用RCS曲线探讨PNI和SII与不同血糖代谢状态患者28天和90天死亡率的关联
对于PNI,曲线呈现“初始下降后趋于平缓”的模式,表明与全因死亡率存在非线性反比关联:在低PNI水平时,PNI增加导致风险估计值快速下降(死亡风险显著降低);在高PNI水平时,随着PNI进一步增加,风险估计值的下降速度减慢。关于亚组变异,风险估计值的降低在NGR亚组中更为明显,提示PNI在血糖代谢正常的危重心脑血管疾病患者中发挥更突出的保护作用。相比之下,Pre-DM和DM亚组的曲线更为平坦,可能源于葡萄糖代谢紊乱减弱了PNI的营养-免疫保护作用。
对于SII,曲线呈现“初始上升后持续升高”的模式,表明与全因死亡率存在非线性正比关联:在低SII水平时,SII
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号