《Digestive and Liver Disease》:Metabolic factor-based machine learning model for mortality prediction in acute hepatitis E: Development and validation from a dual-center cohort
编辑推荐:
本文针对戊型肝炎病毒(HEV)感染患者短期死亡率高、缺乏有效预测工具的问题,研究人员整合了血脂、糖尿病等全身代谢参数与临床指标,开发并验证了一套基于机器学习逻辑回归(LR)的死亡率预测模型。该模型在多个队列中均表现出优于传统MELD评分的预测性能,为HEV患者的早期风险分层与精准管理提供了可靠工具。
戊型肝炎病毒(HEV)感染是全球范围内病毒性肝炎的重要病因,尤其在资源匮乏地区,它是导致急性肝衰竭的主要元凶之一,短期死亡率可高达10-40%。更令人担忧的是,对于已有慢性肝病基础的患者,HEV感染常常成为“压垮骆驼的最后一根稻草”,诱发慢加急性肝衰竭(ACLF),使预后急剧恶化。因此,如何在这类患者中“未雨绸缪”,早期识别出那些高风险、可能走向死亡或需要肝移植的患者,从而实现主动监测与及时干预,是临床医生面临的一大挑战。
肝脏是人体代谢的中心枢纽,那么,HEV感染引起的代谢紊乱是否能为预测患者命运提供线索呢?已有研究提示,血脂代谢与HEV病毒的复制组装息息相关,而糖尿病患者似乎也面临更差的预后。然而,将系统性代谢因素(如血脂谱、血糖状况)整合进一个实用的预测模型,此前尚属空白。同时,随着人工智能技术的发展,机器学习在挖掘复杂临床数据中的隐藏模式方面展现出巨大潜力。那么,能否利用机器学习技术,构建一个融合了代谢指标的精准预测模型,来预估HEV患者的短期死亡风险呢?这正是上海交通大学医学院附属瑞金医院感染科团队在《Digestive and Liver Disease》杂志上发表的研究所要探索的核心问题。
为回答上述问题,研究者开展了一项回顾性双中心队列研究。技术方法的核心包括:1) 回顾性队列构建与数据收集:研究纳入了来自瑞金医院及瑞金医院北部院区共510名HEV住院患者,分为训练、内部验证和外部验证队列,系统收集了包括人口统计学、合并症(如糖尿病)、以及广泛的实验室参数(如肝功能、血脂、肾功能、凝血指标等)。2) 代谢评分构建与特征选择:利用支持向量机(SVM)算法整合总胆固醇(TC)、高密度脂蛋白(HDL)、低密度脂蛋白(LDL)和糖尿病状态四个代谢参数,生成了一个连续的“代谢评分”(Metabolism Score)。该评分与其他在单因素分析中显著的变量一同,通过最小绝对收缩和选择算子(LASSO)回归进行特征筛选。3) 机器学习模型开发与比较:采用五种机器学习算法——逻辑回归(LR)、随机森林(RF)、支持向量机(SVM)、高斯朴素贝叶斯(GNB)和极限梯度提升(XGB),构建预测28天和90天死亡/肝移植结局的模型,并使用受试者工作特征曲线下面积(AUROC)、校准曲线和决策曲线分析等指标评估性能。
研究结果主要分为以下几个部分:
一、患者特征与代谢因素关联:研究发现,在训练队列中,90天非存活组患者的年龄、总胆红素(TBIL)、凝血酶原时间(PT)、国际标准化比值(INR)、肌酐(Cr)、白细胞计数(WBC)更高,而总胆固醇(TC)、高密度脂蛋白(HDL)、低密度脂蛋白(LDL)、γ-谷氨酰转移酶(GGT)、白蛋白、血小板计数和估算肾小球滤过率(eGFR)则更低。同时,患有糖尿病和感染的患者更易发生死亡或肝移植。利用SVM构建的“代谢评分”与TBIL、PT、INR呈正相关,与白蛋白水平呈负相关,表明该评分能够反映HEV患者的肝功能损害和疾病进展程度。
二、特征选择与模型构建:通过LASSO回归,最终确定了11个核心预测特征用于模型构建,包括:感染状态、WBC、代谢评分、肌酐(Cr)、白蛋白、年龄、血小板、TBIL、eGFR、INR和GGT。
三、机器学习模型预测90天死亡/肝移植结局的性能:在五种模型中,逻辑回归(LR)模型展现出最佳的预测性能。在训练、内部验证和外部验证队列中,其预测90天结局的AUROC分别为0.86、0.88和0.89。校准曲线显示预测与观察结果高度一致,决策曲线分析表明LR模型在所有队列中均能提供更高的临床净获益。Kaplan-Meier分析进一步证实,根据LR风险评分(>0.47 vs ≤0.47)分层的患者,其90天死亡率存在显著差异。
四、机器学习模型预测28天死亡/肝移植结局的性能:对于更短期的28天结局预测,LR模型同样表现最优,在三个队列中的AUROC分别达到0.87、0.98和0.84。其校准度和临床净效益同样优异。Kaplan-Meier分析显示,LR预测风险>0.85的患者28天死亡率显著更高。
五、LR模型的临床应用及与传统评分的比较:与传统的终末期肝病模型(MELD)评分相比,LR模型在预测28天和90天结局时,在所有队列中均显示出更高的AUROC。研究还通过SHAP分析解读了LR模型中各变量的贡献度,并开发了易于临床使用的列线图(Nomogram),可将模型预测结果可视化,方便个体化风险评估。
研究结论与讨论:本研究系统性地揭示了系统性代谢因素与HEV患者疾病进展的关联,证实血脂水平(TC、HDL、LDL)降低和糖尿病是预后不良的危险因素。基于此,研究创新性地构建了一个融合了“代谢评分”的逻辑回归(LR)机器学习模型。该模型能够准确预测HEV患者的短期(28天和90天)死亡或肝移植风险,其预测性能稳定且优于传统MELD评分,并具有良好的校准度和临床实用性。
这一发现具有重要意义。首先,它提供了一种非侵入性、准确度高的风险评估工具,有助于临床医生早期识别高危HEV患者,实现精准的风险分层。其次,模型强调了代谢因素在HEV预后中的关键作用,提示监测血脂和关注糖尿病状态对于疾病管理具有价值。再者,尽管采用了机器学习流程,但最终脱颖而出的逻辑回归模型因其出色的性能、良好的校准以及易于解释的特性,非常适合在中等规模的临床数据集中应用,有利于临床转化。最后,通过SHAP分析和列线图,模型具备了良好的可解释性和临床易用性,为个体化医疗决策提供了支持。
当然,研究也存在一定局限性,如患者群体均来自中国,结论的外推性需在不同种族和地区的人群中进一步验证;此外,由于数据限制,未能评估糖化血红蛋白水平与疾病进展的关联。未来,开发基于该模型的在线计算工具,并开展更多中心的前瞻性研究,将有助于推动该预测模型在临床实践中的广泛应用,最终改善HEV患者的预后。