使用机器学习预测沙特阿拉伯一家三级医院儿科重症监护病房的住院时长

《International Journal of Medical Informatics》:Predicting length of stay in the pediatric intensive care unit at a tertiary center in Saudi Arabia using machine learning

【字体: 时间:2026年05月11日 来源:International Journal of Medical Informatics 4.1

编辑推荐:

  穆罕默德·阿洛瓦(Mohammed Alowa)| 阿基拉·阿尔卡萨布(Aqilah Alqassab)| 迪娜·阿尔鲁迈(Dina Al-Rumaih)| 哈迪尔·阿尔朱巴布(Hadeel AlJubab)| 阿卜杜拉齐兹·阿索卡蒂(Abdulaziz Alsoqati)| 莫

  
穆罕默德·阿洛瓦(Mohammed Alowa)| 阿基拉·阿尔卡萨布(Aqilah Alqassab)| 迪娜·阿尔鲁迈(Dina Al-Rumaih)| 哈迪尔·阿尔朱巴布(Hadeel AlJubab)| 阿卜杜拉齐兹·阿索卡蒂(Abdulaziz Alsoqati)| 莫赫森·阿尔扎马南(Mohsen Alzamanan)| 艾哈迈德·S·阿尔哈利法(Ahmed S. AlKhalifah)
沙特阿拉伯东部省卡提夫医疗网络(Qatif Health Network)儿科重症监护科

摘要

背景

在儿科重症监护病房(PICU)的长时间停留与死亡率增加、医疗成本上升以及重症监护能力下降有关。准确预测住院时长(LOS)有助于资源分配、出院计划和家庭咨询。由于儿科重症疾病的复杂性和非线性,传统的基于回归的模型表现有限。

目标

开发并内部验证利用入院时临床数据预测PICU住院时长的机器学习模型,并使用可解释的人工智能技术确定关键预测因素。

方法

这项回顾性队列研究包括了沙特阿拉伯一家三级医院2013年至2022年间所有符合条件的PICU入住病例。根据百分比划分,将住院时长分为短期、中期和长期。在分层数据集上训练了多种监督式机器学习算法,并通过交叉验证调整超参数,然后在独立的测试集上进行评估。通过准确率和多类曲线下面积的微平均值以及Shapley Additive Explanation方法评估模型可解释性。

结果

分析了6,090例患者的数据。Light Gradient Boosting Machine和Categorical Boosting模型的表现最佳,其多类曲线下面积的微平均值分别为0.826和0.832。对于短期和长期停留类别,模型的区分能力最强,而中期停留的分类能力较弱。长期停留的关键预测因素包括早期机械通气、入院来源、术后状态、生理不稳定性和合并症负担。

结论

利用入院时数据的机器学习模型可以可靠地分类PICU住院时长,尤其是在住院时长的极端情况下。这种可解释的数据驱动方法有助于早期风险分层,并为儿科重症监护的运营决策提供依据。

引言

儿童在儿科重症监护病房(PICU)的长期住院与较高的死亡率、增加的医疗成本以及对有限的重症监护资源的更大需求相关[1]。长时间住院会使患者面临继发并发症,并给家庭带来沉重的经济和情感负担,这凸显了早期风险识别的重要性[2]、[3]。长期住院还会通过延迟其他重症儿童的入院而进一步加重ICU的工作负担[4]。尽管其影响已被认识到,但长期PICU住院并没有得到普遍接受的定义;报道的阈值范围从>7天到>30天不等,这通常反映了机构的优先事项而非患者的具体情况[1]。大多数定义都是回顾性的,以利用为导向,对实时决策支持的实用性有限。
由于病例构成、临床实践和医疗基础设施的不同,PICU住院时长(LOS)在国际上存在差异。英国的研究报告的平均住院时长<3天,而巴西的研究报告的平均住院时长为7.4–9.9天[4]。一项沙特阿拉伯的研究报告的中位住院时长为2.8天(平均值:7.43±14.34天),显示出显著的变化[5]。因此,需要本地验证的模型来准确预测LOS,以指导特定医疗系统内的资源规划。
以往关于LOS预测的工作可以分为三大类方法。首先,连续回归模型可以估计准确的LOS,对于统计预测很有用,但它们往往受到线性假设的限制,并且与出院计划和床位分配等运营决策的契合度较低[3]、[4]。其次,二元模型简化了预测过程,但它们会模糊短期、中期和长期住院之间的临床差异[1]。第三,针对特定疾病的机器学习模型在某些特定人群(如毛细支气管炎和烧伤患者)中显示出潜力,但它们在异质性的PICU人群中的普适性有限[6]、[7]。虽然疾病严重程度评分系统(如Pediatric Risk of Mortality (PRISM III))是为预测死亡率设计的,但与LOS的相关性有限,作为独立的LOS预测因素价值有限[8]。
人工智能和机器学习的进步可以通过建模非线性关系和捕捉儿科重症护理数据中的复杂交互来克服这些限制[9]。在PICU环境中,多类框架可能比连续回归更具临床实用性,因为它支持将患者分为可操作的运营组:短期停留、中期停留和长期停留。这种方法更好地反映了PICU团队如何分配监测强度、家庭咨询和资源规划[4]。我们还加入了可解释性,以便不仅关注模型性能,还能识别哪些入院时的特征推动了每个类别的预测,从而提高透明度和临床可解释性[9]。在异质性的PICU人群中,这种做法尤为重要,因为一个具有强区分能力但无法解释的黑箱模型可能难以信任或实施[9]。
我们来自沙特阿拉伯一家三级护理PICU的十年数据集,通过标准化的虚拟儿科系统(VPS)注册表收集,为我们提供了一个机会来开发并内部验证针对特定医疗环境定制的机器学习模型。利用这一可靠且统一的数据源,我们旨在利用入院时的临床变量来识别有长期PICU住院风险的儿童,并确定延长住院的关键预测因素。

章节片段

研究设计和环境

这项回顾性观察性队列研究在沙特阿拉伯利雅得的国王法赫德国王医疗城(KFMC)的PICU进行,该中心每年接收约600-700名患者。研究筛选了2013年1月1日至2022年12月31日期间连续的PICU入住病例。
本研究遵循TRIPOD+AI报告指南。已获得KFMC机构审查委员会的伦理批准(日志编号24-635;2024年11月13日)。

描述性特征

最终队列包括6,090名儿童患者,排除了270例代码状态改变的病例、138例缺失LOS数据的病例以及2例性别特征不明确的病例(图1)。ICU入院时的中位年龄为36.0个月(IQR:10.0–93.0个月),中位体重和身高分别为11.3公斤(IQR:6.2–19.4公斤)和88.0厘米(IQR:64.0–116.0厘米)。
大多数入住病例来自手术/诊断部门(32.3%)、普通护理病房(31.0%)或急诊科(30.9%)。

讨论

在这项针对6,090例PICU入住病例的研究中,CatBoost和LightGBM在将住院时长分为短期(≤1天)、中期(>1–5天)和长期(>5天)方面的表现相当,各自的多元类AUC分别为0.832和0.826。在极端情况下(短期和长期停留),模型的区分能力最强;而中期停留的区分能力中等(AUC约为0.73)。误分类主要发生在中期和长期停留之间。

CRediT作者贡献声明

穆罕默德·阿洛瓦(Mohammed Alowa):撰写——原始草稿,数据整理。阿基拉·阿尔卡萨布(Aqilah Alqassab):撰写——原始草稿,数据整理。迪娜·阿尔鲁迈(Dina Al-Rumaih):撰写——原始草稿,数据整理。哈迪尔·阿尔朱巴布(Hadeel AlJubab):撰写——审阅与编辑,监督。阿卜杜拉齐兹·阿索卡蒂(Abdulaziz Alsoqati):撰写——审阅与编辑,监督。莫赫森·阿尔扎马南(Mohsen Alzamanan):撰写——审阅与编辑,调查。艾哈迈德·S·阿尔哈利法(Ahmed S. AlKhalifah):撰写——审阅与编辑,方法学,正式分析,概念化。

资金

这项研究没有获得公共部门、商业部门或非营利部门的任何特定资助。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

致谢

作者感谢国王法赫德国王医疗城的所有PICU团队和研究中心在完成这项工作中的支持。VPS数据由Virtual Pediatric Systems (LLC)提供。这些数据或作者观点的解读并未得到任何形式的认可或限制。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号