
-
生物通官微
陪你抓住生命科技
跳动的脉搏
用于急性肾损伤预测的深度学习模型:多中心外部验证以及在模拟连续监测条件下的评估
《npj Digital Medicine》:Deep learning models for acute kidney injury prediction: multi-center external validation and evaluation under simulated continuous monitoring conditions
【字体: 大 中 小 】 时间:2026年05月10日 来源:npj Digital Medicine 15.1
编辑推荐:
摘要急性肾损伤(AKI)是医院常见的并发症,具有较高的发病率和死亡率。用于预测AKI的深度学习模型在发展队列中的表现令人印象深刻,但单点评估无法捕捉到连续监测下的变化情况。我们采用来自三个队列的电子健康记录(共157,323例住院患者)进行了一项多中心回顾性研究:韩国国家健康保险
急性肾损伤(AKI)是医院常见的并发症,具有较高的发病率和死亡率。用于预测AKI的深度学习模型在发展队列中的表现令人印象深刻,但单点评估无法捕捉到连续监测下的变化情况。我们采用来自三个队列的电子健康记录(共157,323例住院患者)进行了一项多中心回顾性研究:韩国国家健康保险服务蔚山医院(开发数据集)、春川圣心医院以及MIMIC-IV(外部验证数据集)。我们设计了三种深度学习架构(LSTM-Attention、Masked CNN、ITE-Transformer)以及两种基线模型(XGBoost、逻辑回归),分别针对0小时、48小时和72小时的时间跨度进行预测,并通过在线模拟框架在症状出现前每隔12小时生成 prediction。结果显示,深度学习模型的外部预测性能显著优于基线模型(AUROC值分别为0.956–0.963 vs 0.630–0.686)。在线模拟发现,0小时 prediction的模型表现出“临床准确性”——随着症状临近,AUROC值持续提升(在15种组合中均具有统计学意义);而较长时间跨度的模型预测结果则不稳定。值得注意的是,单点评估中 AUROC 值最高的模型(Masked CNN,AUROC值为0.961)在实际应用中的性能最差(网络延迟指数 NNE 为17.6–564),而 ITE-Transformer(AUROC 值为0.924)在实际应用中的警报负担最低(网络延迟指数 NNE 为1.5–2.4)。对于连续监测模型而言,以实际应用为导向的评估应作为传统评估指标的补充。
生物通微信公众号