用于急性肾损伤预测的深度学习模型：多中心外部验证以及在模拟连续监测条件下的评估

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《npj Digital Medicine》：Deep learning models for acute kidney injury prediction: multi-center external validation and evaluation under simulated continuous monitoring conditions

【字体：大中小】 时间：2026年05月10日 来源：npj Digital Medicine 15.1

编辑推荐：

　　摘要急性肾损伤（AKI）是医院常见的并发症，具有较高的发病率和死亡率。用于预测AKI的深度学习模型在发展队列中的表现令人印象深刻，但单点评估无法捕捉到连续监测下的变化情况。我们采用来自三个队列的电子健康记录（共157,323例住院患者）进行了一项多中心回顾性研究：韩国国家健康保险

摘要

急性肾损伤（AKI）是医院常见的并发症，具有较高的发病率和死亡率。用于预测AKI的深度学习模型在发展队列中的表现令人印象深刻，但单点评估无法捕捉到连续监测下的变化情况。我们采用来自三个队列的电子健康记录（共157,323例住院患者）进行了一项多中心回顾性研究：韩国国家健康保险服务蔚山医院（开发数据集）、春川圣心医院以及MIMIC-IV（外部验证数据集）。我们设计了三种深度学习架构（LSTM-Attention、Masked CNN、ITE-Transformer）以及两种基线模型（XGBoost、逻辑回归），分别针对0小时、48小时和72小时的时间跨度进行预测，并通过在线模拟框架在症状出现前每隔12小时生成 prediction。结果显示，深度学习模型的外部预测性能显著优于基线模型（AUROC值分别为0.956–0.963 vs 0.630–0.686）。在线模拟发现，0小时 prediction的模型表现出“临床准确性”——随着症状临近，AUROC值持续提升（在15种组合中均具有统计学意义）；而较长时间跨度的模型预测结果则不稳定。值得注意的是，单点评估中 AUROC 值最高的模型（Masked CNN，AUROC值为0.961）在实际应用中的性能最差（网络延迟指数 NNE 为17.6–564），而 ITE-Transformer（AUROC 值为0.924）在实际应用中的警报负担最低（网络延迟指数 NNE 为1.5–2.4）。对于连续监测模型而言，以实际应用为导向的评估应作为传统评估指标的补充。

联系信箱：

粤ICP备09063491号

摘要

热点排行