
-
生物通官微
陪你抓住生命科技
跳动的脉搏
CODE-II:一个用于心电图(ECG)分析中人工智能研究的大规模数据集
《npj Digital Medicine》:CODE-II: a large-scale dataset for artificial intelligence in ECG analysis
【字体: 大 中 小 】 时间:2026年05月27日 来源:npj Digital Medicine 15.1
编辑推荐:
摘要基于数据的心电图(ECG)解读方法正在迅速发展。大规模数据集推动了基于人工智能(AI)的ECG分析技术进步,但注释质量、数据量和覆盖范围的局限性仍然是主要挑战。本文介绍了CODE-II,这是一个来自巴西米纳斯吉拉斯州远程医疗网络(TNMG)的庞大真实世界数据集,包含2,735
基于数据的心电图(ECG)解读方法正在迅速发展。大规模数据集推动了基于人工智能(AI)的ECG分析技术进步,但注释质量、数据量和覆盖范围的局限性仍然是主要挑战。本文介绍了CODE-II,这是一个来自巴西米纳斯吉拉斯州远程医疗网络(TNMG)的庞大真实世界数据集,包含2,735,269份12导联ECG记录,涉及2,093,807名成年患者。每份心电图均按照标准化诊断标准进行注释,并由心脏病专家进行了审核。CODE-II的一个显著特点是包含66个具有临床意义的诊断类别,这些类别是在心脏病专家的参与下制定的,并在远程医疗实践中得到常规应用。我们还提供了一个公开可用的子集:CODE-II-open,包含15,000名患者的记录;以及CODE-II-test,这是一个由多位心脏病专家独立审核的8,475份心电图记录的非重叠子集,用于盲法评估。在CODE-II上预训练的神经网络在外部基准测试(PTB-XL和CPSC 2018)中表现出更优的迁移性能,其表现优于在更大数据集上训练的模型。