超越“黑箱”:利用深度学习在类别平衡的临床数据集上实现对心律失常的精确时间定位
《Biomedical Signal Processing and Control》:Beyond the black box: Precise temporal localization of arrhythmias via deep learning on class-balanced clinical datasets
【字体:
大
中
小
】
时间:2026年03月25日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
可解释的CRNN-Attention模型通过整合ResNet、Bi-LSTM和稀疏注意力机制,解决了多导联心电图分类中的数据泄露、类不平衡和黑箱问题,在2,814样本测试集上实现97.26%准确率,显著提升PAC(F1从0.72到0.95)和LBBB/RBBB(F1>0.98)检测精度,并实现病理波形可视化定位。
作者:秦超 | 林坤 | 黄翠良
单位:广西医科大学第一附属医院心电图诊断科,中国南宁
摘要
背景
尽管深度学习在心电图(ECG)分类方面取得了进展,但公共数据集通常存在类别不平衡和数据泄露的问题。因此,模型往往具有较差的泛化能力和有限的可解释性(即“黑箱”现象)。本研究提出了一种可解释的卷积循环神经网络(CRNN),并结合注意力机制,以实现精确的异常定位和稳健的心律失常分类。
方法
我们构建了一个大规模、类别平衡的数据集,包含14,000条真实的临床记录(7种心律失常类型,每类2,000个样本),所有记录均经过心脏病专家的验证。关键的是,我们实施了严格的“患者间分割方案”,确保训练集和测试集之间没有患者重叠,从而消除了以往研究中常见的内患者数据泄露风险。该架构采用ResNet进行空间特征提取,Bi-LSTM进行时间上下文建模,并使用注意力模块来突出病理性的心跳信号。
结果
在2,814个样本的独立测试集上,该模型的总体准确率为97.26%,宏F1分数为0.9724。注意力机制显著提高了对细微异常的检测能力,将早搏(PAC)的F1分数从基线0.72提升至0.95。左/右束支阻滞(LBBB/RBBB)的识别几乎完美(F1分数>0.98)。可视化分析证实了模型能够准确关注具有临床意义的波形(例如异常的P波)。
结论
该框架在平衡的临床数据上表现出了竞争力。通过提供精确的时间定位,该模型成为临床实践中可靠且可解释的决策支持工具。
引言
心血管疾病(CVDs)仍然是全球死亡的主要原因,12导联心电图(ECG)是筛查和诊断的基石[1][2]。尽管深度学习(DL)在心律失常分类方面具有专家级潜力,但其转化为可靠的临床实践受到三个未解决的系统性瓶颈的阻碍:有偏的泛化评估、类别不平衡以及神经网络的不透明“黑箱”特性。现有的研究通常依赖于使用“患者内分割”的公共数据集,这种做法会导致数据泄露并产生过于乐观的性能估计[3]。此外,现实世界临床数据中的长尾分布常常加剧了罕见类别的误诊[4]。更严重的是,缺乏可解释性——特别是无法精确定位短暂异常(如早搏(PACs)——这削弱了临床医生对AI驱动决策的信任[5](见图1和图2)。
为了解决这些挑战,我们提出了一个综合框架,将严格的数据管理机制与可解释的DL架构相结合。我们构建了一个包含14,000个样本的类别平衡数据集。与传统公共数据集不同,所有样本都是直接从中国顶级三级医院的MUSE心电图管理系统中存储的原始ECG数据中提取的,每条记录都经过了资深心脏病专家的双重注释。关键的是,我们实施了严格的“患者间分割方案”,以确保训练集和测试集之间患者身份的隔离,从而保证评估的稳健性[6]。
方法上,我们开发了一个结合注意力机制的卷积循环神经网络(CRNN)框架[7]。除了实现高分类精度外,本研究还挑战了准确性和可解释性之间的传统权衡[8]。注意力机制充当“临床引导的规则器”:通过施加稀疏性约束,它迫使模型关注具有诊断意义的波形(例如P波),同时抑制非诊断性的背景噪声。这种方法同时提高了可解释性和模型的泛化能力。因此,我们的框架在提供精确的心律失常时间定位的同时,实现了与“黑箱”AI之间的有效衔接,为可靠的临床决策支持架起了桥梁。
研究人群和数据整理
本研究遵循赫尔辛基宣言进行,并获得了广西医科大学第一附属医院伦理委员会的批准(批准编号2025-E1010)。由于研究的回顾性特性,无需获取知情同意。我们从广西医科大学第一附属医院的MUSE心电图管理系统中回顾性地整理了12导联ECG记录。为了确保数据质量符合深度学习的要求
研究人群的基线特征
研究队列包含14,000条来自10,999名独立患者的ECG记录。为了减少类别不平衡可能导致的训练偏差,在数据集构建过程中采用了严格的分层采样方法,确保7种心律失常类型(1AVB、AFIB、LBBB、正常、PAC、PVC、RBBB)各有2,000个样本。
表1列出了各心律失常类型的基线特征。这些生理参数与标准临床病理学特征高度一致
主要发现和整体性能
本研究提出了一种混合深度学习框架CRNN-Attention,它将卷积神经网络(CNNs)、双向长短期记忆(Bi-LSTM)网络和稀疏注意力机制相结合。该架构旨在解决自动化多导联ECG诊断中提取复杂时空特征的挑战。实验结果表明,该模型的总体准确率为97.26%,宏F1分数为0.9724
结论
总之,所提出的CRNN-Attention框架通过深度融合时空特征,在多导联ECG心律失常分类中实现了具有竞争力的性能。该模型不仅克服了区分早搏(PACs)和正常心律的临床挑战,还通过稀疏注意力机制实现了高性能与可解释性的统一。其卓越的特异性和抗噪声能力为构建可靠且可部署的临床决策支持系统提供了新的范例。
关于生成式AI和AI辅助技术在写作过程中的声明
在准备本稿时,作者使用了Gemini(谷歌)工具来提高手稿的可读性和语言表达。使用该工具/服务后,作者根据需要对内容进行了审查和编辑,并对出版物的内容负全责。
CRediT作者贡献声明
秦超:撰写初稿、监督、软件开发、项目管理、概念构思。林坤:撰写初稿、验证、软件开发、方法论、数据整理、概念构思。黄翠良:资源获取、调查、数据分析、数据整理。
资金支持
本研究未获得公共部门、商业机构或非营利组织的任何特定资助。
利益冲突声明
作者声明他们没有已知的利益冲突或个人关系可能影响本文的研究结果。
致谢
我们衷心感谢广西医科大学第一附属医院心电图诊断科的同事们在数据收集和注释方面提供的帮助。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号