《Biomedical Signal Processing and Control》:ECGyolo: An end-to-end model combining transformer and 1D YOLO for arrhythmia detection
编辑推荐:
ECGyolo是一种结合Transformer编码器和1D YOLO检测模块的端到端心律失常检测框架,无需QRS分割直接处理原始ECG信号,通过Transformer捕捉长程依赖,1D YOLO同步实现波形定位与分类,在MIT-BIH数据库上达到99.21%准确率和93.46% F1分数,支持低算力设备实时诊断。
颜超凯|冯国金|马梦阳|潘家毅|孟照宗|董振
河北工业大学机械工程学院,天津300401,中国
摘要
心血管疾病(CVDs)是全球死亡的主要原因之一,心电图(ECGs)在诊断心律失常方面起着关键作用。目前的心律失常分类方法主要依赖于心跳分割和手工特征提取,但它们存在噪声敏感性和上下文建模不足等显著局限性。为了解决这些问题,本研究提出了一个端到端的心律失常检测框架ECGyolo,该框架将Transformer编码器与定制的基于1D YOLO的检测模块相结合。与依赖心跳分割的传统方法不同,ECGyolo通过Transformer编码器捕捉原始ECG信号中的全局时间依赖性。此外,我们还针对1D时间序列数据专门调整了YOLOv3架构。该框架具有专用的锚点生成机制和损失函数,能够同时实现波形定位和心律失常分类。通过在MIT-BIH心律失常数据库上的严格评估,我们的实验结果表明,ECGyolo在不依赖QRS复合波检测的情况下,实现了99.21%的检测准确率,并且宏观平均F1分数为93.46%。ECGyolo的端到端架构旨在简化临床诊断工作流程,确保高效性和鲁棒性。本研究提供了一种高精度且高效的心律失常检测解决方案,推动了深度学习在心血管疾病早期筛查中的应用。
引言
根据世界卫生组织2023年的全球健康估计,心血管疾病(CVDs)每年导致约1790万人死亡,占全球死亡人数的32%,是全球主要的死亡原因[1]。心电图(ECGs)作为“一线诊断工具”,通过记录心脏电活动,能够无创地检测心律失常、心肌缺血和其他心脏病理。因此,它们在心血管疾病的早期筛查和临床管理中发挥着至关重要的作用。然而,心血管专科医生的供应存在严重不足,特别是在发展中国家,每10万人中不到5名专科医生[2]。鉴于这一关键的医疗资源缺口,开发自动化的ECG分析和诊断技术对于应对有限的医疗资源带来的挑战至关重要。
传统的心电图(ECG)信号分析采用了一种结合信号处理技术和机器学习算法的顺序框架,通常从通过自适应滤波器[3]或小波变换[4]进行噪声抑制开始,以减少运动伪影和电源线干扰。随后的心跳检测依赖于基于阈值的算法,如Complex-Pan-Tompkins-Wavelets[5]来定位R波峰,从而确定心脏周期的分割。之后,领域专家手动设计经过临床验证的生物标志物,包括RR间期变异性、ST段形态和T波幅度[6],作为支持向量机或随机森林等分类器的输入来诊断心律失常。虽然这种多阶段方法提供了可解释的决策路径,但其级联架构本质上放大了预处理错误。此外,手工制作的特征无法充分捕捉短暂的病理模式,如缺血性ST段动态[7],而特征选择由于生物标志物相关性的迭代验证消耗了超过80%的开发时间——这种权衡限制了可扩展性,并削弱了在不断变化的心血管监测场景中的实际适应性。
深度学习的出现显著改变了ECG信号分析的格局,提供了前所未有的能力来绕过传统的特征工程限制。卷积神经网络(CNNs)凭借其分层架构进行局部模式提取,在心律失常分类任务中取得了最先进的性能,例如PhysioNet Computing[8],通过端到端学习框架直接处理原始ECG波形。最近,Transformer架构通过其全局自注意力机制展示了捕捉ECG信号中长距离依赖性的巨大潜力[9]。此外,YOLO架构在计算机视觉中展示了其统一检测框架的潜力[10]。特别是YOLOv3通过其单次检测架构[11]彻底改变了实时对象检测,实现了毫秒级的推理速度,同时不牺牲检测准确性。这种架构的优雅性与ECG分析的诊断需求相契合:能够在单次计算过程中同时定位短暂的心律失常波形和分类心脏事件。尽管现有文献在使用深度学习进行心律失常分类方面取得了实质性进展,但仍有一些挑战需要解决。当前的CNN实现主要需要固定长度的输入窗口,通常通过以R波峰为中心的ECG信号截断来隔离单个心跳。这种人工分割放弃了相邻心跳之间的临床重要节律上下文,并传播了预处理引起的错误。从实现的角度来看,基于R波峰的截断在现实场景中要求事先进行QRS复合波检测,引入了对本质上具有错误传播风险的算法的依赖,从而复杂化了临床部署。
为了解决上述挑战,本研究提出了ECGyolo,这是一个端到端的心律失常检测框架,创新地将Transformer架构与1D时间对象检测相结合。该模型通过两个协同工作的组件运行:首先,Transformer编码器架构直接处理原始的一维ECG信号,提取层次化的时空特征,通过自注意力机制将模式分解为多尺度表示,这也本质上捕捉了心脏周期间的长距离空间依赖性。在此基础上,第二个组件引入了一个专为1D时间分析优化的新型YOLO启发式检测模块。该子系统实现了针对心电图波形特征的锚点机制和混合损失函数,同时优化了定位和诊断分类。通过在统一的计算框架内同步预测波形边界和心律失常分类,我们的架构消除了顺序处理的瓶颈。所提出的模型具有三个关键优势:
•基于1D YOLO架构的时间对象检测。所提出的框架引入了一种受YOLO架构启发的创新时间对象检测范式,专门适用于1D心电图信号。通过统一优化定位和分类损失,系统实现了有竞争力的检测准确性,有效应对了不规则QRS复合波和噪声环境带来的重大挑战。
•Transformer编码器增强了上下文信息和空间特征学习。ECGyolo框架集成了一个处理原始ECG信号的Transformer编码器。这种架构消除了对易出错的心跳分割的依赖,同时保留了节律模式。此外,该架构优先考虑了诊断上关键的区域,并抑制了噪声伪影,使得在信号质量变化的情况下仍能进行稳健的特征提取。学习到的表示直接输入到后续的1D-yolo中,将全局节律上下文与局部异常识别相结合。
•适用于低性能终端设备的轻量级剪枝。模型压缩技术用于大幅降低计算资源消耗,同时保留关键的多尺度锚点帧检测能力。它支持在计算能力较低的终端设备中实现实时心律失常预警,无需依赖云计算资源。
本文的其余部分结构如下。第2节回顾了ECG分析和医学对象检测的相关工作。第3节详细介绍了所提出的ECGyolo框架的架构设计。第4节进行了实验研究和比较结果。最后,第5节讨论了局限性和未来方向。
章节片段
心律失常分类
传统的心电图(ECG)分析技术通过医学信号处理和统计学习框架不断发展,大量研究致力于心律失常分类的手动特征提取。传统方法通常遵循三阶段工作流程:预处理、特征提取、分类决策。在预处理过程中,原始ECG信号被过滤并分割成单独的心跳波形。
方法论
所提出的ECGyolo心律失常检测框架如图1所示,包括几个关键步骤。首先,采样频率为的ECG数据被标准化并分割成包含多个心跳的段,这些心跳具有恒定的时间间隔。然后将分割后的ECG段下采样,再输入到Transformer编码器中进行空间维度特征提取。之后,分割后的数据被输入到一个修改后的yolo模型中,该模型结合了
数据集和预处理
选择MIT-BIH心律失常数据库[29]作为实验对象,以评估ECGyolo模型的性能。该数据集的独特之处在于它考虑了AAMI提出的五种心律失常类型。
MIT-BIH心律失常数据库包含48个记录,每个记录代表47名不同患者的心跳,采样频率为360 Hz,持续时间约为30分钟,数字化分辨率为11位。总共,该数据集包含超过110,000次心跳。
结论
本研究提出的ECGyolo框架将Transformer编码器与基于1D-YOLO的检测机制相结合,提供了一种端到端的解决方案,用于单导联ECG数据中的心律失常定位和分类。这种方法证明了1D-YOLO模型在时间域信号分类和检测方面的可行性。与依赖QRS复合波勾勒的传统方法不同,ECGyolo使用Transformer编码器来捕获
颜超凯:撰写 – 审稿与编辑,撰写 – 原始草稿,可视化,验证,软件,方法论,调查,形式分析,数据管理,概念化。冯国金:撰写 – 审稿与编辑,验证,监督,软件,资源,项目管理,方法论,调查,资金获取,数据管理,概念化。马梦阳:撰写 – 审稿与编辑,验证,调查。潘家毅:撰写 – 审稿与编辑,验证,
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
致谢
本工作部分得到了国家本科生创新与创业培训计划(编号202410080027)和河北省自然科学基金创新研究团队延续资助项目(编号E2024202298)的支持。