ELOGOnet：基于知识增强的本地-全局学习方法在心脏疾病诊断中的应用

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Information Fusion》：ELOGOnet: Knowledge-Enhanced Local-Global Learning for Cardiac Diagnosis

【字体：大中小】 时间：2026年01月24日 来源：Information Fusion 15.5

编辑推荐：

　　针对现有ECG模型在整合局部和全局特征及利用医学先验知识上的不足，本文提出ELOGOnet框架，通过并行CNN-SSM模块提取多尺度特征，结合关联损失和自适应跨门控机制融合医学先验与患者元数据，在多个公开数据集上验证其有效性，平均Macro-F1达63.8%，优于16种基线模型。

冯一卓|王北北|王子瑞|江凯|王鹏|杜立东|陈献祥|吴鹏|李振峰|宋俊贤|江立斌|方振

中国科学院航空航天信息研究所，北京，中国

摘要

人类心脏病专家的诊断过程是一个整体的推理行为，它无缝整合了两个关键组成部分：（1）对心电图（ECG）信号本身的协同分析，结合了全局节奏模式和局部形态的见解；（2）基于先验知识的解释过程，利用内化的医学知识和外部患者特定信息。然而，现有的深度学习模型难以模仿这种复杂的专家推理，通常面临双重困境：无法在统一的框架内协同处理局部和全局特征，以及广泛忽视了有价值的低成本先验知识来源，如疾病关联和患者元数据。为了弥合这一差距，我们提出了ELOGOnet，这是一种旨在模拟专家诊断工作流程的新深度学习框架。ELOGOnet通过采用并行混合架构来模拟专家的协同信号分析，该架构结合了用于全局节奏的状态空间模型（SSM）和用于局部形态的卷积神经网络（CNN）。为了实现基于先验知识的解释，该框架引入了两项关键创新：一种关联损失，通过建模疾病共病性和互斥性来增强临床一致性；以及一种自适应的跨门控模块，用于稳健地融合患者元数据。在几个主流公共基准测试上的广泛实验表明，ELOGOnet取得了63.8%的平均宏F1分数，显著优于16个竞争基线，从而为心电图自动诊断树立了新的性能标杆。

引言

心电图（ECG）是一种不可或缺的临床工具，提供了一种方便、无创且成本效益高的方法，用于诊断各种心血管疾病[1]。对其形态模式（例如P-QRS-T复合波）和节奏动态（例如心率变异性）的详细分析，能够有效识别各种病理状况，包括心律失常[2]、心肌梗死[3]和其他心脏异常[4]、[5]。人工智能的进步扩展了自动心电图解释的范围，实现了细粒度的多类和多标签分类，但在这些复杂环境中真正有效的诊断需要的不仅仅是模式识别——它还需要模仿专家的临床推理。

人工智能的前沿正在发生重大转变，从单纯的模式识别转向模仿复杂的人类认知过程。受到这一趋势的启发，我们认为，构建真正有效的自动心电图诊断系统以真正辅助临床决策，需要回归诊断的本质：系统地模拟经验丰富的心脏病专家的多维推理过程。这种方法与其他AI领域的进展相呼应。例如，在自然语言处理中，链式思维等技术模拟了逐步的人类推理[6]，而在计算机视觉中，注意力机制最初是为了模仿人类视觉系统对显著信息的关注而设计的[7]。

受此启发，我们将专家的心电图诊断工作流程分解为两个互补的层次：

(1)

协同信号分析：这是诊断的感知基础。它要求对信号本身进行整体解释，将局部（Lo）形态细节的细致检查与多个心跳的全局（Go）节奏模式的宏观评估无缝结合。

(2)

基于先验知识的解释：这是诊断的认知核心。它涉及将信号中观察到的特征与两个关键的外部知识来源进行校准和上下文化：内化的医学知识（例如疾病共病性和互斥性）和外部患者特定信息（即元数据，如年龄和性别）。

因此，理想的智能心电图模型必须同时应对这两个层次的挑战。然而，现有的深度学习方法在这两方面都存在显著限制：它们往往无法在统一的框架内有效协同处理局部和全局特征学习，同时也没有充分利用先验知识提供的有价值、低成本的信息。

为了系统地解决这一双重挑战，我们提出了ELOGOnet，这是一种新的深度学习框架，能够计算出专家心脏病专家的完整诊断工作流程。如图1概念性所示，ELOGOnet的组成部分旨在反映心脏病专家推理过程的各个阶段。

具体来说，如图1概念性所示，ELOGOnet的核心是双重的。在架构上，我们引入了一个并行的CNN-SSM模块，以协同捕获局部和全局的心电图特征，模仿专家的协同信号分析。在知识方面，我们的框架通过两项关键创新整合了医学先验和患者特定信息：一种新的关联损失，用于建模专家的内化知识；以及一个专用的融合模块，用于处理来自外部信息源的患者元数据。

这些贡献体现在三个关键创新中：

•

我们引入了LoGoBlock，这是一个高效的多分支并行模块，用于协同学习局部-全局特征，包括三个专用流：一个基于SSM的流用于全局依赖性，一个多尺度膨胀卷积流用于局部细节，以及一个用于信息保留的身份流。

•

我们引入了一种新的关联损失，包括共病损失和抑制损失，通过将疾病共病性和互斥性明确编码到训练目标中，指导模型学习临床一致的疾病关系。

•

我们设计了一种考虑缺失值的跨门控机制，用于稳健地融合元数据，能够自适应地调节心电图和元数据特征之间的交互，确保对不完整数据的鲁棒性。

本文的其余部分结构如下。我们在第2节回顾相关文献。第3节详细介绍了提出的ELOGOnet框架。第4节展示了我们的实验设置和结果，第5节进行了进一步分析和讨论。最后，我们在第6节总结了我们的工作。

方法

在这项研究中，我们提出了ELOGOnet，这是一种用于高精度多标签分类心血管疾病的新深度学习框架。该框架的核心设计理念是系统地整合来自三个不同层次的信息：心电图信号的内在局部和全局特征、患者级别的辅助信息（元数据）以及疾病之间的先验关联。为此，ELOGOnet基于三个关键创新组件构建

数据集

我们根据Nonaka等人[39]建立的评估协议，在三个公共心电图数据集上评估了我们提出的框架。作为初步的预处理步骤，所有心电图信号都被重采样到100 Hz的统一频率。对于每个数据集，我们解决了两个不同的临床场景：多标签分类用于同时诊断疾病，以及多类分类用于识别特定的目标异常。

双向结构对心电图建模的有效性

虽然双向序列模型在各种任务中通过整合未来上下文显示出了优势，但由于信号固有的单向因果关系，它们在心电图分类中的必要性值得审视。

为了研究这一点，我们比较了基本SSM和LoGo主干结构的单向和双向配置的性能。表7中的结果显示了一个显著现象：虽然双向结构带来了轻微的性能提升

结论

在本文中，我们提出了ELOGOnet，这是一种用于高精度心电图诊断的新深度学习框架，它模仿了专家的推理工作流程。其核心是一个并行的CNN-SSM架构，协同学习局部形态和全局时间特征。我们进一步通过两项知识驱动的创新增强了模型：一种关联损失，用于强化临床一致性；以及一种稳健的元数据融合门控机制。在三个公共基准测试上的广泛实验表明

未引用的引用

缺少引用表4。

CRediT作者贡献声明

冯一卓：撰写——原始草稿，可视化，验证，软件，资源，方法论，调查，形式分析，数据管理，概念化。王北北：可视化，软件，形式分析，数据管理。王子瑞：撰写——审阅与编辑，验证，软件，调查。江凯：监督，项目管理。王鹏：监督，项目管理。杜立东：撰写——审阅与编辑。陈献祥：撰写——审阅与编辑。吴鹏：

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

联系信箱：

粤ICP备09063491号

摘要

引言

相关工作

相关工作

方法

数据集

双向结构对心电图建模的有效性

结论

未引用的引用

CRediT作者贡献声明

利益冲突声明

热点排行