KMS-Net：基于Kolmogorov-Arnold多尺度注意力网络的心脏超声与磁共振图像精准分割新架构

《IEEE Access》：KMS-Net: Kolmogorov–Arnold-Based Multi-Scale Attention Network for Cardiac Segmentation

【字体：大中小】 时间：2026年03月23日 来源：IEEE Access 3.6

编辑推荐：

　　为解决心脏超声与磁共振图像分割存在图像质量差、结构多变、长程依赖建模难等挑战，研究人员提出一种新颖的KMS-Net分割架构，创新性地将可学习的基于样条的Kolmogorov-Arnold网络与多尺度注意力机制深度融合，在CAMUS、ACDC等多个数据集上实现了超越U-Net、TransUNet、U-Mamba等模型的优异性能，为临床心脏结构准确分割与量化评估提供了新方案。

心血管疾病是全球最主要的死因，而心脏成像技术的准确解读是临床诊断与治疗的关键。在各种成像工具中，超声心动图因其无创、实时、无辐射、便携且成本低廉，成为临床实践中使用最频繁的检查手段。医生依赖它来评估左心室射血分数、瓣膜病、心肌病等一系列关键参数。然而，这些评估通常建立在对心脏结构（如左心室、心房、心肌等）的精确勾画之上。目前，临床实践中大多依赖医生手动或半自动描记边界，这个过程不仅耗时耗力，而且不同医生之间甚至同一医生在不同时间的标注都可能存在显著差异，影响了诊断的一致性与可靠性。因此，开发可靠的自动分割工具以减轻工作负担、提高结果的一致性，已成为一项迫切需求。

但自动分割心脏结构，尤其在嘈杂的超声图像中，并非易事。图像质量参差不齐、声学阴影、探头角度变化、心脏收缩与舒张期的巨大形态差异，都给机器“看懂”心脏带来了重重困难。传统上，基于卷积神经网络的方法，尤其是U-Net及其变体，是医学图像分割的主力。它们擅长捕捉图像的局部细节特征，但在建模图像中相距较远的区域之间的长程依赖关系方面存在先天不足。另一方面，纯基于Transformer的模型能够很好地捕捉全局上下文信息，却又可能牺牲对精细边界的刻画。近年来，一种名为Kolmogorov-Arnold网络的新型可学习函数近似器进入研究者视野，它用基于样条的可训练非线性映射替代了固定的激活函数，有望在表达能力和参数效率上取得更好平衡。那么，能否设计一种新型网络架构，巧妙地融合卷积的局部感知能力、Transformer的全局建模优势，以及KAN强大的非线性表达能力，从而精准地勾勒出心脏的每一个轮廓呢？

来自研究团队的研究者们给出了肯定的答案。他们在《IEEE Access》上发表了题为“KMS-Net: Kolmogorov–Arnold-Based Multi-Scale Attention Network for Cardiac Segmentation”的论文，提出了名为KMS-Net的新型混合分割架构。这项研究旨在解决心脏图像分割中面临的数据有限、计算复杂度高、现有模型对多尺度特征和长程关系建模不足等关键挑战。KMS-Net在著名的CAMUS超声心动图数据集、ACDC心脏磁共振数据集以及EchoNet-Dynamic数据集上进行了全面评估，其分割精度在多个指标上均超越了包括U-Net、TransUNet、Swin-UNet、U-Mamba以及近期多种KAN-based模型在内的一系列先进方法，证实了其强大的分割性能和出色的跨模态泛化能力。

为达成研究目标，作者团队主要应用了以下几项关键技术方法：首先，构建了KMS-Net核心架构，它是一个包含茎干层、编码器、瓶颈（KASPPS模块）、解码器和预测头的五阶段网络。其次，创新性地集成了多种注意力与特征处理模块，包括用于多尺度上下文信息提取的EMA模块、用于长程空间依赖线性复杂度建模的SS2D模块、用于细化跳跃连接的多尺度注意力门MSAG，以及结合了KAN卷积与通道注意力机制的增强型空洞空间金字塔池化模块KASPPS。研究使用的样本队列来源于公开数据集：CAMUS（500名患者的超声数据）、ACDC（150名患者的心脏MRI数据）和EchoNet-Dynamic。

研究结果

A. 整体网络架构表现

KMS-Net在ACDC心脏MRI数据集上取得了当前最佳的性能，其平均Dice系数达到92.65%，平均IoU为85.95%，边界误差HD95低至1.08 mm。与U-Net、TransUNet、Swin-UNet、U-Mamba等模型相比，KMS-Net在所有心脏子结构（左心室、右心室、心肌）的分割精度上均有显著提升。在更具挑战性的CAMUS超声心动图数据集上，KMS-Net同样表现出色，在四腔心切面和两腔心切面视图上，对左心室内膜、心肌和左心房的分割Dice分数均领先于其他对比模型。

B. 消融实验验证

通过系统的消融研究，作者验证了KMS-Net中各个核心组件的有效性。实验表明，移除EMA模块、SS2D模块、MSAG模块或使用标准ASPP替代KASPPS模块，都会导致模型性能的明显下降。这证实了EMA在捕获方向性多尺度上下文、SS2D在线性复杂度下建模长程关系、MSAG在精炼跳跃连接特征以及KASPPS在增强多尺度特征聚合方面的重要作用。

C. 泛化能力测试

为了评估模型的鲁棒性和泛化能力，作者将在CAMUS数据集上训练的KMS-Net模型，直接（零样本）应用于EchoNet-Dynamic数据集进行测试。结果显示出强大的跨数据集泛化性能，进一步证明了KMS-Net所学特征的代表性和普适性。

D. 计算效率分析

尽管集成了多个复杂模块，KMS-Net通过采用轻量化的残差卷积块、线性复杂度的SS2D模块以及分组注意力机制，在保持高精度的同时，控制了参数量并实现了较快的推理速度，显示了其在实际临床部署中的潜力。

结论与讨论

本研究成功提出并验证了KMS-Net，一种专为心脏图像分割设计的新型Kolmogorov-Arnold多尺度注意力网络。该模型的核心贡献在于，创造性地将可学习的KAN层与精心设计的多尺度注意力机制（EMA、MSAG）深度集成，并辅以高效的SS2D模块进行长程建模，通过增强的KASPPS瓶颈聚合多尺度上下文，从而在单个架构中协同优化了局部细节感知、全局上下文理解以及复杂非线性特征映射。

研究结果表明，KMS-Net在心脏超声和磁共振图像分割任务上均达到了最先进的性能水平。它不仅显著提升了分割精度（更高的Dice和IoU，更低的边界误差HD95），而且展现出了优异的跨成像模态和数据集的泛化能力。这意味着KMS-Net有望成为一种通用的、鲁棒的心脏结构自动分割工具，能够适应临床中不同设备、不同患者、不同图像质量带来的变异。

这项工作的重要意义在于：其一，为医学图像分割，特别是心脏图像分析领域，提供了一种融合前沿KAN理论与多尺度注意力机制的新范式；其二，所提出的各种模块（如EMA、KASPPS、MSAG）及其组合思路，对解决其他医学影像分割任务具有启发和借鉴价值；其三，模型展现出的高精度和强泛化性，为将其转化为临床辅助工具，实现心脏功能的自动化、标准化、快速量化评估奠定了坚实的技术基础，有望减轻医生负担，提高诊断的一致性和效率，最终惠及广大心血管疾病患者。未来的工作可以探索将KMS-Net架构应用于更多器官和模态的分割任务，并进一步优化其在实际临床工作流中的集成与部署。

热点排行