高效双线解码器网络EDLDNet:多尺度卷积注意力机制革新多器官分割,实现精准与计算效率的完美平衡

《Biomedical Signal Processing and Control》:An efficient dual-line decoder network with multi-scale convolutional attention for multi-organ segmentation

【字体: 时间:2025年09月14日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  本刊推荐:本文创新性提出高效双线解码器分割网络(EDLDNet),通过引入带噪声与无噪声双解码器训练策略,结合多尺度卷积注意力模块(MSCAM)、注意力门(AG)及上卷积块(UCB),显著提升多器官分割精度并大幅降低计算成本(MACs减少89.7%)。在四个公开医学影像数据集上超越现有SOTA方法,为临床放疗规划和手术导航提供高效可靠的AI解决方案。

  

Highlight

精准的风险器官(OAR)分割在放射治疗、计算机辅助手术和治疗规划中具有至关重要的意义——细微的偏差都可能直接影响患者预后[1][2]。然而,传统人工分割方式不仅耗时费力,还容易引入人为误差,甚至带来临床风险[3]。

Related work

近年来,基于卷积神经网络(CNN)和Transformer架构的深度学习模型在医学图像分割领域取得显著进展。U型网络(如UNet[4]、UNet++[5]和nnUNet[6])已成为主流框架,注意力机制[7][8]的引入进一步优化了特征表达与像素级分类精度。不确定性感知分割网络通过提取不确定性信息生成注意力[9],并优化分割掩码[10]。尽管这些模型表现优异,但其高昂的计算成本限制了临床推广应用。最近,视觉Transformer(ViT)[11]凭借自注意力机制在捕获长程依赖关系方面展现出强大潜力。为提升性能,层次化视觉Transformer模型如SSFormer[12]、TransUNet[13]、DS-TransUNet[14]、TransFuse[15]、SwinUNet[16]、PolypPVT[17]、MT-UNet[18]、MISSFormer[19]、TransCASCADE[20]、PVT-GCASCADE[20]和EMCAD[21]相继提出,但这些方法通常计算密集、资源消耗大,在资源受限的临床场景中难以落地。

Methodology

我们提出了一种集成视觉Transformer编码器(PVTv2)与双并行解码器的分割架构:一个噪声解码器(noisy decoder)和一个无噪声解码器(noise-free decoder)。每个解码器均融合多尺度卷积注意力模块(MSCAMs)、上卷积块(UCBs)和注意力门(AGs)以增强特征表达能力。噪声解码器额外引入噪声层,在训练阶段与无噪声解码器协同生成多尺度分割掩码,通过突变隐式逻辑集成技术组合多级逻辑输出,从而提升模型鲁棒性与噪声适应力。推断阶段仅保留无噪声解码器,确保高效率推理。

Dataset

为验证方法有效性,我们在四个公开多器官分割数据集开展实验:Synapse[36]、ACDC[37]、SegThor[38]和LCTSC[39]。

Conclusion

本研究提出的EDLDNet网络通过多尺度卷积注意力与噪声正则化机制,在保证高精度的同时显著降低计算成本。其独特的双解码器训练策略与突变损失函数设计,有效提升了模型泛化能力与鲁棒性,为临床实时精准分割提供了新的技术路径。

相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号