高效双线解码器网络EDLDNet：多尺度卷积注意力机制革新多器官分割，实现精准与计算效率的完美平衡

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Biomedical Signal Processing and Control》：An efficient dual-line decoder network with multi-scale convolutional attention for multi-organ segmentation

【字体：大中小】 时间：2025年09月14日 来源：Biomedical Signal Processing and Control 4.9

编辑推荐：

　　本刊推荐：本文创新性提出高效双线解码器分割网络（EDLDNet），通过引入带噪声与无噪声双解码器训练策略，结合多尺度卷积注意力模块（MSCAM）、注意力门（AG）及上卷积块（UCB），显著提升多器官分割精度并大幅降低计算成本（MACs减少89.7%）。在四个公开医学影像数据集上超越现有SOTA方法，为临床放疗规划和手术导航提供高效可靠的AI解决方案。

Highlight

精准的风险器官（OAR）分割在放射治疗、计算机辅助手术和治疗规划中具有至关重要的意义——细微的偏差都可能直接影响患者预后[1][2]。然而，传统人工分割方式不仅耗时费力，还容易引入人为误差，甚至带来临床风险[3]。

Related work

近年来，基于卷积神经网络（CNN）和Transformer架构的深度学习模型在医学图像分割领域取得显著进展。U型网络（如UNet[4]、UNet++[5]和nnUNet[6]）已成为主流框架，注意力机制[7][8]的引入进一步优化了特征表达与像素级分类精度。不确定性感知分割网络通过提取不确定性信息生成注意力[9]，并优化分割掩码[10]。尽管这些模型表现优异，但其高昂的计算成本限制了临床推广应用。最近，视觉Transformer（ViT）[11]凭借自注意力机制在捕获长程依赖关系方面展现出强大潜力。为提升性能，层次化视觉Transformer模型如SSFormer[12]、TransUNet[13]、DS-TransUNet[14]、TransFuse[15]、SwinUNet[16]、PolypPVT[17]、MT-UNet[18]、MISSFormer[19]、TransCASCADE[20]、PVT-GCASCADE[20]和EMCAD[21]相继提出，但这些方法通常计算密集、资源消耗大，在资源受限的临床场景中难以落地。

Methodology

我们提出了一种集成视觉Transformer编码器（PVTv2）与双并行解码器的分割架构：一个噪声解码器（noisy decoder）和一个无噪声解码器（noise-free decoder）。每个解码器均融合多尺度卷积注意力模块（MSCAMs）、上卷积块（UCBs）和注意力门（AGs）以增强特征表达能力。噪声解码器额外引入噪声层，在训练阶段与无噪声解码器协同生成多尺度分割掩码，通过突变隐式逻辑集成技术组合多级逻辑输出，从而提升模型鲁棒性与噪声适应力。推断阶段仅保留无噪声解码器，确保高效率推理。

Dataset

为验证方法有效性，我们在四个公开多器官分割数据集开展实验：Synapse[36]、ACDC[37]、SegThor[38]和LCTSC[39]。

Conclusion

本研究提出的EDLDNet网络通过多尺度卷积注意力与噪声正则化机制，在保证高精度的同时显著降低计算成本。其独特的双解码器训练策略与突变损失函数设计，有效提升了模型泛化能力与鲁棒性，为临床实时精准分割提供了新的技术路径。

联系信箱：

粤ICP备09063491号

热点排行