VWENet:一种用于3D医学图像分割的体积小波与专家混合网络

《Pattern Recognition Letters》:VWENet: Volumetric Wavelet and Mixture-of-Experts Network for 3D Medical Image Segmentation

【字体: 时间:2026年02月28日 来源:Pattern Recognition Letters 3.3

编辑推荐:

  3D医疗图像分割的轻量化解决方案VWENet提出,通过Volumetric Fused Wavelet Pooling减少信息损失,stage-specific模块降低参数和推理成本,动态通道分配融合多阶段特征,在ACDC、KiTS、BraTS数据集上Dice指标优于现有模型,同时实现最低FLOPs和参数量。

  
陶朝阳|蔡青|夏成毅
天津天宫大学人工智能学院,中国天津市滨水西路399号,西青区,300387

摘要

3D医学图像分割是计算机辅助诊断的基石,然而现有的基础模型受到全体积推理计算成本过高的限制。为了打破这一资源瓶颈而不牺牲性能,我们提出了体积小波与专家混合网络(VWENet),这是一种轻量级的U形架构,集成了三项互补的创新技术。首先,体积融合小波池化(VFWP)模块减轻了传统池化方法中固有的混叠伪影,同时保留了高频和低频特征。其次,针对不同阶段的轻量级模块利用了低秩分解、信息融合和专家路由技术,大幅降低了参数数量和推理延迟。第三,动态通道分配策略将浅层和深层特征融合在一起,以实现精确的目标边界检测。在ACDC、KiTS和BraTS数据集上的评估表明,VWENet在Dice分数上分别比第二名的重型网络高出1.83%、1.78%和1.48%,同时在轻量级竞争者中实现了最低的FLOPs消耗和第二小的参数规模,平均Dice分数提升了4.34%。因此,VWENet成为资源受限环境下实时3D医学图像分析的实用高效解决方案。

引言

体积医学图像分割能够精确地从CT和MRI等成像方式获取的体积数据中勾勒出病变区域,为计算机辅助诊断提供关键技术支持[1]。深度学习长期以来一直是医学图像分割模型的核心。基于卷积的架构[2][3]侧重于局部特征,但其固有的感受野限制了长距离建模的能力。注意力模型[4][5]在捕捉长距离依赖关系方面表现出色。然而,由于数据量庞大,现有的3D模型计算成本极高。
尽管当前模型[6]取得了显著成果,但仍存在两个关键挑战:首先,大多数现有方法[4][7]在每个编码器阶段采用相同的结构,尚未探索如何在每个层次设计有效的特征;其次,为了降低大图像尺寸带来的计算负担,通常会应用多次下采样操作,这进一步削弱了对象信息的完整性。
与此同时,现有的轻量级架构主要针对2D图像[8][9]设计,缺乏注意力机制提供的全局视角,在体积医学图像分割任务中处于劣势。因此,本研究旨在设计一种轻量级模型,以解决当前的计算瓶颈问题,同时保持高性能。
本研究的主要贡献如下:
  • 我们提出了体积融合小波池化(VFWP)模块,在下采样过程中保留了对象的结构和细节。
  • 我们引入了深度可分离通道注意力卷积(DAConv)和高效路径专家混合注意力(EMPA)模块,形成了一个混合模块,逐步将特征学习从局部细节提升到全局高级表示。
  • 我们提出了体积小波与专家混合网络(VWENet),用于体积医学图像分割。VWENet通过通道分配高效融合了多阶段特征,以轻量级的计算开销实现了对小对象的高精度分割。
  • 章节摘录

    体积医学图像中的分割方法

    早期的体积医学分割网络使用全3D卷积[10]。V-Net[11]为前列腺MRI引入了残差3D模块,展示了端到端体积处理的优势。nnU-Net[12]自动化了整个处理流程。同时,注意力机制和Transformer架构改变了这一领域:Swin-UNet[7]将分层的Swin-Transformer模块集成到类似U-Net的框架中,以捕获2D切片内的长距离依赖关系;而UNETR[5]

    方法论

    本文提出的VWENet是一个U形网络,其中编码器在不同阶段采用不同的特征提取策略,解码器阶段与编码器阶段对称,如图1所示。
    我们首先介绍了体积融合小波池化模块如何在下采样过程中减少信息损失。接着,讨论了专门为体积数据分割设计的轻量级模块。最后,我们详细介绍了特征提取过程。

    数据集

    ACDC(自动化心脏诊断挑战)数据集是一个公开的心脏图像分割和诊断基准,包含100个病例,用于分割心脏MRI图像中的左心室(LV)、右心室(RV)和心肌(Myo)。其中70个病例用于训练,10个用于验证,20个用于测试。
    KiTS19数据集是一个用于分割肾脏及其肿瘤的CT数据集,体素间距范围为[0.5–5.0 mm, 0.44–1.04 mm, 0.44–1.04 mm]

    结论

    最近的医学成像基础模型,如MedSAM[26]或MONAI模型[27],在体积分割方面展现了强大的泛化能力,但它们面临高推理成本等挑战,难以在实时临床环境中应用。本文提出了一种方法,通过利用小波池化、低秩设计和通道分配策略显著降低了计算开销,使VWENet能够

    CRediT作者贡献声明

    陶朝阳:撰写——原始草稿、方法论、研究、概念化。蔡青:撰写——审阅与编辑、方法论、研究、形式分析。夏成毅:撰写——审阅与编辑、方法论、资金获取、形式分析、概念化。

    利益冲突声明

    作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究结果。

    致谢

    本项目部分由中国国家自然科学基金(项目编号62173247)资助。
    相关新闻
    生物通微信公众号
    微信
    新浪微博

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号