DCSM-Unet:一种具有内容感知引导和差异特征学习的双路径异构编码器

《Computerized Medical Imaging and Graphics》:DCSM-Unet: Dual-Path Heterogeneous Encoder with Content-Aware Guidance and Differential Feature Learning

【字体: 时间:2026年03月24日 来源:Computerized Medical Imaging and Graphics 4.9

编辑推荐:

  提出DCSM-Unet双路径分割网络,结合ResNet-34提取局部细节和Mamba建模全局上下文,创新内容自适应融合机制及多尺度细节增强模块,显著提升医学图像分割精度,在GlaS、MoNuSeg等数据集上表现优异,临床应用价值显著。

  
陈庄东|程光友|刘伟
浙江工商大学信息与电子工程学院,中国浙江省杭州市白羊街310000

摘要

高精度医学图像分割是实现准确计算机辅助诊断的先决条件,但在平衡细粒度局部细节提取与全局上下文建模方面始终面临挑战。传统的基于卷积神经网络(CNN)的方法在分析局部纹理(对病理学边界划分至关重要)方面表现出色,但受限于其较小的感受野。相反,纯Transformer或状态空间模型(SSM)虽然能够捕捉到理解解剖结构所需的长距离依赖关系,却以计算效率或高频细节保真度的牺牲为代价。现有的混合方法往往忽略了这些架构之间的语义异质性,导致特征整合效果不佳。为了解决这些问题,本研究提出了DCSM-Unet,这是一种双路径分割网络,它结合了ResNet-34 CNN编码器以实现局部特征的高保真度,以及基于Mamba的状态空间编码器以实现全局语义的一致性。在技术上,我们提出了两项核心创新:首先,一种内容自适应引导融合机制通过渐进式优化生成通道特定的空间权重图(SWM),实现异构特征的动态、像素级校准;其次,为了减少下采样过程中的细节损失,我们引入了一种多尺度差分细节增强模块(DeeM)来锐化细微边界表示。在三个公开医学数据集(GlaS、MoNuSeg和胸部X光)上的广泛实验表明,DCSM-Unet的性能优于现有方法,实现了更高的Dice值、IoU值、精确度和更低的Hausdorff距离。在40倍放大倍数下,边界精度的提升达到了0.067-0.189微米,这使得在结直肠癌诊断中能够更准确地分级,对肿瘤进行精确的核形态测量,并在结核病筛查中可靠地划分肺野。这些结果证实,我们的架构不仅有效地整合了互补的视觉模式,还为从精确的细胞形态测量到宏观放射学筛查等多种医学识别任务提供了稳健、通用的解决方案。

引言

医学图像分割(MISeg)作为计算机辅助诊断系统的核心技术,已深入应用于包括图像建模分析(Asgari等人,2021年)、病变参数建模(Lee和Lee,2019年;Zeng等人,2020年)以及多模态图像解释(Kashyap等人,2025年;Ma等人,2024年)等关键诊断和治疗过程中。MISeg的发展与数字病理学和高分辨率成像设备的临床应用同步进行(Wei等人,2023年;Zhou等人,2019年),直接满足了临床场景中对高精度的要求。传统的MISeg方法受到观察者主观性导致的注释偏差的限制,在效率和准确性之间难以平衡。然而,MISeg还面临着不同成像模式独特物理特性带来的复杂挑战,需要能够适应广泛变化的视觉模式的模型。
具体而言,临床诊断任务通常对特征提取提出相互冲突的要求:一方面需要细粒度的局部定义,另一方面需要全局空间理解。在组织病理学工作中,如结直肠癌分级或核形态测量中,主要挑战在于区分高频结构细节。临床医生必须在不规则腺体边界和密集重叠的细胞核之间进行区分,以确定肿瘤的分化等级。这些任务要求网络对局部纹理和边缘具有极高的敏感性,以避免在细胞密集区域出现欠分割现象。相反,在胸部X光等投影成像中,诊断难度在于组织对比度低和解剖结构重叠。由于肋骨和锁骨的投影,肺野往往缺乏明显的边界,因此模型需要捕捉长距离依赖关系和全局解剖背景,以从模糊的边界中推断出准确的器官形状。
这些不同的临床场景——既需要病理学的微观精度,也需要放射学的宏观背景——暴露了现有单流范式的局限性。深度学习模型传统上以卷积神经网络(CNN)为核心(He等人,2016年;Howard等人,2017年)。虽然CNN通过分层窗口滑动在捕获病理学所需的细粒度局部特征方面表现出色,但其有限的感受野阻碍了对X光所需长距离依赖关系的建模。为了解决这个问题,视觉Transformer(ViT)引入了自注意力机制来建立全局语义关联(Chen等人,2021年;Oktay等人,2018年;Cao等人,2022年,见图1(b))。然而,其二次方的计算复杂度在处理高分辨率医学图像时会导致效率瓶颈(Bolya等人,2022年),而纯序列建模通常会导致高频局部细节的丢失。为了克服这些限制,近期发表在相关期刊上的研究探索了轻量级混合编码器,将卷积局部建模与基于注意力的全局推理相结合,实现了具有较低计算开销的竞争性分割精度(He等人,2024年;Liu等人,2024b)。
最近的进展表明,基于状态空间模型(SSM)的Mamba架构通过线性复杂度实现了全局扫描(见图1(c)(Gu和Dao,2023年)(Gu和Dao,2023年)。视觉Mamba的改进版本(Liu等人,2024年)在保持性能的同时降低了计算成本。尽管现有的Mamba架构能够关注局部特征(Huang等人,2024年;Lianghui等人,2024年),但在处理对局部细节要求较高的场景时仍显不足,其局部窗口机制也忽略了空间上下文信息。在窗口滑动和全局扫描过程中,详细的特征提取不可避免地会丢失。尽管当前的基于Mamba的分割网络成功模拟了全局背景,但将2D图像转换为1D序列的过程会破坏局部空间连贯性,从而降低了它们在保持细胞和腺体分割所需清晰边界方面的效果。
为了弥合局部细节提取与全局上下文建模之间的差距,本研究提出了DCSM-Unet(见图1(d)),这是一种双路径分割网络,有效整合了CNN和Mamba的优势。通过结合ResNet-34编码器和基于Mamba的状态空间编码器,我们的方法解决了组织病理学和放射学图像的特定挑战。此外,为了解决融合这些异构特征的难题,我们提出了内容自适应引导融合机制和多尺度差分细节增强模块(DeeM)。在GlaS、MoNuSeg和胸部X光数据集上的广泛实验表明,DCSM-Unet为多种医学成像模式提供了稳健的解决方案。
本文探讨了MISeg任务中全局依赖关系建模与局部细节捕获之间的平衡问题,以及如何将异构网络与Mamba建模相结合,并提出了三项具有临床意义的核心贡献:
  • 1)
    双路径异构编码器:引入了一种混合SSM-CNN架构,通过基于Mamba的编码器模拟全局背景,通过ResNet-34 CNN模拟局部细节。该设计克服了传统CNN的局部感受野限制,减少了全局模型中的细节损失,从而获得了更丰富的特征表示。临床意义:同时捕捉腺体结构变形(全局)和单个腺体边界的不规则性(局部)——这两者对于准确的肿瘤分级都至关重要。
  • 2)
    内容自适应引导融合机制:实现了一种渐进式注意力 CSA,生成通道特定的空间权重图,以实现动态特征融合。该机制动态平衡了来自异构编码器特征的贡献,实现了局部和全局线索的自适应、内容感知融合。临床意义:根据组织特征自动调整融合权重,无需手动调整——实现了跨模态的稳健部署。
  • 3)
    差分细节增强模块:应用多级图像差异处理来强调组织边界和细微结构。通过在不同尺度上增强边缘,DeeM显著提高了微结构的分割精度,并保留了传统下采样过程中丢失的关键细节信息。临床意义:0.531-0.865像素的Hausdorff距离降低使得在早期癌症中能够检测到细微的边界不规则性,并在高密度细胞区域中准确划分相互接触的细胞核——这些场景最容易出错。

实验部分

MISeg任务方法 - CNN、ViT和VMamba

深度学习显著推动了医学图像分割(MISeg)的发展。基于CNN的方法,如U-Net(Ronneberger等人,2015年),因其简洁的设计和可扩展性成为MISeg领域的基准模型,并催生了多种改进版本。例如,Zhou等人(2019年)的UNet++引入了嵌套的密集跳跃连接,Isensee等人(2021年)的nnU-Net优化了预处理和网络配置。然而,CNN的局部感受野限制了其捕获

实验

实验部分包括数据集和指标描述、实现细节与模型比较、定量和定性分析以及消融研究,以全面验证DCSM-Unet的有效性和各组分的贡献。选择CNN是为了保留详细生物医学纹理的结构完整性,而选择Mamba是为了增强全局上下文推理,同时避免典型的高计算开销

结论

本研究提出了DCSM-Unet,这是一种双路径医学图像分割网络,它结合了ResNet34的卷积编码能力和Mamba的序列建模优势。由于解决了在医学图像中保留局部细节和建模全局背景的双重挑战,该网络在融合特征时应用了DeeM的多尺度差分细节增强机制。这一机制显著提高了边缘检测的准确性

CRediT作者贡献声明

程光友:撰写——审稿与编辑、撰写——初稿、监督、方法论、形式分析、概念化。刘伟:撰写——审稿与编辑、监督、资源管理、项目行政、方法论、资金获取、概念化。陈庄东:撰写——审稿与编辑、撰写——初稿、可视化、验证、监督、软件开发、资源管理、项目行政、方法论、调查、形式分析、概念化。

利益冲突声明

作者声明没有已知的财务利益或个人关系可能影响本文的研究工作。

致谢

本工作得到了国家自然科学基金(项目编号62073125)的支持。
作者感谢匿名审稿人的建设性评论和建议,这些评论和建议显著提高了本手稿的质量和清晰度。

利益冲突

不存在需要声明的利益冲突。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号