自动乳腺超声(ABUS)是一种新兴的乳腺监测方式,能够有效获取乳腺的三维(3D)体积图像,用于乳腺癌筛查(Huang等人,2025b)。根据美国癌症协会的数据(Siegel, Kratzer, Giaquinto, Sung, & Jemal, 2025),乳腺癌在所有癌症类型中发病率最高。然而,ABUS扫描产生的3D体积由数百个二维切片组成(Brem, Lenihan, Lieberman, & Torrente, 2015),解释这样的体积数据需要时间。计算机辅助系统可以显著提高ABUS解释的效率。其中,ABUS图像中的肿瘤分割提供了具有临床价值的信息——如肿瘤大小、形状和边界,这些信息在病变特征描述和手术计划中起着关键作用(Pan等人,2024)。因此,开发一种有效的ABUS图像肿瘤分割方法具有重要的临床意义(图1)。
关于ABUS图像中肿瘤分割的研究仍然相对有限。早期的方法主要依赖于手工制作的特征。Agarwal等人(2018)提出了一个基于分水岭算法的半自动分割框架。Tan等人(2016)采用了一种螺旋扫描的深度引导动态规划方法来分割3D ABUS图像中的恶性肿瘤。Xi等人(2017)提出了一种结合异常病变区域先验知识的质量分割方法。Kozegar, Soryani, Behnam, Salamati, & Tan(2017)提出了一种两阶段分割方法,该方法将形状信息纳入分割过程。Lee, Chang, Chou, & Yang(2020)应用各向异性扩散滤波来抑制斑点噪声并校正强度不均匀性,以减少边界伪影。近年来,ABUS分割的进步主要得益于深度学习。Pan, Chen, Li, Cai, & Wang(2021)开发了SC-FCN-BLSTM,这是一个全卷积网络,它在FCN解码器中引入了SC-注意力模块,以提高空间精度和语义丰富性,从而更好地解决了ABUS图像中肿瘤边界模糊的问题。Zhu等人(2022)提出了一个区域感知Transformer网络(RAT-Net),该网络结合了区域感知自注意力块(RASAB)和区域感知Transformer块(RATB),将肿瘤区域信息整合到多尺度特征中以实现准确分割。Cheng等人(2022)提出了DSGMFFN,这是一个多尺度特征融合网络,它引入了深度语义引导解码器(DSGNet)和多尺度特征融合模块(MFFM)。在DSGNet中,所有跳跃连接的特征图都包含深度语义信息,从而防止了噪声传播。MFFM由最深的语义特征引导,并构建了多尺度特征融合方案来捕获多尺度信息。Cao等人(2021)开发了一个扩张的密集连接U-Net,以解决ABUS数据中常见的肿瘤大小和形状的大变化,从而改善了跨尺度特征整合。Cui, Tian, Wang, & Ma(2025)引入了MBDPNet,这是一个多分支深度感知网络,它在多尺度融合过程中压缩特征通道以降低计算复杂性。
然而,实现ABUS图像的准确分割仍然具有挑战性。首先,超声图像通常是模糊的,只包含灰度信息(Wells, 2006, Zhuang, Zhang, Liang, Liu, Gao, 2025)。这种成像方式的有限颜色变化导致背景呈现出低强度的灰色特征,这与病变区域的特征相似。因此,病变与周围组织之间的边界往往不清晰。其次,病变区域仅占整个ABUS图像的一小部分(Boca, Ciurea, Ciortea, & Dudea, 2021),并且包含的特征信息有限,导致前景和背景之间的强度和纹理差异很小,从而增加了肿瘤分割的难度。因此,乳腺肿瘤分割需要多尺度信息。第三,ABUS图像中的肿瘤区域形状多样,经常受到成像伪影的影响。不同病例之间的形状、大小和边界外观存在显著差异,导致高类别间相似性和较大的类别内变异性(Ding, Zhang, Zhuang, Zhuang, Gao, 2023, Xu, Zhuang, He, Wang, Zhuang, Zeng, 2026)。因此,ABUS图像分割必须考虑有效的跨尺度特征融合。
为此,我们提出了一个边缘细化多尺度卷积混合注意力网络(EMCANet),用于自动乳腺超声(ABUS)图像中的肿瘤分割。该框架通过多尺度级联架构解决了ABUS图像中的固有挑战。具体来说,为了解决病变边界模糊的问题,我们在特征融合阶段设计了一个边缘特征细化融合(ERF)模块。该模块提取多尺度边缘特征,明确引导网络的关注点朝向肿瘤边界信息。同时,为了增强模型对不同肿瘤形态的鲁棒性,我们引入了一个群组特征相关性聚合(GFA)模块,通过跨尺度特征对齐来校准语义差异。此外,还结合了空间多尺度卷积混合注意力(SHA)模块,以自适应地增强目标区域的表示,同时抑制背景伪影。这种整体设计确保了ABUS图像中的精确分割性能。本工作的主要贡献总结如下:
1.为了提高模型对模糊边界的敏感性,我们提出了边缘特征细化融合(ERF)模块。通过在特征级别引入边缘运算符并在小波域局部抑制高频噪声,该模块提高了提取的边界特征的精度。
2.所提出的群组特征关联(GFA)模块通过基于群组的相关性建模实现跨尺度特征对齐,并使用多阶段预测进行特征重新校准。这增强了低级纹理和高级语义信息之间的互补性,促进了跨尺度信息融合,从而增强了形态变化大且类别内差异显著的区域的肿瘤分割的鲁棒性。
3.我们设计了空间多尺度卷积混合注意力(SHA)模块,该模块在不同的感受野上执行并行深度卷积,并整合了注意力机制。该模块自适应地增强了多尺度肿瘤信息,同时抑制了背景干扰。
4.实验结果表明,这三个设计的模块有效地增强了主干网络的特征提取能力,有助于捕获特定于病变的特征。与其他方法相比,EMCANet在两个私有ABUS数据集以及一个公共BUSI数据集上均表现出更优的性能。