轻量级U-Net和视觉几何组中的双重注意力机制在高级乳腺癌诊断中的应用

《Engineering Applications of Artificial Intelligence》:Dual attention in lightweight U-Net and visual geometry group for advanced breast cancer diagnosis

【字体: 时间:2026年02月20日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  提出一种结合轻量化U-Net与VGG网络的二阶段框架DALUGG,通过深度可分离卷积和双注意力机制(Attention Gate与Spatial Attention)提升超声乳腺癌图像的分割与分类精度,实验显示其准确率达82.69%,参数量较SOTA模型减少50%。

  
作者:Ha Minh Tan, Lam Tuan Kiet, Tran Cao Minh, Nguyen Thien Phuc, Cao Hong Nga
越南胡志明市信息技术大学信息科学与工程学院

摘要

准确诊断乳腺癌对于早期干预和改善患者预后至关重要。然而,划定肿瘤区域和评估疾病严重程度的准确性在很大程度上依赖于医生的临床经验。近期在乳腺超声图像分割和分类方面的研究努力旨在帮助医生更快、更准确地做出决策。然而,许多这类研究往往因依赖参数众多、计算成本高昂的大型模型而牺牲了可扩展性。在本文中,我们提出了一种名为“Dual Attention Lightweight U-Net and Visual Geometry Group”的轻量级模型,该模型能够同时执行乳腺超声图像的分割和分类任务。该模型基于广泛采用的Visual Geometry Group和U-Net架构设计,整合了深度可分离卷积层以及两种注意力机制(Attention Gate和Spatial Attention)。这种设计利用U-Net注意力机制的分割结果来提高分类准确性,同时降低模型复杂度。在公共乳腺超声图像数据集上的实验结果表明,与最先进模型相比,该模型仅使用一半的参数即可达到82.69%的准确率,凸显了其在临床应用中的可扩展性和高效性。

引言

乳腺癌是一种起源于乳腺组织细胞的病理状况,如果未能及时发现和治疗,可能会发生转移并带来严重的健康风险(?ukasiewicz等人,2021年)。2022年,美国癌症协会的数据显示,美国女性中新诊断出287,850例乳腺癌病例(Giaquinto等人,2022年)。鉴于这一令人担忧的趋势,准确快速的诊断变得越来越重要。信息技术和人工智能的结合显著提升了疾病评估和潜在并发症预测的能力(Lindroth等人,2024年;Jabeen等人,2022年;Chattopadhyay和Maitra,2022年)。 深度学习(LeCun等人,2015年),特别是卷积神经网络(CNNs)(Wu,2017年),已成为医学图像分析中的强大工具(Krizhevsky等人,2012年;Kumar等人,2017年)。其中,U-Net(Ronneberger等人,2015年)因其编码器-解码器结构以及能够保留空间信息的跳跃连接而表现出色,适用于精确的分割任务。同时,预训练在大规模图像数据集上的Visual Geometry Group(VGG)网络(Simonyan和Zisserman,2015年;Liu和Deng,2015年)由于其深度和分层表示学习能力,在各种计算机视觉应用中作为特征提取器表现出高效性(Simonyan和Zisserman,2015年)。 医学成像技术,如计算机断层扫描(CT)和磁共振成像(MRI),在乳腺癌的诊断和评估中起着关键作用。超声检查有助于确定肿瘤的大小、特征,并确定合适的治疗方案(Man等人,2022年)。然而,由于肿瘤大小不一、形状不规则以及恶性区域与周围健康组织之间的对比度低等因素,从医学图像中准确分割乳腺肿瘤仍然是一个严峻挑战。 在本文中,我们提出了一种新颖的两阶段框架,将Dual Attention Lightweight U-Net与基于VGG的特征学习模块结合用于超声图像中的乳腺肿瘤分割和诊断。我们将这种组合模型称为Dual Attention Lightweight U-Net and Visual Geometry Group架构(DALUGG),其中UGG代表U-Net与VGG特征提取器的结合。我们的主要贡献总结为以下两点:
  • 设计了一种高效的轻量级U-Net架构,该架构利用深度可分离卷积(Chollet,2017年;Tan等人,2023年)显著减少了参数数量和计算成本,从而加快了训练和推理速度,同时保持了高分割准确性。此外,我们引入了双重注意力机制(Attention Gate,Oktay等人,2018年;Spatial Attention,Guo等人,2021年),以增强网络对关键肿瘤区域的关注,提高肿瘤边界划分的精度。
  • 引入了一个特征学习阶段,使用预训练的VGG网络(Simonyan和Zisserman,2015年;Liu和Deng,2015年)从分割出的肿瘤区域中提取丰富的层次特征,从而实现更可靠的肿瘤特征描述并支持准确诊断。我们在乳腺超声图像(BUSI)数据集(Al-Dhabyani等人,2020年)上验证了我们的方法,显示出比现有最先进方法显著的改进。
  • 总体而言,我们提出的两阶段框架通过结合高效的区域定位和强大的特征学习,有效克服了超声图像中乳腺肿瘤分析的关键挑战,展现出在临床应用中提高诊断准确性和实用性的巨大潜力。 本文的其余部分安排如下:第2节回顾了与本研究相关的工作;第3节描述了研究方法,包括所提出框架的概述、模型整体架构以及使用的损失函数;第4节介绍了实验内容,详细说明了使用的数据集、评估指标、实现细节和实验结果;最后,第5节总结了本文并讨论了未来工作的方向。

    U-Net及其在医学图像分割中的变体

    近年来,人们广泛探索了利用深度学习技术进行乳腺癌准确诊断和肿瘤分割的方法。本节重点回顾了与U-Net架构相关的基础模型和显著进展,以及为医学图像分割和分类(特别是在乳腺超声成像中)定制的混合模型。 U-Net在医学图像分割中的重要性源于其编码器-解码器架构。

    方法论

    本节详细介绍了所提出的框架,该框架采用先进的U-Net进行分割,并利用VGG对U-Net的输出进行优化和学习,以用于乳腺肿瘤诊断。该模型包含两个相互连接的阶段:

    实验

    本节全面描述了用于验证所提出的深度学习模型在超声成像数据中对乳腺肿瘤分类有效性的实验框架。描述内容包括使用的数据集、采用的评估指标、测试的神经网络架构配置以及对实验结果的详细分析。 实验设计的主要目标是严格……

    结论与未来工作

    在本文中,我们提出了DALUGG这一创新架构,通过整合分割阶段和分类阶段这两个关键阶段,提升了原始UGGNet的性能,实现了更准确和高效的乳腺癌诊断。分割阶段以U-Net为核心,结合了可分离卷积和空间注意力机制来提高分割质量。编码器-解码器结构及跳跃连接确保了关键空间细节的保留。

    CRediT作者贡献声明

    Ha Minh Tan:撰写初稿、可视化处理、验证、软件开发、方法论研究、概念化。 Lam Tuan Kiet:软件开发、资源获取、调查研究、方法论研究。 Tran Cao Minh:撰写与编辑、可视化处理、验证、软件开发。 Nguyen Thien Phuc:撰写与编辑、方法论研究、调查研究、概念化。 Cao Hong Nga:撰写与编辑、监督工作、方法论研究。

    利益冲突声明

    作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

    致谢

    本研究得到了越南胡志明市信息技术大学科学研究支持基金的支持。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号