综述:GRANet-Lite:一种轻量级的Ghost-残差注意力网络,用于乳腺癌分类,并结合了全面的组织病理学预处理分析

《Smart Health》:GRANet-Lite: A lightweight Ghost–Residual Attention Network for breast cancer classification with comprehensive histopathological preprocessing analysis

【字体: 时间:2026年05月02日 来源:Smart Health CS7.7

编辑推荐:

  法萨尔·艾哈迈德(Faysal Ahmmed)、雷萨杜斯·萨莱欣·拉夫桑(Resadus Salehin Rafsan)、艾琳·阿克瑟(Airin Akther)、莫海曼-宾-努尔(Mohaimen-Bin-Noor) 美国国际大学-孟加拉国分校(AIUB)计算机科学系,达卡

  法萨尔·艾哈迈德(Faysal Ahmmed)、雷萨杜斯·萨莱欣·拉夫桑(Resadus Salehin Rafsan)、艾琳·阿克瑟(Airin Akther)、莫海曼-宾-努尔(Mohaimen-Bin-Noor)
美国国际大学-孟加拉国分校(AIUB)计算机科学系,达卡1229,孟加拉国

**摘要**
从组织病理学图像中对乳腺癌进行分类常常受到染色变异性和高计算需求的挑战。本研究介绍了一种新型的轻量级卷积神经网络,该网络专为资源受限的临床环境优化设计。该架构整合了Ghost模块、挤压-激发(Squeeze-and-Excitation)和坐标注意力(Coordinate Attention)机制,并结合残差学习(residual learning),仅使用172万个可训练参数即可实现强大的特征表示能力。通过使用BreaKHis数据集,在多个放大倍数下对五种预处理策略(包括Macenko、Vahadane、Reinhard、Ruifrok归一化和基于Otsu的组织分离方法)进行了系统评估。实验结果表明,在400倍放大倍数下,基于Otsu的组织分离方法始终表现出优异的性能,准确率达到98.54%,AUC达到95.33%。通过Grad-CAM++和Score-CAM验证了模型的可解释性,确保了特征提取在空间上的一致性和与病理学的相关性。通过在计算效率与高诊断精度之间取得平衡,该框架为边缘设备和资源匮乏平台上的乳腺癌筛查提供了可扩展且可解释的解决方案。

**引言**
乳腺癌仍然是全球主要的健康负担之一,也是女性癌症相关死亡的主要原因之一。全球监测数据显示了该疾病的规模和增长趋势。2020年,全球约有230万女性被诊断出患有乳腺癌,占所有新发癌症病例的约11.7%(Sung等人,2021年)。这一数字较2018年的210万例有所增长(Bray等人,2018年),人口统计预测表明到2040年新发病例数可能超过300万例(Arnold等人,2022年)。在常规临床实践中,活检样本的组织病理学检查被认为是确认恶性肿瘤和评估肿瘤形态的金标准。然而,手动切片评估劳动强度大,并且存在观察者间和观察者内的变异性,这可能影响诊断的一致性和效率。这些限制促使人们开发计算机辅助诊断(CAD)系统来支持病理学家的工作,提高他们的诊断效率和可重复性(Echle等人,2021年;Komura和Ishikawa,2018年)。
全切片成像的广泛采用加速了病理工作流程的数字化,使得大规模数据驱动分析成为计算病理学中的核心方法(Echle等人,2021年;Hong和Feny?,2022年)。卷积神经网络(CNN)在包括乳腺癌分类在内的多种组织病理学任务中表现出色。然而,许多先进的CNN模型依赖于深度和参数密集的架构,导致计算和内存需求巨大。这些需求限制了其在资源受限的临床环境、边缘设备或即时护理(point-of-care)设置中的实际应用(Hong和Feny?,2022年;Somvanshi等人,2025年)。研究水平与实际可行性之间的差距激发了对紧凑高效网络设计的兴趣,这些网络能够在显著降低计算开销的同时保持区分能力(Somvanshi等人,2025年)。
除了计算成本外,组织病理学图像分析还面临染色变异性、扫描仪异质性和组织伪影等持续存在的挑战。血红蛋白-苏木精(H&E)染色协议、试剂浓度和扫描设备的差异可能导致颜色和外观的显著变化,从而降低模型在不同机构间的泛化能力(Hong和Feny?,2022年;Xu等人,2025年)。为了解决这些问题,人们广泛研究了染色归一化和染色增强策略,最近的研究强调了它们在现实世界异质性下的有效性和局限性(Hong和Feny?,2022年;Xu等人,2025年)。同时,通常使用组织和背景分离技术来抑制无信息区域和伪影,使模型能够专注于与诊断相关的组织结构,从而可能提高模型的鲁棒性,特别是在背景内容对分类无关的情况下(Tellez等人,2019年)。
轻量级模型设计为提高准确性和可部署性提供了有希望的途径。高效的架构组件在保留表示能力的同时减少了冗余。例如,Ghost模块使用低成本的线性操作生成额外的特征图,从而实现计算成本较低的紧凑网络(Han等人,2020年)。注意力机制进一步增强了特征选择性:挤压-激发块重新校准通道级响应,以突出重要特征(Hu等人,2018年);坐标注意力将位置信息嵌入注意力图中,且开销最小,非常适合高效架构(Hou等人,2021年)。当与残差学习结合使用时,这些策略有助于开发出用于高分辨率生物医学图像分析的紧凑且表现力强的CNN(He等人,2016年)。
尽管深度学习模型具有潜力,但将其应用于常规病理实践仍面临更广泛的临床和操作挑战。监管框架要求提供关于安全性、可靠性和有效性的有力证据。最近的评估表明,相对于研究产出量而言,临床批准的数字病理学AI工具仍然有限(Matthews等人,2024年)。此外,模型在不同机构间的泛化能力仍然是一个关键问题;实证研究表明,当模型在未见过的中心的数据上进行评估时,性能可能会下降,因为切片制备和扫描协议存在差异(Jarkman等人,2022年)。这些考虑突显了需要既准确又能够适应领域变化且符合临床基础设施限制的方法。
同样重要的是,对可解释的人工智能(XAI)的日益重视,以确保医疗AI的可靠部署。深度学习模型常被视为“黑箱”,这可能限制临床医生的信心,并在高风险的诊断环境中增加责任复杂性(Plass等人,2023年)。XAI技术提供了模型预测所基于的区域或特征的可解释性视觉证据,使临床医生能够评估算法决策是否与病理学相关结构一致(Plass等人,2023年)。关于医疗AI的最新讨论进一步强调,可解释性提高了透明度,促进了临床接受度,并支持了对负责任和伦理AI使用的期望(Agrawal等人,2025年)。
受这些挑战的启发,本研究使用BreaKHis数据集(Spanhol等人,2016年)中的组织病理学图像,研究了一种高效且可解释的乳腺癌分类框架。所提出的方法通过轻量级网络设计强调计算效率,并系统评估了多种预处理策略,以减轻染色变异性和背景伪影,目标是在资源有限的临床环境中实现可靠的性能。使用现代归因技术(包括Grad-CAM++和Score-CAM)进一步评估了模型的可解释性,以确保预测是由与病理学相关的组织区域驱动的(Chattopadhay等人,2018年;Wang等人,2020年)。

**主要贡献**
- 一种轻量级卷积神经网络架构,结合了高效的特征提取和注意力机制,实现了低计算复杂度的乳腺癌分类。
- 对多种预处理策略(包括染色归一化和组织分离方法)进行了系统评估,分析了它们对分类性能的影响。
- 使用Grad-CAM++和Score-CAM进行了全面的可解释性分析,以确保模型预测在空间上的一致性和与病理学的相关性。
- 一种适用于资源受限的临床环境的高效且可解释的分类框架。

**研究结构**
第2节回顾了组织病理学乳腺癌分类的相关文献以及相关的效率和可解释性研究。第3节详细介绍了所提出的框架,包括轻量级网络设计和评估的预处理策略。第4节报告了在不同放大倍数下的实验设置和定量结果。第5节讨论了研究结果、实际意义和局限性。最后,第6节总结了主要结论并指出了未来研究的方向。

**相关研究**
最近在组织病理学图像乳腺癌分类方面的进展主要集中在基于卷积神经网络(CNN)的框架上,这反映了深度模型在存在显著类内变异性和实验室间染色差异的情况下学习区分性形态表示的能力。早期的基于CNN的研究证明了在BreaKHis数据集上进行自动化乳腺癌识别的可行性,后续工作引入了越来越多的改进。

**方法论**
为了提供所提出框架的端到端视图,图1总结了整个流程,包括预处理(如组织分离和染色归一化)、通过增强进行类别平衡、针对特定放大倍数的数据集构建和分割、GRANet-Lite训练,以及使用定量指标和可解释性进行评估。

**跨放大倍数的预处理效果评估**
表2报告了GRANet-Lite在所有20种实验设置下的图像级测试性能,这些设置结合了五种预处理策略(组织分离基线和四种染色归一化变体)和四种放大倍数(40×、100×、200×、400×)。总体而言,染色归一化的效果并不总是有益的:Macenko和Vahadane方法通常降低了准确率,而Reinhard和Ruifrok方法在特定情况下产生了有竞争力的结果。

**讨论**
实验结果表明,GRANet-Lite在乳腺癌组织病理学分类中提供了强大的准确性和效率之间的平衡。尽管仅使用了172万个可训练参数,所提出的架构在不同放大倍数和预处理分支下均实现了强大的区分能力,预处理效果分析表明,基于Otsu的组织分离方法在我们的研究中是最有益的策略。这一发现与组织分离在分类中的作用一致。

**结论**
本研究提出了GRANet-Lite,这是一种用于BreaKHis数据集上的二分类乳腺癌的轻量级Ghost-残差注意力网络。通过整合Ghost模块与残差学习和高效的注意力机制(挤压-激发和坐标注意力),所提出的模型仅使用172万个可训练参数就实现了强大的区分性能。在四个放大倍数和五种预处理策略下的全面预处理分析显示了……

**作者贡献声明**
法萨尔·艾哈迈德(Faysal Ahmmed):撰写 – 审稿与编辑、撰写 – 原稿、验证、方法论、概念化。
雷萨杜斯·萨莱欣·拉夫桑(Resadus Salehin Rafsan):撰写 – 审稿与编辑、撰写 – 原稿、验证、方法论、数据管理。
艾琳·阿克瑟(Airin Akther):撰写 – 审稿与编辑、撰写 – 原稿、可视化、方法论。
莫海曼-宾-努尔(Mohaimen-Bin-Noor):撰写 – 审稿与编辑。

**伦理批准和参与同意**
本研究使用了公开可用的BreaKHis乳腺癌组织病理学图像数据集。所有图像均已完全匿名处理,并获得了原始数据提供者的伦理批准和知情同意。因此,本研究不需要额外的伦理批准或参与同意。

**财务披露**
本研究未从公共、商业或非营利部门获得任何特定资助。

**利益冲突声明**
作者声明他们没有已知的竞争性财务利益或个人关系,这些利益或关系可能会影响本文报告的工作。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号