《Neural Networks》:An interactive axial feature selection network for medical image classification
编辑推荐:
医疗图像分类中,本文提出交互式轴向特征选择网络(IAFSNet),通过特征交互模块(FIM)增强多尺度特征互补性,轴向特征选择模块(AFSM)从水平、垂直和空间维度过滤噪声并强化关键特征。实验证明该模型在四个基准数据集上分类准确率显著提升,优于传统CNN和Transformer方法。
潘帅|胡春华|赵娟|于海芳
山东航空大学自动化与电气工程学院,滨州市,256600,山东,中国
摘要
为了解决特征之间的差异和相关性,并充分利用显著语义在医学图像分类任务中的重要性,本文提出了一种交互式轴向特征选择网络(IAFSNet),旨在改进特征表示,有效过滤分类过程中的噪声,从而提高分类性能。本文介绍了一种新设计的特征交互模块(FIM),该模块可以学习不同特征之间的空间差异,并增强局部空间特征与全局上下文语义之间的相互依赖性和互补性。此外,本文实现了一种新颖的轴向特征选择模块(AFSM),该模块从水平、垂直和空间三个角度过滤显著的特征语义。通过调整阈值,可以突出显著特征并消除无关噪声,使这些关键特征能够逐层交叉聚合并建立相互作用,最终提高分类准确性。在四个基准数据集上的实验结果表明,所提出的IAFSNet表现出优异的分类性能和鲁棒性,显著优于许多现有的分类方法。
引言
传统的医学图像自动检测方法已经显示出较高的准确性。随着机器学习技术的发展,深度学习作为医学辅助诊断的新方法得到了广泛应用(Bi等人,2017年;You等人,2025年;Hekler等人,2019年)。近年来,深度学习在医学图像分析领域取得了突破性进展。Sahu和Kashyap(2023年)提出了一种基于深度学习的有效自动检测方法,用于CT扫描图像的COVID-19自动多分类任务,其准确性比传统方法有显著提高。Ausawalaithong等人(2018年)将DenseNet网络应用于肺癌分类,并结合迁移学习方法来缓解小数据集的问题。与传统的机器学习方法不同,深度学习模型能够自主学习数据集的多层次抽象、表示和信息,无需人工干预。这一特性使它们成为病理学家克服主观视觉评估障碍的强大工具(Uhm等人,2021年;Shapira等人,2020年)。
可靠的分类模型可以帮助临床医生更快、更准确地解释医学图像。尽管卷积神经网络(CNN)在计算机辅助诊断方面取得了快速进展(Rawat和Wang,2017年;Masud等人,2022年),包括ResNet(Xu等人,2023年)和Inception(Soumik和Hossain,2020年)等代表性变体,但它们的感受野有限,因此在提取局部细节方面表现良好,但在捕捉长距离依赖关系方面效果较差,尤其是在病变形态在不同个体之间存在显著差异时(Khatri等人,2024年)。基于Transformer的架构(Peng等人,2021年)通过自注意力来建模全局上下文,并且具有尺寸灵活性;然而,纯自注意力缺乏明确的局部性先验,其捕捉精细结构的能力取决于补丁大小、架构选择和数据规模。此外,这类模型通常依赖于大型、注释良好的数据集,而这在医学成像中成本较高。因此,现有的流程往往未能充分利用跨尺度/层次结构的互补关系,也缺乏一种原则性的机制来选择性地强调临床上的显著线索,同时抑制冗余响应。
总之,深度学习依赖于神经元强大的自学习能力。经过成功训练后,它可以根据学到的映射进行智能预测。它已被广泛用于医学图像分类任务。然而,上述现有的深度学习模型在特征提取方面仍存在一些局限性:1)在多个尺度上的特征提取能力不足;2)不同特征之间的差异和相关性没有得到有效区分;3)对显著特征的关注不足,以及重复使用冗余信息。为了解决这些局限性,开发了一种新颖的交互式轴向特征选择模型,该模型可以有效改进视觉表示的性能,并具有强大的特征交互和噪声减少能力。该模型首先使用ResNet18作为骨干网络来实现多尺度局部空间特征提取,同时通过跨层信息流减少冗余信息的使用。其次,设计特征交互模块(FIM)用于建立不同尺度特征之间的关系,突出差异,并增强全局上下文语义的表达。最后,受关注显著信息的注意力机制的启发,新开发的轴向特征选择模块(AFSM)从水平、垂直和空间方向过滤交互特征信息,并实现逐层交叉聚合,以突出显著特征的表示并进一步减少无关噪声。本文的主要贡献如下:
•提出了一种新的特征交互模块(FIM),用于探索多样化特征之间的空间差异和相关性。通过建立依赖关系和互补性,它增强了局部空间特征和全局上下文细节的表示,有效解决了现有方法中特征交互不足的问题。
•开发了一种轴向特征选择模块(AFSM),用于从水平、垂直和空间维度建模和过滤多尺度空间-语义细节。利用阈值优化策略和分层交叉聚合机制,它强化了显著特征的表现,同时过滤掉无关噪声。这种方法建立了特征之间的有效连接,显著提高了模型解释复杂医学图像的能力。
本研究的其余组织结构如下:第2章详细介绍了与医学图像分类相关的工作。第3章重点介绍了所提出的交互式轴向特征选择框架(IAFSNet)及其相应的内部组成模块。第4章提供了详细的实验结果和分析。第5章给出了结论和未来研究计划。
相关研究
相关工作
学者们提出了许多基于CNN的高效医学图像分类模型,在某些情况下,它们的性能甚至接近人类专家。例如,Chen等人(2019年)使用AlexNet区分良性与恶性结节(AUC为0.9325);Farooq和Hafeez(2020年)对预训练的ResNet-50进行了微调,并在41个周期内实现了96.23%的COVID-19分类准确率,尽管临床应用仍需要更大规模的训练。Huang等人(2020年)
方法
本节重点介绍所提出的医学图像分类框架,并详细介绍了每个模块的内部结构(见3.1至3.4节)、工作原理和训练过程。
实验与讨论
本节介绍了实验数据的来源、详细的参数配置和相关指标(见4.1.1和4.1.2节)。然后,提供了不同分割方法和每个模块的消融研究结果和分析。最后,对热图的可视化进行了讨论。
结论与未来研究计划
本文开发了一种交互式轴向特征选择框架(IAFSNet),强调了显著特征和全局上下文语义细节在医学图像分类中的重要性。该框架采用ResNet18及其残差结构实现多尺度局部空间特征提取。通过集成特征交互模块(FIM),它建立了跨尺度和跨层次的特征交互,增强了特征的互补性和依赖性
CRediT作者贡献声明
潘帅:撰写——审稿与编辑,撰写——初稿,验证,软件,方法论,概念化。胡春华:验证,调查,数据管理。赵娟:监督,项目管理,数据管理。于海芳:调查,形式分析。