MTA-HXCN：一种改进的三重注意力融合混合学习机制，用于实现可解释的卷积神经网络在脑肿瘤检测中的应用

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Neurocomputing》：MTA-HXCN: Modified Triplet Attention Fused Hybrid Learning Enabled Explainable Convolutional Neural Network for Brain Tumor Detection

【字体：大中小】 时间：2026年05月11日 来源：Neurocomputing 6.5

编辑推荐：

　　德万舒·杜贝（Devanshu Dube）| 阿肖克·库马尔（Ashok Kumar）计算机科学专业，班纳斯塔利文迪亚皮斯（Banasthali Vidyapith），印度拉贾斯坦邦班纳斯塔利，邮编304022 摘要由于脑肿瘤结构复杂多样，脑肿瘤成像面临巨大挑战，这阻碍了

德万舒·杜贝（Devanshu Dube）| 阿肖克·库马尔（Ashok Kumar）

计算机科学专业，班纳斯塔利文迪亚皮斯（Banasthali Vidyapith），印度拉贾斯坦邦班纳斯塔利，邮编304022

摘要

由于脑肿瘤结构复杂多样，脑肿瘤成像面临巨大挑战，这阻碍了有效的检测。由于准确的分割和识别对于降低死亡率至关重要，因此对自动化、高效的方法需求很高。然而，传统技术在临床应用中往往不切实际，因为它们计算效率低、会丢失空间信息且解释性较差。为了解决这些问题，本文提出了一种有效的改进型三重注意力融合混合学习驱动的可解释卷积神经网络（MTA-HXCN）框架用于脑肿瘤检测。该研究结合了多种先进技术，构建了一个更准确、高效且透明的模型。研究的核心是混合学习概念，它整合了分布式学习和增量学习；改进型三重注意力（MTA）机制增强了特征处理能力；同时，可解释人工智能（XAI）的引入提高了模型的透明度。基于改进型三重注意力融合的生成对抗网络（MTAGAN）的分割方法着重于复杂的跨维度特征交互，从而获得更精确的分割结果，并可能克服标准模型的局限性。总体而言，所提出的MTA-HXCN框架提高了模型的可解释性、泛化能力及效率，同时减少了过拟合问题。实验结果显示，在使用BraTS2020数据集时，该模型实现了97.99%的准确率、98.36%的精确率、97.80%的敏感度和98.08的F1分数；与传统方法相比，在BraTS2024数据集上，该模型的准确率为97.98%、精确率为98.54%、F1分数为98.33%、敏感度为97.70%。

引言

大脑是一个不可或缺的器官，由数十亿个细胞组成，负责人类的调节功能，如呼吸、反应、运动技能、视觉、情绪等[1]。脑肿瘤是由于细胞无控制地增殖而形成的，这些细胞没有经历正常的细胞生命周期（凋亡和生长）[2]。脑肿瘤分为恶性和良性两类：良性肿瘤不具备癌性，不会影响其他身体部位；而恶性肿瘤则会侵犯周围组织，并容易扩散到全身，危及生命。通常情况下，原发性癌症起源于大脑，而继发性癌症则起源于其他部位后再扩散至大脑。脑磁 resonance 成像（MRI）是描述肿瘤生长的主要工具之一，能够有效表征和检测脑肿瘤。MRI生成的图像具有高分辨率，提供了关于肿瘤大小、形状和精确位置的重要信息[3]。

然而，由于复杂的结构、变异性、对比度、分辨率和噪声等因素，MRI图像分析既耗时又具有挑战性[4][5]。此外，图像分割需要通过自动化识别过程对肿瘤进行准确的估计和分类，这依赖于几何和统计特性[6]。全自动分割、半自动化分割和手动分割是三种处理复杂情况的分割方法，具有较高的准确性潜力[7]。随后，研究人员利用机器学习（ML）方法，因为它们具有学习能力，且无需明确指导即可提升性能。ML算法是一种有价值的工具，可以简化分类过程、提供预测性见解并辅助做出准确决策[8]。特征提取、特征选择和分类是ML技术的主要流程。纹理处理、轮廓提取、聚类和阈值设定等一系列特征提取技术被用于从人类头骨中区分和检测肿瘤区域，这些提取的特征富含具有辨识力的信息[9]。

相比之下，K最近邻（KNN）[10]、随机森林（RF）[11]和支持向量机（SVM）[12]等ML模型利用从MRI数据或放射组学信号中提取的特征来对肿瘤进行分类。尽管当前ML技术主要依赖于特征提取，但这限制了它们对未知病例的适应能力，并增加了数据丢失的风险[2]。先进的ML技术，如自适应学习类激活映射（AL-CAM）[13]和高斯过程（GP）结合的自适应核优化（AKO）[14]，为脑肿瘤检测带来了显著改进，提高了时空特征提取的效率。尽管这些技术在处理不确定性和小数据集时表现良好，但存在可扩展性问题，导致计算成本较高。最近的研究集中在深度学习（DL）模型上，这是ML的一个分支，可以从训练数据中提取模式信息[15]。DL模型的深层结构比KNN和SVM的浅层结构更具复杂性[16]。预训练的深度学习模型，如残差神经网络（ResNet）、视觉几何组网络（VGGNets）、Google Net和卷积神经网络（CNN）[17][18]，有助于准确诊断脑肿瘤。然而，这些技术在效率和准确性方面仍有提升空间。此外，DL模型在处理MRI数据的位置、大小、形状和强度的巨大差异时面临挑战[19][20]。现有方法在图像分类方面的效率较低，所需时间较长，从而延迟了患者的治疗[21][22]。尽管不断尝试，脑肿瘤的识别和切除仍存在问题，如准确率较低、肿瘤异质性、假阳性以及手术风险[23][24]。

针对这些挑战，本文提出了MTA-HXCN模型以实现有效的脑肿瘤检测。该方法结合了混合学习概念、改进的注意力机制和XAI，增强了模型的鲁棒性。此外，改进的注意力模块在分割和检测方面都显示出了显著效果，有望解决过拟合问题。下面将详细介绍该方法的贡献。

MTA机制通过捕捉强大的多维特征交互，提升了网络学习复杂模式的能力，超越了标准Sigmoid函数的局限性。MTA模块内融合了三种不同的激活函数，形成了更强大的非线性映射，促进了更好的梯度流动，从而实现了有效的脑肿瘤检测训练。

MTAGAN模型利用MTA模块的强大功能，通过通道信息和空间信息之间的跨维度交互，精确区分了肿瘤区域与健康组织，实现了更有效的特征学习，避免了过拟合问题，提高了模型训练的效率。

MTA-HXCN模型显著提高了检测准确性，并具备快速学习能力，同时能够处理不平衡的数据集，因为它结合了改进的注意力机制和混合学习概念。特别是，改进的注意力机制关注低强度差异，抑制了不相关部分，以最小的时间成本提高了训练效率。混合学习概念（分布式学习和增量学习）的结合利用了来自MRI的有用信息，并通过间隔重复帮助记忆过往信息，同时保持了训练效率。此外，XAI的融合提高了模型的透明度，明确了哪些特征影响了模型的输出，便于临床验证。

本文的其余部分安排如下：第2节回顾了现有研究；第3节介绍了脑肿瘤检测的提出方法；第4节进行了对比分析；第5节总结了研究成果及未来的研究方向。

章节摘要

现有研究回顾

本节回顾了若干基于脑肿瘤检测的现有研究工作。Abdullah A. Asiri等人[4]提出了一种独立成分分析-神经网络-SVM（ICA-NN-SVM）方法，通过双计算模块提高了检测速度和准确性。在初始步骤中，系统通过引入对比度增强技术对MRI图像进行了标准化处理，解决了图像质量不均等问题。

提出的改进型三重注意力融合混合学习驱动的可解释卷积神经网络模型用于脑肿瘤检测

本研究的目标是设计MTA-HXCN框架用于脑肿瘤检测。首先，从BraTS2020[37]和BraTS2024[38]数据集中收集输入的MRI图像。然后使用MTAGAN模型对这些图像进行分割处理，以捕获更多特征并生成高质量的分割图像，从而实现精确的肿瘤检测。接下来，对分割后的图像进行感兴趣区域（ROI）提取，以分离特定肿瘤。

结果

本节通过标准指标评估MTA-HXCN模型的检测性能，将其与现有方法进行比较，显示出其在提高诊断精确度和促进医学成像临床决策方面的有效性。

结论

本研究开发了一种基于深度学习的创新方法MTA-HXCN模型，用于脑肿瘤检测。该模型有效解决了过拟合和计算复杂性等现有问题，提供了比现有方法更准确的脑肿瘤检测结果。在性能方面，MTA-HXCN模型结合了混合学习的优势，形成了一个更强大、可扩展且高效的模型。

局限性与未来工作

尽管有诸多优势，所提出的模型仍存在一些局限性，表明仍有改进空间。尤其是，由于其双分支架构，该模型具有较高的计算复杂性，这对实时临床应用构成挑战。因此，研究将采用受自然启发的优化算法来调整模型超参数，提高收敛效率。

CRediT作者贡献声明

德万舒·杜贝（Devanshu Dube）： 负责数据整理。阿肖克·库马尔（Ashok Kumar）： 也负责数据整理。

利益冲突声明

作者声明他们没有已知的可能影响本文工作的财务利益或个人关系。

德万舒·杜贝（Devanshu Dube） 目前在班纳斯塔利文迪亚皮斯担任研究学者。

联系信箱：

粤ICP备09063491号

摘要

引言