近年来,在使用深度学习对乳腺肿瘤图像进行分类方面取得了显著进展。例如,Kabir等人提出了一种结合图像处理技术和视觉变换器(ViT)模型的新方法来提高乳腺肿瘤分类性能(Mahmud Kabir和Imamul Hassan Bhuiyan,2025年)。此外,Cho等人提出了MMF-U-Net,用于在获取病变分割后对良性和恶性肿瘤进行分类(Cho等人,2025年)。这些方法在乳腺肿瘤图像分类任务中表现出了令人满意的效果。这一成功反映了医学界正在利用深度学习来降低医疗服务的成本(Diaz Ochoa和Mustafa,2022年)。
然而,仍存在一些挑战,这些挑战可能通过半监督方法来解决。正如Singh等人(2016年)所指出的,监督方法高度依赖于训练数据的质量。然而,数据收集成本很高。实际上,从不同医院聚合数据需要领域适应(Cai, Huang, Zhang, Zheng, Yue, 2025; Cai, Liu, Huang, Hu, Wu, Jing, Shao, 2026)。此外,许多现有方法依赖于大量标记数据,但标注医学图像既耗时又昂贵。因此,人们开始探索半监督学习方法用于乳腺肿瘤超声图像分类任务。
半监督学习旨在利用少量的标记数据和大量的未标记数据共同训练模型,从而在下游任务中实现满意的性能。作为强大的半监督方法,图神经网络(GNN)近年来得到了持续发展。鉴于数据的图结构,GNN可以平滑相似数据样本之间的特征表示(例如Kipf和Welling,2017年;Veli?kovi?等人,2018年)。GNN作为半监督方法的有效性在于它们能够通过特征传播促进同类数据的聚合。
由于GNN的特征传播机制鼓励同类数据聚集在一起,因此GNN被应用于医学图像分类。例如,Sun等人提出了一种基于GNN的疾病预测模型,该模型利用外部知识补充稀疏的电子病历数据(Sun等人,2021年)。Wang等人提出了一种新的疾病指导模型,整合了专家系统、GNN和知识图(Wang等人,2023年)。在D‘Souza等人(2024年)的研究中,提出了一种使用复合图机制进行医学信息融合的新GNN。这些工作表明,特征传播和融合对医学预测非常有用,从而推动了GNN在医学图像分类中的应用。
尽管有这些优势,但由于数据可区分性不足和数据分布偏移等问题,直接将GNN应用于乳腺肿瘤超声图像分类仍然困难。数据可区分性不足指的是乳腺肿瘤的形态变化和模糊外观(Jiang等人,2025年;Zheng等人,2025年)。这导致同类样本间的相似度很高,尤其是来自不同患者的同一等级图像之间。在从特征构建图结构时,可能会得到无法有效捕捉区分性信息的图。此外,数据分布偏移源于数据采集过程的差异,包括医院和超声扫描仪的差异。由于标记数据有限,测试样本的分布可能与训练集中的分布不同,从而导致分类性能不佳。
关于医学图像分类中分布外挑战的研究很多(Di Teodoro等人,2025年;Li等人,2025年),GNN作为一种有前景的方法应运而生。然而,GNN无法正确识别数据的不同分布环境可能会导致特征传播过程中的信息扰动(Wu等人,2023年;Zhang和Chen,2025a)。此外,这种混淆可能导致学习到次优的图结构,从而影响分类准确性。为了解决GNN在乳腺肿瘤分类任务中的问题,我们提出了图绝热扩散神经网络(GradiNet),该方法同时学习具有区分性的图结构和模拟分布环境,如图1所示。主要贡献如下:
•提出了一种针对具有低区分性特征的乳腺肿瘤超声图像的新颖区分性图结构建模策略。构建了一个拉格朗日函数来解决图结构问题,从而得到了图的显式更新公式。此外,从理论上证明了在无限特征传播后,特征表示会收敛到目标函数的零空间解。
•首次提出了一种新的数据分布偏移模拟方法,该方法利用了基于傅里叶热扩散方程和绝热边界条件的图神经网络。
•我们在公开和私有的乳腺肿瘤超声图像数据集上证明了我们的区分性图结构和分布偏移模拟策略的有效性。因此,GradiNet在分布内和分布外数据上的性能均达到了最佳水平,多个评估指标均表现优异。
本文的其余部分组织如下。第2.1节介绍了我们工作中使用的关键符号和定义。第2.2节回顾了相关工作。第3.1节讨论了我们方法的动机,强调了乳腺肿瘤图像分类的挑战。第3节详细介绍了提出的GradiNet框架。第4节展示了在公开和私有乳腺肿瘤超声图像数据集上的全面实验。第5节总结了本文。第6节包含了致谢。附录B提供了偏微分方程解的详细推导。