用于分布偏移乳腺肿瘤图像分类的图解绝热扩散神经网络

《Neural Networks》:Graph Adiabatic Diffusion Neural Networks for Distribution-shift Breast Tumor Image Classification

【字体: 时间:2026年02月09日 来源:Neural Networks 6.3

编辑推荐:

  乳腺超声图像分类中,低类内相似性和分布偏移问题导致传统方法性能受限。本文提出GradiNet框架,通过联合学习判别性图结构和分布偏移模拟环境,创新性地将傅里叶热扩散方程与绝热边界条件引入图神经网络,实现自适应分布偏移模拟和特征传播优化。理论证明无穷迭代后特征收敛于目标空间解,实验表明该方法在公共和私有数据集上均达到SOTA性能。

  
郝全路|志辉赖|恒港
机构:深圳大学计算机科学与软件工程学院,地址:南山,城市:深圳,邮编:518060,省份:广东,国家:中国

摘要

乳腺肿瘤图像在同类样本间的相似度较低,并且存在分布偏移问题,这给识别任务带来了挑战。虽然增加标记训练数据的数量是提高性能的常见策略,但专家标注的高成本是另一个难题。半监督学习方法(例如图神经网络GNN)通过图拓扑结构来平滑特征,有潜力降低乳腺肿瘤数据集的标注成本,同时实现令人满意的分类性能。为了解决这些问题,我们提出了图绝热扩散神经网络(GradiNet),该方法同时学习具有区分性的图结构和模拟分布偏移环境。具体来说,我们通过图学习目标函数对区分性图结构进行建模,并从理论和实证上证明了其有效性。此外,我们首次设计了基于傅里叶热扩散方程和绝热边界条件的GNN特征传播机制。因此,该机制使模型能够适应性地模拟分布偏移,并提高其在分布内(ID)和分布外(OOD)数据上的泛化能力。在公开和私有的乳腺肿瘤超声图像数据集上的广泛实验表明,我们的方法具有优越性和有效性,在多个评估指标上达到了最佳性能。

引言

近年来,在使用深度学习对乳腺肿瘤图像进行分类方面取得了显著进展。例如,Kabir等人提出了一种结合图像处理技术和视觉变换器(ViT)模型的新方法来提高乳腺肿瘤分类性能(Mahmud Kabir和Imamul Hassan Bhuiyan,2025年)。此外,Cho等人提出了MMF-U-Net,用于在获取病变分割后对良性和恶性肿瘤进行分类(Cho等人,2025年)。这些方法在乳腺肿瘤图像分类任务中表现出了令人满意的效果。这一成功反映了医学界正在利用深度学习来降低医疗服务的成本(Diaz Ochoa和Mustafa,2022年)。
然而,仍存在一些挑战,这些挑战可能通过半监督方法来解决。正如Singh等人(2016年)所指出的,监督方法高度依赖于训练数据的质量。然而,数据收集成本很高。实际上,从不同医院聚合数据需要领域适应(Cai, Huang, Zhang, Zheng, Yue, 2025; Cai, Liu, Huang, Hu, Wu, Jing, Shao, 2026)。此外,许多现有方法依赖于大量标记数据,但标注医学图像既耗时又昂贵。因此,人们开始探索半监督学习方法用于乳腺肿瘤超声图像分类任务。
半监督学习旨在利用少量的标记数据和大量的未标记数据共同训练模型,从而在下游任务中实现满意的性能。作为强大的半监督方法,图神经网络(GNN)近年来得到了持续发展。鉴于数据的图结构,GNN可以平滑相似数据样本之间的特征表示(例如Kipf和Welling,2017年;Veli?kovi?等人,2018年)。GNN作为半监督方法的有效性在于它们能够通过特征传播促进同类数据的聚合。
由于GNN的特征传播机制鼓励同类数据聚集在一起,因此GNN被应用于医学图像分类。例如,Sun等人提出了一种基于GNN的疾病预测模型,该模型利用外部知识补充稀疏的电子病历数据(Sun等人,2021年)。Wang等人提出了一种新的疾病指导模型,整合了专家系统、GNN和知识图(Wang等人,2023年)。在D‘Souza等人(2024年)的研究中,提出了一种使用复合图机制进行医学信息融合的新GNN。这些工作表明,特征传播和融合对医学预测非常有用,从而推动了GNN在医学图像分类中的应用。
尽管有这些优势,但由于数据可区分性不足和数据分布偏移等问题,直接将GNN应用于乳腺肿瘤超声图像分类仍然困难。数据可区分性不足指的是乳腺肿瘤的形态变化和模糊外观(Jiang等人,2025年;Zheng等人,2025年)。这导致同类样本间的相似度很高,尤其是来自不同患者的同一等级图像之间。在从特征构建图结构时,可能会得到无法有效捕捉区分性信息的图。此外,数据分布偏移源于数据采集过程的差异,包括医院和超声扫描仪的差异。由于标记数据有限,测试样本的分布可能与训练集中的分布不同,从而导致分类性能不佳。
关于医学图像分类中分布外挑战的研究很多(Di Teodoro等人,2025年;Li等人,2025年),GNN作为一种有前景的方法应运而生。然而,GNN无法正确识别数据的不同分布环境可能会导致特征传播过程中的信息扰动(Wu等人,2023年;Zhang和Chen,2025a)。此外,这种混淆可能导致学习到次优的图结构,从而影响分类准确性。为了解决GNN在乳腺肿瘤分类任务中的问题,我们提出了图绝热扩散神经网络(GradiNet),该方法同时学习具有区分性的图结构和模拟分布环境,如图1所示。主要贡献如下:
  • 提出了一种针对具有低区分性特征的乳腺肿瘤超声图像的新颖区分性图结构建模策略。构建了一个拉格朗日函数来解决图结构问题,从而得到了图的显式更新公式。此外,从理论上证明了在无限特征传播后,特征表示会收敛到目标函数的零空间解。
  • 首次提出了一种新的数据分布偏移模拟方法,该方法利用了基于傅里叶热扩散方程和绝热边界条件的图神经网络。
  • 我们在公开和私有的乳腺肿瘤超声图像数据集上证明了我们的区分性图结构和分布偏移模拟策略的有效性。因此,GradiNet在分布内和分布外数据上的性能均达到了最佳水平,多个评估指标均表现优异。
  • 本文的其余部分组织如下。第2.1节介绍了我们工作中使用的关键符号和定义。第2.2节回顾了相关工作。第3.1节讨论了我们方法的动机,强调了乳腺肿瘤图像分类的挑战。第3节详细介绍了提出的GradiNet框架。第4节展示了在公开和私有乳腺肿瘤超声图像数据集上的全面实验。第5节总结了本文。第6节包含了致谢。附录B提供了偏微分方程解的详细推导。

    节选内容

    初步介绍

    为了帮助读者清楚地理解我们提出的方法,提供了初步信息。符号和定义在第2.1节中概述,相关工作在第2.2节中介绍。

    GradiNet:图绝热扩散神经网络

    接下来,我们将介绍GradiNet的分析和提出过程。第3.1节提供了该方法的动机。第3.2节提出了用于建模区分性图结构的目标函数。第3.3节在成功构建图拓扑结构的基础上,通过将绝热边界条件引入傅里叶热扩散方程中,提出了GradiNet。

    实验

    在本节中,我们进行了实验,以证明所提出方法在区分性图结构建模和真实世界乳腺肿瘤超声数据集上的分布偏移泛化能力方面的有效性。

    结论

    在本文中,我们提出了图绝热扩散神经网络(GradiNet),这是一种新的图神经网络框架,用于解决半监督乳腺肿瘤超声图像分类中数据可区分性不足和分布偏移的问题。该方法通过新颖的特征传播机制同时学习具有区分性的图结构和模拟分布偏移。在公开和私有乳腺肿瘤超声图像数据集上的广泛实验表明...

    CRediT作者贡献声明

    郝全路:撰写——原始草稿,可视化,方法论。志辉赖:监督,项目管理,资金获取。恒港:资源,正式分析。

    利益冲突声明

    作者郝全路和志辉赖来自深圳大学计算机科学与软件工程学院。作者恒港来自深圳市宝安中心医院的乳腺和甲状腺外科。

    致谢

    本研究部分得到了中国自然科学基金(项目编号62476175和62272319)和广东省自然科学基金(项目编号2023A1515010677、2024A1515011637、2023B1212060076)以及深圳市科技计划项目(项目编号JCYJ20220818095803007和JCYJ20240813142206009)的支持。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号