一种用于骨髓细胞分类的新型特征重建方法

《Engineering Applications of Artificial Intelligence》:A novel feature reconstruction method for bone marrow cell classification

【字体: 时间:2026年01月23日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  骨髓细胞图像分类中冗余特征导致模型性能下降,提出RR-Block模块通过保留高频特征并过滤低频信息解决该问题,可无缝集成至ResNet等CNN架构。实验在PBC(8类)和Matek(21类)数据集上分别达到98.54%和91.69%准确率,Cohen's Kappa系数达99.37%和89.14%,优于现有方法。

  
志慧翔 | 建慕伟 | 陈洪宇 | 徐文静 | 倪长群 | 罗汉江 | 李晓光
山东财经大学计算与人工智能学院,中国济南

摘要

骨髓细胞(BMCs)在人类健康中起着至关重要的作用,特别是在造血和免疫功能方面。评估骨髓细胞的健康状况对于早期发现和治疗造血系统疾病至关重要。然而,传统的形态学分析在很大程度上依赖于操作者的经验和专业知识。同时,卷积神经网络(CNNs)由于骨髓细胞图像中存在冗余信息而经常出现性能下降的问题。为了解决这个问题,我们提出了一种新的模块——减少冗余块(RR-Block),该模块在保留高频信息的同时过滤掉不太重要的特征,从而增强了特征提取能力。此外,RR-Block是一个即插即用的模块,可以无缝集成到现有的CNN架构中。实验结果表明,用RR-Block替换残差网络(ResNet)中的标准3×3卷积层可以显著提高分类性能。具体来说,在包含八种细胞类型的周围血细胞(PBC)数据集上,我们的方法达到了98.54%的准确率和99.37的Kappa系数;在包含21种细胞类别的慕尼黑白血病实验室数据集上,我们的模型达到了91.69%的准确率和89.14的Kappa系数。这些结果突显了我们模型架构的有效性,其性能超过了多种现有的先进方法。

引言

成人的骨髓是人体中最大的组织之一。它依靠其强大的造血能力不断生成细胞成分、血小板以及白细胞和红细胞等细胞。这一过程确保了造血系统的正常运作,满足了身体对氧气供应、血液凝固和免疫反应的需求。因此,骨髓细胞的健康状况直接关系到身体的整体健康。随着医学技术的不断进步,骨髓细胞和周围血细胞的形态学检查已被广泛用于临床实践和治疗中,以诊断造血系统疾病。在临床实践中,细胞形态学检查通常由熟练的医生进行。他们观察单个细胞的图像,分析其轮廓、形态和其他特征,然后进行进一步的分类。这些分类的准确性在很大程度上依赖于医生的专业知识。不幸的是,全球范围内专业医生资源稀缺,难以满足大量患有造血系统疾病患者的需求。同时,仅仅依赖医生的手动检查既繁琐又费时,从长远来看会影响医生检查的准确性。因此,开发一个准确高效的自动化骨髓细胞分选系统至关重要。
自21世纪以来,人工智能的快速发展对社会各个领域产生了重大影响。卷积神经网络(CNN)已成为计算机视觉领域的主导技术,在图像识别方面取得了显著的成功。这一成功归功于它们出色的特征提取能力和对图像结构的有效捕捉。其优异的性能也使研究人员能够将其应用于医学成像领域。例如,Lin等人(Lin和Chen,2024年)提出了一个多尺度多模块的交叉注意力U-Net网络,通过两种机制实现了准确的脑肿瘤分割;Jian等人(2023年)提出了一个三级关联网络模型(Triple-DRNet),通过三个独立的子网络实现了糖尿病视网膜病变的自动分类,有效提高了分类效果,并解决了某些病变类别区分的挑战。
在骨髓细胞分类任务中,Lee等人(2022年)设计并评估了一种算法,利用深度学习技术自动区分骨髓穿刺涂片中的造血细胞系列并检测异常细胞,在分类发育不良细胞方面取得了更好的结果;Ngasa等人(2024年)结合了基于扩散的Wasserstein生成对抗网络(WGAN-GP)和支持向量机(SVM)来对白细胞进行分类。
上述研究在骨髓细胞分类任务中取得了令人印象深刻的结果,但它们没有考虑到细胞图像的复杂性,因此仍存在一定的局限性。根据我们对骨髓细胞图像的观察,我们认为骨髓细胞图像包含大量冗余特征,这些特征的存在严重限制了分类模型的性能。然而,现有的分类系统即使包含了注意力机制等技术,也未能充分关注这一方面。目前减少冗余特征的方法只是简单地丢弃设计者认为无用的通道,这显得过于随意。我们认为冗余特征中不仅包含对分类任务无用的低频成分,还包含有价值的高频信息。这些被忽略的通道中可能仍存在有限量的有用信息,这些信息有可能提升模型的分类性能。因此,本文介绍了一种新的方法论,旨在解决上述问题并实现骨髓细胞的精确分类。具体来说,我们设计了一种新颖且高效的特征提取模块(RR-Block),该模块能够在丢弃的通道中仅保留高频信息,减少冗余的同时不丢失关键信息,从而提高分类结果。
本文的主要贡献总结如下:
  • 1.
    提出了一种骨髓细胞分类模块RR-Block。它利用特征图中的高频信息来指导从特征不足的特征图中提取高频细节,从而减少冗余。
  • 2.
    RR-Block具有即插即用的特性,可以集成到CNN网络中,以提高骨髓细胞分类的性能。
  • 3.
    在PBC和Matek数据集上进行的实验表明,我们的分类模型取得了令人满意的结果。
  • 本文的结构如下:第2节提供文献综述,第3节介绍方法论的详细内容,第4节展示实验结果,第5节对本文进行总结。

    章节摘录

    冗余问题解决

    由于卷积神经网络(CNN)能够获取有用的特征,它在自然语言处理、计算机视觉和计算声学等不同领域获得了广泛应用。然而,随着网络架构的深入和复杂性的增加,通道冗余、参数冗余和内存冗余等问题也随之出现,给资源受限环境下的模型部署带来了困难。

    方法论

    为了在特征提取过程中减少大量冗余信息的同时确保保留具有区分性的特征,我们设计了一种新的模块RR-Block。这个即插即用的模块包含三个部分:重建、提取和融合。本节将演示这一过程,模型结构图和流程图分别如图2和图3所示。

    实验结果

    本节首先介绍实验中使用的数据集、评估指标和参数设置。然后进行对比实验以展示该模块的有效性。随后展示了消融实验的结果。

    结论

    我们在本文中提出了一种名为RR-Block的模块,该模块具有即插即用的功能,旨在减少冗余。我们将该模块应用于骨髓细胞的分类中。RR-Block模块通过从特征图中重新提取高频数据并消除低频信息来提高分类准确性。我们在PBC和Matek数据集上进行的实验表明,所提出的模型在准确率(ACC)方面优于其他常用模型。

    讨论

    尽管本研究验证了所提出方法的有效性,但仍存在一些挑战。以下是我们计划在未来工作中解决这些挑战的努力方向:
  • (1)
    数据稀缺问题的解决方案:未来的工作将专注于扩展稀有细胞数据集并提高图像质量,同时探索数据增强和新的加权损失函数来缓解数据稀缺问题。
  • (2)
    模型性能提升:后续工作将致力于进一步优化模型性能
  • CRediT作者贡献声明

    志慧翔:撰写——初稿。建慕伟:撰写——审阅与编辑。陈洪宇:数据整理。徐文静:撰写——审阅与编辑。倪长群:撰写——审阅与编辑。罗汉江:撰写——审阅与编辑。李晓光:撰写——审阅与编辑。

    利益冲突声明

    作者声明他们没有已知的财务利益或个人关系可能影响本文的研究工作。

    致谢

    本项工作得到了山东省泰山学者计划(tstp20250536)的支持。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号