一种改进的RT-DETR算法,结合多尺度特征融合技术,用于自动化检测脑脊液(BALF)中的细胞

《Biomedical Signal Processing and Control》:An improved RT-DETR with multi-scale feature fusion for automated BALF cell detection

【字体: 时间:2026年02月21日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  本研究提出基于改进RT-DETR的自动化BALF细胞检测框架,通过Faster-AFGC模块优化特征提取,GCAttention增强跨区域特征交互,GSF模块融合多层级特征,显著提升检测准确性和效率。实验表明模型mAP达85.7%,召回率79.1%,有效缓解传统手动分析工作量大、一致性差的问题,为临床肺疾病诊断提供可靠工具。

  
姜佩合|李少奇|卢彦芬|宋晓刚
中国烟台大学物理与电子信息学院,烟台264005

摘要

支气管肺泡灌洗液(BALF)中的细胞为临床实践提供了关键的诊断和病理学见解,尤其是在评估各种肺部疾病(如感染、间质性肺病和恶性肿瘤)方面。传统上,BALF细胞分析主要依赖于人工显微镜检查,这种方法劳动强度大、耗时长,并且高度依赖于病理学家的专业知识。这种人工过程引入了变异性,限制了可重复性,并降低了常规临床工作流程的可扩展性。为了解决这些挑战,我们提出了一种基于改进的实时检测变换器(RT-DETR)的自动化目标检测框架,该框架旨在快速准确地检测和分类BALF细胞。该模型专注于识别BALF样本中常见的四种主要细胞类型:巨噬细胞、淋巴细胞、中性粒细胞和嗜酸性粒细胞。广泛的实验评估表明,所提出的方法平均精度(mAP)高达85.7%,召回率为79.1%,表明其在实际临床细胞学应用中的稳健性、准确性和潜力。这种方法可以显著减少工作量,同时提高诊断一致性。

引言

准确识别BALF中的细胞组成对于诊断和管理各种肺部疾病至关重要。例如,在急性呼吸窘迫综合征(ARDS)中,BALF中的主要细胞类型是中性粒细胞,这反映了疾病的炎症性质[1]。在间质性肺病(ILDs)中,BALF中的细胞计数差异是疾病亚型分类的重要参考[2]。中性粒细胞和/或嗜酸性粒细胞的过度存在——通常被称为“肺泡炎”——表明下呼吸道存在炎症[3],而淋巴细胞计数升高则常与肉芽肿性ILDs(如过敏性肺炎和结节病)相关[4]。此外,在嗜酸性粒细胞性哮喘中,外周血和BALF中的嗜酸性粒细胞计数通常都会升高,这会导致气道炎症和高反应性——这是该疾病的关键病理特征[5]。
BALF的解释通常依赖于使用1000倍放大倍率的油浸镜头进行人工显微镜检查,每个样本至少需要计数400个细胞。然而,这一过程劳动强度大、耗时长,并且高度依赖于操作者,难以确保在不同临床环境中的一致性和标准化。病理学家经常需要检查大量切片,这大大增加了他们的工作负担,而且如果由经验不足的人员进行操作,诊断准确性可能会受到影响[6]。
近年来,深度学习在图像分析和目标识别任务中表现出色,尤其是在ImageNet大规模视觉识别挑战赛(ILSVRC)中[7]。受这些进展的启发,许多研究小组探索了深度学习在医学图像解释中的应用。例如,Andre等人使用ILSVRC 2014中的Inception V3 CNN架构对129,450张临床图像进行皮肤癌和黑色素瘤的分类,其性能可与皮肤科专家相媲美[8]。同样,Daniel等人将同一架构应用于光学相干断层扫描(OCT)图像,用于常见可治疗性致盲性视网膜疾病的分类[9]。在后续工作中,AI系统在儿科肺炎诊断中也展示了强大的性能[10]。基于CNN的方法还应用于显微图像分析任务,如细菌性阴道病的细菌形态识别[11]、鼻细胞学解释[12]、粪便寄生虫检测[13]和自动疟原虫分类[14]。
除了通用医学成像之外,深度学习在显微和细胞病理学图像分析中也显示出巨大潜力。最近的研究将卷积神经网络应用于细胞级诊断任务,包括自动识别微生物和寄生虫,以及细胞学标本中的细胞形态分析。在这些方法论进展的基础上,越来越多的研究开始专注于使用深度学习技术进行自动BALF细胞学分析。Shi等人构建了一个临床策划的BALF数据集,并展示了使用现代目标检测框架对多种BALF细胞类型进行实例级检测和分割的可行性[15]。Tao等人提出了一种基于CNN的自动BALF解释流程,其差异细胞分析结果与人工显微镜相当[16]。
后续研究探索了先进的架构和多种成像模式,以应对BALF细胞学分析的固有挑战。例如,van Huizen等人结合深度学习使用了更高谐波生成显微镜来区分BALF样本中的白细胞群体,在无标记成像条件下实现了高精度识别主要细胞类别[17]。Marzahl等人开发了一种基于深度学习的流程,用于量化细胞学切片中的肺含铁血黄细胞,展示了在自动细胞特征描述方面的良好性能,并突出了AI减少肺部细胞学人工工作量的潜力[18]。Wu等人应用了一种自动深度卷积网络来识别和分类临床细胞学图像中的多种BALF细胞类型,证明了基于CNN的检测器在BALF细胞学分析中的可行性[19],而Rumpf等人系统地比较了不同的YOLOv7变体,并确认了它们在高精度BALF细胞分类方面的有效性[20]。
为了克服传统BALF细胞学方法的局限性,我们提出了一种基于改进的RT-DETR网络的增强型BALF细胞检测框架。RT-DETR利用了Transformer架构的优势以及可变形卷积,实现了有效的全局上下文建模和准确的目标检测[21]。通过改进其特征提取模块和注意力机制,我们使网络更有效地适应BALF显微图像的独特特征。在此基础上,我们进一步优化了RT-DETR架构(见图1),以提高其准确检测各种BALF细胞成分的能力。本工作的主要贡献如下:
  • Faster-AFGC模块:我们提出了一种新颖的Faster-AFGC特征生成模块,增强了网络高效建模局部细节和全局上下文的能力,显著提高了特征表示能力,同时减少了计算开销。
  • GCAttention模块:我们引入了GCAttention机制,该机制结合了图神经网络和卷积操作,增强了跨区域特征交互和上下文理解。这有效解决了传统注意力机制在建模区域间依赖性方面的局限性。
  • GSF特征融合模块:我们基于GSConv设计了一个轻量级的GSF模块,有效融合了多个层次结构中的语义和细粒度特征,从而提高了对多种BALF细胞类型的检测准确性。
  • 数据集

    在本研究中,BALF数据集使用了烟台玉黄顶医院临床医生提供的整张切片显微图像构建,样本收集流程如图2所示。所有样本均在常规临床条件下获取,没有进行人工选择或质量筛选。没有应用任何排除标准(如性别、年龄或种族),从而保持了临床BALF标本的自然异质性。BALF采样遵循标准化

    Faster-AFGC

    传统的卷积操作在处理高维、多通道和多尺度输入特征时通常会引入大量的卷积核和参数。这导致了显著的计算冗余和资源消耗,给实时部署场景带来了挑战[23]。为了解决这个问题,我们提出了一个改进的自适应细粒度通道(AFGC)模块[24],作为我们新设计的Faster-AFGC模块的核心。
    如图所示

    实验设置

    我们的实验是在NVIDIA RTX3060 GPU上进行的,代码基于PyTorch实现。模型使用AdamW优化器进行优化,学习率和批量大小分别设置为0.0001和4。训练期间,输入图像大小设置为640 × 640。

    评估指标

    为了评估训练好的支气管肺泡灌洗液细胞识别模型的性能,使用了几个客观评估指标,包括精确度、召回率、平均精度(mAP)和模型

    结论

    我们提出了一种基于改进的RT-DETR架构的支气管肺泡灌洗液细胞自动检测方法。为了解决支气管肺泡灌洗液图像中细胞密度高、边界模糊和背景复杂等挑战,我们从三个关键方面对原始网络结构进行了深度优化:特征提取、注意力建模和多尺度融合。
    通过引入轻量级的Faster-AFGC模块,我们提高了效率和使用能力

    未来工作

    尽管已经取得了显著进展,但在支气管肺泡灌洗液(BALF)细胞检测领域仍有改进的空间和机会。未来的研究方向可能包括以下方面:
  • 多模态数据融合:将各种成像模式(如荧光显微镜和电子显微镜图像)与临床数据(如患者病史、实验室指标)相结合,可以进一步提高检测准确性和可靠性。多模态数据
  • CRediT作者贡献声明

    姜佩合:监督、资金获取、概念化。李少奇:撰写——原始草案、验证、软件、方法论、调查。卢彦芬:监督、资源、资金获取、数据管理。宋晓刚:监督、资源、资金获取、数据管理。

    利益冲突声明

    作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号