颅内出血(ICH)是一种具有深远全球健康影响的医疗紧急情况,占全球中风相关死亡和永久性残疾的很大比例(Neethi, Kannath, Kumar, Mathew, & Rajan, 2024)。在急性中风护理的高压力环境中,非对比度计算机断层扫描(NCCT)是初步分诊的基石(Currie et al., 2016; Goldstein & Gilson, 2011; Raj, Mathew, Kannath, & Rajan, 2023)。至关重要的是,ICH的管理不仅仅是基于检测;患者的预后和手术计划取决于血肿体积的精确量化,这是血肿扩张和30天死亡率的最强预测因子(Hemphill et al., 2015; Hoang et al., 2024; de Liyis et al., 2024)。然而,当前的临床工作流程存在一个关键问题:虽然准确的体积数据对于挽救生命至关重要,但通过金标准的手动勾画来获取这些数据对于负担过重的放射科医生来说耗时过长(Rajapakse et al., 2024)。因此,在时间敏感的紧急情况下,临床医生往往不得不依赖粗略的估计,这可能会影响治疗策略的精确性。
这种操作瓶颈因出血病变的固有形态复杂性而加剧。与刚性解剖器官不同,ICH在形状、大小和位置上表现出极度的异质性(从硬膜外到脑实质内亚型不等)。此外,在非对比度CT扫描中,由于部分体积效应和重叠的强度轮廓,病变与健康脑组织之间的边界往往模糊。这些因素使得手动分割不仅劳动密集,而且观察者之间的变异性很高。随着医疗系统越来越要求快速和标准化的诊断,依赖手动或半手动工作流程已经变得不可行。因此,迫切需要智能的计算机辅助诊断系统,能够自主提供专家级别的分割,以解决诊断精确性和紧急时间限制之间的冲突(Yeasmin, Al Amin, Joti, Aung, & Azim, 2024)。
尽管传统的分割方法在医学成像中表现出一定的性能(Chen et al., 2021; Ronneberger, Fischer, & Brox, 2015; Zhou, Rahman Siddiquee, Tajbakhsh, & Liang, 2018),但它们仍无法满足临床应用所需的高精度和可靠性,尤其是在处理像颅内出血这样的危及生命的状况时,这些状况需要快速和准确的勾画。随着计算机视觉技术的快速发展,许多成熟的计算机辅助诊断技术已成功应用于其他医学图像分割任务,实现了快速和准确的诊断(Deng et al., 2024; Hartmann Toli?, Habijan, Gali?, & Nyarko, 2024; Yagmur, Dag, & Temurtas, 2024)。然而,这些技术在ICH分割中遇到了严重挑战,因为出血的表现高度异质且不可预测——在位置(例如脑实质内、硬膜下、硬膜外)、形态、大小和密度方面差异很大(Li et al., 2020; Rettenberger, Schilling, Elser, B?hland, & Reischl, 2023)。在非对比度CT扫描中,出血区域与周围脑组织之间的强度相似性,以及成像伪影和模糊的病变边界,进一步增加了准确勾画的难度。结果,现有方法往往难以在不同ICH病例之间进行泛化,限制了它们的临床实用性。
最近,基于提示的分割方法作为一种有前途的方法出现(Kirillov et al., 2023; Li, Hu, & Yang, 2024; Rahman, Munir, Jha, Bagci, & Marculescu, 2024)。通过结合临床医生提供的手动提示,这些模型可以有效地关注提示中指出的出血区域,从而实现更准确的分割结果。在涉及自然图像的各种计算机视觉任务中,使用手动提示来提高模型性能是一种合理的方法。最近出现的基础模型,特别是Segment Anything Model(SAM),在计算机视觉领域引入了一种范式转变。然而,将其直接转移到医学领域存在一个根本性的悖论。在自然场景中,手动提示是一种合理的交互方式;然而,在急性医疗环境(如ICH诊断)中,要求临床医生手动标注病变违背了自动化的目的,并增加了认知负担。
为了解决这个问题,最近的改进尝试通过使用对象检测器来“自动化”SAM,以生成边界框提示(Li et al., 2025; Lin, Xiang, Yu, & Yan, 2024; Liu et al., 2024)。然而,如图1所示,仍然存在一个关键的方法论差距:这种“先检测后分割”的范式从根本上不适合ICH。与形状规则的器官不同(Biswas, 2023; Zhang, Liu, Lin, Liao, & Li, 2024a),出血病变的特点是非凸的、不规则的边界和高形态异质性。边界框提示不可避免地包含了过多的背景噪声(正常脑组织),引入了语义歧义,使分割模型感到困惑。此外,还存在一个重大的领域差距:SAM的编码器在自然图像上预训练,通常难以在没有针对性特征增强的情况下区分CT扫描中出血的低对比度边界。因此,迫切需要一个统一的框架,能够自主生成精确的、形状感知的提示,并弥合这一领域差距,这也是本研究具体旨在解决的问题。
为了弥合这些已识别的差距,本研究旨在开发ICH-ASNet,这是一个完全自动化的框架,专门针对颅内出血的形态复杂性进行定制。我们的主要目标是通过引入一种新颖的预训练驱动的自动点生成机制来超越刚性边界框提示的局限性,该机制为不规则病变提供精确的、形状自适应的引导。此外,为了解决非对比度CT成像中的固有领域差异,我们提出了一个多模态特征引导的局部增强模块。通过有效地将语义先验注入视觉编码器,这项工作旨在提高低对比度条件下的边界区分能力,为将基础模型适应急性医学诊断建立一个新的稳健基线。
实验在两个公共数据集上进行,为了进一步验证我们方法的实际适用性,我们构建了一个包含42例颅内出血的独立数据集进行外部验证。结果表明,我们的方法始终优于传统的分割方法和现有的基于自动提示的分割方法,并且与一些依赖手动提示的分割方法相比表现更佳。我们的主要贡献总结如下:
1) 一种新的通用语义注入范式:我们在多模态编码器中使用固定的语义锚点来生成特定于实例的提示嵌入,解决了“注释成本与精度”之间的困境。
2) 协同的双分支提示:我们分离了引导:点分支解决定位不确定性,而文本分支解决边界歧义。
3)多模态引导的局部特征增强(LFE):该模块主动将语义先验注入视觉编码器,创建了一种“语义注意力”效应,显著改善了边界区分能力。