《Leukemia》:AI-based hematological malignancy prediction from peripheral blood smears in a large diagnostic laboratory cohort
编辑推荐:
本研究开发了一种基于Transformer的AI模型cAItomorph,旨在解决从外周血涂片中快速、准确诊断多种血液系统恶性肿瘤的临床难题。该模型在包含6000余例患者的真实世界队列中表现出色,可区分8大类血液疾病,尤其对急性白血病具有高敏感度(0.94),并能将潜在不必要的骨髓穿刺检查减少35%,展示了其作为初筛辅助工具的巨大潜力,为优化血液病诊断流程提供了新思路。
血液系统恶性肿瘤种类繁多,传统的诊断“金标准”通常需要结合骨髓穿刺、细胞形态学、免疫分型和分子遗传学等多种检查。然而,骨髓穿刺是一种有创操作,会给患者带来不适和风险。另一方面,外周血涂片检查虽然快速、微创,但传统的人工镜检耗时耗力,且存在观察者间差异,难以对多种疾病进行系统性筛查。那么,能否利用人工智能(AI)技术,仅仅通过分析外周血涂片中白细胞的图像,就对多种血液肿瘤进行准确的初筛和分类,从而减少不必要的骨髓穿刺呢?
为了回答这个问题,来自慕尼黑白血病实验室(Munich Leukemia Laboratory, MLL)等机构的研究人员开展了一项大规模研究,并开发了一个名为cAItomorph的AI模型。这项研究近期发表在血液学顶级期刊《Leukemia》上。研究人员从2021年至2022年间在MLL实验室处理的6610名个体(包括6115名患者和495名健康干细胞捐献者)中,回顾性收集了超过320万张外周血白细胞单细胞图像,涵盖了血液系统恶性肿瘤的完整谱系。他们将168种诊断标签归纳为8个粗分类(包括急性白血病、骨髓增生异常综合征(MDS)、MDS/骨髓增殖性肿瘤(MPN)重叠综合征、MPN、淋巴瘤、浆细胞肿瘤、反应性改变和健康状态),用于模型训练和测试。
研究人员采用了几项关键技术方法构建cAItomorph模型。首先,他们利用一个名为DinoBloom的医学视觉基础模型,从每个白细胞图像中提取出768维的特征向量。接着,通过一个Transformer聚合器,将每位患者约500个细胞的特征信息整合成一个512维的、代表患者整体状况的向量。最后,一个多层感知机(MLP)分类器根据这个整体向量,预测该患者属于8个疾病粗分类中每一个的概率。此外,模型还额外预测血红蛋白值作为辅助任务。研究使用五折交叉验证训练了五个模型,并通过集成学习在独立测试集上评估性能。模型的泛化能力还在两个外部数据集(AML-Hehr和APL-AML)上进行了验证。
研究结果主要体现在以下几个方面:
模型在内部测试集中对不同疾病表现出差异化性能
cAItomorph对急性白血病(敏感度/精确度=0.74/0.79)和MPN(0.85/0.76)表现出较高的识别能力,对MDS的识别能力中等(0.71/0.57)。令人惊讶的是,对于通常无法在外周血中检测到的浆细胞肿瘤,模型也达到了0.77的敏感度。而对于难以通过外周血诊断的淋巴瘤(0.40/0.66)、MDS/MPN(0.50/0.69)和反应性改变(0.45/0.56),模型的敏感度较低,这在预料之中。模型预测的血红蛋白值与实测值显著相关(皮尔逊相关系数0.67)。
模型能有效区分恶性与非恶性样本,有望减少不必要的有创检查
通过将所有恶性类别(急性白血病、MDS、MDS/MPN、MPN、淋巴瘤、浆细胞肿瘤)的预测概率相加,模型可以计算出一个“恶性概率”。当设定恶性阈值为0.5时,模型区分恶性与非恶性样本的曲线下面积(AUC)高达0.97,敏感度为0.94,特异度为0.83。在测试队列中,有13.5%接受骨髓穿刺的患者最终被诊断为反应性改变,这意味着这些有创操作可能是可以避免的。通过调整模型的恶性阈值,可以在检测所有白血病病例和避免不必要的骨髓穿刺之间取得平衡。例如,在阈值为0.5时,可以将不必要的骨髓穿刺率从13.5%降低至8.7%(相对减少35%),同时仍能正确识别测试集中全部46例急性白血病病例。
模型在更详细的疾病亚型中表现良好
在对19个详细疾病类别进行分析时,模型在具有可见异常或高细胞计数的亚型中表现出高敏感度,如急性髓系白血病(AML,0.70)、急性淋巴细胞白血病(ALL)、慢性淋巴细胞白血病(CLL)、原发性血小板增多症(ET)和慢性髓系白血病(CML)。模型对多发性骨髓瘤病例的敏感度也很高。研究发现,cAItomorph的AML预测概率与血液中原始细胞比例呈正相关(斯皮尔曼相关系数0.73),所有被错误分类的AML病例其原始细胞比例均低于20%。对于淋巴瘤,模型在淋巴细胞计数升高时检测更准确,其中大部分为CLL亚型。
模型在外部验证中表现出强大的泛化能力
在两个外部数据集上,cAItomorph均表现稳健。在包含四种遗传学AML亚型的AML-Hehr数据集中,模型仅错误分类了129例AML患者中的8例,对急性白血病的敏感度达0.94,区分恶性与非恶性样本的AUC为0.99。在染色背景不同的APL-AML数据集中,模型检测急性白血病的敏感度为0.76,检测恶性的敏感度达到1.0。
模型具有可解释性,能高亮诊断相关细胞
通过可视化模型对细胞层面的“注意力”,研究人员可以理解模型的决策依据。例如,在分类一例急性白血病患者时,模型成功地将最高注意力分配给原始粒细胞,而对典型的淋巴细胞关注极少。在一例来自外部数据集的急性早幼粒细胞白血病(APL)患者中,模型正确地高亮了早幼粒细胞和原始粒细胞。这些发现表明,cAItomorph能够识别出与临床诊断相关的关键细胞形态。
该研究的结论表明,研究人员成功开发了cAItomorph这一基于Transformer的模型,用于从外周血涂片中对多种血液系统恶性肿瘤进行分类。在诊断实验室队列中,该模型对急性白血病、骨髓增殖性肿瘤和健康对照达到了高精度,并在外部验证队列中表现出稳健的性能。基于测试集表现,该模型可能有助于减少不必要的骨髓穿刺(在测试集中最多可减少35%),同时保持对急性白血病的高敏感度,不过仍需前瞻性验证加以证实。值得注意的是,基于图像的诊断模型性能优于基于血细胞分类计数和人口学变量(年龄和性别)的模型。
研究也指出了重要的局限性,包括回顾性、单中心的研究设计,类别不平衡对罕见疾病检测的影响,以及健康对照组仅限干细胞捐献者。需要前瞻性、多中心验证来评估其真实的临床应用价值。尽管如此,cAItomorph证明了基于AI的外周血筛查作为血液系统恶性肿瘤初始诊断分诊辅助工具的可行性,有望在保持诊断敏感度的同时,减少有创操作带来的负担。这项研究为人工智能辅助的血液病精准、高效诊断开辟了新的道路。