《Frontiers in Oncology》:Predicting modelling for early diagnosis in early myeloproliferative neoplasms, not otherwise specified. Evidence from a machine learning study
编辑推荐:
本综述系统阐述了人工智能(AI)技术在骨髓增殖性肿瘤(MPN)早期诊断中的应用价值。研究通过自动提取骨髓活检(BMB)全切片图像(WSI)中的细胞形态学特征(如巨核细胞面积、周长、圆形度)和细胞密度参数,构建支持向量机(SVM)分类模型,实现对原发性骨髓纤维化前期(pre-PMF)、真性红细胞增多症(PV)和原发性血小板增多症(ET)的亚型区分(平均AUC=0.70)。特别针对13例非特指型MPN(MPN-NOS)患者的验证显示,模型预测与病理学家初诊一致性达61.5%,为临床疑难病例的精准分型提供了自动化决策支持工具。
背景
骨髓增殖性肿瘤(MPN)是一组克隆性造血干细胞疾病,其特征为髓系细胞一系或多系过度增殖,具有向骨髓纤维化或急性髓系白血病进展的风险。根据世界卫生组织(WHO)第5版分类,最常见的费城染色体(Ph)阴性MPN包括真性红细胞增多症(PV)、原发性血小板增多症(ET)和原发性骨髓纤维化(PMF)。其中,约5%的MPN病例因临床病理特征不典型而归类为非特指型骨髓增殖性肿瘤(MPN-NOS),这类患者常处于疾病早期或表现重叠特征,给准确诊断和治疗决策带来巨大挑战。近年来,人工智能(AI)技术在血液病诊断和预后预测中展现出重要价值。骨髓活检(BMB)的全切片成像(WSI)能够提供细胞和组织的高分辨率视图,但其解读高度依赖专家经验且存在观察者间差异。因此,开发自动化分析工具对提高MPN诊断的效率和一致性具有重要意义。
材料与方法
研究纳入2011年至2023年间确诊的101例MPN患者的回顾性H&E染色BMB样本,包括19例原发性骨髓纤维化前期(pre-PMF)、30例PV、39例ET和13例MPN-NOS。所有切片经两位资深病理学家复核,确保诊断一致性(依据WHO第5版标准,结合分子检测JAK2、CALR、MPL突变)。切片通过40倍放大全自动扫描仪(Aperio AT2, Leica Biosystems)数字化。研究构建了一个全自动AI分析流程:首先由病理学家共同选取三个具有诊断代表性的感兴趣区域(ROI),避免组织褶皱、红细胞聚集等干扰区域;随后自动计算细胞密度和细胞结构参数。关键形态学特征聚焦于巨核细胞核形态(面积、周长、圆形度),并为每位患者提取均值、标准差、偏度、峰度和熵等统计量。同时,通过改进的算法自动量化骨髓细胞结构(定义为有核细胞面积与有核细胞+无核细胞总面积之比)。最终获得17个特征组合(核形态统计量、细胞密度统计量及细胞结构)。采用Kruskal-Wallis检验筛选与MPN亚型显著相关的特征(p<0.05),使用线性核支持向量机(SVM)进行三分类(PV、ET、pre-PMF)建模,并通过5折交叉验证重复5次评估性能。模型最终在13例MPN-NOS患者中测试,将其预测结果与病理学家活检时分类和临床随访评估进行对比。
结果
特征分析显示,6个特征与MPN亚型显著相关:核周长均值(p=0.0423)和偏度(p=0.0104)、核圆形度偏度(p=0.0474)、细胞密度均值(p=0.0329)和偏度(p=0.0384),以及自动细胞结构值(p=0.0000772)。这些特征在pre-PMF与ET、PV与ET间均存在显著差异(p=0.0008)。自动细胞结构测量与病理学家评估无显著分布差异(K-S检验p=0.39),绝对误差主要集中在0-0.2区间。分类模型在88例明确诊断患者中达到平均多类曲线下面积(AUC)0.70±0.01,准确率0.60±0.03。各类别AUC分别为:pre-PMF 0.50±0.04(病例数较少导致置信区间较宽)、PV 0.80±0.03、ET 0.73±0.06。微F1分数和微G均值分别为0.50和0.60。对13例MPN-NOS患者的验证显示,模型预测与病理学家活检时分类一致率为61.5%(8/13),与临床随访诊断一致率为50%(4/8)。例如,患者BMB93(模型预测ET)和BMB103(模型预测PV)在随访中分别被证实为ET和PV;而部分病例(如BMB114,模型预测ET,但病理提示pre-PMF/ET重叠特征)出现分歧,凸显了早期/不典型病例的诊断复杂性。
讨论
本研究证实了基于WSI的形态学定量分析在MPN亚型区分中的可行性。巨核细胞核形态参数(特别是周长和圆形度的分布特征)和细胞结构是区分PV、ET和pre-PMF的关键指标。模型在MPN-NOS患者中表现出的中等一致性说明其具备捕捉早期病变特征的潜力,但同时也反映了该类疾病的异质性和演化特性。部分预测与随访结果的差异可能源于疾病自然进程中的表型演变(如BMB15从模型预测ET发展为临床PV),或合并症(如BMB2伴发乳腺癌和肺癌)对临床表现的干扰。与近期应用深度学习(如卷积神经网络)直接分析WSI的研究相比,本研究采用的手工特征提取方法虽在数据量需求上更友好且结果更易解释,但在复杂模式识别上可能存在局限。未来工作将通过多中心合作扩大样本量,纳入更多形态学标记(如Gomori染色评估纤维化程度),并探索与深度学习模型的融合,以提升对不典型病例的鉴别能力。此外,自动化ROI选择算法的开发将有助于减少对人工标注的依赖,提高流程的标准化程度。
结论
骨髓活检的形态学评估是MPN诊断体系的核心环节。本研究构建的AI辅助诊断模型能够客观量化关键病理特征,为PV、ET和pre-PMF的亚型分类提供有效支持。尤其对于诊断存疑的MPN-NOS病例,该工具有望成为病理学家和临床医生的决策辅助,助力更早期的疾病分型和个体化管理策略制定。