《Virchows Archiv》:A multimodal explainable ai framework to assist in the differential diagnosis of head and neck reactive follicular hyperplasia and follicular lymphoma: an international multicentre study
编辑推荐:
头颈部组织中原发性结外滤泡性淋巴瘤(Follicular Lymphoma, FL)罕见,且与反应性滤泡增生(Reactive Follicular Hyperplasia, RFH)形态学重叠,构成诊断挑战。研究人员开发并评估了一种可解释的多模态人工智能框架
头颈部组织中原发性结外滤泡性淋巴瘤(Follicular Lymphoma, FL)罕见,且与反应性滤泡增生(Reactive Follicular Hyperplasia, RFH)形态学重叠,构成诊断挑战。研究人员开发并评估了一种可解释的多模态人工智能框架以辅助此鉴别诊断。这项国际多中心研究汇集了来自四大洲10个中心的108例病例(54例RFH,54例FL),代表了规模最大的头颈部滤泡性病变队列之一。该多模态框架整合了卷积神经网络(Convolutional Neural Networks, CNNs:AlexNet, VGG16, ResNet18)、视觉Transformer(Vision Transformer:CellViT++)、图神经网络(Graph Neural Network:用于空间分析的Cell-GNN)以及结合形态计量学特征的梯度提升决策树(Gradient-Boosted Decision Trees:XGBoost)。通过梯度加权类激活映射(Gradient-weighted Class Activation Mapping, Grad-CAM)可视化和沙普利加性解释(SHapley Additive exPlanations, SHAP)分析实现可解释性。性能最佳的模型(CellViT++)在内部测试集上达到了95.7%的准确率。外部验证分别展示了80.5%(ResNet18, 队列1)和69.0%(VGG16-Seg, 队列2)的准确率,其性能差异反映了跨中心泛化的挑战。可解释性分析揭示,该多模态框架整合了形态计量学特征(核面积、偏心率)与流行病学背景(患者年龄,与已知的FL人口统计学特征一致)。Cell-GNN空间分析识别出FL中显著的架构重组,通过Hedges' g = -6.65量化,代表了正常滤泡极性的丧失。该研究证明了多模态可解释AI框架在辅助诊断罕见的头颈部滤泡性病变方面的可行性。形态学、空间和结构临床特征的整合为未来的协作验证研究及专科病理环境中的潜在诊断支持奠定了基础。
这篇发表于《Virchows Archiv》的论文针对头颈部反应性滤泡增生(RFH)与滤泡性淋巴瘤(FL)鉴别诊断这一病理学难题,构建并验证了一套多模态可解释人工智能(AI)框架。由于原发性头颈部FL极为罕见(占头颈淋巴瘤不到1%),且与RFH在组织学上存在显著重叠,特别是在小活检标本中,常规形态学检查常面临挑战,导致观察者间差异较大。为此,研究人员开展了一项覆盖全球四大洲10个医疗中心的国际多中心研究,收集了108例确诊病例(RFH与FL各54例),构建了迄今为止该领域最大规模的地理多样性队列。
研究采用了多种前沿技术方法。首先,利用注意力引导的U-Net++进行核分割,结合Cell Graph Neural Network(Cell-GNN)建模细胞间空间关系。其次,整合了卷积神经网络(CNNs:AlexNet, VGG16, ResNet18)和视觉Transformer(CellViT++)提取图像特征,并通过多层感知机(MLP)与临床病理数据(如年龄、部位)进行多模态融合。此外,研究利用梯度加权类激活映射(Grad-CAM)和沙普利加性解释(SHAP)分析确保模型的可解释性,并在两名经验丰富的病理学家独立评估的基础上进行了人机基准测试。
研究结果显示,在多中心队列与计算流程方面,RFH患者平均年龄显著低于FL患者(33.29岁 vs 65.61岁,p < 0.0001),且病变部位分布存在显著差异(RFH多见于颊黏膜,FL多见于唾液腺和口底)。核形态测量学分析表明,FL细胞核相比RFH表现出更大的核面积和周长,以及显著增加的偏心率(p < 0.0001),这与恶性肿瘤核异型性相符。传统的机器学习分析(XGBoost)整合临床病理和核形态特征,在测试集上获得了0.904的曲线下面积(AUC)。
在深度学习分类性能方面,基于patch级别的分析显示,ResNet18在内部数据集表现最佳(准确率0.920,AUC 0.954),但在外部验证中存在域偏移现象。CellViT++作为视觉Transformer架构,展现了卓越的性能,其内部patch级别准确率达到95.7%,患者级别准确率为93.5%,AUC达0.97。通过Grad-CAM引导的形态学分析进一步证实了模型关注区域的生物学合理性。尤为重要的是,Cell-GNN空间分析量化了FL中显著的架构重组,平均细胞间距离存在极显著差异(Hedges' g = -6.65),揭示了滤泡极性丧失的空间特征。病理学家评估结果显示,两名专家的诊断准确率分别为82.4%和86.1%,而AI模型的性能与之相当甚至更优,且一致性良好。
讨论部分指出,该研究首次专门针对头颈部RFH与FL的鉴别构建了多模态AI模型。研究发现核几何形状(如偏心率)和患者年龄是区分两者的最重要预测因子。尽管较深的网络(如ResNet18)在patch级别表现优异,但AlexNet在多模态患者级别分析中表现更佳,表明适度的模型复杂度结合多源数据可能更有利于临床转化。CellViT++的结果验证了该方法论的有效性,其性能与更复杂的Transformer模型相当,但更具可解释性。Cell-GNN的应用是该研究的亮点,它提供了定量化的空间架构证据,证实了组织结构的破坏是区分良恶性的关键指标。尽管存在样本量相对罕见病有限、分割模型在淋巴组织中特异性不足以及依赖年龄作为强预测因子等局限性,但这项研究成功地将计算病理学工具应用于极具挑战性的头颈部淋巴病变诊断,为病理医生提供了客观、透明且具有生物学意义的决策支持,标志着在罕见病AI辅助诊断领域迈出了坚实的一步。