子宫内膜癌(Endometrial Cancer, EC)人工智能辅助组织形态学分层:基础模型(Foundation Model)用于分子分型(Molecular Subtyping)的现实世界(Real-World)验证

《npj Precision Oncology》:AI-assisted histomorphological stratification of endometrial cancer: real-world validation of foundation models for molecular subtyping

【字体: 时间:2026年06月07日 来源:npj Precision Oncology 8

编辑推荐:

  摘要:子宫内膜癌(Endometrial Cancer, EC)被分为四种具有不同预后及治疗意义的分子亚型。尽管该分子分型已确立,形态–分子相关性仍研究不足。人工智能(Artificial Intelligence, AI)使得从苏木精–伊红(Haematox

  
摘要:子宫内膜癌(Endometrial Cancer, EC)被分为四种具有不同预后及治疗意义的分子亚型。尽管该分子分型已确立,形态–分子相关性仍研究不足。人工智能(Artificial Intelligence, AI)使得从苏木精–伊红(Haematoxylin and Eosin, H&E)染色全切片图像(Whole-Slide Image, WSI)中预测生物标志物成为可能,但用于EC分子分型的现实世界验证尚缺。本研究在来源于常规诊断、图像质量异质性的现实世界队列中评估了基于图像的分子分型。研究人员采用CTransPath与UNI基础模型(Foundation Model)进行特征提取基准测试,证明其在不同扫描仪硬件间的稳健性,并量化了额外染色归一化(Stain Normalization)带来的性能变化。基于UNI提取的特征,在外部现实世界数据上获得了POLEmut(n=16)平均AUROC 0.646、MMRd_MSI(n=79)0.700、NSMP(n=176)0.684及p53abn(n=18)0.844的结果。研究人员提供了各亚型特异性形态特征的人为解读。本发现有望为基于形态学知情(Morphologically Informed)分子分型、实现更可靠的个体化治疗分层框架奠定基础。
论文解读:子宫内膜癌AI辅助组织形态学分层与分子分型基础模型现实世界验证
本研究发表于《npj Precision Oncology》。
一、研究背景与立题依据
子宫内膜癌(Endometrial Cancer, EC)传统上依据Bokhman双重致病模型按组织病理分型,现已被癌症基因组图谱(The Cancer Genome Atlas, TCGA)提出的四种分子亚型所补充,即DNA聚合酶ε超突变型(POLEmut,DNA polymerase epsilon ultra-mutated)、错配修复缺陷/微卫星不稳定型(MMRd_MSI,Mismatch Repair deficient / MicroSatellite Instable)、无特殊分子谱型(NSMP,No Specific Molecular Profile)及p53异常型(p53abn,aberrant tumor protein p53)。ProMisE(Proactive Molecular Risk Classifier for Endometrial Cancer)分类系统在常规诊断中得到应用。POLEmut预后极佳,p53abn最差,MMRd_MSI与NSMP为中间预后。MMRd_MSI推荐林奇综合征(Lynch Syndrome)筛查并可从免疫检查点抑制剂获益。
然而,目前存在以下问题:(1)四种分子亚型的组织形态学(Morphohistological)特征重叠明显,病理医师肉眼鉴别困难且观察者间一致性差;(2)以往深度学习(Deep Learning, DL)预测EC分子分型的研究多为概念验证,缺乏真实临床环境——即图像质量不均、设备不同、连续入组的"现实世界(Real-World)"队列——的外部验证;(3)新兴的组织病理学基础模型(Foundation Model, FM)如UNI和CTransPath在EC分子分型中尚未见现实世界外部验证报道。为此,研究人员旨在用现实世界常规诊断队列验证基于H&E WSI和FM特征提取的EC四分子亚型AI分类器,并与传统对比学习方法CTransPath进行基准比较,并对模型关注的区域做组织形态学诠释。
二、主要技术方法与数据来源
研究人员采用TCGA-UCEC(n最终=454)和CPTAC-UCEC(n最终=203)公开数据集作为训练/交叉验证集,以德国埃尔朗根大学医院(University Hospital Erlangen)2008–2019年连续入组、经病理医师选片的子宫内膜样癌常规诊断H&E WSI(n=289,分别由3DHistech P1000及Hamamatsu S210扫描)作为独立外部测试集。全切片图像预处理为224×224像素图块(Patch),剔除空白与模糊区域;比较了有无Macenko染色归一化(Stain Normalization)。特征提取分别使用Transformer架构的CTransPath(预训练于约3.2万WSI)和UNI foundation model(预训练于>10万WSI,输出1024维向量)。分类头采用基于Transformer的多实例学习(Multiple Instance Learning, MIL)模型(Vision Transformer两层的注意力池化),以10折交叉验证训练并选取最优单模型,预测四类肿瘤分子亚型及非肿瘤组织类。可解释性分析采用Grad-CAM(Gradient-weighted Class Activation Mapping)及QuPath生成的WSI热力图,辅以最高得分Patch的形态学观察。统计指标采用每类One-vs-All AUROC及宏平均AUROC,分级亚组关联用Fisher精确检验。
三、研究结果
Benchmarking of foundation models, normalization method, and scanning hardware(基础模型、归一化方法及扫描硬件的基准测试)
通过对10折交叉验证模型在Erlangen外部队列测试,UNI特征提取(不做染色归一化、合并两台扫描仪数据)获四肿瘤类别+非肿瘤类别最高平均宏AUROC 0.761;仅四肿瘤类别平均为0.718,优于CTransPath同配置(0.701)。染色归一化未提升反而略降AUROC(UNI原始0.761→归一化0.688)。不同扫描仪间性能差异小,表明跨硬件稳健性好。各类别One-vs-All AUROC(UNI无归一化,双扫描仪):POLEmut0.646(n=16)、MMRd_MSI 0.700(n=79)、NSMP 0.684(n=176)、p53abn0.844(n=18)。
Evaluation of single model performance(单模型性能评估)
选取验证集表现最优的单模型,外部测试各类AUROC为POLEmut0.766、MMRd_MSI 0.715、p53abn0.862、NSMP 0.682;总体符合率56.1%。POLEmut误判最多(10/16判为非POLEmut,常判为morpho-MMRd_MSI);MMRd_MSI主要误判为NSMP(称morphoNSMP);p53abn误判少;仅1例因肿瘤占比<10%误归为非肿瘤。按组织学分级:低级别(G1/G2, n=226)预测符合率60.2%,常判为morphoNSMP且与低级别显著相关(Fisher检验 p<0.05);高级别(G3, n=63)非符合率58.7%,常判为morphoMMRd_MSI且与高级别显著相关。Slide-level评分显示p53abnConcordant预测评分最高,POLEmutConcordant评分最低;NSMP评分呈双峰分布暗示异质性。
Morphological characteristics of the four molecular subtypes(四种分子亚型形态特征)
结合Grad-CAM热力图与最高注意力Patch分析得出:Concordant POLEmut见紧密实体或小腺管伴坏死腔、泡状核中度至重度异型、密集瘤周及瘤内淋巴细胞浸润;非Concordant多呈MMRd_MSI样腔内坏死或混有富细胞间质被误判为实体癌。Concordant MMRd_MSI见微腺体/微腺管生长、肌层浸润前沿小癌细胞簇、中至重度淋巴细胞浸润及腔内黏液/中性粒细胞。Concordant p53abn(限于内膜样)见乳头/微乳头状结构、厚核膜、高核异型、淋巴细胞少;低评分或误判病例中见玻璃反光被模型高关注(伪影干扰)。Concordant NSMP见中等大小管状腺管、背靠背排列、低淋巴浸润、低核异型;非Concordant NSMP出现黏液化生、坏死或较高淋巴浸润倾向p53abn或MMRd_MSI样特征。
四、讨论与结论总结(译文式浓缩)
本研究利用前沿基础模型构建了基于H&E WSI的EC分子分型分类器,在真实世界、基于人群的外部测试队列中获得尚可性能。UNI基础模型在不做染色归一化、合并双扫描仪数据时获四肿瘤类别平均AUROC 0.718,优于CTransPath,表明基础模型具更优泛化能力。模型在不同扫描仪间结果稳健,提示扫描硬件变异对最终预测影响次要,且在资源受限时可省略染色归一化步骤。与既往基于高选择PORTEC-3队列研究相比,本研究AUROC偏低(尤其POLEmut受样本量小波动大),但更能反映日常诊断场景下的预期表现。
各亚型形态学关联:POLEmut与广泛TLS(肿瘤浸润淋巴细胞)及实体结构相关但常被AI混淆为MMRd_MSI;MMRd_MSI典型为微腺管生长伴TLS,最常误判为NSMP;p53abn(内膜样型)呈浆液样乳头结构伴高核异型、低TLS,AUROC最高说明形态–分子相关性较强;NSMP为典型内膜样腺管伴背靠背、低TLS、低异型,内部形态异质致双峰评分分布,部分具p53abn样高核异型者值得进一步预后研究。局限含训练集规模有限、测试集单中心且POLEmut/p53abn例数少、仅含内膜样癌、Patch层面缺失大视野上下文、尚未关联临床终点。未来需在宫腔冲洗/活检标本及多中心扩大验证,并探索ROI(Region of Interest)预筛选以减少伪影干扰。
综上,研究人员证实基于UNI基础模型及MIL的H&E WSI分类器可在现实世界EC常规诊断队列中区分TCGA四分子亚型,其中p53abn判别最佳、POLEmut受样本不平衡限制,跨扫描仪稳健且无需染色归一化;结合形态学可解释性分析揭示了亚型特异性组织学模式,为将来低成本、快速的形态学知情分子初筛及个体化治疗分层提供了基础框架。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号