子宫内膜癌(Endometrial Cancer, EC)人工智能辅助组织形态学分层：基础模型(Foundation Model)用于分子分型(Molecular Subtyping)的现实世界(Real-World)验证

《npj Precision Oncology》：AI-assisted histomorphological stratification of endometrial cancer: real-world validation of foundation models for molecular subtyping

【字体：大中小】 时间：2026年06月07日 来源：npj Precision Oncology 8

编辑推荐：

　　摘要：子宫内膜癌(Endometrial Cancer, EC)被分为四种具有不同预后及治疗意义的分子亚型。尽管该分子分型已确立，形态–分子相关性仍研究不足。人工智能(Artificial Intelligence, AI)使得从苏木精–伊红(Haematox

摘要：子宫内膜癌(Endometrial Cancer, EC)被分为四种具有不同预后及治疗意义的分子亚型。尽管该分子分型已确立，形态–分子相关性仍研究不足。人工智能(Artificial Intelligence, AI)使得从苏木精–伊红(Haematoxylin and Eosin, H&E)染色全切片图像(Whole-Slide Image, WSI)中预测生物标志物成为可能，但用于EC分子分型的现实世界验证尚缺。本研究在来源于常规诊断、图像质量异质性的现实世界队列中评估了基于图像的分子分型。研究人员采用CTransPath与UNI基础模型(Foundation Model)进行特征提取基准测试，证明其在不同扫描仪硬件间的稳健性，并量化了额外染色归一化(Stain Normalization)带来的性能变化。基于UNI提取的特征，在外部现实世界数据上获得了POLEmut（n=16）平均AUROC 0.646、MMRd_MSI（n=79）0.700、NSMP（n=176）0.684及p53abn（n=18）0.844的结果。研究人员提供了各亚型特异性形态特征的人为解读。本发现有望为基于形态学知情(Morphologically Informed)分子分型、实现更可靠的个体化治疗分层框架奠定基础。

论文解读：子宫内膜癌AI辅助组织形态学分层与分子分型基础模型现实世界验证

本研究发表于《npj Precision Oncology》。

一、研究背景与立题依据

子宫内膜癌(Endometrial Cancer, EC)传统上依据Bokhman双重致病模型按组织病理分型，现已被癌症基因组图谱(The Cancer Genome Atlas, TCGA)提出的四种分子亚型所补充，即DNA聚合酶ε超突变型(POLE^mut，DNA polymerase epsilon ultra-mutated)、错配修复缺陷/微卫星不稳定型(MMRd_MSI，Mismatch Repair deficient / MicroSatellite Instable)、无特殊分子谱型(NSMP，No Specific Molecular Profile)及p53异常型(p53^abn，aberrant tumor protein p53)。ProMisE(Proactive Molecular Risk Classifier for Endometrial Cancer)分类系统在常规诊断中得到应用。POLE^mut预后极佳，p53^abn最差，MMRd_MSI与NSMP为中间预后。MMRd_MSI推荐林奇综合征(Lynch Syndrome)筛查并可从免疫检查点抑制剂获益。

然而，目前存在以下问题：(1)四种分子亚型的组织形态学(Morphohistological)特征重叠明显，病理医师肉眼鉴别困难且观察者间一致性差；(2)以往深度学习(Deep Learning, DL)预测EC分子分型的研究多为概念验证，缺乏真实临床环境——即图像质量不均、设备不同、连续入组的"现实世界(Real-World)"队列——的外部验证；(3)新兴的组织病理学基础模型(Foundation Model, FM)如UNI和CTransPath在EC分子分型中尚未见现实世界外部验证报道。为此，研究人员旨在用现实世界常规诊断队列验证基于H&E WSI和FM特征提取的EC四分子亚型AI分类器，并与传统对比学习方法CTransPath进行基准比较，并对模型关注的区域做组织形态学诠释。

二、主要技术方法与数据来源

研究人员采用TCGA-UCEC（n最终=454）和CPTAC-UCEC（n最终=203）公开数据集作为训练/交叉验证集，以德国埃尔朗根大学医院(University Hospital Erlangen)2008–2019年连续入组、经病理医师选片的子宫内膜样癌常规诊断H&E WSI（n=289，分别由3DHistech P1000及Hamamatsu S210扫描）作为独立外部测试集。全切片图像预处理为224×224像素图块（Patch），剔除空白与模糊区域；比较了有无Macenko染色归一化(Stain Normalization)。特征提取分别使用Transformer架构的CTransPath（预训练于约3.2万WSI）和UNI foundation model（预训练于>10万WSI，输出1024维向量）。分类头采用基于Transformer的多实例学习(Multiple Instance Learning, MIL)模型（Vision Transformer两层的注意力池化），以10折交叉验证训练并选取最优单模型，预测四类肿瘤分子亚型及非肿瘤组织类。可解释性分析采用Grad-CAM(Gradient-weighted Class Activation Mapping)及QuPath生成的WSI热力图，辅以最高得分Patch的形态学观察。统计指标采用每类One-vs-All AUROC及宏平均AUROC，分级亚组关联用Fisher精确检验。

三、研究结果

Benchmarking of foundation models, normalization method, and scanning hardware（基础模型、归一化方法及扫描硬件的基准测试）

通过对10折交叉验证模型在Erlangen外部队列测试，UNI特征提取（不做染色归一化、合并两台扫描仪数据）获四肿瘤类别+非肿瘤类别最高平均宏AUROC 0.761；仅四肿瘤类别平均为0.718，优于CTransPath同配置（0.701）。染色归一化未提升反而略降AUROC（UNI原始0.761→归一化0.688）。不同扫描仪间性能差异小，表明跨硬件稳健性好。各类别One-vs-All AUROC（UNI无归一化，双扫描仪）：POLE^mut0.646（n=16）、MMRd_MSI 0.700（n=79）、NSMP 0.684（n=176）、p53^abn0.844（n=18）。

Evaluation of single model performance（单模型性能评估）

选取验证集表现最优的单模型，外部测试各类AUROC为POLE^mut0.766、MMRd_MSI 0.715、p53^abn0.862、NSMP 0.682；总体符合率56.1%。POLE^mut误判最多（10/16判为非POLE^mut，常判为morpho-MMRd_MSI）；MMRd_MSI主要误判为NSMP（称morphoNSMP）；p53^abn误判少；仅1例因肿瘤占比<10%误归为非肿瘤。按组织学分级：低级别（G1/G2, n=226）预测符合率60.2%，常判为morphoNSMP且与低级别显著相关（Fisher检验 p<0.05）；高级别（G3, n=63）非符合率58.7%，常判为morphoMMRd_MSI且与高级别显著相关。Slide-level评分显示p53^abnConcordant预测评分最高，POLE^mutConcordant评分最低；NSMP评分呈双峰分布暗示异质性。

Morphological characteristics of the four molecular subtypes（四种分子亚型形态特征）

结合Grad-CAM热力图与最高注意力Patch分析得出：Concordant POLE^mut见紧密实体或小腺管伴坏死腔、泡状核中度至重度异型、密集瘤周及瘤内淋巴细胞浸润；非Concordant多呈MMRd_MSI样腔内坏死或混有富细胞间质被误判为实体癌。Concordant MMRd_MSI见微腺体/微腺管生长、肌层浸润前沿小癌细胞簇、中至重度淋巴细胞浸润及腔内黏液/中性粒细胞。Concordant p53^abn（限于内膜样）见乳头/微乳头状结构、厚核膜、高核异型、淋巴细胞少；低评分或误判病例中见玻璃反光被模型高关注（伪影干扰）。Concordant NSMP见中等大小管状腺管、背靠背排列、低淋巴浸润、低核异型；非Concordant NSMP出现黏液化生、坏死或较高淋巴浸润倾向p53^abn或MMRd_MSI样特征。

四、讨论与结论总结（译文式浓缩）

本研究利用前沿基础模型构建了基于H&E WSI的EC分子分型分类器，在真实世界、基于人群的外部测试队列中获得尚可性能。UNI基础模型在不做染色归一化、合并双扫描仪数据时获四肿瘤类别平均AUROC 0.718，优于CTransPath，表明基础模型具更优泛化能力。模型在不同扫描仪间结果稳健，提示扫描硬件变异对最终预测影响次要，且在资源受限时可省略染色归一化步骤。与既往基于高选择PORTEC-3队列研究相比，本研究AUROC偏低（尤其POLE^mut受样本量小波动大），但更能反映日常诊断场景下的预期表现。

各亚型形态学关联：POLE^mut与广泛TLS(肿瘤浸润淋巴细胞)及实体结构相关但常被AI混淆为MMRd_MSI；MMRd_MSI典型为微腺管生长伴TLS，最常误判为NSMP；p53^{abn(内膜样型)呈浆液样乳头结构伴高核异型、低TLS，AUROC最高说明形态–分子相关性较强；NSMP为典型内膜样腺管伴背靠背、低TLS、低异型，内部形态异质致双峰评分分布，部分具p53^abn样高核异型者值得进一步预后研究。局限含训练集规模有限、测试集单中心且POLE^mut/p53^abn例数少、仅含内膜样癌、Patch层面缺失大视野上下文、尚未关联临床终点。未来需在宫腔冲洗/活检标本及多中心扩大验证，并探索ROI(Region of Interest)预筛选以减少伪影干扰。}

综上，研究人员证实基于UNI基础模型及MIL的H&E WSI分类器可在现实世界EC常规诊断队列中区分TCGA四分子亚型，其中p53^abn判别最佳、POLE^mut受样本不平衡限制，跨扫描仪稳健且无需染色归一化；结合形态学可解释性分析揭示了亚型特异性组织学模式，为将来低成本、快速的形态学知情分子初筛及个体化治疗分层提供了基础框架。

热点排行