《Breast Cancer》:A simple morphometric algorithm based on nuclear atypia features of invasive breast carcinoma: relationship with nuclear grade, Ki-67 level, and hormone receptor status
编辑推荐:
背景(Background):随着全切片成像(whole-slide imaging, WSI)的普及,诸多研究利用苏木精-伊红(hematoxylin and eosin, H&E)染色乳腺癌组织数字图像并应用卷积神经网络(convolutional
背景(Background):随着全切片成像(whole-slide imaging, WSI)的普及,诸多研究利用苏木精-伊红(hematoxylin and eosin, H&E)染色乳腺癌组织数字图像并应用卷积神经网络(convolutional neural networks, CNNs)进行病理诊断。然而,基于CNN的诊断在很大程度上属于"黑箱(black box)",可能在定量形态学研究中受限。本研究研究人员开发了一种简易算法,用于在H&E染色全切片图像上对三种核异型性(nuclear atypia)特征进行形态测量分析,以预测乳腺癌的核分级(nuclear grade)、激素受体(hormone receptor, HR)状态及Ki-67水平。材料与方法(Materials and Methods):研究人员使用来源于131例浸润性导管乳腺癌的43,183个面积大于20 μm2的H&E染色细胞核图像,利用计算机视觉算法计算以下核异型性特征:核大小不均(anisonucleosis,即核大小变异率)、染色质密度不均(inhomogeneous chromatin density)及显著核仁(prominent nucleoli)的平均大小。核大小不均量化为面积大于47 μm2的细胞核百分比;不均一染色质量化为亮度≤平均核亮度0.92倍的蓝饱和结构百分比;显著核仁基于亮度≤平均核亮度0.87倍、圆度(circularity)>0.65且面积>1.15 μm2的蓝饱和结构识别。利用约登指数(Youden index)通过受试者工作特征(receiver operating characteristic, ROC)曲线计算与分级和生物标志物最相关的阈值。结果(Results):应用上述阈值的形态测量算法预测核分级(1级和3级)、Ki-67标记指数≥20%及激素受体阴性状态的灵敏度为52.1%~100%,特异度为34.3%~85.3%。结合这三个阈值建立的双多元逻辑回归(multivariable logistic regression)模型预测核分级、Ki-67及激素受体阴性的准确性显著提高,灵敏度57.1%~91.3%,特异度50.9%~82.2%,ROC曲线下面积(area under curve, AUC)为0.70~0.82。该算法应用于含42例肿瘤的独立验证集。结论(Conclusion):本核异型性形态学算法可为浸润性乳腺癌的计算病理学分级(computational grading)提供新的思路。
论文解读:基于H&E染色浸润性乳腺癌核异型性特征建立的简易形态测量算法及其与核分级、Ki-67水平及激素受体状态的关系
本文发表于《Breast Cancer》,研究围绕浸润性乳腺导管癌(invasive ductal carcinoma of no special type, IDC-NST)H&E染色切片中核异型性(nuclear atypia / nuclear pleomorphism,诺丁汉分级Nottingham Grading System三要素之一,包括核大小变异/anisonucleosis、染色质分布不均及显著核仁/prominent nucleoli)的客观量化展开。目前病理医师对核异型性的半定量评分存在主观差异及观察者间不一致性,而近年广泛使用的卷积神经网络(convolutional neural networks, CNN)深度学习方法属"黑箱"模型,难以解释形态特征与生物学指标间的定量关系。为此,研究人员开发了基于经典计算机视觉OpenCV的无黑箱简易形态测量算法,对核异型性的三个组成要素赋予可解释的数字化阈值,探讨其预测核分级(nuclear grade)、Ki-67标记指数(labeling index, LI)及雌激素受体(estrogen receptor, ER)/孕激素受体(progesterone receptor, PR)状态的能力,并在独立队列中验证。
研究人员选取日本防卫医科大学校医院2010—2013年173例原发性浸润性导管癌手术切除H&E染色切片,排除特殊亚型、导管原位癌、术前新辅助化疗/内分泌治疗及无合适切片者,按手术年份分为训练队列(Cohort 1,n=131,2011—2013年)与验证队列(Cohort 2,n=42,2010年)。由病理医师框选浸润癌区域,使用HALO AI(DenseNet V2架构核表型分析模块)进行核分割,排除面积≤20 μm2的可能非癌细胞或部分核,共注释43,183个癌细胞核。基于Python 3.7.4和OpenCV 4.5.1编写算法提取三项形态学参数并进行亮度标准化与对比受限自适应直方图均衡化(contrast-limited adaptive histogram equalization, CLAHE)预处理:(1) Ax(核大小不均比)= 面积>47 μm2的核数/总核数(>20 μm2)×100%;(2) Bx(不均一染色质密度比)= 核内亮度≤平均核亮度×0.92的蓝饱和结构总面积/核总面积×100%;(3) Cx(显著核仁平均面积)= 核内亮度≤平均核亮度×0.87、圆度>0.65且单个面积>1.15 μm2的蓝饱和结构平均面积(μm2)。在Cohort 1中以Youden指数求取各参数最佳截断值,建立两个多元逻辑回归组合公式:Dx = 0.10×Ax + 0.45×Bx + 9.52×Cx(截断值29.5),Ex = 0.27×Ax + 0.06×Bx + 14.2×Cx(截断值32.9),并在Cohort 2中不加修改地验证。临床病理及免疫组化数据(核分级、ER/PR/HER2、Ki-67 LI、三阴triple-negative, TN状态等)取自原病理报告,ER/PR阳性判定采用Allred评分比例分≥2(对应ASCO/CAP指南≥1%肿瘤细胞着色),Ki-67高≥20%、低<10%。
Determination of reference values for elements of nuclear atypia: nuclear size, inhomogeneous chromatin density, and prominent nucleoli
通过ROC曲线分析关联核异型性评分3分确定参考值:Ax参考核面积阈值定为47 μm2;Bx中蓝饱和结构亮度阈值定为平均核亮度的0.92倍及以下;Cx中蓝饱和结构亮度阈值定为平均核亮度的0.87倍及以下,圆度参考值>0.65,核仁最小面积>1.15 μm2。
Clinicopathological implication of anisonucleosis, inhomogeneous chromatin density, and prominent nucleoli
在Cohort 1中比较各亚组均值:Ax均值与高级别核(3级 vs 2/1级,校正后q=0.0044)、高Ki-67(q=0.02)、ER阴性(q=0.014)显著相关;Bx均值与核3级(q=0.0048)、高Ki-67(q=0.0025)、ER阴性(q=0.016)、PR阴性(q=0.034)显著相关;Cx均值与核3级(q=0.0002)、高Ki-67(q=0.0033)、ER阴性(q=0.00074)、PR阴性(q=0.0057)及TN状态(q=0.0014)显著相关;HER2阳性组三参数均值虽偏高但无统计学意义。单参数截断值预测各亚组的灵敏度52.1%~100%、特异度34.3%~85.3%。
ROC分析与联合模型
以Youden指数获取Ax、Bx、Cx各自截断值后,构建Dx与Ex联合模型。Cohort 1中Dx预测核3级的灵敏度76.2%、特异度70.6%(AUC=0.75),Ex预测核3级灵敏度77.8%、特异度66.2%(AUC=0.74);对Ki-67高/低、ER阴性、PR阴性及HER2阳性预测AUC可达0.70~0.82,灵敏度57.1%~91.3%,特异度50.9%~82.2%。Cohort 2验证因样本量少且构成偏态,部分指标性能下降(Grade 3检测灵敏度63.6%~100%、特异度4.3%~62.5%),Ex对Grade 3及Dx对HER2阳性的相对准确性尚可,但整体外部验证受限于队列规模。
讨论(总结)
本研究将WHO及日本《乳腺癌临床病理记录总则》第18版核异型性评分的形态学标准转化为可计算的H&E图像形态测量算法(Ax、Bx、Cx),证实客观量化核大小不均、染色质密度不均及显著核仁可预测核分级乃至Ki-67≥20%与激素受体阴性状态,联合逻辑回归模型AUC达0.70~0.82。局限性在于Cohort 2验证效能偏低(小样本偏态、非完全外部多中心验证),分级参照原病理报告存在个体医师差异,算法基于173例且每张切片仅选一个视野可能存在抽样偏差,未来需多中心大样本跨扫描仪/染色条件验证。该白盒(非黑箱)可解释形态测量方法为计算病理学分级提供了量化依据,也为H&E图像特征与肿瘤分子表型关联的基础研究提供了客观工具。
结论(翻译)
本由浸润性乳腺癌核异型性要素——核大小不均(anisocytosis)、染色质密度不均(inhomogeneous chromatin density)及显著核仁(prominent nucleoli)——形态学量化所组成的简易算法,有潜力预测浸润性乳腺癌的核分级、Ki-67水平及激素受体状态。