将 DeepLabV3+ 适配用于宫颈癌病变的分割
《Frontiers in Digital Health》:Adapting DeepLabV3+ for biopsy cervical cancer lesion segmentation
【字体:
大
中
小
】
时间:2026年05月11日
来源:Frontiers in Digital Health 3.8
编辑推荐:
摘要
引言:在资源有限的环境中,宫颈癌仍然是癌症死亡的主要原因之一,因为这些地方无法获得先进的数字病理设备。自动化的组织病理图像分割提供了一种潜在的途径来改善诊断能力,但将经济实惠的硬件与强大的深度学习相结合的实际解决方案仍然处于发展阶段。
方法:我们提出了一种结合智能手机辅
摘要
引言:在资源有限的环境中,宫颈癌仍然是癌症死亡的主要原因之一,因为这些地方无法获得先进的数字病理设备。自动化的组织病理图像分割提供了一种潜在的途径来改善诊断能力,但将经济实惠的硬件与强大的深度学习相结合的实际解决方案仍然处于发展阶段。
方法:我们提出了一种结合智能手机辅助显微镜和DeepLabV3+架构的方法,用于对H&E染色的组织病理图像中的宫颈癌病变进行精确分割。我们使用定制的智能手机适配器和Ocular数据收集应用程序进行标准化图像采集。开发了一个基于ResNet34编码器的DeepLabV3+模型,并在乌干达癌症研究所收集的5,966张组织病理图像上进行了验证,针对21个不同的组织病理特征类别,使用结合了BCE和Dice损失函数的模型,并在NVIDIA RTX 3090上进行内存高效的训练。
结果:在从同一机构数据集抽取的保留验证集上,该系统实现了75.8%的平均交并比(IoU)和93.1%的Dice系数,利用了带有孔洞的空间金字塔池化来捕捉多尺度上下文信息。所有21个特征类别的每个类别的IoU范围都在74.13%到75.41%之间,显示出一致的分割性能。DeepLabV3+在相同条件下训练的U-Net基线模型(mIoU:56.84%,Dice:68.53%)表现更好,这证实了预训练编码器和ASPP模块的架构贡献。
讨论:这些结果证明了在资源有限的环境中使用现成的智能手机硬件进行可靠的数字病理分析的技术可行性。DeepLabV3+架构的优越边界划分和多尺度特征提取对于复杂的组织病理模式特别有效。这些结果仅在验证数据上报告;在任何临床部署之前,需要进行独立的多机构评估,以评估其对更广泛临床人群和成像条件的泛化能力。
1 引言
宫颈癌是现代医疗保健中的一个根本性挑战,成为全球女性中第四大常见肿瘤类型(1)。世界卫生组织报告称,每年约有57万新病例和31.1万例宫颈癌死亡,这一负担不成比例地影响低收入和中等收入国家(2)。在非洲的情况下,特别是在乌干达,由于医疗资源有限、检测延迟和社会经济障碍,死亡率升高,形成了严重的健康差异,需要创新解决方案。准确分析组织病理图像对于诊断和治疗计划至关重要,但在许多地区,特别是农村和偏远地区,获得先进诊断能力的机会仍然非常有限(3)。传统的诊断方法主要依赖于专家病理学家通过传统显微镜检查H&E染色的组织样本,这种方法已被证明是可靠的,但在资源受限的环境中面临显著的扩展挑战。尽管数字病理学已经在资源丰富的医疗环境中改变了癌症诊断,但由于成本高昂、基础设施要求高以及需要专门培训,其在资源受限环境中的采用仍然有限(4)。这一技术差距造成了资源丰富和资源受限的医疗设施之间诊断能力的显著差异,特别影响宫颈癌的检测和治疗结果。病理服务的集中化,加上合格病理学家的稀缺和先进诊断设备的缺乏,往往导致诊断和治疗的延迟,直接影响到患者的结果和生存率(5)。为了应对这些挑战,我们提出了一种结合智能手机辅助显微镜和基于深度学习的图像分析的新方法,专门为资源受限的医疗环境设计(6)。我们的解决方案集成了一个经济高效的智能手机适配器系统,用于基于显微镜的图像采集,以及Ocular数据收集应用程序,用于标准化图像捕获和管理(7)。该系统与DeepLabV3+(8)配合使用,后者是一种专为组织病理图像中的宫颈癌病变分割优化的先进语义分割架构。DeepLabV3+通过结合带有孔洞的空间金字塔池化(ASPP)的编码器-解码器结构,扩展了原始的DeepLab框架,使得在各种放大倍数下捕捉组织病理模式的多尺度特征成为可能。该架构的孔洞卷积允许模型捕捉到精细的细胞细节和更广泛的组织级模式,而不会增加计算需求,这对于在资源受限的环境中部署是一个关键优势。与通常用于医学图像分割的传统U-Net架构不同,DeepLabV3+采用了一个在ImageNet上预训练的强大编码器骨干(在我们的实现中是ResNet34),提供了强大的特征提取能力,有效地转移到组织病理分析中。解码器模块通过渐进式上采样和跳跃连接来细化分割边界,确保在我们的21个不同组织病理特征类别中精确地描绘复杂的宫颈癌病变形态。
通过使用定制适配器将智能手机安装到传统显微镜上,我们实现了无需昂贵的整张切片成像系统即可进行数字图像捕获,同时保持了准确诊断所需的质量标准。这种方法减少了实施数字病理解决方案的财务障碍,并为资源受限的医疗环境提供了一个可扩展的框架(9, 10)。这项工作表明,结合智能手机辅助显微镜和先进的深度学习技术可以为服务不足的地区提供高质量的癌症诊断解决方案(11, 12)。本文的其余部分组织如下:第2节回顾相关工作;第3节详细介绍我们的方法;第4节展示实验结果;第5节讨论影响;第6节总结。
2 相关工作
通过数字病理学、移动显微镜和深度学习架构的创新,宫颈癌病变分割技术取得了显著进展。表1提供了相关先前工作的全面比较。
表1
研究 方法 数据集类型 图像模态 类别 指标 性能
Ronneberger等人(13) U-Net 细胞分割 显微镜 二值 IoU–
Zhang等人(14) 注意力U-Net 组织病理学 WSIM 多类 Dice 提高了准确性
Hodneland等人(15) 剩余U-Net 肿瘤体积 MRI 二值 Dice, DSCH 高准确性
Lin等人(16) U-Net 肿瘤分割 MRI 二值 Dice 高准确性
Nazir等人(17) 改进的U-Net 细胞质/细胞核 巴氏涂片 多类 Dice, Acc 在噪声图像中稳健
Hussain等人(18) 形状上下文FCN 宫颈细胞核 巴氏涂片 二值 相似性指数 97%
Shi等人(19) U-Net变体 临床目标体积 CT 二值 Dice 有效的边界划分
Wang等人(20) U-Net 危险器官 CT(EBRT) 多类 Dice, DSC 成功的自动分割
Sornapudi等人(21) EpithNet 上皮 组织学 二值 IoU 自动检测
Jin等人(22) U-Net变体 宫颈癌 超声 二值 IoU, Dice 模型效率
Huang等人(6) 基于CNN的 宫颈筛查 智能手机 多类 准确性 高准确性
Chen等人(8) DeepLabV3+ 语义分割 自然图像 多类 mIoU 89% (PASCAL VOC) 对宫颈癌分析的深度学习方法进行比较。
Wang等人引入了一个在资源受限环境中进行数字病理学的变革性框架,展示了适当的技术解决方案在弥合全球病理服务诊断差距方面的潜力(4)。这与Wang等人(23)的发现一致,他们探索了用于医疗图像中宫颈癌分割的传统和深度学习方法。Jin等人率先在资源受限环境中使用深度学习方法进行组织病理学图像分析,评估了多种基于U-Net的自动分割模型,用于宫颈癌的经阴道超声图像(22)。Huang等人对基于智能手机的宫颈癌筛查在资源匮乏环境中的可行性进行了全面评估,确立了智能手机显微镜作为传统数字病理系统的可行替代方案(6)。U-Net架构已成为医学图像分割的强大工具,Ronneberger等人的原始框架为生物医学图像分析的创新奠定了基础(13)。Zhang等人引入了注意力引导的变体,提高了复杂组织病理模式的分割准确性(14)。Hodneland等人开发了一种使用增强型剩余U-Net的全自动体积肿瘤分割方法(15),Lin等人展示了MRI放射组学特征提取的准确宫颈癌分割(16)。Nazir等人解决了资源受限环境中的细胞学样本分析问题(17),Hussain等人实现了宫颈细胞核分割的97%相似性指数(18)。Shi等人展示了CT图像中有效的自动临床目标体积划分(19),Wang等人应用U-Net进行EBRT计划中危险器官的自动分割(20),Sornapudi等人开发了EpithNet用于宫颈组织学图像中的上皮分割(21)。Sambyal和Sarwar进行了广泛的回顾,强调了U-Net变体在整张切片图像上对宫颈癌诊断的有效性(24)。最近,Chen等人引入了DeepLabV3+,在PASCAL VOC 2012上实现了89%的平均IoU,其多尺度上下文能力非常适合医学图像分析(8)。
尽管取得了这些进展,但在整合移动显微镜和基于深度学习的宫颈癌诊断端到端解决方案方面仍存在显著差距。大多数先前的工作都集中在二值分割或单一模态分析上。我们的工作通过开发一种结合智能手机辅助显微镜和DeepLabV3+的集成解决方案来解决这一差距,用于21个不同组织病理特征的多类宫颈癌病变分割,将先进的深度学习技术与实际部署在资源有限的临床环境中结合起来。
3 方法论
我们的方法论遵循一个全面的六阶段流程(图1):(1)通过智能手机辅助显微镜获取H&E染色的活检图像;(2)专家病理学家使用CVAT进行注释;(3)注释级别的数据增强;(4)分割掩码生成;(5)使用组合损失函数训练DeepLabV3+模型;(6)在未见图像中自动分割宫颈癌特征。
图1 宫颈癌病变分割的方法论流程,展示了从H&E染色的活检图像开始,通过智能手机辅助采集、专家注释、数据集准备和DeepLabV3+模型训练,生成多类分割掩码的整个过程。
任务定义。我们的目标是多类语义分割,其中输入图像I∈RH×W×3中的每个像素被分配到21个组织病理特征类别之一(加上背景),生成一个密集的像素级标签图Y∈{0,1,2,…,20}H×W。
3.1 数据集获取和组织
3.1.1 原始图像分类数据集
我们的源数据集包括来自乌干达Mulago国家转诊医院的5,966张高分辨率宫颈组织活检组织病理图像,最初被分类为四种疾病类别:正常组织(1,088张图像)、癌前病变(57张图像)、腺癌(1,448张图像)和鳞状细胞癌(3,373张图像)。所有图像都是使用Ocular Data Collection应用程序以40×40×的放大倍数和一致的相机设置(f/1.8光圈,1/60秒曝光,ISO 100)通过智能手机辅助显微镜捕获的。图像分辨率主要是2160 ×× 3840像素(85%),15%是3840 ×× 2160像素。
3.1.2 分割数据集注释
乌干达癌症研究所的专家病理学家使用CVAT(计算机视觉注释工具)进行了全面的像素级注释,识别并描绘了所有疾病类别中的21个不同的组织病理特征。四个原始类别代表图像级别的疾病诊断,而21个特征代表这些类别内和跨这些类别出现的像素级组织病理结构。注释过程采用了双重放大策略:组织级特征(较低放大倍数):如腺体形成、组织结构和基质特征。细胞级特征(较高放大倍数):如细胞核特征、单个细胞角化情况和有丝分裂图像。每张图像都由两位经过认证的病理学家独立审查,并对分歧达成共识。
3.1.3 特征分类和质量控制
表2展示了21个组织病理特征的完整分类。通过与专家病理学家协商,排除了少于800个注释实例的特征,以平衡特征表示与临床意义,将特征空间从25多个类别减少到最终的21个稳健类别(实例数量:814–2,962)。排除了六个特征:不规则细胞核膜、基质侵袭、明显的核仁、单个浸润性恶性细胞(保留的变体不同)、不规则染色质分布和乳头状图案。
3.1.4 注释级别数据增强
数据增强在注释级别应用,直接在渲染任何分割掩码之前对CVAT XML注释文件进行操作。这消除了在事后对渲染的掩码应用增强时产生的掩码图像对齐不良的问题。增强将5,966张原始注释图像扩展到23,160对图像-注释对,使用:(1)几何变换:旋转(±15°±15°)、水平翻转、垂直翻转同时应用于图像和注释坐标;(2)强度调整:亮度(±±10%),对比度(±±10%);(3)染色变化:H&E染色颜色模拟。差异性增强因子解决了类别不平衡问题:正常(1.2×1.2×:1,088 →→ 1,306),癌前(3.5×3.5×:57 →→ 200),腺癌(2.0×2.0×:1,448 →→ 2,896),SCC(1.8×1.8×:3,373 →→ 6,071张图像)。
这种离线注释级别的增强与训练期间应用的在线运行时增强完全不同(第4.7节);在线增强仅应用于训练批次,不应用于验证集。
3.1.5 训练/验证分割策略
完整的23,160张图像池被随机洗牌(种子 = 42),并按90/10的比例划分:训练集:20,844张图像(90%);验证集:2,316张图像(10%)。我们没有创建单独的保留测试集,因为(1)进一步细分将导致罕见的细胞特征由于我们的双重放大策略而训练样本不足,(2)最大化罕见特征的训练数据(异常有丝分裂:461个实例;过高染色:484个实例)与医学成像研究中常见的情况一致,这些研究中的机构数据集显示出严重的类别不平衡(25, 26)。由于分割是在增强后的池上进行的,2,316张验证图像代表了大约597个独特原始组织样本的增强变体。我们认识到两个由此产生的限制:(1)验证指标可能略显乐观;(2)验证集评估的是增强鲁棒性,而非完全的分布独立性。这些限制通过变换引入的有意义的视觉多样性以及所有21个特征类别中的一致性能得到了缓解(第5.3节)。分割后,CVAT注释被转换为多类分割掩码,其像素值对应于特征类别索引(0–20,其中0保留为背景)。3.2 分类与分割任务之间的关系我们通过让专家注释每个图像中可见的特定组织病理学特征,将一个4类图像分类问题转换为一个21类像素级别的语义分割问题,而不考虑其原始诊断标签。这21个特征代表了病理学家在诊断宫颈癌时实际检查的形态学特征,提供了可解释的、具有临床意义的分割输出。4 DeepLabV3+架构我们使用segmentation_models_pytorch库实现了DeepLabV3+,用于资源受限计算环境中的多类宫颈癌病变分割(图2)。该网络执行映射 F:RH×W×3→RH×W×NF:RH×W×3→RH×W×N,其中H=W=384,N=21。图2 使用ResNet34编码器实现的DeepLabV3+架构。该网络通过编码器ASPP解码器结构处理384×384像素图像,输出22类分割掩码(21个组织病理学特征加上背景)。4.1 模型配置我们选择了ResNet34作为编码器骨干,基于模型容量和计算约束之间的平衡(27, 28):编码器:使用ImageNet预训练权重的ResNet34;编码器深度:5层;解码器通道:256;输入分辨率:384×384像素;输出类别:22;激活函数:Softmax。4.2 编码器:ResNet34骨干每个残差块都实现了恒等映射(方程1):y=F(x,{Wi})+x(1)编码器产生五个尺度的特征图(x0:384×384×3到x4:24×24×512)。ImageNet预训练提供了强大的低级特征提取器,能够有效转移到组织病理学图像上(28, 29)。4.3 孔状空间金字塔池化(ASPP)ASPP模块捕获了从小型细胞异常(2×2像素)到大型恶性区域(25×24像素)的分割特征所需的多尺度上下文信息。通过多个膨胀率rr进行并行孔状卷积(方程2):y[i]=∑k=1到Kx[i+r?k]?w[k](2)连接的多尺度特征被减少到256个通道(方程3):fASPP=Conv1×1(Concat[Conv1×1(x),Convr1×3(x),Convr2×3(x),Pool(x)](3)4.4 解码器架构解码器通过三个阶段将ASPP的高级语义特征与低级空间特征结合起来:1. 特征融合:ASPP输出的上采样4×4×与降采样到48通道的特征合并:ffused=Concat[Upsample4×(fASPP),Conv1×1(x2)] 2. 精细化:frefined=Conv3×3(Conv3×3(ffused)) 3. 上采样:P(y|x)=softmax(Conv1×1(Upsample4×(frefined))) 4.5 训练配置4.5.1 节能训练批量大小:2张图像;梯度累积:8步(有效批量=16)混合精度:FP16(约减少50%的内存)图像分辨率:384×384像素权重更新使用K=8步累积(方程4):θt+1=θt?η1K∑k=1到K?θL(θt;Bk)(4)4.5.2 优化AdamW(权重衰减10^-4);初始学习率2×10^-4;ReduceLROnPlateau(耐心=5,因子=0.5);提前停止(在验证mIoU上耐心=15个周期);130个训练周期。4.6 损失函数Ltotal=αLBCE+(1?α)LDice,α=0.5(5)LBCE=?1N∑i=1到N∑c=1yi,clog(pi,c)(6)LDice=1?1C∑c=12∑ipi,cyi,c+?∑ipi,c+∑iyi,c+?,C=22,?=10^-6(7)4.7 数据增强流程在线运行时使用Albumentations(32)随机地对训练批次应用增强,并未应用于验证集。训练增强包括水平翻转(p=0.5)、垂直翻转(p=0.3)、ImageNet标准化(均值=[0.485,0.456,0.406],标准差=[0.229,0.224,0.225]),以及调整大小到384×384。初步实验中更重的在线增强并未提高验证性能。4.8 训练基础设施NVIDIA GeForce RTX 3090;PyTorch 2.5.1与vision torchvision 0.20.1;大约130个周期,历时4-5天。4.9 评估指标主要指标:平均交并比(mIoU)和平均Dice系数(方程8)。IoUc=TPc+FPc+FNc,mIoU=1N∑c=1IoUc(8)Dicec=2?TPc+FPc+FNc,mDice=1N∑c=1NDicec(9)我们选择IoU和Dice而不是像素精度,因为:(1)它们衡量的是边界一致性,这在临床上更为相关;(2)它们对于严重的类别不平衡(>85%的背景像素)具有鲁棒性;(3)它们是医学图像分割中的事实标准(30, 31)。4.10 基线模型:U-Net配置为了隔离DeepLabV3+的架构贡献,我们在相同的数据集、分割、损失函数和优化器上训练了一个标准的U-Net(13)基线,通道深度Ci=min(64×2i,1024)。表3总结了完整的配置比较。表3配置U-Net(基线)DeepLabV3+(我们的)EncoderScratch(4阶段)ResNet34(ImageNet预训练)编码器深度4个下采样阶段5个阶段瓶颈1024通道双卷积ASPP(256通道输出)解码器转置卷积+跳跃连接双线性上采样+跳跃连接输入分辨率512×512512×512像素384×384像素输出类别22(21个特征+背景)22(21个特征+背景)损失函数BCE + Dice(α=0.5)BCE + Dice(α=0.5)优化器AdamW,wd=10^-4AdamW,wd=10^-4初始学习率2×10^-42×10^-42×10^-4学习率调度器ReduceLROnPlateau(pp=5,ff=0.5)ReduceLROnPlateau(pp=5,ff=0.5)提前停止耐心=15(验证mIoU)耐心=15(验证mIoU)训练/验证图像20,844/2,31620,844/2,316配置比较:U-Net基线与DeepLabV3+。5 结果与分析所有结果都在保留的验证集上报告。5.1 整体分割性能模型在120周期时达到了最佳验证平均IoU 75.77%和平均Dice 93.11%(表4)。训练-验证IoU差距(85.17% vs. 75.77%)表明了中度过拟合,这是由于类别不平衡和组织病理学复杂性所预期的。表4指标训练集验证集平均IoU(%)85.1775.77平均Dice(%)97.3493.09损失0.0260.303最佳验证IoU(%)–75.77(第120周期)最佳验证Dice(%)–93.11(第120周期)验证集上的整体模型性能。5.2 训练动态训练损失从0.303(第1周期)降低到0.026(第130周期)(图3A-C);验证损失从0.467改进到0.303。平均IoU从21.5%提高到85.2%(训练)和75.8%(验证);Dice从71.9%提高到97.3%(训练)和80.3%(验证)。验证指标在70–80周期左右稳定。图3 130周期内的训练动态。(A)训练和验证集的损失曲线。(B)平均IoU进展。(C)平均Dice系数演变。验证指标在70–80周期左右稳定。5.3 每类别性能分析总体平均Dice为93.09%,包括背景在内的像素加权。未加权的类别平均Dice约为85.6%,这是临床相关的特征分割质量指标(表5)。表5组织病理学特征IoU(%)Dice(%)实例背景85.8792.26–高性能(IoU ≥ 75.2%)KOilocytosis75.4186.47892恶性细胞巢75.2485.132,102背靠背/拥挤的腺体75.2285.64844多形性75.2385.851,510恶性细胞片75.1785.982,962单个细胞角质化75.1785.69563中等性能(74.9% ≤ IoU < 75.2%)部分厚度异型增生75.0486.32814恶性细胞小梁75.0385.161,273坏死75.0586.07899异型鳞状上皮75.0685.941,206正常宫颈内层75.1185.881,074角质珠75.0085.97730正常宫颈外层75.0085.761,010正常宫颈外层74.9385.621,617出血74.8585.29814过度着色74.8485.12484最具有挑战性的(IoU < 74.9%)形成不良的腺体74.7185.311,166基质肥大74.4885.54888异常有丝分裂74.5185.16461全层异型增生74.1385.00463类别平均(21个特征)74.9785.6319,337加权(包括背景)验证集上的每个类别IoU和Dice分数(最佳周期)。每个类别的Dice = 2?IoU/(1+IoU)。粗体值表示每次比较中表现最佳的指标。IoU的范围从74.13%(全层异型增生)到75.41%(KOilocytosis),仅相差1.28个百分点,表明在多样化的形态学模式下具有鲁棒的表示能力。图4展示了21个组织病理学特征的每个类别IoU分布。图4 21个组织病理学特征的每个类别IoU分数。狭窄的范围(74.13%–75.41%)显示了一致的多类别分割。虚线:类别平均IoU(74.97%)。5.4 按特征大小的分析性能在不同特征大小上惊人地一致(标准差=0.41%):小特征(<5,000像素2):mIoU = 74.89%;中等特征(5,000–15,000像素2):mIoU = 74.95%;大特征(>15,000像素2):mIoU = 75.21%。这验证了ASPP模块的多尺度上下文能力(图5)。图5 平均值特征面积与每个类别IoU分数的散点图。性能与特征大小无关,验证了ASPP模块的多尺度能力。5.5 混淆分析图6显示了十个最常见组织病理学特征的混淆矩阵。大多数混淆发生在形态相似的类别之间:恶性细胞片 ? 恶性细胞巢;正常宫颈外层 ? 正常宫颈内层;形成不良的腺体。图6 十个最常见组织病理学特征的混淆矩阵。大多数混淆发生在形态相似的类别之间:恶性细胞片 ? 恶性细胞巢;正常宫颈外层 ? 正常宫颈内层;形成不良的腺体 ? 背靠背/拥挤的腺体。5.6 定性结果图7展示了定性分割结果,行显示了原始图像、真实掩码、模型预测以及包括正常、癌前病变、腺癌和鳞状细胞癌在内的代表性组织类别的叠加可视化。图7 四个验证样本的代表性分割结果。每行显示原始图像以及预测的分割掩码,展示了多样化的组织病理学特征的像素级识别。5.7 对比分析:DeepLabV3+与U-Net基线DeepLabV3+在所有指标上都优于U-Net基线,因为:(1)ResNet34 ImageNet预训练提供了强大的特征提取器;(2)ASPP在空间尺度上捕获结构而不损失分辨率;(3)解码器中的双线性上采样产生了更精确的边界描绘。尽管分辨率较低(384×384 vs. 512×512),这一优势仍然存在(表6)。表6模型mIoU(%)Dice(%)Val lossU-Net(13)56.8468.530.487DeepLabV3+(我们的)75.7793.090.303ΔΔ+18.93+24.56??0.184验证集上的性能比较:DeepLabV3+与U-Net。粗体值表示每次比较中表现最佳的指标。5.8 与先前工作的对比表7将我们的方法与之前的深度学习方法进行了对比。我们的DeepLabV3+模型在21个组织病理学特征上的类别平均Dice达到了85.6%(包括背景的加权平均Dice:93.09%),即使分辨率较低也优于U-Net基线。表7研究方法模式类别mIoU(%)Dice(%)Ronneberger等人(13)U-Net显微镜二元––Sornapudi等人(21)EpithNet组织学二元报告Hussain等人(18)形状FCNPap涂片二元–97%(相似性)Jin等人(22)U-Net变体超声二元报告Huang等人(6)基于CNN的智能手机多类别––Chen等人(8)DeepLabV3+自然图像多类别89.0–我们的(U-Net基线)U-Net智能手机显微镜2156.8468.53我们的(DeepLabV3+)DeepLabV3+智能手机显微镜2175.7785.63aa与先前工作的对比。直接数值比较应谨慎解释,因为数据集、模式、类别数量和评估协议存在差异。aa21个组织病理学特征类别的类别平均Dice。包括背景的加权平均Dice:93.09%。所有结果都在单个机构的保留验证集上报告。粗体值表示每次比较中表现最佳的指标。6 讨论我们的研究表明,DeepLabV3+结合ResNet34编码器在多类别组织病理学特征分割中取得了有希望的性能,验证平均IoU为75.77%,平均Dice为93.11%,涵盖了21个特征类别。这比U-Net基线(验证mIoU:56.84%,Dice:68.53%)有显著改进,证实了改进来自于DeepLabV3+的架构设计,而不是数据或训练的优势。这些结果应被视为概念验证性能,而不是临床级泛化的证据。6.1 模型性能和临床相关性每个类别的IoU分数(74.13%–75.41%)和类别级别的Dice分数(85.00%–86.47%)表明该模型在罕见类别上没有牺牲准确性,以优先考虑高频特征,因为缺失罕见特征(如异常有丝分裂或全层异型增生)会带来严重的诊断后果。正常组织类别取得了良好的性能(正常宫颈外层:IoU 74.93%,Dice 85.62%;正常宫颈内层腺体:IoU 75.00%,Dice 85.76%)。恶性模式类别表现良好:恶性细胞片(75.17%,85.98%),恶性细胞巢(75.24%,85.13%),以及恶性细胞小梁(75.03%,85.16%)。最具挑战性的类别,异常有丝分裂(74.51%),全层异型增生(74.13%),以及基质肥大(74.48%)反映了训练样本有限、特征区域小或边界模糊;针对这些类别的针对性数据收集和高级采样策略是优先考虑的。6.2