通过渐进式域变换实现无监督的单域泛化，用于组织分类

《Medical Image Analysis》：Unsupervised single-domain generalization for tissue classification via progressive domain transformation

【字体：大中小】 时间：2026年05月04日 来源：Medical Image Analysis 11.8

编辑推荐：

　　林家泰|李倩|崔艳芬|赵炳超|邓天鹏|黄静琪|史振伟|崔恩明|刘在义|赵可|韩楚|黄艳琪广东省人民医院（广东省医学科学院）放射科，南方医科大学，广州510080，中国摘要组织分类是计算病理学中的基本任务之一，但数字病理学图像中的领域差异限制了分类模型的泛化能力。为了解决这一问题，

林家泰|李倩|崔艳芬|赵炳超|邓天鹏|黄静琪|史振伟|崔恩明|刘在义|赵可|韩楚|黄艳琪

广东省人民医院（广东省医学科学院）放射科，南方医科大学，广州510080，中国

摘要

组织分类是计算病理学中的基本任务之一，但数字病理学图像中的领域差异限制了分类模型的泛化能力。为了解决这一问题，领域泛化成为了一种领先的解决方案，相关研究通常使用多个公共数据集来展示模型在不同来源上的泛化能力。为了进一步探索这一点，我们引入了GDPH-CRC-HE-MS数据集，该数据集包含来自广东省人民医院的101张H&E染色的结直肠癌切片，这些切片由1到6种不同的扫描仪扫描。在这项研究中，我们提出了一种无监督的单领域渐进式泛化（USD-PG）框架，该框架结合了两种渐进式数据转换：风格渐进式数据转换（Style-PDT）和空间渐进式数据转换（Spatial-PDT）。这种方法可以防止在早期训练阶段由于完全随机的转换而导致的纹理和颜色变化。我们在新的GDPH-CRC-HE-MS数据集以及公开可用的NCT-CRC-HE-100K数据集上评估了USD-PG框架的泛化能力。我们的结果表明，USD-PG在单来源领域泛化方面表现优异，有效处理了基于扫描仪和数据源的领域差异。这突显了USD-PG在增强组织分类领域泛化方面的潜力及其在临床应用中的适用性。源代码和发布的数据集可在以下链接获取：https://github.com/linjiatai/USD-PG.

引言

癌症已成为全球人类健康的主要威胁之一（Bray等人，2024年）。病理学仍然是癌症诊断的“金标准”（Perez-Lopez等人，2024年），近年来，计算病理学（CPath）作为一个有前景的领域出现，利用人工智能（AI）辅助诊断过程（Song等人，2023年）和新生物标志物的发现（Amgad等人，2024年）。组织分类是计算病理学的基本任务，用于识别肿瘤微环境的组织亚型（Campanella等人，2019年）。

基于深度学习的组织分类在理想化的数据集上显示出良好的效果（Lin等人，2022年；Deng等人，2024年）。然而，实际应用中的组织分类模型在应用于分布外（OOD）数据时，会因领域差异问题而性能下降（Ciompi等人，2017年）。如图1所示，我们展示了使用不同扫描仪生成的同一组织切片的病理图像，以及由相同补丁级分类模型生成的相应WSI级分割掩膜。我们可以观察到由于领域差异导致的模型性能显著差异。这意味着克服领域差异挑战对于实际场景中的病理图像AI模型至关重要。

近年来，领域泛化已成为解决领域差异的主流方法。它的目标是使用一个或多个源领域的数据来训练深度学习模型，以便有效地泛化到未见过的分布外目标领域（Zhou等人，2022年）。为了实现领域泛化，一些研究专注于通过对齐源领域分布来学习领域不变表示（Li等人，2020年；Ahn等人，2024年）。然而，上述研究需要访问带有领域标签的多个源领域的数据，这被称为多源领域泛化（M-DG）。当只能访问单领域数据时，专门开发了单源领域泛化（S-DG）算法。为了实现S-DG，数据增强方法旨在通过扩展数据分布并利用伪领域差异来学习领域不变信息（Zhou等人，2020年；Yuan等人，2022年），例如基于特征的增强（Zhou等人，2021年）、基于模型的增强（Borlino等人，2021年）、对抗性梯度（Zhou等人，2020年）和基于图像的转换（Zhang等人，2020年）等。由于可以直接从输入图像扩展数据分布，基于图像转换的单领域泛化受到了广泛关注。基于各种随机图像转换的S-DG用于以自监督学习的方式预训练模型，以学习领域外数据的领域不变信息，然后通过微调将预训练模型转移到特定的组织分类任务中（Abbet等人，2022年）。然而，完全随机的数据转换可能会引入过多的纹理失真和不真实的颜色变化，这可能阻碍模型训练，尤其是在组织分类的早期阶段。

为了解决这个问题，我们提出了一种无监督的单领域渐进式泛化（USD-PG）框架，该框架结合了两种类型的渐进式随机转换：风格渐进式数据转换（Style-PDT）和空间渐进式数据转换（Spatial-PDT）。该框架使得无监督的预训练更加平滑，从而学习组织分类任务的领域泛化能力。同时，我们收集了一批使用一种或多种扫描仪扫描的全切片图像（WSIs），创建了一个用于领域泛化的新型多扫描仪数据集，命名为GDPH-CRC-HE-MS。这个数据集为进一步探索领域泛化提供了宝贵的资源。

我们的主要贡献如下：

•
我们提出了一种名为USD-PG的无监督框架，可用于学习单领域泛化的领域不变特征表示。
•
在我们的框架中，提出了两种渐进式领域扩展方法，即Style-PDT和Spatial-PDT，通过图像的风格和空间转换来模拟领域差异，以实现领域泛化。
•
这项工作介绍了一个名为GDPH-CRC-HE-MS的多扫描仪数据集，其中包含由六种扫描仪扫描的图像。这个数据集可用于研究深度学习模型的泛化能力，旨在减轻扫描仪引起的领域差异的影响。
•
在实验中，我们将我们的USD-PG与四种无监督对比学习和两种领域泛化方法在公开的数据集和K19数据集上进行了比较。USD-PG在单领域泛化设置中取得了最先进的性能。

章节片段

病理图像的补丁级分类

由于病理图像的千兆像素特性和需要专业知识，获取像素级注释非常困难。因此，补丁级分类成为了一种替代方法，并已被证明是有效的（Kather等人，2019年）。目前最常见的方法是将训练在ImageNet上的分类模型（Krizhevsky等人，2012年）转移到目标领域。Tan和Le（2019年）提出了EfficientNets，在结直肠癌上实现了95.59%的准确率

方法论

本文旨在通过无监督学习预训练来提高模型的领域泛化能力。为此，我们提出了一种基于对比学习的无监督单领域渐进式泛化（USD-PG）框架，如图2所示。在本节中，我们描述了第3.1节中提出的USD-PG框架的详细信息。在这个框架中，我们提出了两种数据增强方法来指导模型学习更稳定的

数据集

在这项工作中，我们在两个数据集上展示了我们方法的有效性，包括新提出的GDPH-CRC-HE-MS数据集和公开可用的NCT-CRC-HE-100K（K19）数据集（Kather等人，2019年）。本节提供了数据集的详细信息。

实验结果

在本节中，我们进行了实验来评估我们提出模型的领域泛化能力。第5.1节描述了总体实验设置。第5.2节展示了与最先进方法的定量和定性比较。接下来，我们在第5.3节扩展了多领域泛化的实验。最后，在第5.4节进行了单源设置的消融研究。

结论

本文提出了一种用于组织分类的无监督单领域泛化模型，名为USD-PG。在相关研究中，使用数据转换来模拟领域差异，从而从单一源领域学习领域不变特征，从而实现领域泛化。考虑到完全随机的数据转换在早期阶段可能会引入不真实的颜色和纹理变化，这会阻碍模型训练，我们设计了两种

CRediT作者贡献声明

林家泰：撰写——原始草稿，可视化，验证，方法论，概念化。李倩：撰写——原始草稿，软件，项目管理，方法论，形式分析。崔艳芬：撰写——审阅与编辑，资源获取，资金筹措，数据管理。赵炳超：验证。邓天鹏：调查。黄静琪：调查。史振伟：撰写——审阅与编辑。崔恩明：验证。刘在义：撰写——审阅与编辑，资源，资金

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

致谢

本工作得到了国家自然科学基金重点计划（编号：82530070）；国家自然科学基金区域创新与发展联合基金（编号：U22A20345）；广州市科技计划项目（编号：2025A03J4508）；中国博士后科学基金（编号：2025M772908）；国家青年科学基金（编号：82502464）；国家自然科学基金的支持

摘要

引言

章节片段

病理图像的补丁级分类

方法论

数据集

实验结果

结论

CRediT作者贡献声明

利益冲突声明

致谢

热点排行