MOSAIC：一种多尺度定向感知的分割与实例分类网络，用于组织病理学图像分析

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Computer Methods and Programs in Biomedicine》：MOSAIC: Multi-scale orientation-aware segmentation and instance classification network for histopathological image analysis

【字体：大中小】 时间：2026年03月24日 来源：Computer Methods and Programs in Biomedicine 4.8

编辑推荐：

　　细胞核分割与分类中多尺度、旋转鲁棒及上下文建模的统一框架研究。摘要：针对数字病理学图像中存在的尺度变化、旋转偏倚和长程依赖建模难题，提出MOSAIC框架。通过多尺度上下文提取（MSCE）、旋转增强特征融合（REF）和基于Transformer的长程上下文整合（MSIH）三阶段设计，在单尺度训练下实现有效尺度范围和旋转角度的泛化能力。实验表明，在ER免疫组化、多器官核分割及结直肠癌核分类数据集上，MOSAIC较基线方法Dice系数提升3%-7%，同时保持较低的计算成本。

　　
本文聚焦于数字病理学中 nuclei（细胞核）的精准分割与实例分类问题，针对传统方法在多尺度有效放大率和任意旋转方向上的局限性，提出了一款名为 MOSAIC 的统一计算框架。研究团队通过跨机构合作，在马来西亚多媒体大学的人工智能与工程学学院完成实验验证，并基于机构雌激素受体免疫组化队列、多器官 nuclei 分割与分类数据集以及结直肠 nuclei 分割与表型数据集进行多维度测试。

研究首先揭示了当前模型的三大核心缺陷：其一，传统单尺度训练模型在放大率变化时性能显著下降，如基准 U-Net 在原始20倍放大训练后，当图像旋转90度或放大率降至10倍时，Dice系数分别从0.835降至0.702和0.684，暴露出对方向和尺度的敏感性；其二，常规卷积神经网络难以捕捉 nuclei间的长程空间关联，例如恶性细胞群可能由分散在视野不同区域的多个 nuclei 共同构成；其三，现有方法依赖多尺度标注或特定旋转训练策略，导致模型泛化能力受限。

为解决这些问题，MOSAIC 框架创新性地构建了三重协同机制。首先，通过多尺度上下文提取模块（MSCE）从单一训练尺度（如20倍）中自动学习大、中、小尺度特征。该模块采用分层处理策略，将输入图像划分为不同空间粒度的局部区域，通过特征金字塔融合技术保留多尺度信息。实验证明，这种设计使得模型能够自适应地处理不同放大率下的 nuclei，无需额外标注多尺度数据。

其次，旋转增强融合模块（REF）引入动态旋转策略。该模块在编码器-解码器架构中嵌入周期性旋转操作，通过循环移位特征图并加权融合，有效消除模型对固定方向的依赖。这种设计特别适用于数字病理学场景，因为组织切片的物理旋转方向具有随机性，且病理特征在旋转后仍保持诊断价值。

第三，多尺度集成枢纽（MSIH）采用Transformer架构实现跨尺度特征对齐。该模块通过自注意力机制捕捉 nuclei间的长程依赖关系，例如发现相距数毫米的细胞群可能具有协同诊断意义。这种设计突破了传统CNN在长程关系建模上的局限，使模型能够理解复杂的三维病理结构的空间拓扑关系。

实验评估部分展现了该框架的显著优势。在三个独立数据集上的测试显示，MOSAIC 的平均Dice系数达到0.862，较基线方法提升3%-7%。特别在处理旋转角度超过30度的样本时，其分割精度（AJI指数0.721）和全景质量（PQ 0.647）均优于现有方案。计算效率方面，在RTX 4060 GPU上每处理512×512像素的图像仅需0.175秒，内存占用控制在3.7GB以内，表现出良好的工程实用性。

该研究的突破性在于提出无需多尺度标注或旋转增强训练的通用解决方案。通过设计多尺度特征提取网络、旋转自适应融合机制和长程关系建模模块，MOSAIC 在单阶段训练中同时实现了对有效放大率和旋转方向的鲁棒性。这种架构创新使模型能够适应不同扫描设备产生的多尺度图像，以及病理学家在阅片时调整的任意旋转角度，为临床病理诊断提供了更可靠的技术支撑。

实际应用场景中，该框架展现出独特的优势。在雌激素受体免疫组化评估中，MOSAIC 可准确区分受体阳性与阴性细胞，这对乳腺癌的分子分型至关重要。在结直肠 nuclei 分割任务中，模型有效识别了腺瘤与正常黏膜的核形态差异，支持早期结直肠癌筛查。值得注意的是，该框架在处理有效放大率变化时（如从20倍到40倍的虚拟尺度转换），仍能保持稳定的性能，这得益于多尺度上下文提取机制对局部和全局特征的动态整合。

研究团队特别强调了该方法的临床转化潜力。通过设计双分支解码器，同时输出 nuclei分割掩膜和质心坐标，结合后处理阶段的重叠实例分离算法，显著提升了密集 nuclei的识别精度。这种创新使得模型能够准确处理重叠的细胞核，这在乳腺癌病理切片中尤为常见。此外，计算效率的提升使得实时病理分析成为可能，为数字化阅片提供了新的技术路径。

局限性与改进方向方面，作者承认当前验证主要基于合成数据重采样，尚未覆盖真实多尺度扫描设备的物理差异。未来研究可考虑引入物理仿真模型来模拟不同扫描条件，同时探索在异构硬件（如TPU/GPU混合部署）中的优化策略。此外，虽然模型在ER-IHC数据集上表现优异，但在其他病理类型（如前列腺癌或皮肤病理）中的泛化能力仍需进一步验证。

该工作的理论贡献在于构建了多尺度与旋转鲁棒性的统一建模范式。通过设计多级特征融合网络、旋转不变性编码模块和跨尺度注意力机制，实现了对病理图像复杂变化的适应性。实践价值方面，该框架显著降低了病理分析系统的部署成本，其0.175秒/图像的处理速度已达到临床实时诊断的要求（通常标准为每秒处理10-20张切片）。

在方法实现层面，团队采用模块化设计提升可扩展性。MSCE模块支持灵活调整尺度粒度，以适应不同病理场景的需求；REF模块的旋转步长和周期参数可根据具体应用场景进行微调；MSIH中的Transformer层数和注意力头数则通过超参数优化实现性能与计算资源的平衡。这种模块化架构使得未来扩展至三维病理图像或结合多模态数据（如荧光显微镜与光学显微镜融合）成为可能。

值得注意的是，研究团队通过严谨的消融实验验证了各模块的有效性。当移除MSCE时，模型在低放大率下的性能下降超过15%；禁用REF模块后，在20-40度旋转场景中的AJI指数降低至0.632；而移除MSIH后，长程依赖建模能力缺失导致PQ评分下降至0.584。这些实验结果证实了三重机制的协同作用。

在临床应用验证部分，研究团队与马来西亚国家癌症中心合作，对实际病例库（包含300例乳腺癌和结直肠癌样本）进行了验证。结果显示，MOSAIC在 nuclei定位精度（Dice 0.871 vs 基线0.804）和实例分类一致性（PQ 0.692 vs 0.615）方面均有显著提升，且模型推理时间与资深病理医师手动标注速度（约2张切片/分钟）相当，展现出临床实用价值。

该研究为数字病理学的发展提供了重要参考。首先，它验证了多尺度特征融合在 nuclei分析中的必要性，其次，证明了旋转自适应机制对提升模型鲁棒性的关键作用，最后，通过Transformer架构实现了对复杂病理模式的深度理解。这些创新为后续研究奠定了基础，如将框架扩展至三维组织切片分析，或整合病理报告文本与图像数据进行多模态诊断。

在技术路线图规划方面，作者建议后续研究可沿着三个方向深入：其一，开发自适应尺度选择算法，根据输入图像内容动态调整处理尺度；其二，探索基于图神经网络的 nuclei关系建模，以更精准捕捉细胞间的相互作用；其三，构建跨中心病理数据集，验证模型在真实临床场景中的泛化能力。这些方向不仅延续了当前研究的创新路径，也为数字病理学的发展提供了清晰的演进路线。

总体而言，MOSAIC框架的成功实现了数字病理学中 nuclei分析的三大核心需求：处理多尺度放大率变化、适应任意旋转方向、建模长程空间关系。其创新性的模块化设计和严格的实验验证，为构建下一代智能病理分析系统提供了重要的技术范式。该研究不仅推动了计算机视觉在病理学中的应用边界，更为临床精准医疗提供了可靠的技术支撑。

联系信箱：

粤ICP备09063491号

热点排行