《Exploratory Research in Clinical and Social Pharmacy》:Robust Multi-Domain Digital Pathology Image Segmentation via Joint Balancing Representation Learning
【字体:
大中小
】
时间:2026年03月21日来源:Exploratory Research in Clinical and Social Pharmacy 1.8
乳腺癌是全球女性最常见的恶性肿瘤之一,其准确诊断和早期干预对改善患者预后至关重要。数字病理图像分割在识别肿瘤边界、评估侵袭深度和指导个性化治疗中发挥着关键作用。以U-Net及其变体为代表的深度学习模型在大型标注数据集上表现出色,但在面对临床实际时,其泛化能力遭遇巨大挑战。这主要是因为在不同机构间,由于染色程序、成像设备和组织制备过程的差异,产生的数字病理图像存在显著的“领域偏移”。模型在一个机构数据上训练得很好,到了另一家医院,可能就“水土不服”,性能急剧下降。更棘手的是,现有的多域学习方法大多专注于对齐不同领域间的特征差异,却常常忽视了由数据分布不均引起的“域间特征失衡”。想象一下,如果一个模型在训练时,大量“看到”的是A医院风格鲜明、对比度高的图片,而只有少量B医院色调偏暗、纹理模糊的样本,那么模型自然会更“偏爱”A医院的模式,在B医院的数据上表现不佳,这种不平衡会导致“灾难性遗忘”,即模型完全忘记了如何应对代表不足的领域。特别是在三阴性乳腺癌(TNBC)这类高异质性、高复发率、预后差的亚型中,这种挑战尤为突出。现有公开数据集中TNBC样本有限,难以充分捕捉其复杂特征。为了突破这些瓶颈,一项新的研究在《Exploratory Research in Clinical and Social Pharmacy》上提出了一套创新的解决方案。
本研究主要运用了以下关键技术方法:首先是数据集构建与标注,研究收集并构建了名为UKMTILS的私有TNBC数据集,包含253个经病理专家细致标注的H&E染色图像区域,并与公开的TIGER等数据集结合使用。其次,研究者提出了DRIFT(Differential Ratio Integration with Twin-domain Training)分割框架,其核心是基于nnU-Netv2架构。框架包含两个创新模块:一是PRISM-DD(Pattern Recognition Integration with Scale Mechanism for Domain Distribution),这是一个动态数据分布机制,通过分析多维特征(如类别分布、像素强度统计、纹理对比度)的差异,自适应地生成并优化不同领域(数据集)在训练批次中的分配比例,以平衡各领域对模型的贡献。二是AMBiCoL(Adaptive Masked Boundary Consistency Loss),这是一个集成自适应边界掩码和双向一致性建模的多层次损失函数,通过施加空间、结构和边界一致性约束,增强模型在边界敏感区域的泛化能力。