《Communications Biology》:CLEAR-IT, a framework for contrastive learning to capture the immune composition of tumor microenvironments
编辑推荐:
肿瘤微环境中细胞的精准表型分析对理解癌症生物学至关重要,但通常依赖精确的细胞分割,限制了可扩展性。为此,研究人员开发了CLEAR-IT,一种基于对比学习(SSL)的自监督框架。该研究仅利用细胞位置信息,从多重荧光组织图像中学习细胞级特征。结果显示,CLEAR-IT编码器实现了出色的线性评估性能,并通过超参数优化显著提升,在不同成像模态和标签减少高达90%的情况下仍保持高精度。该框架为可扩展的细胞表型分析提供了一种弱分割、高标签效率的方法,增强了数字病理和肿瘤微环境分析现有工作流程。
肿瘤微环境是肿瘤细胞与周围免疫细胞、基质细胞等相互作用的复杂生态系统,其细胞组成深刻地影响着癌症的发生、发展和治疗反应。因此,对肿瘤微环境中各种细胞进行精确的识别和分类——即细胞表型分析——是理解癌症生物学和开发新型疗法的基石。传统的细胞表型分析高度依赖于高质量的组织切片图像,特别是多重荧光成像技术,它能够同时标记数十种蛋白质,揭示细胞的空间分布和功能。然而,想要从这些复杂的图像中提取细胞信息,一个关键的、但极具挑战性的前提步骤是“细胞分割”,即精确地勾勒出图像中每个细胞的边界。这个过程不仅繁琐耗时,需要大量专业知识,而且对图像质量和标记特异性要求极高,严重制约了大规模、高通量的分析。有没有一种方法,能够绕开对精确分割的依赖,直接从图像中学习到有意义的细胞特征呢?
为了回答这个难题,一项发表在《Communications Biology》上的研究提出了一种名为“CLEAR-IT”的创新框架。这项研究旨在开发一种不依赖于精确细胞分割、且能高效利用标注信息的自监督学习方法,以实现对肿瘤微环境中细胞组成的自动化、可扩展的表型分析。该研究的意义在于,它有望克服当前数字病理学分析中的一个主要瓶颈,使研究人员能够更快速、更经济地从海量组织图像中挖掘生物学洞见,从而推动精准肿瘤学的发展。
为了开展这项研究,研究人员主要运用了几个关键技术方法。首先是基于多重荧光组织病理学图像的细胞核检测与定位,为模型提供了基本的细胞位置信息,而无需精确的细胞质边界分割。核心方法是对比学习,具体采用了类似SimCLR 框架的自监督学习策略,模型通过最大化同一细胞在不同增强视图下的特征相似性,同时最小化不同细胞特征间的相似性,从而学习到有判别力的细胞表示。此外,研究采用了线性评估 和非线性评估 协议来系统衡量所学特征的性能,并与基于手工特征和CellProfiler 软件的传统方法进行对比。研究还利用了COCOS 和COCOMO 这两个独立的、包含CODEX 和MIBI-TOF 两种不同成像模态的多重荧光图像数据集进行模型训练与验证,确保了结论的普适性。最后,研究人员将学习到的细胞特征应用于构建Cox比例风险模型,以评估其在患者生存预后预测中的价值。
研究结果
CLEAR-IT learns robust, label-efficient representations of tumor and immune cell types
(CLEAR-IT学习到稳健且标签高效的肿瘤与免疫细胞类型表示)
研究人员开发了CLEAR-IT框架。该框架仅输入检测到的细胞核中心点(即位置信息)和其周围的多通道图像块,通过自监督对比学习,训练一个编码器来为每个细胞生成一个特征向量。实验表明,使用CLEAR-IT学到的特征,仅用一个简单的线性分类器,就能在不同成像平台(CODEX和MIBI-TOF)的数据集上,对多种免疫细胞和肿瘤细胞实现高精度的分类。其性能与需要完整细胞分割图作为输入的方法相当,甚至更优,证明了其在没有精确分割掩膜的情况下依然有效。
Hyperparameter optimization improves CLEAR-IT performance
(超参数优化提升CLEAR-IT性能)
研究通过系统的超参数优化发现,图像块的大小、对比学习损失函数中的温度参数以及投影头的维度等,对CLEAR-IT模型的性能有显著影响。经过优化后,模型在所有测试的细胞类型分类任务中,性能均获得了大幅提升。这表明通过调整这些架构和训练细节,可以进一步挖掘自监督学习在细胞表型分析中的潜力。
CLEAR-IT is label-efficient and generalizes across imaging platforms
(CLEAR-IT具有标签效率且能跨成像平台泛化)
CLEAR-IT的一个核心优势是标签效率。研究显示,在使用仅10%的标注数据时,基于CLEAR-IT特征的分类器性能,与使用100%标注数据的、依赖手工特征(如形态、纹理)的传统方法(使用CellProfiler提取)性能相当。更重要的是,在一个数据集(COCOS, CODEX成像)上预训练的CLEAR-IT编码器,可以直接应用到另一个不同技术平台的数据集(COCOMO, MIBI-TOF成像)上,并保持高性能,而传统手工特征方法的跨平台性能则下降明显。这证明了CLEAR-IT所学特征的强大泛化能力和平台无关性。
CLEAR-IT features are complementary to handcrafted features
(CLEAR-IT特征与手工特征具有互补性)
研究人员进一步探索了结合两种特征的优势。他们将CLEAR-IT学习到的深度特征与传统的、基于CellProfiler提取的手工特征相结合,输入到一个先进的细胞分类器(CellSNAP)中。结果表明,这种组合特征在多个数据子集上都能达到最高的分类性能。特别重要的是,使用这种组合特征,仅需不到一半的标注数据,就能达到与使用全部标注数据和手工特征相当的分类精度,再次凸显了其节省标注成本的潜力。
CLEAR-IT enables discovery of prognostic tissue features with minimal labels
(CLEAR-IT能够以极少的标签发现具有预后价值的组织特征)
研究最后将CLEAR-IT应用于癌症预后分析。他们使用来自单个患者的少量标注数据,对模型进行微调,然后对整个队列的组织样本进行细胞表型分析,并提取组织水平的空间特征。利用这些特征构建的预后模型,能够在训练队列和独立的验证队列中,显著区分出高风险和低风险患者。这一发现证明了,基于CLEAR-IT的自动化分析流程,能够从极少的标注起步,识别出具有普遍预后意义的肿瘤微环境特征,为临床转化提供了可能。
研究结论与讨论
本研究表明,CLEAR-IT框架成功实现了一种不依赖精细细胞分割的、标签高效的自监督学习方法,用于从多重荧光组织图像中学习细胞表征。该方法学到的特征在跨细胞类型、跨数据集甚至跨不同成像技术平台(CODEX和MIBI-TOF)的分类任务中,都表现出优异的性能和强大的泛化能力。这些深度特征与传统手工特征相结合,能进一步大幅减少对昂贵标注数据的依赖。更重要的是,基于此框架的自动化表型分析流程,能够利用极少的患者标注,发现具有统计学显著性和临床相关性的患者生存预后标志物,其发现能够在不同患者队列中得到验证。
这项研究具有重要意义。它为解决数字病理学和肿瘤免疫学中大规模细胞表型分析的可扩展性难题,提供了一个新颖且实用的解决方案。通过减轻对精确分割的依赖并大幅提高标签利用效率,CLEAR-IT有潜力显著加速肿瘤微环境的基础研究和转化研究。它使得研究人员能够更便捷地从日益增长的高维组织图像数据集中提取生物学洞见,推动对癌症免疫组成的理解,并最终助力于开发更精准的诊断和治疗策略。该框架作为一种“即插即用”的工具,可以很容易地整合到现有的病理学分析工作流中,增强其分析能力。