《Scientific Reports》:mViSE: A visual search engine for analyzing multiplex IHC brain tissue images (spatial proteomics)
编辑推荐:
为解决全玻片脑组织多重成像数据量大、信息密集、分析困难的问题,研究人员开展了针对空间蛋白质组学的交互式多重视觉搜索引擎mViSE的研究。研究开发了基于多组编码器的无监督视觉搜索方法,能够检索和剖析相似细胞群落、邻近细胞对及多细胞生态位。该平台作为开源QuPath插件发布,为脑区域、皮质层及亚层的描绘与比较分析提供了免编程的查询驱动新工具。
人脑是自然界中最精密的系统之一,理解其复杂的结构和功能是现代神经科学的核心目标。在微观层面,大脑的功能高度依赖于其精密的细胞组成、蛋白表达模式和细胞间的空间排布关系。传统的组织学研究方法,如免疫组织化学(IHC),通常一次只能标记少数几种蛋白质,难以全面解析组织中数十甚至上百种蛋白在空间上的共表达与相互作用网络。近年来,多重免疫组化(multiplex IHC)成像技术的突破,使得在同一张组织切片上同时可视化数十种蛋白质标志物成为可能,产生了海量的全玻片图像数据。这些数据承载着前所未有的信息密度,被誉为“空间蛋白质组学”(spatial proteomics)的宝库。然而,如何从这些TB级、多维度的复杂图像中高效、精准地提取生物学洞见,却成为了摆在研究人员面前的新挑战。传统的图像分析方法要么依赖繁琐的手工标注和编程,要么受限于现有基础模型对多通道图像整合能力的不足。正是在这样的背景下,一项旨在为科研人员提供“所见即所得”式探索能力的研究应运而生,其成果发表在了《Scientific Reports》期刊上。
为了应对上述挑战,研究人员开发了名为mViSE(A visual search engine for analyzing multiplex IHC brain tissue images)的交互式多重视觉搜索引擎。该研究无需人类标注或干预,通过训练多个独立的编码器(encoder),分别从用户定义的分子标志物组合中学习组织的不同方面:细胞形态(morphology)、空间蛋白表达(即化学构筑,chemoarchitecture)、细胞排列(即细胞构筑,cytoarchitecture)以及神经纤维排列模式(即髓鞘构筑,myeloarchitecture)。这些编码器能够无缝整合跨成像通道的视觉线索,并通过视觉化方式确认学习成功。多个编码器还可通过逻辑组合来驱动特定的搜索任务。技术方法的核心是构建基于深度学习图像编码器的视觉搜索框架,并集成于开源的数字病理分析平台QuPath中,以插件形式供用户使用。
研究结果
检索与剖析细胞及细胞群落
研究验证了mViSE检索单个细胞、邻近细胞对以及组织斑块(tissue patches)的能力。编码器成功捕捉了不同细胞类型的视觉特征,使得用户可以通过简单的视觉查询(visual query),快速找到图像中所有形态或蛋白表达模式相似的细胞,或具有特定空间关联的细胞对。
描绘大脑皮质层与区域
mViSE能够依据学习到的细胞构筑和化学构筑特征,自动且准确地描绘大脑皮质的不同层次(cortical layers)以及更大的脑功能区(brain regions)。这不仅包括主要区域的划分,还能进一步细化到亚区(sub-regions)和亚层(sub-layers)的水平,展示了其在解析大脑精细结构方面的强大潜力。
比较分析与表征
通过对检索出的相似细胞群落或多细胞生态位(multicellular niches)进行统计分析,mViSE支持对不同脑区、皮质层或病理状态下的组织微环境进行定量化表征(profiling)和比较。这为研究大脑在发育、老化或疾病过程中特定细胞集群的变化提供了新工具。
结论与讨论
本研究成功开发并验证了mViSE这一针对脑组织空间蛋白质组学数据的交互式视觉搜索引擎。其核心创新在于提出并实现了一种免编程的查询驱动分析范式,通过训练专门的多重图像编码器,克服了现有基础模型在处理多通道组织图像整合上的局限。mViSE使得研究人员能够以直观的“视觉搜索”方式,探索海量脑组织图像数据,直接检索和剖析具有生物学意义的细胞单元(如相似细胞、邻近细胞对)和组织结构单元(如多细胞生态位),进而实现脑区与皮质层的自动化描绘、精细划分以及定量比较。
这项工作的重要意义在于它极大降低了空间蛋白质组学图像的分析门槛,将复杂的计算分析过程封装于简单的交互操作之后,使生物学家和病理学家能够更直接地专注于科学问题的发现。作为开源工具集成于广泛使用的QuPath平台,mViSE有望在神经科学、神经病理学以及更广泛的生物医学研究领域获得应用,加速对大脑复杂性和相关疾病机制的理解。未来,该方法学框架亦可拓展至其他器官或肿瘤组织的多重成像数据分析中,展现出广阔的应用前景。