
-
生物通官微
陪你抓住生命科技
跳动的脉搏
Tissueformer:将单细胞基础模型扩展应用于预测群体水平的表型特征
《BMC Bioinformatics》:Tissueformer: extending single-cell foundation models to predict population-level phenotypes
【字体: 大 中 小 】 时间:2026年06月05日 来源:BMC Bioinformatics 3.3
编辑推荐:
摘要背景单细胞RNA测序技术为基因表达的研究提供了前所未有的见解,并为诊断和组织注释开辟了新的途径。目前,大多数用于解释单细胞数据的计算方法都是基于孤立的单细胞转录组谱来预测细胞标签或属性的。这种方法忽略了样本内的细胞组成,而细胞组成往往对于推断组织身份或其他样本级别的表型至关重
单细胞RNA测序技术为基因表达的研究提供了前所未有的见解,并为诊断和组织注释开辟了新的途径。目前,大多数用于解释单细胞数据的计算方法都是基于孤立的单细胞转录组谱来预测细胞标签或属性的。这种方法忽略了样本内的细胞组成,而细胞组成往往对于推断组织身份或其他样本级别的表型至关重要。
为了解决这一局限性,我们提出了TissueFormer,这是一种基于Transformer的神经网络,它可以从单细胞RNA谱组中推断出群体级别的标签,同时保持单细胞的分辨率。我们将TissueFormer应用于两项任务:通过血液样本的单细胞RNA测序来预测COVID-19的严重程度,以及通过小鼠大脑的空间转录组数据来预测皮层区域的身份。TissueFormer的表现优于基于单细胞的基础模型以及应用于伪混合样本和细胞类型组成的机器学习方法。
TissueFormer的更高性能有望实现更准确的诊断,并能够直接从空间转录组数据中自动构建个体小鼠的高分辨率脑区地图。将这些地图应用于视觉输入存在发育异常的小鼠时,发现预测的视觉皮层面积显著减小,这说明了如何量化个体间的神经解剖学差异。更广泛地说,TissueFormer为预测任何受细胞多样性和组织级别组织结构影响的群体级别表型提供了一个框架。
单细胞RNA测序技术为基因表达的研究提供了前所未有的见解,并为诊断和组织注释开辟了新的途径。目前,大多数用于解释单细胞数据的计算方法都是基于孤立的单细胞转录组谱来预测细胞标签或属性的。这种方法忽略了样本内的细胞组成,而细胞组成往往对于推断组织身份或其他样本级别的表型至关重要。
为了解决这一局限性,我们提出了TissueFormer,这是一种基于Transformer的神经网络,它可以从单细胞RNA谱组中推断出群体级别的标签,同时保持单细胞的分辨率。我们将TissueFormer应用于两项任务:通过血液样本的单细胞RNA测序来预测COVID-19的严重程度,以及通过小鼠大脑的空间转录组数据来预测皮层区域的身份。TissueFormer的表现优于基于单细胞的基础模型以及应用于伪混合样本和细胞类型组成的机器学习方法。
TissueFormer的更高性能有望实现更准确的诊断,并能够直接从空间转录组数据中自动构建个体小鼠的高分辨率脑区地图。将这些地图应用于视觉输入存在发育异常的小鼠时,发现预测的视觉皮层面积显著减小,这说明了如何量化个体间的神经解剖学差异。更广泛地说,TissueFormer为预测任何受细胞多样性和组织级别组织结构影响的群体级别表型提供了一个框架。