《Genes》:Deep Single-Cell Transcriptomic Profiling of Bovine Milk Somatic Cells Revealed Expression of Stem Cell Related Transcription Factors
Mateja Dolinar,
Peter Dov? and
Minja Zorc
编辑推荐:
单细胞RNA测序(scRNA-seq)为解析乳用牛乳腺的细胞组成和功能状态提供了强大工具。本研究通过整合新旧高深度scRNA-seq数据,揭示了牛乳中免疫细胞和上皮细胞的异质性图谱,并证明测序深度显著影响对低丰度转录因子(如NANOG)的检测,为深入研究哺乳期乳腺生物学和细胞可塑性提供了高分辨率视角。
乳汁不仅仅是营养来源,更是窥探乳腺这一复杂器官内部动态的窗口。乳腺在哺乳期间经历着剧烈的重塑,其中充满了执行不同功能的细胞,包括合成乳汁的上皮细胞和负责免疫监视的各种免疫细胞。传统的研究方法,如批量RNA测序,只能得到细胞群体的平均基因表达信号,就像听一首交响乐的合奏,却无法分辨其中每把小提琴或每支长笛的独奏。这让我们难以精确理解乳汁合成、免疫防御乃至乳腺疾病的细胞层面机制。近年来,单细胞RNA测序(scRNA-seq)技术让我们能够“听见”单个细胞的“声音”,精细描绘组织的细胞图谱。然而,这项技术本身也存在挑战:测序的“深度”,即每个细胞被测序的详细程度,会强烈影响我们能否“听清”那些表达量很低的基因,比如调控细胞命运的“指挥官”——转录因子。为了更清晰地描绘牛乳中细胞的多样性,并探究测序深度如何影响我们发现细胞“秘密”的能力,Mateja Dolinar, Peter Dov? 和 Minja Zorc 开展了这项研究。
为了开展研究,作者主要应用了以下几项关键技术:从两头处于泌乳中期的健康荷斯坦奶牛身上采集并混合了四分之一乳区的乳汁样本,分离其中的体细胞;使用基于液滴的10x Genomics Chromium平台进行单细胞RNA测序(scRNA-seq)文库构建;将新生成的高深度测序数据与两个已发表的牛乳scRNA-seq数据集,使用统一的生物信息学流程(包括Seurat框架)进行整合、聚类和细胞类型注释;最后,基于来自AnimalTFDB的牛转录因子列表,评估了不同测序深度对转录因子检测的影响。
3.1. 单细胞RNA测序数据集概述
研究人员对两头泌乳中期(分别为产后150天和163天)荷斯坦奶牛的乳汁体细胞进行了scRNA-seq。新生成的数据集(Cow3和Cow4)测序深度高,每个细胞检测到的基因和UMI(唯一分子标识符)数量更多,但细胞总数较少。而重新处理的已发表数据集(Cow1和Cow2)细胞数量庞大,但每个细胞的测序深度和转录组复杂度较低。
3.2. scRNA-seq数据集的质量控制
通过严格的质控筛选(基于基因/UMI数量、线粒体/核糖体/血红蛋白转录本比例)和双细胞(doublet)去除,获得了用于后续分析的高质量细胞。
3.3. 数据整合与聚类
使用基于锚点(anchor-based)的整合方法将四个数据集合并。UMAP(均匀流形近似和投影)可视化显示细胞混合良好,无明显的样本特异性聚集。无监督图聚类(graph-based clustering)在整合数据集中识别出了21个转录组学上不同的细胞簇。
3.4. 牛乳中主要细胞群体的鉴定
基于典型标记基因的表达,这21个簇被注释为不同的细胞类型。免疫细胞构成了主要部分,包括以CD8+T细胞为主的多个T细胞亚群(如活化、初始、效应、记忆、增殖等状态)、B细胞、单核细胞/巨噬细胞亚型、中性粒细胞(包括一个应激相关亚群)和肥大细胞。上皮群体包括高表达乳蛋白基因(如CSN1S1, CSN2, CSN3, LALBA)的腔上皮细胞,以及表达角蛋白和紧密连接相关基因的腔祖样细胞。还鉴定出一个高表达细胞周期基因的增殖性免疫细胞簇。
3.5. 深度测序的细胞簇
来自高深度测序样本(Cow3和Cow4)的细胞在某些簇中富集,这些簇表现出更高的转录组复杂性和更清晰的功能亚群分离,尤其体现在CD8+T细胞、单核细胞亚型和腔上皮细胞中。相比之下,以低深度、高细胞数数据集为主的簇(如中性粒细胞和单核细胞)则显示出较低的转录分辨率和更少的可检测低丰度转录本。
3.6. 转录因子表达与测序深度效应
转录因子分析显示,在整个数据集中平均表达最高的包括JUN、JUNB、JUND、NFKB1、PLEK和YBX1,它们与免疫激活、应激反应和上皮功能相关。然而,比较不同测序深度的数据集发现,深度测序能够检测到在浅层测序数据中无法可靠观察到的低丰度转录因子。其中,NANOG(一种与细胞可塑性和干细胞特性相关的关键调节因子)仅在深度测序样本中被检测到。这表明其检测依赖于足够的转录组覆盖度,而非细胞组成的差异,暗示了牛乳体细胞中可能存在与细胞可塑性相关的罕见转录状态。
本研究通过整合高深度与已发表的scRNA-seq数据,提供了牛乳体细胞转录组异质性的综合视图。研究证实牛乳中含有复杂的免疫细胞(尤其是多种CD8+T细胞状态)和上皮细胞群体,并首次在深度测序的牛乳细胞中检测到低水平表达的NANOG。这一发现至关重要,因为它提示即使是在看似终末分化的泌乳期细胞中,也可能存在与细胞可塑性相关的罕见转录程序。更重要的是,研究明确论证了测序深度对解析细胞异质性的关键影响:虽然浅层测序足以鉴定主要细胞类型,但只有更高的测序深度才能揭示细胞亚群内更精细的转录状态,并检测到像NANOG这样的低丰度调控因子。这挑战了仅依靠细胞数量进行单细胞研究的设计思路,强调了在关注特定细胞亚群功能状态时,保证足够测序深度的重要性。总之,该研究不仅丰富了我们对哺乳期乳腺细胞组成的认知,也为未来利用乳汁这种非侵入性样本,高分辨率地研究乳腺生物学、 lactation(泌乳)性能以及相关疾病机制提供了重要的方法学参考和数据分析框架。论文已发表于《Genes》期刊。