《Biomolecules》:Analysis of RNA Expression Specificity and Commonality in Commonly Used Tool Cells and Multiple Tissues of Pigs
Huan Yang,
Chunlei Zhang,
Xiaohuan Chao,
Jiahao Chen,
Yuan Ding and
Bo Zhou
编辑推荐:
为减少基因功能研究的非必要重复,本研究分析了猪6种常用工具细胞和43种组织的RNA-seq数据,发现细胞中高表达或特异性表达的基因很可能执行其核心功能,而细胞和组织间RNA表达具有高度共性和相似性,并筛选出4117个普遍表达的基因。该研究为高效识别核心功能基因、减少不必要的重复验证提供了重要见解。
在生命科学研究中,基因如同一部宏大交响乐中的音符,它们的“表达”水平决定了细胞演奏出何种“旋律”,即表现出何种功能。科学家们常利用不同类型的细胞作为“试管模型”,来验证基因在各种生命活动中的作用,例如猪的骨骼肌细胞用于研究瘦肉率,脂肪细胞用于探索脂肪沉积。然而,一个日益凸显的“重复”问题正困扰着学界:许多“明星”基因,如大名鼎鼎的TP53,在数万篇论文中被反复研究,而一些细胞或组织特异性表达的基因则被这些“普遍存在”的基因所淹没。这种大量的、非必要的重复验证,不仅造成了数据冗余,也让基因功能研究变得冗长而低效。为了拨开迷雾,更高效地识别那些真正决定细胞核心功能的关键基因,并梳理出哪些是所有细胞都依赖的“基础”基因,一项聚焦于猪模型的研究应运而生。
为了回答上述问题,研究人员开展了一项系统性分析。他们从NCBI Sequence Read Archive (SRA)等公共数据库中,下载了6种常用的猪工具细胞(包括骨骼肌细胞SKMC、卵巢颗粒细胞OGC、PK15细胞、肠道上皮细胞IPEC-J2、脂肪细胞PAC和神经胶质细胞PNGC)以及43种猪组织的RNA测序数据。通过一系列生物信息学与实验分析,研究人员揭示了不同细胞与组织间基因表达的“特异性”与“共性”规律,这项研究最终发表于期刊《Biomolecules》。
在技术方法层面,本研究首先对获取的RNA-seq数据进行了严格的质量控制、比对和基因表达定量。核心分析采用了加权基因共表达网络分析,以识别与特定细胞类型显著相关的基因模块。接着,利用基因本体论和京都基因与基因组百科全书数据库对筛选出的基因集进行功能富集分析,以揭示其潜在的生物学功能。此外,研究还通过可视化(如热图)和统计方法,在全基因组层面比较了不同细胞与组织间的RNA表达谱,并筛选了普遍表达的基因。最后,通过细胞培养和形态学观察,对部分细胞的特性进行了实验验证。
3.1. 6种常见猪工具细胞的加权基因共表达网络分析
通过对6种细胞进行WGCNA,研究人员构建了基因共表达网络,并识别出与每种细胞类型显著相关的基因模块。例如,与PK15细胞相关的模块包含的基因数量最多,而神经胶质细胞相关的模块包含的基因数量相对较少。这些模块的“特征基因”与各自对应的细胞类型显示出高度相关性,其中PK15、PAC和PNGC相关模块的相关系数均达到或超过0.9,表明这些模块的基因能很好地代表对应细胞的表达特征。
3.2. 与各细胞类型正相关的基因是维持相应细胞核心功能的潜在关键
对WGCNA识别出的特异性基因集进行功能分析发现,它们高度富集于对应细胞的核心功能通路上。例如,在骨骼肌细胞中显著相关的基因,主要富集于肌肉结构、分化和发育等生物学过程,同时也涉及阿尔茨海默病、帕金森病等神经退行性疾病通路,这提示了肌肉功能与神经疾病之间可能存在的分子联系。PK15细胞相关基因则大量富集在DNA代谢与修复、RNA加工、细胞周期调控等与细胞增殖密切相关的通路上,这或许解释了PK15细胞为何在病毒研究和疫苗生产中表现出优异的稳定性和耐受性。而IPEC-J2(肠道细胞)相关基因与NADH脱氢酶(一种能量代谢关键酶)活性有关,脂肪细胞相关基因与管状形态发生和细胞外基质有关,神经胶质细胞相关基因则与免疫反应相关。这些结果强有力地表明,在每种细胞中相对高表达或特异性表达的基因,很可能正是维持该细胞主要功能的关键执行者。
3.3. 细胞总RNA表达水平与其增殖能力和稳定性呈正相关
进一步的实验观察发现,PK15和IPEC-J2细胞在形态上更为饱满、均一。对细胞增殖标志基因的分析显示,PK15细胞中绝大多数增殖相关基因的表达水平是六种细胞类型中最高的,其总mRNA读数也显著高于其他细胞。这与生物信息学分析中PK15相关基因富集于细胞周期通路的结果相互印证,说明细胞的RNA表达丰度与其增殖能力存在正相关。
3.4. 猪常用工具细胞和组织的RNA表达具有高度一致的共性
除了特异性,研究更发现了令人惊讶的“共性”。通过对大量组织和细胞样本的全基因组表达谱进行可视化分析,研究人员发现,所有基因在不同细胞和组织中的表达模式表现出高度一致性,差异主要在于表达水平的高低。特别是,除了胚胎样本因其“全能性”而表现出最强的组织特异性外,其余成熟组织和细胞的RNA表达范围极为接近,呈现随机交织的聚类模式。基于此,研究筛选出了在所有43种组织中都表达RNA的4117个“普遍表达基因”。这些基因的功能几乎覆盖了细胞所有的基础代谢和遗传信息传递过程,构成了细胞生命活动的“基石”。对细胞常见表型(如增殖、凋亡、细胞周期、可塑性)相关标志基因的互作网络分析也显示,它们之间存在强烈的相互作用。
4. 讨论
研究的讨论部分对上述发现进行了深入阐释。针对细胞特异性表达基因,作者认为它们很可能是决定细胞和组织核心功能的关键,例如骨骼肌细胞中的基因调控肌肉发育。因此,加强对各类细胞中高表达和特异性表达基因的研究,有助于更快地定位调控其核心功能的“钥匙”。
关于普遍表达的基因,作者指出它们虽然数量众多,但很可能主要负责维持最基本的细胞生命活动。由于这些基因在几乎所有细胞类型中都存在,针对它们的功能研究(如过表达或敲低)在不同细胞中往往得到相似的结果,这就导致了大量的重复性工作。本研究通过分析来自不同品种、性别、年龄和饲养条件下的猪样本,发现其基因组RNA表达谱依然高度相似,这为减少同一物种内不同细胞间的基因功能冗余验证提供了重要依据。作者建议,如果一个普遍表达的基因已在某类细胞中被证实调控某种表型(如增殖、凋亡),那么在其他细胞类型中进行相同验证的必要性或许可以降低,从而将研究资源更多地投入到探索未知的特异性基因功能上。
5. 结论
综上所述,这项研究系统揭示了猪不同细胞与组织间基因表达的特异性与共性规律。主要结论包括:第一,在每种细胞类型中高度或特异性表达的基因,是维持该细胞核心功能的潜在关键。第二,RNA表达在胚胎组织中组织特异性最高,而在成熟组织和细胞中则表现出高度的保守性和普遍性。第三,筛选出的普遍表达基因构成了细胞基础活动的“背景音”,针对这些基因的重复功能验证可以适当精简。这项研究不仅深化了对基因表达调控复杂性的理解,更重要的是,为生命科学和生物医学领域如何优化研究策略、避免不必要的重复工作、更高效地鉴定关键功能基因提供了新的视角和数据支持。