新生儿期45S核糖体DNA拷贝数变异与全基因组DNA甲基化的关联:揭示早期生命发育与疾病轨迹的关键表观遗传调控机制

《Epigenetics》:Genome-wide DNA methylation profiles and ribosomal DNA copy number at birth

【字体: 时间:2026年03月05日 来源:Epigenetics 3.2

编辑推荐:

  这篇综述性研究通过表观基因组关联分析(EWAS)系统探讨了新生儿脐带血中45S核糖体DNA拷贝数(rDNAcn)与全基因组DNA甲基化的关联。研究发现rDNAcn的变异与122个CpG位点的甲基化水平显著相关,并与RNA聚合酶III转录、翻译起始等关键通路富集相关。该研究首次揭示了rDNAcn与DNA甲基化在生命早期的紧密联系,为理解细胞功能、早期发育编程及远期健康与疾病轨迹的表观遗传调控机制提供了新见解。

  
引言:探索基因组调控的新维度
核糖体DNA(rDNA)以串联重复序列形式存在于人类基因组中,在人二倍体基因组中约有100至600个拷贝,但其中仅约半数被活跃转录。尽管如此,rDNA的转录占细胞内总RNA产出的大部分。在人类中,rDNA由位于近端着丝粒染色体13、14、15、21和22短臂上的45S阵列以及位于1号染色体上的5S阵列编码。45S阵列被RNA聚合酶I转录并加工成18S、5.8S和28S核糖体RNA(rRNA),而5S rRNA则由RNA聚合酶III转录。这些rRNA与细胞质核糖体蛋白共同组装成负责蛋白质合成的人类核糖体。rDNA簇还包含核仁组织区,它们聚集形成核仁,这是核糖体生物发生的主要场所。已有研究表明,几个核仁组织区与其他基因组区域(称为核仁相关域)相关联。
近年来,越来越多的证据表明,rDNA不仅在核糖体生物发生中扮演重要角色,而且rDNA阵列的变异可以在群体内诱导遗传和表型多样性。rDNA拷贝数(rDNAcn)与全局基因表达、衰老以及包括体重、肾功能和不同类型人类癌症在内的健康表型相关。此外,研究发现rDNA可以触发基因组不稳定性并改变基因组组织。因此,有人认为rDNA可能在细胞衰老中发挥作用并诱导复制间隙。
DNA甲基化是调节基因表达的主要过程之一。广泛的研宄揭示了其分子基础和影响领域。基因启动子区域的高甲基化会抑制基因表达,而基因体甲基化则与基因转录的上调相关。除此之外,DNA甲基化被列为衰老和癌症的标志之一,并与基因组不稳定性和发育过程相关。
尽管DNA甲基化已成为许多研宄的重点,但rDNA似乎是一个相对未被充分研宄的基因组调节因子。尽管两者在功能上有相当大的重叠,但它们之间的关系在很大程度上仍不清楚。最近的证据表明rDNAcn与基因表达之间存在联系,而DNA甲基化可能介导了这种联系。因此,本研究旨在探讨rDNAcn与全基因组DNA甲基化之间的关联或相互联系。这两种基因组调节因子巨大的生物学意义可能与健康和疾病中重要的表型差异有关。健康与疾病的发育起源假说假定,晚年的疾病可能在生命早期阶段就被编程。因此,调查rDNAcn和全基因组甲基化等关键组学调节因子,可能为理解健康和疾病的分子编程起点提供见解,并可能塑造后续的健康表型。基于此,我们在新生儿中调查了rDNAcn与全基因组DNA甲基化之间的相互联系。
研究方法:严谨的设计与分析流程
研究人群
本研究纳入了来自正在进行的ENVIRONAGE出生队列的参与者。在2010年2月至2015年6月期间,共招募了930名参与者。本研究包括了一个361名参与者的子集,他们均有rDNAcn测量数据。其中,194名新生儿通过Illumina HumanMethylationEPIC Bead-Chip阵列测量了全基因组DNA甲基化,构成了EPIC发现数据集。此外,167名新生儿通过Illumina HumanMethylation450K Bead-Chip阵列测量了甲基化,构成了450K重复数据集。
样本收集与测量
出生后立即采集脐带血样本。从血沉棕黄层提取基因组DNA。使用多重液滴数字PCR方法测量rDNA含量,通过计算45S rDNA拷贝均值与单拷贝基因TBP拷贝均值的比值来确定rDNAcn。DNA甲基化分别使用EPIC阵列和450K阵列进行测量。此外,一部分参与者还提供了基因表达数据,通过安捷伦全人类基因组8x60K微阵列进行分析。
统计分析
主要统计方法应用于EPIC发现数据集。首先,进行了一项表观基因组关联分析,以单个CpG位点的甲基化(使用Illumina EPIC Bead-Chip阵列测量)为结果,以脐带血rDNAcn为预测因子。其次,利用EWAS的结果来识别差异甲基化区域。第三,在表达数量性状甲基化分析中,将EWAS中识别的CpG的甲基化水平与基因表达数据相关联。第四,将EWAS第一步中识别的CpG、第二步中识别的DMRs以及第三步中识别的相关基因表达所注释的基因,用作通路富集分析的输入。最后,使用包含Illumina 450K Bead-Chip阵列测量的DNA甲基化数据的450K重复数据集,对EWAS、DMR和通路分析进行了重复验证。统计方法的概述如图1所示。
主要发现:揭示rDNAcn与DNA甲基化的新联系
研究人群特征
参与者的平均出生体重为3394 ± 487克,平均孕周为39.1 ± 1.6周。其中51.2%为男孩,大多数新生儿为欧洲裔。新生儿平均rDNAcn为465.42。与EPIC发现数据集相比,450K重复数据集中的参与者脐带血rDNAcn略低。
脐带血rDNAcn的表观基因组关联
在EPIC发现分析中,脐带血rDNAcn与122个经过Bonferroni校正后显著的单个CpG探针相关(120个正相关,2个负相关)。结果通过曼哈顿图(图3A)和火山图展示。火山图不对称的形状,明显偏向正相关,反映了与rDNAcn呈正相关关系的CpG占主导地位。在这122个CpG中,109个被注释到一个或多个基因,产生一组125个基因。基于p值排名前10位的CpGs注释到以下基因:GFI1USP46ABHD14BABHD14ACHL1CGREF1CRCPCCNIAGBL3EIF4G1PROM1(散点图见图4)。在125个被注释的基因中,79个显示启动子甲基化,仅16个表现基因体甲基化,30个基因无法分类。相关的CpGs分散在常染色体上,如图5的核型图所示。尽管在6、10和21号染色体上未检测到显著的CpGs,但仅6号染色体的显著CpGs与总CpGs数量的比率显著较低,因为其总体CpG含量相对较高(图6)。
使用450K重复数据集,我们观察到EPIC发现分析中的122个Bonferroni显著CpG中有96个存在于450K阵列上。在450K重复分析中,基于名义p值,这96个全部显著,并且与EPIC发现数据集中观察到的关联方向一致。经过对459,781次检验进行Bonferroni校正后,总共有61个CpG(63.5%)仍然显著。总体而言,当使用450K重复数据集时,我们观察到118个与出生时rDNAcn相关的Bonferroni显著CpG(114个正相关,4个负相关)。EPIC发现分析与450K重复分析的Bonferroni显著CpG之间的重叠通过维恩图(图8)展示。
差异甲基化区域
在EPIC发现数据集中,使用DMRcate发现了31个与脐带血rDNAcn相关的FDR显著DMRs。当使用combp时,未识别出任何DMRs。在这31个DMRs中,23个被注释,产生30个与DMRs重叠的基因。5个最显著的DMRs与USP46ABHD14AABHD14BRP11-155D18.14RP11-155D18.12CHL1CHL1-AS2CGREF1等基因相关。这些DMRs包含2到8个CpG。已识别DMRs的位置显示在图5的核型图中。
在450K重复数据集中,总共观察到24个DMRs(使用DMRcate),其中18个被注释,产生22个重叠基因。450K重复数据集中的24个DMRs中有11个与EPIC发现分析中发现的DMRs重叠(图9)。
下游eQTM分析
EPIC发现数据集中的64名新生儿可用于eQTM分析。在EWAS识别的CpG的甲基化水平与基因表达之间,总共观察到253个名义上显著的相关性(73个正相关,180个负相关)。这导致192个独特基因的表达与显著CpG的甲基化水平相关。前5个负相关包括:cg06297958和CENPT、cg18182148和GLMN、cg01255913和LOC202181、cg11817993和GPR68、cg09463466和LOC91450。前5个正相关包括:cg02660524和PFKM、cg23733562和TMEM140、cg06297958和PARD6A、cg02660524和TUBA1A、cg05696584和MRPS27
253个名义上显著的相关性涉及239个独特的转录本探针;其中14个分别与两个CpG相关。相反,这253个名义上显著的相关性包括89个独特的CpG。其中,一个CpG(cg00231422)与11个转录本探针相关,两个CpG(cg02660524, cg27138088)分别与10个转录本探针的表达相关,一个CpG(cg17681277)与8个转录本探针相关,一个CpG(cg06297958)与7个转录本探针相关,4个CpG(cg01255913, cg03727280, cg23806621, cg25371950)各与6个转录本探针相关,7个CpG(cg04228104, cg05035456, cg07049977, cg11817993, cg21855135, cg25552435, cg26228123)各与5个转录本探针相关。这16个CpG总共占了253个名义上显著相关性中的105个(图10)。
通路富集分析
来自EPIC发现分析的EWAS结果揭示了44个富集通路。在Reactome数据库中发现了“胞质小分子磺化”和“RNA聚合酶III转录”。GO条目显示,除其他外,与翻译调节、肾脏发育和维生素代谢调节相关的通路。当使用DMRs注释的25个基因时,总共识别出13个富集通路,其中11个显著,2个在FDR校正后仅处于临界显著。这些通路主要与“RNA聚合酶III转录”相关。此外,还观察到“病原体相关DNA的胞质传感器”、“RNA聚合酶II转录snRNA基因”、“RNA聚合酶”、“真核翻译起始”和“帽依赖性翻译起始”的富集。图11显示了来自两种分析(EWAS和DMRs)的富集通路(Reactome和KEGG)。
使用450K重复数据集的EWAS结果进行通路富集分析,我们能够部分重复EPIC发现分析的结果。使用来自450K重复数据集的DMRs注释的22个基因,支持了在EPIC发现分析的DMRs注释基因中识别的所有通路。
最后,使用eQTM分析中所有相关基因转录本进行的通路富集分析揭示了59个富集通路。这些通路主要与激素和肽调节有关,包括“胰岛素分泌的正向调节”或“肽转运的调节”。此外,我们还发现了与细胞内运输相关的通路,以及与有丝分裂和“姐妹染色单体分离”相关的通路,以及信号通路,如“Hedgehog信号传导”和“PKR介导的信号传导”。所有这些通路在使用CpG和DMR注释基因时均未识别。总体而言,大多数通路是由编码微管蛋白的基因TUBA1ATUBA1BTUBA1CTUBB6驱动的。
补充分析结果
线性回归分析未揭示EPIC发现数据集中全局、启动子、基因体或基因间DNA甲基化与rDNAcn之间的关联。先前报道的NADs基因组位置显示,与Bonferroni显著CpG有4.9%的非显著重叠,与DMRs有6.5%的重叠。使用基于网络的工具eFORGE,我们识别了32种组织和细胞类型,其中Bonferroni显著CpGs在DNase I超敏位点中富集。其中15种对应于胎儿或胚胎干细胞。在胎儿肾脏DNase I超敏位点中观察到最显著的富集。
讨论:机制探索与科学意义
迄今为止,已有研宄评估了rDNA阵列上的甲基化,揭示了人类rDNA甲基化模式与癌症和衰老的关联。然而,尚无研宄探讨rDNAcn与全基因组DNA甲基化之间的相互作用。我们在两个独立的新生儿群体中进行了脐带血rDNAcn的EWAS。使用EPIC发现数据集,我们发现了122个与rDNAcn相关的显著单个CpG,其中98.4%呈正相关。此外,还识别了31个DMRs。在下游分析中,我们可以将已识别CpG的甲基化水平与脐带血基因表达联系起来,并观察到与177个注释基因的253个名义上显著相关性。通路分析揭示了即使使用不同的基因输入方法,RNA聚合酶III转录通路也持续富集。使用450K重复数据集进行EWAS、DMR和下游通路富集分析,我们能够为这些发现找到一致的证据。
脐带血中全基因组DNA甲基化与rDNAcn的关系此前未被描述过,目前尚不清楚是甲基化影响rDNAcn,还是rDNAcn影响甲基化,或者是否存在第三个因素同时以独立的方式影响rDNAcn和DNA甲基化。在我们的研宄中,我们旨在强调对rDNAcn差异可能的生物学反应。因此,我们做了以下假设:rDNAcn作为预测变量,而DNA甲基化是结果变量。然而,我们只能推测更高的rDNAcn是否会导致已识别CpGs甲基化程度的差异,或者反之亦然。总体而言,目前缺乏直接连接rDNAcn和DNA甲基化的机制证据。尽管如此,潜在依赖性以及与第三个混杂因素相关的可能性都需要讨论。
我们的结果表明,更高的rDNAcn与更高的DNA甲基化相关(在122个已识别的CpG中,有120个显示随着rDNAcn增加,甲基化升高)。这与最近的研宄一致,这些研宄显示在人类多种组织和老鼠中,rDNAcn与rDNA甲基化之间存在强正相关。在这122个CpG中,79个CpG位于注释基因的启动子区域,这大多会导致基因表达减少。因此,对于EWAS中识别的基因,我们的结果表明在脐带血中随着rDNAcn增加,表达有降低的趋势。
EPIC发现分析中最重要的CpGs与基因GFI1USP46ABHD14AABHD14BCHL1CGREF1相关。总之,我们识别出的与新生儿rDNAcn相关的顶级基因在功能上都与(癌症)细胞增殖、细胞生长和发育有关。这架起了与rDNA连接的桥梁,因为研宄已显示rDNA与细胞增殖之间存在密切联系。在哺乳动物细胞中,rDNA转录在整个细胞周期进程中波动显著,并且受细胞生长因子、营养可用性和细胞能量稳态的调节。同时,核糖体生物发生的变化会阻碍细胞增殖。45S rDNAcn与细胞增殖呈负相关,而5S rDNAcn与之呈正相关。在评估我们顶级基因的功能时,值得注意的是其中几个与mTOR通路相关。这个信号网络协调真核细胞的生长,并对生长因子、氨基酸、细胞能量水平、氧气可用性和压力作出反应。mTOR信号传导被认为通过调整胎儿的生长轨迹以适应母体氧气、营养和生长因子的供应,在调节胎儿生长中发挥重要作用。此外,mTOR已被证明影响rDNA转录,并且也可能与rDNAcn有关。因此,我们推测mTOR可能是我们顶级基因与rDNAcn之间的机制联系。除了在增殖中的作用外,大多数顶级基因在功能上也与细胞生长和发育相关,这可能与生命早期这一阶段的观察结果一致。它也可能暗示潜在的长期效应,因为神经和免疫系统发育的改变可能在以后的生活中具有重要意义。
最显著的CpG总体上是cg01804284。它成为450K重复数据集中的首要发现;然而,该探针不存在于EPIC阵列上。它注释到基因NFYC,这是一个已知与发育过程和癌症相关的基因,这与上述发现一致。
尽管相对大量的高度显著CpG,我们未发现rDNAcn与平均基因组CpG甲基化水平之间的任何关联。因此,目前我们没有证据表明rDNAcn对整体基因组CpG甲基化水平产生全局性影响,但我们的结果可能表明更局部化或基因特异性的效应。
我们的下游通路分析以三种不同的方式进行。首先,使用EWAS的结果作为输入,显示“胞质小分子磺化”、RNA聚合酶III转录,以及与翻译调节、肾脏发育和维生素代谢调节相关通路的富集。其次,我们使用显著CpG和已识别DMRs的注释基因作为输入进行了通路分析。这揭示了与RNA聚合酶III、“病原体相关DNA的胞质传感器”、“RNA聚合酶II转录snRNA基因”、“RNA聚合酶”、“真核翻译起始”和“帽依赖性翻译起始”的强烈联系。第三,我们使用表达与CpG甲基化水平相关的基因进行了通路分析,我们观察到与激素和肽调节、细胞内运输和有丝分裂相关通路的富集。尽管我们通路富集分析的关键发现尚未在以前的研宄中报道,但其中几个已识别的通路可以得到文献的证实。2014年Gibbons及其同事进行的一项研宄直接调查了成年人类中rDNAcn与基因表达的相关性。他们报告了15个与rDNA剂量正相关的GO条目和20个呈负相关的GO条目。更高的rDNAcn与核仁、核糖体、剪接体复合物、RNA代谢和病毒反应相关基因的更高基因表达相关,而更低的基因表达主要发现于定位于内质网的基因。我们的发现与Gibbons的发现有一定程度的重叠。使用EWAS中DMRs进行的通路分析揭示了与RNA代谢的联系。我们使用eQTM分析中的基因进行的第三次通路分析显示了与细胞内蛋白质运输相关通路的富集,这与Gibbons等人2014年的研宄一致。除此之外,我们发现了与肾脏发育相关的通路。与这一发现一致,最近的一项研宄报告了rDNAcn与估计肾小球滤过率(已知是肾功能的标志物)之间的关联。使用eQTM分析中的基因进行的通路分析显示了与有丝分裂相关通路的富集。正如之前所讨论的,rDNA与细胞增殖之间存在公认的联系。rDNAcn与有丝分裂之间的具体联系,由Ide等人在2010年描述,强调了rDNAcn对复制功能的重要性。他们在酵母中的研宄表明,一旦rDNAcn减少,姐妹染色单体的分离对损伤更加敏感。他们的结论是,额外的rDNA重复促进了凝缩蛋白的结合和姐妹染色单体的凝聚力,从而增强了重组修复。
研宄的优势与局限性
据我们所知,这是首次显示人类基因组中rDNAcn与全基因组DNA甲基化之间关联的研宄。在主要分析中,我们使用了高度可靠的EPIC阵列,该阵列覆盖了广泛的基因组区域,并使用了稳健且灵敏的ddPCR技术进行rDNAcn测量。观察到的关联在一系列综合测试中保持一致,包括多个调整集和敏感性分析。此外,我们使用了一个完全独立的数据集重复了结果,该数据集包含使用450K阵列测量的甲基化数据。
尽管如此,指出本研宄的一些局限性也很重要。首先,如上所述,我们无法确定依赖关系的方向。其次,eQTM分析中有限的样本量是一个限制,因为它可能限制结论的稳健性,并需要在解释结果时谨慎。第三,最近的一项研宄报告脐带血样本中母体细胞污染约为4%。鉴于这种低水平,我们不认为它会实质性地影响我们的结果。然而,我们将其作为一个局限性指出,因为它可能潜在地影响我们的分析。最后,通过ddPCR获得的rDNAcn测量无法捕获rDNA阵列内的序列变异;鉴于新出现的证据表明这种变异可能具有生物学意义,这代表了本研宄的另一个局限性。
结论:对早期生命编程的启示
在这项研宄中,我们显示了出生时rDNAcn变异与全基因组DNA甲基化之间的关联。脐带血rDNAcn的增加与更高的DNA甲基化相关,并且我们确定了122个CpG与出生时rDNA重复数显著相关。与rDNA类似,已识别CpG注释的顶级基因在功能上与(癌症)细胞增殖、细胞生长和发育相关。通路富集分析揭示了潜在相关的生物通路,并且最引人入胜的是,该关联可能与RNA聚合酶III转录存在联系。最后,我们在此表明,rDNAcn可能作为生命早期的关键基因组调节因子,这凸显了需要进一步的研宄来探索rDNAcn变异及其相关表观基因组效应在发育、健康和疾病中的功能作用。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号