《Nature Genetics》:Systematic analysis of snRNA genes reveals frequent RNU2-2 variants in dominant and recessive developmental and epileptic encephalopathies
编辑推荐:
为阐明非编码RNA基因在罕见病中的贡献,研究人员通过对大型罕见病队列中200个潜在功能性的剪接体snRNA基因进行系统性分析,并结合国际合作验证,发现RNU2-2基因的单等位和双等位变异是导致神经发育障碍(NDD)伴癫痫的常见病因,其隐性形式发病率至少是显性形式的两倍,为理解NDD的遗传基础提供了新见解。
在我们的身体细胞中,一个精密的“分子剪刀”——剪接体(spliceosome)——负责修剪基因的RNA“草稿”,以产生能够制造蛋白质的正确指令。这个剪刀由多种蛋白质和称为小核RNA(small nuclear RNA, snRNA)的非编码RNA共同组成。长期以来,科学家们认为编码蛋白质的基因突变是遗传病的主要原因。然而,近年来的一系列突破性发现颠覆了这一认知:一些位于snRNA这种非编码RNA基因上的突变,竟能导致严重的神经发育障碍(neurodevelopmental disorder, NDD),其中最著名的例子是2024年发现的由RNU4-2基因突变引起的ReNU综合征,它已成为最常见的单基因神经发育疾病之一。尽管如此,snRNA基因家族庞大,序列存在高度重复且注释不完全,使得在其中准确识别致病性变异、区分功能性基因与假基因充满挑战,大量潜在的致病基因和遗传模式仍有待揭示。
为了系统性地探索snRNA基因在人类罕见病,特别是神经发育障碍中的角色,一个国际研究团队开展了一项大规模研究。他们的研究成果以“Systematic analysis of snRNA genes reveals frequent RNU2-2 variants in dominant and recessive developmental and epileptic encephalopathies”为题,发表在国际顶级遗传学期刊《Nature Genetics》上。该研究通过对法国“基因组医学计划2025”(PFMG2025)大型罕见病队列(包含34,329名患者)中200个潜在功能性的snRNA基因进行深度挖掘,并结合全球多中心合作验证,取得了里程碑式的发现:RNU2-2基因的变异,无论是显性(单等位)还是隐性(双等位)遗传,都是导致神经发育障碍伴癫痫的极其常见的原因。尤其令人震惊的是,由双等位RNU2-2变异引起的隐性神经发育障碍的发病率,至少是已知显性形式的两倍,其整体患病率与ReNU综合征不相上下。这一发现不仅确立了一个新的、高发的遗传病病因,也揭示了snRNA基因突变在疾病中从显性到隐性遗传的连续作用谱。
研究人员为开展此项研究,综合运用了多项关键技术方法。首先,他们通过生物信息学分析,从人类参考基因组中筛选出200个具有潜在功能的剪接体snRNA基因,并利用ENCODE计划的脑组织小RNA测序数据评估了这些基因的表达情况。研究的核心基于法国PFMG2025大型罕见病队列(包含22,775名神经发育障碍患者)的短读长全基因组测序数据,系统筛查了这些snRNA基因中的新生(de novo)和双等位(biallelic)变异。通过国际合作,他们进一步在额外的5,456名神经发育障碍患者队列中通过靶向测序或数据重分析进行了验证,并利用seqr平台在全球范围检索病例。在机制探索层面,他们对携带特定RNU2-2变异患者的淋巴细胞进行了转录组测序,以分析可变剪接事件;同时,利用DNA甲基化芯片分析了血液甲基化组,以期发现疾病特异的表观遗传特征(episignature)。
结果部分的主要发现如下:
1. 识别潜在功能性剪接体snRNA基因
研究人员通过计算分析,从人类基因组中注释的所有snRNA基因里,筛选出200个可能具有功能的基因,其中包括147个被标注为“假基因”的序列。对ENCODE人脑小RNA测序数据的重新分析显示,其中87个基因(包括39个假基因)在脑中表达,提示更多snRNA基因可能与神经发育障碍相关。
2. 在PFMG队列中分析潜在功能性snRNA基因的新生和双等位变异
在PFMG队列中,研究人员鉴定出843个高置信度的变异(330个新生,551个双等位),涉及66个基因。通过比较“已解”和“未解”病例,以及神经发育障碍与非神经发育障碍病例,他们发现RNU4-2和RNU2-2的新生变异显著富集于未解或神经发育障碍组。尤为重要的是,RNU2-2的双等位变异在神经发育障碍患者中也显示出显著富集,提示其可能与显性和隐性形式的神经发育障碍都相关。
3. RNU2-2变异作为显性和隐性疾病的病因
通过对PFMG队列的深入分析和国际合作验证,研究共报告了来自122个无关家庭的141名患者携带RNU2-2变异。其中包括35名携带显性致病性变异(n.4G>A或n.35A>G)的患者,以及来自73个家庭的91名携带双等位变异的患者。值得注意的是,在7名最初被识别为携带新生变异的个体中,进一步检查发现了第二个总是处于反式(in trans)位置的罕见变异,表明为隐性遗传。这凸显了在snRNA基因中发现新生变异时,必须寻找反式位置的第二个等位基因。
在16个有多个患病同胞的家庭中,两个变异均与疾病共分离,进一步支持了其致病性。
4. 显性和隐性RNU2-2神经发育障碍具有重叠的临床特征
对112名患者的详细临床分析表明,无论是显性还是隐性RNU2-2疾病,都表现出重叠的临床谱。所有患者均有发育迟缓,几乎所有3岁以上患者都有智力障碍(ID),且大多数(77%)为重度/极重度。癫痫的发生率高达85%(88/104),在显性(88%)和隐性(83%)病例中相似。癫痫发作中位年龄为1.5岁。此外,患者常伴有轻微的面部特征。尽管存在组内差异,但智力障碍严重程度、癫痫和运动障碍在家族内表现一致。最严重的表型,包括全部8例死亡病例(年龄3-19岁),均限于双等位变异患者。
5. RNU2-2变异的预测影响
通过将发现的变异映射到U2 snRNA的二级结构和已发表的剪接体三维结构上,研究人员预测了这些变异可能的功能影响。位于5‘端(如n.4G>A)的变异可能破坏U2/U6螺旋II(U2/U6 helix II)的关键碱基配对,影响剪接体组装。位于分支点相互作用茎环(branch-point-interacting stem-loop, BSL)区域的变异(如n.35A>G)可能影响其稳定性或与内含子分支点(branch site, BS)的配对,从而干扰剪接的保真性。而位于3‘端区域(如Sm位点或茎环III/IV)的变异,则可能损害U2 snRNP(小核核糖核蛋白)的成熟和细胞核输入,导致功能性U2分子完全缺失。
6. RNU2-2变异对淋巴细胞转录组的影响
对携带显性(n.4G>A, n.35A>G)或隐性RNU2-2变异患者淋巴细胞的转录组分析显示,与之前发现强剪接特征的RNU4-2不同,RNU2-2变异引起的剪接改变更为微妙且具有变异特异性。主要影响是外显子跳跃(skipped exon, SE),但不同变异类型(n.4G>A, n.35A>G, 双等位)之间共享的剪接事件很少,表明是定量而非定性的剪接扰动。
7. RNU2-2变异对血液甲基化组的影响
DNA甲基化分析揭示了与RNU2-2变异相关的微弱且异质性的甲基化特征。n.4G>A携带者的信号最强,主要表现为低甲基化;n.35A>G携带者表现为轻微的高甲基化;而双等位变异携带者则表现出异质性模式。总体而言,甲基化差异很小(Δβ<5%),接近技术检测极限,这与在血液中观察到的微弱剪接效应一致。
结论与讨论:本研究通过系统性分析,确立了RNU2-2基因变异作为显性和隐性神经发育障碍伴癫痫的一个主要且高发的遗传病因。其隐性形式的发病率至少是显性形式的两倍,整体估计约占神经发育障碍的0.35%,与ReNU综合征的患病率相当。这极大地扩展了我们对非编码RNA在人类疾病中贡献的认识。
研究结果支持一个“影响梯度”(gradient-of-impact)模型,用以解释RNU2-2变异从显性到隐性遗传的连续谱。位于5’端功能关键区域(如U2/U6螺旋II、BSL)的某些强效变异(如n.4G>A, n.35A>G)本身足以在杂合状态下达到致病阈值,导致显性疾病。而效力稍弱的变异或位于3’端影响snRNP组装的“无效”(null)等位基因,则需要与另一个致病等位基因以反式组合(即双等位基因状态)才会引发疾病。snRNA基因固有的高突变性使得新生变异频繁发生,这解释了为什么在这些小基因中能反复观察到致病变异,也强调了在snRNA基因中发现新生变异时,必须积极寻找可能存在的第二个反式变异。
与RNU4-2变异在血液中产生显著的剪接和甲基化特征不同,RNU2-2变异在血液细胞中仅引起微弱且变异特异性的分子变化。这可能反映了RNU2-2在血液中表达相对较低,而其致病效应更特异地作用于大脑。同时,RNU2-2变异复杂的效应谱和与RNU2-1等旁系同源基因的共存,也给变异的临床解读带来了挑战。
总之,这项工作不仅发现了一个新的、常见的遗传病基因,也揭示了snRNA基因在疾病遗传学中的复杂性和重要性。它提示我们,大量曾被视为“假基因”的非编码RNA可能具有尚未被认识的功能,而在高度重复的基因组区域中,仍蕴藏着许多等待发现的疾病基因。未来,需要更大规模的国际合作、更先进的长读长测序技术以及对患者组织(特别是脑组织)的深入分子研究,来完全阐明这些变异导致神经发育障碍的精确机制,并最终为诊断和治疗带来希望。