《Current Opinion in Genetics & Development》:The role of cohesin and DNA loop extrusion in the generation of single neuron identity
编辑推荐:
这篇综述聚焦于神经科学前沿,系统阐述了凝聚素(cohesin)复合物及其调控因子如何通过DNA环挤压(DNA loop extrusion)机制,驱动原钙粘蛋白(Protocadherin, Pcdh)基因簇的随机选择性表达,从而为单个神经元赋予独特的细胞表面“条形码”,这对于神经元的自我/非我识别至关重要。文章整合了最新的体内模型、单细胞基因组学和聚合物模拟研究,揭示了染色质三维动态、DNA甲基化与转录调控之间的精妙偶联,并将分子机制与神经环路发育及神经精神疾病(如cohesinopathies)相联系,为理解基因组架构如何编码细胞身份提供了新的范式。
细胞多样性的产生是高等生物复杂功能的基础。簇状原钙粘蛋白(Pcdh)基因的随机组合性表达产生了巨大的细胞表面蛋白多样性,为每个神经元提供了独特的“条形码”,使其能够进行自我/非我识别。近年来,对单个神经元如何随机选择Pcdh基因表达机制的研究,为理解凝聚素(cohesin)复合物、其卸载蛋白WAPL以及绝缘蛋白CTCF在神经识别中的功能提供了关键见解。Pcdh基因座独特的基因组架构——近60个串联排列的启动子竞争少数几个共享的增强子——为了解增强子与启动子如何通讯、这些相互作用如何随基因组距离和不同细胞类型变化提供了新视角。
Pcdh基因的基因组组织及其在神经细胞类型中的表达
小鼠Pcdh基因座跨越100万个DNA碱基对,包含α、β和γ三个串联排列的基因簇。本文主要关注Pcdhα基因的表达调控。小鼠有14个可变的Pcdhα基因,分为12个“交替型”(Pcdhα1-12)和2个“c型”(Pcdhαc1和Pcdhαc2)。每个可变基因/外显子前都有一个几乎相同的启动子DNA序列,其下游是两个增强子:超敏感位点(HS)HS7和HS5-1增强子。
单细胞RNA测序分析显示,Pcdhα启动子的选择在不同神经细胞类型中存在差异。例如,小鼠5-羟色胺能神经元(5-HTs)表现出极端的增强子距离偏向性表达,基因选择偏向于最靠近增强子的Pcdhαc2基因。这种距离偏向性的表达谱确保了单个5-HT神经元能被均匀地编码,并在大脑中均匀地平铺延伸。相比之下,小鼠嗅觉感觉神经元(OSNs)则显示出距离无偏向性的Pcdhα启动子选择谱,所有14个基因在单个神经元中被随机选择的概率近乎相等。这种距离无偏向性的基因选择使得OSNs能够汇聚到称为肾小球的结构中并组装气味图。浦肯野神经元和皮质神经元(CNs)中Pcdhα基因的表达谱则介于OSNs和5-HTs之间,具有不同程度的增强子距离偏向性。
DNA甲基化抑制Pcdhα启动子,其激活需要增强子介导的去甲基化
绝缘蛋白CTCF是Pcdh基因表达的主要调控因子。在Pcdhα基因簇中,交替型Pcdhα基因有两个CTCF结合位点(CBS),分别位于启动子和外显子中。而Pcdhαc1基因只包含启动子CBS,Pcdhαc2基因则两者都没有。HS5-1增强子有两个CBS,其方向与启动子和外显子中的CBS相对。
CTCF与Pcdhα基因CBS的结合会被DNA甲基化阻断。研究发现,在OSN干细胞中,Pcdhα启动子被CpG DNA甲基化转录抑制,其去甲基化和转录激活是发育调控的。启动子的高甲基化和转录沉默状态被称为“选择前”状态。单个Pcdhα 1-12启动子的随机选择需要从位于外显子内、紧邻有义启动子下游的反义启动子转录反义长链非编码RNA(as-lncRNA)。Pcdhα as-lncRNA的转录会导致其紧邻上游启动子、启动子CBS和外显子CBS的DNA去甲基化,从而使CTCF能够结合到随机选择的启动子上。这种低甲基化、CTCF结合且转录活跃的状态被称为“选择后”状态。
这些研究共同提出了一个模型:Pcdhα启动子的基础状态是通过DNA甲基化对所有启动子进行转录抑制。这种状态抑制了CTCF结合,但HS5-1增强子与Pcdhα外显子中反义启动子之间的随机接触会启动Pcdhα as-lncRNA的转录,从而驱动DNA去甲基化和CTCF结合,随后激活邻近的有义链启动子。
凝聚素驱动初始的增强子/启动子接触,导致Pcdhα启动子去甲基化并消除其激活中的基因组距离偏向性
Pcdhα启动子与HS5-1增强子之间长程接触的形成需要凝聚素。凝聚素是一种环状蛋白复合物,通过一种称为DNA环挤压的机制调控哺乳动物基因组的三维折叠。在DNA环挤压过程中,凝聚素水解ATP并沿着DNA易位,形成DNA环。CTCF以CBS方向依赖的方式结合DNA并在CBS位点阻挡凝聚素。这一过程使得凝聚素/CTCF锚定的环和拓扑关联域(TADs)得以形成,从而将增强子和启动子等DNA调控元件区室化并使其相互靠近。凝聚素与DNA的结合受到WAPL蛋白的拮抗,WAPL将凝聚素从染色质上解离,限制了凝聚素沿染色质易位的距离。
对完全发育的有丝分裂后OSNs进行Rad21(凝聚素的kleisin亚基)条件性敲除的研究揭示了凝聚素和DNA环挤压在Pcdhα启动子选择中的作用:消除Pcdhα启动子选择中的基因组距离偏向性。单细胞RNA测序研究表明,Pcdhα基因选择最初是以从HS5-1增强子偏向Pcdhαc2的距离偏向性方式开始的。随着OSN前体细胞成熟为有丝分裂后神经元,这种距离偏向性表达转变为更偏向距离无偏向性的Pcdhα基因表达。凝聚素是这种转录转换所必需的,因为其在OSNs中的条件性缺失会使Pcdhα表达默认为唯一的增强子近端基因:Pcdhαc2。
这些研究证明了凝聚素的DNA环挤压在Pcdhα启动子选择中的关键作用,并为在过表达Tet3的OSNs中观察到的Pcdhα12的增强子距离偏向性表达提供了分子解释。如果凝聚素持续在Pcdhα基因座进行挤压,在所有Pcdhα启动子都被CTCF结合的条件下,凝聚素在第一个CTCF结合的启动子处停滞的频率会远高于上游启动子,这将导致Pcdhα12的表达偏向和单个神经元多样性的丧失。然而,如果Pcdhα启动子的基础状态是甲基化且没有CTCF结合,那么凝聚素可以沿着Pcdh基因座进行挤压,启动子的选择则由初始增强子/启动子接触的概率决定,从而导致DNA去甲基化和CTCF结合。在这种情况下,启动子选择的基因组距离偏向性就被消除了。
可调的凝聚素挤压机制影响初始增强子/启动子相互作用的概率和Pcdh启动子选择
在OSNs中删除凝聚素会将Pcdhα基因表达从基因组距离无偏向性转变为偏向性图谱,类似于5-HTs(其中唯一表达的Pcdhα基因是Pcdhαc2),这为Pcdhα启动子与其增强子之间的高效相互作用及其神经元细胞类型特异性调控提供了机制。结合计算机聚合物模拟研究,该模型确定了可调的细胞类型特异性凝聚素活性和位点特异性调控元件,这些元件为Pcdhα启动子分配了“逃逸概率”,并构成了生成细胞类型特异性Pcdhα启动子随机选择模式的基础。
- •
调节凝聚素的持续性和密度*:研究发现,相对于Rad21,凝聚素卸载蛋白WAPL的mRNA和蛋白水平在OSN成熟过程中下调,而在5-HTs中相对于OSNs则上调。WAPL相对于凝聚素的相对化学计量比可能决定了凝聚素在解离前能在基因簇上穿越的距离,从而决定了驱动启动子选择的初始增强子/启动子相互作用的概率。WAPL高水平会促进凝聚素从DNA上频繁解离,限制其挤压距离,从而将选择限制在最靠近增强子的Pcdhα启动子。相反,WAPL低水平会增加凝聚素的持续性,有利于长距离易位,使得远离增强子的Pcdh启动子能够以相等的概率被选择。遗传实验支持了这一假说。在OSNs中过表达WAPL有利于Pcdhα基因选择的距离偏向性,而在这些细胞中删除WAPL则使得远端Pcdh基因比近端基因表达更多,这种效应在距离其增强子近600 kb的最远端Pcdhβ基因上尤为明显。在5-HTs中删除WAPL(而非Rad21)会导致Pcdhαc2表达丧失。这些观察结果支持了凝聚素和DNA环挤压在Pcdhα启动子选择中的作用,并提出了一种模型,即通过改变凝聚素相对于WAPL(或可能的其他凝聚素调节因子)的化学计量比来调节凝聚素的持续性和密度,从而产生Pcdh基因座的不同读取结果。WAPL因此被提出作为神经元中Pcdh多样性的“变阻器”。
- •
调节凝聚素边界*:与Pcdhα 1-12的启动子和外显子CBS(预测其被CTCF结合的频率与其基因被选择的频率相同,因此在每个OSN中平均最多一个)不同,Pcdhαc1的启动子CBS似乎在所有OSNs中都被CTCF结合。改变该边界元件渗透性的聚合物模拟表明,削弱其边界强度有利于初始增强子/启动子接触的距离偏向性,而加强Pcdhαc1启动子CBS边界则能抵消这些偏向性。删除Pcdhαc1启动子CBS或插入能强化该边界的CBS的实验支持了这一观点,并为CTCF和Pcdhαc1启动子CBS在Pcdhα基因座表达多样化中的作用提供了实验证据。
- •
调节增强子强度*:远端增强子是Pcdhα启动子去甲基化和CTCF结合所必需的,这表明增强子活性强度也可以在定义启动子选择概率方面发挥作用。例如,更强的增强子可能通过启动更高水平的as-lncRNA转录,以更低的接触频率或在更少的相互作用下促进Pcdhα启动子的DNA去甲基化。高增强子活性预示着启动子选择的邻近偏向性。对OSNs和CNs中Pcdhα选择模式的比较支持了这一假设,因为CNs中更强的HS5-1和HS7增强子促进了这些神经元中Pcdhα启动子选择的距离偏向性。
超越分子见解:凝聚素和WAPL在神经连接中的生理作用及其对神经系统疾病的影响
在OSNs中删除Rad21会导致其末端轴突的分支表型,这可能是由于Pcdhα亚型多样性的丧失。在5-HTs中敲除WAPL会导致轴突平铺缺陷,这是由于Pcdhαc2表达的丧失。因此,除了通过DNA环挤压阐明Pcdh基因随机选择的分子机制外,对凝聚素调控Pcdhα基因表达的研究还建立了凝聚素和WAPL与神经连接之间的生理联系。这一联系的影响延伸至人类神经系统疾病。值得注意的是,编码凝聚素复合物多个亚基及其调节因子(包括WAPL)的基因变异与被称为“cohesinopathies”的发育和认知异常有关。与此一致的是,在来自cohesinopathy患者的细胞中,簇状Pcdh基因表达失调。重要的是,与所提出的模型一致——凝聚素调节因子的化学计量比调节Pcdh表达——研究发现,在促进凝聚素DNA易位的结合伙伴nipped-B-like蛋白缺陷的小鼠大脑中,Pcdh基因表达丧失,而这一缺陷可通过下调WAPL来挽救。最后,Pcdh基因座的遗传变异也与多种神经系统疾病相关,包括精神分裂症、自闭症谱系障碍和成瘾障碍。因此,凝聚素在Pcdh基因座的活性及其失调可能为理解神经发育、神经学和神经精神疾病提供重要见解。
对Pcdh基因调控的基础研究,结合体内发育模型系统的建立,推动了关于凝聚素调控随机Pcdh基因选择的重要概念进展。将凝聚素在染色质上的分子活动与神经生理学联系起来,也削弱了早期关于凝聚素和DNA环挤压在基因表达调控中潜在作用的怀疑。最重要的是,对Pcdh基因表达的研究建立了一个研究凝聚素和基因组架构在基因表达调控中作用的范式。然而,关于随机Pcdh基因选择机制的几个重要问题仍有待解答。例如:什么构成了增强子/启动子相互作用?这些相互作用的动态是怎样的?这些动态在不同神经细胞类型之间如何变化?最后,这些相互作用如何在神经元的整个生命周期中被忠实维持?在具有多个串联排列启动子和少数共享增强子这种复杂架构的基因座背景下研究这些问题,为发现基因组折叠与基因调控、细胞生理学和人类健康相关的新颖且重要的原理提供了独特的机会。