《Briefings in Bioinformatics》:Emerging insights into enhancer RNAs: biogenesis, function, mechanism, and disease implication
编辑推荐:
本刊特约编辑推荐:为系统阐明增强子来源的非编码RNA——增强子RNA(eRNA)在基因精准调控中的核心功能及其疾病关联机制,研究人员聚焦其生物发生、功能特性和分子调控网络开展系统性综述。研究揭示eRNA通过介导增强子-启动子(E-P)环化、招募转录辅激活因子(如p300/CBP)、调控RNA聚合酶II(Pol II)暂停释放等机制,在癌症、心血管疾病和神经退行性疾病中发挥关键作用。该成果为开发eRNA靶向的精准诊疗策略提供了理论依据和技术路径。
在人类基因组中,仅有约2%的DNA序列直接编码蛋白质,其余约98%的非编码区域曾长期被视为“垃圾DNA”。然而,随着研究的深入,科学家发现这些非编码区域蕴藏着大量至关重要的调控元件,其中增强子(enhancer)作为一类关键的远端基因调控元件,在细胞分化、发育及环境应答等生命过程中扮演着决定性角色。更为有趣的是,活跃的增强子本身会被转录,产生一类被称为增强子RNA(enhancer RNAs, eRNAs)的非编码RNA。过去,eRNAs一度被认为是转录过程的副产物,但近年来的研究证据表明,eRNAs绝非“转录噪音”,而是作为活性增强子最可靠的分子标志之一,并积极参与增强子介导的基因调控网络,通过影响染色质构象重塑、转录复合物组装与稳定等多种机制,对下游靶基因的表达进行精细调控。由于eRNAs在基因表达调控中的核心地位,其表达或功能异常已被证实与癌症、神经退行性疾病、自身免疫病等多种人类重大疾病的发生发展密切相关。因此,系统梳理eRNAs研究领域的最新进展,不仅有助于深化对基因转录调控基本规律的认识,也为相关疾病的精准诊断和治疗提供了新的视角和潜在靶点。在此背景下,研究人员在《Briefings in Bioinformatics》上发表了题为“Emerging insights into enhancer RNAs: biogenesis, function, mechanism, and disease implication”的综述文章,系统性地总结了eRNAs研究的最新突破。
为全面描绘eRNAs的研究全景,作者团队综合运用了多种关键技术方法进行文献调研与数据整合。这包括利用染色质构象捕获技术(如Hi-C、Capture Hi-C)解析增强子与启动子的三维空间互作;通过ATAC-seq(测定转座酶可接近的染色质区域)和ChIP-seq(染色质免疫沉淀测序,针对组蛋白修饰如H3K27ac或结合蛋白如p300)在全基因组范围内鉴定活性增强子区域;采用新生RNA测序技术(如GRO-seq/PRO-seq)和BruUV-seq等特异性捕获不稳定、非poly(A)的eRNAs转录本;并结合RNA荧光原位杂交(RNA FISH)、核质分离、RNA免疫共沉淀(RIP)以及功能扰动实验(如CRISPRi、反义寡核苷酸ASOs)等实验手段在细胞模型中进行功能验证与机制探索。此外,研究还广泛利用了公共数据库资源(如GTEx、ENCODE、TCGA)以及近年来开发的多个专注于eRNAs的专用数据库(如eRic、HeRA、eRNAbase等)进行多维数据挖掘与分析。
结构性特征和转录过程
增强子是能够通过与启动子相互作用来提高转录活性的DNA序列。活跃的增强子通常具有独特的表观遗传特征,如富含H3K4me1和H3K27ac组蛋白修饰,并表现出双向转录的特性,产生eRNAs。eRNAs的转录过程是一个高度有序的多步骤事件,始于先锋转录因子(如FOXA1, SOX2)和染色质重塑复合物(如SWI/SNF)协同作用打开染色质,使其从“关闭”状态转变为“开放”状态。随后,转录机制被招募,RNA聚合酶II(Pol II)在中介体(Mediator)复合物的桥接下启动双向转录,产生正义和反义eRNAs链。转录终止由整合子(Integrator)复合物介导,其利用内核糖核酸酶活性切割新生RNA,引发Pol II的终止和释放。新生的eRNAs通常不经过剪接和poly(A)尾巴加尾,但会经历丰富的化学修饰,其中m6A(N6-甲基腺苷)修饰最为常见,由METTL3/METTL14甲基转移酶复合物催化,并与增强子活性正相关。最后,eRNAs的降解主要由RNA外切体(exosome)复合物介导,以防止其过度积累形成有害的R-loop结构,维持基因组稳定性。
功能特性
eRNAs通过多种分子机制精细调控基因转录。首先,eRNAs积极参与增强子-启动子(E-P)环的形成和稳定。它们可以作为分子支架,直接结合黏连蛋白(cohesin)等环化相关蛋白,或通过其序列中富含的Alu重复元件与启动子区域产生的上游反义RNA(uaRNAs)形成RNA双链结构,从而拉近增强子与启动子的空间距离,促进染色质环的形成。其次,eRNAs在空间上 orchestrate 靶基因激活。它们能与中介体(Mediator)复合物结合,促进转录因子激活域(ADs)诱导的液-液相分离(liquid-liquid phase separation),形成转录凝聚体(transcriptional condensates),显著提高E-P区域内局部蛋白浓度,协同促进转录前起始复合物(PIC)的功能组装。第三,eRNAs能够招募并稳定转录因子(TF)的结合。例如,eRNAs与YY1等TF直接结合,形成RNA-蛋白质复合物,延长TF与DNA的相互作用时间,增强其在增强子或启动子区域的占据。第四,eRNAs通过招募组蛋白乙酰转移酶CBP/p300和阅读蛋白BRD4等辅激活因子,催化H3K27ac等组蛋白修饰,促进染色质开放,增强转录活性。第五,eRNAs调控RNA聚合酶II(Pol II)的暂停释放。它们能作为分子诱饵,竞争性结合负性延伸因子(NELF),或激活正性转录延伸因子b(P-TEFb),促进Pol II羧基末端结构域(CTD)Ser2位点的磷酸化(Pol II-Ser2p),从而推动暂停的Pol II向 productive elongation 转变。最后,部分eRNAs(特别是长的lnc-eRNAs)能够形成R-loop结构(RNA:DNA杂交体+ displaced 单链DNA),这种结构在特定情况下(如神经基因Pcdhα的随机表达调控中)有助于稳定三维染色质互作,精确控制基因表达。
识别方法
eRNAs的识别需要综合基因组和转录组两个层面的信息。在基因组层面,活性增强子的特征,如开放的染色质状态(可通过ATAC-seq检测)、特定的组蛋白修饰(如H3K27ac,可通过ChIP-seq检测)以及其与靶基因启动子的空间互作(可通过Hi-C、Capture Hi-C等染色质构象捕获技术揭示),为预测eRNAs来源的增强子区域提供了线索。在转录组层面,eRNAs不具poly(A)尾巴的特性使其可以从总RNA测序数据中筛选出来;而其不稳定性、新生转录的特性则可通过GRO-seq/PRO-seq或BruUV-seq等专门捕获新生RNA的技术进行高分辨率鉴定。实验上,RNA FISH可用于可视化eRNAs的转录位点;核质分离结合RT-qPCR可验证其核内定位;RNA免疫共沉淀(RIP)可鉴定其相互作用的蛋白伙伴;而通过CRISPRi、ASOs等技术进行功能扰动,则可直接验证其调控功能。
eRNAs数据资源
随着eRNAs研究的深入,多个专门的数据库被建立起来,为研究人员提供了宝贵的数据资源和分析工具。例如,HeRA和TCeA专注于构建增强子/超级增强子(SEs)的基因组坐标图和跨组织表达谱;eRNAbase整合多组学数据,提供eRNAs的表观遗传和遗传注释,并支持其介导的通路调控、变异解释等分析;eRic数据库则将eRNAs表达与药物反应数据关联,用于预测癌症的靶向治疗策略;GPIeR平台则利用TCGA等多组学数据,建立eRNAs与患者预后、肿瘤免疫微环境之间的关联模型。这些数据库共同构成了从基础研究到临床转化的eRNAs研究生态系统。
eRNAs与疾病的关系
eRNAs的失调与多种人类疾病的发生发展密切相关。在炎症和免疫疾病中,如幽门螺杆菌感染或炎症性肠病(IBD),eRNAs参与NF-κB等炎症通路的激活,调控IL1A、IL1B、CXCL8等炎症因子基因的表达。在系统性红斑狼疮(SLE)中,eRNA SLEAR的表达降低导致其下游抗凋亡基因BCL2L1转录激活受阻,引发免疫细胞过度凋亡。在癌症中,eRNAs的功能异常尤为突出。例如,在混合谱系白血病(MLL)中,MLL融合蛋白与BRD4形成复合物,异常激活超级增强子相关的长链非编码eRNA SEELA,进而顺式激活致癌基因SERINC2的转录。在前列腺癌中,雄激素受体(AR)抑制了具有肿瘤抑制功能的乳铁蛋白-eRNA(LTFe)的活性,导致其靶基因LTF(编码乳铁蛋白)表达下调,从而产生铁死亡抵抗。在心血管疾病中,如动脉粥样硬化(ASCVD),超级增强子来源的ABCA1-seRNA既能顺式激活ABCA1基因促进胆固醇外流,又能反式促进NF-κB亚基P65的泛素化降解,抑制炎症反应。在心力衰竭(HF)中,心脏特异性eRNA LINC00881的表达下调影响了钙循环和能量代谢相关基因的表达。在神经退行性疾病中,如亨廷顿病(HD),纹状体eRNAs的广泛失调与神经元身份基因的转录异常相关;而在阿尔茨海默病(AD)中,APOE增强子相关的eRNA AANCR通过正反馈环路促进APOE表达,诱导星形胶质细胞向促炎的A1状态转化,加剧神经炎症。
总结与未来展望
本综述系统总结了eRNAs的结构特征、转录过程、功能、调控机制、识别策略、数据资源及其在疾病中的作用。大量证据表明,eRNAs的转录不仅是增强子活性的标志,更通过稳定转录因子结合、促进染色质可及性、调控Pol II暂停释放等多种机制放大基因表达。尽管eRNAs具有低丰度和易降解的特点,但其检测方法在不断演进,多组学组合策略显著提高了鉴定准确性。eRNAs的失调已被证实是多种重大疾病发病机制的关键因素,虽然其在特定背景下已被验证为诊断和预后生物标志物,但其靶向治疗仍主要处于临床前探索阶段。未来研究面临的挑战包括eRNAs实验验证的困难、多组学数据资源与整合分析能力的不足以及临床转化滞后等。通过持续推动技术创新(如开发更高灵敏度的检测方法和功能扰动工具)、大力构建系统化数据资源、深入探究其功能机制以及积极探索其在疾病诊断和治疗中的转化应用,有望逐步揭示eRNAs所主导的更复杂的调控网络,为精准医学开辟新的道路。