编辑推荐:
本综述全面梳理了后生动物硒蛋白的研究进展,从核心分子硒代半胱氨酸(Sec)独特的生物合成与共翻译插入机制切入,系统阐释了SECIS元件、SECISBP2、EEFSEC等关键因子构成的精密调控网络,并揭示了其与NMD等细胞通路的复杂互作。文章进一步从宏观演化视角,通过生物信息学工具追踪了硒蛋白组在动物界的多样化动态,包括基因重复、丢失及Sec与Cys的相互替换,特别是在昆虫和线虫中发生的多次独立的硒利用“灭绝”事件。最后,文章详细盘点并总结了迄今已知的各硒蛋白家族(如GPXs、TrxRs、DIOs、SELENOP等)的结构、功能与系统发育分布,为理解硒在动物氧化还原稳态、甲状腺激素代谢及应激响应中的关键作用提供了全景式视野。
硒代半胱氨酸的生物学
硒蛋白是一类特殊的蛋白质,其独特之处在于掺入了第21种蛋白原性氨基酸——硒代半胱氨酸(Sec)。Sec在化学结构上类似于半胱氨酸(Cys),只是用硒(Se)原子取代了硫原子。Sec的插入并非遵循标准遗传密码,而是通过一套复杂的“重编码”机制,将通常作为终止信号的UGA密码子重新定义为Sec的编码子。这一过程在真核生物中依赖于位于硒蛋白mRNA 3‘非翻译区(UTR)的一个称为Sec插入序列(SECIS)的RNA基序。
Sec的生物合成
在真核生物中,Sec的合成直接在其专用的转移RNA——tRNASec上进行,这是一个三步途径。首先,丝氨酰-tRNA合成酶(SARS)将丝氨酸(Ser)加载到tRNASec上,形成Ser-tRNASec。随后,磷酸丝氨酰-tRNA激酶(PSTK)将其磷酸化,生成O-磷酰丝氨酸-tRNASec。最后,Sec合成酶(SEPSECS)催化形成Sec-tRNASec,其中关键的硒供体是硒磷酸,由硒磷酸合成酶2(SEPHS2)合成,而SEPHS2本身在大多数后生动物中就是一个硒蛋白。
tRNASec的结构独特性
tRNASec在结构和功能上都与经典tRNA不同。它具有独特的9/4二级结构(受体茎9个碱基对,T茎4个),而非经典的7/5结构。其反密码子中携带罕见的mcm5Um修饰,该修饰水平受氧化状态和硒供应的影响,并有助于区分组成型(如TRXR1)和应激诱导型(如GPX1)硒蛋白的翻译,实现硒依赖的层级调控。
Sec插入硒蛋白的机制
Sec的共翻译插入发生在UGA密码子处,涉及Sec特异性的核糖体延伸机制。其特异性由SECIS元件保证,该元件被SECIS结合蛋白2(SECISBP2)识别,后者进而招募与带电Sec-tRNASec结合的Sec特异性延伸因子EEFSEC。Sec插入与UGA处的翻译终止相竞争,因此效率通常较低(约10-25%),这成为硒蛋白表达的一个关键限速和调控环节。
SECIS元件
真核生物的SECIS元件位于硒蛋白mRNA的3‘UTR,具有茎-环-茎结构,分为I型和II型。大多数硒蛋白含有一个Sec和一个SECIS,但硒转运蛋白SELENOP是一个关键例外,它含有多个Sec残基(如人类有10个),由两个SECIS元件支持。SECIS元件在不同物种甚至不同硒蛋白间进化迅速,在非脊椎动物中,预测工具有时会失效,表明其序列和结构具有多样性。
SECIS结合蛋白2(SECISBP2)
SECISBP2是将Sec插入限制在硒蛋白mRNA上的关键因子。其C端RNA结合域(RBD)和相邻的富含赖氨酸的Sec插入域(SID)对于结合SECIS和招募EEFSEC-tRNASec复合物至关重要。脊椎动物拥有一个旁系同源基因SECISBP2L,其功能尚不完全清楚,但在斑马鱼中,同时敲除两个基因会完全废除硒蛋白合成。许多失去Sec合成能力的昆虫,其SECISBP2基因也一同丢失,但在蜜蜂和某些果蝇中得以保留,提示其可能具有不依赖于Sec的功能。
EEFSEC与核质穿梭
EEFSEC是Sec特异性的翻译GTP酶,负责将Sec-tRNASec递送至核糖体A位。它与SECISBP2一样,能在细胞核与细胞质之间穿梭,这可能与在细胞核内组装Sec特异性的核糖核蛋白复合物以调控无义介导的降解(NMD)有关。一些蛋白如真核起始因子4a3(EIF4A3)和核仁素可与SECIS竞争性或协同性结合,参与翻译调控。
硒蛋白与无义介导的降解(NMD)
由于UGA密码子的双重性,在Sec位点发生的翻译终止可能触发NMD途径。大约一半的哺乳动物硒蛋白因其基因结构而被预测为NMD敏感型。研究表明,NMD是硒蛋白合成层级调控的关键机制,在低硒条件下优先降解某些硒蛋白(如GPX1, SELENOP)的mRNA,而看家型硒蛋白则具有NMD抗性结构。GPX4是个例外,其高效的Sec重编码可能阻止了终止事件。
非特异性硒蛋白与非Sec硒蛋白
除了经典的Sec途径,硒也可能通过化学相似性非特异性地进入硫代谢途径,导致硒代甲硫氨酸或Sec误载到甲硫氨酰或半胱氨酰-tRNA上,从而掺入蛋白质。相反,硫也可以进入Sec途径,在硒缺乏时,SEPHS2可能使用硫化物合成Cys-tRNASec,导致Cys在UGA位点的掺入。
硒代谢与Sec循环
硒代谢受到严格调控,以平衡膳食摄取、利用和排泄。硒蛋白SELENOP作为硒的转运蛋白,将硒以Sec形式输送至外周组织。Sec-containing蛋白降解后释放的游离Sec不能被直接再利用,而是被Sec裂解酶降解为硒化物和丙氨酸,实现硒的循环或排泄。
硒蛋白组演化
硒蛋白生物信息学
UGA密码子的双重解读使得硒蛋白的比较基因组学研究复杂化,标准生物信息学工具和公共数据库常存在注释错误。因此,发展出了如Secmarker、Selenoprofiles、SECISearch3、SelGenAmic等专门工具,用于可靠地鉴定tRNASec、注释已知硒蛋白家族、预测SECIS以及进行不依赖同源性的从头预测。
硒蛋白的演化动力学
后生动物的硒蛋白组在不同物种间差异巨大,从完全缺失到超过70个基因。其演化涉及基因复制、从头产生、丢失以及Sec与Cys之间的独特转换。脊椎动物,特别是辐鳍鱼类,拥有较大的硒蛋白组(多达55个硒蛋白,20个家族),而四足动物则经历了多次Sec向Cys的转换。一个普遍趋势是,水生环境的生物倾向于拥有比陆生环境更大的硒蛋白组,这可能与硒生物利用度的差异有关。
为什么是Sec而非Cys?
尽管Sec的生物合成复杂且依赖微量元素,但其在催化性能上可能优于Cys。Sec的硒醇盐比Cys的硫醇盐酸性更强、亲核性更高、氧化还原电位更低,并能耐受超价态,这些特性可能增强催化效率。另一种假说强调化学恢复力:Cys残基可能被不可逆地过氧化,而含Sec的酶通常可以通过形成可逆的保护性中间体从氧化损伤中恢复。
昆虫和线虫中的Sec“灭绝”
硒利用在后生动物中发生了多次独立的完全丧失,即“Sec灭绝”。在昆虫中,除了果蝇等少数物种保留少量(如果蝇有3个)硒蛋白外,大多数昆虫(如蜜蜂、甲虫、蚕)完全丧失了合成硒蛋白的能力,相关的Sec machinery基因也一并丢失。线虫中,秀丽隐杆线虫仅保留一个硒蛋白TRXR1,而一些植物寄生线虫则完全丧失了硒利用能力。这些重复的丧失事件表明,在这些谱系中,Sec相对于Cys的选择优势已经减弱或消失,这与相关突变体缺乏明显表型的现象一致。
后生动物硒蛋白家族
谷胱甘肽过氧化物酶(GPXs)
GPXs是后生动物中最大的硒蛋白家族,负责还原过氧化氢和有机氢过氧化物,是抗氧化防御的核心。人类有8个GPX同源物,其中5个是硒蛋白(GPX1, 2, 3, 4, 6)。GPX4独特地靶向膜脂氢过氧化物,在防止脂质过氧化和铁死亡中起关键作用。GPX在动物界中广泛存在,在硒蛋白组缩减的谱系中,Sec-GPX基因被转换为Cys同源物。
硫氧还蛋白还原酶(TrxRs)
TrxR与NADPH和硫氧还蛋白(Trx)构成Trx系统,是维持细胞氧化还原平衡的核心网络。动物的高分子量TrxR是硒蛋白,其C端延伸含有一个GCUG催化基序(U代表Sec)。哺乳动物有三个Sec-TrxR基因:胞质TRXR1、线粒体TRXR2和睾丸特异性的Trx谷胱甘肽还原酶(TGR, TRXR3)。TrxR基因在动物界中几乎普遍存在,且多为Sec-containing。昆虫和线虫是主要例外,其TrxR多为Cys形式。
碘甲腺原氨酸脱碘酶(DIOs)
DIOs是调节甲状腺激素激活与失活的Trx折叠酶,对代谢、发育和稳态至关重要。脊椎动物有DIO1、DIO2、DIO3三个硒蛋白。DIO家族非常古老,在动物中广泛存在,但在一些蜕皮动物(如线虫、果蝇)中丢失。最近的系统发育分析表明,许多非脊椎动物中的“DIO-like”基因可能并非真正的脱碘酶,其功能多样性仍有待探索。
甲硫氨酸亚砜还原酶(Msrs)
Msrs催化氧化甲硫氨酸(Met-O)的还原。MsrA修复Met-S-O,MsrB修复Met-R-O。Sec-containing的MsrA和MsrB(即MSRB1)在多种动物中被发现,但在脊椎动物和昆虫中,MsrA仅为Cys形式,而MSRB1在脊椎动物中为Sec形式,并进化出Cys同源物MSRB2和MSRB3。
硒磷酸合成酶(SEPHS2)
SEPHS2催化硒磷酸的合成,这是硒蛋白生物合成的关键步骤。它在所有利用Sec的动物中均存在,且通常是硒蛋白。许多动物还有旁系同源基因SEPHS1,其催化位点发生改变,失去了合成硒磷酸的活性,转而参与抗氧化防御的转录调控,是趋同进化的一个例子。
SELENOP:硒转运蛋白
SELENOP以其多Sec结构在硒蛋白中独树一帜,是体内硒分布的主要载体。其N端有一个Trx折叠域(含一个Sec),C端尾含有多个Sec-rich重复序列,用于储存和运输硒。不同动物SELENOP的Sec数量差异极大,从几个到上百个(如淡水蚌有132个),其数量与物种的硒蛋白组大小相关。多Sec的合成依赖于其两个SECIS元件的分工协作以及Sec重定义元件(SRE)的辅助,以“进行性”机制高效完成。
内质网驻留硒蛋白
包括SELENOK、SELENOS、SELENOF、SELENOM、SELENOI、SELENON、SELENOT等在内的多个硒蛋白定位于内质网(ER),参与蛋白质折叠、脂质合成、钙信号传导和ER相关降解等过程。它们大多具有Trx-like折叠或跨膜结构,在ER稳态中发挥重要作用。这些蛋白在动物中广泛保守,通常在Sec利用能力丧失的谱系中被转换为Cys或丢失。
SELENOO:催化蛋白质AMP化的伪激酶
SELENOO是一个定位于线粒体的大型硒蛋白伪激酶,具有AMP转移酶活性,可对底物蛋白进行AMP化修饰,参与氧化应激响应和线粒体完整性维持。该家族在生命体中广泛存在,Sec形式见于部分原生生物和大多数后生动物。
SELENOW和SELENOV
SELENOW是一个Trx折叠的氧化还原酶,与14-3-3蛋白互作,参与细胞信号传导、骨代谢和神经保护等过程。它在动物界分布广泛。SELENOV是胎盘哺乳动物中出现的与SELENW相关的硒蛋白,主要在睾丸中表达,功能尚不完全明确。
SELENOH
SELENOH是已知唯一靶向核仁的硒蛋白,具有Trx-like结构域和AT-hook DNA结合基序。它在氧化应激感知、抗氧化基因上调以及维持基因组稳定性中发挥作用,几乎普遍存在于后生动物中。