GGC重复扩增在新型开放阅读框中翻译为毒性多聚甘氨酸蛋白:揭示眼咽远端肌病的发病新机制

《Nature Genetics》:GGC repeat expansions within new open reading frames are translated into toxic polyglycine proteins in oculopharyngodistal myopathy

【字体: 时间:2026年02月28日 来源:Nature Genetics 29

编辑推荐:

  为解决非编码区GGC重复扩增如何致病这一科学难题,研究人员针对导致眼咽远端肌病(OPDM)和伴白质脑病的眼咽肌病(OPML)的GGC重复序列展开研究。他们首次发现这些重复序列位于此前未被识别的微小开放阅读框(smORF)中,可翻译为新型多聚甘氨酸蛋白(polyglycine proteins),并在细胞、果蝇和小鼠模型中证实了该蛋白的毒性。该工作不仅揭示了OPDM/OPML的致病新机制,将此类疾病归为“polyG病”,还为开发靶向治疗(如TMPyP4)提供了希望,论文发表于《Nature Genetics》。

  
在人类基因组中,约有3-6%的序列是被称为微卫星的短串联重复DNA。其中一部分微卫星的异常扩增,是超过60种人类疾病的元凶。然而,一个令人费解的现象是,大多数新近发现的致病性重复扩增,例如导致眼咽远端肌病(Oculopharyngodistal myopathy, OPDM)和伴白质脑病的眼咽肌病(Oculopharyngeal myopathy with leukoencephalopathy, OPML)的GGC重复,都位于基因组中被注释为“非编码”的区域。这些区域传统上被认为不编码蛋白质,那么,一段看似“无用”的DNA序列扩增,是如何引发进行性肌无力和神经系统功能障碍的呢?这成为了领域内亟待解决的核心谜题。
为了揭开谜底,一项发表于《Nature Genetics》的研究应运而生。研究人员怀疑,这些“非编码”序列中可能暗藏玄机。他们的研究目标明确:探索导致OPDM/OPML的GGC重复扩增是否会被翻译成蛋白质,并验证该蛋白质是否具有致病性。
研究者们首先选取了导致OPDM2、OPDM4和OPML的GGC重复所在序列(分别位于GIPC1基因5'非翻译区、RILPL1基因反义转录本和LOC642361长链非编码RNA中)。通过巧妙的实验设计,他们将带有约50个GGC重复的序列以三种可能的阅读框(分别编码甘氨酸、丙氨酸或精氨酸)与绿色荧光蛋白(GFP)融合,并在HEK293细胞中表达。结果清晰显示,只有以甘氨酸阅读框构建的载体能产生强烈的GFP信号,而丙氨酸或精氨酸阅读框则几乎不表达。这强烈提示,GGC重复优先被翻译成多聚甘氨酸。他们进一步用甘氨酰-甘氨酸内切酶(lysostaphin)处理细胞提取物,成功将表达的蛋白切割成更小的产物,确证了其内部含有多聚甘氨酸片段。
那么,翻译是如何起始的呢?通过免疫沉淀-质谱联用技术,研究人员确定了这些多聚甘氨酸蛋白的N端序列。他们发现,翻译始于GGC重复上游的标准起始密码子(ATG)或近起始密码子(如CTG)。敲除这些起始密码子会完全废除蛋白表达。重要的是,当GGC重复为正常长度(约10个)时,翻译产生的是微小且不稳定的多肽;而当重复扩增至约50个或以上时,则生成稳定、可检测的新型多聚甘氨酸蛋白。这些发现揭示了在原本被认为是“非编码”的序列中,隐藏着此前未被识别的微小开放阅读框(smORF),其翻译产物因GGC扩增而变得稳定。研究者将这些新蛋白分别命名为uGIPpolyG(源自GIPC1)、asRILpolyG(源自RILPL1反义链)和LOC6polyG(源自LOC642361)。
为了在患者组织中验证这一发现,研究团队针对每种蛋白独特的N端或C端序列开发了特异性抗体。令人信服的是,在OPDM2、OPDM4、OPML以及由NOTCH2NLC基因GGC扩增导致的OPDM3(该疾病与神经元核内包涵体病NIID共享遗传病因,其蛋白uN2CpolyG此前已被报道)患者的骨骼肌切片中,相应的抗体清晰地标记出了那些该疾病典型的、p62阳性的胞质镶边空泡和核内包涵体。而在非患者对照中,则几乎没有染色信号。这确凿地证明了,在患者体内,GGC重复扩增确实被翻译成了新型的多聚甘氨酸蛋白,并且这些蛋白聚集形成了疾病的病理标志。
既然在患者体内发现了这些蛋白,下一个关键问题是:它们本身是否足以致病?研究人员在多种模型中进行了验证。在分化的LHCN-M2人肌肉细胞中表达这些多聚甘氨酸蛋白,可导致其形成p62阳性的胞质和核内包涵体,与患者组织中的病理特征一致。相关光镜-电镜联用技术显示,这些包涵体是由无膜边界的丝状结构组成的电子致密沉积物。更重要的是,这些蛋白的表达会导致肌肉细胞死亡,且不同蛋白的毒性、定位、半衰期和聚集倾向存在差异,提示其共有的多聚甘氨酸核心的毒性受到了其两侧特有氨基酸序列的调制。
动物实验提供了更强的在体证据。通过重组腺相关病毒(rAAV)将多聚甘氨酸蛋白递送至小鼠骨骼肌或中枢神经系统(CNS),成功地再现了疾病的多个核心特征。在肌肉中,表达这些蛋白会导致进行性肌纤维萎缩、出现内化核,并形成大量p62阳性包涵体。其中,表达asRILpolyG(OPDM4)和LOC6polyG(OPML)的小鼠甚至出现扩张型心肌病并过早死亡。在CNS中,多聚甘氨酸蛋白的表达导致小鼠运动协调能力下降、寿命缩短,脑内出现大量p62阳性包涵体,并伴有神经炎症和小脑浦肯野细胞丢失。这些结果在果蝇模型中也得到了印证。综合来看,这些多聚甘氨酸蛋白的表达足以在细胞和动物模型中重现OPDM/OPML/NIID的关键临床和组织病理学特征,证实了其直接的致病作用。
最后,研究探索了潜在的治疗方向。在筛选了多种化合物后,研究人员发现阳离子卟啉TMPyP4能有效降低细胞中多聚甘氨酸蛋白的聚集和毒性。机制上,TMPyP4可能通过抑制富含GC的微卫星的翻译发挥作用。在果蝇模型中,TMPyP4的喂食能够显著改善由多聚甘氨酸蛋白表达引起的眼小面退化和横纹肌结构破坏。这为开发针对此类疾病的共同疗法带来了希望。
本研究综合利用了分子克隆与质粒构建、细胞转染与模型建立(如LHCN-M2人成肌细胞)、多种蛋白检测技术(包括蛋白质印迹、免疫荧光、免疫沉淀-质谱、点印迹)、动物模型构建(使用重组腺相关病毒rAAV在小鼠肌肉和中枢神经系统进行递送,以及果蝇转基因模型)、组织病理学与成像技术(如免疫组织化学、相关光镜-电镜联用CLEM)、以及高通量测序(如单核RNA测序)等关键实验方法。研究中使用了来自患者(OPDM/OPML/NIID)和健康对照的骨骼肌样本。
结果
GIPC1, 反义RILPL1LOC642361的GGC重复被翻译为多聚甘氨酸
通过将GGC重复序列以不同阅读框与GFP融合并在细胞中表达,结合FACS、荧光显微镜和蛋白质印迹分析,证实GIPC1、反义RILPL1LOC642361的GGC重复优先在甘氨酸阅读框内翻译,产生多聚甘氨酸蛋白,而在丙氨酸或精氨酸阅读框内翻译可忽略不计。甘氨酰-甘氨酸内切酶处理可切割这些蛋白,进一步证实其含有多聚甘氨酸片段。
GIPC1, 反义RILPL1LOC642361的GGC重复位于微小开放阅读框中
通过质谱鉴定多聚甘氨酸-GFP融合蛋白的N端,发现翻译起始于GGC重复上游的典型ATG或近起始密码子(如CTG)。删除这些起始密码子会废除蛋白表达。正常长度的GGC重复(约10个)翻译产生不稳定的小肽,而扩增的重复(约50个)则产生稳定的新型多聚甘氨酸蛋白,证实这些序列中存在此前未识别的smORF。
多聚甘氨酸蛋白与OPDM/OPML肌肉切片中的p62包涵体共定位
使用针对uGIPpolyG、asRILpolyG、LOC6polyG和uN2CpolyG的特异性抗体对患者肌肉切片进行免疫荧光染色,结果显示这些蛋白特异性地位于OPDM2、OPDM4、OPML和OPDM3/NIID患者典型的p62阳性胞质镶边空泡和核内包涵体中,而在对照中无或仅有微弱信号,证实了患者体内多聚甘氨酸蛋白的存在及其与病理包涵体的关联。
多聚甘氨酸蛋白的表达在肌肉细胞中形成包涵体并具有致病性
在分化的LHCN-M2肌肉细胞中表达各种多聚甘氨酸蛋白,可诱导形成p62阳性的胞质和核内包涵体,其超微结构为无膜界的丝状电子致密沉积物。这些蛋白具有细胞毒性,可导致细胞死亡,但不同蛋白在定位、半衰期、聚集性和毒性强度上存在差异,表明其两侧的特有序列调制了核心多聚甘氨酸的生物学特性。
多聚甘氨酸蛋白在小鼠肌肉中形成包涵体并具有致病性
通过rAAV将多聚甘氨酸蛋白递送至小鼠骨骼肌,可导致进行性肌纤维萎缩、出现内化核,并形成大量p62阳性包涵体。不同蛋白的致病性不同,asRILpolyG和LOC6polyG毒性更强,可导致心肌病和过早死亡。单核RNA测序显示模型肌肉中存在炎症和再生迹象。
多聚甘氨酸蛋白在小鼠中枢神经系统中形成包涵体并具有致病性
通过rAAV将多聚甘氨酸蛋白递送至小鼠CNS,可导致运动能力下降、寿命缩短,并在多个脑区形成p62阳性包涵体,伴随神经炎症和小脑浦肯野细胞丢失。包涵体数量与蛋白毒性呈正相关,且随年龄增长而积累。
卟啉TMPyP4减轻多聚甘氨酸蛋白的聚集和毒性
化合物筛选发现阳离子卟啉TMPyP4可降低细胞中多聚甘氨酸蛋白的聚集水平和毒性。在果蝇模型中,TMPyP4处理能够改善由uGIPpolyG和asRILpolyG表达引起的眼结构退化,保护横纹肌结构。
讨论
本研究系统性地阐明,导致OPDM、OPML和NIID的GGC重复扩增,虽然位于注释为非编码的序列中,但实际上隐藏在之前未被认识的微小开放阅读框内。这些ORF可被翻译成新型的多聚甘氨酸蛋白。该工作证实了这些蛋白在患者病理包涵体中的存在,并在细胞、果蝇和小鼠模型中证明了其直接致病性,能够重现疾病的核心特征——包括p62阳性包涵体的形成、肌萎缩和神经变性。这统一解释了这些疾病的发病机制:即“非编码”重复扩增通过“毒性蛋白增益”机制致病。
这一发现具有多重重要意义。首先,它揭示了人类基因组的复杂性和丰富性,挑战了传统“编码/非编码”区域的简单二分法,强调了在“非编码区”中探索smORF及其功能的重要性。其次,该研究将OPDM、OPML、NIID与脆性X相关震颤/共济失调综合征(FXTAS)、脊髓小脑性共济失调4型(SCA4)等疾病联系起来,因为它们都涉及GGC重复扩增翻译为多聚甘氨酸蛋白。这定义了一类新的疾病类别——“多聚甘氨酸病”(polyG diseases),类似于由CAG重复扩增导致的多聚谷氨酰胺病(polyQ diseases)。最后,研究证明不同多聚甘氨酸蛋白的毒性因其两侧序列不同而存在差异,提示疾病临床表现的多样性可能部分源于此。更重要的是,研究筛选出的化合物TMPyP4能在多个模型中减轻毒性,为开发针对此类“多聚甘氨酸病”的广谱疗法提供了概念验证和潜在起点。总之,这项工作不仅破解了OPDM等相关疾病的致病谜题,也为理解更多由“非编码”区微卫星扩增引起的疾病开辟了新的范式。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号