《Molecular & Cellular Proteomics》:Polysomal profiling coupled to allele-specific proteomics reveals an EIF4H tranSNP allele possessing higher mRNA translation potential.
编辑推荐:
本研究为探索等位基因特异性mRNA翻译的遗传来源,开发了一套整合多聚体谱分析、RNA测序和靶向蛋白质组学的研究策略。研究人员利用HCT116结直肠腺癌细胞系中的杂合多态性,通过比较总RNA和多聚体结合RNA的等位基因分数,筛选出52个与等位基因特异性翻译相关的编码变异,并聚焦于EIF4H基因的罕见错义单核苷酸变异rs1554710467。研究开发了结合无标记鸟枪法分析、高pH反相肽段分馏和同位素标记肽段标准品的靶向平行反应监测(PRM)蛋白质组学工作流程,在蛋白质水平验证了该变异的替代等位基因(H183)表达显著高于参考等位基因(R183),这一结果与RNA-seq数据中多聚体RNA的等位基因失衡一致。这项概念验证研究证明了利用内源性杂合编码变异进行等位基因特异性蛋白质组学分析的可行性,为探索mRNA翻译调控这一相对未被充分挖掘的基因表达层提供了新工具,有助于揭示与疾病相关表型的个体间差异。
基因表达的调控是一个精密而复杂的过程,其中mRNA被翻译成蛋白质是最终执行生命功能的关键步骤。人们早已知道,遗传变异会影响基因的转录水平,即DNA到mRNA的过程。然而,这些变异是否以及如何影响下游的mRNA翻译效率,进而导致蛋白质丰度的个体差异,尤其是在癌症等疾病背景下,仍然是一个相对未被深入探索的领域。传统的转录组学分析可能无法捕捉到这一层面的调控信息,而蛋白质组学分析又常常受限于技术的灵敏度和覆盖度。因此,开发能够直接关联遗传变异、mRNA翻译状态和最终蛋白质产出的综合性研究方法,对于理解基因表达的完整调控网络和疾病发生的分子机制具有重要意义。
为了回答这些问题,由Meriem Hadjer Hamadou、Laura Alunno、Daniele Peroni等人组成的研究团队在《Molecular & Cellular Proteomics》期刊上发表了一项研究。他们建立了一个创新的研究流程,旨在发现并验证那些能够影响mRNA翻译潜力的遗传变异。
研究人员主要运用了几个关键技术方法:首先,利用多聚体谱分析技术分离并结合了多聚核糖体的mRNA,并通过RNA测序(RNA-seq)计算等位基因分数(AF),从而从大量杂合单核苷酸多态性(SNP)和单核苷酸变异(SNV)中筛选出在翻译层面显示出等位基因失衡的候选“tranSNP”。其次,为了在蛋白质水平验证这些候选变异,他们开发了一套蛋白质组学验证方案,该方案结合了无标记鸟枪法蛋白质组学、高pH反相肽段分馏技术,并最终使用同位素标记合成肽段作为内标,通过靶向平行反应监测(PRM)质谱技术,对源自不同等位基因的特定肽段进行精确定量和比较。研究的模型体系来源于人结直肠腺癌细胞系HCT116。
结果
利用全裂解液定量蛋白质组学验证HCT116细胞中的错义tranSNP
研究人员通过对HCT116细胞的总细胞质和多聚体结合mRNA进行RNA-seq分析,并应用前期开发的筛选流程,从1753个杂合SNP/细胞系/条件组合中,鉴定出52个独特的SNP/SNV与等位基因特异性翻译相关,其中16个为错义tranSNP。随后,他们尝试使用无标记鸟枪法蛋白质组学来定量由两个等位基因表达的蛋白质相对水平。尽管在16个含有错义tranSNP的蛋白质中检测到了14个,但仅对其中三个蛋白质(EIF4H、RPA1、RBM17)成功检测到了包含变异位点的肽段。通过凝胶富集目标蛋白再进行鸟枪法分析,他们发现EIF4H蛋白中对应于替代等位基因(ALT, H183)的肽段丰度显著高于参考等位基因(REF, R183)的肽段,这与RNA-seq数据中观察到的趋势一致。
rs1554710467常见于两个表达量不均等但翻译效率重叠的EIF4H转录本异构体
rs1554710467是一个罕见变异,位于EIF4H基因第6外显子,该外显子为两个主要的可编码剪接异构体(201和202)所共有。定量PCR和蛋白质印迹分析均显示,跳过第5外显子的202异构体表达量显著高于201异构体。通过蔗糖梯度密度离心分离核糖体复合物,并结合异构体特异性qPCR分析,研究人员发现这两个异构体具有等同的翻译效率。生物信息学工具预测该SNV对mRNA结构或翻译效率的影响不明显。
rs1554710467是EIF4H基因中一个与蛋白质等位基因变异差异相关的编码tranSNP
为了更精确地定量两个等位基因的肽段,研究人员采用了靶向蛋白质组学方法。他们将重同位素标记的合成参考肽和替代肽(“重肽”)作为内标,加入到消化的样品中,通过计算内源性“轻肽”与对应“重肽”的比率来估算肽段等位基因分数。该分析再次确认,在总蛋白提取物或经凝胶富集的样品中,源自rs1554710467替代等位基因的肽段丰度均显著高于参考等位基因肽段,且差异幅度甚至大于多聚体谱RNA-seq所测量的结果。同时,该方法也成功验证了低丰度蛋白RPA1中另一个错义tranSNP(rs5030755)的等位基因失衡。
rs1554710467变异不影响EIF4H蛋白半衰期或其亚多聚体定位
为了排除氨基酸替换(R183H)可能通过影响蛋白质稳定性而导致丰度差异,研究人员进行了环己酰亚胺(CHX)追踪实验,测得EIF4H蛋白的半衰期约为8小时。对CHX处理0小时和8小时(即半衰期时间点)的样品进行靶向蛋白质组学分析,结果显示两个等位基因肽段的失衡比例保持恒定,表明两个等位基因编码的蛋白质具有相似的稳定性。此外,通过蔗糖梯度离心分离细胞质提取物中的核糖核蛋白(RNP)和核糖体亚基,蛋白质印迹显示EIF4H蛋白主要定位于RNP和40S亚基组分。从这些组分中回收蛋白质进行靶向质谱分析,同样检测到了显著的等位基因失衡,表明R183H变异并未改变EIF4H蛋白的亚细胞定位。
rs1554710467替代等位基因在核糖体滞留实验中显示出更高的翻译效率
为了直接探究该氨基酸变化是否影响翻译过程,研究人员构建了双荧光报告系统。他们将包含参考或替代等位基因的EIF4H外显子6片段(33个氨基酸)或完整的EIF4H cDNA(两个异构体)克隆到GFP和mCherry报告基因之间,两侧由P2A肽序列连接。通过测量mCherry与GFP的荧光比值,可以评估插入序列的翻译效率。实验结果表明,与阴性对照(SEC61B序列)和参考等位基因相比,含有替代等位基因的EIF4H外显子6片段能产生显著更高的mCherry/GFP比值,提示其翻译效率更高。对于完整的202异构体(跳过外显子5),也观察到了类似但稍弱的趋势。
结论与讨论
本研究成功建立并验证了一种整合多聚体谱分析、转录组学和等位基因特异性靶向蛋白质组学的研究策略,用于发现和验证影响mRNA翻译潜力的错义遗传变异。研究人员利用HCT116细胞系内源表达的杂合SNP/SNV,通过比较其多聚体RNA与总RNA的等位基因分数变化,高效地筛选出候选tranSNP。尽管全局蛋白质组学方法在检测变异肽段方面存在灵敏度限制,但通过结合肽段分馏、凝胶富集和靶向PRM分析(特别是使用同位素标记内标),研究团队实现了对特定等位基因肽段的精确定量。
以EIF4H基因的rs1554710467变异为概念验证案例,研究提供了从mRNA到蛋白质的多层次证据:1)RNA-seq显示该变异的替代等位基因在多聚体RNA中过度呈现;2)靶向蛋白质组学证实编码H183的肽段丰度显著高于编码R183的肽段;3)双荧光报告基因实验证明替代等位基因序列具有更高的翻译潜能。此外,研究排除了蛋白质稳定性差异和亚细胞定位改变作为导致失衡的主要原因。EIF4H是参与翻译起始的RNA解旋酶,在某些癌症中被认为具有致癌功能。因此,该变异导致的翻译效率提升可能为细胞生长带来优势。
这项研究的意义在于,它拓展了研究基因表达调控,特别是mRNA翻译层面个体遗传差异的工具箱。传统上,识别影响翻译的遗传因素颇具挑战性。本研究展示的方法提供了一条可行的路径:首先利用易获取的转录组和翻译组数据(RNA-seq)进行高效筛查,再使用靶向蛋白质组学进行精准验证。尽管目前的方法更适用于研究高丰度蛋白,且需要内源性杂合变异的条件,但它为在更接近生理条件的背景下,探究遗传变异如何通过调控翻译效率来影响蛋白质表达和最终表型提供了有力的框架。未来,结合更深度测序、使用多种蛋白酶以及构建等位基因特异的同基因型细胞系,将能进一步推动这一领域的发展,揭示mRNA翻译调控在复杂疾病和个体差异中的重要作用。