《Nature Communications》:A framework for the exploration of subcellular compartmentalization of RNA-binding proteins
编辑推荐:
为阐明RNA结合蛋白(RBPs)在稳态及应激状态下的亚细胞分布、相互作用网络及其在疾病中的作用,研究人员开展了一项整合多组学数据与机器学习的系统性研究。他们构建了“区室化RNA结合蛋白图谱”(coRBP map),系统鉴定了1768个RBPs的亚细胞定位,揭示了其多层次复合物层级,并探索了其在C9ORF72-ALS/FTD相关二肽重复序列及DNA损伤应激下的动态变化。该资源为理解RBPs在生理和病理中的功能提供了新视角。
在微观而精密的细胞宇宙中,RNA结合蛋白扮演着至关重要的角色。它们不仅是信使RNA的“伴侣”,负责其加工、定位、稳定和翻译,更是细胞内各种生物分子复合物的核心组织者,共同维持着生命活动的有序进行。然而,长久以来,科学界对RNA结合蛋白的认识存在一个显著的盲区:我们并不完全清楚这些蛋白质在细胞的哪个具体“房间”(即亚细胞区室)工作,它们又与哪些“同事”(相互作用分子)组成团队,以及这些团队的成员和位置在细胞遇到压力或发生疾病时会发生怎样的变化。传统的生化方法往往将细胞打碎成匀浆,这就像把一栋大楼夷为平地后再清点里面的物品,虽然能得到成分列表,但完全丢失了空间组织和区室特异性的关键信息。这种信息的缺失,严重阻碍了我们深入理解RNA结合蛋白如何通过其精确的时空分布和动态组装来调控复杂的细胞功能,以及它们在诸如神经退行性疾病等病理过程中的具体作用机制。
为了系统性地回答这些问题,并为该领域提供一个强大的探索工具,一个研究团队在《Nature Communications》上发表了一项开创性研究。他们开发了一个名为“区室化RNA结合蛋白质图谱”的创新性框架。这项研究并非仅仅提供一份蛋白质名单,而是构建了一张动态的、多层次的“细胞地图”,它整合了多种实验数据,并利用机器学习的力量,首次全景式地描绘了RNA结合蛋白在细胞内的精细分布格局、相互作用网络及其在应激条件下的适应性变化。
研究人员为开展这项研究,主要运用了几个关键技术方法。首先,他们建立了系统的亚细胞分级分离实验流程,从细胞中分离出包括细胞核、核仁、细胞质、多核糖体、压力颗粒等在内的多种区室组分。其次,他们利用定量质谱蛋白质组学技术,对每个区室中的蛋白质进行大规模鉴定和定量。再者,他们整合了来自公共数据库的多种“组学”数据,包括蛋白质-蛋白质相互作用、RNA-蛋白质相互作用以及基因共表达数据,形成了多模态数据集。最后,他们开发了基于机器学习的计算分析流程,利用随机森林等算法,对已知和推定的RNA结合蛋白进行系统鉴定,并分析其在不同区室间的关联、复合物组成以及在不同扰动条件下的动态变化。研究分析了人类细胞系,并在应激模型中引入了与疾病相关的C9ORF72基因相关的二肽重复序列以及DNA损伤诱导剂。
研究结果
构建亚细胞分辨率的RNA结合蛋白图谱
通过整合亚细胞分级分离蛋白质组学数据和机器学习预测,研究人员成功绘制了coRBP图谱。该图谱包含了1,768个已知和推定的RNA结合蛋白,并详细标注了它们在12个主要亚细胞区室中的分布。分析显示,RNA结合蛋白普遍具有多区室分布的特性,许多蛋白同时在细胞核和细胞质中被检测到,这挑战了传统上对它们功能定位的简单划分,提示其可能参与跨区室的协同调控网络。
揭示RNA结合蛋白的相互作用与复合物层级
利用图谱数据整合蛋白质-蛋白质相互作用网络,研究系统性地勾勒了RNA结合蛋白参与的分子复合物。他们建立了一个从简单二元相互作用到高阶组装体的多层次“复合物层级”。研究发现,许多RNA结合蛋白是大型多功能复合物的核心枢纽,例如剪接体、核糖体、转录相关复合物等。更重要的是,该分析还预测了一些RNA结合蛋白可能参与此前未知的生物学过程,例如细胞周期调控和信号转导,为其功能研究开辟了新方向。
应激条件下RNA结合蛋白复合物与定位的动态重编程
研究进一步探究了在病理相关应激条件下,RNA结合蛋白的“社交网络”和“工作地点”如何变化。他们重点分析了由C9ORF72基因突变(与肌萎缩侧索硬化和额颞叶痴呆相关)产生的二肽重复序列以及DNA损伤剂诱导的细胞应激。结果表明,在这些应激条件下,特定RNA结合蛋白的亚细胞分布发生显著改变,例如向细胞质应激颗粒聚集或从核内特定区域消失。同时,它们所处的蛋白质复合物组成也发生了重排,一些原有的相互作用被破坏,同时形成了新的应激特异性复合物。这些动态变化直接关联到细胞的应激响应通路,并可能参与了神经退行性疾病中异常蛋白聚集和毒性作用的形成机制。
结论与讨论
本研究通过创建coRBP图谱这一综合性资源,将RNA结合蛋白的研究从“成分列表”时代推进到了“空间图谱”和“动态网络”时代。它首次在亚细胞分辨率上系统性地描绘了RNA结合蛋白的分布全景,并揭示了它们通过形成多层次、动态变化的复合物来执行功能的普遍规律。研究所证明的RNA结合蛋白在应激条件下的快速重编程能力,为理解细胞应对内外界刺激的适应性机制提供了分子基础。
尤为重要的是,该研究将基础生物学发现与人类疾病紧密连接。对C9ORF72-ALS/FTD相关二肽重复序列和DNA损伤响应的分析表明,RNA结合蛋白的区室化分布和相互作用网络紊乱可能是多种疾病(尤其是神经退行性疾病)的共同病理特征之一。coRBP图谱不仅为这些发现提供了数据支撑,更作为一个开放的分析框架,允许其他研究者在此基础上提出新的假设、验证已知蛋白的新功能,或探索其他疾病模型和生理过程中RNA结合蛋白的行为。
总之,这项研究超越了传统的单一蛋白或单一区室研究,通过系统性、整合性的方法,为我们理解RNA结合蛋白在细胞空间组织中的核心作用及其在健康与疾病状态下的动态调控建立了新范式。它提供的丰富数据和强大工具,预计将极大地推动RNA生物学、细胞区室化研究以及相关疾病机制和治疗策略的发展。