编辑推荐:
Kap家族通过识别不同线性信号(如cNLS、PY-NLS、IK-NLS、RS/E?和RSY-NLS)介导核蛋白运输,研究揭示了各信号与Kap蛋白的相互作用机制,但仍存在多数Kap成员识别信号不明确的问题。
凯西·E·温格|余敏卓
德克萨斯大学西南医学中心药理学系,达拉斯,75390,美国
核质运输依赖于货物多肽中的靶向信号,这些信号通常为短线性基序,但有时也为折叠结构域。这些信号由核转运蛋白-β(Kap)家族的导入蛋白、导出蛋白和双功能蛋白识别。尽管核转运蛋白-β家族成员众多,但只有少数几种线性信号被明确定义:经典的核定位信号(cNLS),由导入蛋白-α(IMPα)识别,后者与IMPβ结合形成IMPα/β异二聚体;运输蛋白-1(TNPO1/Kapβ2)的Pro–Tyr NLS;Kap121/导入蛋白-5的IK-NLS;TNPO3的RS/E?和RSY-NLS;以及导出蛋白-1(XPO1/CRM1)的经典核输出信号(NES)和酵母Msn5的磷酸化NES。本文综述了最近在结构学和生物化学方面的进展,这些进展明确了这些信号及其识别规则,并指出了我们对核转运蛋白-β家族中线性信号理解上的不足之处。
引言
数千种蛋白质通过其多肽链中的信息定位到细胞核或在其内部移动。许多蛋白质依赖短线性核定位信号(NLS)或核输出信号(NES),而其他蛋白质则使用折叠结构域或线性与结构化元素的组合[1]。
核运输由核转运蛋白-β(Kap)家族介导,该家族能够识别这些信号[1]。人类细胞表达20种核转运蛋白-β成员:10种将大分子货物运入细胞核的导入蛋白,5种将货物运出细胞核的导出蛋白,3种将不同货物运入和运出细胞核的双功能蛋白,以及2种尚未完全表征的成员,每种成员都能结合特定的(尽管范围较广的)货物[图1a]。方向性由细胞质中的RanGDP和细胞核中的RanGTP浓度梯度决定。导入蛋白在细胞质中装载货物,并在RanGTP结合时将其释放到细胞核中;而导出蛋白则在细胞质中与RanGTP结合货物,并在Ran催化GTP水解后将其释放[图1b]。
尽管存在多种导入蛋白,但只有五种线性信号被明确定义:经典的核定位信号(cNLS),由导入蛋白-α(IMPα)识别并形成IMPα/β异二聚体;运输蛋白-1(TNPO1/Kapβ2)的Pro–Tyr(PY)NLS;Kap121/导入蛋白-5(IPO5)的Ile–Lys(IK)NLS;以及运输蛋白-3(TNPO3/transportin-SR/SR2)的Arg–Ser(RS)NLS[3]。已知有两种核输出信号(NES):导出蛋白-1(XPO1/CRM1)的疏水性经典NES[4,5],以及酵母Msn5识别的磷酸化NES[6]。
本文总结了最近在结构学和生物化学方面的进展,明确了这些信号及其识别规则,并强调了我们对核转运蛋白-β家族中线性信号理解上的不足之处。
经典导入蛋白-α结合的核定位信号
经典NLS(cNLS)与导入蛋白-α(IMPα)结合,IMPα包含一个自抑制的无序N端IBB结构域,其后是10个armadillo重复序列(ARM结构域),其中包含两个cNLS位点:一个主要位点(ARMs 2–4;P0–P5口袋)和一个次要位点(ARMs 6–8;P0′–P4′)[图2a]。IBB占据主要NLS位点,直到IMPβ结合并隔离IBB,从而释放出主要位点供cNLS结合[8]。IMPβ通常不直接与含有cNLS的货物相互作用。IBB的自抑制强度因不同而异
作为导入蛋白-β结合位点的核定位信号
第一个IBB是在导入蛋白-α(IMPα)中发现的[8];类似的约40个残基组成的碱性IBB也存在于snurportin-1(SPN1)和RIP(RPA相互作用蛋白)中[31,32]。IMPβ的酸性凹陷表面与这些碱性序列互补[33]。IBB在溶液中处于无序状态,但在结合后折叠成特征性的310螺旋结构,随后是一个长的碱性α螺旋[34,35]。它们的相互作用主要由分布式的静电相互作用决定,而不是单一的共识基序运输蛋白-1/运输蛋白-2识别的Pro–Tyr核定位信号
Pro–Tyr(PY)NLS(约15–100个残基)存在于许多RNA结合蛋白中(例如异质核核糖核蛋白(HNRNPs)、融合蛋白FUS以及RPL4),并且必须位于内在无序区域(IDR)内。所有已知的PY-NLS在与TNPO1的凹陷C端表面结合时都采用扩展构象。PY-NLS的定义不是基于严格的共识序列,而是由四个模块化的“表位”组合来调节亲和力[1,36]。表位1是一个N端疏水性基序酵母Kap121和人类导入蛋白-5的Ile–Lys核定位信号
酵母导入蛋白Kap121识别IK-NLS,这是一种紧凑的碱性序列(5–12个残基),具有共识序列K–I/V–X–K–X1–2–K/H/R,其中位置2的Ile/Val和位置4的Lys决定了特异性[50,51]。多个结构显示IK-NLS在Kap121的凹陷表面以扩展构象结合(HEAT重复序列h8–h12)[50, 51, 52]。位置2的Ile/Val占据一个浅疏水口袋P1,而位置4的Lys与一个酸性口袋P2结合(图4a–c)。运输蛋白-3识别的RS/E?和RSY核定位信号
TNPO3可以运输参与剪接、转录延伸和mRNA输出的RS结构域蛋白[54,55]。RS结构域通常是富含RS二肽的长IDR,其中许多RS二肽是磷酸化的[36]。TNPO3还可以运输其他没有典型RS结构域的蛋白质,包括那些具有RE-或R/S/Y丰富基序的蛋白质(图4d)[54,56]。具有替代剪接因子(ASF)/切割和多聚腺苷酸化特异性因子亚基6(SF2, CPSF6)的蛋白质结构
与XPO1/CRM1结合的经典核输出信号
被XPO1识别的经典NES是最明确的输出信号,已有超过400种货物和40种结构被研究[62, 63, 64, 65, 66, 67, 68, 69]。XPO1通过HEAT重复序列h11–h12形成的疏水凹槽结合短(8–15个残基)的NES肽段(P0–P4口袋)(图5a,b)。NES序列和构象差异很大,但依赖于侧链的互补性,从而实现多种构象和双向结合[4]。酵母Msn5识别的磷酸化核输出信号
酵母导出蛋白Msn5通过长磷酸化IDR段运输磷酸化蛋白质[1,6]。最近对磷酸化Pho4(pPho4)与Msn5结合的冷冻电镜结构显示,其机制与XPO1不同[6]。35个残基组成的pPho4 NES沿Msn5的h8-h18区域以曲折路径结合,与HEAT螺旋结构反向平行(图5e,f)。相距约30 ?的两个磷酸丝氨酸作为主要锚点;任何一个都足够,而磷酸模拟物无法实现结合,这表明其结合依赖于特定的氢键未来展望
尽管取得了大量的结构学见解,但许多蛋白质的定位仍然超出已建立的NLS/NES定义,依赖于复合基序、结构化结构域或磷酸化修饰(PTM)激活的信号。大多数已知货物的核转运蛋白-β成员(如IPO4、IPO7、IPO8、IPO9、XPO2、XPO4、XPO7)以及了解较少的RANBP6和RANBP17)缺乏明确的NLS/NES信号,可能识别额外的线性或混合基序。由于IDR中的功能性基序较为稀少,预测核定位信号仍然具有挑战性结论
过去十年的结构和生物化学研究提高了我们对不同核转运蛋白如何与其货物中的线性信号结合的理解。经典的cNLS、PY-NLS、IK-NLS、RS/E?和RSY-NLS以及XPO1和Msn5的NES各自使用一组独特的序列和化学规则与核转运蛋白表面的保守结合位点相互作用。在同一类信号中,序列和构象可能有所不同,它们的亲和力通过核心共识序列的组合进行调节手稿准备过程中使用生成式AI和AI辅助技术的声明
在准备这项工作时,作者使用了ChatGPT来编辑和压缩文本。使用该工具/服务后,作者根据需要审查和编辑了内容,并对发表文章的内容负全责。利益冲突声明
作者声明以下可能被视为潜在利益冲突的财务利益和个人关系:余敏卓报告获得了国家普通医学科学研究所的财务支持;凯西·E·温格报告获得了德克萨斯癌症预防与研究研究所的财务支持。如果还有其他作者,他们声明没有已知的利益冲突致谢
本项工作得到了国立卫生研究院(项目编号R35GM144137(Y.M.C.)、R01HL175985(Y.M.C.)和分子生物物理学培训计划(项目编号T32GM131963(C.E.W.)的资助;国家科学基金会(项目编号NSF-Bio-DFG 2501493(Y.M.C.);Welch基金会(项目编号I-1532(Y.M.C.);CPRIT培训(项目编号RP210041(C.E.W.));以及阿尔弗雷德和梅布尔·吉尔曼分子药理学讲座(Y.M.C.)和尤金·麦克德莫特生物医学研究奖学金(Y.M.C.)的支持。