《Current Opinion in Structural Biology》:Amyloid fibril polymorphism: Structural mechanisms of assembly and the links to disease
编辑推荐:
本文系统探讨了淀粉样蛋白原纤维的多态性,这一特性使单一蛋白序列可形成多种不同结构,并构成了阿尔茨海默病、帕金森病等多种神经退行性疾病的重要病理基础。文章整合了冷冻电镜等前沿技术所揭示的结构多样性,深入分析了多态性的结构基础、热力学起源、动力学影响因素及其与疾病表现和进展的内在联系,尤其强调了淀粉样蛋白能量景观的复杂性以及特定生理环境与辅助因子对多态性的“选择”或“导向”作用。文末展望了未来在结构预测、机制解析及干预策略方面的挑战与方向。
引言
淀粉样蛋白原纤维是由超过40种不同疾病相关蛋白质组装而成的有序蛋白质聚集体,与阿尔茨海默病(AD)、帕金森病(PD)、亨廷顿病、2型糖尿病、朊病毒病及系统性淀粉样变性等多种破坏性疾病密切相关。尽管来源各异,它们共享一个共同的结构框架,即交叉β折叠(cross-β amyloid fold)。针对淀粉样蛋白形成的治疗策略展现出潜力,但“多态性”——即单一蛋白序列能够形成多种不同结构的原纤维的能力——构成了结构导向药物设计和疾病机理理解的重大挑战。近期,冷冻电子显微镜技术的突破推动了大量淀粉样蛋白近原子分辨率结构的解析,使得我们能够分析大型数据集,以理解这种多样性并揭示其背后的热力学和动力学起源。
淀粉样蛋白折叠
淀粉样蛋白原纤维的核心特征是其交叉β结构,其命名源于X射线衍射图谱中在4.7-4.8 ?和8-11 ?处的正交反射。从结构上看,这源于沿原纤维轴延伸的连续分子间β-折叠的存在。一个典型的淀粉样蛋白原纤维由成千上万个堆叠的单体亚基层组成,这些层共同构成了这些β-折叠片层()。
原纤维的层次化结构包括:单体堆叠形成原丝,每个原丝含有一个或多个连续的分子间β-折叠片层;随后,多个原丝横向结合形成完整的原纤维。通常,构成亚基具有扁平结构,这优化了其在堆叠中与上下亚基形成氢键的能力,并允许其每个β-链参与到不同的、带状分子间β-折叠中。这些分子间β-折叠片层伴随着沿原纤维轴方向形成的巨大、重复的氢键网络。研究表明,淀粉样蛋白原纤维中的氢键对其稳定性的贡献可能超过对球状蛋白的贡献。密度泛函理论计算显示,重复堆叠的骨架或侧链氢键基团之间的相互作用会诱导其电子密度的协同极化,从而赋予淀粉样蛋白原纤维异常强健的氢键。
此外,互补相互作用进一步稳定了原纤维结构。这些相互作用在原纤维结构中无处不在,包括侧链-侧链相互作用(特别是π-堆积和酰胺侧链氢键)以及由疏水效应或相反电荷残基间盐桥形成驱动的正交方向作用力。由于其重复结构,这些支持性相互作用通常以“拉链样”阵列的形式出现,最常见的是“空间拉链”(优化范德华接触)和“极性拉链”(通过盐桥或氢键连接)。淀粉样蛋白核心的有序结构通常不包括整个蛋白质序列,许多原纤维还具有由数十至数百个残基长度的无序侧翼区域构成的“模糊涂层”。
淀粉样蛋白多态性:一种序列,多种结构
与球状蛋白折叠不同,单一蛋白质序列在淀粉样状态下通常可以形成多种不同的结构,这种现象被称为多态性。多态性可体现在原纤维结构层次的各个层面()。多态性存在于所有类型的淀粉样蛋白原纤维中,无论是病理性的、功能性的还是体外组装的。对于Tau或α-突触核蛋白等某些疾病相关蛋白,在不同个体中观察到的淀粉样折叠似乎是疾病特异性的,不同的原纤维结构与特定的临床表现相关。然而,淀粉样蛋白β(Aβ)和转甲状腺素蛋白等蛋白质则可在同一疾病、同一患者甚至同一组织中形成不同的原纤维结构。体外组装时,即使在密切相关或相同的溶液条件下,单个蛋白序列也常会产生一系列不同的结构,这提示多肽具有形成不同原纤维结构的内在能力,而生理环境的特定特征选择并“锁定”了特定的淀粉样折叠。
不同的相互作用区域产生多样化的淀粉样折叠“字母表”
多态性可能涉及相同原丝折叠的不同堆积排列方式(例如Tau的配对螺旋丝和直丝),也可能涉及具有相似折叠的原丝数量的差异(例如β2-微球蛋白),或者由相同序列构成的不同折叠的原丝(例如α-突触核蛋白)。在胰岛淀粉样多肽的情况下,多态性涉及不同数量和组合的独特原丝折叠,导致结构呈现出字母表式的分类。有趣的是,具有不同折叠的原丝可能共享共同的结构单元,例如野生型IAPP的S型和U型原丝折叠中相同的β-拱形基序,或在许多Aβ(1-42)原丝结构核心中发现的S形内核。
随着超过700个淀粉样蛋白结构被解析至近原子分辨率,淀粉样蛋白原纤维多态体的结构现在可以被分类到不同的拓扑组中,类似于用于球状蛋白的CATH和SCOP数据库。这些研究表明,原纤维多态体可以根据亚原丝水平的相似性,被组织成定义明确、有意义的折叠家族。同一个折叠家族中可能包含不同条件下或不同突变体形成的多态体,而另一些则在看似微小的溶液条件变化下形成截然不同的结构。
理解驱动淀粉样蛋白形成的序列区域可能是理解不同原丝折叠如何构建的关键。大多数蛋白质都含有驱动聚集的区域,称为聚集倾向区。APRs具有高β-折叠倾向性、富含芳香族、酰胺和疏水侧链等共同特性,并且通常被纳入原纤维核心。然而,一个单一的APR可能在不同原纤维多态体的核心中采用不同的结构。研究表明,Tau和α-突触核蛋白序列中存在明确定义的稳定区域,这些区域通常在不同多态体中为原纤维的自由能做出有利贡献()。有趣的是,这些研究发现不同的折叠家族具有其核心内稳定区域之间独特的、特征性的相互作用模式。
淀粉样蛋白多态体的能量景观
支持淀粉样蛋白原纤维结构的相互作用的固有混杂性,为构建能量相似的原纤维折叠提供了多种方式,从而导致了多态性。这种混杂性可能源于淀粉样蛋白原纤维与球状蛋白相比的独特组织方式。给定原纤维亚基的扁平结构将折叠限制在近似二维的接触搜索中,因此,肽骨架的微小偏差可能允许单个稳定区域与一系列其他序列配对。潜在可达到的原纤维拓扑结构数量是组合爆炸式的。巨大的可能结构数量及其在构象空间中能量最小值之间的巨大距离表明,淀粉样蛋白组装的能量景观是复杂、高度崎岖且难以导航的。有观点指出,淀粉样蛋白多态性的能量景观与玻璃的能量景观之间具有相似性,其众多可比较的最小值导致了持久的、动力学被捕获的非平衡态。
淀粉样蛋白多态性随时间变化
淀粉样蛋白组装能量景观的复杂性意味着蛋白质需要时间才能完全在其中探索,而多态性可能取决于观察时间和原纤维形成的机制()。早期研究就显示,在体外静置条件下,Aβ(1-40)会形成一种亚稳态的淀粉样蛋白多态体,随后在平台期被更稳定的多态体所取代。近期的研究为多态性随时间演变提供了高分辨率的见解。例如,利用时间分辨冷冻电镜追踪了IAPP S20G(一种与疾病相关、更具聚集倾向的变异体)的自组装过程。令人惊讶的是,在滞后期就观察到了少量原纤维,随着时间推进,扭曲的原纤维变得更加丰富,并且出现了不同的L谱系和C谱系原纤维折叠。L和C谱系由于外周原丝数量的差异而表现出进一步的多态性,并且随着平台期的到来,原丝的平均数量随时间增加。类似地,另一项研究追踪了在不同缓冲液中Tau原纤维多态性的进展,这些缓冲液最终分别导致AD或慢性创伤性脑病折叠。他们观察到表观扭曲和折叠复杂性随时间增加,并在两种条件下均发现了一个共享的中间体,即首个含有交叉β结构的第一中间体淀粉样蛋白。
多态体如何形成和在组装过程中重组尚不完全清楚,涉及多种机制,包括初次成核、在已有原纤维表面的二次成核、保留足够结构灵活性的早期多态体之间的直接构象转换,以及延伸过程中的模板复制错误。一旦形成,这些多态体将在动力学上竞争单体用于生长,并且通过延伸和二次成核(或断裂)自我复制最快的多态体可能占据主导。当单体浓度接近溶解度极限时,动力学竞争预计会让位于热力学竞争。尽管淀粉样蛋白原纤维非常稳定,但它们与溶液中的单体存在缓慢的动态平衡,并且如果单体水平降至某一临界浓度以下,它们会发生净解聚。随着平台期单体浓度逐渐下降,最不稳定的多态体将开始解聚,释放出的单体会重新分配到更稳定的原纤维中,直到所有单体都被整合到最稳定的原纤维多态体中,达到真正的单体-原纤维平衡。
多态性:受动力学控制还是热力学控制?
除了热力学稳定性外,体内活跃的生理过程可能施加额外的选择压力。与体外形成的原纤维相比,来源于患者的Aβ、血清淀粉样蛋白A、抗体轻链和转甲状腺素蛋白形成的淀粉样蛋白原纤维表现出更强的蛋白酶抗性,这表明只有最具蛋白酶抗性的“菌株”才能在体内持续存在。原纤维核心结构和暴露的模糊涂层的差异也可能影响分子伴侣的解聚作用。
动力学也可以在平台期深处留下持久的印记,从而影响最终的多态性。研究表明,两种抑制剂(YX-I-1和坎格列净)深刻地影响了IAPP在纤维生长末期形成的原纤维多态体。这两种化合物都不是通过简单地稳定另一种原纤维多态体来实现这一点的,而是通过干扰决定原纤维结构的早期步骤。我们因此提出“动力学导向”这一术语,来描述一种持久的多态性变化,其起源完全或部分是动力学的,而不仅仅是涉及差异性的稳定化。关键在于,多态性变化能够持续到平台期深处,这表明在没有抑制剂时形成的原纤维结构要么不存在,要么无法在热力学上胜过改变后的多态体。因此,动力学调节剂可以通过过滤最初形成的多态体“调色板”,并对随后发挥作用的热力学选择产生影响,从而对多态性施加长期影响。从原理上讲,动力学导向也可能在体内发挥作用,我们的结果表明,小分子与蛋白质之间即使微弱、短暂的相互作用,也可能随着聚集的进展演变为持续性的相互作用,最终对原纤维结构产生深远影响。这提示生理环境中存在的药物、代谢物或其他生物分子的相互作用,可能会深刻地影响所观察到的淀粉样蛋白原纤维的动力学演变和结构。
总结与展望
近期高分辨率淀粉样蛋白结构的激增、计算方法的进步以及机制数据的积累,推动了对原纤维多态性的理解取得了重大进展。尽管如此,一些基本问题仍然存在。
首先,决定序列区域配对和选择特定淀粉样折叠的规则尚未被理解。填补这一空白将需要新的动力学和结构分析来绘制序列区域如何配对以构建原纤维折叠,以及通过突变、序列修饰或添加辅助因子来改变折叠拓扑结构的靶向实验。一旦建立了一套原理,原纤维结构预测将为我们理解的有效性提供关键检验。目前,像AlphaFold这样的先进蛋白质结构预测工具尚无法重现观察到的原纤维结构或其多态体,这表明使用多序列比对来寻找未经进化塑造的结构并不合适,而淀粉样蛋白组装能量景观的复杂性将需要不同的计算导航方法。尽管如此,机器学习在淀粉样蛋白结构预测方面前景广阔,基于深度突变扫描数据训练的模型已经能够准确预测稳定淀粉样核心或促进向纤维状态转换的序列区域。尽管取得了这些进展,原纤维折叠预测仍处于起步阶段,对多态性的准确预测可能需要能够探索具有众多可比最小值的广泛构象景观的方法。
其次,我们迫切需要更好地理解在体内塑造淀粉样蛋白多态性的动态机制,例如热力学选择、动力学效应以及分子伴侣或蛋白酶的降解作用,以及这些如何与不同疾病状态下的细胞类型易感性相关联。这将需要将高分辨率的离体结构数据与高通量技术相结合,这些技术能够快速、准确、可解释地检测多态性的差异,并可用于动力学或机制研究。此外,生物物理和计算分析将需要阐明这些过程的热力学驱动因素和机制基础,而原位原纤维结构测定将在机制和病理学之间提供强有力的联系。更好地理解塑造淀粉样蛋白原纤维结构演变的机制,对于解释这些破坏性蛋白质折叠疾病中如何发生毒性,以及启发新一代淀粉样蛋白生物标志物和治疗策略至关重要。