《Nature Communications》:Origins and breadth of pairwise epistasis in an α-helix of β-lactamase TEM-1
编辑推荐:
蛋白质突变效应常受遗传背景影响,即上位性,这对进化与功能预测至关重要但其机制不明。本研究针对TEM-1 β-内酰胺酶的一个11残基α螺旋,构建了超过14,000个双突变体库。通过适应性(fitness)和最低抑菌浓度(MIC)两种度量,揭示了广泛且一致的上位性。一个非线性的两态蛋白质稳定性模型能够很大程度上解释这些数据,表明多数上位效应可由单突变效应预测。然而,当两个突变残基在三维结构中直接相互作用时,会出现系统性偏离模型的现象。此外,基于远缘同源序列训练的统计模型可部分复现观测到的上位性相互作用。这些发现阐明了塑造β-内酰胺酶长时程进化轨迹的上位性景观的多种决定因素。
在生命演化的宏伟剧本中,蛋白质如同精密的分子机器,其功能由氨基酸序列决定。然而,生命体并非简单的零件组装,单个氨基酸的改变(即突变)所产生的效应,常常并非独立,而是深受其“邻居”们的影响。这种突变间相互依赖的现象,在遗传学中被称为“上位性”(epistasis)。它如同蛋白质世界里的“蝴蝶效应”,一个微小的改变可能在特定背景下被放大或抵消,深刻影响着蛋白质的进化路径、新功能的产生以及对环境(如抗生素)的适应。然而,尽管上位性在进化中扮演着核心角色,并使得精准预测突变效应变得异常复杂,其背后的物理化学和结构机制在很大程度上仍是一个“黑箱”。理解上位性,就是解读蛋白质演化规则的关键密码。
为了揭开这层面纱,一项发表于《Nature Communications》的研究将目光聚焦于一个经典的抗性蛋白——TEM-1 β-内酰胺酶。研究人员没有试图剖析整个庞大而复杂的蛋白质,而是巧妙地选择了一个明确的结构单元:一个由11个残基构成的α螺旋。这个“微缩景观”成为了探究上位性起源与广度的理想模型。他们构建了一个包含超过14,000种双突变体的全面突变文库,堪称一次在微观尺度上的“普查”。研究采用了两种形成对比的指标来衡量蛋白质效率:反映细菌在抗生素压力下生长能力的适应性(fitness),以及直接衡量蛋白质抑制抗生素能力的表型——最低抑菌浓度(MIC)。令人瞩目的是,两种度量均揭示了一致且广泛存在的上位性相互作用,表明这种现象在该结构元件中普遍存在,而非个别特例。
那么,这些复杂的上位性模式是否有规律可循?研究人员提出了一个简洁而有力的物理解释模型:一个非线性的两态蛋白质稳定性模型。该模型的基本假设是,每个突变(无论是去稳定化、中性还是稳定化)以相加的方式贡献于蛋白质的整体稳定性表型。当蛋白质的稳定性处于临界阈值附近时,微小的稳定性变化会通过蛋白质折叠与功能状态的“开关”效应,被非线性地放大,从而表现出上位性。令人振奋的是,这个模型成功地解释了大部分观测到的数据。这意味着,在这个α螺旋中,多数的上位性效应并非源于突变间特异、复杂的直接相互作用,而是可以通过各个单突变对蛋白质稳定性的独立贡献预测出来,上位性更多地表现为稳定性的“背景依赖放大效应”。
然而,科学总是在对模型的偏离中发现更深层的真理。研究发现,当两个发生突变的残基在蛋白质的三维结构中直接接触(如形成氢键或疏水相互作用)时,数据会出现系统性偏离上述稳定性模型的情况。这强烈暗示,在紧密的物理相互作用层面,存在着超越简单稳定性叠加的、更为特异的化学或结构效应,这部分上位性无法仅用稳定性模型来捕捉。为了探索进化是否记录了这些相互作用的信息,研究者进一步利用从远缘同源序列中提取的进化关联信息,训练了统计模型(如直接耦合分析,DCA)。结果显示,这些基于序列共进化信息的模型,能够部分地恢复实验中观察到的上位性相互作用模式。这表明,尽管经历了漫长的进化分歧,蛋白质序列中依然保留着关于关键残基间功能耦合(可能包括直接相互作用)的历史印记。
本研究通过聚焦于一个精确定义的结构模块,系统量化并解析了上位性的多重决定因素。它揭示了在TEM-1 β-内酰胺酶的α螺旋中,广泛的上位性主要源于突变对蛋白质稳定性的非线性、背景依赖性贡献,这使得相当一部分上位效应变得可预测。同时,研究也指出了在残基直接相互作用的场景下,存在更复杂的、超越稳定性模型的特异性上位性。最后,通过将实验数据与基于进化序列的统计模型相关联,为利用生物信息学方法预测蛋白质的突变效应和相互作用提供了新的线索与验证。这些发现不仅深化了我们对蛋白质上位性分子基础的理解,也为预测蛋白质进化轨迹、合理设计具有新功能的蛋白质或应对抗生素耐药性等挑战,提供了重要的理论框架和实验范例。