《Biochemical Journal》:Deep learning insights into β-lactamase dynamics and resistance evolution
编辑推荐:
全球范围内β-内酰胺酶介导的抗菌素耐药性(AMR)的快速扩张,迫切需要能够解析酶适应性动力学的机制性方法。尽管β-内酰胺酶的进化通常涉及细微的重排而非大的结构位移,但传统的结构和模拟分析难以捕捉构成底物特异性和抑制剂易感性变化的构象异质性。在此,研究人员综述了
全球范围内β-内酰胺酶介导的抗菌素耐药性(AMR)的快速扩张,迫切需要能够解析酶适应性动力学的机制性方法。尽管β-内酰胺酶的进化通常涉及细微的重排而非大的结构位移,但传统的结构和模拟分析难以捕捉构成底物特异性和抑制剂易感性变化的构象异质性。在此,研究人员综述了应用深度学习探测A-D类β-内酰胺酶构象动力学的最新进展。研究人员重点介绍了卷积变分自动编码器(CVAEs)如何从分子动力学(MD)模拟中重建非线性构象流形,揭示亚稳态、隐秘口袋和催化中间体。DiffNets整合监督目标以识别生化表型的结构决定因素,而BindSiteS-CNN和几何深度学习方法则提供了对活性位点重塑和局部口袋可塑性的高分辨率洞察。此外,基于动态信息描述符训练的图形神经网络(GNN)捕获了长程变构耦合,并准确预测了突变适应度和上位性。这种深度学习赋能的蛋白质动力学分析为理解β-内酰胺酶的适应性提供了一个统一且具有预测性的框架。
引言
全球抗菌素耐药性(AMR)危机日益严峻,其核心驱动力在于β-内酰胺酶通过水解β-内酰胺环使抗生素失活。根据Ambler分类,A、C和D类为丝氨酸β-内酰胺酶(SBLs),B类为锌依赖性金属β-内酰胺酶(MBLs)。这些酶进化的核心特征在于其显著的适应性,单个氨基酸的替换即可重构整个酶支架的构象景观。值得注意的是,功能多样化往往并非源于剧烈的结构重排,而是源于环状结构定位、螺旋堆积及氢键网络的细微变化,这些变化通过动态通讯通路调节底物特异性。传统的分子动力学(MD)模拟虽能表征酶柔性,但经典降维技术如主成分分析(PCA)受限于线性假设。因此,研究人员采用深度学习技术从MD集合中提取非线性、高维模式,以揭示隐藏的构象状态、变构位点及与功能分化相关的动态特征。本综述聚焦于DiffNets、卷积变分自动编码器(CVAEs)、BindSiteS-CNN和图形神经网络(GNN)等关键深度学习流程,探讨其在四类β-内酰胺酶中的应用,阐明构象动力学与耐药表型之间的联系。
深度学习在β-内酰胺酶研究中的应用方法
卷积变分自动编码器(CVAEs)
CVAEs是一种用于非线性降维的神经网络架构,特别适用于处理源自MD模拟的残基间接触图谱或Cα–Cα距离矩阵。其编码器将输入结构映射为潜在高斯分布的参数,通过结合重构损失与Kullback–Leibler(KL)散度惩罚来正则化潜在空间。这种约束鼓励模型学习连续且平滑的潜在流形,捕捉局部二级结构相互作用和长程接触网络。当MD轨迹投影到该空间时,亚稳态构象形成紧凑簇,而过渡路径表现为盆地间的连续轨迹。CVAEs能够重建自由能景观并确定可能对应于催化或抑制剂敏感构象的稀有中间态。
用于功能导向MD嵌入的DiffNets
标准无监督自动编码器往往强调大尺度结构差异而忽略细微的功能性重排。DiffNets通过在训练中加入监督分类目标来解决这一挑战,除了重构输入结构外,还预测变体水平的标签(如稳定与不稳定)。该模型结合了期望最大化(EM)方案,迭代细化帧级标签概率,从而重塑潜在空间,使与功能特征(如螺旋压缩、环状稳定)相关的构象沿学习到的坐标分离。这使得DiffNets能够从高度重叠的构象集合中识别出具有预测性的结构特征。
BindSiteS-CNN与几何深度学习
针对酶活性位点局部的微环境变化,BindSiteS-CNN直接从MD衍生的结合位点构象入手。它将活性位点区域提取并投影到以口袋为中心的球面上,并用疏水性、静电势等物理化学描述符进行注释。球形卷积神经网络处理这些旋转等变表示,无需结构对齐即可跨MD帧一致比较口袋几何形状。聚类分析可揭示状态特异性的口袋构象,如开放态、收缩态或与抑制剂兼容的几何形状,从而将全局构象转变与局部催化位点重塑联系起来。
图形神经网络(GNNs)
GNN将蛋白质拓扑结构表示为图,氨基酸残基为节点,空间或动态关系为边。弹性网络模型(ENM)为此提供了基础,其中非对称动态耦合指数(DCIasym)量化了一个残基扰动如何影响另一个残基的灵活性。基于ENM衍生的动态耦合训练的变构GNN能够捕获变构通讯通路和非局域的上位相互作用,无需依赖实验测量的上位性数据。
深度学习在β-内酰胺酶结构动力学中的应用
A类β-内酰胺酶
TEM-1的稳定变体
研究人员利用DiffNets分析了TEM-1及其变体(如M182T)的MD模拟。相比无监督自动编码器,DiffNets通过加入分类目标,成功将紧密与延伸的螺旋9构象在潜在空间中分离,并揭示了螺旋9压缩是关键的稳定特征。通过EM方案迭代细化帧标签,模型能够在不依赖显式结构特征的情况下,预测未见过的变体(如M182N)的稳定性,证实了学习到的结构决定因素的转移性。
疏水节点的作用
疏水节点是由保守残基组成的簇,构成了A类β-内酰胺酶的结构骨架。结合自适应MD模拟和无监督深度学习的研究表明,这些节点不仅是静态结构特征,更是动态调节器。通过对KPC-2、SME-1、TEM-1和SHV-1的CVAE分析,发现疏水节点灵活性和耦合的变化与酶功能差异相关,凸显了其在塑造构象景观和催化调节中的关键作用。
L2 β-内酰胺酶家族中的共进化动力学
针对嗜麦芽窄食单胞菌L2家族的研究,整合了CVAE和BindSiteS-CNN模型。CVAE阐明了全局构象转变,而BindSiteS-CNN则识别了局部活性位点几何形状如何随全局动力学共进化。这种多尺度分析揭示了疏水节点和特定口袋残基作为动态锚点,协调着区分L2家族内功能表型的波动模式。通过将潜在嵌入与进化信息相关联,该研究在机制层面上桥接了基因型与表型。
Pen家族中的热点与环状动力学
针对伯克霍尔德菌属Pen β-内酰胺酶(PenA, PenI, PenL, PenP)的研究结合了强化学习驱动的增强采样MD模拟与CVAE/BindSiteS-CNN。研究发现,尽管序列同一性低,但这些酶表现出明显的环状动力学差异,特别是在Ω-loop和β9–α12环区域。CVAE潜在投影揭示了不同的动态盆地,对应于替代构象亚态,而BindSiteS-CNN则展示了口袋体积和环取向的局部几何差异,表明功能分化源于全局运动与局部微状态的协调改变。
基于图形神经网络的深度突变扫描
利用基于动力学信息的GNN对TEM家族进行深度突变扫描显示出显著优势。模型仅基于ENM衍生的相互作用模式训练,却始终优于现有的突变适应度和上位性预测因子。该模型对远端残基间的上位相互作用表现出极高的敏感性,并在37种新型TEM-1变体上得到了实验验证,证明了ENM动态特征编码了生物学上有意义的信息。
B类β-内酰胺酶
L1 MBL中的二聚体-二聚体动力学
L1金属β-内酰胺酶(MBL)组装成同源四聚体,其催化中心由两个表面环(α3–β7和β12–α5)调控。结合自适应MD模拟、马尔可夫状态模型(MSM)和CVAE分析,研究人员解析了这七个亚稳态(开放、中间、闭合)。CVAE学习的潜在表示清晰地分离了这些状态,并揭示了四聚体内的二聚体-二聚体运动,表明门控涉及两个环之间的协同相互作用,而非简单的几何位移。
C类β-内酰胺酶
PDC-3 β-内酰胺酶中的隐秘口袋
针对铜绿假单胞菌来源的头孢菌素酶PDC-3,研究人员采用良好温度元动力学(well-tempered metadynamics)偏置Ω-loop的φ/ψ二面角,并结合CVAE分析。UMAP可视化与HDBSCAN聚类揭示了三种主要的Ω-loop构象:晶体样态、扩张态和收缩态。在收缩态中,Ω-loop向内移动部分封闭了催化通道,并在环的外表面暴露出一个先前未被识别的隐秘口袋。量子力学/分子力学(QM/MM)计算进一步支持了一种构象依赖的备用通用碱机制,为靶向该隐秘口袋的抑制剂设计提供了新策略。
D类β-内酰胺酶
D类β-内酰胺酶(DBLs,又称OXA酶)遗传异质性极高。近期研究建立了标准化的结构比对编号方案以应对序列多样性。结合位点中心的分析表明,B5–B6环等柔性元件引入了结构变异性。尽管同源,不同亚家族的OXA酶在口袋几何形状上存在明显局部差异,导致功能重叠。即使功能相似的碳青霉烯酶也可能表现出不同的口袋几何形状,表明其通过不同的结构解决方案趋同进化出碳青霉烯水解能力。这种结构可塑性使得仅凭序列预测耐药表型面临挑战。
探究催化机制和功能状态分化的机器学习方法
除深度学习外,经典机器学习方法亦有贡献。例如,监督投影追踪框架被用于解析TEM-52的功能机制;树集成模型结合QM/MM模拟阐明了KPC-2中碳青霉烯脱酰化的结构特征;基于SHAP的解释性分析揭示了关键氢键相互作用的作用。此外,PathDetect-SOM作为一种无监督机器学习方法,成功聚类了PDC-3与抑制剂LP06的结合动力学路径,识别出关键的疏水相互作用残基。
结论
深度学习已从根本上改变了研究人员对β-内酰胺酶构象动力学的理解,将分析焦点从静态结构比较转向高维构象景观的动态探索。DiffNets、CVAEs、BindSiteS-CNN和GNN等方法共同建立了一个连贯的数据驱动范式,揭示了耐药性常源于自由能表面的微妙重塑。尽管这些方法在MD采样质量、跨类别迁移性及输入表示敏感性方面仍存在局限,但随着力场精度的提高和神经架构的成熟,深度学习引导的酶动力学探索将成为合理设计抑制剂、对抗AMR的核心手段。