利用蛋白质折叠模型探索腺苷酸激酶(Adenylate Kinase, AdK)及更广范围的构象景观

《Scientific Reports》:Exploring the conformational landscape of adenylate kinase and beyond with protein folding models

【字体: 时间:2026年06月02日 来源:Scientific Reports 3.9

编辑推荐:

  摘要:蛋白质折叠(model folding)模型已革新了结构预测,但在捕获构象柔性方面仍存在困难。近期研究通过扰动输入或参数来采样替代构象,而基于扩散(diffusion-based)的方法可直接生成构象集合(ensemble)。尽管单个生成模型已对照分子动

摘要:蛋白质折叠(model folding)模型已革新了结构预测,但在捕获构象柔性方面仍存在困难。近期研究通过扰动输入或参数来采样替代构象,而基于扩散(diffusion-based)的方法可直接生成构象集合(ensemble)。尽管单个生成模型已对照分子动力学(Molecular Dynamics, MD)数据进行了基准测试,但跨不同方法的系统性比较仍较缺乏,且亚结构域(sub-domain)动力学的验证亦有限。本研究对20种具有活性和非活性状态的单体蛋白上的九种方法进行系统性基准测试。研究人员将两两比对误差(pairwise aligned error, PAE)指标扩展至集合层面,发现蛋白质本身属性对模型性能存在不可忽略的影响。以拥有丰富MD数据的经典酶——腺苷酸激酶(Adenylate Kinase, AdK)为重点,研究发现Chai-1在恢复已知构象、识别可动区域及捕获合理的中间构象方面表现最优。这些结果凸显了生成模型作为MD高效替代方案用于探索蛋白质构象动力学的潜力,并为蛋白质构象景观的采样提供了严谨的基准。
论文解读:利用蛋白质折叠模型探索腺苷酸激酶及更广范围的构象景观
研究背景与意义
蛋白质执行依赖于三维结构的生物学功能,且具有内在动态性,可通过构象变化实现别构调节、底物转运及酶催化。实验技术如X射线晶体学通常仅捕获单一静态状态,核磁共振(Nuclear Magnetic Resonance, NMR)受限于蛋白大小,冷冻电镜(cryo-EM)难以解析连续柔性及瞬态中间体。AlphaFold2及AlphaFold3等蛋白质折叠模型能高精度预测单一最可几结构,但因训练目标所限难以探测功能性构象多样性。现有构象采样策略(如MSA子采样、随机dropout、MSA聚类、随机掩码及丙氨酸突变等)或基于扩散的生成式模型缺乏跨方法系统性评估和亚结构域水平验证。为此,研究人员在《Scientific Reports》发表此研究,对九种主流构象采样方法在20个单体蛋白(含酶、转运蛋白、GPCR、激酶等)上进行系统基准测试,重点以腺苷酸激酶(Adenylate Kinase, AdK)为范例深入验证,评估各方法恢复已知端态、捕捉中间构象及识别可动结构域的能力,并将PAE矩阵推广至集合层面分析。
主要关键技术方法
研究人员从既往研究中筛选并建立含20个单体蛋白的基准数据集,均具高分辨率开放(非活性)与闭合(活性)状态实验结构,涵盖酶(如AdK、己糖激酶)、膜转运蛋白(如MCT1、ZnT8)、GPCR(如M2受体)及信号激酶(如SRC、ABL1)。通过MMseqs2和HHsearch(ColabFold v1.5.5)生成各靶点统一的主多序列比对(Multiple Sequence Alignment, MSA)。测试的九种构象采样方法均使用相同序列和MSA运行,包括:标准AlphaFold2(AF2)、AF2-Dropout(Evoformer与结构模块10%–25% dropout)、AFSample2(15% MSA列掩码)、SPEACH_AF(滑动窗口丙氨酸突变)、Subsampled AF2(max_seq:extra_seq设为32:16、128:64、5120:512)、AF-Cluster(DBSCAN聚类MSA后分别预测)、Cfold(基于已知结构簇重训练AF2预测)、Boltz-1及Chai-1(默认参数下各生成200个扩散样本)。评估指标采用基于TM-score计算的精确度(预测→最近真值平均相似度)和召回率(真值→最近预测平均相似度),填充比(fill-ratio)衡量构象空间覆盖,残基级Cα-RMSF(Root-Mean-Square Fluctuation)与态间Cα-RMSD比对识别可动域,并将比对误差(Aligned Error, AE)矩阵扩展至集合平均以量化域间运动模式。AdK深入验证中引入DIMS(Dynamic Importance Sampling MD)与FRODA(Framework Rigidity Optimized Dynamics Algorithm)模拟轨迹作参照,并利用PCA(Principal Component Analysis)分析预测构象分布。
研究结果
Benchmarking nine sampling methods against twenty protein targets including enzymes, transport, and chaperone proteins(对含酶、转运及分子伴侣蛋白等20个靶点的九种采样方法基准测试)
研究人员计算各方法在全部靶点上平均精确度与召回率并绘制散点图,Chai-1平均召回率近90%、精确度近90%,F1得分最高,综合表现最优;按蛋白汇总发现不同蛋白可测性差异显著(蛋白质因素解释47.8%方差,方法因素解释13.2%),表明固有蛋白属性影响大于方法选择。AdK在各方法中均被较好恢复,其预测Cα-RMSF与态间Cα-RMSD的Spearman相关系数为0.77,Chai-1全蛋白平均达0.60。结构异质性与序列组成特征(分子量、长度、半胱氨酸数、β折叠比例)及MSA质量对采样性能影响强于采样协议本身。
Chai accurately recovers both active and inactive states of AdK(Chai-1准确恢复AdK的活性与非活性状态)
针对AdK单独分析,Chai-1取得最高召回率(95%)与较高精确度,精确率—召回率散点中F1最高;AF-Cluster虽召回率高但精确度偏低(预测噪点多),Cfold精确度高但召回率低(只准确定位一端态),丙氨酸突变法表现最差。增大采样量可提升召回率(构象空间覆盖)但不显著改善单态精确度,Chai-1在小样本下仍维持高性能。PCA显示Chai-1预测构象在PC1方向可无监督区分开实验确定的开放与闭合态,证实生成结构编码了构象景观几何信息。
Validation of predicted intermediate conformations using molecular dynamics(利用分子动力学验证预测的中间构象)
Chai-1不仅捕获两端态,还生成介于其间的潜在过渡中间体。与DIMS(19691帧)和FRODA(28282帧)轨迹对比投影至TM-score空间,Chai-1系综偏离MD路径最少且填充比达0.60(约为传统MSA扰动策略的两倍),说明其较好地桥接了两稳定态几何间隙。中间体聚类的PCA坐标与已知半开放LID域实验中间体(PDB:1ZIN)比对,最近三个预测骨架RMSD<2?,验证Chai-1可捕获真实中间构象。Chai-1集合显示LID域渐变运动而NMP域呈延迟突跃,与NMR及部分计算研究报道NMP先于LID打开的运动顺序相符,区别于DIMS/FRODA中两域较协同的运动模式。
Conformation variation allows prediction of mobile domains(构象变异可用于预测可动结构域)
AdK预测集合的残基Cα-RMSF与两态间Cα-RMSD高度吻合,峰值对应NMP(AMP结合域,残基约30–60)和LID(ATP结合域,残基约120–160)可动域,说明Chai-1可识别功能性柔性区。扩展的集合同胞比对误差(Ensemble Aligned Error, EAE)矩阵呈现明显非对角高值块(~3.5?),指示域间协调位移,对角低值确认域内刚性——与真实结构AE矩阵模式一致,Chai-1的EAE与真值平均绝对差异次低。此外Chai-1预测中D118–K136盐桥距离随趋近闭合态而增大,符合已知稳定开放态的关键相互作用机制。
讨论与结论
研究人员指出扩散生成模型(尤Chai-1)在精确度、召回率及填充比上优于AF2扰动类方法,可有效恢复AdK开闭态、生成合理中间体并捕捉残基级机理细节(如D118–K136盐桥及非同步域运动)。与物理驱动MD不同,生成模型学习数据驱动的结构流形,缺乏时间顺序与能量权重,应与MD互补而非替代;可通过溶剂化平衡或力场再打分整合。研究发现蛋白质自身性质(结构异质性、序列特征、MSA深度)比方法选择更显著影响性能,为靶点与方法匹配提供指导。局限性包据中间体验证仅限AdK(因缺乏其他蛋白收敛MD轨迹)、仅限单体未考虑配体/复合物别构效应、PCA路径为几何插值非时间过程。结论为:基于扩散的生成式蛋白质折叠模型可作为MD计算高效替代用于探索蛋白质构象景观,该系统基准框架有助于深入理解别构调控蛋白的构象动力学,并在抗原设计等转化应用中具潜力。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号