
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用力场引导改进蛋白质-配体复合物的生成
《Journal of Cheminformatics》:Improving protein-ligand complex generation with force field guidance
【字体: 大 中 小 】 时间:2026年05月04日 来源:Journal of Cheminformatics 5.7
编辑推荐:
摘要 基于扩散和流匹配的生成模型最近已被应用于基于结构的药物设计,但它们的输出通常包含不现实的蛋白质-配体相互作用,这些相互作用不符合物理定律。我们提出了一种能量引导框架,该框架将分子力学力场(MMFF94)直接集成到采样过程中。该方法在不重新训练基础模型的情况下,引导
基于扩散和流匹配的生成模型最近已被应用于基于结构的药物设计,但它们的输出通常包含不现实的蛋白质-配体相互作用,这些相互作用不符合物理定律。我们提出了一种能量引导框架,该框架将分子力学力场(MMFF94)直接集成到采样过程中。该方法在不重新训练基础模型的情况下,引导分子生成更具物理合理性和能量稳定性的构象。我们使用两种最先进的架构——SemlaFlow(流匹配模型)和EDM(扩散模型)在PDBBind数据集上评估了这种方法。在两种模型中,能量引导均提高了焓相互作用能量,应变能量最多提高了75%,并且生成了1000多种比天然配体具有更好对接分数的配体。这些结果表明,轻量级的、基于物理的引导方法可以在保持化学有效性和多样性的同时显著提升生成药物设计的效果。
我们引入了一种新的、无需训练的力场引导框架,该框架在基于扩散或流的采样过程中使用经验分子力学(例如MMFF94)来引导配体生成——而无需修改或重新训练基础生成模型(例如EDM或SemflaFlow [24])。我们的方法在推理过程中作为插件运行,利用能量反馈生成应变较小的构象,并预测出与蛋白质结构更好的相互作用。
我们的主要贡献如下:
无需重新训练的能量引导:与需要来自神经亲和力预测器的梯度的方法(例如BADGER [26])不同,我们的方法在后采样步骤中直接注入经典力场反馈(MMFF94)。
改进的对接和应变指标:在与无条件EDM和Semflaflow的基准测试中,我们的引导推理始终获得了更好的AutoDock Vina分数和更低的配体应变能量,即使在使用相同的力场优化最终结构之后也是如此。
兼容性和灵活性:由于引导模块是外部的,它可以广泛应用于多种生成框架——无需重新训练或修改架构,并且可以应用于任意可微的势能函数。
稳定性的理论保证。我们在附录B中证明,在标准平滑性假设下,梯度校正步骤对应于能量上的下降步骤。虽然完整的采样更新还包括模型驱动的(在扩散情况下还包括随机)组件,但这一结果正式说明了引导项如何局部地将轨迹偏向能量较低的区域,并为其稳定效果提供了原理上的解释。