DFDD:一种云端就绪的距离引导全动态对接工具,用于主客体复合物研究

《Journal of Chemical Information and Modeling》:DFDD: A Cloud-Ready Tool for Distance-Guided Fully Dynamic Docking in Host–Guest Complexation

【字体: 时间:2026年02月16日 来源:Journal of Chemical Information and Modeling 5.3

编辑推荐:

  本文介绍了一种云端就绪的工具DFDD(Distance-Guided Fully Dynamic Docking),它基于LB-PaCS-MD框架,通过无偏分子动力学(MD)在显式溶剂中捕获主客体包合过程。该工具自动化系统设置、参数生成、迭代短周期MD采样和轨迹分析,仅需数分钟即可在Google Colab上复现实验观测的包合构象(如β-环糊精(β-CD)体系),并揭示插入路径中的中间态。结合pKaNET-Cloud模块可实现pH感知的配体质子化状态调整,为高效、可重复的主客体复合物研究提供了透明、易用的平台。

  

引言

主客体复合物是研究分子识别、超分子组装和药物递送机制的常用模型。其中,β-环糊精(β-CD)因能形成明确的包合物、水溶性好且具有柔性空腔,成为广泛使用的宿主分子。传统分子对接常忽略溶剂效应、熵贡献和β-CD空腔的固有柔性,仅提供静态结合姿态;而基于分子动力学(MD)的方法能在显式溶剂中捕获动态插入路径和自适应主客体相互作用,但常规MD采样包合过程通常具有随机性且难以复现。为此,研究团队开发了DFDD(距离引导全动态对接),这是一种云端就绪的LB-PaCS-MD框架实现,旨在通过无偏MD在显式溶剂中捕获包合过程。

方法

系统准备:所有主客体系统通过Python接口调用AmberTools构建,配体以SMILES字符串或常见3D格式(如SDF、MOL2、PDB)提供,并采用GAFF2力场和AM1-BCC电荷进行参数化。使用pKaNET-Cloud模块基于机器学习预测pa值,实现pH感知的配体质子化状态调整,确保化学一致性。宿主β-CD使用预参数化模型,支持多种衍生物(如DMβCD、MβCD、HPβCD)。系统组装通过tLEaP完成,配体初始置于β-CD空腔上方约25 ?处,溶剂化并中和后生成拓扑和坐标文件。
能量最小化与平衡:采用OpenMM进行松弛和平衡,使用PME静电、1.0 nm截断、氢键约束以允许2 fs时间步长。先施加位置约束(10,000 kJ/mol·nm)于宿主重原子以保持空腔几何,随后进行L-BFGS最小化(最多1000次迭代)、从0 K分段加热至300 K,并进行短暂NVT平衡。所有参数(如截断值、约束强度、加热方案)可在DFDD笔记本中调整。
距离引导LB-PaCS-MD采样(DFDD):DFDD以主客体质心距离为选择指标进行迭代采样。每轮循环运行多个短无偏MD轨迹(默认5条轨迹,每条100 ps),结束后选择质心距离最小的终点作为下一轮初始结构,从而富集朝向包合的构象而不施加外部偏置力。默认进行30轮循环,用户可调整循环次数和轨迹长度。采样通过“pacs_q_md”模块执行,当客体达到稳定插入构象或达到最大循环数时终止。
后处理分析与可视化:DFDD自动计算结构描述符(如RMSD、质心距离、聚类)和结合自由能(通过AMBER MMPBSA.py进行MM/PB(GB)SA计算)。轨迹分析使用MDAnalysis、NumPy和Deeptime,并通过py3Dmol在笔记本中交互式可视化结合路径、代表性快照及动态插入过程。
精修模拟:DFDD筛选出的主客体姿态通过NPT分子动力学模拟(默认30 ns)进行精修,以评估包合构象的稳定性并获取代表性快照用于能量评估。结果轨迹自动通过CPPTRAJ分析RMSD、回转半径(Rg)和主客体距离分布。

实现

DFDD以模块化、云端就绪的工作流实现,集成OpenMM(模拟)、AmberTools(参数化)、ParmEd(文件转换)、MDAnalysis(数据分析)和py3Dmol(可视化)。其架构包括:(i)环境初始化与依赖管理;(ii)系统组装;(iii)外部引擎协调;(iv)迭代采样控制;(v)后处理。工作流通过Jupyter/Colab界面运行,仅暴露必要用户输入,同时通过自动生成的配置文件保持透明度。整个流程可预览于。若未收敛,工作流提供自动扩展机制,可追加LB-PaCS-MD循环。DFDD针对Google Colab GPU实例优化,依赖项在运行时安装,持久存储通过Google Drive挂载处理;也可在本地GPU硬件上运行。代码以MIT许可证发布,支持透明、可重复使用。

应用示例

主客体复合物采样:以β-CD包合(?)-表儿茶素没食子酸酯(ECG)和(?)-表没食子儿茶素(EGC)的晶体复合物为例,DFDD在30轮LB-PaCS-MD循环(每轮5个候选,10个重复)下一致复现自发插入,主客体质心距离随循环单调减小(每轮约1分钟,整个系统约30分钟)。二维自由能景观揭示两个主导状态:紧密结合构象(模式(i),RMSD ≈ 0.5–0.6 ?,Rg≈ 6.1 ?)与部分插入中间态(模式(ii))。投影于Rg和主客体距离的景观(g and host–guest RMSD, identifying a stable bound configuration (mode (i)) and a less stable alternative inclusion configuration (mode (ii)). (b) FELs projected onto host Rgand host–guest distance, defining bound (B), intermediate (I), and unbound (U) regions.">)捕获了从未结合态到结合态的β-CD“呼吸”运动,收缩至稳定盆地(Rg≈ 6.0–6.1 ?)。聚类和自由能分析确认紧凑模式为全局最小值。
主客体复合物结合能:通过常规MD模拟(30 ns × 3独立重复)评估结合稳定性。模式(i)的RMSD快速稳定于较窄范围(β-CD–ECG约2.0–3.7 ?,β-CD–EGC <~1.5 ?),而模式(ii)显示更大RMSD和波动。MM/PB(GB)SA分析()表明模式(i)更稳定:β-CD–ECG的ΔGMM/GBSA≈ ?17 ± 0.3 kcal/mol,ΔGMM/PBSA≈ ?21 ± 0.4 kcal/mol;模式(ii)则较弱(?7至?14 kcal/mol)。ΔΔG(i–ii)值显示模式(i)在能量上更优(ECG为?9.21/?10.64 kcal/mol,EGC为?0.70/?1.28 kcal/mol)。这些能量值与实验ITC/DSC结合自由能(?39至?66 kJ/mol)吻合良好,小偏移归因于隐式溶剂评分中缺失的熵贡献。
与常规MD比较:对β-CD–ECG和β-CD–EGC进行10次独立100 ns常规MD模拟,起始于完全未结合构象。结果轨迹显示显著副本间变异:包合样构象仅出现于部分副本且通常对应模式(ii)或不稳定排列,未在任何副本中持久形成DFDD复现的晶体样包合几何(模式(i))。主客体氢键分析显示间歇性、副本依赖性的氢键形成,缺乏持续网络。这表明常规MD虽能采样主客体结合,但稳定、晶体样结合态的高效复现需大量采样,而DFDD通过路径引导实现了更可靠、可重复的采样。

局限性与未来展望

DFDD目前针对β-CD大小体系优化(总原子数约<3000),更大、更柔性宿主或构象多样性高的客体可能需要更长时间或额外循环。仅使用质心距离作为选择指标虽对环糊精类空腔有效,但未显式考虑取向或特定分子间接触,未来版本可针对几何复杂宿主改进选择标准。DFDD依赖短无偏MD轨迹,虽高效捕获插入事件,但不提供严格自由能估计;精确结合自由能需专用方法(如炼金自由能计算)。工作流在Google Colab上运行可靠,但执行速度受分配GPU和后端影响,长时模拟可能更适合本地GPU资源。尽管当前聚焦主客体体系,框架设计具可扩展性,未来将支持蛋白质-配体复合物的全动态对接,特别适用于诱导拟合结合机制。

结论

DFDD通过全动态、显式溶剂采样为主客体复合物建模提供实用、易用的方法。它将系统准备、距离引导LB-PaCS-MD循环和自动分析集成于单一云端就绪笔记本,使用户无需偏置力或专用计算设施即可获得真实插入路径和稳定包合结构。示例表明DFDD能在分钟级运行时于免费云GPU上复现实验支持的结合模式并捕获有意义的中间态。作为开放、模块化框架,DFDD可轻松适配其他主客体体系或并入更广模拟流程,为研究动态包合过程提供高效、可重复的工具。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号