集成虚拟筛选、机器学习和分子动力学技术发现新型植物化学物质FabI抑制剂,可有效抑制耐甲氧西林金黄色葡萄球菌(MRSA)

《Journal of Molecular Graphics and Modelling》:Integrated Virtual Screening, Machine Learning and Molecular Dynamics Identify Novel Phytochemical FabI Inhibitors against MRSA

【字体: 时间:2026年02月27日 来源:Journal of Molecular Graphics and Modelling 3

编辑推荐:

  MRSA FabI抑制剂的计算化学发现与验证:通过整合虚拟筛选、机器学习、可解释AI和分子动力学模拟,从41,423个聚酚类化合物中筛选出最佳候选CNP0408084,其结合亲和力(-12.57 kcal/mol)显著优于参考化合物PV4,并展现出高动态稳定性(RMSD:1.79 ?)和热力学优势(ΔG结合-38.72 kcal/mol)。

  
Mithun Rudrapal | Kevser Kübra K?rbo?a
印度安得拉邦Guntur市Vadlamudi 52221,Vignan科学、技术和研究基金会,生物技术与制药科学学院,药学科学系

摘要

耐甲氧西林金黄色葡萄球菌(MRSA)感染对全球健康构成了严重威胁,因此需要发现针对细菌关键代谢途径的新抗菌剂。烯酰酰基载体蛋白还原酶(FabI)是一个经过验证的抗菌靶点,因为它在细菌脂肪酸生物合成中起着关键作用,而哺乳动物细胞中不存在这种酶。本研究旨在通过结合基于结构的虚拟筛选、机器学习(ML)分类、可解释的人工智能(XAI)分析、分子动力学模拟和结合自由能计算的综合计算方法,从天然产物数据库中筛选出新型的多酚类及相关多酚类FabI抑制剂。从COCONUT数据库中选取了41,423种类药多酚类及相关多酚化合物,使用AutoDock Vina对它们与金黄色葡萄球菌FabI(PDB: 4BNF)的结合能力进行了筛选,并用10种ML算法根据ECFP4分子指纹将化合物分类为活性或非活性化合物。通过XAI指导的标准筛选出的候选化合物经过100纳秒分子动力学模拟验证,随后进行了MM-GBSA结合自由能计算、主成分分析(PCA)和自由能景观(FEL)分析。虚拟筛选共发现了26,097种化合物(占63%),其结合亲和力优于参考抑制剂PV4(-8.21 kcal/mol),其中香豆素类化合物占多数(56%),其次是黄酮类化合物(20%)。SVM-RBF分类器的ROC-AUC为0.9894,Matthews相关系数为0.9017,表现最佳。特征重要性分析显示,酚羟基/醚基团(占顶级特征的40%)和烷基链(占30%)是FabI抑制的关键结构决定因素。N-(1H-苯并咪唑-2-基)-2-(2-氧代-4-苯基-chromen-7-基)氧基乙酰胺(CNP0408084)成为最有前景的先导化合物,其结合亲和力较高(-12.57 kcal/mol),能够覆盖大部分ML重要的结构特征(55%),并且结合稳定性也优于PV4(RMSD:1.79 ± 0.32 ? vs 2.26 ± 0.42 ?)。MM-GBSA计算证实CNP0408084的结合热力学优势更明显(ΔG_bind = -38.72 ± 3.85 kcal/mol vs -24.56 ± 2.94 kcal/mol),范德华相互作用是主要驱动力。PCA分析表明CNP0408084能够有效限制FabI的构象动态,使其分布更加紧凑;FEL分析显示其具有稳定的、紧密结合的特性。本研究展示了将ML、可解释AI、分子动力学和高级后分子动力学分析整合用于天然产物药物发现的实用性,为基于结构相关性的虚拟筛选结果优先排序提供了一个通用框架。

引言

抗菌素耐药性(AMR)是21世纪最紧迫的全球健康挑战之一,2019年由耐药性感染导致的死亡人数超过495万例,预计如果不加以解决,到2050年这一数字可能上升至每年1000万例[1]。在此背景下,近期研究采用了基于结构的计算方法,包括虚拟筛选和分子动力学(MD)模拟,以识别针对关键耐药相关酶的新抑制剂[2]。在各种病原体中,耐甲氧西林金黄色葡萄球菌(MRSA)已成为医院获得性和社区获得性感染的主要原因,其死亡率在发达国家甚至超过了HIV/AIDS[3]。针对传统抗生素(包括万古霉素中间型菌株)的耐药机制的快速演变,迫切需要具有不同作用机制的新治疗药物。细菌的脂肪酸生物合成途径(FAS-II)作为抗菌药物开发的潜在靶点受到了广泛关注。与哺乳动物中的多功能I型脂肪酸合成酶不同,细菌使用由多个基因编码的独立酶进行脂肪酸合成,这为选择性抑制提供了机会,而不会对宿主产生毒性[4]。其中,烯酰酰基载体蛋白还原酶(FabI)催化脂肪酸延伸的限速步骤,以NADH依赖的方式将trans-2-烯酰-ACP还原为酰基-ACP[5]。FabI抑制剂的临床成功,例如作为外用消毒剂的triclosan和一线抗结核药物isoniazid,证明了该酶作为抗菌靶点的吸引力。最近,几种针对FabI的化合物已进入临床开发阶段。AFN-1252(Debio-1452)是一种针对葡萄球菌的合成抑制剂,已完成急性细菌性皮肤感染的II期试验,但尚未进入III期;CG400549(Nilofabicin)完成了针对MRSA皮肤感染的IIa期研究,效果良好但未进一步进展;Fabimycin主要针对革兰氏阴性病原体设计,仍处于临床前阶段。尽管这些化合物验证了FabI作为临床靶点的可行性[6],但尚未获得监管批准,而且抗生素开发的高淘汰率凸显了从新型化学来源开发结构多样化的FabI抑制剂的必要性。值得注意的是,所有现有的临床FabI抑制剂候选物均为合成化合物,尽管多酚类化合物具有已知的安全性和多靶点抗菌特性,但对其系统探索仍十分有限。历史上,天然产物一直是抗菌剂的丰富来源,尤其是多酚类及相关多酚化合物因其多样的生物活性和已建立的安全性而受到特别关注。多酚类化合物含有多个酚羟基,通过多种机制(如膜破坏、酶抑制和干扰群体感应)展现广谱抗菌特性[7][8]。多酚类的结构特征,特别是其芳香环和氢键能力,使其非常适合与FabI活性位点相互作用,triclosan的酚环可通过与NAD+辅因子的堆叠相互作用结合到该位点[9]。COCONUT数据库包含超过400,000种天然产物,具有丰富的化学多样性,为系统探索多酚类及相关多酚类FabI抑制剂提供了前所未有的机会。传统的药物发现方法虽然有效,但耗时且资源密集,典型的开发周期超过十年,成本高达数十亿美元。计算方法,尤其是基于结构的虚拟筛选和机器学习(ML),已成为从大量化合物库中加速发现先导化合物的强大工具[10]。深度学习(DL)的最新进展在抗菌发现方面取得了显著成功,某些研究的命中率比传统的高通量筛选提高了90倍。然而,许多ML模型的“黑箱”性质限制了其可解释性和机制洞察力,阻碍了对识别出的候选物的合理优化。可解释的人工智能(XAI)方法通过为模型预测提供人类可解释的解释来克服这一限制。特征重要性分析,特别是使用随机森林等集成方法,能够识别出对预测活性有贡献的分子亚结构,使研究人员能够理解结构-活性关系,并合理优先选择化合物进行实验验证。将XAI与分子动力学(MD)模拟相结合,可以有效地验证对接和ML的静态预测结果在生理条件下的结合稳定性。本研究旨在通过结合基于结构的虚拟筛选、ML分类、XAI分析和分子动力学验证的综合计算工作流程,识别新型多酚类及相关多酚类金黄色葡萄球菌FabI抑制剂。从COCONUT和Phenol-Explorer数据库中检索的98,088种多酚类及相关多酚化合物库中,经过顺序筛选和ADMET过滤后获得了41,423种类药化合物,并对其与FabI活性位的结合能力进行了测试,随后使用基于ECFP4分子指纹训练的多种ML算法进行活性预测。基于随机森林的特征重要性分析用于识别预测活性的结构决定因素,从而指导选择用于MD模拟的候选化合物。

数据集准备和化合物检索

多酚类及相关多酚化合物从两个全面的天然产物数据库中检索:COCONUT(开放天然产物集合)版本2.0(2025年12月发布)[11]和Phenol-Explorer版本3.6 [12]。COCONUT是最大的免费开放访问的天然产物数据库,包含715,822种化合物,具有详尽的结构和理化注释,无需注册即可访问:https://coconut.naturalproducts.net

化合物检索和过滤结果

从COCONUT数据库中初步检索到715,822种天然产物。通过基于多酚类及相关多酚化学分类(苯丙素类、多酮类、黄酮类及相关超类)的过滤,得到了97,596种化合物。从Phenol-Explorer数据库中检索到492种多酚类及相关多酚化合物,连同它们的结构信息。初步的多酚类化合物集合共有98,088种。
应用Lipinski五规则

讨论

本研究旨在通过结合基于结构的虚拟筛选、ML分类、可解释AI分析和MD模拟的综合计算方法,识别新型多酚类及相关多酚类金黄色葡萄球菌FabI抑制剂。结果表明,CNP0408084是最有前景的先导化合物,其结合亲和力(-12.57 kcal/mol)和动态稳定性(RMSD:1.79 ± 0.32 ?)均优于参考化合物

结论

本研究通过结合基于结构的虚拟筛选、ML分类、可解释AI分析、MD模拟和全面的结合自由能计算的综合计算方法,成功识别出了新型多酚类及相关多酚类金黄色葡萄球菌FabI抑制剂。从COCONUT和Phenol-Explorer数据库中检索的98,088种多酚类及相关多酚化合物库中,获得了41,423种类药化合物
利益冲突声明
作者声明没有利益冲突。
作者贡献声明
Mithun Rudrapal:撰写——审稿与编辑、监督、项目管理、方法学、研究、概念构思。Kevser K?rbo?a:撰写——原始草稿、可视化、验证、软件开发、方法学、研究、数据分析、概念构思
伦理批准和参与同意
不适用。
数据可用性
本研究生成或分析的所有数据均包含在本文及其补充材料中。
写作过程中生成AI和AI辅助技术的声明
本手稿的撰写过程中未使用任何生成AI工具。
资助
无资助信息需要报告。
利益冲突声明
作者声明没有已知的财务利益冲突或个人关系可能影响本文所述的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号