《Journal of Cheminformatics》:CReM-pharm: de novo 3D pharmacophore-based design with synthetic accessibility awareness
编辑推荐:
针对现有基于生成模型的de novo设计方法(如PGMG)所生成分子结构合成可行性(Synthetic Feasibility)普遍较低的问题,捷克的研究人员开发了CReM-pharm。该方法基于CReM框架,在可控地生成符合特定3D药效团(3D pharmacophore)模型化合物的同时,显著提升了合成可及性(Synthetic Accessibility)。评估显示,该方法在不同复杂度的蛋白靶点和药效团模型上均有效,并展现出对PGMG方法的优势,已开源。
在当今药物发现领域,高效地探索广阔的化学空间(Chemical Space),以寻找具有新颖化学型(Chemotype)的先导化合物,是一项核心挑战。传统的实验筛选方法成本高昂、周期漫长,而计算辅助的De Novo(从头)设计方法为此提供了极具潜力的解决方案。这类方法能够根据预设的规则或模型,在计算机中“无中生有”地生成全新的分子结构,从而极大地扩展了可探索的化合物范围。在众多指导De Novo设计的策略中,3D药效团(3D Pharmacophore)模型是一种强有力的工具。它抽象地概括了配体与靶点蛋白(Protein)发生有效相互作用所必需的空间和电子特征(如氢键供体、受体、疏水区域等),为设计能够特异性结合靶点的新分子提供了精确的“蓝图”。
然而,理想很丰满,现实却很骨感。许多现有的生成方法,包括一些采用深度神经网络(Deep Neural Network)架构的先进模型,都存在一个普遍且致命的缺陷:它们生成的分子结构在化学上往往过于复杂、奇特,以至于合成化学家在实际实验室中几乎无法或需要付出极高代价才能将其制备出来。这种低合成可行性(Low Synthetic Feasibility)或低合成可及性(Low Synthetic Accessibility)的问题,使得许多计算机中“看上去很美”的分子永远停留在数字世界,无法进入后续的生物学测试,严重限制了De Novo设计方法的实际应用价值。为了克服这一瓶颈,由捷克的研究团队开展的本项研究应运而生。他们提出并开发了一种新的方法,旨在确保生成的分子既符合针对特定靶点的3D药效团约束,又具备较高的合成可行性。该研究成果以题为“CReM-pharm: de novo 3D pharmacophore-based design with synthetic accessibility awareness”的论文形式,发表于《Journal of Cheminformatics》上。
为开展这项研究,作者主要应用了以下几个关键技术方法:首先,研究以CReM(Chemical Replicable Models)框架为核心基础。CReM本身是一个基于已知化学反应和反应物数据库构建的、用于生成合成可行分子的生成模型。本研究的关键创新在于将CReM框架与3D药效团模型约束进行了深度融合与引导。具体而言,研究人员从蛋白质-配体(Protein-Ligand)复合物晶体结构中提取或根据已知活性分子构建了具有不同复杂度的3D药效团模型。然后,他们利用一种优化的搜索或采样算法,在CReM框架所定义的化学空间内,寻找并生成那些其3D构象能完美匹配(explicitly conforming to)给定药效团模型特征点的分子结构。整个生成过程是“可控的”,即目标药效团模型是用户可指定的输入条件。此外,研究采用了PGMG(Pharmacophore-Guided Molecule Generation)方法作为主要的对比基准。PGMG是一种同样以药效团为指导、但基于深度神经网络架构的生成方法。研究人员设计了一套评估流程,在一系列多样化的蛋白靶点和药效团模型上,对比测试了CReM-pharm与PGMG在生成分子的药效团匹配度、合成可及性(通过SAscore等指标评估)以及化学特性(如类药性)方面的表现。
研究结果部分主要包含以下发现:
- •
方法有效性验证:研究通过多个案例证明,CReM-pharm方法能够成功生成在3D空间上符合指定药效团模型约束的分子。这些生成的分子在构象上能够满足关键的氢键、疏水等相互作用的空间位置要求,表明该方法成功地将药效团的空间约束整合到了生成过程中。
- •
合成可及性优势:评估结果显示,与基于深度神经网络的PGMG方法相比,CReM-pharm所生成的分子在合成可及性(Synthetic Accessibility)相关指标上表现出显著优势。这意味着CReM-pharm产生的分子结构在化学上更合理,更有可能通过已知或有限的合成步骤在实验室中被制备出来。这直接回应了当前De Novo设计领域的一大痛点。
- •
跨靶点与模型鲁棒性:研究在多种不同蛋白靶点(涵盖酶、受体等不同类型)和不同复杂程度(特征点数量多寡)的药效团模型上对CReM-pharm进行了测试。结果表明,该方法在不同场景下均能稳定工作,生成符合要求的分子,展现了其良好的普适性和鲁棒性。
- •
与基准方法的综合对比:除了合成可行性,研究还从多个维度对比了CReM-pharm与PGMG。尽管在某些纯粹的分子生成新颖性或多样性指标上可能各有千秋,但CReM-pharm在“生成可合成且符合药效团要求分子”这一核心目标上达成了更好的平衡,凸显了其基于化学反应知识的CReM框架相对于纯数据驱动的深度神经网络方法在该特定任务上的实用优势。
综上所述,本研究的主要结论是,成功开发并验证了一种名为CReM-pharm的新型De Novo药物设计方法。该方法创造性地将注重合成可行性的CReM生成框架与精确的3D药效团空间约束相结合,实现了在可控条件下生成既具有预期生物活性特征(由药效团保证)、又具备较高合成前景的虚拟分子。其重要意义在于,它为解决De Novo设计中长期存在的“生成分子难以合成”这一关键瓶颈问题提供了一种有效且实用的解决方案。通过优先考虑合成可及性,CReM-pharm显著提高了计算设计向实验验证转化的成功率,推动了De Novo设计从理论概念向实用化工具迈进。此外,研究团队将CReM-pharm实现为开源工具并公开发布,极大地促进了该方法的可及性、可重复性和后续发展,有助于计算化学和药物发现领域的研究人员直接利用或在此基础上进行改进。这项工作不仅证明在药物生成模型中整合合成化学知识是必要且有效的,也为未来开发更注重实用性的AI辅助药物设计工具指明了重要方向。