ComTarget:基于组合建模的小分子靶点预测

《Pharmaceuticals》:ComTarget: Small-Molecule Target Prediction with Combinatorial Modeling Yuzhu Li, Qingyi Shi, Xingjie Lu, Daiju Yang, Dilixiati Yeerken, Huizi Jin and Qingyan Sun

【字体: 时间:2026年05月01日 来源:Pharmaceuticals 4.8

编辑推荐:

  背景:识别生物活性化合物的潜在靶点对阐明作用机制和药物开发至关重要。方法:本研究介绍了ComTarget,这是一种计算工具,它集成了三维分子形状相似性分析(基于组合三维描述符,C3DD)与反向对接,以预测小分子蛋白靶点。ComTarget针对源自26,272个

  
背景:识别生物活性化合物的潜在靶点对阐明作用机制和药物开发至关重要。方法:本研究介绍了ComTarget,这是一种计算工具,它集成了三维分子形状相似性分析(基于组合三维描述符,C3DD)与反向对接,以预测小分子蛋白靶点。ComTarget针对源自26,272个PDB复合物的4429个独特蛋白靶点库进行筛选。结果:在基准数据集(DEKOIS 2.0和DUDE-Z)上的验证表明,C3DD分子相似性计算方法通过捕获仅靠化学拓扑无法显现的关键三维形状信息,有效富集了活性配体。其性能优于传统的二维指纹方法,并在形状敏感性和计算效率之间提供了有利的平衡,作为集成工作流程内的快速预筛选过滤器。对于FDA批准的药物(如伊马替尼、阿司匹林)和天然产物(如小檗碱),ComTarget识别出的靶点与文献报道的治疗靶点或被推定脱靶一致,同时也揭示了与化合物药理机制一致的潜在靶点。结论:作为一个本地程序,ComTarget在计算资源定制方面提供了灵活性,可免费用于多药理学研究、药物重定位和不良反应预测。
论文解读:ComTarget——整合三维形状相似性与反向对接的小分子靶点预测工具
研究背景、问题与目的
在现代药物研发中,识别生物活性化合物的潜在靶点对于阐明药物作用机制和推动新药开发至关重要。然而,许多化合物因临床试验中出现的毒性副作用而失败或被撤市。尽管现代药物发现侧重于开发针对特定靶点且具有高效力和选择性的药物,但多药理学(Polypharmacology)的概念日益受到重视,即通过设计单一分子同时作用于多个靶点来治疗复杂的多因素疾病。然而,多靶点药物的开发面临巨大挑战,特别是从庞大的候选库中实验鉴定实际靶点成本高昂。计算机辅助靶点预测(也称为“靶点垂钓”)因此成为实验鉴定的重要替代方案。现有的计算方法主要分为配体(Ligand)和受体(Receptor)两类,前者受限于已知化学信息的覆盖范围,后者则受限于蛋白质结构数据的稀缺性和对接打分的不准确性。此外,许多现有工具以网络服务形式提供,限制了其适应多样化研究需求的灵活性。为解决这些挑战,研究人员开发了ComTarget这一本地化工具,旨在通过整合三维分子表面形状相似性比较与反向对接,提供一种高效、灵活的靶点预测解决方案。该研究成果发表在《Pharmaceuticals》期刊上。
关键技术方法
研究人员构建了包含来自26,272个PDB条目的4,429个独特蛋白靶点的库。核心技术流程包括:(1)采用组合三维描述符(Combined 3D Descriptors, C3DD)进行三维分子形状相似性计算,该方法基于几何矩不变量和紧凑性测量;(2)利用AutoDock Vina 1.1.2进行反向对接;(3)引入归一化差异打分(DetScore)以校正不同蛋白系统间的打分偏差,实现跨靶点的可比排序。案例研究对象涵盖FDA批准药物及天然产物。
研究结果
  1. 1.
    引言(Introduction)
    研究人员指出,单药多靶点是药物研发的重要方向,但实验验证成本高昂。ComTarget旨在通过结合配体相似性(三维形状)与受体结构特征,克服单一策略的局限性,提供了一个开源、本地的计算平台。
  2. 2.
    结果(Results)
2.1 配体相似性搜索中C3DD的评估
通过在DEKOIS 2.0和DUDE-Z基准数据集上的测试,研究人员评估了C3DD的性能。结果表明,C3DD的平均AUC(Area Under the Curve)分别为0.617和0.613,虽低于部分高级三维比对工具(如ROSHAMBO),但显著优于传统二维指纹(如ECFP4、MACCS)。在早期富集因子(EF5%)方面,C3DD表现优异(DEKOIS上为3.42,DUDE-Z上为3.19),证明其在虚拟筛选初期能有效浓缩活性分子。C3DD的优势在于无需分子叠合,计算效率高,适合作为大规模库筛选的预处理步骤。
2.2 反向对接部分
研究人员构建了包含4,429个靶点的蛋白-配体复合物库。通过对原始配体的重对接验证了AutoDock Vina打分的波动性,确立了使用归一化差异打分(DetScore)而非原始打分的必要性,以消除靶点特异性的打分偏差。
2.3 ComTarget的有效性验证
通过对23个治疗相关靶点(涵盖激酶、酶、核受体等)的69个已知活性配体进行测试,ComTarget实现了100%的召回率(正确靶点均排名在前200位内)。平均AUC高达0.950 ± 0.071,早期富集因子EF1%和EF5%分别达到18.0和12.5,证明了该集成工作流在靶点识别中的高精度和强早期富集能力。
2.4 描述符计算运行时测试
研究发现,C3DD描述符的计算时间随原子数增加略有上升(少于50个原子时低于0.15秒),相似性搜索耗时约0.16秒,表明预筛选步骤极其高效。反向对接是计算瓶颈,其耗时取决于分子大小和对接盒子尺寸。
2.5 测试用例
研究人员选取了伊马替尼、阿司匹林、氟西汀、地西泮、阿托伐他汀五种常见药物以及小檗碱和隐丹参酮两种天然产物进行测试。
  • 伊马替尼:成功预测了ABL1、PDGFRA、KIT等主要靶点,并结合已知药理机制解释了预测结果。
  • 阿司匹林:虽然未能将COX-1/2排在前列(归因于PDB中结构缺失),但成功识别了磷脂酶A2(PLA2)等中等亲和力脱靶。
  • 氟西汀:正确识别了血清素转运体(SERT)和主要组胺H1受体(HRH1)。
  • 地西泮:正确识别了GABRB2和GABRA5亚基。
  • 阿托伐他汀:正确识别了HMG-CoA还原酶和ABCB1转运蛋白。
  • 小檗碱与隐丹参酮:展示了工具在天然产物多靶点机制探索中的应用潜力。
2.6 与相似性集合方法(SEA)的比较
与基于配体化学相似性原理的SEA相比,ComTarget表现出不同的预测特征。SEA擅长召回已知配体注释丰富的家族,而ComTarget作为结构驱动的工具,能够识别缺乏已知配体注释但具有互补三维空间性质的靶点,体现了其“骨架跃迁”(Scaffold-hopping)的潜力。
  1. 3.
    讨论(Discussion)
    研究人员讨论了C3DD在捕获三维形状互补性方面的优势及其作为高效预过滤器的价值。ComTarget通过整合配体和受体策略,克服了单一方法的局限,且本地化部署提供了更高的灵活性。研究还指出了频繁预测到碳酸酐酶2(CA2)的原因,主要归因于PDB中CA2结构的丰富性及其口袋的物理化学性质。局限性在于反向对接计算量大、目标库依赖PDB实验结构以及输入构象质量的影响。未来计划通过并行计算和整合AlphaFold3预测结构来改进。
  2. 4.
    结论(Conclusions)
    综上所述,ComTarget通过整合三维分子形状相似性和反向对接,为小分子靶点预测提供了一种实用的本地解决方案。它不仅有效识别了治疗靶点和脱靶,还在多药理学、药物重定位和不良反应预测方面显示出应用潜力。作为一个免费的开源工具,ComTarget有望成为解析复杂药物作用机制和辅助多靶点药物发现的有用资源。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号