综述:PROTAC药物发现的计算方法进展

《Drug Discovery Today》:Advances in computational methods for PROTAC drug discovery

【字体: 时间:2026年02月20日 来源:Drug Discovery Today 7.5

编辑推荐:

  本文系统综述了靶向蛋白降解嵌合体(PROTAC)这一革命性策略中计算与人工智能方法的最新进展。文章重点讨论了如何利用化学信息学、结构生物信息学、分子建模和机器学习等工具,克服PROTAC结构复杂性和类药性挑战,实现对靶点蛋白的精准诱导降解。作者详细评述了用于弹头与连接体设计、三元复合物建模以及降解效率和ADMET属性预测的计算资源,并指出了当前局限与未来方向,为加速该领域发展提供了重要指引。

  
蛋白降解是细胞调节蛋白质稳态、清除错误折叠或损伤蛋白的关键生化过程。其中,泛素-蛋白酶体系统是真核生物中主要的蛋白水解途径。20S蛋白酶体作为26S蛋白酶体的催化核心,在这一过程中扮演着核心角色。基于此,一种革命性的药物发现策略——靶向蛋白降解嵌合体(PROTAC)应运而生。与需要直接占据靶点蛋白活性位点并抑制其功能的传统小分子抑制剂不同,PROTAC通过一种“事件驱动”的机制发挥作用。它就像一个精密的分子桥梁,其三部分组成:一端是结合E3泛素连接酶的配体(锚定体),另一端是结合目标蛋白(POI)的配体(弹头),中间则由一个灵活的连接体将两者共价连接起来。这种结构使得PROTAC能够将目标蛋白与E3连接酶拉近,从而诱导目标蛋白被泛素化标记,最终被蛋白酶体识别并降解。这个过程在文章中通过一张示意图被清晰地展示出来,描绘了从PROTAC分子结构到最终靶蛋白被降解的完整机制链。
这种独特的作用机制带来了显著优势,特别是能够靶向那些因缺乏传统可成药结合口袋而难以用常规抑制剂干预的“不可成药”靶点。同时,由于PROTAC的降解作用是催化性的,它无需与靶点蛋白保持极高的结合亲和力,这在理论上可能降低因靶点突变而产生的耐药风险。然而,PROTAC的分子量更大、结构更复杂,通常超出了Lipinski五规则(Ro5)等传统小分子类药性规则的范畴,进入了大五规则(bRo5)化学空间。这意味着它们在口服生物利用度、细胞渗透性等ADMET(吸收、分布、代谢、排泄和毒性)性质方面面临独特的挑战,其优化策略也完全不同于传统小分子药物。
在临床开发方面,PROTAC已展现出巨大潜力。尽管尚无基于PROTAC的疗法获得正式批准,但已有超过30个候选药物进入了临床开发阶段。文章中展示了一些代表性候选药物的化学结构,例如靶向降解雌激素受体(ER)用于治疗乳腺癌的vepdegestrant(ARV-471,已进入III期临床),以及靶向降解雄激素受体(AR)的ARV-766等。
为了应对PROTAC设计的复杂性,计算和人工智能驱动的方法已成为不可或缺的工具。计算机辅助药物设计(CADD)和人工智能驱动的药物设计(AIDD)正在加速PROTAC的开发进程。这些方法贯穿于从靶点识别到候选化合物优化的全流程。一个典型的PROTAC理性设计工作流通常始于疾病相关靶点蛋白的识别,随后是合适的E3连接酶及其配体的选择,以及能够结合POI的小分子弹头的发现或优化。然后通过理性或生成式的连接体设计策略,将各个组分组装成候选PROTAC。最终,通过三元复合物的结构建模来评估其有效性并预测降解能力。下图清晰地勾勒了这一整合性的设计优化路径。
计算资源在支持PROTAC设计的各个环节发挥着核心作用。首先,一系列专门的数据资源为研究提供了基础。例如,PROTAC-DB和PROTAC-Pedia等数据库系统性地收集了经过实验验证的PROTAC结构、活性数据等信息;E3 Atlas和ELIOT等数据库则整合了E3连接酶及其口袋的结构与功能信息。这些高质量的标注数据是后续建模和分析的基石。
连接体是PROTAC设计优化的核心元件。其长度、化学组成、柔韧性以及连接位点(出口向量)的微小变化,都可能显著影响三元复合物的稳定性、几何构型,从而决定最终的降解效率和药代动力学(PK)性质。为了应对这一复杂挑战,涌现出了多种用于连接体设计的计算工具。例如,DRLinker是基于深度学习的工具,能在结构约束下生成连接体;SyntaLinker和DiffLinker则分别基于深度学习和扩散模型,生成连接预设分子片段的、可合成的连接体;Link-INVENT则利用生成式强化学习框架进行从头连接体设计。这些工具有助于快速探索连接体的化学空间,优化其性质。
机器学习模型也被开发用于预测PROTAC的降解活性和优化分子设计。PrePROTAC和DeepPROTACs等框架能从分子描述符或结构特征预测降解潜力,用于早期活性筛选。PROTAC-RL等强化学习模型则可用于从头生成符合特定约束的PROTAC分子。
在结构建模层面,准确预测POI、E3连接酶和PROTAC三者形成的三元复合物结构至关重要,这直接关系到设计的成败。传统的蛋白-配体对接软件(如AutoDock Vina、GOLD)可用于分别预测弹头和锚定体与各自靶点的结合模式,确定合适的出口向量。而要模拟PROTAC诱导下两个蛋白质的相互作用,则需要使用蛋白-蛋白对接工具(如FRODOCK、HADDOCK、RosettaDock)来探索它们之间的相对取向。此外,专门为PROTAC设计的工作流(如PRODE、P4ward)整合了对接和连接体建模,能够更系统性地生成和评估三元复合物。分子动力学模拟(使用GROMACS、AMBER、NAMD等软件)则进一步提供了动态视角,用于分析连接体柔性、三元复合物稳定性以及相互作用能量随时间的变化,为优化设计提供了关键见解。
尽管计算工具取得了显著进展,但PROTAC的设计与建模仍面临诸多挑战。由于PROTAC分子处于bRo5化学空间,传统的基于小分子(Ro5)数据训练的ADMET预测模型(如SwissADME、ADMETlab)往往不适用,其预测准确度受限。研究表明,对于PROTAC这类大分子、高柔性的化合物,基于三维构象描述符的预测更为有效。例如,回转半径(Rgyr)和三维极性表面积(3D PSA)比简单的分子量或二维氢键供体/受体计数更能反映分子的通透性和口服吸收潜力。结构紧凑、回转半径小(通常在5-7 ?)、极性表面积低的PROTAC往往表现出更好的细胞渗透性。这种分子能够根据环境改变构象以降低极性(即“变色龙特性”),是其获得良好口服生物利用度的关键因素之一。
另一个核心挑战是三元复合物的建模。PROTAC的生物活性不仅取决于二元结合亲和力,更依赖于三元复合物的动态组装和协同性。当前的对接方法在模拟这种由柔性双功能分子诱导的非天然蛋白-蛋白相互作用时,往往受限于简化的打分函数和有限的构象采样,预测精度有待提高。此外,实验解析的三元复合物高分辨率结构数据仍然稀缺,这极大地限制了对模型的验证和基于结构的理性设计。
机器学习方法的应用也受限于数据。尽管有PROTAC-DB等数据库,但与拥有数百万化合物的传统小分子数据库相比,高质量、标准化的PROTAC降解活性、渗透性及复合物稳定性数据仍然匮乏。数据异构性和稀缺性制约了复杂深度学习模型的训练和泛化能力。为应对此问题,可以利用生成对抗网络(GAN)等生成模型进行数据增强,或采用在大规模通用化学数据集上预训练,再在较小的PROTAC数据集上进行微调的迁移学习策略。
总而言之,PROTAC代表了药物发现领域的一种范式转变,为攻克“不可成药”靶点开辟了新路径。然而,其独特的结构和作用机制也带来了前所未有的设计复杂性。计算与人工智能方法,从结构建模到数据驱动的预测与生成,正成为推动该领域发展的关键引擎。展望未来,PROTAC的发现将更依赖于高质量实验数据与多尺度计算方法的深度整合。标准化、大规模降解数据集的建立,更多三元复合物实验结构的解析,以及开发能够链接PROTAC结构与其下游生物学效应(如泛素化效率和细胞降解能力)的计算框架,将是加速理性设计、克服现有瓶颈并最终实现其临床转化潜力的重要方向。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号