亚稳态蛋白质-蛋白质相互作用作为PROTACs的设计原理:来自RIPK1–VHL系统的见解
《JACS Au》:Metastable Protein–Protein Interactions as a Design Principle for PROTACs: Insights from the RIPK1–VHL System
【字体:
大
中
小
】
时间:2026年05月11日
来源:JACS Au 8.7
编辑推荐:
高分辨率图像下载 MS PowerPoint 幻灯片
蛋白水解靶向嵌合体(PROTACs)通过稳定目标蛋白与 E3 连接酶之间的短暂、亚稳态蛋白质-蛋白质相互作用(PPIs)来消除与疾病相关的蛋白。这些瞬时的结合复合物是 PROTAC 活性的核心,但它们难以预测,而且通常无法
高分辨率图像下载 MS PowerPoint 幻灯片
蛋白水解靶向嵌合体(PROTACs)通过稳定目标蛋白与 E3 连接酶之间的短暂、亚稳态蛋白质-蛋白质相互作用(PPIs)来消除与疾病相关的蛋白。这些瞬时的结合复合物是 PROTAC 活性的核心,但它们难以预测,而且通常无法通过基于结构的或仅使用人工智能的建模方法来捕捉,因为这些方法更倾向于稳定、天然的相互作用。在这里,我们展示了明确考虑亚稳态 PPIs 为理性设计 PROTAC 提供了一个有效的原则。通过结合大规模分子动力学(MD)模拟和积分广义主方程(IGME)建模,我们绘制了受体相互作用的丝氨酸/苏氨酸蛋白激酶 1(RIPK1)与冯·希佩尔-林道(VHL)E3 连接酶之间的所有亚稳态 PPIs,并确定了四个适合降解剂结合的独特 PPIs。我们发现不同的 PPIs 更倾向于适应不同的接头结构,这为一个反直觉的实验观察提供了机制上的解释:即具有非常短和非常长的接头的 PROTAC 也能持续显示出强大的降解效果。基于这一见解,我们建立了一个用于接头设计的虚拟筛选工作流程,并确定 VHL 配体上的苄基位置是一个可行的连接位点。合理设计的新 PROTACs 利用这一位点能够实现从亚纳摩尔到低纳摩尔的降解效力。我们的结果表明,将蛋白质动力学纳入降解剂设计显著扩展了可行的 PROTAC 设计空间。
1. 引言
受体相互作用的丝氨酸/苏氨酸蛋白激酶 1(RIPK1)是细胞命运的核心调节因子,它协调上游信号,这些信号要么导向促进生存的核因子-κB(NF-κB)信号通路,要么导向促进死亡的通路。其 N 端激酶结构域通过自磷酸化促进细胞死亡程序,而其中间结构域则介导支架功能,以组装调节促炎和促生存信号通路的信号复合体。RIPK1 的失调会破坏这种平衡,并与多种病理状况相关,包括炎症和自身免疫性疾病以及癌症。越来越多的证据表明,癌细胞可以利用 RIPK1 的支架功能将肿瘤坏死因子(TNF)信号从细胞死亡路径转向 NF-κB 激活的路径,从而促进细胞存活。特别是,在癌细胞中,持续的 RIPK1 依赖性 NF-κB 激活会诱导一种免疫抑制性趋化因子程序,导致 T 细胞和自然杀伤(NK)细胞浸润减少,并增强对免疫检查点阻断(ICB)的抵抗性。传统的 small-molecule 抑制剂仅针对激酶结构域,无法抑制这种支架功能,因此无法解决由 RIPK1 驱动的 ICB 抵抗性问题。靶向蛋白降解(TPD)通过消除整个 RIPK1 蛋白提供了一种有前途的解决方案,从而破坏其支架功能,并可能改善对免疫治疗的反应。在 TPD 策略中,蛋白水解靶向嵌合体(PROTACs)尤为突出。PROTACs 是由三个组成部分构成的双功能分子:一个与目标蛋白(POI)结合的配体,一个招募 E3 泛素连接酶(如冯·希佩尔-林道(VHL)或 Cereblon(CRBN)的配体,以及一个连接这两个配体的接头。通过同时结合 POI 和 E3 连接酶,PROTACs 诱导非天然蛋白质-蛋白质相互作用(PPIs),并促进三元复合物的形成。由此产生的空间接近性使 E3 连接酶能够催化 POI 的多泛素化,随后将目标蛋白导向由内源性泛素蛋白酶体系统进行的降解。这种事件驱动的作用机制使得 PROTACs 可以在亚化学计量剂量下发挥作用,并为靶向难以直接抑制的蛋白提供了一种强大的策略。多项概念验证研究表明,基于 VHL 的 PROTACs 可以有效降解 RIPK1。然而,关键机制问题仍未解决,针对 RIPK1 的 PROTACs 的有效设计空间也尚未得到系统探索。值得注意的是,我们之前的工作表明,尽管接头结构差异显著,PROTACs 仍然可以实现高效的 RIPK1 降解。我们在从约 8 ? 到约 16 ? 的不同接头长度范围内观察到了强效的降解剂。从静态结构的角度来看,这种广泛的接头长度容忍度难以合理解释。这一观察表明,RIPK1 和 VHL 可能通过多种不同的 PPIs 相互作用,而这些 PPIs 可以通过不同结构的接头差异化地被稳定,这种行为也在其他 PROTAC 系统中被报道过。此外,VHL 配体结合在一个相对浅的口袋中,并提供多个潜在的连接位点,进一步扩展了组合设计空间。然而,充分利用这一丰富的设计空间仍然具有挑战性,关键的瓶颈是全面且高质量的建模亚稳态 PPIs。三元复合物的共结晶结构难以获得,即使获得,它们也仅捕捉到本质上动态且异质的过程的静态快照。作为补充,已经开发了多种计算方法来推进 PROTAC 的发现。最近的深度学习生成模型(如 AlphaFold3 或 Boltz-2)在生物结构预测方面取得了显著成功。然而,由于这些模型主要基于进化保守的序列和实验解析的结构进行训练,它们优化了对天然、稳定 PPIs 的预测,难以捕捉 TPD 策略依赖的亚稳态、瞬时结合复合体。对接方法在三元复合体建模中仍被广泛采用,但其性能很大程度上取决于构象采样、过滤和评分方法。此外,全原子分子动力学(MD)模拟提供了一种多功能方法,可以细化对接姿势,评估构象稳定性,并表征 PROTAC 三元系统的热力学和动力学特性。尽管如此,从 MD 模拟中系统且高效地映射 PROTAC 系统中所有亚稳态 PPIs 的全貌仍然是一个挑战。
马尔可夫状态模型(MSMs)为解决这一挑战提供了一个强大的框架。MSM 将构象动态描述为在固定时间间隔内的马尔可夫转换。为了使 MSM 具备预测能力,它必须基于足够长的 MD 模拟构建,以便动态变得近似马尔可夫。这一要求可能会限制其应用于更大系统和更长时间尺度。为了克服这一限制,开发了积分广义主方程(IGME)方法,通过时间积分记忆核明确纳入非马尔可夫效应,即使在较短的滞后时间下也能实现可靠建模。在之前的研究中,我们引入了一个基于物理的框架,结合蛋白质-蛋白质对接、大规模 MD 模拟和 IGME 建模,来评估与 Kirsten 老鼠肉瘤病毒癌基因同源物(KRAS)的 PROTAC 设计相关的所有亚稳态 POI–E3 结合复合物。这使得 PROTAC 设计能够基于一组具有连接能力的结合复合物而不是单一的静态结构来进行指导。在这项研究中,我们展示了明确考虑亚稳态 PPIs 可以实现 RIPK1 的合理和预测性 PROTAC 设计。具体而言,我们使用大规模 MD 模拟结合 IGME 建模来绘制适合降解剂结合的亚稳态 PPIs 集合(图 1c–d)。我们的 IGME 模型揭示了四个具有明确几何形状的独特结合复合物,每个复合物偏好不同的接头长度和连接位点。在这些亚稳态 PPIs 的指导下,我们评估了多个连接位点的接头可及性,并优先考虑了与特定 PPIs 兼容的 PROTAC 候选物(图 1e–f)。正如在 VHL 配体上的已知连接位点 2 所展示的那样,我们的结果为之前令人困惑的实验观察提供了一个机制上的解释:即具有非常短(例如化合物 216–11,约 8 ?;图 4)和非常长(例如化合物 225–5,约 16 ?)接头的 PROTAC 也能表现出有效的降解效力,因为这些接头稳定了不同的亚稳态 PPIs。利用这一见解,我们进一步确定了苄基位置(位点 3)作为一个可行的但之前未被充分利用的连接位点,并合理设计了利用不同 PPIs 的 PROTACs。实验验证确认,具有位点 3 的短接头(约 7 ?;化合物 269–2,图 5)和长接头(约 16 ?;269–10)PROTACs 都实现了从亚纳摩尔到低纳摩尔的 DC50 稳定性。我们的结果表明,明确纳入蛋白质动力学和结合复合物集合显著扩展了有效的 PROTAC 设计空间,超出了仅从静态结构推断出的范围。
图 1
图 1. 靶向 RIPK1 的新型 PROTACs 的理性设计总体流程。(a) 目标蛋白(POI)RIPK1 及其对应的 POI 配体结构。(b) E3 连接酶 VHL 及其 E3 配体结构。(c) 执行刚性蛋白质-蛋白质对接以生成 MD 模拟的初始种子。(d) 通过将 MD 模拟与 IGME 分析相结合来识别亚稳态 PPIs,并随后进行筛选。(e) 选择高溶剂暴露度、有利取向和适当接头长度的连接位点用于构建 PROTAC 接头。(f) 使用 DiffDock 对设计的接头候选物进行三元复合物建模,随后进行短 MD 模拟、结合自由能计算(MM/PBSA)和实验验证。
2. 结果与讨论
2.1. IGME 模型揭示了多种亚稳态 RIPK1–VHL PPIs
在理性 PROTAC 设计中,一个核心问题是目标蛋白与 E3 连接酶之间有多少种不同的亚稳态 PPIs 可以被利用,以及这些 PPI 几何形状是否可以通过不同的接头设计来利用。对于 RIPK1–VHL 系统,我们发现相互作用景观并不是由单一的三元排列主导的。相反,RIPK1 和 VHL 会采样多种亚稳态结合复合物 PPIs,每种 PPI 具有潜在的、可与降解剂结合的独特几何形状。为了表征这一集合,我们对 RIPK1 与其配体 GSK’074(图 1a)以及 VHL 与其配体 Me-VH032(图 1b)的结合进行了大规模 MD 模拟。作为 II 型抑制剂,GSK’074 稳定了 RIPK1 的 DLG-out 失活状态,防止其转变为活跃构象。因此,我们的模拟仅采样了与失活状态相关的结合复合物。有意省略了接头,以允许这两种蛋白自由探索与三元复合物形成相关的相对取向。初始结合配置是通过 HDOCK 程序使用刚体蛋白质-蛋白质对接生成的,并作为广泛 MD 模拟的起点。总共在 Folding@home 平台上积累了大约 420 微秒的全原子 MD 轨迹(见方法部分,SI 文本第 1 节和图 S1 详细信息)。对这些 MD 轨迹的分析表明,RIPK1 和 VHL 之间的相对运动高度异质,主要由蛋白质间重排而不是内部构象变化主导。为了捕捉这种行为,我们以蛋白质间 Cα–Cα 距离作为输入特征来描述 PPI 的形成。经过特征选择(87)和使用时间滞后的独立成分分析(tICA)(88–90)进行降维后,MD 构象被聚类(91)为 100 个微状态,并进一步归纳(92,93)为六个亚稳态(图 2a)。这些亚稳态对应于具有特征性界面几何形状的不同结合复合物 PPIs(见图 2d、图 S2–S3 和 SI 文本第 2.3 节详细信息)。
图 2
图 2. 从 IGME 模型中识别的 RIPK1 和 VHL 之间的亚稳态蛋白质-蛋白质界面。(a) 投射到前两个 tICA 组件上的自由能景观。微状态中心显示为点:状态 I(橙色),状态 II(青色),状态 III(蓝色),状态 IV(红色),状态 V(绿色),状态 VI(紫色)。(b) 六个亚稳态的界面 RMSD 值,以及平均值和标准差。(c) 六个亚稳态的埋藏表面积(BSA),以及平均值和标准差。(d) 六个亚稳态的代表性结构和种群。RIPK1 以海洋色调显示,VHL 以鲑鱼色调显示。种群值是从排名前 5% 的 IGME 模型中得出的平均值。所选结构对应于每个亚稳态中最具代表性的微状态的中心。
为该系统构建的传统马尔可夫状态模型(MSMs)无法准确再现六个亚稳态的长时间尺度动态。特别是,6 状态的 MSM 在 150 ns 的滞后时间未能通过 Chapman–Kolmogorov 测试(图 S4d),表明 RIPK1–VHL 结合复合物的形成具有明显的非马尔可夫动态。为了解决这一挑战,我们应用了 IGME 框架,该框架通过时间积分记忆核明确纳入了动态记忆效应。对于这个系统,我们使用滞后时间 <100 ns 的轨迹数据构建了 IGME 模型。如图 S4b 所示,跨广泛超参数范围构建的 IGME 模型获得了始终如一的较低均方根误差(RMSE)值,其中排名前 5% 的模型的平均 RMSE 值低至 2 × 10–4。这与图 S4d 中的 MSM 相比有显著改进,后者的 RMSE 大约为 1 × 10–3。重要的是,IGME模型成功通过了Chapman–Kolmogorov测试,证实了它们能够捕捉RIPK1–VHL结合复合物形成的动态过程,如图S4d所示。基于验证的IGME分析,我们量化了六个亚稳态的热力学群体和动力学稳定性(图2d和图S5)。所有六个状态都有一定程度的存在(>5%),表明RIPK1和VHL在生物学相关的时间尺度上可以形成多种结合复合物的几何结构。
2.2 筛选适合进一步连接子设计的PPIs
存在多个亚稳态PPIs为降解剂设计提供了优势,因为不同的结合复合物具有不同的几何结构,可以通过不同的PROTAC连接子进行选择性稳定。然而,并非所有亚稳态PPIs都同样适合合理的连接子设计。为了识别可能支持有效三聚复合物形成的结合PPIs,我们使用了包括结构异质性、结合模式和界面埋藏程度在内的多种标准来评估这六个亚稳态的RIPK1–VHL PPIs。我们首先检查了IGME模型确定的六个亚稳态的结构特征(图2d)。蛋白质间Cα–Cα距离图(图S6)显示每个状态都采用了独特的PPI几何结构,RIPK1和VHL之间的间距变化较大。状态I和III展现出紧密的相互作用模式,而状态VI只显示少数局部接近区域。残基级别的接触频率分析(图S7)进一步表明,每个界面都由一组独特的残基稳定。按残基类型进一步分析(图S9)显示,在RIPK1和VHL中,带电和极性残基贡献了更多的蛋白质间接触,表明静电相互作用在稳定这些结合复合物中起着重要作用。特别是,VHL中的Arg残基与RIPK1中的Glu残基之间的频繁接触表明盐桥在稳定几个结合复合物中起着重要作用(图S9)。
尽管所有六个状态的占有率都超过5%,因此具有足够的亚稳态性可以被PROTACs稳定,但还需要进一步筛选以确定适合合理连接子设计的PPIs。我们通过使用构成微态的中心作为参考,计算了每个状态内的界面均方根偏差(interface RMSD)来评估结构异质性。如图2b所示,五个状态(状态I至V)显示出适度的界面RMSD值,表明PPI界面相对明确且稳定。相比之下,状态VI的界面RMSD显著较高(>10 ?),反映出多样化的结合模式和高配置熵。状态VI的代表性结构叠加图(图S10)进一步证实了明显的构象变异性,表明该状态过于异质,不适合作为连接子设计的可靠候选者。
接下来,我们评估了每个亚稳态PPI的埋藏表面积(BSA),因为PROTAC介导的三聚复合物中较大的界面BSA已被证明与更强的结合力和更高的降解潜力相关。BSA是通过从结合复合物的总体积中减去单个蛋白质的溶剂可及表面积(SASA)计算得出的。如图2c所示,状态II和VI的BSA值显著小于其他状态。这一观察结果与高接触频率残基数量较少(图S8)一致,表明它们的相互作用模式较弱或更为短暂。根据上述标准,我们选择状态I、III、IV和V作为后续PROTAC连接子设计最有前景的PPIs。
2.3 识别亚稳态RIPK1–VHL PPIs上的可行连接位点
合理的PROTAC设计需要识别POI配体和E3配体上与特定结合复合物PPI的几何结构兼容的化学上可行的连接位点。我们的分析显示,连接子的放置受到RIPK1配体的强烈限制,但在VHL配体上则具有更大的灵活性,从而可以在不同的亚稳态PPIs之间选择性地利用多个可行的连接位点。为了量化连接子的可行性,我们首先通过计算RIPK1配体GSK’074(图3a)和VHL配体Me-VH032(图3b,详见方法和补充信息第4节)中所有重原子的溶剂可及表面积(SASA)来评估溶剂暴露情况。两种配体之间存在明显差异。GSK’074深埋在RIPK1激酶口袋内,显示出均匀较低的SASA值。按SASA对单个重原子进行排名(图S11)显示,只有连接到溶剂可及吡唑环的甲基基团超过了10 ?2,被确定为RIPK1配体上唯一可行的连接点(标记为Site C)。相比之下,Me-VH032结合在VHL的相对浅和溶剂可及的区域,为连接子的安装提供了更大的灵活性。与先前的实验研究一致,VHL配体上有五个 exit vector 可用于PROTAC设计(图3c):左侧(LHS)酰胺上的Site 1、苄基(S)-甲基上的Site 3、苯环上的Site 4和噻唑环上的Site 5。在筛选出的亚稳态PPIs中,这五个位点的SASA值通常都超过10 ?2,除了状态I和IV中的Site 2,由于空间拥挤减少了溶剂暴露(图S11)。
图3
图3. 筛选出的亚稳态状态的潜在连接位点识别。(a) RIPK1配体重原子的平均SASA。(b) VHL配体重原子的平均SASA。(c) 用于PROTAC设计的VHL配体上最常见的连接位点。(d–g) 分别适用于状态I (d)、状态III (e)、状态IV (f) 和状态V (g) 的连接位点。左图:VHL配体上的连接位点(Site 1–5)与RIPK1配体上的吡唑环甲基碳(Site C)之间的距离。红色条形表示适合连接子设计的位点,而灰色条形表示不适合的位点。中间图:蛋白质复合体和配体的相对位置的放大视图,显示了蛋白质表面。这些结构对应于每个亚稳态中最常见的微态中心。右图:每个亚稳态的最佳连接位点。
除了溶剂可及性之外,几何距离对连接子设计也施加了额外的限制。过长的连接子通常是不利的,因为它们会在三聚复合物形成过程中增加构象熵的成本,并且往往会通过增加分子量而损害类药性质,导致细胞渗透性降低和代谢脆性增加。因此,我们测量了GSK’074上的Site C与Me-VH032上五个潜在连接位点之间的距离,并认为平均距离低于15 ?是连接子构建的最佳选择。对于状态I(图3d),Site 1和2位于首选距离范围内。然而,Site 2由于 tert-丁基基团的空间拥挤而受阻,这从结构检查和较低的SASA中可以看出。Site 3和4略高于上限距离阈值,需要高度扭曲的连接路径,因此不太理想。结果,Site 1成为这种结合复合物PPI(状态I)的唯一可行连接点。在状态III(图3e)中,四个位点(Site 1–4)同时满足溶剂暴露和距离标准。Site 1–3采用的取向有利于从Site C直接建立几何上合理的连接路径。尽管Site 4由于苄基甲基的存在而存在一定的空间限制,但由于存在无甲基的类似物VH-032,它在化学上仍然是可行的。在状态IV(图3f)中,所有五个位点都处于可接受的距离范围内;然而,与状态I一样,Site 2受到空间阻碍,其平均SASA值低于10 ?2,因此剩下的四个位点是可行的候选者。相比之下,在状态V(图3g)中,只有Site 2位于最佳距离范围内,并且相对于Site C具有有利的取向,成为该状态的首选连接点。
我们的上述分析表明,不同的亚稳态RIPK1–VHL结合复合物对连接子的放置施加了不同的几何限制。与其使用单一的通用出口向量,不如选择VHL配体上的多个连接位点与特定的PPIs匹配,从而扩展PROTAC开发的可用设计空间。
2.4 不同的亚稳态PPIs更倾向于容纳短链和长链的Site-2连接子
在PROTAC设计中的一个反直觉现象是,具有非常不同连接长度的化合物可以表现出相似的高降解效力。对于针对RIPK1的PROTACs,尽管它们的几何结构明显不同,但据报道短链和长链的Site-2连接子都能实现强烈的降解效果。我们的亚稳态PPI框架为这一现象提供了机制上的解释:不同的RIPK1–VHL结合复合物施加了不同的几何限制,因此更倾向于容纳不同的连接长度。Site 2(VHL配体上的LHS酰胺;图4a)是VHL基PROTACs中最常用的连接点,因此为检验这一原理提供了理想的测试平台。在第2.2节中识别的亚稳态PPIs中,状态III和V为基于Site-2的连接提供了有利的几何结构和取向。重要的是,这两种结合复合物PPI在蛋白质间排列上存在显著差异,表明它们可能偏好不同的连接器架构。预计较短的连接子与紧凑的PPIs更兼容,而较长的连接子可能需要跨越更扩展的结合几何结构。
图4
图4. 用于PROTAC设计的Site-2连接子。(a) 含有各种Site-2连接子的PROTACs的化学结构。RIPK1配体及其连接位点以蓝色显示,而VHL配体及其相应的连接位点以红色显示。(b) 使用MM/PBSA计算的PROTAC分子的结合自由能。前50%的化合物显示为紫色,其余的显示为青绿色。平均值和标准偏差是通过自助法获得的。区分顶级和底层的阈值设定为?77 kcal/mol。(c) 如Zhang等人(31)报告的顶级化合物的降解效率。DC50表示使RIPK1蛋白水平降低50%的剂量,Dmax表示化合物实现的RIPK1蛋白的最大降低量。(d) 状态III中的216–15个化合物的结构。(e) 状态V中的225–5个化合物的结构。RIPK1用海洋色表示,VHL用鲑鱼色表示,POI配体用黄色棒球模型表示,E3配体用灰色棒球模型表示。连接子基序用洋红色棒球模型表示,与连接子有接触的残基用橙色棒表示。
为了实现这一见解并优先考虑可行的连接子设计,我们实施了一个多步骤的虚拟筛选工作流程来估计候选PROTAC分子的三元复合物稳定性。我们使用PROTAC与预形成的亚稳态PPIs的结合自由能来估计三元复合物稳定性,因为给定PPI的蛋白质-蛋白质结合自由能是固定的(详见方法和补充信息第5节)。该工作流程集成了亚稳态PPI结构、使用DiffDock的PROTAC对接(100)、MD松弛以及使用分子力学/泊松-玻尔兹曼表面积(MM/PBSA)方法的结合自由能计算(101,102)。我们通过将一系列Site-2 PROTACs对接到状态III和V的代表性结构中来评估它们,这些PROTACs涵盖了不同的连接长度和化学组成(图4a)。对于与两种状态都兼容的连接子,保留了低自由能的构象进行分析(图S13)。然后根据预测的结合自由能对这些化合物进行排名,选择前50%的可能性最高的作为形成有效三元复合物的候选者。如图4b所示,?77 kcal/mol的阈值清晰地将这一高端设计与表现较差的设计区分开来。值得注意的是,这种基于物理学的优先排序与实验降解数据高度相关。在前50%的化合物中,有五个化合物的Dmax值超过90%,且所有化合物的DC50值低于10 nM(图4c)。相比之下,排名较低的化合物显示出较弱的降解活性:没有一个化合物的DC50值超过90%,只有一个化合物的DC50值低于10 nM(图S14)。这些结果表明,在适当的亚稳态PPI背景下进行结合自由能评估为识别有效的Site-2 PROTAC连接子提供了实用且具有预测性的标准。
通过对代表性低自由能化合物的进一步分析,我们为实验观察结果提供了机制上的解释,即具有短链和长链连接子的Site-2 PROTACs可以表现出相似的高降解效力。在采用更紧凑结合几何结构的状态III中,更倾向于容纳较短的Site-2连接子。例如,在化合物216–15的具有有利结合自由能的构象中,连接剂采用了一种略微弯曲的构象,这种构象自然地适合III状态界面,并与RIPK1中的残基H102以及VHL中的残基N67、R69、F91和Y112形成稳定接触(图4d)。相比之下,V状态呈现出更扩展的蛋白质-蛋白质相互作用(PPI)几何结构,这种结构不利于短连接剂,但可以很容易地容纳较长的连接剂。在化合物225–5的低自由能构象中,扩展的连接剂跨越了更大的蛋白质间距离,并与RIPK1的残基Y308、E311和N312形成了额外的接触(图4e)。上述结果表明,连接剂长度并非由单一的“最佳”值决定。相反,当它们稳定不同的亚稳态RIPK1–VHL相遇复合物时,短连接剂和长连接剂都可以非常有效。这一发现解决了RIPK1 PROTACs中连接剂长度宽容性的表面悖论,并强调了一个通用的设计原则:有效的降解剂来自于将连接剂几何结构与它们优先稳定的特定亚稳态PPI相匹配,而不是针对单一静态三重组合物进行优化。
此外,在VHL配体上的苯基位置(位点2),我们发现了一个未被充分利用的附着位点。尽管这个位置在之前的研究中已经有一些探索(32),但它并没有被广泛采用,部分原因是缺乏一个将连接剂几何结构与兼容的蛋白质-蛋白质相遇复合物相匹配的系统框架。我们的分析表明,两种亚稳态RIPK1–VHL相遇复合物,即III状态和VI状态,为基于位点2的连接提供了合适但不同的PPI几何结构(图3e–f)。为了验证这一假设,我们评估了一系列不同长度连接剂的位点2 PROTACs(图5a)。结合自由能计算显示出明显的状态依赖性偏好(图S15)。在III状态下,采用紧凑的相遇复合物几何结构时,最短的连接剂化合物269–2(约7 ?)受到强烈青睐,其平均结合自由能低于-77 kcal/mol(图5b)。相比之下,在III状态下,逐渐延长的连接剂提供了越来越有利的结合自由能(图S15b),其中化合物269–8和269–10实现了最稳定的结合。
接下来,我们实验性地制备了一系列新的化合物库,并测试了这些预测(详见方法部分、补充信息第6-7节和图S16)。与计算分析一致,前三种优先考虑的位点3 PROTACs,即269–2、269–8和269–10,在细胞测定中均表现出强劲的RIPK1降解能力(图5c)。每种化合物的Dmax值均超过90%,DC50值低于10 nM。值得注意的是,最短的连接剂(269–2,约7 ?)和最长的连接剂(269–10,约16 ?)都实现了完全降解(Dmax = 100%),其中269–10的效力甚至低于纳米摩尔级别。尽管269–2的效力略低于269–10,但其最小的连接剂长度降低了整体分子量,从而在合成可及性和药代动力学特性上具有潜在优势。为了进一步评估位点3降解剂的潜在脱靶效应,我们用化合物269–10在不同的浓度下处理PC3细胞,并评估了RIPK1、RIPK3和磷酸化混合谱系激酶结构域样伪激酶(p-MLKL)的蛋白水平。如图S17所示,这些相关信号蛋白的水平没有显著变化,表明RIPK1的降解不会显著影响下游的坏死过程。我们进一步通过在PROTAC处理前用免费的RIPK1配体、VHL配体、蛋白酶体抑制剂MG132或neddylation抑制剂MLN4924预处理PC3细胞来检查降解机制。结果表明,所有预处理都有效恢复了RIPK1的水平,这表明降解需要同时涉及靶标和E3激酶的结合,并通过VHL依赖的泛素-蛋白酶体途径进行。
通过对低自由能构象的结构分析,我们为具有明显不同位点3连接剂长度的降解剂观察到的高降解效率提供了机制解释。在VI状态下,紧凑的几何结构使化合物269–2能够紧密地适应蛋白质-蛋白质界面,其中哌嗪环与RIPK1的残基H102形成稳定的疏水接触(图5d)。相比之下,III状态可以轻松容纳更长的连接剂结构。在269–10的低自由能构象中,扩展的连接剂与RIPK1的残基A21、E22、L33以及VHL的残基R69、H110和Y112形成了额外的相互作用(图5e)。因此,正如位点2的情况一样,短连接剂和长连接剂通过稳定不同的亚稳态RIPK1–VHL相遇复合物而成功。上述结果表明,虽然苯基位点3以前未被充分利用,但在明确考虑亚稳态PPI的情况下,它可以被稳健且可预测地利用。更广泛地说,我们的设计原则表明:有效的PROTACs来自于将连接剂几何结构和附着位点与特定的亚稳态相遇复合物PPI相匹配,而不是针对单一静态三重组合物进行优化。这种视角所启发的设计空间超出了已经实验验证的位点2和3。VHL配体上的其他附着位点,特别是位点1和4,可能提供额外的机会来利用多个相遇复合物,进一步提高降解剂的成功率。我们的基于物理的设计框架不依赖于VHL特有的结构特征,因此可以潜在地扩展到其他E3激酶,包括CRBN,前提是存在合适的初始结构。因此,我们预计将亚稳态PPI分析与化学合成和实验筛选的进步相结合,将为各种蛋白质-E3激酶系统的PROTAC发现提供一种通用且可转移的策略。
RIPK1参与多个具有不同细胞功能的信号复合体。在肿瘤坏死因子受体1(TNFR1)信号通路中,RIPK1在复合体I中作为支架促进促生存信号传导,而RIPK1的激活可以促进细胞死亡复合体(如复合体IIa和IIb)的形成。这些不同的复合体提出了一个问题:降解剂设计是否可以在原则上利用不同的RIPK1构象或RIPK1–VHL相遇复合物来实现选择性降解。然而,这种选择性不太可能仅通过激酶域的结合来实现。这些信号复合体的组装以及RIPK1的寡聚化主要由中间域和死亡域的相互作用介导(4,6,83,105-107),而这里开发的PROTACs则结合激酶域。因此,这些高级组装不预期会直接干扰VHL的募集。此外,已知激酶在生理条件下会在活性和非活性构象状态之间动态转换(108,109),允许优先结合某一状态的降解剂接触到更广泛的RIPK1群体。与这一观点一致,我们的II型抑制剂基降解剂(例如269–2和269–10)实现了完全降解(Dmax ≈ 100%),表明构象偏好并不限制降解只能发生在RIPK1的特定构象状态。
最近基于深度学习的生成模型(例如AlphaFold3(45)和Boltz-2(46))在复杂生物组装的结构预测方面取得了进展。通过利用进化序列信息和实验解析的结构,这些工具在模拟天然的、稳定的PPI方面表现出色。然而,PROTAC介导的降解依赖于稳定亚稳态的、短寿命的相遇复合物,而这些复合物通常不在这些模型的训练数据中体现。因此,直接将这些方法应用于PROTAC设计可能会导致异质性或弱的三重组合物。为了检查这一限制,在RIPK1–VHL系统中,我们应用Boltz-2(46)作为代表性的生成模型,对基于位点3的PROTACs进行了研究,这些PROTACs具有短(269–2,约7 ?)和长(269–10,约16 ?)的连接剂。对于短连接剂化合物269–2,Boltz-2预测的RIPK1–VHL方向与IGME建模识别出的方向大致一致。然而,由此产生的三重组合物仍然具有异质性,并且其BSA明显较小,蛋白质间接触点也较少(图S19a–e)。相比之下,对于长连接剂化合物269–10,Boltz-2一致预测了一个与IGME识别的亚稳态PPI不同的RIPK1–VHL方向。尽管在结构上看起来一致,所有Boltz-2预测的269–10复合体的BSA显著降低(约604 ?2对比IGME模型的约1766 ?2),蛋白质间接触点也较少,代表性结构的界面接触区域明显减少(图S19f–j)。这些结果表明,当直接应用类似AlphaFold的生成模型时,可能无法捕获降解剂功能所需的亚稳态PPI。相比之下,我们的基于物理的框架明确解决了定义PROTACs有效设计空间的动态集合体,使得连接剂的合理选择超越了仅凭静态或AI结构预测所能推断的范围。
最后,我们注意到三重组合物的稳定性本身并不能完全决定降解效率。其他因素,包括靶点上赖氨酸残基与泛素化机制的接近度和方向,以及下游的细胞过程,也会影响降解结果。在这种情况下,我们的虚拟筛选工作流程被视为一种高效且具有预测性的策略,用于优先选择在结构和动态上与有效PPI兼容的PROTAC候选者,从而将实验努力集中在最有前景的设计上。
总之,在这项研究中,我们展示了明确考虑亚稳态、短寿命的PPI可以为PROTAC设计提供一个强大的框架。通过绘制RIPK1与VHL E3激酶之间亚稳态相遇复合物的集合,我们证明了不同的PPI施加了不同的几何约束,因此优先适应不同长度和方向的连接剂。这一洞察解释了令人惊讶的实验观察结果:在已建立的位点2,短连接剂和长连接剂都能实现类似的最佳降解效果。根据这一原则,我们进一步进行了虚拟筛选,展示了当明确考虑亚稳态PPI时,VHL配体上的一个未被充分利用的苯基附着位点(位点3)可以稳健地被利用。使用新设计并合成的PROTAC库进行的实验验证证实,无论是短连接剂(化合物269–2)还是长连接剂PROTACs(269–10)(具有位点3附着),都能实现亚纳米到低纳米摩尔的降解效力。总之,我们的结果确立了亚稳态相遇复合体,而非单一的静态三重组合物,作为设计目标,并提供了一种通用的、基于物理的策略,用于扩展可访问的设计空间并提高PROTAC发现的成功率。涉及氢的原子的键合是通过LINCS方法进行约束的。(122) 在平衡过程中,温度使用速度重标定恒温器(123)维持在300 K(τ = 0.1 ps),压力使用Berendsen压强计(124)控制在1 bar(τ = 0.5 ps)。生产模拟是在OpenMM 8.0.0(125)中进行的,采用NVT系综和Langevin中间积分器(时间步长2 fs,摩擦系数1.0 ps–1)。在经过10 ns的局部模拟后,最终结构被用于启动大规模的Folding@Home(85,86)模拟。最终数据集包含了来自31个种子结构的轨迹,总长度约为420 μs。有关系统设置和全原子模拟的更多详细信息,请参阅补充信息第1节和图S1。
4.2 微状态MSM构建与验证
使用VHL和RIPK1之间的Cα–Cα成对距离作为输入特征。所有VHL的Cα原子以及RIPK1中的每隔一个Cα原子被包括在内,共得到22,022个特征。然后,通过光谱加速顺序非相干选择(spectral oASIS)(87)方法挑选出最重要的2,000个特征(图S2a)。这些特征进一步通过tICA(88?90)进行投影,以最大化时间延迟自相关来识别慢速集体变量(CVs)。接着使用K-means聚类算法(91)将这些构象聚类成微状态。超参数(包括CV的数量、tICA延迟时间和微状态的数量)通过广义矩阵Rayleigh商(GMRQ)(126)得分进行交叉验证优化。基于此分析,选择了tICA延迟时间30 ns、4个CV和100个微状态(图S2b–d)。所得到的微状态MSM模型通过隐含时间尺度和Chapman–Kolmogorov检验进行了验证(图S3)。有关更多详细信息,请参阅补充信息第2节。
4.3 IGME模型构建与验证
使用经过验证的微状态MSM,通过Robust Perron Cluster Analysis(PCCA+)(92,93)方法将100个微状态进一步合并为6个亚稳态。选择这6个亚稳态是因为它们在IGME模型中产生了相对较低的均方根误差(RMSE,见公式S7)(图S4a)。对于IGME的构建,两个常数矩阵A和T?(公式S6)使用最小二乘法(LSF)(76)对MD数据进行了数值拟合。然后对超参数(τKtrial和L)进行系统搜索,以找到能够最小化预测RMSE的最优模型(图S4b)。选择RMSE值最低的前5%的模型来估计T?并表征系统的动力学和热力学特性。有关更多详细信息,请参阅补充信息第3节。
4.4 PROTAC建模与结合自由能计算
在每个亚稳态内,通过选择稳定种群比例大于1%的微状态来定义一个“核心区域”。从每个核心区域随机选取200个MD快照。从这些结构中移除配体,以生成用于对接的VHL–RIPK1受体集合。对于与给定亚稳态的几何约束(包括连接器和结合位点)兼容的每个PROTAC分子,使用DiffDock(100)和默认参数对这些受体结构进行对接。对接后的构象根据未叠加配体时的配体RMSD进行排名,每个PROTAC-状态对中选择RMSD最低的5个构象进行10 ns的全原子MD模拟。生产模拟是在NPT系综中进行的,使用速度重标定恒温器(123)(τ = 0.1 ps, 300 K)和Parrinello–Rahman压强计(127)(τ = 2 ps, 1 bar)在GROMACS 2022.5121中进行。使用gmx_MMPBSA工具(102)基于MM/PBSA方法(101,102)计算每个轨迹的最后5 ns的结合自由能。通过五个轨迹的自助重采样来估计系综平均结合自由能和不确定性:对于10次自助迭代,每次迭代都进行替换重采样并取平均值,最终结合自由能和统计误差作为自助集的平均值和标准差。为了保持系统间的一致性,在模拟和能量计算中排除了位于位置3的氟环丙基基团。对于化合物269–2和269–10,使用与MD模拟中相同的蛋白质序列通过Boltz-246共折叠方法生成了额外的三元复合物结构。每个化合物生成了五个结构。有关DiffDock和Boltz-2建模以及结合自由能计算的更多详细信息,请参阅补充信息第5节。
4.5 化学合成
所有反应均在干燥的氩气正压下进行,反应容器在使用前已经过烘烤。反应混合物的无水溶液通过经过烘烤的注射器或套管传输。除非另有说明,否则所有溶剂在使用前均已干燥。薄层色谱(TLC)使用预涂硅胶板进行。闪柱色谱使用硅胶柱完成。1H和13C核磁共振(NMR)谱在Bruker 400 MHz仪器上录制。1H NMR谱以百万分之一(ppm)为单位报告,参考7.26 ppm的CDCl3或参考DMSO-d6中2.50 ppm处的分裂线。信号分裂模式描述为单峰(s)、双峰(d)、三峰(t)、四峰(q)、五峰(quint)或多峰(m),其耦合常数(J)以赫兹(hertz)为单位。高分辨率质谱(HRMS)在电子喷雾注射(ESI)TOF质谱仪上进行。最终产物的HPLC光谱分析使用Shimadzu CMB-40系统进行,色谱分离使用Shimadzu Nexcol C18柱(5 cm × 3.0 mm, 5 μm)。检测使用Shimadzu SPD-40 LC/MS和多模式电喷雾离子化加常压化学离子化。流动相分别为0.1%甲酸水溶液(A)和0.1%甲酸MeCN溶液(B)。梯度在10分钟内从5%升至100%,然后保持100%的B浓度5分钟,之后立即降至5%进行5分钟的重新平衡。流速设置为1.0 mL/min。柱温设置为30 °C。所有最终化合物的纯度通过LC–MS测定都超过95%。有关化学合成的更多详细信息,请参阅补充信息第6节。
4.6 西部印迹
PC3细胞在添加了10%胎牛血清和1%青霉素-链霉素的RPMI-1640培养基中培养,温度为37 °C,置于加湿的5% CO2培养箱中。西部印迹操作按照之前的描述进行(31,128)。细胞在RIPA缓冲液中裂解,蛋白质浓度通过BCA试剂盒测定。等量的蛋白质通过SDS-PAGE分离,转移到PVDF膜上,并用针对RIPK1和β-Actin的抗体进行探测。结合的抗体通过ECL试剂盒(Bio-Rad)可视化,图像使用ChemiDoc MP成像系统(Bio-Rad)捕获。抗体购自Cell Signaling Technology,包括Anti-RIPK1(CS#3493)、Anti-RIPK3(CS#10188)、Anti-Phospho-MLKL(CS#91689)、Anti-β-Actin(CS#3700)和HRP标记的兔抗IgG(CS#7074)。
参考文献
支持信息
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号