《Journal of Medicinal Chemistry》:Thermodynamic Data Remain a Hot Tip for Decoding Binding Affinity and Water Impact on Protein–Ligand Complex Formation to Assist Lead Optimization
编辑推荐:
这篇综述深入探讨了将结合亲和力分解为焓(ΔH0)和熵(?TΔS0)贡献的热力学策略,及其在先导化合物优化中的应用。文章强调,通过等温滴定量热法(ITC)获取的热力学数据,结合结构生物学和分子动力学模拟,能够揭示水分子、质子化状态以及配体预组织等复杂因素对结合特征的深远影响,从而为克服普遍存在的焓熵补偿现象、实现更合理的药物设计提供关键洞见。
引言
在药物发现项目中,将筛选得到的苗头化合物优化为有前景的先导候选物,通常依赖于理性设计概念。早期阶段,配体对其生物靶标的效力或亲和力是追踪和验证后续设计步骤成功与否的关键属性。配体亲和力通常以结合常数(Ki, Kd或 Ka)或半数抑制浓度(IC50)表示,并与吉布斯结合自由能(ΔG0)对数相关。ΔG0可加性地分解为焓变(ΔH0)和熵变(?TΔS0)贡献。了解这种分解是否能支持所选的设计策略是一个核心问题。
数据来源、质量与校正
为了进行旨在确定配体结合热力学特征决定因素的分析,必须以高度可控和统一的方式收集和校正多个蛋白-配体复合物的数据点。本文的分析基于作者研究小组在过去20年中一致收集和验证的数据,共包括266个数据点。配体数据经过验证,并在必要时对叠加的质子化步骤变化进行了校正。例如,配体1在结合蛋白质时会获取一个质子,而结构相关的配体2则保持不带电。因此,1的焓熵分配强烈依赖于测量所选用的缓冲体系。质子化状态的变化会叠加在结合过程测量的热信号上,因此使用磷酸盐和醋酸盐等缓冲液有助于最小化缓冲液依赖性热效应。
数据表征与分析
266个配体-蛋白质复合物(蓝色圆点)和55个内肽酶片段复合物(洋红色圆点)的数据显示在ΔH0对?TΔS0图中H0versus –TΔS0diagram.">。该图被分为红色和绿色区域,分别表示熵或焓主导结合的区域。单个复合物的ΔG0贡献沿着主对角线增加,变化范围约为?10至?55 kJ/mol,这反映了药物化学家可优化的范围。垂直方向上,ΔH0(?110至0 kJ/mol)和?TΔS0(?40至+70 kJ/mol)的数据分散在超过6倍大的范围内,但并未改善ΔG0。这种巨大的分散表明了众所周知的焓熵补偿现象。尽管没有物理定律定义蛋白-配体复合物中这两种热力学性质的相互补偿,但这一观察表明,优化一种性质往往会被另一种性质的补偿效应所抵消。
具有显性焓驱动结合特征的复合物通常在深埋的蛋白质口袋中包含极性和可能带电的基团,以增强氢键(如图1a中的1或3)。最具熵驱动结合特征的复合物则由刚性配体形成,这些配体具有较少的可旋转键并装饰有疏水基团(例如8)。这些观察表明,增加分子大小、进行正确刚性化或连接更多疏水(通常是芳香族)取代基等优化,将导致结合熵的增加。
提升焓与熵特征以改善亲和力
为了追踪结合特征变化的细节,我们考虑密切相关的复合物对之间热力学特征的相对变化(即ΔΔX0值,X= G, H, 或 S),其中晶体学分析已确认结合模式未变,并且可能叠加的质子化状态变化效应已被考虑。
第一个例子涉及凝血酶深埋的S1口袋的占据,该口袋远端包含一个带电荷的天冬氨酸残基。配体3通过其二邻位二氨基吡啶部分与天冬氨酸189形成强大的电荷辅助氢键网络,并显示出图1中所有复合物中最强的焓特征。与未取代的吡啶衍生物5相比,观察到显著的焓增强。
在凝血酶抑制剂11中引入五元环构象上限制了分子0.">。因此,正确刚性化以适应结合状态的化合物12表现出更高的效力,这源于显著增强的熵特征。在系列13-15中,开放链的4-脒基苄基衍生物13在14中通过2-(氨甲基)-5-氯苄基取代基的NH2基团与两个侧链羰基氧原子之间形成分子内氢键而稳定。有趣的是,类似的OH衍生物15并未表现出这种亲和力增强和熵优势。溶液中的分子动力学模拟表明,14在蛋白质结合之前就已预组织成结合构象,而15构象灵活,缺乏有利的预组织。
在以4-脒基苄基为锚定基团的系列(16)中,占据凝血酶疏水S3/S4口袋的疏水取代基从氢(a)逐渐增大为甲基(b)、异丙基(c)、仲丁基(d)和环己基甲基(e)。这导致两个结晶水分子从S3/S4口袋中依次置换,伴随着取代基疏水性的增加和熵特征的增强。这通常用经典的疏水效应来解释。然而,具有焓特征的疏水结合也可能发生。在嗜热菌蛋白酶抑制剂系列(17)中,S1′口袋取代基从氢(a)优化到仲丁基(d)。结合亲和力增加了41,000倍,这主要归因于结合焓的增加。实验表明,当配体在P1′位点携带氢原子(甘氨酸衍生物17a)时,该口袋几乎没有水分子,尽管其尺寸足以容纳多达五个水分子。在这里,配体疏水部分与去溶剂化口袋的结合主要产生焓驱动响应,因为无需支付口袋去溶剂化的成本。
结合口袋的特性范围很广,从具有有序水分子的充分溶剂化口袋,到几乎去溶剂化的干燥口袋。因此,我们观察到结合特征从熵主导到焓主导的显著变化。这解释了为什么疏水效应的热力学特征可以从熵驱动转变为焓驱动。
另一个方面是,结合位点的残留流动性可以区分非常相似配体的热力学特征。例如,仅末端环戊基或环己基取代基不同的两个同源凝血酶抑制剂(18和19)当适配到S3/S4口袋时,表现出不同的焓和熵结合特征。晶体结构显示,五元环具有明确定义的差分电子密度,而六元环类似物由于明显的无序在电子密度中未定义。分子动力学模拟显示环戊基部分经历伪旋转和跳跃旋转,而环己基环则表现出非常不同的构象特性,即使环大小仅增加一个成员。
水甚至在蛋白质结合之前就能影响特征。在一系列蛋白激酶A抑制剂(20a–20e)中,具有最多可旋转键的配体20e表现出最熵有利的特征,这看似违反直觉。详细分析表明,在结合蛋白质之前,最灵活的配体在水溶液中采用能紧密捕获一个水分子的构象状态。当该配体与蛋白质结合时,被固定的水分子将被释放。这种释放是熵有利的,并决定了该配体的整体特征,即使这一步发生在与蛋白质结合之前。
水对热力学结合特征的影响
之前的例子也强调了水对配体结合特征的重要影响。有趣的是,水对结合亲和力的影响通常较小。然而,焓熵补偿的偏移可能很显著。这可能解释了为什么在忽略水分子存在的情况下,对接和打分仍能有效预测亲和力。然而,结合口袋中水的存在会影响对接的配体结合姿态的几何形状,这对于正确的设计假设是重要的考虑因素。
从图1a的数据中选取了几个例子,其中结构数据表明单个水分子对同源配体对的结合特征有实质性影响。14对复合物的数据显示在图1b的ΔΔH0对?TΔΔS0图中,描述了复合物对的相对差异。尽管ΔΔG0的差异通常很小,但在某些情况下可以发现高达±5 kJ/mol的贡献。如图1a中的复合物一样,明显的焓熵补偿似乎在起作用。一项对五个胰蛋白酶-配体复合物的中子衍射研究表明,未复合蛋白质中的水分子既可以在形成的复合物中介导蛋白质与配体之间的相互作用,也可能被置换。此外,剩余的水分子可以改变其与所容纳配体的结合特性,从固定的有序状态转变为增强的动态状态。这些变化因结合的配体而异。这将使单个水分子的热力学特征从更焓驱动转变为更熵驱动,反之亦然。当水分子因配体结合而被置换、获取或在空间和动态上发生移动时,这一事实将影响个体结合特征之间相对热力学差异的比较。因此,在蛋白质-配体复合物中观察到的焓熵补偿的很大一部分可能源于水对热力学特征的影响。如前所述,片段结合的补偿效应至少与药物大小配体的一样显著。理论上,片段通常被认为是更焓驱动的结合剂,因为它们结合到结合口袋的热点。然而,由于其弱结合,水对片段的影响可能更大,这可以解释观察到的其结合中显著的焓熵补偿。
口袋溶剂化对配体结合亲和力的影响
目前,我们对蛋白质口袋溶剂化热力学特征的了解仍然相当有限,主要是因为获取单个水分子在口袋中足够可靠的实验结构信息和结合亲和力数据具有挑战性且非常困难。因此,我们通常依赖计算模拟数据。然而,水分子表现出广泛动态行为,并且这些特性随着结合配体的存在而发生显著变化。我们当前分子动力学模拟中实施的标准力场可能不足以描述水分子的所有特性。需要明确处理水分子。此外,必须考虑依赖于局部介电条件的极化现象,以及水分子、蛋白质残基和配体官能团之间广泛的氢键网络的建立。不能假设未复合结合口袋中的水密度与周围体相水的密度相同或可比,更不用说水分子在结合口袋中也可以采用不同的质子化状态。此外,一些口袋是瞬态的,仅在配体结合时打开。它们的溶剂化模式会是怎样的?
Stephen Homans首先提出了配体结合前具有不同水密度的口袋溶剂化概念。对于必须区分不同底物的酶来说,利用口袋的溶剂化特性对于区分正确和错误的底物至关重要。嗜热菌蛋白酶是一种主要在其深S1′口袋中识别待切割肽链的酶,其尺寸足以容纳多达五个水分子,这为研究这一现象提供了机会。通过高分辨率晶体学和微量热法,我们检查了类肽磷酸类似物配体(17a–e)。记录了所有研究配体的保守结合模式。如上所述,仅将一个氢原子定向到S1′口袋的配体,其Ki值比带有P1′仲丁基的衍生物低41,000倍。这个侧链在结构上与天然底物一致。仅仅是四个碳原子及其附着的氢原子的变化,如何能导致如此巨大的亲和力提升(主要是焓驱动的)?第一个甲基展现出已知最强的“神奇甲基效应”之一,揭示了140倍的改善。根据精心设计的结晶、定相和精修方案,晶体学分析显示嗜热菌蛋白酶中的S1′口袋几乎没有溶剂化。因此,待结合的配体无需支付口袋去溶剂化的成本。有趣的是,氙原子和苯分子都可以容纳在该口袋中。通过晶体学,两种探针都表明与口袋结合,然而它们对口袋的亲和力很可能非常低。
在另一个案例中,我们在一个tRNA结合酶中发现了一个瞬态口袋。通常,这个口袋是关闭的,例如配体21。然而,一个片段(22)的结合打开了这个口袋,而该片段本身甚至不占据这个口袋。晶体结构和分子动力学模拟表明,这个口袋被几个水分子充分溶剂化。设计的配体(23)将其疏水的丙炔基侧链定向到口袋中,取代了一些水分子,但与未取代的母体结构(24)相比,没有观察到结合亲和力的改善。显然,与嗜热菌蛋白酶的情况不同,占据这个口袋需要显著的去溶剂化成本,并且将疏水取代基放入这个口袋中并未显示出亲和力增强。
此外,应考虑醛糖还原酶,它具有一个能够容纳配体侧链的瞬态结合口袋。这一特性使该酶能够识别多种底物,解释了其在细胞内降解各种结构多样性醛的能力。在苄基侧链末端的间位用羧酸基团替换硝基,得到两种配体(25, 26),其结合亲和力差异惊人,达1000倍。两种配体采用不同的结合模式。效力更强的硝基衍生物25通过诱导蛋白质中的肽键翻转来打开瞬态口袋。相比之下,间位羧酸衍生物26让口袋保持关闭,并以不同的苄基侧链方向在口袋外部结合。最初,我们将这些差异归因于羧酸基团相对于不带电、等结构的硝基的高去溶剂化成本。调节苄基取代基的特性产生了使口袋保持开放或关闭的例子。使用晶体学和微量热法观察到了两种结合模式。
例如,未取代的苄基衍生物同时表现出开放和关闭状态。
瞬态口袋通过疏水的苯基-亮氨酸侧链接触被密封,打开口袋涉及翻转相邻的肽键。为了更仔细地研究与瞬态口袋的结合过程,我们将关键蛋白质区域的两个亮氨酸残基替换为丙氨酸残基。
结果令人惊讶。在野生型中观察到的硝基和羧酸衍生物之间1000倍的亲和力差异,在检测的突变变体中减少到仅10倍的差异。尽管硝基衍生物25的亲和力显著下降,但它保留了在野生型中观察到的结合模式,占据开放的瞬态口袋。相比之下,羧酸类似物26的亲和力在野生型和突变变体之间变化很小。然而,25的结合模式从在野生型中观察到的、瞬态口袋关闭的几何形状,转变为同时观察到关闭和开放口袋两种结合模式的混合情况。在两个亮氨酸残基都被丙氨酸替换的变体中,只发现了开放的瞬态结合口袋并被配体占据。在所有情况下,打开口袋都涉及位于氨基酸300上游的肽键翻转。
将Leu 300替换为丙氨酸会产生额外的空间,该空间被几个水分子占据。这一观察得到了以柠檬酸作为配体的晶体结构的支持,该配体填充了活性位点,但未占据瞬态口袋,同时允许水分子渗透结构。我们还对不同的口袋变体进行了分子动力学模拟和溶剂化位点分析。根据这些结果,瞬态口袋在变体中经历了“预水合”,这在野生型中没有观察到。这改变了去溶剂化平衡,意味着进入的配体现在必须置换水分子。这给了羧酸衍生物26一个优势,因为“预水合”的水分子可以与带负电荷的羧酸基团相互作用,从而稳定结合过程中的中间步骤。然而,不带电的硝基衍生物25无法从这种稳定中受益。相反,“预水合”对硝基衍生物不利,因为它也必须置换水分子。这导致亲和力显著下降。然而,这一机制假设丙氨酸变体的肽键翻转势垒明显低于亮氨酸衍生物,或者不需要显著的贡献。
为了研究这种效应,还研究了300位的甘氨酸变体。由于甘氨酸没有侧链,预计会对肽键翻转产生可检测的影响。由更小的甘氨酸侧链在瞬态口袋中产生的额外空间应有利于“预水合”。硝基衍生物25结合到该变体的开放瞬态口袋,并且在结合过程中没有发生肽键翻转。由于没有侧链,口袋已经足够开放。然而,硝基衍生物的结合亲和力仍然很低。这强调了肽键翻转不能对结合亲和力产生决定性影响的事实。相反,特征在很大程度上取决于被占据时瞬态口袋的溶剂化特性。羧酸配体26支持这一假设,因为当300位存在甘氨酸时,配体结合现在完全发生在开放口袋中。
从这些例子中,对于具有瞬态口袋的相关案例,我们能学到什么?显然,口袋去溶剂化显著影响配体结合亲和力。这种影响的程度取决于口袋在容纳配体之前的“预水合”程度。弱溶剂化或几乎没有溶剂化的口袋在被配体的疏水部分占据时可以增加结合亲和力。对于仅在疏水配体部分接近其入口时才打开的瞬态口袋,情况似乎类似。此类过程被描述为具有诱导契合结合机制。在这种情况下,结合可以在没有显著去溶剂化成本的情况下发生,并且可以预期强烈的亲和力增强。然而,导致瞬态口袋“预水合”的结构或动态扰动会显著降低这种增强,因为口袋去溶剂化需要越来越多的自由能。最后,问题仍然存在:如何检测疏水的、未溶剂化的结合口袋?在晶体学中,一种众所周知的实验定相方法是用惰性气体对蛋白质晶体加压。这种方法也可以识别弱溶剂化的蛋白质口袋。苯是另一种选择,因为它具有显著的水溶性。然而,苯的毒性使其在常规工作中具有危险性。氙策略在嗜热菌蛋白酶的S1′口袋中效果良好,最近它帮助检测并填充了β1-肾上腺素受体中的一个无水空腔。
定制设计疏水基团周围的表面水网络以增强亲和力
最后,一种额外的口袋溶剂化效应可以增加配体结合亲和力。配体通常占据蛋白质外部开放的、碗状或裂隙状的结合口袋。通常,配体的一部分延伸到周围的体相中。然而,在蛋白质-配体复合物新形成的界面与周围体相水之间,会组装一个新的溶剂化层。根据暴露的配体部分的结构特征,组装的界面将允许形成理想的表面水网络,或者由于与水壳几何形状的不匹配而保持不完整和受扰动。这也会影响配体结合,特别是,完美的表面水网络对暴露的疏水基团的限制可以显著增加配体的亲和力。在一项综合研究中,我们调查了在嗜热菌蛋白酶S2′口袋附近形成的、暴露的蛋白质-配体界面周围的表面水网络的结构特征。形成能量有利的、融合的五到八元水多边形,通过氢键链互连,像罩子一样包裹住暴露的配体部分,从而增加配体的结合强度。分子动力学模拟可用于通过仅考虑水分子的流动性来设计和验证合适的侧链。使用这一设计理念,我们实现了27相对于28的50倍亲和力增强。已经描述了考虑在蛋白质和配体之间形成水网络的其他例子。然而,在将此概念应用于超出结合口袋的极性或带电基团时需要谨慎,这些基团是为了在不改变其结合姿态的情况下改善配体溶解度而故意添加的。此类基团会强烈扰动多边形水罩的形成,从而抵消增强的水壳效应。
结论
在物理学的四种基本力中,生物分子几乎只使用电磁力进行相互作用,构成生命的所有过程都源于这些相互作用。分子只能相互作用;然而,它们以高度复杂的方式进行,具有惊人的多样性和难以置信的复杂性。因此,我们使用诸如分子识别、功能导向、信息传递或信号转导等术语,以比喻意义来概念化在更高层次上观察到的效应。尽管热力学可以更精确地表征相互作用,并从焓和熵的角度进行区分,但我们只能将它们确定为适用于整个多组分生物系统的整体量。问题在于如何将这些整体相互作用量划分到分配给系统单个组件的单独贡献中。这只能通过尽可能多地收集有关系统的结构背景信息来实现,方法是研究密切相关的配体对,希望其中只有一个属性主导特征变化。在药物设计中,感兴趣的属性是吉布斯结合自由能,它源于许多焓和熵贡献的复杂总和。其中许多贡献由于焓和熵的补偿效应而相互抵消。因此,它们不会出现在测量的吉布斯自由能中。尽管如此,少数贡献仍然是决定因素,但它们可能因情况而异。这使得使用热力学数据作为药物优化的直接指南变得困难。尽管如此,可以提出一些通用规则,并已在别处详细总结。
在这篇综述中,试图通过检查选定的密切相关的配体对例子,来证明哪些方面决定了给定的热力学焓熵特征。除了显著的补偿效应外,决定因素还包括正确的刚性化、涉及电荷的强极性相互作用的埋藏、蛋白质结合位点的残留流动性、配体在蛋白质结合前的构象性质分析,以及无处不在的水分子作为蛋白质-配体复合物形成中第三结合伙伴的影响。水分子的存在或缺失及其结构特性显著影响配体结合特征。在蛋白质-配体复合物形成中观察到的焓熵补偿的很大一部分可能是由于水分子的贡献。尽管如此,一旦认识到,参与的水分子的特性可以在设计理念中加以利用,以改善给定配体的结合亲和力。
也许到文章末尾,实践的药物化学家会问自己:“我如何应用所有这些精彩的见解?反映现象复杂性的热力学数据对我的工作真的有用吗?”首先,理解哪些因素有助于亲和力提升是有帮助的。这不仅仅涉及计算形成的氢键数量、埋藏在结合口袋中的疏水表面积或从口袋中置换的水分子数量。配体在蛋白质结合之前的特性差异可以决定亲和力。只有当配体在溶液中的结合几何形状在蛋白质结合之前就已存在时,配体的刚性化才有贡献。还必须考虑口袋溶剂化的差异。更多方面已在别处总结。
但是其次,热力学数据能否帮助指导标准药物化学环境中的先导化合物优化项目?在制药行业,收集一系列相关蛋白质-配体复合物的ITC数据通常不是一项重大任务。如果此类研究中的一个复合物偏离趋势,很可能是一个其他方面很重要的案例,值得更详细地分析。一个可能的原因是质子化状态的变化。这涉及估算pKa值,特别是关于靶标结合口袋的组成。例如,是否存在酸性或碱性残基或官能团?药物化学家通常非常擅长估算假定诱导的配体pKa位移。
然而,其他原因可能解释为什么一个配体会偏离该系列。本文中提出的两个例子应能阐明这一概念的观点。在溶液中与凝血酶结合之前,通过分子内刚性化预组织配体,清楚地显示了热力学特征的差异,并表明了对于优化策略很重要的配体行为差异。另一个例子是蛋白激酶A系列中最灵活的配体是最熵驱动的结合剂这一看似矛盾的相关性。收集此类复合物系列的ITC数据将使研究人员意识到源于蛋白质结合前效应的其他重要因素。这些例子表明,收集在工业环境中可实现的热力学数据,可以帮助解释配体系列结构-活性数据中看似无法解释的趋势。通过这种方式,热力学数据可以补充药物优化策略。