《ChemMedChem》:Direct-to-Biology: Streamlining the Path From Chemistry to Biology in Drug Discovery
1 引言与起源
直接到生物学(Direct-to-Biology, D2B)代表着一种全新的药物发现工作流程。其核心在于,将新合成的化合物——通常是粗反应混合物或仅经最低限度纯化的产物——直接在生物学检测中进行测试。这彻底颠覆了传统的“合成-纯化-测试”循环,将其压缩为快速的“合成-测试”环路。虽然“D2B”一词的起源存在争议,但它因2021年Bush及其同事与葛兰素史克(GSK)合作发表的“D2B-HTC”平台研究而广为流行。该平台在384孔板中于24小时内生成了超过1000个分子,并在未纯化的情况下针对药物靶点进行了筛选,从而证明了该方法的可行性与实用价值。
从概念上讲,D2B建立于2010年代成熟起来的纳摩尔级、高通量板式合成技术的进步之上。早期的研究,如2014年的解离速率筛选(off-rate screening, ORS)和活性导向合成(activity-directed synthesis, ADS),已经预示着可以从粗产物中提取生物相关信息。2018年,Cernak及其同事在《自然》(Nature)上发表的研究,将纳摩尔级反应与亲和选择生物检测相结合,无需耗时纯化即可评估药物效力,这成为了D2B的核心原则之一。需要注意的是,D2B不同于DNA编码库(DNA-encoded libraries, DEL)或基于珠子的组合库等方法,后者通常在合成与筛选之间是分离的。D2B则强调在板式布局中进行即时合成并立即获得生物学读数,从而能以最少的材料和每次实验最大的信息量,实现快速、迭代的“设计-合成-测试”循环。
2 直接到生物学研究的现状概览
根据对截至2026年1月发表的文献分析,D2B领域呈现出快速发展的态势。年发表量从2021年的首篇论文增长至2025年的约25篇/年。产业界提交的以及与学术界的合作研究约占D2B项目的40%,显示该方法在学术界和工业界均受到关注。
在具体实施上,当前的D2B项目库规模从中等的50个到超过5000个化合物不等(中位数在100-500个化合物/库)。反应规模大多集中在三位数的纳摩尔级,但根据应用需求,可低至1 nmol,也可高达10 μmol。值得注意的是,库规模大于500的项目,其单个反应规模通常不超过500 nmol,这凸显了在96或384孔板合成布局中通量与材料经济性之间的紧密关联。
在反应化学方面,目前占主导地位的D2B转化反应是酰胺形成(占项目的50%)、铜(I)催化的叠氮-炔烃环加成(copper(I)-catalyzed azide–alkyne cycloaddition, CuAAC, 20%)、硫(VI)氟交换(sulfur(VI)fluoride exchange, SuFEx, 12%),以及其他后期多样化化学反应,此外还包括各种芳基化、烷基化、胺化和C–C交叉偶联反应。这种选择反映了对下游检测技术的生物相容性、在纳摩尔级(主要在孔板中)的稳健性,以及适用于测试最低限度纯化混合物的高转化率的需求。
在检测方式上,无细胞检测仍然占主流,其中基于荧光的读数(25%)和质谱(30%)在早期筛选中占主导地位;基于细胞的检测占40%,越来越多地用于蛋白水解靶向嵌合体(proteolysis targeting chimera, PROTAC)筛选或表型分析。其他检测方式(5%)包括发光和高通量晶体学筛选。
就靶点格局和模式而言,经典的抑制剂项目在绝对数量上占主导(60%),其中可逆小分子配体仅占一半,共价配体和蛋白-蛋白界面配体构成另一半。靶向降解剂导向的项目(分子胶(molecular glues, MGs)和PROTACs)占D2B发表的40%,通常采用收敛式组装策略,在纳尺度条件下高效探索E3连接酶/弹头/连接子空间。除了E3连接酶和特别是靶向BRD4的PROTACs,激酶和表观遗传酶分别占已涉及靶点的14%和12%。
总体来看,该领域正在从示范性实验向平台化、迭代式的D2B工作流程过渡:小规模、稳健的纳摩尔级反应组;快速、大多无需纯化的分析;以及能够耐受残留基质的检测选择。近期,包括Concept Life Sciences、Domainex、WuXi AppTec和Molecule.one在内的几家商业服务提供商已经开始提供基于D2B的合成服务,专门用于现有配体的商业优化,这进一步凸显了该技术的转化潜力和在制药及学术管线中更广泛应用的潜力。
3 直接到生物学的应用:靶点特异性洞察
3.1 激酶抑制剂
激酶是药物化学中最突出和特征最明确的靶点家族之一,因其在细胞信号传导中的核心作用和在癌症相关疾病中的可成药性,也成为D2B策略的有吸引力的目标。
其中一项有影响力的早期研究由Gehrtz等人开展。他们使用带有丙烯酰胺弹头和炔基手柄的共价依鲁替尼衍生物,通过CuAAC反应与448种商业可得的叠氮化物在384孔板格式中偶联,并直接使用细胞内Western检测法筛选粗混合物。这种针对MKK7的策略产生了强效抑制剂,其IC50值在3-4 nM,与母体化合物相比(EC50> 10 μM)有显著改善。
另一项由Douthwaite等人进行的研究将D2B概念应用于探索Cdk2/CycE抑制剂。他们通过高通量组合筛选,将6个氨基吡唑核心与128种羧酸偶联,生成了一个包含768个成员的库。为了最大化反应效率,他们系统性地组合了不同的碱基和偶联试剂,使用自动化液体处理系统实现了90%的合成成功率。粗反应产物使用ADP-Glo和芯片外Caliper迁移率变动检测法进行测试,随后又使用亲和选择质谱法进行正交验证。值得注意的是,在此研究期间,可以直接从粗反应混合物中获得含有配体的晶体结构。
3.2 SARS-CoV-2主要蛋白酶(MPro)抑制剂
COVID-19大流行引发了对抗病毒药物开发的浓厚兴趣,特别是靶向SARS-CoV-2的主要蛋白酶(MPro)。多个D2B方法被用于探索这一酶靶点。
Bush及其同事应用了一种独特的D2B策略,从靶向半胱氨酸的氯乙酰胺反应性片段出发,来鉴定共价和非共价的MPro抑制剂。对219个纯化的反应性片段的初步筛选得到了一个共价命中化合物,随后通过D2B库用193种胺与氯乙酸的N-羟基琥珀酰亚胺酯反应,形成了带有氯乙酰胺装饰的抑制剂。通过完整蛋白质LC/MS筛选这些候选抑制剂,鉴定出了靶向MPro的化合物,其IC50小于39 nM。
随后,为了发现非共价MPro抑制剂,进行了一项级联D2B研究。首先替换了初始命中化合物的共价弹头,然后通过HATU介导的酰胺偶联与两个迭代的羧酸库(先是146个多样化的构建块,然后是72个聚焦的候选物)进行反应,最终得到了非共价抑制剂,其KI值为110 nM。
此外,包括开放科学项目“COVID Moonshot”在内的其他MPro靶向研究,也利用了酰胺偶联驱动的D2B优化。这些研究产生的化合物对MPro的P3/P5口袋具有低纳摩尔级的结合亲和力。COVID Moonshot项目不仅采用了酰胺偶联,还开创了另一种化学上截然不同的D2B策略,独特地对源自基于片段的晶体学筛选的化合物应用了Chan–Lam反应,得到了靶向MProP4口袋的化合物。值得注意的是,酰胺偶联反应总体上比Chan–Lam反应更成功。
3.3 表观遗传/表观转录组抑制剂
表观遗传和表观转录组靶点由于其在基因调控和疾病进展中的关键作用而变得越来越重要。因此,D2B策略使得能够利用表观遗传格局的独特特征来加速药物发现。
其中一项早期的概念性D2B研究由D?mling及其同事进行。他们应用Groebcke–Blackburn–Bienaymé反应生成了1536个化合物,并通过差示扫描荧光法筛选粗产物,以鉴定Menin-MLL抑制剂。从这次筛选中,22个命中化合物被重新合成并通过微量热泳动验证,其中最有效的化合物显示出2.8 μM的KD值。
另一项针对组蛋白去乙酰化酶2的研究中,通过酰胺偶联和钯催化的Suzuki–Miyaura反应,在文献报道的HDAC抑制剂骨架上合成了一个包含70个成员的化合物库。粗反应通过自动配体识别系统和微粒体稳定性检测进行筛选,结果显示酰胺衍生的化合物在ACE50与生化检测的IC50值之间表现出比Suzuki产物更好的相关性。最有效的抑制剂IC50值为9.06 nM。
除了传统的基于活性的筛选,先进的D2B平台最近还结合了自动化合成和结构生物学。其中一个项目集成了用于合成的液体处理机与高通量蛋白质晶体学,以评估1696个靶向PHIP2的片段延伸化合物,获得了969个衍射数据集和29个共晶结构。随后,Biggin及其同事在此晶体学研究结果的基础上应用“xSAR”计算来进一步评估筛选结果。
3.4 靶向降解剂
D2B已被用于多项靶向降解剂的发现项目。在这篇综述中,我们区分了二价的PROTACs和单价的分子胶。
3.4.1 蛋白水解靶向嵌合体
D2B方法特别适用于PROTAC的发现,因为其命中鉴定通常需要较高的合成努力,且合理设计的机会有限,因此降解剂开发是近期D2B发表中最常见的应用。与经典的D2B酶抑制剂筛选的一个关键区别在于,在PROTAC开发过程中,未反应的前体通常保留靶点或E3连接酶结合活性,可能有助于细胞毒性并影响降解读数。
在当前的D2B-PROTAC领域,招募cereblon的PROTAC通常优于招募von Hippel–Lindau配体的PROTAC。多个项目采用了酰胺化策略,例如,用于靶向BRD4的PROTACs,使用单N-Boc保护的二胺,采用偶联-脱保护-偶联的工作流程进行模块化组装。
除了CRBN和VHL基础的E3连接酶,Bush及其同事采用了一种基于片段的D2B方法来鉴定E3连接酶TRIM25的新型共价配体,其方式类似于之前靶向MPro的努力。在这项研究中,基于晶体学数据定义了出口向量,将TRIM25结合片段通过NHS酯连接到氯乙酰胺弹头上。由此产生的基于JQ1的BRD4 PROTAC在SPR中显示出纳摩尔级的亲和力。
在另一项不同的D2B-PROTAC策略中,酰胺偶联与“PANAC”连接子化学相结合,利用胺和带有NHS酯及邻硝基苯甲醇的双功能连接子。“PANAC”反应能够实现伯胺与邻硝基苯甲醇的分子内光诱导环化。这种模块化方法能够生成580个靶向MDA-MB细胞中CDK9的PROTACs,产生了最有效的CDK9 PROTAC,其IC50为269 nM。
CuAAC化学最近也被用于生成靶向BRD4、Aurora激酶A、可溶性环氧化物水解酶和WDR5抑制剂的PROTAC库,这些抑制剂通过溶剂暴露的炔基功能化的靶点招募剂进行功能化。随后与48个连接酶结合叠氮化物的反应,每个靶点产生192个PROTACs,转化率高达92%,针对AURKA的PROTACs的DC50值达到亚纳摩尔级。
3.4.2 分子胶
与PROTACs类似,分子胶的发现常常是偶然的,由于缺乏清晰的结构活性关系,理性设计仍然极具挑战性。因此,大规模的经验性筛选仍然是核心策略。SuFEx化学因其强大的反应性和高转化率,在分子胶发现中获得了关注,特别是在芳基氟硫酸盐与伯胺和仲胺的反应中。
多项分子胶研究聚焦于CRBN招募支架,通常对CRBN配体进行衍生化,并筛选降解表型。例如,GSPT1降解剂通过基于Ugi的D2B筛选或基于SuFEx的库(将3180种胺与5‘-氨基-来那度胺偶联)被鉴定出来,并在白血病和神经母细胞瘤细胞系中通过HiBiT验证进行测试。
与这些“E3连接酶优先”的方法不同,一些努力追求“降解靶点优先”的策略:对于BRD4和组蛋白酰化阅读器ENL,已知的抑制剂被功能化以具备SuFEx兼容的出口向量,并与3163种结构多样的胺反应。通过HiBiT筛选得到了ENL降解剂,DC50值从50 nM到1.85 μM不等,而CRISPR/Cas9介导的MV4;11细胞中CRBN的敲除证实了降解是CRBN依赖性的。
3.5 碳酸酐酶抑制剂
碳酸酐酶催化CO2水合为HCO3-,在pH调节中起核心作用。尽管碳酸酐酶抑制剂并非当前药物化学的新焦点,但有几项D2B开发项目突出了碳酸酐酶作为D2B开发模型的特征。
为了探索超越半胱氨酸残基的片段-蛋白质相互作用,Bush及其同事采用了新的共价抑制剂筛选平台来靶向碳酸酐酶等。在他们的第一个策略中,一个包含1073个成员的烷基胺片段库通过NHS酯化学被功能化,带有光反应性烷基二嗪部分,实现了初始非共价结合后的UV诱导交联,这也被称为光亲和位点方法。用已知靶向锌结合位点的抑制剂乙氧唑胺进行的置换实验,确认了活性位点结合,并产生了五个含有伯磺酰胺的命中化合物。随后,合成了一个包含100个磺酰胺类似物的聚焦库,得到了一些具有微摩尔级亲和力的结合剂。
在第二个策略中,探索了靶向Asp/Glu残基的光活化2-芳基-5-羧基四唑光亲和位点,通过酰胺化D2B产生了针对CA I的17个命中化合物和针对CA II的16个命中化合物。
在一项不同的CA靶向研究中,靶向赖氨酸、酪氨酸和丝氨酸的硫(VI)氟化物反应性片段产生了四个初始命中;尽管初始的kinact值较低,但一个优化的包含96个成员的类似物库实现了更高的修饰率和改善的选择性。总的来说,这些研究将基于片段的共价配体发现扩展到了传统的半胱氨酸靶向之外。
3.6 抗病毒和抗菌药物
抗生素耐药性的出现推动了新抗菌剂的寻找,这始终是学术界和工业界研究的优先事项。同样,自COVID-19大流行以来,病毒靶点仍然是药物发现工作的核心。因此,D2B方法也被应用于SARS-CoV-2主要蛋白酶之外的细菌和病毒靶点也就不足为奇了。
使用D2B策略探索的两个突出的病毒靶点是流感病毒和埃博拉病毒。对于流感,HA的茎部区域是D2B衍生抑制剂的目标。基于先前建立的高通量荧光偏振检测,鉴定出一个EC50为1.9 μM的片段样配体。随后的X射线晶体学揭示了三个未被占据的区域,随后在D2B方式下使用SuFEx化学对其进行衍生化。这使得能够通过与230种胺反应生成一个包含690个成员的库。同时,通过将片段修饰后的胺版本与500种羧酸偶联,合成了一个酰胺库。两个库均在未纯化的情况下在荧光偏振检测中进行测试,每个库的最佳化合物被合并,产生了最终的化合物,该化合物在多种H1毒株中表现出亚纳摩尔级的EC50值,代表了迄今为止报道的最有效的HA茎部结合剂。
对于靶向埃博拉病毒,Kitamura及其同事选择埃博拉病毒糖蛋白作为潜在的D2B靶点。将他莫昔芬与该受体对接的计算机模拟指导了衍生化策略,随后使用四氟化亚硫酰进行基于SuFEx的修饰,引入二氟化物功能化手柄。随后使用自动化液体处理机器人偶联了一个包含2496种胺的库,并在基于细胞的埃博拉病毒进入检测中评估粗产物。该研究的顶级命中化合物表现出0.63 μM的KD值,与他莫昔芬相比提高了50多倍,并且在VSV-埃博拉病毒-GP检测中EC50值为92 nM。
对于细菌靶点的D2B靶向,已经探索了几种互补的方法。在这方面,共价片段药物发现被应用于沙门氏菌和志贺氏菌NEL E3连接酶,通过筛选227个带有靶向半胱氨酸的氯乙酰胺弹头的亲电片段;虽然针对IpaH未发现命中,但针对SspH鉴定了三个命中。一个包含430种胺的聚焦D2B库被用于通过酰胺偶联到氯乙酰胺弹头进行命中扩展,产生的化合物在6.25 μM时显示出显著的蛋白质标记,并在重建的泛素酶级联反应中抑制了PKN1的泛素化。
除了靶向半胱氨酸的抑制,Wennekes及其同事研究了二氯三嗪共价弹头用于靶向赖氨酸,并使用生物素-亲和素模型系统对其进行了优化。将其整合到模块化的“双击”平台中,能够顺序进行配体和报告基因多样化,产生了一系列用于多杀巴斯德菌唾液酸转移酶1的功能化探针,并支持D2B方法。
3.7 其他靶点和抑制剂
Bush、Rittinger及其同事使用前面讨论过的反应性片段进行了几个未按上述章节分类的额外D2B研究。光活化2-芳基-5-羧基四唑方法产生了针对KRAS、BCL6和BRD4-BD1的选择性命中化合物,其特征是结合亲和力较弱,代表了进一步优化的起点。同样应用于CA II靶向的磺酰氟,被用于鉴定BCL6的共价反应性片段;因此,一个以D2B方式设计的包含352个化合物的聚焦库显示,间位取代的苯甲酰胺是优选的共价化学型。
类似的策略被应用于开发WRN解旋酶的共价丙烯酰胺抑制剂。在这里,对1055种丙烯酰胺的初步LC/MS筛选产生了两个中等亲和力的命中化合物。随后遵循了两条平行的优化途径:一条途径将328种Tanimoto相似的胺与丙烯酰胺亲电试剂偶联,得到了最佳命中化合物IC50为1 μM;另一条途径采用了多步合成,包括酰胺偶联和丙烯酰胺形成,产生的化合物IC50为251 nM。通过X射线晶体学获得的结构信息指导了第三轮D2B优化,使用123种胺生成类似物,最终得到了先导化合物IC50为31.6 nM。
同样,基于氯乙酰胺的筛选被用于鉴定OTUD7B的选择性抑制剂,得到了一个IC50为3.5 μM的命中化合物。在这项研究中,通过生物素化泛素乙烯基砜探针和来自HEK裂解液的LC/MS鉴定了被片段标记的靶点。随后,一个包含351个成员的胺库与氯乙酰胺亲电试剂偶联,并通过完整蛋白质LC/MS进行筛选,得到了上述命中化合物。
在另一项研究中,Roecker及其同事靶向与帕金森病至关重要的葡萄糖神经酰胺合酶,通过高通量筛选鉴定了一个二氮杂环庚烷核心。在QSAR指导下,他们通过HATU偶联合成了1390个二氮杂环庚烷衍生物,并直接在GCS酶检测中筛选它们,随后通过支架跃迁,鉴定出的化合物在酶检测中具有皮摩尔级效力,在人类iPSC衍生神经元中IC50为1.7 nM。
此外,Ponzi等人使用亲核芳香取代化学通过自动化合成将160种胺连接到咪唑并吡嗪支架上,鉴定出了SHP2变构抑制剂,IC50值为225 nM,经过进一步改进后达到88 nM。最后,Chen等人生成了2720个靶向过氧化物还原酶的雷公藤红素衍生物。最佳化合物在抑制PRDX1方面比雷公藤红素提高了4.6倍,并且对PRDX2/3/4/6具有选择性。
4 计算D2B技术
与合成发展同步,计算方法也被用来支持D2B工作流程和高通量筛选数据的分析。其中一个平台是Cernak实验室开发的“phactor”,这是一个旨在自动化数据处理并简化反应阵列设置和评估的软件工具。它处理多种数据类型,包括LC/MS和生化检测输出,并通过利用Excel和Python与广泛使用的仪器和程序兼容。
同样,King-Smith及其同事利用一个靶向MPro的项目来验证一个基于机器学习的“去混杂因子”,该因子能够区分低效力和低合成产率,从而减少假阴性。他们的“瑞士奶酪”方法集成了随机森林和高斯过程模型,以在嘈杂的数据集中识别一致的结构活性关系模式,并可扩展到新骨架的计算机筛选中。
在另一篇发表物中,将已知抗生素的迁移学习应用于化学语言模型,以从头发现新的抗菌化合物。这使得能够生成合成上可行的、新颖的抗菌结构。随后通过酰胺偶联与40种胺进行D2B评估,产生的化合物对金黄色葡萄球菌和大肠杆菌显示出有希望的MIC值。
此外,Biggin小组分析了von Delft和Spencer进行的D2B晶体学研究数据,采用了所谓的“xSAR”方法。他们从摩根指纹中提取特征,并根据保守结合位和保守非结合位计算了正负结合分数,最终鉴定出26个先前被归类为非结合剂的PHIP2结合剂。
专门为D2B开发的计算工具,如phactor,旨在基于反应和板级原生数据结构运行,从而能够以传统高通量筛选软件不易支持的方式,联合分析合成参数和生物学读数。同样,诸如“瑞士奶酪”模型和xSAR等解卷积框架利用保守的反应水平或结合特征,从嘈杂的粗混合物数据中改进命中鉴定,提供了超越传统结构活性关系建模的能力。
5 直接到生物学的局限性与展望
尽管资源投入空前,但新药上市(或仅仅进入临床试验)的速度在过去20年中基本保持不变。迄今为止,早期药物发现依赖于耗时且资源密集的合成工作流程,这些流程难以扩展(尤其是在学术界),并且通常与生物学评估的整合较差。D2B工作流程以纯化换取速度和材料经济性,但这种交换引入了具体且后果严重的局限性。
主要关注点是生化检测和基于细胞的检测中的基质干扰。试剂、副产物、溶剂和残留催化剂原则上可能干扰生物学检测,导致假阳性或假阴性。一个必然结果是检测依赖性;基于荧光和发光的读数特别容易受到反应成分的淬灭或背景信号的影响,而无标记的生物物理方法通常不易产生此类假象。D2B活动中的检测干扰最常见于残留的反应成分,包括痕量过渡金属和可能直接调节蛋白质活性或干扰检测读数的反应性试剂。为了减轻此类影响,一些研究建议采用基质加标对照、金属清除剂和正交检测形式,以区分真正的化合物活性与源自粗反应混合物的假信号。为了减轻基质依赖性检测干扰,一些近期研究建议进行项目无关的D2B兼容性测试,即将粗的但在结构上不相关的反应与阳性对照加标,以探究检测的稳健性。尽管如此,这样的程序增加了开销,并且可能揭示某些反应类型或检测形式根本不适合D2B。
在化学方面,D2B目前偏爱一部分受限制的、稳健、高产率且耐受检测的转化反应。这种化学选择与学术和早期制药药物化学活动的需求非常吻合。然而,当比较已批准药物中发现的化学型与当前的D2B工具箱时,迫切需要将反应库扩展到有利于C–C/C–N交叉偶联和杂环化反应的方向。在已报道的活动中,反应成功率并未统一定义或披露;然而,在有此类指标的情况下,基于点击化学的转化反应始终能实现超过90%的成功率。相比之下,更复杂的转化反应,如钯催化的交叉偶联,通常显示出显著较低的成功率,这揭示了易于与D2B格式兼容的化学反应与在微型化、无需纯化的条件下仍然具有挑战性的化学反应之间存在明显的实际鸿沟。此外,尝试将更敏感或更复杂的化学反应推向纳摩尔级、板式条件会暴露出转化不完全、试剂分解和混合不良等问题,这可能会损害命中鉴定或向批量合成的可转化性。
分析通量和决策制定是进一步的瓶颈:对数百个粗孔进行质谱分析和数据解析非常耗时,并且需要半自动化流程和针对可接受转化率的定制阈值,这些阈值既取决于检测灵敏度,也取决于项目背景。最后,由于只有重新合成的命中化合物才会被验证,早期的结构活性关系可能会被粗基质中的假象所模糊,因此D2B目前最好作为一种过滤策略来部署,该策略需要严格的控制、正交验证性检测,以及在获得纯化的后续数据之前进行保守的解读。
总的来说,这些考虑因素强调,D2B尚未成为传统合成-纯化-检测流程的通用替代品。它最好被视为一种补充策略,当以严格的控制和对其局限性的认识来应用时,可以显著加速早期发现周期,同时避免代价高昂的传统结构活性关系死胡同。