一种基于计算机的新型平台,结合了数据驱动模型和基于物理的模型,用于评估蛋白质配方的开发可行性

《Journal of Pharmaceutical Sciences》:A novel in silico platform combining data-driven and physics-based models for protein formulation developability assessment

【字体: 时间:2026年02月09日 来源:Journal of Pharmaceutical Sciences 3.8

编辑推荐:

  蛋白药物开发中基于计算的平台整合数据驱动与物理模型(如分子动力学)评估稳定性、制剂可能性及潜在风险,减少实验依赖。案例验证其在抗体和模型蛋白(如G-CSF)中的实用性。

安德烈亚·阿尔西奇奥(Andrea Arsiccio)|克里斯蒂安·勒瓦伊(Kristian Le Vay)|安德烈·萨奥·佩德罗(Andre Sao Pedro)|托马斯·帕布斯特曼(Thomas Pabstmann)|康斯坦茨·赫尔比格(Constanze Helbig)|多米尼克·布兰德施泰特(Dominik Brandstetter)|埃莱奥诺拉·切拉索利(Eleonora Cerasoli)|安德烈亚·霍韦(Andrea Hawe)|蒂姆·门岑(Tim Menzen)
Coriolis Pharma Research GmbH,Fraunhoferstr. 18 b,82152 Martinsried,德国

摘要

新型治疗性蛋白质的开发需要巨大的资金和时间投入。在缺乏适当审查的情况下推进药物产品的开发往往会导致昂贵的失败。在某些情况下,这些失败与候选分子的固有不稳定性以及通过选择合适的配方来最小化这些不稳定性的难度有关。因此,早期对蛋白质药物候选物的配方可开发性进行表征对于降低风险至关重要。由于在开发早期阶段可用的药物物质材料稀缺,全面的体外评估常常受到限制,这增加了对模拟和计算模型的兴趣。目前,只有非常少的基于计算的方法专注于配方开发并评估蛋白质药物候选物的配方可开发性。为了解决这个问题,我们提出了一个基于数据驱动和物理模型的新型计算平台,该平台结合了包括结构预测、生物信息学、机器学习和分子动力学计算在内的不同领域的计算技术。该平台仅需要治疗性蛋白质的初级序列作为输入,从而消除了对物理材料的需求。我们描述了该平台所包含的计算工具,并展示了如何使用它们来识别蛋白质药物候选物的潜在问题和异常特性,评估高浓度适用性,筛选配方条件对自相互作用倾向的影响,并提出配方范围。此外,我们还展示了两个案例研究,说明了该平台在现实世界应用中的潜力,并证明了其实验验证。

引言

生物制药行业面临着加快新疗法上市时间的压力。1然而,新型蛋白质治疗药物的开发仍然是一个复杂且成本高昂的过程。虽然疗效是后期失败的关键因素2,但药物候选物较差的药物特性或不稳定性可能导致耗时且资源密集的药物产品开发,失败风险很高。鉴于开发新药所需的巨大资金和时间投入,早期评估蛋白质药物候选物的可开发性的重要性不容忽视。
因此,近年来学术界和工业界在建立可开发性平台以全面表征蛋白质药物候选物和指导先导化合物选择方面的努力有所增加。3, 4, 5, 6, 7, 8, 9这些平台旨在通过评估分子的物理化学性质来评估它们从发现到开发的可行性。6可开发性评估应涵盖化学、构象和胶体稳定性等不同方面。10为了简化临床前和临床开发,应评估分子的“可配方性”,即通过配方开发可实现的稳定性优化程度。10为此目的开发了多种生物物理方法,这些方法在材料要求、通量和表征深度之间取得了平衡,具体取决于要筛选的候选物数量。11, 12
通过实验室测试对候选物的潜在问题进行早期评估通常受到可用药物物质材料稀缺性和严格时间表的限制。因此,计算工具的应用已成为支持生物制品可开发性和可配方性评估的强大方法。11, 13计算方法可以在不需要物理材料的情况下筛选大量分子。此外,计算分析可以在第一份蛋白质材料可用于实验室活动之前很久就进行。基于这些原因,计算方法已成为药物发现过程的基本组成部分,因为它有潜力从早期到后期降低药物产品开发的风险。通过计算预测的实验验证对于证明所使用模型的有效性至关重要。总体而言,通过计算预筛选可以减少所需的实验测试数量并使其更加有针对性。
已经开发了许多计算工具来表征蛋白质分子,旨在预测它们的稳定性和可开发性潜力。已经开发了计算描述符来估计蛋白质的聚集倾向14, 15, 16或免疫原性17,并能够在短时间内以较低的计算成本对大量候选物进行排序。近年来,随着人工智能的快速发展,同源性和从头建模18, 19, 20使得从序列出发预测新型蛋白质的3D构象成为可能。
已经训练了大量机器学习(ML)模型来预测胶体不稳定性21、溶解度22、热稳定性23、免疫原性24、化学降解途径的倾向25,26、毒性27和表达28。许多这些数据驱动的模型是针对单克隆抗体(mAbs)开发的,因为这些分子在制药市场中的重要性以及相对于其他模式而言,有大量已发布的实验数据集用于模型训练。因此,已经开发了针对mAbs的特定模型来表征它们在高浓度下的粘度行为29, 30, 31、自关联倾向21,31,或突变对稳定性和结合亲和力的影响32, 33, 34。众所周知的治疗性抗体分析器(TAP)常用于通过比较可变片段(Fv)的五个描述符与临床阶段治疗药物来计算评估抗体候选物的可开发性35。已经进行了大量研究来表征mAbs,并识别出区分临床抗体和库抗体的计算属性,这些属性对可开发性至关重要36。与针对mAbs的模型相比,开发了应用范围更广的ML模型,尽管覆盖的蛋白质类型更多,但由于蛋白质治疗模式的多样性以及用于训练的数据集的稀缺性,这些模型的开发程度有限25,26,37
除了数据驱动的模型外,还开发了基于物理的方法来表征生物制品的可开发性和可配方性。基于物理的工具,如分子对接和分子动力学(MD),不需要训练数据集,并且与数据驱动的模型相比具有更高的外推能力。缺点是,分子对接和MD模拟的计算成本可能非常高。MD模拟已被用于评估蛋白质的聚集倾向38、抗体的脱酰胺和异构化倾向39,并结合数据驱动的描述符来预测生物物理性质40。分子对接在可开发性评估中得到了广泛应用,例如用于预测结合构象和估计结合亲和力41,或预测蛋白质的免疫原性24
在本文中,我们提出了一个结合了生物信息学、机器学习和分子动力学等先进计算工具的新型计算平台,以降低蛋白质药物开发的风险并指导配方科学家。数据驱动和基于物理的模型的整合是我们方法的一个显著特点,它既受益于机器学习方法的速度,也受益于分子动力学计算的外推能力。虽然计算工具主要应用于早期药物发现阶段,但我们在本文中讨论的平台在涵盖临床前和后期药物产品开发中至关重要的蛋白质稳定性方面具有创新性,从而降低了新候选物的选择风险并提供了指导。我们还提出了基于生物物理特性的新算法,并通过参考一个庞大的、手动整理的已批准蛋白质分子数据库来建议配方策略。最后,我们计算平台的一个创新之处在于它既适用于mAbs也适用于非mAb蛋白质,本文的其余部分将讨论其中的差异和局限性。
将通过两个与蛋白质药物产品开发相关的案例研究来说明该计算平台在可配方性评估中的应用。在第一个案例研究中,我们将展示所推荐的计算工具如何支持不同mAb候选物的筛选。在第二个案例研究中,我们将展示计算方法如何表征模型蛋白质(粒细胞集落刺激因子)并建议潜在的配方策略。

小节片段

蛋白质结构预测

对于mAb和非mAb蛋白质,计算平台的第一步是基于蛋白质序列预测三维(3D)结构。对于mAb,使用Schr?dinger软件(版本2025-1)中的同源性建模生成3D结构。42对于mAb的Fv部分,通过Schr?dinger中的自动化程序筛选大量VH和VL部分的模板,选择与

机器学习模型有助于识别潜在问题

首先,使用同源性或从头建模从蛋白质序列预测其结构。然后计算大量的计算描述符(mAb超过890个,非mAb蛋白质超过150个)。
已发现计算描述符与mAb的可开发性问题(即高浓度下的自关联或粘度、脱酰胺、异构化或氧化等)相关的实验数据集之间存在相关性(如表1所示)

结论

本文讨论了一个用于蛋白质表征和可配方性评估的新型计算平台。该平台适用于mAb和非mAb蛋白质,结合了数据驱动(ML)和基于物理(MD)的模型。ML模型可以根据类似分子的实验数据识别潜在问题,而MD模拟可以计算不同配方条件下蛋白质候选物的自相互作用倾向。

CRediT声明

AA:概念化、方法论、软件、形式分析、调查、数据管理、初稿撰写、审稿与编辑、可视化;
KLV:调查;
ASP:调查;
TP:调查;
CH:调查;
DB:调查;
EC:调查;
AH:概念化、撰写 – 审稿与编辑;
TM:概念化、方法论、撰写 – 审稿与编辑、监督、项目管理。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
作者是该期刊的编委会成员/主编/副主编/客座编辑,未参与本文的编辑审查或发表决定。

致谢

作者感谢Coriolis Pharma的Zsofia Burkart、Maximilian Eizinger、Kerstin Hausmann、Alexandra Kafka、G?khan Kücükg?ze、Anna Langenberger、Thomas Lassak、Stefan Lehnert、Theresa Rauen、Alexandra Roesch、Gonzalo Rosso、Jonas Zantow和Maksymilian Zegota对本文中呈现的实验结果的贡献。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号