基于蛋白质语言模型的生成式设计亲和肽,用于慢病毒载体的色谱纯化

【字体: 时间:2026年03月13日 来源:Journal of Chromatography A 4

编辑推荐:

  人工智能辅助筛选VSV-G结合肽并开发亲和色谱纯化方法,实现高效稳定Lentiviral疫苗纯化。

  
王飞波|董晓燕|于琳琳|孙艳|史庆红
天津大学合成生物学与生物制造学院生物工程系,中国天津300350

摘要

慢病毒载体(LVs)已成为细胞和基因治疗中最有前景的工具。然而,LVs非常脆弱,对剪切应力、缓冲液pH值和盐浓度非常敏感,这在下游处理过程中造成了严重障碍。为了解决这一挑战,需要温和且特异的下游处理技术来纯化LVs。为了开发基于亲和层析法的LVs纯化方法,我们提出了一种基于人工智能(AI)的策略来寻找亲和肽配体。该策略结合了蛋白质语言模型ESM3-sm-open-v1和计算机模拟(in silico)筛选。基于通过精细调整的ESM模型生成的肽库,我们识别出8种能够靶向囊泡性口炎病毒G糖蛋白(VSV-G)上保守的半胱氨酸富集结构域结合区域的肽。其中,VSV-G-P7在分子对接和ELISA实验中表现出最高的亲和力。分子动力学模拟表明,肽与VSV-G的亲和结合受多种因素驱动,但主要由静电相互作用主导。通过将肽与Sepharose 4FF(Sep4FF)凝胶结合,制备了用于LVs纯化的Sep4FF?VP7凝胶。色谱实验表明,LVs不仅可以选择性地结合到Sep4FF?VP7上,而且可以通过增加盐浓度有效洗脱。温和的洗脱过程保持了回收LVs的结构完整性和生物活性。在从VCCF中纯化LVs的过程中,亲和层析法在20次重复操作中表现出稳定的效果,LVs的回收率(78.2%-79.1%)、Vero细胞产生的细胞杂蛋白(HCP)去除率(90.6%-91.7%)以及残留双链DNA去除率(44.7%-47.3%)。这些结果共同证明了基于AI的配体筛选策略的成功,以及亲和层析法在LVs纯化中的潜力。

引言

细胞和基因治疗(CGT)是生物医学领域中最前沿的方向之一,为多种人类疾病提供了有前景且可能具有颠覆性的治疗策略[[1], [2], [3]]。CGT的成功离不开高效病毒载体和制造工艺[4]。自1972年首个使用重组SV40病毒的病毒载体被开发以来[5],包括腺病毒(AD)、腺相关病毒(AAV)、慢病毒(LV)和逆转录病毒(RV)在内的多种病毒载体已被改造为将目标基因递送到哺乳动物细胞中的工具[6]。从现代角度来看,LV载体是最有前景的病毒载体,因为它具有较高的基因组载量,并且能够高效地转导增殖和非增殖细胞[7,8]。几种基于LV的CGT方法已获得FDA和EMA的批准[[9], [10], [11], [12]]。随着CGT在全球范围内获得越来越多的关注,LV将继续引领治疗创新,推动市场的强劲增长和投资者的兴趣。然而,高质量LV产品的生产仍然面临诸多挑战[13]。
临床级LV的制造必须遵循良好生产规范(GMP),以确保最终产品的纯度、安全性、一致性和可追溯性[14,15]。这一复杂过程包括病毒载体构建、细胞系开发、上游和下游处理以及强制性的质量控制[4]。基于哺乳动物细胞的LV生产通常会导致病毒滴度较低,范围在106到108转导单位/毫升(TU/mL)之间,并且收获的液体中含有多种杂质(宿主细胞DNA和RNA、宿主细胞蛋白(HCPs)、空病毒颗粒和细胞外囊泡如外泌体[[15], [16], [17], [18], [19], [20]]。这给LV的下游处理(DSP)发展带来了巨大挑战[[16], [17], [18]]。在病毒载体制造中,典型的DSP流程包含有限的单元操作步骤,因此每个步骤都需要高效进行[21]。然而,目前用于病毒载体制造的梯度超速离心、过滤和切向流过滤(TFF)以及离子交换色谱法的分辨率相对较低,难以同时平衡产品纯度、产率和转导活性。
亲和层析法能够从复杂材料中高特异性地捕获目标分子。这些目标分子不仅包括重组蛋白和单克隆抗体,还包括病毒载体和疫苗。例如,几种商业化的亲和吸附剂已被应用于AAV制造,以满足临床应用日益增长的需求[[22], [23], [24], [25]]。此前,Segura等人报道了一种用于直接从澄清的上清液中纯化LVs的肝素亲和层析法[26]。最近,Moreira等人开发了一种亲和树脂,可以特异性纯化囊泡性口炎病毒G糖蛋白(VSV-G)伪型化的LVs,其动态结合能力约为每毫升树脂1011个病毒颗粒[27]。然而,亲和层析法在商业LV制造中尚未得到广泛应用。更重要的是,LVs比AAV载体更脆弱,对剪切应力、pH值和盐浓度的敏感性更高[21,28],这为开发LVs纯化的亲和层析法带来了额外的挑战。在实际应用中,识别高亲和力配体是成功应用亲和层析法的前提。组合库[29]、噬菌体展示[30]、mRNA展示[31,32]和理性设计[33]已被广泛用于配体筛选,以开发亲和层析法。Barbieri等人通过Fmoc/tBu化学方法合成的线性八肽库,识别出靶向VSV-G的亲和肽,与这些肽结合的亲和树脂表现出较高的LV回收率和高达220倍的HCPs去除率[34]。在这些筛选方法中,基于计算机的筛选更为强大,因为它理论上可以遍历大型肽库中的所有可能性[35]。然而,肽库的生成仍然受限于亲和模型,这在生成具有全新特性的配体时存在挑战。在自然界中,新蛋白质结构和功能的出现通常需要数百万年的进化[36]。人工智能(AI)的出现通过学习蛋白质序列中的模式显著加速了进化过程[37]。AI为设计高亲和力肽配体用于亲和层析法开辟了新的途径。
在这项工作中,我们提出了一种基于AI的策略来寻找靶向VSV-G伪型化LVs的亲和肽配体。该策略结合了蛋白质语言模型ESM3-sm-open-v1和计算机模拟(in silico)筛选。使用精细调整的ESM3-sm-open-v1模型生成了优化后的肽库,并通过分子对接筛选出肽,以分析其与VSV-G蛋白的结合亲和力和结合机制。最终,这些亲和肽被合成并与Sepharose? 4FF(Sep4FF)凝胶结合,以评估其在LVs纯化中的色谱性能。这项研究对于应用AI开发用于LVs色谱纯化的亲和配体具有重要意义。

材料与化学品

Sep4FF和Tricorn 5/50色谱柱购自Cytiva(瑞典乌普萨拉)。表达增强型绿色荧光蛋白(eGFP, pcSLenti-EF1-EGFP-P2A-Puro-CMV-MCS-3?×?FLAG-WPRE)的LV载体以及Vero细胞培养液(VCCF)购自OBiO Technology(中国上海)有限公司。所有肽均由上海Apeptide有限公司合成。AAV载体购自Cyagen Biosciences(中国苏州)。牛血清白蛋白(BSA)...

肽库的构建

在这项工作中,首先通过(1)PDBbind数据库和(2)结合PepBDB数据库及VSV-G与LDL-R CR域的结合数据,逐步对蛋白质语言模型ESM3-sm-open-v1进行了精细调整。图2a的结果显示,使用PepBDB数据集进行精细调整后,损失值随迭代次数的增加而逐渐降低。经过5次迭代后,训练子集上的损失值最终降至0.601。通过测试子集对模型进行评估后发现...

结论

在这项工作中,我们提出了一种基于AI的策略来寻找用于LVs纯化的亲和肽配体。该策略结合了蛋白质语言模型ESM3-sm-open-v1和计算机模拟(in silico)筛选。通过精细调整的ESM模型生成了肽库后,进行了三轮分子对接筛选,以识别靶向VSV-G上保守的LDL-R CR2结合区域的亲和肽,最终确定了8个候选配体进行分子动力学(MD)模拟。

CRediT作者贡献声明

王飞波:方法学研究、数据收集、初稿撰写。董晓燕:方法学研究、撰写与编辑、监督、资金获取。于琳琳:资源准备、监督、撰写与编辑。孙艳:方法学研究、撰写与编辑、监督、项目管理。史庆红:方法学研究、初稿撰写、撰写与编辑、监督、项目管理、资金获取。

CRediT作者贡献声明

王飞波:初稿撰写、方法学研究。董晓燕:撰写与编辑、监督、方法学研究、资金获取。于琳琳:撰写与编辑、监督、资源准备。孙艳:撰写与编辑、监督、项目管理、方法学研究。史庆红:撰写与编辑、初稿撰写、监督、项目管理、方法学研究、资金获取。

利益冲突声明

作者声明没有已知的财务利益或个人关系可能影响本文所述的工作。

致谢

本研究得到了中国国家重点研发计划(项目编号2021YFC2103402)的财政支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号