利用综合免疫信息学和生物信息学方法,对针对Chapare病毒的一种新型多表位疫苗进行计算机辅助设计
《Medicine in Omics》:In-silico design of a novel multi-epitope vaccine against Chapare virus using integrated immunoinformatics and bioinformatics approaches
【字体:
大
中
小
】
时间:2026年05月11日
来源:Medicine in Omics
编辑推荐:
纳吉布·乌拉(Najeeb Ullah)、伊塔扎兹·乌尔·哈克(Itazaz Ul Haq)、穆罕默德·拉希亚布(Muhammad Rahiyab)、赛义德·舒贾伊特·阿里(Syed Shujait Ali)、伊萨克·汗(Ishaq Khan)、阿尔沙德·伊克巴尔(Arshad
纳吉布·乌拉(Najeeb Ullah)、伊塔扎兹·乌尔·哈克(Itazaz Ul Haq)、穆罕默德·拉希亚布(Muhammad Rahiyab)、赛义德·舒贾伊特·阿里(Syed Shujait Ali)、伊萨克·汗(Ishaq Khan)、阿尔沙德·伊克巴尔(Arshad Iqbal)
斯瓦特大学生物技术与微生物学中心,明戈拉19200,巴基斯坦卡拉奇专区(KPK)
**摘要**
查帕雷哺乳动物病毒(Chapare mammarivirus,简称CHAPV)属于沙粒病毒科(Arenaviridae),是导致人类查帕雷出血热(Chapare hemorrhagic fever)的病原体。目前尚无针对CHAPV的疫苗或抗病毒药物。通过利用免疫信息学算法,我们从该病毒的糖蛋白前体、核衣壳蛋白前体和Z蛋白前体中筛选出了潜在的CTL(细胞毒性T细胞)表位、B细胞表位和CTL表位,以开发候选疫苗。我们使用了多种接头分子(如KK、GPGPG和AAY)将这些表位连接起来。此外,通过EAAAK接头将Adjuvant 50 S核糖体蛋白L7/L12连接到疫苗的C端。所设计的多表位亚单位疫苗的三维结构通过ERRAT、PROCHECK和ProSA-web服务器进行了验证。结果显示,该疫苗的ERRAT值为88.167,Ramachandran图显示88.8%的氨基酸残基位于最稳定的区域;Z评分为-7.56;疫苗的抗原性评分为0.953767,免疫原性评分为-6.88914。验证后的结构通过MD模拟(分子动力学模拟)显示出良好的稳定性。密码子优化表明,该疫苗构建体的CAI( Codon Optimization Index)值为0.93,GC含量为50.30%,pET28a(+)载体表明其表达正常。免疫模拟显示TC细胞和TH细胞反应增强,IgM、IgG1和IgG2水平升高,并产生多种细胞因子,表明机体具有强烈的免疫反应和快速的抗原清除能力。本研究为未来验证疫苗的安全性和免疫原性提供了基础,为治疗CHAPV相关疾病提供了潜在的策略。
**1. 引言**
查帕雷哺乳动物病毒属于沙粒病毒科,是人类查帕雷出血热的致病因子。这类病毒主要通过啮齿动物传播。根据分布区域,沙粒病毒可分为新世界群(New World)和旧世界群(Old World)两组。旧世界群中最重要的病毒是淋巴细胞脉络丛脑膜炎(Lymphocytic Choriomeningitis, LCM)病毒,因为它们会引起严重的疾病;新世界群病毒被划分为A、B、C三个主要分支,其中B分支包含所有与出血热相关的病毒(如阿根廷、玻利维亚、委内瑞拉和巴西的出血热病毒)。上述病毒中,马丘波病毒(Machupo)、瓜纳里托病毒(Guanarito)和胡宁病毒(Junin)的致死率较高,约30%的病例会导致死亡。这些疾病具有相似的临床表现,潜伏期后会出现发热、疲劳、肌肉疼痛和食欲减退等症状,随后出现头痛、背痛、头晕、恶心、呕吐和极度虚弱。出血和神经系统症状(如微小出血点、颤抖、迟钝和牙龈出血)较为典型。在未接受治疗的患者中,约有三分之一的病例会出现神经系统和/或出血症状恶化,表现为广泛瘀伤、注射部位或黏膜出血、意识混乱和惊厥。虽然其他类似病毒(如拉蒂诺病毒Lato virus)也存在于同一种啮齿动物中,但在玻利维亚,只有Calomys callosus啮齿动物是马丘波病毒的已知宿主。
2013年1月,玻利维亚查帕雷省的萨穆扎贝蒂(Samuzabeti)社区首次发现了这种病毒引发的疫情。此次疫情仅有少数病例,其中一人死亡。2019年拉皮斯(Lapis)地区又有9人感染,其中4人死亡。其中至少3例为人际传播,一名胃肠病医生和一名实习医生因该病毒而去世。据推测,携带该病毒的宿主可能是小侏儒稻鼠(little Pygmy Rice Rat)。该病毒的基因组为单链RNA,分为两部分(L和S)。该病毒与萨比亚病毒(Sabia virus)关系密切,属于新世界群B分支的哺乳动物病毒。初期症状包括发热、不适、头痛、肌肉疼痛和背痛,潜伏期约为9至19天。随后病情加重,患者会出现神经系统症状和出血症状,如黏膜出血、贫血、白细胞减少、意识混乱、抽搐、瘀斑和多器官衰竭。感染患者的血液、尿液、结膜、精液、支气管肺泡液和鼻咽拭子中均检测到CHAPV RNA。部分幸存者长期存在神经系统后遗症。研究发现,患者症状出现86天后仍可在其精液中检测到病毒。
自2003年首次在玻利维亚发现CHAPV以来,人类感染病例极为罕见,全球确认病例不足二十例,大部分发生在玻利维亚。首次疫情发生在查帕雷省,导致一人死亡。2019年再次爆发,确认9例病例(含死亡病例),并确有医患间传播。此后还报告了其他零星病例。尽管病例总数较少,但高病死率和医院内传播风险凸显了这种新病原体对公共卫生的威胁。
2003年底,在靠近玻利维亚科恰班巴(Cochabamba)的山麓地区,记录到一小部分出血热病例。关于具体病例数量和症状的详细信息难以获取。仅有一例患者的生物样本和医疗记录可供研究:该患者22岁,曾在萨穆扎贝蒂居住四年,主要从事缝纫和农业活动。他在2004年1月3日发病前四周内没有旅行史,也未接触过类似疾病患者。其病程包括发热、头痛、关节痛、肌肉痛和呕吐,随后病情恶化并出现多种出血症状,最终于2004年1月17日死亡。初步诊断考虑为登革出血热或黄热病,但相关检测结果均为阴性。随后使用IgM、IgG抗体和RT-PCR检测马丘波病毒也呈阴性。为分离病毒,患者样本被送往亚特兰大最高安全级别(BSL4)实验室。从发病第4、7、9和14天采集的血液样本培养出病毒,这些病毒在Vero E6细胞中无致病性。通过兔血清进行的免疫荧光抗体检测确认这些病毒属于南美沙粒病毒(包括马丘波病毒、萨比亚病毒和瓜纳里托病毒)。RT-PCR分析扩增出481 bp的基因片段,其基因序列与南美新世界群B分支沙粒病毒一致。结合序列分析,成功鉴定出第9天采集的病毒株(编号810419)的完整基因组成,并利用新得到的序列信息进行了引物设计。虽然L片段需用不同引物扩增,但S片段可使用基于新世界沙粒病毒RNA末端的引物扩增。序列分析表明该病毒属于新世界群B分支。遗传分析显示CHAPV与萨比亚病毒最为相似,但存在显著遗传差异,属于不同物种。
**3. CHAPV的免疫学特性**
新世界群B分支沙粒病毒可通过人类细胞受体TfR1与人类细胞结合。尽管需进一步验证,但CHAPV可能也具有类似的结合特性。尽管通过氨基酸序列比较难以确定具体的TfR1结合域,但玻利维亚CHAPV与巴西萨比亚病毒之间存在关联。这两种病毒均能引起出血热。1990年,巴西圣保罗的萨比亚社区记录了一例由萨比亚病毒引起的心力衰竭病例。尽管其他新世界沙粒病毒(如马丘波病毒和瓜纳里托病毒)也可能导致出血热,但两者之间可能存在共同特征(如广泛的肝脏损伤)。初步研究未能确定该病毒的啮齿动物宿主。未来需要更多研究以明确人类感染来源,并评估CHAPV对当地公共卫生的影响。目前已知玻利维亚存在三种沙粒病毒:CHAPV、拉蒂诺病毒(Latino virus)和马丘波病毒(Machupo virus),均由Calomys callosus啮齿动物携带。尚未批准针对CHAPV的疫苗或抗病毒药物。临床治疗主要依靠对症支持措施,如补液、电解质平衡和氧气疗法。抗病毒药物(如利巴韦林)在 altre 沙粒病毒感染中的疗效尚不明确,因此亟需开发新疫苗。
**4. 研究意义**
鉴于CHAPV感染发病率低、病死率高且缺乏有效疫苗或抗病毒药物,制定有效的预防措施至关重要。计算机免疫学和免疫信息学取得的进展使得能够在计算机上识别出针对病毒引起的传染病的有效疫苗候选物。在这方面,本研究旨在使用计算机建模技术设计和预测一种潜在的多表位疫苗对CHAPV的疗效。所设计的疫苗结构已经对其抗原性、免疫原性、过敏性、稳定性以及与免疫受体的相互作用进行了评估,以确定其作为CHAPRE出血热疫苗的疗效。
2. 方法论
图1提供了本研究的一般工作流程。
下载:下载高分辨率图像(566KB)
下载:下载全尺寸图像
图1. 设计针对CHAPV的多表位疫苗候选物的步骤。
2.1. 用于疫苗开发的CHAPV蛋白质收集
从NCBI数据库(https://www.ncbi.nlm.nih.gov)[17]中检索了三种CHAPV蛋白质,包括糖蛋白(登录号YP_001816782.1)、核衣壳(登录号ABY87069.1)和Z蛋白(登录号ABY87070.1),利用VaxiJen2.0服务器。这些蛋白质被确定为具有抗原性(https://www.ddg-pharmfac.net/vaxigen/vaxigen/vaxigen.html),并选择它们来创建疫苗[18]。
2.2. T淋巴细胞(CTL)表位预测
NetCTL 1.2是一个基于网络的工具(NetCTL 1.2 ? DTU Health Tech ? Bioinformatic Services),它可以预测这些蛋白质的CTL表位[19]。肽与MHC的结合、蛋白酶体C端降解的有效性以及与抗原处理相关的转运蛋白TAP的转运精度是影响这些CTL表位预测的三个关键因素。TAP转运得分是使用权重矩阵预测的,而肽与MHC-1的结合以及蛋白酶体C端的降解则是通过人工神经网络预测的。为了检测CTL表位,设立了0.75的阈值[20]。
2.3. 辅助T细胞(HTL)表位预测
免疫表位数据库IEDB是一个基于网络的平台(https://tools.iedb.org/mhcii/),用于预测具有15个核苷酸长度的人类等位基因特异性辅助T细胞淋巴细胞。选择了七个HLA参考等位基因(HLA-DRB3*01:01, HLA-DRB3*02:02, HLA-DRB4*01:01, HLA-DRB1*07:01, HLA-DRB1*15:01, 和 HLA-DRB5*01:01)[21]。该平台预测基于受体的表位结合强度,这是通过为每个表位分配的结合得分(IC50值)来计算的。具有较强结合力的表位通常具有50 nM的IC50值。化合物的亲和力由其IC50值决定;小于500 nM的值表示中等亲和力,而大于5000 nM的值表示低亲和力表位。表位的百分位数与其亲和力呈负相关[22]。
2.4. B细胞表位预测
B细胞调节体液免疫并产生抗体,这是每个疫苗开发中的关键组成部分。使用了基于合成神经网络的服务器ABCpred(https://webs.iiitd.edu.in/raghava/abcpred/ABC_submission.html)来预测线性B细胞表位[23]。最终的疫苗设计包括每个蛋白质得分最高的18个核苷酸长的抗原表位。使用VaxiJen v2.0评估了这些表位的抗原潜力。
2.5. 多表位疫苗构建
来自UniProt数据库(https://www.uniprot.org/)的佐剂序列被用于创建多表位亚单位疫苗,并利用所有可用的表位来生成疫苗[24]。佐剂RL7_MYCTU大核糖体亚单位蛋白(UniProt ID: P9WHE3)被用来与CTL表位结合,使用EAAAK连接器。然后,使用两个AAY连接器将CTL表位连接在一起。接下来,使用GPGPG连接器将CTL和HTL表位连接起来。最后,使用KK连接器将B细胞和HTL表位连接起来[25]。
2.6. 疫苗过敏原性预测
使用Allertop 2.0(https://www.ddg-pharmfac.net/AllerTOP/)网络工具来预测多表位亚单位疫苗的过敏原潜力[26]。
2.7. 疫苗抗原性预测
使用了一个名为ANTIGENpro(https://scratch.proteomics.ics.uci.edu/)的网络服务器来预测抗原性[27]。该服务器采用双管齐下的方法:重复蛋白质的基本序列多次,并使用五种不同的机器学习技术来生成基于分析蛋白质微阵列信息的预测结果。
2.8. 蛋白质的物理化学性质和区域识别
使用基于网络的平台ProtParam(https://web.expasy.org/protparam/)来预测各种物理化学性质,包括理论pI值、稳定性指数、氨基酸含量、体内和体外半衰期、分子量、疏水性平均值(GRAVY)和烷基指数[28]。
2.9. 多表位疫苗结构的溶解度
使用基于网络的平台SOLUPROT(https://loschmidt.chemi.muni.cz/soluprot/)来分析最终的多表位疫苗结构[29]。该工具使用不同的分数生成溶解度得分。得分高于0.5(用绿色表示)表示蛋白质可能可溶,而得分低于0.5(用红色表示)则表明在大肠杆菌中的不溶性。
2.10. 预测最终疫苗的二级结构
使用Web服务器PSIPRED(https://bioinf.cs.ucl.ac.uk/psipred/)来预测疫苗结构的二级结构[30]。这种方法以其高准确性而闻名,它使用两个神经网络来分析PSI-BLAST(位置特异性集成BLAST)数据[31]。该服务器能够准确预测多种结构特征,包括结构域识别、alpha螺旋、蛋白质折叠、跨膜拓扑结构、膜螺旋预测和二级结构[32]。
2.11. 最终疫苗结构的3D分子建模
在开发基于表位的疫苗时,生成疫苗的三维模型是最关键的阶段之一。疫苗的蛋白质序列以fasta格式提交给Robetta服务器进行三维结构分析。自2014年以来,Robetta服务器(https://robetta.bakerlab.org/)因其连续自动模型评估(CAMEO)而成为最准确的服务器,以确保其精度[33]。
2.12. 三级结构的精细化
蛋白质的功能取决于其三维构型,这由氨基酸序列决定。这些因素决定了蛋白质与受体、酶和抗体等其他分子之间的相互作用[22],[34]。因此,疫苗蛋白质的三维构型会影响其引发免疫反应和提供防御免疫的能力[35]。为了实现这一目的,使用了基于互联网的工具Galaxy Refine(https://galaxy.seoklab.org/cgi-bin/submit.cgi?type=REFINE)[36]。Galaxy Refine的输出显示了五种生成的结构模型的得分,包括Ramachandran图中的优选区域百分比以及GDT-HA、MolProbity、Clash、RMSD和Poor rotamers[37]。该工具使用称为CASP10的精细化方法,重建蛋白质的侧链,重新包装它们,并利用分子动力学模拟来放松3D结构。Galaxy Refine是基于CASP10方法提高蛋白质结构整体和局部质量的最可靠工具之一[38]。该工具用于利用最佳的蛋白质结构预测工具来优化生成的结构[38]。
2.13. 三维结构的验证
使用在线工具ProSA-web、PROCHECK和ERRAT来确认批准疫苗模型的结构有效性。ERRAT在线应用程序用于分析不同原子之间的非共价相互作用[39]。PROCHECK服务器用于评估残基间的立体化学性质,并通过Ramachandran图验证目标模型[40]。Ramachandran图得分显示了能量上有利的区域大小。得分高于85%被认为是令人满意的[41]。这两个工具(PROCHECK和ERRAT)都可以在SAVES版本v6.0下获得(https://saves.mbi.ucla.edu/)。最后,使用ProSA-web服务器(https://prosa.services.came.sbg.ac.at/prosa.php)计算能量图和Z得分值,代表目标疫苗模型的总体质量得分[42]。结果以图形方式显示,x轴表示残基,y轴表示Z得分,与通过X射线晶体学和NMR确定的天然蛋白质结构进行比较[43]。
2.14. 预测不连续的B细胞表位
在蛋白质序列中距离较远但通过蛋白质折叠而靠近的残基会结合形成不连续的B细胞表位[44]。使用蛋白质的3D结构,Ellipro抗体表位预测服务器(https://tools.iedb.org/ellipro/)识别潜在的不连续或构象B细胞表位[45]。ElliPro使用基于突出指数(pI)值的三种方法来测量残基的pI和相邻的簇残基,并估计蛋白质的椭球形[46]。当选择PDB格式的模型提交给ElliPro服务器时,保持了默认的表位预测设置。
2.15. 将疫苗分子与TLR7对接并使用PDBsum检查复合物
疫苗物质必须与特定的免疫细胞受体结合以产生持久的免疫反应。执行分子对接测试来研究这些相互作用。分子对接是一种有益的方法,通过分析配体分子和受体分子的相互作用来确定复合物结合的稳定性和亲和力[47]。使用RCSB PDB数据库(https://www.rcsb.org/)[48]检索TLR7的PDB结构(PDB代码:7CYN)。在这项研究中,通过将其上传到HDOCK服务器(https://hdock.phys.hust.edu.cn/)[49]来分析疫苗物质与TLR之间的相互作用。之后,使用PyMOL可视化疫苗分子和TLR的3D复合物。最后,使用PDBsum来映射疫苗物质与TLR之间的相互作用残基[50]。
2.16. 评估疫苗与TLR7的结合强度
在对接分析之后,选择了每个对接复合物的最佳结构,并使用PDBsum网络服务器分析了TLR7和疫苗的结合亲和力。PDBsum(https://www.ebi.ac.uk/thornton-srv/databases/pdbsum/)[51]是一个图形数据库,提供了蛋白质数据银行(PDB)中每个3D结构的内容摘要。它显示了构成结构的分子(如蛋白质链、DNA、配体和金属离子)以及它们相互作用的图示[52]。该数据库广泛使用RasMol、JSmol和PyMOL分子图形工具来在3D中查看分子及其相互作用。
2.17. 最终疫苗设计的计算机克隆、密码子优化和逆转录翻译
使用EMBOSS工具Backtranseque(https://www.ebi.ac.uk/Tools/st/emboss_backtranseq)将氨基酸序列逆转录为核苷酸序列,以便在表达系统中表达嵌合蛋白[53]。当两种生物使用不同的密码子时,一种称为“密码子适应”的方法可以提高外源基因在宿主中的表达速率[54]。因此,使用Java Codon Adaptation Tool(JCat)(https://www.jcat.de/)[55]将疫苗蛋白在大肠杆菌K12中表达,大肠杆菌是测序最多的原核生物。表达速率因子的最佳范围是GC含量为50.7%,CAI为0.9[56]。为了防止细菌限制性内切酶切割位点,还检查了三个额外的JCat设置。同时确认优化后的核苷酸序列没有限制酶切割位点(HindIII和SphI)。随后,向优化的序列的N端和C端分别添加了HindIII和SphI限制酶切割位点。最后,使用SnapGene 3.2.1程序的 Restriction Cloning 模块将优化的密码子适应序列克隆到大肠杆菌pET28a(+)载体中[57]。
2.18. 最终亚单位疫苗结构的免疫系统模拟
通过免疫模拟评估疫苗蛋白的潜在免疫原性和免疫反应谱是研究免疫系统的重要步骤[58]。使用基于代理的免疫服务器C-ImmSim(https://kraken.iac.rm.cnr.it/C-IMMSIM/)[59]进行免疫疫苗蛋白的模拟。C-ImmSim服务器利用机器学习算法和位置特异性评分矩阵(PSSM)[60]来预测免疫系统与表位之间的相互作用。对于目前大多数可用的疫苗,推荐的最低接种间隔为四周。此外,TOVA方法建议以4周的间隔进行三次接种,以获得最佳的预防盘尾丝虫病的疫苗效果[61]。因此,使用了默认的模拟参数:宿主HLA选择(A MHC类I A0101等位基因,B MHC类I B0702等位基因,DR MHC类II DRB1_0101等位基因),随机种子12345,模拟步骤100,模拟体积10,注射时间步长设为1。C-ImmSim旨在描述疫苗(抗原)并在注射后在宿主细胞(特别是人类细胞)中引发的免疫反应。该工具可以测量免疫系统的细胞反应水平,包括辅助T细胞1(Th1)和辅助T细胞2(Th2),以及干扰素和抗体的生成。总之,该服务器有助于表征疫苗并预测可能的宿主免疫反应。
2.19. TLR7和疫苗的常规模式分析
使用iMODS在线服务器(https://imods.iqf.csic.es/)来识别疫苗TLR7复合物内的长期原子运动[62]。通过MD建模澄清了复合物的结构和动态[63]。
2.20.**疫苗-TLR7复合物的分子动力学(MD)模拟**
使用Gromax对疫苗-TLR7复合物进行了分子动力学(MD)模拟。该过程包括两个部分:能量最小化、适度加热和平衡。平衡后,运行了20纳秒的模拟。我们利用Gromax在20纳秒的时间尺度上研究了模拟后的轨迹(RMSD、RMSF和RoG)[64]。
**3. 结果**
3.1. 蛋白质检索
疫苗通过针对特定抗原或病原体产生强烈且持久的免疫反应来阻止传染病的传播,从而保护个人和社会健康[65]。为此,本研究使用了三种CHAPV蛋白质来研究潜在的候选疫苗。这些蛋白质,包括Z蛋白、核衣壳蛋白和糖蛋白,是从NCBI数据库中以FASTA格式获取的。
3.2. CTL特异性表位的预测
要成功根除感染并实现持久免疫力(包括体液免疫力),需要CTL细胞的参与。因此,我们将糖蛋白、核衣壳蛋白和Z蛋白的序列提交给NetCTL 1.2服务器,以预测潜在的免疫原性CTL表位。从预测的表位中选择了两个9个碱基对的候选表位用于疫苗开发,每个表位都是基于其强的MHC结合亲和力和预测得分选中的。选定的CTL表位列在表1中。
**表1. 选定的CTL表位列表。每个表位都是根据其得分选中的。**
| 蛋白质 | 肽序列 | 亲和力 | 亲和力重标定 | 切割点 | 组合得分 | 免疫原性 |
|---------|--------|---------|---------|-------|-------|
| 糖蛋白 | PrecursorSTELQNITI | 0.242 | 1.028 | 10.533 | 0.554 | 0.037 |
| Z蛋白 | PrecursorNTKTKDRQY | 0.216 | 0.917 | 2.908 | 1.204 | 0.244 |
3.3. HLA特异性表位的预测
辅助T细胞可以刺激抗体产生,重新激活B细胞,并控制炎症反应。它们可以分成多个具有不同功能的亚群,例如Th1细胞促进体液免疫力,而Th2细胞增强细胞介导的免疫力[66]。为了预测高免疫原性表位,将糖蛋白、核衣壳蛋白和Z蛋白的序列发送到IEDB服务器。根据百分比评分和不重叠序列标准,选择了九个15个碱基对的HLA表位用于疫苗开发。选定的HLA表位列在表2中。
**表2. 选定的HLA表位列表,每个表位都是根据其百分比排名选中的。**
| 蛋白质 | 等位基因 | 起始位置 | 结束位置 | 长度 | 核心肽 | 表位得分 | 排名 |
|---------|---------|---------|---------|---------|--------|------|
| 糖蛋白 | HLA-DRB3*02:02 | 3246 | 15 | IQINVSDSAE | TRIQINVSDSA | SAGSH | 0.808 | 70.182 |
| | HLA-DRB4*01:01 | 3044 | 15 | IQINVSDSAV | NETRIQINVSDS | AGSH | 0.572 | 30.483 |
| | HLA-DRB4*01:01 | 3347 | 15 | IQINVSDSA | TRIQINVSDS | AGSHD | 0.558 | 30.534 |
| 核衣壳蛋白 | HLA-DRB5*01:01 | 3123 | 26 | 15 | YIGSRSQVKGW | PXYIGSRSQV | KGRS | 0.808 | 90.125 |
| | HLA-DRB5*01:01 | 3113 | 25 | 15 | YIGSRSQVKEG | WPYIGSRSQV | KGRS | 0.753 | 10.226 |
3.4. B细胞表位的识别
抗体的合成对免疫系统的先天性和适应性反应至关重要,这依赖于B细胞。正确设计B细胞表位非常重要,因为它们可以激活多种防御系统,如补体系统激活和细胞介导的细胞毒性、凝集和中和作用。选择适当的B细胞表位对于设计和预防针对CHAPV的疫苗至关重要[67]。因此,使用ABCpred服务器识别了B细胞表位,最终选出了六个16个碱基对的表位用于疫苗开发。这些选定的B细胞表位列在表3中。
**表3. 预测的线性B细胞表位及其对应的得分。**
| 蛋白质 | 排名 | 序列 | 起始位置 | 得分 |
|---------|-------|---------|--------|
| 糖蛋白 | Precursor | 10 | AGSHDFKETML | QRLAI | 183 | 0.82 |
| | | 11 | LMFDKTPK | QFIVIRN | Q20 | 0.81 |
| 核衣壳蛋白 | 2 | FSTIIKTVL | GVKKR | EN27 | 10.93 |
| | | 3 | KGRSWENT | TVDLSL | KP32 | 0.90 |
| Z蛋白 | 3 | TKTKDRQY | QSNSSQPT | 40.85 |
| | | 7 | LKCLNTML | RRSNL | CDI6 | 10.72 |
3.5. 构建最终亚单位疫苗模型
称为连接器的短氨基酸序列用于将多个肽或蛋白质片段连接在一起。在疫苗开发过程中,连接器对于确定疫苗的稳定性、效果和引发免疫反应的能力至关重要[68]。在疫苗设计中使用了各种连接器,包括KK、GPGPG和AAY连接器。因此,我们使用GPGPG、KK和AAY连接器连接CTL、HLA和B细胞表位,创建了一个多表位亚单位疫苗。此外,我们还加入了结核分枝杆菌的50S核糖体蛋白L7/L12,这对于先天免疫力至关重要,并且能够诱导针对抗原的免疫反应,目的是增强疫苗引发免疫反应的能力[69]。使用EAAAK连接器将50S核糖体蛋白L7/L12连接到疫苗序列的C末端。图2提供了疫苗设计的示意图。
**图2. 本研究构建的疫苗候选物。**
3.6. 多表位疫苗的抗原性、致敏潜力、毒性和免疫反应的评估
创建的疫苗经过了抗原性和免疫原性、致敏潜力及毒性的评估。其抗原性得分为0.953767,而免疫原性为-6.88914。值得注意的是,疫苗被证明是无害且无毒的。
3.7. 最终疫苗的理化特性和溶解动力学
使用Soluprot服务器计算出亚单位疫苗的溶解度为0.6835。疫苗的理化特性分析包括以下参数:烷基指数、在大肠杆菌(E. Coli)中的半衰期、理论等电点(pI)、分子量、不稳定性指数、GRAVY值和氨基酸含量。发现疫苗的分子量为47200.23,不稳定性指数为31.01,表明疫苗是稳定的[70]。其烷基指数为65.09,表明具有显著的热稳定性[71]。疫苗在大肠杆菌中的半衰期超过10小时,表明在细菌中的表达稳定且易于纯化[72]。理论pI记录为9.62。GRAVY值为-0.721,表明与水有亲水相互作用。根据其理化特性,疫苗在大肠杆菌中表现出良好的表达、热稳定性和易于纯化的特性[73]。我们的发现与之前的关于理化特性的研究一致[74]。
3.8. 最终疫苗二级结构的检查
使用PSIPRED服务器构建了最终疫苗的二级结构[75]。二级结构组分在图3中以视觉形式表示。疫苗中有32.43%的α螺旋、13.29%的延伸链、4.05%的β转角和50.23%的随机卷曲。
**图3. 疫苗二级结构的示意图。螺旋用粉色表示,β链用黄色表示,卷曲用灰色表示。(有关此图中颜色参考的解释,请参阅文章的网页版本。)**
3.9. 生成疫苗的三级结构
疫苗的组成类似于它所针对的病毒或细菌的结构,有助于免疫系统识别和应对感染[76]。使用Robetta在线平台,并采用比较建模技术,对疫苗结构进行了三维配置的构建[77]。Robetta服务器生成了五个疫苗结构原型,并通过全面的质量评估选择了最佳模型。
3.10. 提高疫苗的三维排列
使用Galaxy Refine网络服务器在精炼过程后提高了蛋白质模型的质量。通过减少能量消耗和优化环路,达到了理想的结构质量。使用Galaxy Refine网络服务器,最初的“粗略”疫苗模型得到了优化,生成了五个模型结构。模型1在各种参数评估中显示出更优的结构质量。在精炼过程中考虑了多个因素,包括MolProbity得分为1.912、RMSD为0.295和GDT-HA为0.9865。碰撞和不良旋转器得分分别为11.7和0.6,而预期的Ramachandran得分为95.2%[78]。
3.11. 提高后疫苗三维结构的验证
通过分析Ramachandran图来验证改进后的模型,结果表明Rama优先区域包含了88.8%的残基,其次是允许区域占9.6%,自由允许区域占0.5%,不允许区域占1.1%(图4A)。此外,使用ERRAT和ProSA-web服务器对原始3D模型进行了整体质量和缺陷的评估[79]。ProSA-web显示改进模型的Z得分为-7.56(图4B),虽然超出了同类天然蛋白质的通常范围,但它与实验验证的结构相符,并接近数据库中的平均值。使用ERRAT,改进后的模型的总质量因子为88.167%(图4C)。改进和验证后的疫苗三维结构显示在图5中。
**图4. (A) CHAPV的Ramachandran图;(B) Z得分图,黑点表示疫苗设计的Z得分;(C) 通过ERRAT验证的整体质量指标。**
3.12. 预测不连续B细胞表位
新蛋白质的组织和折叠可能会产生新的B细胞构象表位,需要额外的预测。因此,使用ElliPro服务器,我们能够在更新的3D模型中找到B细胞表位的不连续性。ElliPro预测了九个新的不连续B细胞表位,涉及241个残基(表4)。图6展示了每个表位的详细信息以及完整的3D模型。
**表4. 显示了预测的不连续B细胞表位的得分。**
| 序列 | 残基数 | 得分 |
|---------|--------|------|
| 1 | A:V65 | 0.794 |
| 2 | A:D216 | 0.748 |
| 3 | A:G217 | 0.748 |
| 4 | A:Q365 | 0.732 |
| 5 | A:M1 | 0.712 |
| 6 | A:N148 | 0.716 |
| 7 | A:K14 | 0.569 |
| 8 | A:A12 | 0.569 |
| 9 | A:D11 | 0.569 |
| 10 | A:A12 | 0.569 |
| 11 | A:A13 | 0.569 |
| 12 | A:D11 | 0.569 |
| 13 | A:A14 | 0.569 |
| 14 | A:M1 | 0.569 |
| 15 | A:A2 | 0.569 |
| 16 | A:A3 | 0.569 |
| 17 | A:K3 | 0.569 |
| 18 | A:L4 | 0.569 |
| 19 | A:A12 | 0.569 |
| 20 | A:D11 | 0.569 |
| 21 | A:A13 | 0.569 |
| 22 | A:K3 | 0.569 |
| 23 | A:L4 | 0.569 |
| 24 | A:A14 | 0.569 |
| 25 | A:Q3 | 0.569 |
| 26 | A:A2 | 0.569 |
| 27 | A:D21 | 0.569 |
| 28 | A:G21 | 0.569 |
| 29 | A:P21 | 0.569 |
| 30 | A:G22 | 0.569 |
| 31 | A:E21 | 0.569 |
| 32 | A:K3 | 0.569 |
| 33 | A:L4 | 0.569 |
| 34 | A:A2 | 0.569 |
| 35 | A:K3 | 0.569 |
| 36 | A:T3 | 0.569 |
| 37 | A:A1 | 0.569 |
| 38 | A:N4 | 0.569 |
| 39 | A:L4 | 0.569 |
| 40 | A:C4 | 0.569 |
| 41 | A:D4 | 0.569 |
| 42 | A:A1 | 0.569 |
| 43 | A:K3 | 0.569 |
| 44 | A:L4 | 0.569 |
| 45 | A:M1 | 0.569 |
| 46 | A:A2 | 0.569 |
| 47 | A:K3 | 0.569 |
| 48 | A:L4 | 0.569 |
| 49 | A:A1 | 0.569 |
| 50 | A:P2 | 0.569 |
| 51 | A:G2 | 0.569 |
| 52 | A:R2 | 0.569 |
| 53 | A:Q2 | 0.569 |
| 54 | A:V2 | 0.569 |
| 55 | A:K2 | 0.569 |
| 56 | A:G2 | 0.569 |
| 57 | A:P2 | 0.569 |
| 58 | A:G2 | 0.569 |
| 59 | A:P2 | 0.569 |
| 60 | A:G2 | 0.569 |
| 61 | A:I2 | 0.569 |
| 62 | A:G2 | 0.569 |
| 63 | A:P2 | 0.569 |
| 64 | A:Y2 | 0.569 |
| 65 | A:G2 | 0.569 |
| 66 | A:R2 | 0.569 |
| 67 | A:Q2 | 0.569 |
| 68 | A:G2 | 0.569 |
| 69 | A:R2 | 0.569 |
| 70 | A:Q2 | 0.569 |
| 71 | A:G2 | 0.569 |
| 72 | A:P2 | 0.569 |
| 73 | A:K3 | 0.569 |
| 74 | A:L4 | 0.569 |
| 75 | A:A2 | 0.569 |
| 76 | A:T3 | 0.569 |
| 77 | A:A1 | 0.569 |
| 78 | A:D1 |对于这个序列,产生的CAI值为0.93。GC含量的推荐范围是30%到70%,而CAI得分超过0.8通常被认为是出色的[81]。这些发现表明目标疫苗的表达率很高,并且与早期研究报道的持续疫苗表达的类似数据范围一致[82]。最后,使用HindIII和SphI限制性内切酶将优化的Chapare序列克隆到pET28a(+)载体中(见图8)。下载:下载高分辨率图像(345KB)下载:下载全尺寸图像图8。序列调整和计算机辅助克隆疫苗。红色表示在PET28a(+)载体中克隆的序列。
3.15. 计算机辅助免疫模拟
模拟免疫反应对于疫苗开发至关重要。疫苗的设计目的是触发身体的免疫反应以抵御特定感染而不引起疾病。为了评估我们创造的疫苗所引发的免疫反应,使用了C-imsimm服务器进行免疫模拟[83]。研究发现,接种疫苗后产生了强烈的初级免疫反应。IgM+IgG抗体的滴度接近700,000/ml(见图9A),而IgM抗体的滴度超过400,000/ml。IgG1+IgG2和IgG1的滴度分别约为15,000/ml。在免疫后期间,IgG2抗体的反应保持较低。疫苗引发的免疫反应在很大程度上依赖于白细胞介素和细胞因子。免疫后,身体的抗原呈递细胞(APCs)识别出疫苗抗原并准备将其呈现给T细胞。当T细胞被激活时,会释放出包括IL-2和干扰素-γ(IFN-γ)在内的细胞因子,这些细胞因子促进了B细胞和T细胞的增殖和分化。B细胞产生的抗体可以中和针对疫苗的病原体[84]。接种疫苗后,白细胞介素(IL)和细胞因子显著升高。经过逐渐增加后,目标疫苗的INF-γ水平接近430,000/ml。同样,IL-2的浓度也较高,达到了近450,000/ml(见图9B)。总之,我们创造的用于对抗Chapare的疫苗显示出高度的免疫原性,因为它有效地引发了强烈的免疫反应。
3.16. 复合物的常态模式模拟
在iMODS服务器上使用分子动力学模拟来研究疫苗对接的TLR7复合物的稳定性和动态性。图10显示了对接复合物的结果。首次构建了一个可变形性图表,以便评估每个残基的分子可变形性。NMA和B因子测试计划在将来进行更新。随后创建了一个特征值图,该图显示了模型的相对刚性:较低的特征值表示变形较简单。当前研究中确定的特征值为5.800095e-06。得到的方差图显示了每个常态模式的特征值与方差之间的反比关系。对于大分子片段,协方差图显示了三种不同的运动模式:无关的白色、相关的红色和反相关的蓝色。原子间连接的刚度在弹性网络图中显示;更硬的弹簧用较深的颜色表示。
3.17. 复合物的MD模拟
我们使用分子动力学模拟来研究TLR-7复合物和疫苗构型的稳定性和波动。图11显示了疫苗、蛋白质及侧链的计算RMSD和RMSF以及它们的图表。经过20纳秒的模拟后,评估了TLR-7疫苗的残基和侧链的系统稳定性,整体RMSD值为1-6?(TLR-7)。系统最大残基的RMSF也在可接受范围内,但有些残基更不稳定。RoG研究表明,在MD模拟过程中蛋白质结构保持紧凑。图11C显示RoG从64.90开始,下降到64.75,然后上升到64.80,最终在模拟结束时达到64.85。
4. 讨论
CHAPV导致人类出现Chapare出血热,属于沙粒病毒科。这项研究的目的是开发有效的CHAPV感染候选疫苗。通过刺激免疫反应,疫苗在防止微生物引起的感染方面发挥着关键作用[85]。传统疫苗通常被认为是控制各种疾病的有效策略,但会遇到许多体内方法无法克服的障碍。相比之下,体内亚单位疫苗具有更高的稳定性、无毒性和更简单的工程过程。通过传统方法制造疫苗以引发所需的抗体反应既费力又成本高昂[86]。相反,现代疫苗通过逆向疫苗学技术设计,利用病原体基因组数据和表位映射,避免了培养病原体的需要[87]。与传统的单表位疫苗不同,多表位疫苗设计的新方法是通过病毒基因组筛选识别免疫原性表位,从而实现高度针对性的免疫反应,同时不改变病毒病理[88]。基于表位的疫苗有许多优点,例如能够诱导定向的免疫反应并减轻非表位区域的损害[89]。它们还便于表位工程,以增强免疫反应和与目标分子的结合效率,促进后续的细胞信号传导[90]。先进的免疫信息学技术已经帮助研究人员预测开发有效多表位疫苗候选所需的潜在抗原表位[91]。与通常使用大蛋白质或整个基因组来引发免疫反应的重组疫苗技术不同,多表位疫苗设计基于小的免疫原性序列来引发反应,从而防止宿主体内过度的抗原负荷和过敏反应[93]。这种方法相比传统和单表位疫苗具有多个优势,包括通过来自不同T细胞亚群的TCRs发现多个MHC1和MHC2表位,同时通过重叠的B细胞、HTL和CTL表位触发体液和细胞免疫,佐剂促进持续的免疫反应,并避免了体外抗原表达和病原体培养的问题[94]。具有多个表位的疫苗设计领域正在迅速发展,显示出体内有效性和保护性免疫,已有I期临床试验进行了验证。相同的计算方法已被有效用于设计针对各种病毒病原体的合理多表位疫苗[95][96][97][98][99][100][101],证明了这些方法在疫苗设计中的可靠性。
在本研究中,我们开发了一种针对CHAPV的多表位亚单位疫苗候选物。我们使用了多种免疫信息学方法来研究潜在的抗原,重点关注CHAPV的糖蛋白前体、核衣壳蛋白和Z蛋白前体。我们预测了这些蛋白质的CTL、HTL和B细胞表位。在最终疫苗构建中选择了六个B细胞表位、九个HTL表位和四个CTL表位,这些表位被验证为非抗原性、非过敏性和非毒性。使用了多种连接剂(如KK、GPGPG和AAY)来连接这些表位,并且在疫苗的C末端添加了50S核糖体蛋白bL12佐剂和EAAAK连接剂。此外,还评估了疫苗的物理化学参数。结果表明,该疫苗由444个氨基酸组成,分子量为47200.23,理论pI值为9.62,表明其呈碱性。计算出的疫苗不稳定性指数为31.01,低于40表示不稳定,说明我们构建的疫苗是稳定的。此外,我们开发的疫苗的GRAVY值为-0.721,如果其烷基指数得分超过50,则疫苗在高温下是稳定的[102],我们的疫苗烷基指数得分为65.09。使用SoluProt服务器预测疫苗的溶解度得分,得分低于0.5表示疫苗不溶,而我们的疫苗溶解度得分为0.6835。我们还使用Allertop服务器预测了疫苗的过敏性,结果表明我们的疫苗是非过敏性的。我们的疫苗在ANTIGENpro和IEDB服务器上都获得了优异的抗原性和免疫原性得分,最终免疫原性得分为-6.88914,抗原性得分为0.953767。接下来,使用PSIPRED和SOPMA服务器预测了最终疫苗的二级结构。对包含444个氨基酸的构建进行的分析显示,50.23%的氨基酸参与螺旋结构,32.43%参与α螺旋形成,13.29%参与伸展链形成,4.05%参与β折叠形成。结果被认为是可接受的,因为预期的疫苗二级结构包含足够的螺旋,这代表了氢键的数量,从而表明了蛋白质的强度。使用Robetta服务器确定了三级结构,Galaxyrefine服务器用于改进疫苗的3D模型。Z-score、PROCECK和Prosa-web服务器使用Ramachandran图检查了疫苗的三级结构。总质量因子通过ERRAT评估为88.167。改进后,疫苗的Ramachandran图处于最佳区域88.8%,精炼模型的Z-score为-7.56。较低的Z-score意味着疫苗的3D模型质量更高;这证明了我们模型的高质量。3D疫苗模型产生了九个不连续的B细胞表位。由于体液免疫反应依赖于不连续B细胞表位产生的抗体[103],因此这一点非常重要。与TLR7的对接研究表明具有很强的结合亲和力,表明具有引发先天性和适应性免疫反应的潜力[104]。PDBsum分析显示了强烈的亲和力,发现了242个非键合相互作用、13个氢键和3个盐桥。这些相互作用使用了PhyMol进行显示。使用残基动力学、弹性网络、可变形性和B因子等指标,iMODS分子动力学模拟评估了复合物的稳定性。结果表明,疫苗-TLR7复合物是稳定的和适应性的。疫苗的GC含量为50.30%,密码子适应性指数(CAI)为0.93。使用SnapGene工具,将包含限制位点HindIII和SphI的修饰基因或序列克隆到pET-28a(+)载体中,其密码子适应性和GC含量支持高水平的蛋白质表达。免疫模拟显示IgG1+IgG2、IgM+IgG、INF-γ和INF-2显著增加。
结论
总之,在本研究中,我们利用免疫信息学工具构建了一种针对CHAPV的双表位疫苗候选物。CHAPV是一种新兴的人畜共患病病毒,可引起Chapare出血热。通过识别重要的病毒蛋白中的各种B细胞和T细胞表位,并将这些表位链接成一个单一的构建体,设计出了一种具有抗原性、非过敏性和免疫原性的多表位疫苗候选物。这样的疫苗候选物显示了对抗CHAPV感染的有希望的预防工具。然而,在将其用于感染者之前,对设计的疫苗候选物进行实验验证是至关重要的。
6. 局限性
尽管结果很有希望,但这项研究也存在一些局限性。首先,疫苗设计和测试完全是通过计算和免疫信息学方法完成的,这可能无法完全再现活体系统中发生的复杂生物相互作用。其次,预测的表位和疫苗构建需要在体外免疫实验和体内动物模型中得到实验验证。第三,当前研究缺乏关于CHAPV的基因组序列和免疫学信息的分析。由于该病毒只在少数人类病例中被发现,病毒株的多样性不足以进行此类分析。未来的研究可能会使人们更好地分析HLA血型表位在世界各地人群中的保守性及其覆盖范围。此外,通过模拟预测的免疫反应在实际生物情况下可能会因为宿主的遗传多样性和环境条件而有所不同。因此,在未来的研究中,应进行实验和临床试验来验证所提出的疫苗候选物的有效性和安全性。
7. 生成式人工智能声明
作者希望声明使用了人工智能(AI)辅助的语言编辑工具Chat GPT来改进手稿的语法、清晰度和可读性。该AI工具仅用于语言上的优化,并未参与科学内容的编写、数据分析、结果解释或图表制作。本手稿中呈现的所有结果、图表、分析和结论均由作者本人生成和验证。
作者贡献
NU和HAQ:使用软件进行数据收集与分析,并撰写了实验方法的原稿。
AI:监督研究过程和手稿的准备工作。
SSA和MR:执行计算模拟并验证结果。
MI:协助撰写和编辑手稿。
作者贡献声明
Najeeb Ullah:正式分析、数据管理、概念化。
Itazaz Ul Haq:正式分析、数据管理、概念化。
Muhammad Rahiyab:正式分析、数据管理、概念化。
Syed Shujait Ali:结果验证、软件开发、方法论制定。
Ishaq Khan:文本撰写与审稿、初稿撰写。
Arshad Iqbal:数据可视化、结果验证、研究监督。
资金来源
作者在完成本研究过程中未获得任何组织的资助。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号