编辑推荐:
本研究对2007-2024年间来自欧亚25个国家的250株非洲猪瘟病毒(ASFV)基因II型分离株进行全基因组分析,首次提出了基于单核苷酸多态性(SNP)的时空分类系统,鉴定出4个拓普型(Topotypes)和31个遗传谱系(Genetic Lineages)。这项工作克服了传统基于B646L基因分型及多位点分析的局限性,为ASF疫情的国际监测、溯源追踪及分子流行病学研究提供了高分辨率的新工具。
引言
自2007年非洲猪瘟病毒(ASFV)基因II型从非洲传入格鲁吉亚以来,该病已在欧亚大陆包括波兰、德国、罗马尼亚、匈牙利、意大利、菲律宾等多个国家成为地方性流行病,造成严重的经济损失。超过99%的疫情可归因于高度致病的血吸附性基因II型病毒。传统的基因分型方法主要依赖于B646L基因,在全面理解病毒传播模式方面存在显著局限。以往基于B602L基因的CVR区域以及I73R/I329L位点寻找通用标记的尝试,也未能清晰描绘病毒在欧亚大陆的地理分布全貌。为了应对这些挑战,本研究旨在基于全基因组分析,开发适用于2007年至2024年间在欧亚大陆分离的ASFV基因II型毒株的亚基因分型新方案。
材料与方法
研究从GenBank国际数据库中导入了258个来自欧亚26个国家(2007-2024年)的ASFV基因II型分离株/毒株的全基因组注释序列文件。通过筛选,最终有250个分离株的全基因组序列被纳入分析。序列通过MAFFT进行比对,并使用trimAl进行修剪。在基于ModelTest-NG选择了最佳DNA替代模型TPM1uf + G4后,利用RAxML(随机加速最大似然法)构建了最大似然树(ML树),并使用iTOL进行可视化。分子流行病学地图则通过QGIS软件绘制。
结果
通过最大似然法构建的系统发育树清晰地展示了自格鲁吉亚2007/1株(作为根节点)分化出的子分类群拓扑结构。基于此,我们提出了一种将欧亚大陆流行的ASFV基因II型分为拓普型和遗传谱系的新分类法。分类概念基于分离株的种系地理学归属以及特定的单核苷酸多态性组合。拓普型的鉴定基于时空因素,而遗传谱系的划分则基于自展值在65到100之间的高置信度分支。
研究共鉴定出四个拓普型:高加索1型、欧洲1型、欧洲2型和亚洲1型。每个拓普型的所有代表株至少拥有一个该分类群特有的SNP。在这些拓普型内部,共鉴定出31个遗传谱系。对于未被分类的变异,则标记为“未分类”。在命名上,拓普型名称指示了病毒主要传播地域的顶级域,而遗传谱系的名称则考虑了病毒首次被检测到的国家,但仅使用顶级域代码以避免与国家直接关联。建议使用“II/拓普型/遗传谱系”的格式进行系统记录,例如“II/高加索1型/未分类”。
地理分布图显示,除了立陶宛、波兰和俄罗斯,欧亚大陆其他国家的行政区域都只检测到单一拓普型病毒的传播。在立陶宛发现了三种拓普型,在波兰发现了两种,而在俄罗斯则检测到了全部四种拓普型,这表明了ASFV基因II型拓普型与欧亚大陆特定地区的地理关联性。
研究还对比了本文提出的全基因组分类法与Gallardo C.等人提出的基于6个标记位点遗传变异进行分类的方法。结果表明,两者之间没有建立关联性。基于全基因组的种系发育分析分类出31个遗传谱系,而6个位点的分析仅对应4个已分类和4个未分类的遗传组。这种位点分型法的低分辨率凸显了进行全基因组分析的首要重要性。
讨论
种系地理学是研究生物体基因组进化的科学,其时空方法有助于重建非洲猪瘟的传播模式。在超过18年的基因II型ASFV流行期间,病毒在动物群体传播过程中,其基因组中产生了大量的SNP,导致原始毒株分化出众多遗传变异。这些分子进化并未显著改变病毒的生物学特性,但使得可以根据其地理流行病学特征来区分野外分离株。
寻找能够反映全基因组系统发育树拓扑结构的通用传播标记的努力并未成功。基于6个位点与全基因组的比较表明,多数情况下标记位点是同质的,但在全基因组水平上差异显著。这再次强调了在追踪基因II型ASFV传播时,位点分析的分辨率不足,以及基于位点和基于全基因组构建的系统发育树拓扑结构的不一致性。
因此,本研究提出了一种仅基于全基因组分析、用于可靠地对基因II型内部进行亚基因分型的工具。所提出的分类完全基于系统发育关系,并依赖于鉴定已知的SNP。分为拓普型和遗传谱系的命名法反映了分离株群体在欧亚大陆不同区域的传播。系统发生树清晰地展示了传播历史:初始的“高加索1型”于2007年从非洲传入格鲁吉亚;“欧洲1型”随后出现在俄罗斯、乌克兰、塞尔维亚、意大利等多国;至少到2016年,从“欧洲1型”中分化出“欧洲2型”;而在2017-2018年间,另一个携带MGF 360-10L基因特异性SNP的变异从“欧洲1型”中分化出来,并传播至亚洲,被命名为“亚洲1型”。在每个拓普型内部,ASFV继续进化并分化出具有特定SNP的亚变体,被指定为遗传谱系。
该方法具有优势和不足。其显著优势在于非离散性:该分类是开放性的,随着疫情的持续和病毒的分子进化,新的遗传谱系乃至新的拓普型将会形成,从而实现更精确的分子追踪。此外,在常规实验室实践中,可能无需构建系统发育树,只需将待测样本与参考基因组进行一致性比对,并根据特定SNP进行归类即可。该方法的主要缺点在于成本相对较高,需要高通量测序。此外,已公布的欧亚ASFV全基因组序列数量极少,且各国样本量不均,某些国家数据的缺乏也降低了研究结果的可靠性,因此在推断疫情起源和传播时需格外谨慎。
总之,本研究科学地论证并提出了一种针对ASFV基因II型内部亚基因型的新分类系统,这将极大扩展未来监测和调查非洲猪瘟疫情的能力。未来将有更多欧亚大陆ASFV分离株的基因组数据发布,这将深化我们对疾病传播模式的理解。