全球不同国家人类冠状病毒的基因组范围比较分析:组成特征与密码子使用模式

《Ecological Genetics and Genomics》:Genome wide comparative analysis of compositional features and codon usage patterns of human coronavirus across different countries worldwide

【字体: 时间:2026年06月07日 来源:Ecological Genetics and Genomics CS1.8

编辑推荐:

  Tarikul Huda Mazumder | Arif Uddin 动物学系,Moinul Hoque Choudhury 纪念学院,Algapur 788150,印度 摘要 背景 导致 COVID-19 疾病的冠状病毒 SARS-CoV-2 吸引了科学界的关注,他们试图寻

  
Tarikul Huda Mazumder | Arif Uddin
动物学系,Moinul Hoque Choudhury 纪念学院,Algapur 788150,印度

摘要

背景

导致 COVID-19 疾病的冠状病毒 SARS-CoV-2 吸引了科学界的关注,他们试图寻找潜在疫苗开发的线索。这涉及到研究该病毒的核苷酸序列,以了解与其他相关人类冠状病毒基因组序列之间的变异和相似性,这些变异和相似性可能会影响其基因的功能。

方法

我们使用生物信息学方法,对来自世界各地 35 个人类宿主基因组(n=5)中的七种冠状病毒(HCoV-229E、HCoV-OC43、HCoV-NL63、HCoV-HKU1、MERS-CoV、SARS-CoV-1 和 SARS-CoV-2)的基因组中的核苷酸密码子使用情况进行了全面分析。

结果

人类冠状病毒基因组中的密码子使用在基因间几乎是随机的,但富含 AT 的核苷酸较为常见。二核苷酸 CpA 和 TpG 出现频率较高,而 CpG 和 TpC 则较少。值得注意的是,在蛋白质编码基因中,位于密码子位置 3 的密码子使用频率较高。HCoV-229E、SARS-CoV-1 和 SARS-CoV-2 的蛋白质编码基因中有 10 个以 A 或 U 结尾的密码子使用频率较高。同样,HCoV-HKU1 的蛋白质编码基因中有 17 个以 A 或 U 结尾的密码子使用频率较高,而 HCoV-NL63 和 HCoV-OC43 的蛋白质编码基因中有 14 个以 A 或 U 结尾的密码子使用频率较高。对应分析和对 PR2 图的分析表明,突变压力显著影响密码子使用。几乎所有冠状病毒基因组中的蛋白质编码基因都显示出正的 GRAVY 值。大多数冠状病毒的首选密码子使用的是次优的 tRNA 受体。对人类冠状病毒基因组中 ORF1ab 基因核苷酸序列的比较分析显示,有 5095 个保守区域和 17,094 个差异区域。ORF1ab 基因中的开放阅读框(ORF)数量最多的是 HCoV-HKU1,其次是 SARS-CoV-2、HCoV-NL63、HCoV-OC43、MERS-CoV、SARS-CoV-1 和 HCoV-229E。基于 ORF1ab 基因和刺突(S)基因核苷酸序列的系统发育分析表明,冠状病毒基因组之间的密码子使用存在显著相似性。

结论

我们对七种不同冠状病毒基因组的比较研究突出了这些基因组在核苷酸组成、突变和选择压力以及整体系统发育关系方面的相似性和差异,这些之前尚未被报道过。

引言

标准遗传密码包含 61 个密码子,它们只能识别蛋白质序列中的 20 种氨基酸,还有 3 个终止密码子,用于指示翻译的结束。遗传密码是冗余的,这意味着大多数氨基酸(甲硫氨酸和色氨酸除外)由多个密码子编码,这些密码子被称为同义密码子。在不同的基因或基因组中,同义密码子的使用并不均衡;某些密码子比其他密码子更受青睐,这种现象称为密码子偏好。密码子偏好可能受到 GC 含量、基因表达水平和基因长度的影响。此外,密码子使用模式可能会影响 mRNA 的生物合成、翻译延伸速度、蛋白质折叠以及表达后的其他生物学过程。最近的研究表明,重叠基因也可能在某些位点影响密码子使用。
解释密码子偏好现象的广泛接受的假设是突变-选择平衡,该假设认为密码子使用反映了突变压力、自然选择和种群内遗传漂变的综合影响。一般来说,突变压力会改变 A/U 和 G/C 对之间的平衡,从而导致核苷酸组成的偏差。选择压力倾向于选择那些能提高高表达基因中蛋白质生产效率的密码子。同时,由于移民和迁出等种群级因素,遗传漂变可以消除代际间的密码子变异。先前的研究表明,微生物中的密码子偏好通常由突变压力驱动,例如在 Xanthophyllomyces dendrorhous、寨卡病毒和其他人类 RNA 病毒(Jenkins 2003)中。然而,也有研究显示,Nipah 病毒(NiV)基因组中的密码子使用受到组成约束、选择压力和没有突变力的影响。
冠状病毒属于冠状病毒科,是最大的有包膜单链 RNA 病毒,其基因组大小从 26 到 31 千碱基不等。由于病毒复制的独特特性,冠状病毒具有较高的重组频率。所有冠状病毒的基因组都包含四种结构蛋白:刺突(S)、包膜(E)、膜(M)和核衣壳(N),这些蛋白位于病毒聚合酶基因的 3' 端,从 5' 到 3' 的顺序排列。两个开放阅读框(ORF1a 和 ORF1b)在病毒基因组的 5' 三分之二区域重叠,编码 RNA 依赖的 RNA 聚合酶。这些病毒会引起呼吸道或肠道疾病,并传播给多种哺乳动物和鸟类。近年来,人们越来越关注两种人类冠状病毒的出现:2002 年的严重急性呼吸综合征相关冠状病毒(SARS-CoV-1)和 2012 年的中东呼吸综合征冠状病毒(MERS-CoV),这两种病毒都来源于动物。Fumagalli 等人(2024)的最新研究表明,SARS-CoV-2 的刺突蛋白中的非同义突变比例高于其他 RNA 病毒,非同义突变的数量是同义突变的 20:1。尽管如此,在某些特定位点,同义突变仍然非常普遍。Kandeel 等人(2020)报告称,SARS-CoV-2 中富含嘧啶的密码子更受青睐,以 A 或 U 结尾的密码子频率较高,而以 G 或 C 结尾的密码子频率较低。同样,Khattak 等人(2021)报告称,SARS-CoV-2 基因组中几乎所有首选密码子都以 A 或 U 结尾,突变压力主要塑造了 SARS-CoV-2 基因组的密码子使用,尽管边缘选择压力的影响也不能忽视。
最近,有许多关于不同类型冠状病毒(包括与不同宿主相关的 Cov-SARS-2)密码子使用的研究,但我们的研究主要关注使用来自不同国家的 35 个完整基因组对七种主要人类冠状病毒的密码子使用、核苷酸组成、二核苷酸偏好和翻译适应性的全基因组比较分析。这种综合方法使我们能够识别出塑造密码子使用和宿主适应性的共有和谱系特异性进化特征。
我们使用了最可靠的单基因蛋白质编码序列来检查密码子使用偏好及相关指标和功能分类。密码子使用模式反映了进化过程,通过比较这些模式可以评估不同代谢途径之间的差异。然而,确定 RNA 病毒的进化原理至关重要,因为它不仅提供了理解进化变化基本机制所需的数据,还有助于开发 RNA 病毒的控制、治疗和根除方法,甚至可能预测它们的出现时间。
对所有七种人类冠状病毒的比较分析将增强我们对人类冠状病毒遗传机制的理解,并将其独特的密码子使用模式与特定的遗传或基因组功能联系起来,从而有助于未来冠状病毒研究的基因谱型开发,并可能为潜在疫苗的开发提供线索。我们还试图了解选择压力对七种人类冠状病毒基因组密码子使用的影响,并确定它们之间的系统发育关系。

章节片段

基因组数据的收集

我们从 NCBI 的 GenBank 数据库中检索了人类宿主中的冠状病毒(如 HCoV-229E、HCoV-OC43、HCoV-NL63、HCoV-HKU1、SARS-CoV-1 和 SARS-CoV-2)的基因组序列及其登录号(表 1)(http://www.ncbi.nlm.nih.gov)。我们仅选取了每个冠状病毒基因组中具有完整起始密码子和终止密码子的完整核苷酸编码序列(CDs),包括刺突(S)、包膜(E)、膜(M)和核衣壳(N)等基因的序列。

结果与讨论

对不同生物体的密码子偏好分析表明,它与蛋白质的表达、翻译延伸速率和整体功能有关,并且可能在地理分布上有所不同。因此,通过研究密码子偏好可以了解生物体的进化和蛋白质表达水平。

结论

本研究对所有七种人类冠状病毒基因组进行了比较分析,强调了它们在核苷酸组成、密码子使用模式、突变和选择压力以及系统发育关系方面的相似性和差异,这些方面之前尚未得到全面报道。我们的发现表明,所有七种基因组都富含 AT,并且密码子使用偏好较低,大多数密码子以 A 或 U 结尾。二核苷酸...

CRediT 作者贡献声明

Tarikul Huda Mazumder:撰写 – 审稿与编辑、撰写 – 原稿、软件、方法学、正式分析、数据管理、概念化。Arif Uddin:撰写 – 审稿与编辑、撰写 – 原稿、可视化、验证、监督、项目管理、方法学、调查、正式分析、概念化

参与同意

不适用。本研究基于 DNA 序列分析。

出版同意

所有作者同意发表该手稿

数据和材料的可用性

所有数据都包含在手稿和补充文件中

伦理批准

不适用。本研究基于 DNA 序列分析。

资助

本研究未获得公共、商业或非营利部门的任何特定资助。

利益冲突声明

作者声明没有利益冲突。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号