编辑推荐:
为解析野生哺乳动物基因组结构、选择与变异,并支撑其作为生态-进化-疾病(eco-evo-disease)研究模型的广泛应用,研究人员完成了对河岸田鼠(Clethrionomys glareolus)染色体水平的高质量基因组组装与注释。该2.24 Gb基因组被锚定至28条染色体尺度,注释出40,393个基因位点,包含21,029个蛋白质编码基因,BUSCO完整性评估达90.6%。此资源为研究物种对气候变化的生态进化响应、发育生物学及宿主-病原体互作等跨学科领域提供了前所未有的高分辨率基因组基础。
在生态学、进化生物学和疾病研究领域,对非传统模式生物的基因组资源需求日益增长。河岸田鼠(Clethrionomys glareolus)作为一种分布广泛的野生啮齿类动物,正迅速崛起为研究生态进化、气候变化响应以及多种病原体(如汉坦病毒、伯氏疏螺旋体)与宿主相互作用的关键模型。然而,此前缺乏高质量的染色体水平基因组,严重限制了科学家们从基因组结构、自然选择和结构变异等层面,深入探索其适应性和疾病易感性的分子机制。为了填补这一空白,并为跨学科研究提供一个坚实的基础资源,一个国际研究团队在《Scientific Data》上发布了河岸田鼠的染色体水平基因组。
为了获得高质量的参考基因组,研究人员结合了多种测序技术。他们首先利用PacBio长读长测序技术进行初步组装,以获得长片段序列。随后,利用Hi-C(染色体构象捕获,Chromosome Conformation Capture)技术将组装出的片段(Scaffolds)锚定和聚类到染色体水平。通过结合RNA测序(RNA-seq)数据和同源比对(如Swiss-Prot数据库),对基因组进行了基因结构预测和功能注释。此外,还对基因组中的重复序列进行了系统分析。
染色体水平基因组组装
研究人员成功构建了一个高质量的河岸田鼠基因组。该基因组大小为2.24 Gb,通过Hi-C技术被成功解析为28条染色体尺度的Scaffolds,这与该物种已知的核型(karyotype)完全一致。组装结果显示出高度的连续性和完整性。
基因与重复序列注释
通过整合多源数据,研究团队在基因组中预测了40,393个基因位点,其中包含21,029个由Swiss-Prot同源证据支持的蛋白质编码基因。对基因组组成的分析表明,重复序列元件(repetitive elements)约占基因组的29%,这与其他啮齿类基因组的情况类似。组装质量评估工具BUSCO(Benchmarking Universal Single-Copy Orthologs)的评估结果显示,该基因组的完整性评分为90.6%,证实了其作为参考基因组的高质量。
与先前基因组的比较
与此前可获得的、较为零散的基因组组装版本相比,本次完成的染色体水平组装在连续性和准确性上实现了质的飞跃。这使得研究者能够以前所未有的分辨率,对河岸田鼠的基因组结构、受自然选择的区域以及大规模的结构变异(如拷贝数变异、倒位等)进行深入探究。
该研究提供了一个高质量、染色体水平的河岸田鼠参考基因组。这一资源的核心意义在于其强大的跨学科应用潜力。首先,它使得科学家能够精确研究河岸田鼠种群在应对气候变化时的生态与进化响应机制,无论是在空间梯度上还是时间序列上。其次,它极大地促进了将河岸田鼠作为模型,用于发育生物学、免疫学及病毒学等领域的研究。特别是在研究宿主-病原体相互作用(host-pathogen interactions)方面,该基因组为识别与疾病抗性/易感性相关的基因和通路(pathway)奠定了坚实基础。总之,这项研究不仅为河岸田鼠这一新兴模式生物的生物学研究提供了关键工具,也扩展了该基因组资源在更广泛的生物学学科中的相关性,有力推动了“生态-进化-疾病”交叉领域的研究。