编辑推荐:
本研究为解决温带鹿角珊瑚在气候变化适应研究中缺乏高质量参考基因组的问题,构建了首个高连续性的日本高知县Acropora hyacinthus的PacBio HiFi基因组组装,并通过比较基因组学揭示了其与热带、亚热带种群间的系统发育关系及潜在的免疫和基因组重构相关基因家族的扩张,强调了使用高连续性组装对准确比较基因组分析的重要性。
在气候变化的威胁下,珊瑚礁正面临生存危机。作为关键造礁珊瑚的鹿角珊瑚(Acropora),其在不同地理环境下的适应能力研究尤为重要。然而,位于物种分布范围边缘的温带种群,其遗传资源仍然稀缺。例如,生活在日本高知县(Kochi)温带水域的Acropora hyacinthus种群在遗传上被认为是独特的,却长期缺乏一个高质量的参考基因组。这限制了我们从基因组层面深入理解这些边缘种群如何应对环境压力,以及它们在全球变化背景下可能扮演的“避难所”角色的潜力。传统的短读长基因组组装在解析复杂、重复的基因区域方面存在局限,可能导致对重要基因家族(如与免疫、转座子相关的基因)的识别不完整或计数不准。因此,获取一个高连续性、高质量的温带鹿角珊瑚基因组,对于揭示区域适应性进化的基因组基础,并公平、准确地进行跨种群比较,显得至关重要。
研究人员为了填补这一空白,开展了一项系统的基因组学研究。他们利用PacBio HiFi长读长测序技术,对一个来自日本高知县西泊湾的A. hyacinthus个体进行了从头基因组测序和组装。主要技术方法包括:1. 使用PacBio Revio测序系统生成高保真(HiFi)测序读长,并进行高质量组装;2. 利用BRAKER3流程,结合种群特异性RNA-seq数据,对新组装的Kochi基因组以及已公开的帕劳(Palau)染色体水平基因组进行标准化基因预测和注释;3. 使用OrthoFinder对包括Kochi、帕劳和冲绳(Okinawa)在内的16个Acropora物种的蛋白质组进行同源基因簇(Orthogroup)分析,以构建系统发育树并识别显著扩张或收缩的基因家族。
结果
1. 基因组组装和评估
研究人员成功构建了高知县A. hyacinthus的基因组组装,大小为480.16 Mb,包含189个重叠群(contig),具有很高的连续性(contig N50为6.99 Mb)。BUSCO评估显示其基因组完整性高达94.0%,表明组装质量优秀,为后续分析奠定了可靠基础。
2. 基因预测和蛋白质组完整性
通过BRAKER3流程预测,Kochi基因组最初包含28,943个蛋白质编码基因。经过去冗余处理获得初级异构体集后,蛋白质组包含20,636个序列。蛋白质水平的BUSCO评估显示,Kochi蛋白质组的完整性为93.4%,远高于使用相同流程注释的帕劳染色体水平组装的70.5%,这凸显了底层序列连续性的高低直接影响基因注释的完整性。
3. 高知县鹿角珊瑚谱系的系统发育位置
基于434个单拷贝同源基因构建的系统发育树显示,所有三个A. hyacinthus个体(来自Kochi、Palau和Okinawa)都位于鹿角珊瑚的IV分支内。有趣的是,温带的Kochi谱系与热带的Palau谱系形成了密切的姐妹群关系,而它们都与亚热带的Okinawa谱系明显不同。系统发育树的分支长度也显示出差异:Palau个体的分支非常长,而Kochi个体的分支则很短。
4. 在Kochi基因组中识别扩张的基因家族
通过与15个其他鹿角珊瑚基因组的比较,研究人员在Kochi基因组中识别出1,683个基因数量发生显著变化的同源基因簇(orthogroup),并且变化趋势主要表现为基因家族的扩张。其中,扩张最显著的两个基因家族是:
- •
OG0009229(C型凝集素结构域):Z值高达25.20。Kochi基因组拥有9个该基因的拷贝,而参考物种的平均拷贝数仅为0.13。
- •
OG0017780(逆转录病毒相关Pol多蛋白):Z值为19.11。Kochi基因组含有5个拷贝,而参考物种的平均拷贝数为0.07。
讨论与结论
本研究成功构建了首个高质量的温带Acropora hyacinthus基因组,其高连续性(contig N50为6.99 Mb)和高完整性(BUSCO 94.0%)为研究珊瑚的区域适应提供了宝贵资源。系统发育分析从基因组尺度证实了高知县温带种群与冲绳亚热带种群之间存在显著分化,且出人意料地与地理上更远的帕劳热带种群关系更近,这可能暗示了复杂的生物地理历史,如古代基因流动或物种间杂交。
研究发现的基因家族显著扩张,主要集中在与先天免疫(如C型凝集素)和基因组重组(如转座元件相关基因)相关的功能类别上。然而,作者谨慎地指出,这些观察到的扩张可能反映了两种可能性:一是真实的生物学分化,即温带种群为了适应独特环境压力而产生的基因复制;二是由于高通量、长读长测序技术能够更好地解析复杂、重复的基因区域,从而纠正了以往短读长基因组组装中对此类基因的低估。因此,这些结果突显了比较基因组学中的一个关键方法学问题:使用不同技术(短读长 vs. 长读长)和质量(碎片化 vs. 高连续性)的基因组组装进行比较时,所观察到的基因数量差异可能被技术差异所混淆。
综上所述,这项研究不仅为温带鹿角珊瑚的适应性进化研究提供了关键的基因组学工具,也强调了在未来的比较基因组学研究中,使用可比较的、高质量的长读长数据集对于获得准确、可靠的生物学结论至关重要。要真正理解这些候选基因家族的扩张是否与温带适应相关,还需要通过对更多个体进行种群规模测序以及功能实验来进一步验证。