全基因组重测序数据为种群结构和生命史提供了高分辨率的保护学见解
《Conservation Genetics》:Whole genome resequencing data provide high-resolution conservation insights into population structure and life history
【字体:
大
中
小
】
时间:2026年05月02日
来源:Conservation Genetics 1.7
编辑推荐:
摘要
全基因组重测序可以成为揭示生物学见解和量化与保护相关的群体基因组指标的强大工具。这些见解在那些研究不足但种群数量可能正在减少的隐秘或难以捉摸的物种中可能最为重要。西部鸡龟(Deirochelys reticularia miaria)就是这样一个例子,保护主义者对其种群
摘要
全基因组重测序可以成为揭示生物学见解和量化与保护相关的群体基因组指标的强大工具。这些见解在那些研究不足但种群数量可能正在减少的隐秘或难以捉摸的物种中可能最为重要。西部鸡龟(Deirochelys reticularia miaria)就是这样一个例子,保护主义者对其种群数量的下降表示担忧。在这里,我们报告了西部鸡龟基因组序列数据分析的结果,以及如何利用这些推断来为管理决策提供信息。我们首先测序并组装了一个新的参考基因组,然后对德克萨斯州大部分地区进行了群体基因组重测序调查,这是首次在淡水龟类中进行此类研究之一。我们发现了表明出生地忠诚性的精细尺度种群结构。固定指数的绝对值相对较小(所有成对FST ≤ 0.03),但重测序数据的主成分分析能够将个体轻松分为与其地理采样位置相对应的群体(即湿地镶嵌格局),而系统基因组分析也揭示了与湿地镶嵌地理格局相符的单系群。个体全基因组杂合度(H)的估计值与受威胁或濒危龟类相似。总体而言,我们的数据表明,由于出生地忠诚性和有限的基因流,西部鸡龟种群在空间上存在差异。我们讨论了这些见解对于龟类生物学的相关性,包括这种忠诚性对一个受关注物种的保护意义。
引言
根据国际自然保护联盟(IUCN)2024年2月8日的红色名录评估,共有157,190个物种,其中超过22,000种(14%)被归类为数据不足,意味着没有足够的信息来做出名录决定(IUCN, 2024)。超过50%的数据不足物种面临灭绝的风险,与已评估物种相比,数据不足物种的灭绝风险可能更高(Borgelt等人,2022;Jetz和Freckleton,2015)。准确识别处于风险中的种群非常重要,因为被认为数量正在下降的物种可能会得到预防性保护,但不应不必要地消耗有限的保护资源。随着过去几十年测序成本的降低,全群体基因组调查可以提供关于难以捉摸物种的进化历史和适应潜力的详细见解(Russello等人,2015)。
遗传/基因组多样性(GD)是保护工作中需要考虑的生物多样性方面之一。长期以来,人们已经认识到这种多样性在种群和物种持续存在中的作用,大量文献证明了GD与适应性之间的正相关关系(Laikre 2010;Laikre等人,2020;Hoban等人,2020, 2021;DeWoody等人,2021)。近亲繁殖导致GD丧失,从而降低生存能力和繁殖成功率(Harrisson等人,2019;Liberg等人,2005),这证明了这种关系。这种适应性与GD之间的关系在许多受关注的物种或种群中都有体现,例如莫哈韦沙漠龟(Scott等人,2020)。在那里,迁移存活的个体比死亡的个体具有更高的个体杂合度,表明GD的丧失直接导致适应性下降,进而导致种群数量减少甚至灭绝。原则上,GD应随有效种群规模增加而增加,因此种群结构和基因流应该是决定种群水平多样性的关键因素。栖息地和生命史特征(如移动性、性别偏向性扩散和性别决定)可以通过多种方式影响种群结构,这对有效的保护工作至关重要(Avise 2000;Greenwood 1980;Janzen 1994;Pascual等人,2017)。例如,移动性低的物种在异质景观中可能面临更高的灭绝风险(Matlack和Monde 2004)。此外,了解种群结构对于许多保护干预措施(如辅助基因流和保护单位的创建)至关重要(Funk等人,2012)。群体基因组数据集是识别遗传上分化群体的强大工具。在山麓黄腿蛙(Rana boylii)的研究中,RADseq基因型数据揭示了五个蛙类支系之间以前未被发现的差异,作者认为这些支系应作为独立的恢复单位进行管理(McCartney-Melstad等人,2018)。同样,鼠尾草松鸡的全基因组重测序发现了一个遗传上孤立的种群(Oh等人,2019)。
在这里,我们报告了将基因组学应用于一种难以捉摸的淡水龟类(USFWS n.d.)的保护问题。鸡龟属于Emydidae科的半水生龟类,栖息在具有不同持久性的浅水湿地中(Bowers等人,2023;Buhlmann 1995;Buhlmann等人,2008)。在美国东南部发现了三个假定的亚种:东部鸡龟(Deirochelys reticularia reticularia)、西部鸡龟(D. r. miaria)和佛罗里达鸡龟(D. r. chrysea)(Schwartz 1956)。西部亚种的分布范围从密西西比河向西延伸到阿肯色州、俄克拉荷马州、路易斯安那州、密苏里州和德克萨斯州东部(Schwartz 1956)。由于栖息地的动态变化以及检测和捕获率低,西部鸡龟难以研究(Bowers等人,2023;Bowers 2024),并且它们每年有一段时间处于夏眠状态(Ernst和Lovich 2009;Bowers等人,2022b)。因此,数据不足成为评估其当前保护状况的障碍(USFWS n.d.)。尽管它们的许多生物学特性尚未得到充分描述,但已知西部鸡龟在形态和生命史上与其他亚种有所不同。它们的黄色腹甲上有独特的深色线条(Buhlmann等人,2008),并且它们是杂食性的,而其他亚种是肉食性的(McKnight等人,2015a, b)。此外,西部亚种有一个独特的春夏繁殖季节,而其他亚种通常在秋季或冬季繁殖,存在一些地区差异(Bowers等人,2022a;McKnight等人,2015a, b)。基于少量分子标记的系统发育分析表明,西部亚种与其他两个亚种有显著的分化(Hilzinger 2009;Walker和Avise 1998)。
西部亚种不仅因其独特的特征而受到关注,还因其保护状况而备受关注。据认为,西部鸡龟的数量正在下降,部分原因是栖息地的丧失和破碎化(Bowers等人,2021;Buhlmann等人,2008)。在德克萨斯州,休斯顿大都会区既有大量历史上记录有鸡龟存在的地点,也有该州最高质量的栖息地(Ryberg等人,2017)。然而,城市周围的湿地丧失趋势继续减少栖息地的可用性和连通性(Brody等人,2008)。栖息地破碎化分析显示,德克萨斯州休斯顿大都会区的鸡龟栖息地丧失率最高(Ryberg等人,2017)。此外,它们栖息的短暂水体不太可能受到《清洁水法》(CWA)的保护,该法律仅保护与传统可通航水域相连的湿地(EPA 2015)。在密苏里州之外,该亚种没有正式的保护措施,该州将其列为濒危物种。美国鱼类和野生动物服务局进行了为期90天的调查,认为西部亚种可能值得被列为受威胁或濒危物种,其官方名录状态目前正在审查中(USFWS 2011)。
西部鸡龟的活动范围估计在两个季节内超过4.5平方公里(Bowers等人,2021),但如果成年个体返回出生地繁殖,个体行为可能不会反映种群层面的连通性。种群结构和分化受到许多因素的影响,包括有效种群规模(Ne)、扩散、连通性、人口统计学和世代时间(鸡龟为5-8年;Buhlmann等人,2009)。实证群体基因组研究可以有效地量化许多此类因素。我们的研究在德克萨斯州大部分地区采集了野生个体样本,为D. r. miaria生成了一个新的参考基因组,并对个体基因组进行了重测序,以量化采样地点之间的基因组差异。基于群体遗传学理论,我们预测:(1)在景观层面,种群结构将不存在(即,我们预计在随机混合和随机扩散模型下基因库是均匀的);(2)如Eckert等人(2008)的中心-边缘假说所预测的,边缘采样点的基因组多样性会降低;(3)如果外部景观特征(如流域)影响基因库的连通性,我们预计会检测到与这些特征相对应的走廊、过滤器或屏障。最终,我们这项研究的动机是为龟类保护工作者和管理者提供关于德克萨斯州西部鸡龟的重要生物学见解。
材料与方法
我们的团队通过结合路杀和陷阱捕捉,在德克萨斯州东南部的八个地理地点(由相关湿地指定)共收集了91个样本(图1)。我们使用无诱饵的fyke网陷阱捕捉龟类(Vogt,1980);完整的捕捉方法详见Bowers等人(2022b)。我们从每只龟类中收集血液或其他组织样本,确保遵循了仔细的处理程序。
图1
该图像的替代文本可能是使用AI生成的。
采样分布图和空间中杂合度的可视化。德克萨斯州地图显示了研究中包含的样本分布,图例表示每个地点的样本数量。插值使用经验贝叶斯克里金法可视化个体全基因组杂合度估计值。Alazan Bayou、Buller、Gordy和Warren采样点位于德克萨斯州的Nacogdoches、Waller、Chambers和Harris县。所有其他地点名称反映了样本所在的县。属性信息:Texas Parks & Wildlife、CONANP、ESRI、TomTom、Garmin、FAO、NOAA、USGS、NPS、USFWS ? OpenStreetMap贡献者和GIS用户社区
参考基因组组装
我们从在美国德克萨斯州Gordy Marsh附近收集的一只西部鸡龟(Purdue目录编号#F1180)中提取了DNA,使用Qiagen MagAttract HMW DNA试剂盒。文库构建和测序在伊利诺伊大学厄巴纳-香槟分校的Roy J. Carver生物技术中心进行。基因组DNA使用Megaruptor 3(Diagenode)切割成平均长度为13 kb的片段。PacBio文库使用SMRTbell Express Template Prep kit版本2.0(Pacific Biosciences,CA)构建。文库使用Qubit进行定量,然后在Femto Pulse(Agilent,CA)上运行以确认预期大小的DNA片段存在。文库在PacBio Sequel IIe上的三个SMRT细胞上进行了8 M的测序,电影时间为30小时。圆形共识分析在仪器中实时进行,使用SMRT Link V11.1和默认参数,包括至少3次最小遍历和99%的最小准确率。为了剔除潜在的低质量序列,我们使用fastp(v. 0.23.2;Chen等人,2018)从FASTQ文件中移除了<5 kb或>50 kb的基因组读段。我们随后使用Hifiasm(版本0.19.9;Cheng等人,2021年)将这些读段组装起来,并仅使用主要组装结果进行后续步骤。我们利用Jellyfish(版本2.3.0;Mar?ais和Kingsford,2011年)生成的直方图作为输入,在GenomeScope2.0(Ranallo-Benavidez等人,2020年)中检查单倍型,使用Purge dups(版本1.2.6;Guan等人,2020年)移除了替代单倍型,并使用blobtoolkit2(Challis等人,2020年)识别和移除了污染物。基因组指标,包括N50和L50,是通过QUAST(版本5.2.0;Gurevich等人,2013年)进行评估的。我们使用BUSCO(版本5.4.7;Seppey等人,2019年)评估了直系同源基因的内容和完整性。
### 全基因组重测序和样本映射
我们使用Qiagen DNeasy Blood & Tissue试剂盒提取了DNA。91个鸟枪法基因组文库的构建和在NovaSeq X Plus上的测序是在伊利诺伊大学厄巴纳-香槟分校(UIUC)的Roy J. Carver生物技术中心完成的。这些鸟枪法基因组DNA文库是用Illumina DNA Prep试剂盒(Illumina,加利福尼亚州)从50ng的DNA中构建的,并使用了独特双重索引的接头以防止索引切换。单独条形编码的文库使用Qubit(Thermo Fisher,加利福尼亚州)在Fragment Analyzer(Agilent,加利福尼亚州)上进行定量,以确认没有游离引物和引物二聚体,并确认DNA处于预期的大小范围内。文库以等摩尔浓度混合,然后使用BioRad CFX Connect实时系统(BioRad Laboratories,Inc.,加利福尼亚州)通过qPCR进一步定量。条形编码的文库被加载到NovaSeq X Plus的三个10B通道上用于簇形成和测序。文库从片段的两端进行测序,每端总共测序150 bp。fastq读段文件是用bcl2fastq v2.20转换软件(Illumina,圣地亚哥,加利福尼亚州)生成的,并进行了解复用。解复用的fastq文件的质量是通过FastQC软件(版本0.12.1;Andrews,2010年)评估的,该软件生成了包含质量分数、碱基组成、k-mer、GC和N含量、序列重复水平以及过度表达序列的报告。
我们使用bwa-mem算法(版本0.7.17;Li,2013年)将短读段映射到我们的新参考基因组组装上,并使用Genmap(版本1.3.0;Pockrandt等人,2020年)确定读段对齐的模糊区域,这些区域被排除在下游分析之外。我们使用RepeatMasker(版本4.1.2;Smit等人,2015年)识别重复基因组元件。映射后,我们使用GATK(版本3.8;McKenna等人,2010年)重新映射插入缺失位点。未映射的、次要的、质量控制失败的、重复的、补充的和配对不当的对齐使用SAMtools(版本1.17;Li等人,2009年)被移除。映射和质量过滤后,bam文件被用于后续分析。为了评估不同采样点的覆盖范围和深度是否有所不同,我们对所有有超过1个个体的站点进行了Kruskal-Wallis秩和测试。
### 基因组多样性
我们使用ANGSD(版本0.940;Korneliussen等人,2014年)中的基因型似然值估计了个体的全基因组杂合度,通过将折叠的站点频率谱中的杂合站点比例计算得出,即杂合站点的数量除以基因组中分析的站点总数。为了测试不同采样点之间的杂合度是否存在显著差异,我们对所有有超过1个个体的站点进行了成对Wilcoxon秩和测试。得到的p值使用假发现率(FDR)方法进行了多重检验调整。我们还使用单变量线性回归测试了个体杂合度是否随测序深度变化。为了测试中心-边缘假说,我们计算了每个样本与亚种范围大致中心的地理距离(基于USFWS的范围),并使用线性回归将个体全基因组杂合度作为这个距离的函数进行了建模。为了提供更广泛的背景信息,我们还将西部鸡龟的平均全基因组杂合度与其他龟类的公开可用杂合度数据进行了比较(表S1)。为了可视化基因组多样性在时间和空间上的分布,这可能对基因组监测有用(Black等人,2024b),我们使用ArcGIS? Pro(版本3.1)通过经验贝叶斯克里金法(Krivoruchko,2012年)插值了空间杂合度。
### 种群结构
我们使用ANGSD中的种群等位基因频率作为输入,使用NGsRelate(版本2;Korneliussen和Moltke,2015年)估计个体之间的成对相关性,以检查可能影响种群结构分析的近亲。我们通过估计基因组分化(全基因组FST)和核苷酸分歧(DXY)来量化种群结构。成对FST测量了采样地点之间的基因组变异频率相对于总基因组变异的比例,而DXY(即分歧)表示每对站点之间样本的平均核苷酸差异数量。我们使用从ANGSD(版本0.940;Korneliussen等人,2014年)获得的等位基因频率估计了成对加权全基因组FST和每个站点的核苷酸分歧(DXY)。基因组中的变异站点被过滤掉那些p值高于1×10^-6的站点,并使用ngsTools(Fumagalli等人,2014年)的maf文件计算DXY。为了测试距离隔离(IBD),我们首先计算了采样站点之间的成对地理距离(以公里为单位),并使用Mantel测试(Mantel,1967年)评估了地理距离和遗传距离(FST)之间的关系,该测试在R包vegan(版本2.8;Oksanen等人,2025年)中实现了9,999次排列。为了在考虑遗传距离非独立性的同时以更精细的分辨率检查IBD,我们采用了最大似然种群效应(MLPE)混合效应模型(Clarke等人,2002年;Van Strien等人,2012年)。标准化地理距离作为固定效应包含在模型中,每个成对比较中的个体包括随机截距。模型显著性使用似然比测试来评估,比较包含和不包含地理距离作为预测因子的模型。我们使用线性回归来可视化地理距离与每种方法之间的关联。
我们使用ANGSD获得基因型似然值,并将这些作为输入用于PCAngsd(版本1.10;Meisner和Albrechtsen,2018年)以获得协方差矩阵,然后进行了主成分分析(PCA)。为了与无模型PCA进行对比,我们使用NGsAdmix(版本v32;Skotte等人,2013年)基于Hardy-Weinberg平衡模型生成了混合图,每个K值进行了20次重复实验。为了帮助识别CU,我们使用了Evanno方法(Evanno等人,2005年)计算ΔK并评估最可能的簇数量。然而,鉴于这种方法无法检测K=1,并且在复杂的进化情景中可能偏向于K=2(Janes等人,2017年),我们还使用evalAdmix(Garca-Erill和Albrechtsen,2020年)计算了残差的相关性来评估模型拟合度。我们通过分配测试来评估我们的种群结构推断的稳健性,使用之前计算的基因型似然值进行了留一法交叉验证的种群分配(DeSaix等人,2024年)。为了明确表征湿地镶嵌站点之间的有效迁移,我们使用FEEMS(Marcus等人,2021年)推断基因流模式。该方法使用遗传距离和地理位置来检测地点之间的隔离距离模式的异质性;即使在稀疏采样情况下也能有效检测(Marcus等人,2021年)。首先,我们为所有采样个体生成了plink格式的文件。这是通过使用之前的参数运行ANGSD并添加了保守的基因型调用选项(-doPlink 2、-doGeno -4、-doPost 1、-doCounts 1、-postCutoff 0.99、-geno_minDepth 5)来实现的。然后使用FEEMS处理这些plink格式的文件以及其他输入文件。在ArcGIS Pro中准备了栖息地范围边界和三角网格文件,网格大小被确定为将相隔超过3公里的采样站点分配到不同的网格单元中。FEEMS分析遵循开发者提供的工作流程,包括交叉验证以估计λ参数。测试了20个λ值,这些λ值在对数尺度上均匀分布,从1e-6到1e2,并且迭代次数与图文件中观察到的节点数量相匹配。选择使交叉验证误差最小化的λ值用于可视化空间基因流(在图S1 A中用黄色垂直线表示)。
为了进一步划分湿地镶嵌景观中的种群基因组不连续性,我们在核基因座和线粒体基因座进行了最大似然系统发育推断。对于核树构建,我们使用ANGSD获得VCF文件,然后在IQTREE2(版本2.2.2.9;Minh等人,2020年)中构建了1000次自助法的最大似然树。为了从每个个体获得共识的整个线粒体序列,我们首先使用CoalQC(版本0.1;Patil等人,2020年)将修剪后的鸡龟读段映射到Chrysemys picta bellii参考线粒体基因组(CM074729.1)上。然后我们使用SAMtools将sam文件转换为映射的bam文件,然后使用bam2fq命令将映射的bam文件转换为可操作的FASTQ文件。使用这个文件,我们使用MitoBim(版本1.8;Hahn等人,2013年)组装了每个个体的线粒体基因组,最大迭代次数为10次。我们使用MUSCLE(版本3.8.31;Edgar,2004年)对样本进行了对齐。我们使用IQTREE生成了这些线粒体读段的最大似然系统发育树。我们进一步使用我们的Muscle对齐结果使用DNAsp(版本6;Rozas等人,2017年)生成了单倍型多样性统计。我们还使用线粒体基因组序列计算了Watterson的Theta,方法是将分离位点的数量除以每个地理采样位置的序列数与分析的核苷酸位点数量的比率。最后,我们使用ArcGIS Pro? 2.5.0(Esri,2020)可视化了空间中的单倍型分布。
### 结果
我们的西部鸡龟参考基因组从头组装覆盖了2.19Gb,分布在n=183个contig中。组装的N50(即最短contig的长度占整个基因组长度的50%)是85 Mb,L50(即长度总和占基因组大小50%的最小contig数量)是9个(图S2)。整个基因组的GC含量为44%,平均读段深度为49.5(即平均每个核苷酸被测序了49次)。我们识别出了94.6%的完整基准通用单拷贝直系同源基因(BUSCOs),表明这个新的西部鸡龟基因组组装中包含了绝大多数高度保守的脊椎动物基因。
在91个“重测序”的样本中,有89个正确映射到参考基因组组装上,平均测序深度覆盖率为4.84X。作为质量控制的一部分,由于不可接受的质量分数和/或GC含量(可能是由于污染或样本识别错误),我们丢弃了两个个体(F1149和F1151)的数据。因此,后续分析参考的样本数量为n=89。
个体的平均全基因组杂合度为0.0009±1e-5(平均值±标准误差),个体杂合度(H)在不同地理采样点之间有所差异(图2),其中Wharton的杂合度显著低于所有其他站点(表S2)。这种湿地镶嵌站点之间的杂合度变化不能归因于技术因素,因为站点之间的测序深度或范围没有显著差异(表S3),我们的分析表明地理湿地镶嵌中的H变化是由于生物学因素,如出生地忠诚度(见下文)。然而,杂合度随测序深度的增加而略有增加,深度解释了观察到的杂合度变化的15.4%(p=0.00014,R2=0.154)。因此,我们主要将我们的推断限制在采样点之间的比较上(其中测序深度没有显著差异),而不是跨物种或研究的比较(但见图S3)。Wharton和Brazos站点的杂合度最低(H=0.0007±8e-6和0.00065(单个样本))。我们对个体H的空间插值显示了从东到西H逐渐减少的模式(图1),这与我们的东部样本来自亚种范围中心附近,而西部样本位于地理范围边缘的想法一致(即中心-边缘假说——Eckert等人,2008)。为了更明确地测试这一点,我们将杂合度作为距离亚种范围中心的函数进行了建模。我们发现杂合度随着与范围中心的距离增加而显著减少(R2=0.36,β=-8.25×10^-7,p<0.001;图)。S4)支持这一假设,并表明西部鸡龟在其分布范围的边缘地区遗传多样性降低。为了提供系统背景,我们将西部鸡龟的平均H值与其他有重测序数据的龟类物种的平均H值进行了对比(图S3)。我们注意到,图S3中展示的大多数龟类都被IUCN正式列为濒危或受威胁物种。唯一有数据的IUCN无危物种——东部麝香龟,其平均H值大约是我们研究物种的两倍。图2的替代文本可能是使用AI生成的。全尺寸图像显示了每个采样点的基因组杂合度箱线图。对于样本数量少于或等于2的地点,每个个体都被作为一个点绘制出来。种群结构分析显示,亲缘关系图并未揭示任何可能影响混合结果的意外模式(图S5)。为了确认这一点,我们进行了去除一级和二级亲属的PCA分析,结果与所有个体的PCA分析相似(图S6)。所有个体都被纳入后续分析中,以保持样本量并避免因无差别地剔除亲属而产生的偏差(Waples和Anderson 2017)。我们估计了每个有超过2个个体数据的采样点之间的平均全基因组FST(即分化程度)(因此排除了Brazoria、Liberty和Brazos)。所得到的成对FST值很小,范围在0.01到0.03之间(表1)。Wharton与Buller之间的差异最大,而Gordy与Wharton之间的差异最小(表1)。对相同地点对进行了全局DXY(分歧)估计,结果显示核苷酸分歧值较低,不同地点对之间的DXY值变化很小(表1)。我们使用(a)Mantel检验来测试地理距离和地点间遗传分化(FST)之间的IBD关系,以及(b)MLPE模型来测试数据集中每对个体的地理距离和DXY之间的关系。Mantel检验未发现显著相关性(r = ?0.43,p = 0.80;图S6A),但MLPE模型表明地理距离是成对遗传距离的显著预测因子(β = 7.33,SE = 0.08,t = 90.09,p < 2 × 10^-16;LRT: χ2 = 4319.2,df = 1,p < 2 × 10^-16;图S6B)。然而,地理距离仅解释了遗传分化的一小部分方差(边际R2 = 0.017),而个体身份解释了97.8%的方差。表1显示了分析中样本数量超过2个的每个采样点之间的FST(上方***)和DXY(下方***)值。对每个西部鸡龟基因组在5,930,080个变异位点进行的PCA分析显示,个体根据其地理采样位置形成了离散的聚类(图3)。第一个主成分轴解释了大部分总体变异(42.9%;图3)。基于Hardy-Weinberg平衡模型的混合图仅支持两个遗传上不同的群体(表S2;参见图S8中的混合图)。然而,在evalAdmix中获得的残差成对相关性显示,当K值在4到6之间时,数据拟合得更好(图S9)。在基因组水平上,来自Buller和Warren站点的个体在PCA中看起来相似。此外,留一法验证的种群分配测试正确地将83/89(93%)的样本分配到了它们的地理采样位置(表S5)。在六个被错误分配的个体中,有四个来自样本量较小的站点(Brazoria、Brazos和Liberty)。一个来自Buller的个体被错误地分配到了Warren(一个地理位置相近的站点),另一个来自Gordy的个体被错误地分配到了Warren。该个体的覆盖范围广度和深度大致等于所有样本的中位数,表明这种错误分配不是由于技术因素造成的。有趣的是,这个个体(F1252)在我们的核树和PCA中也与Warren分组,表明它可能是一个扩散者。在核系统发育树中,个体主要形成了与其地理湿地镶嵌体相对应的支系,这支持了PCA中看到的结构(图4)。来自Buller和Warren的样本在核树中聚集在一起,而来自Gordy的一个样本在系统发育上更类似于来自Warren的样本。同样,线粒体树拓扑结构也表明,来自同一地理站点的个体倾向于在系统发育组中聚集(图4)。来自Buller和Warren站点的个体在线粒体树中再次聚集,这与PCA和核树的结果一致。图3的替代文本可能是使用AI生成的。全尺寸图像。主成分分析(PCA)中,个体按采样地点进行颜色编码。图4的替代文本可能是使用AI生成的。全尺寸图像。中部根部的核树(左)和线粒体树(右)。个体按采样地点进行颜色编码,分支长度代表每个地点的替换情况。在地理采样点中,Brazoria和Wharton的线粒体单倍型多样性最高(表2)。线粒体单倍型主要在其地理采样点独特,少数单倍型在Wharton、Brazoria和Gordy站点之间共享,其他单倍型在Buller、Warren和Gordy采样点之间共享(图5)。Alazan Bayou和Gordy的线粒体基因组核苷酸多样性最高(表2)。表2显示了所有包含n > 1个个体的群体的单倍型多样性统计(未校正样本量变化)。来自Brazoria、Buller和Warren采样点的个体具有最低的单倍型和核苷酸多样性。表5的替代文本可能是使用AI生成的。全尺寸图像。7个地理采样点的线粒体单倍型组成。我们的数据集总共包含25个单倍型。许多站点包含独特的(私有的)单倍型,只有少量在站点之间共享,这与核数据一致。讨论基因组调查可以提供关于种群动态的深入见解,揭示分化、结构和基因流的模式,这些对于评估ESUs/CUs至关重要,并且经常揭示新的生物学发现。例如,Black等人(2024a)研究了White Sands沙鱼的两个潜在ESUs,发现它们之间存在显著的分化,表明它们可能是不同的物种。同样,对sage-grouse(Centrocercus urophasianus)的全基因组重测序揭示了其分布范围内一个未知的遗传隔离种群(Oh等人2019)。我们对西部鸡龟的基因组调查显示,其全基因组杂合度相对较低,种群结构不明显,并且某些采样点存在私有的线粒体单倍型。我们认为这些发现最合理的解释是地点忠诚性和出生地忠诚性,即个体留在或返回其起源地理地点进行繁殖。这些倾向在许多龟类物种中都有发现,包括Emydidae科的其他成员(Freedberg等人2005;Sheridan等人2010;Reid等人2016;Rowe等人2005),但我们的研究是首次使用全基因组序列支持出生地忠诚性的研究之一。参考基因组组装我们的新型西部鸡龟基因组组装基于N50和L50等指标以及BUSCO分数,具有很高的连续性。我们使用长读长测序为Emydidae科的物种基因组组装提供了高质量的补充,该科包含近一百个已描述的物种,但只有大约十几个相关的基因组组装。我们的西部鸡龟基因组作为我们重测序工作的基础,应有助于未来爬行动物的比较进化研究。作为基因组多样性的关键指标,我们确定了每个个体的全基因组杂合度(H)。通过H测量的基因组多样性与适应性密切相关,并且可以在与保护相关的时间尺度上发生变化(Brüniche-Olsen等人2021;Jeon等人2024)。我们的结果表明,与其他龟类的重测序研究相比,西部鸡龟的基因组多样性相对较低(图S3)。个体H值在采样点之间的分布显示了意外趋势,包括地理位置相近的站点之间的H值差异。值得注意的是,Wharton的样本和Brazos的单一样本具有最低的H水平,表明这些地点的基因组多样性降低。在这里,H不仅显示了多样性的降低,还显示了小地理距离内的种群连通性缺乏。例如,图2显示Wharton样本的H值明显低于仅距Wharton 80公里的Buller站点。我们知道Wharton和Buller站点之间几乎不存在持续的基因流,因为H值可以在一代内迅速变化。例如,一个在基因组每个位点都是杂合的个体(即H = 1)与一个在基因组上都是纯合的个体(即H = 0)交配,原则上应该会产生H = 0.5的中间后代。因此,Wharton和Buller站点之间的基因流会根据有效迁移的程度(即每代的繁殖移民数量)非常迅速地使H值均匀化。为了评估种群连通性,我们检查了采样点之间的基因组分化和分化模式。成对FST值范围从0.017到0.030,表明分化程度较低(表1),但尽管站点之间的地理距离相对较小,多次分析仍显示了种群基因组结构。主成分分析显示了强烈的基因组结构,PC1解释了大约50%的变异(图3)。湿地镶嵌体内的个体聚集在一起,表明站点内的变异性低于站点间的变异性,这展示了全基因组测序数据的极高分辨率。这种基因组结构中存在一个微妙的地理模式,PC1显示了东西方向的分化,这与我们在景观上对H的插值结果一致(图1B)。回想一下,站点间的H变化(图2)支持PCA图中的结构,表明站点间的明显分化是由于生物学信号(即出生地忠诚性)而不是技术伪影造成的。尽管休斯顿大都市区存在主要流域和道路等潜在障碍,我们的FEEMs分析并未发现任何明显的基因流走廊、过滤器或障碍(图S1B)。这表明观察到的结构是由距离隔离或内在生物学因素驱动的,而不是外在环境障碍。我们的MLPE模型显示了IBD的弱证据,但地理距离仅解释了遗传方差的一小部分(1.7%)。综合来看,FEEMS分析和MLPE模型表明,虽然距离隔离在塑造景观中的基因组变异方面起作用,但内在因素如出生地忠诚性可能是种群结构的重要贡献者。这些种群结构模式也得到了线粒体数据的支持。线粒体基因组显示出系统发育结构(图4),许多线粒体单倍型是特定采样点的私有单倍型(图5)。我们在站点之间观察到的有限单倍型共享可能表明历史上存在一些女性基因流(即像鲑鱼那样的偏离行为,即出生地忠诚性并不总是100%)。核系统发育学也显示了类似的模式(图4),大多数支系由来自相同采样点的个体组成。核树和线粒体树之间的轻微不一致是一个有趣但并不意外的模式。这种不一致可能是由于多种因素造成的,包括繁殖者从其出生地的偏离、线粒体和核基因组之间的不同替代率、每种基因组的不同遗传模式(分别是母系和双亲遗传)以及基因在空间中的分布方式(例如,由于性别偏见导致的扩散)。尽管树拓扑结构存在轻微差异,但核和线粒体位点都与有限的基因流和出生地忠诚性一致。与我们数据集相关的一个潜在注意事项是,与大多数自然种群研究一样,我们的样本在空间和时间上是非随机收集的。我们明显非系统的采样可能会导致种群基因组结构的信号,这些信号不一定是由景观上的基因组不连续性引起的,而是由于我们的采样方案中的地理不连续性造成的。全基因组重测序数据提供了对基因库的极高分辨率,更连续的采样可能会导致明显的种群基因组结构消失。换句话说,如果我们填补地理上的空白,我们也可能会填补种群基因组的空白。然而,我们认为鉴于地理位置相近的湿地斑块之间存在约10公里的距离(图2),这种情况通常不太可能发生。我们注意到,Wharton采样点的平均H值最低,位于我们采样分布的边缘,与未采样种群的相互作用可能会影响其基因组多样性。尽管如此,其他龟类也表现出出生地忠诚性(natal philopatry),这种特性在一定程度上塑造了它们的遗传或基因组结构(Hamabata等人,2020年;Bowen和Karl,2007年;Freedberg等人,2005年)。
生物学见解:西部鸡龟非常难以研究,而我们在相对较小的地理区域内发现的显著基因组变异为这一物种的出生地忠诚性提供了首个证据。例如,Buller和Warren相距仅约10公里,且两者之间似乎都有适宜的栖息地,但我们的核基因组系统发育分析(图4)和线粒体单倍型分析(图5)都表明它们之间存在差异。此外,在我们的分配测试中,只有一个个体在这两个采样点之间被错误分配(表S5)。这两个地点地理位置相近,且没有明显的环境障碍,但通过DNA序列仍能区分开来,这表明西部鸡龟的基因组结构是由内在因素而非外在因素驱动的。
这些龟类的整体基因库显示出与以下情况一致的地理结构:(a)有限的历史基因流动,偶尔会有偏离;(b)中心-边缘假说(Central-Marginal Hypothesis)。基因流动受限的一个解释是它们对出生地湿地斑块的忠诚性,以及少量的偏离行为,这种行为在其他脊椎动物中也有所体现。例如,淡水物种中也记录了这种忠诚行为(Freedberg等人,2005年;Sheridan等人,2010年;Reid等人,2016年;Rowe等人,2005年)。鲑鱼会返回出生地的溪流,尽管偶尔会有偏离(Keefer和Caudill,2014年),而咸水鳄鱼尽管具有长距离移动的能力,但也表现出对出生地的忠诚性和有限的扩散范围(Lloyd-Jones等人,2023年)。在龟类中,海龟的出生地忠诚性最为明显,它们能够高度精确地返回整个海洋盆地的出生地(Bowen和Karl,2007年;Bowen等人,1992年;Bowen等人,1993年;Dutton等人,1999年)。我们的基因组数据无法区分这种忠诚性是由于扩散受限还是出生地归巢行为,但夏眠以及它们所依赖的淡水栖息地的不可预测性可能是阻碍移动的两个因素,从而导致我们数据集中的模式。
保护意义:作为Deirochelys属中唯一现存物种的亚种,西部鸡龟代表了一个独特的进化谱系,可能需要得到保护关注。我们报告该亚种的基因组多样性水平较低,这可能导致其适应环境变化的能力减弱。此外,基因组多样性在整个分布范围内的模式似乎遵循中心-边缘假说,即全基因组杂合度通常从东向西递减。考虑到基因组采样有限(即H值估计较低)和地理采样局限性(即亚种范围内的样本收集不全面),我们的数据表明,物种分布中心区域的栖息地破坏可能导致基因组多样性的不成比例损失。一些生活史特征可能会加剧这一担忧。如果西部鸡龟具有出生地忠诚性,那么当地种群在面临环境干扰时可能非常缓慢地(如果有的话)迁移到新的繁殖湿地。鉴于对鸡龟栖息地的保护不足,应仔细考虑这种忠诚性的影响。此外,鸡龟表现出温度依赖的性别决定机制(TSD;Ernst和Lovich,2009年;Ewert等人,2004年),这意味着繁殖能力和性别比例高度依赖于当前的微气候。例如,在TSD物种中,强烈的出生地忠诚性可能会阻碍对气候变化的适应反应,增加性别比例失衡的可能性(Janzen,1994年;Morjan,2003年)。
这里使用的基因组调查技术提供了高分辨率的见解,并具有实际的保护应用价值。我们的种群分配测试表明,基因组重测序可以高精度地将来源不明的西部鸡龟(如被车辆撞击的个体)分配到最可能的来源种群(DeSaix等人,2024年)。此外,西部鸡龟是基因组监测工作的理想候选对象。未来收集更多越来越可行的种群基因组数据将使保护工作者能够追踪基因组多样性的变化,并利用主题制图(Black等人,2024b)来识别需要关注的地理区域。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号