《Ecology and Evolution》:Using Serially Collected Specimens to Investigate the Potential Population Genetic Consequences of Reported Declines in Eastern Woodland Salamanders
编辑推荐:
本研究通过靶向捕获测序技术,利用福尔马林固定标本(1960s–1970s)、历史冷冻血液(1980s–1990s)及现代样本,首次从基因组层面揭示了阿巴拉契亚山脉两个地点(有衰退记录的Indian Grave Gap和无衰退记录的Skull's Gap)六种林地蝾螈(Plethodon)近50年的遗传多样性变迁。研究量化了生物信息学选择对遗传多样性估计的影响,发现不同数据集和过滤方案下遗传多样性变化模式一致。结果支持Skull's Gap种群稳定或扩张,而Indian Grave Gap种群则呈现收缩或混合信号的物种特异性响应。免疫基因座分析表明除一种外,其余物种均存在平衡选择维持的跨时间共享多态性,为理解种群衰退的基因组效应提供了重要见解。
背景
生物多样性正以前所未有的速度经历全球变化。了解种群在过去一个世纪如何应对加速变化,是制定有效保护政策的关键。自然历史收藏馆中连续收集的标本为了解种群随时间变化提供了窗口,并揭示了剩余种群的脆弱性。野外调查显示的种群丰度变化表明,自20世纪60年代以来,部分林地蝾螈(Plethodon)种群经历了衰退,但这些衰退的潜在种群遗传后果尚未得到研究。得益于数十年来持续的基于收藏的努力,Plethodon蝾螈成为测试历史DNA在近期时间尺度上识别遗传多样性变化效用的模型。
方法
2.1 研究地点背景
本研究聚焦于Richard Highton历史调查过的两个地点:Skull's Gap和Indian Grave Gap。Skull's Gap位于阿巴拉契亚山脉中部,历史调查数据显示该地点的蝾螈没有衰退证据。Indian Grave Gap位于阿巴拉契亚山脉南部,近期的调查以及Highton在1970年至1995年间进行的17次调查均显示该地点存在种群衰退证据。
2.2 样本选择
研究使用了三个时间点的组织样本:福尔马林固定的凭证标本肝脏(历史肝脏,1969–1978年)、历史冷冻血液(1984–1993年)和现代冷冻肝脏(2018–2019年)。从史密森尼学会国家自然历史博物馆(USNM)的福尔马林固定凭证标本中采集了肝脏组织。第二个时间点使用了Highton收集的冷冻血液样本。现代组织样本于2018年和2019年在Skull's Gap和Indian Grave Gap两地采集。
2.3 DNA提取
福尔马林固定肝脏组织的DNA提取遵循O'Connell等人(2022)的改良盐析方案。现代肝脏组织和血液毛细血管样本的DNA提取遵循标准盐析方案。
2.4 靶向捕获探针设计
靶标序列包括全基因组外显子(来自转录本)、系统发育信息核基因座、超保守元件(UCE)、视觉相关基因、听觉相关基因和免疫相关基因。最终探针组包含16,226个探针,靶向2572个标记。
2.5 基因组文库制备
历史肝脏文库由Arbor Biosciences制备。历史血液样本和现代肝脏样本的基因组文库在史密森尼国家动物园保护生物学研究所和NMNH制备。使用Illumina Novaseq S4 lane的8%进行双端150 bp测序。
2.6 基因组数据处理
使用Python流程SECAPR v.1.1.15处理序列数据。使用FastQ Screen筛查污染。使用八个P. yonahlossee冷冻肝脏样本的组装重叠群创建了一个伪参考。使用mapDamage2校正福尔马林诱导的脱氨基作用。使用BCFtools调用单核苷酸多态性(SNP)。最终生成六个数据集进行比较分析。
2.7 跨遗传标记类型的遗传多样性和历史人口统计学估计
跨所有数据集,通过估计核苷酸多样性(pi)、Watterson's theta和Tajima's D等种群遗传统计量来研究种群和时间点之间的遗传多样性变化。使用置换检验来解释跨时间点的不均匀样本量。计算免疫基因座、系统发育基因座和UCE的核苷酸多样性。计算所有免疫相关SNP的等位基因频率。
结果
3.1 各基因座类型的捕获统计
在“all reads”数据集中,成功回收了9/9个核“系统发育”基因座,平均深度为141×覆盖度,但其他基因座类型的成功率较低。保留了2229/2572个目标随机外显子,平均覆盖度为70.9×。
3.2 按过滤方案划分的数据集完整性
“all reads all sites”数据集拥有最多基因座(2229个),平均读长为57×。当过滤到仅编码位点时,回收了几乎所有的基因座(2222个),读长增加到61.1×。非编码位点仅保留了1295个基因座,平均深度为31.3×。
3.3 按样本类型划分的捕获统计
历史肝脏样本的平均污染水平为18.4%。降采样后,历史肝脏样本的平均覆盖度增加到26.2×。主成分分析表明样本按物种/种群而非样本类型聚类。
3.4 各数据集的遗传多样性估计
比较六个数据集的核苷酸多样性估计值发现,降采样数据的pi估计值更高,且变化方向对大多数物种一致。编码位点与非编码位点比较也显示变化方向一致,但编码位点的绝对多样性估计值更高。鉴于pi随时间相对变化方向的一致性,后续分析集中于“all reads all snps”数据集。样本量对核苷酸多样性估计值的影响分析表明,估计值最大的变异出现在样本量小的种群中。评估采样时间跨度对遗传多样性的影响发现,其影响可以忽略不计。
3.5 地点和物种特异性的人口历史
在Skull's Gap,所有三个物种都显示出扩张证据,表现为pi和Watterson's Theta增加,Tajima's D下降但大于零,表明持续扩张。在Indian Grave Gap,模式因物种而异。P. cinereus显示出种群收缩证据。P. montanus支持稳定或扩张的种群规模。P. cylindraceus支持从1960s–1980s潜在衰退但此后扩张。P. yonahlossee显示出更复杂的模式。
3.6 免疫基因座中的等位基因频率变化
在所有个体中鉴定出49个独特的先天免疫相关变异。非编码SNP的中性基因组平均Fst为0.345,而免疫相关平均Fst为0.462(比中性基线高34%)。19个SNP随时间显示较大的等位基因频率变化。除P. cinereus外,所有物种的免疫相关基因座均表现出升高的Fst,可能反映了由环境压力驱动的平衡选择。
讨论
4.1 历史样本用于遗传多样性估计的可靠性
历史DNA的使用是一个快速发展的领域。尽管在DNA提取和生物信息学流程方面取得进展,但标本固定对DNA质量的影响及其如何影响历史DNA数据集的完整性和准确性尚未完全了解。本研究表明,在缺乏人口变化的情况下,由于纯合偏倚,历史样本的多样性基线估计值可能较低。来自1980s–1990s的血液样本给出的个体间变异估计值更广。采样时间跨度对人口统计估计的影响可以忽略不计。
4.2 生物信息学决策对人口统计估计的影响
除了外显子和常用系统发育标记外,还测试了捕获与其他类型基因座(如听觉、视觉、UCE和免疫反应)的功效。生物信息学流程在外显子目标上表现良好,但其他目标基因座表现不佳。覆盖度差异会影响多样性估计,但降采样和不降采样数据集之间变化的方向性一致。编码和非编码位点的基因组变异比较发现,编码位点的变异明显多于非编码位点。
4.3 林地蝾螈的人口变化
历史调查数据提供了Plethodon种群在阿巴拉契亚山脉许多地点衰退的证据。分子方法为了解种群规模可能发生的变化以及这些变化的潜在基因组后果提供了新视角。尽管未发现林地蝾螈拟议的衰退对种群内遗传多样性产生负面影响的强有力证据(P. cinereus和P. cylindraceus可能除外),但它们在阿巴拉契亚生态系统中的巨大丰富性使其在这些系统的营养生态中扮演重要角色。免疫相关基因座表现出相对于背景基因组升高的Fst,可能反映了由环境压力驱动的平衡选择。除P. cinereus外,大多数物种的模式与跨物种多态性一致。
结论
本研究证明了历史DNA和自然历史博物馆收藏对于调查遗传多样性时间模式的价值。通过将历史时间序列采样与现代收藏相结合,量化了两个Plethodon蝾螈群落的遗传多样性变化。这些结果强调了种群对持续环境变化反应的复杂性,并突出了继续保存自然历史博物馆中时间序列收藏的必要性。