FORGENIUS基因组资源:面向23种森林树及其遗传保育单元的新基因分型工具与数据

《Molecular Ecology Resources》:The FORGENIUS Genomic Resources: New Genotyping Tools and Genomic Data for 23 Forest Tree Species and Their Genetic Conservation Units

【字体: 时间:2026年03月05日 来源:Molecular Ecology Resources 5.5

编辑推荐:

  本期推荐一篇具有开创性的研究。由欧盟H2020 FORGENIUS项目支持,该研究针对23种欧洲森林树种开发了标准化的靶向基因分型工具(SPET),并成功对7220棵树进行了基因分型。研究发现了超过180万个单核苷酸多态性(SNPs),为建立欧洲森林遗传保育单元(GCUs)网络的首个遗传监测基线、评估森林的适应性潜能及制定基于遗传信息的保护策略提供了关键资源与技术方案。

  
FORGENIUS基因组资源:新基因分型工具与23种森林树及其遗传保育单元的基因组数据
1 引言
遗传多样性是生物多样性的关键但常被忽视的组成部分。欧盟H2020 FORGENIUS项目旨在增加遗传数据的数量和质量,以启动对欧洲森林遗传保育单元(GCUs)网络的监测。该网络由欧洲森林遗传资源计划(EUFORGEN)自1994年起协调,旨在代表适应特定环境条件、预期具有独特遗传特征的森林林分。然而,GCU的纳入决定多基于非标准化的本地观察,缺乏定量科学评估。尽管近年来出现了涵盖物种分布范围和全基因组的表征研究,但大多数欧洲森林树种的遗传信息仍依赖于有限数量的中性分子标记,不足以充分描述其遗传多样性,特别是其适应性潜力。随着高通量测序技术的出现,将相同标准应用于所有物种成为可能。FORGENIUS项目的核心目标之一正是解决欧洲GCU网络的知识空白,为监测欧洲森林中和适应性遗传变异水平提供共同基线。
2 材料与方法
2.1 森林遗传保育单元(GCUs)的基因组表征
研究在FORGENIUS项目框架内定性选择了23种森林树种,它们广泛代表了GCU网络。选定的物种涵盖了从生态和经济上最重要的广布种(如欧洲水青冈、欧洲赤松、欧洲云杉、无梗花栎)到稀有种(如尼泊尔冷杉)或散生种(如欧洲野苹果)。这些物种覆盖了多种环境需求,存在于大多数欧洲生态区,并对应多种社会需求。研究对总共301个GCUs的7220棵树进行了采样和分析。
2.2 单引物富集技术(SPET)面板设计
研究人员为14个物种定制设计了物种特异性SPET探针,以每个物种约10,000个位点为目标,平衡物种特异性和随机分布区域以确保广泛的基因组覆盖并最小化ascertainment bias。至少一半的探针被设计为捕获基因组/转录组的随机位点,以获得无ascertainment bias的SNPs集。总共开发了四种不同的SPET探针面板,可用于相关物种,并可在IGATech获取。
2.3 基因组/转录组上随机靶点的选择
当有参考基因组时,使用k-mer方法在非重复区域选择探针。当没有参考基因组而使用转录组时,则利用相关物种的基因组来识别具有高mappability的区域,以确保探针不跨外显子-内含子连接点或在重复序列内。
2.4 已知靶点的选择
对于四个物种,从之前的研究中选择了已知的目标SNPs,以捕获物种特异性感兴趣区域,包括涉及应激反应和本地适应的同源基因。其他物种的已知目标SNPs则选自之前的各种研究和基因分型阵列。
2.5 DNA提取与基因分型
对所有物种,使用NucleoSpin Plant II试剂盒从叶片/针叶中提取DNA。五个物种使用现有的Axiom芯片进行基因分型。对于SPET基因分型,文库制备采用Tecan Genomics的Allegro靶向基因分型方案,并在Illumina NovaSeq 6000系统上进行测序。使用GATK软件包进行SNP calling。
2.6 SNP过滤与群体遗传统计
对GATK输出的gVCF进行过滤,仅保留双等位SNPs,并应用深度、基因型质量等阈值。通过主成分分析(PCA)和聚类分析识别并移除可能的异常样本和重复样本。使用R包hierfstat计算期望杂合度(HS)和Weir & Cockerham的FST,并使用pixy估算核苷酸多样性。
3 结果
3.1 SPET面板性能
SPET面板在所有分析的物种中都表现良好。每个样本的平均测序读长对数在约130万到340万之间。针对整个基因组的唯一比对率在不同物种间差异很大。在大多数物种中,设计的大部分探针是有效的。SPET面板在相关物种中表现出高的基因分型效率和跨物种转移性。例如,为银冷杉设计的近10,000个探针中有近9300个成功地对尼泊尔冷杉样本进行了基因分型。在栎属物种中也观察到了类似的结果。探针在基因组上通常分布良好,尽管在基于转录组设计探针的物种和基因组较大的物种中,连续窗口无探针的情况更常见。
3.2 SNP检测与基因组表征
研究通过SPET或Axiom芯片基因分型技术,在23个树种的301个GCUs中鉴定出总数超过185万个SNPs,覆盖约50 Mb的基因组序列。通过SPET技术基因分型的物种获得了数万个SNPs,而通过Axiom芯片基因分型的物种SNP数量较少。在Fagaceae科的物种中,观察到了部分探针的跨物种转移性。分析表明,使用来自不同物种的探针捕获的序列不会对遗传多样性估计引入显著偏差。在可以比较SPET和SNP芯片技术的物种中,发现芯片SNP由于倾向于选择中等频率的SNP,导致对多样性指标的过高估计和对FST的低估。开发的SPET面板还具有识别物种分化标记的潜力,例如为夏栎开发的SPET面板能够捕获约200个先前报道的具有高分辨力的标记,并新发现了196个具有高判别力的标记。
4 讨论
4.1 FORGENIUS SPET面板的性能与关键特性
SPET技术使研究人员能够生成涵盖所有分析物种的大量遗传标记,无论基因组大小或复杂性如何。SPET探针在相关物种间表现出高转移率,这是一个显著优势。SPET面板在准确评估物种全分布范围内的遗传多样性方面代表了重大进步。与容易因ascertainment bias而产生偏差的SNP芯片不同,SPET设计允许在全基因组范围内从头检测SNP。在数据中包含不变位点信息还能估算核苷酸多样性,从而实现对GCU遗传组成的更全面表征。
4.2 FORGENIUS基因组资源在欧洲森林保护中的应用
本研究介绍的基因组资源是启动遗传监测计划以评估GCU适应能力的基本要求。研究在物种水平上的参数估计显示了FORGENIUS焦点物种经历的多种过去群体历史。期望杂合度和核苷酸多样性的估计与先前文献中的发现一致,同时也为研究较少的物种(如极度濒危的尼泊尔冷杉的独特种群具有相对较高的核苷酸多样性)提供了新的见解。对于与栽培品种相关的物种,GCU中的核苷酸多样性估计值与研究栽培品种获得的估计值相似,这可能暗示GCU选择和分布方面存在潜在的关键问题。
4.3 最终评述与未来方向
FORGENIUS SPET面板和此处提供的数据旨在描述欧洲森林GCU网络的现状,是开发该网络所保护的森林遗传资源监测计划的第一步。考虑到在属甚至科水平上观察到的高转移性,相同的工具可应用于更多物种。此外,这项工作为在其他物种上设计具有良好前景的SPET面板奠定了基础。对于基因组大小有限的物种,未来可能转向全基因组测序,但对于数千个样本的应用,其经济性仍不合适。对于具有超长和复杂基因组的物种,如此处介绍的工具可能仍是表征数百个种群全分布范围内遗传多样性的便捷选择。SPET数据在候选基因和随机分布标记的混合使用使其特别灵活,可覆盖广泛的研究目标,从基因-环境关联(GEA)分析、遗传负荷评估、交配模式和群体分析,到空间保护规划等更具保护导向的目标。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号