一种基于PCA和随机森林的流程,用于高分辨率下利用SNP(单核苷酸多态性)区分中国藜(Leymus chinensis)的品种

《BMC Plant Biology》:A PCA-random forest pipeline for high-resolution SNP-based cultivar discrimination in Leymus chinensis

【字体: 时间:2026年02月12日 来源:BMC Plant Biology 4.8

编辑推荐:

  紫花羊草基因组SNP分析揭示品种鉴定核心标记群,结合PCA与随机森林模型,575个高置信SNP实现74.36%平均分类精度,部分品种达88.56%精度,但育种材料和野生种群分辨率较低。

  

摘要

背景

Leymus chinensis(羊草)是中国北方草原恢复中重要的多年生牧草,但其复杂的基因组和高遗传多样性阻碍了使用传统形态学方法进行精确的品种鉴定。基于SNP的分子标记的最新进展为该物种的独特性、一致性和稳定性(DUS)测试以及品种权利保护提供了高效可靠的工具。

结果

我们使用定制设计的50K全基因组液相SNP阵列,对来自11个样本的223个个体进行了基因分型,其中包括9个品种、1个育种系和1个野生样本,每个样本抽取了15-30个个体。经过严格的质量控制后,保留了159,262个高置信度的SNP,其中超过60%位于基因相关区域。群体结构和系统发育分析显示大多数样本之间存在明显的遗传差异,尽管某些品种在基因组上存在显著重叠。仅使用主成分分析(PCA)只能有效区分两个品种,表明在区分所有群体方面的分辨率有限。为了提高鉴定能力,我们将PCA与随机森林(RF)分类结合使用,并建立了一个由575个SNP组成的核心鉴定面板。该鉴定模型在11个羊草群体中的平均正确分类率为74.36%,其中3个品种(育种系11、7和8)的准确率超过80%,最高达到88.56%。然而,育种系和野生样本的分辨率较低,这反映了这两组较高的遗传杂合性和复杂的祖先背景。

结论

这种高通量、低成本的SNP检测方法能够准确鉴定羊草品种。通过结合PCA和随机森林技术,我们建立了一个由575个SNP组成的核心鉴定集,实现了较高的区分能力。这一策略也广泛适用于其他物种的品种鉴定。

背景

Leymus chinensis(羊草)是中国北方草原恢复中重要的多年生牧草,但其复杂的基因组和高遗传多样性阻碍了使用传统形态学方法进行精确的品种鉴定。基于SNP的分子标记的最新进展为该物种的独特性、一致性和稳定性(DUS)测试以及品种权利保护提供了高效可靠的工具。

结果

我们使用定制设计的50K全基因组液相SNP阵列,对来自11个样本的223个个体进行了基因分型,其中包括9个品种、1个育种系和1个野生样本,每个样本抽取了15-30个个体。经过严格的质量控制后,保留了159,262个高置信度的SNP,其中超过60%位于基因相关区域。群体结构和系统发育分析显示大多数样本之间存在明显的遗传差异,尽管某些品种在基因组上存在显著重叠。仅使用主成分分析(PCA)只能有效区分两个品种,表明在区分所有群体方面的分辨率有限。为了提高鉴定能力,我们将PCA与随机森林(RF)分类结合使用,并建立了一个由575个SNP组成的核心鉴定面板。该鉴定模型在11个羊草群体中的平均正确分类率为74.36%,其中3个品种(育种系11、7和8)的准确率超过80%,最高达到88.56%。然而,育种系和野生样本的分辨率较低,这反映了这两组较高的遗传杂合性和复杂的祖先背景。

结论

这种高通量、低成本的SNP检测方法能够准确鉴定羊草品种。通过结合PCA和随机森林技术,我们建立了一个由575个SNP组成的核心鉴定集,实现了较高的区分能力。这一策略也广泛适用于其他物种的品种鉴定。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号