创始人品种对Canchim牛基因型插补精度的影响:多品种参考群体提升复合牛种基因推断准确性的研究

《Journal of Applied Genetics》:Effect of founder breeds on genotype imputation accuracy in Canchim cattle

【字体: 时间:2026年04月17日 来源:Journal of Applied Genetics 1.9

编辑推荐:

  为解决基因型插补(genotype imputation)在复合牛种中准确性不足的问题,研究人员探究了纳入Nelore(NE)和Charolais(CH)两种创始人品种基因型对Canchim(CA)牛插补准确性的影响。研究发现,在参考群体中包含NE、CH和CA(雄性或2004年前出生个体)时,插补精度最高(PERC最高达97.39%,R2最高达0.9780)。这证实了多品种参考群体能为复合牛种提供更稳健的遗传基础。

  
巴西是全球重要的牛肉出口国之一,当地肉牛养殖业正不断通过技术投入来优化生产效率。在这个过程中,杂交育种技术催生了许多适应热带气候的合成品种,其中就包括了诞生于20世纪40年代的Canchim牛。这个品种通常携带5/8的Charolais(CH,Bos taurus taurus 血统和3/8的Nelore(NE,Bos taurus indicus 血统,巧妙地结合了欧洲牛的产肉性能和瘤牛的适应性。然而,与主流商业品种相比,Canchim牛的群体规模仍然较小,这在一定程度上限制了其遗传评估的精度和效率。
在基因组学时代,基因型插补(genotype imputation) 技术为成本效益高的基因分型提供了有力工具。它允许我们利用高密度基因型组成的参考群体(reference panel),来推断目标群体中那些未被直接测定的基因型,从而在不必对每个个体进行昂贵的高密度检测的前提下,提高标记密度,助力基因组选择(genomic selection)。然而,对于Canchim这样的复合品种(composite breed) 来说,其基因组是由祖先品种的基因组片段重组拼接而成,其遗传结构是否稳定,以及如何为其构建最优的插补参考群体,仍然是一个悬而未决的问题。特别是,在插补时,是只用Canchim牛自身作参考,还是需要将其创始人品种也包含进来,才能获得更高的准确性?这对于在资源有限条件下,优化Canchim牛的遗传改良策略至关重要。针对这一科学问题,研究人员在《Journal of Applied Genetics》上发表了一项研究,系统评估了创始人品种基因型对Canchim牛基因型插补精度的影响。
为开展此项研究,研究人员运用了几个关键技术方法。首先,他们构建了包含2093头牛的研究群体,其中包括804头Nelore(NE)、897头Charolais(CH)和392头Canchim(CA),所有个体均使用Illumina BovineHD Genotyping BeadChip进行了高密度(777,962个SNP)基因分型。其次,为了模拟中密度芯片的常见应用场景,研究人员对CA牛的基因型进行了“掩码”处理,将其降级为相当于BovineSNP50 BeadChip的54,609个SNP。接着,他们设计了14种不同的插补场景,变量包括参考群体的品种构成(仅NE、仅CH、NE+CH、或包含部分CA个体)、性别、出生年份和谱系(新谱系 vs. 旧谱系)。然后,使用FImpute v.3软件进行基因型插补,该软件能够基于连锁不平衡(linkage disequilibrium) 和共享单倍型来推断缺失基因型。最后,通过主成分分析(principal component analysis) 评估群体结构,通过韦尔-科克勒姆固定指数(Fstof Weir and Cockerham) 衡量遗传分化,并采用正确插补基因型百分比(PERC)观测与插补基因型间的皮尔逊相关系数平方(R2 两个指标来量化插补精度。
结果与讨论
插补精度存在广泛变异,包含CA个体的场景普遍更优
对14种插补场景的分析显示,PERC值在66.52%97.39% 之间,R2在0.63520.9780之间波动。当参考群体仅包含创始人品种(NE或CH)时,插补精度波动较大(PERC:66.52%-90.07%;R2:0.6352-0.9121)。相比之下,所有在参考群体中加入了CA个体的场景(S4至S14),其精度均显著更高且更稳定(PERC:89.79%-97.39%;R2:0.9061-0.9780)。
遗传相似性是决定插补精度的关键因素
主成分分析和Fst值揭示了遗传距离与插补精度的强相关性。在仅使用NE作为参考群体的场景S1中,观测到最低的精度(PERC=66.52%, R2=0.6352)和最高的遗传分化(Fst=0.1169)。而仅使用CH的S2场景,由于CA与CH遗传更接近(Fst=0.0385),精度有所提高(PERC=71.80%, R2=0.7181)。当NE和CH被共同纳入参考群体时(S3),精度得到显著提升(PERC=90.07%, R2=0.9121),这说明尽管NE与CA遗传距离较远,但其遗传信息的加入仍然能优化插补过程。
最优策略:包含创始人品种及特定CA亚群的多品种参考群体
研究发现,同时包含NE、CH以及CA特定亚群(如雄性个体或2004年前出生的个体) 的参考群体,能实现最高的插补精度。例如,场景S6(参考群体:NE+CH+CA雄性)和S10(参考群体:NE+CH+2004年前出生的CA)达到了接近的顶级精度(S6: PERC=97.39%, R2=0.9780;S10: PERC=97.37%, R2=0.9777)。这优于仅使用CA旧谱系个体作为参考群体的场景(S14: PERC=95.12%, R2=0.9564)。研究表明,CA与CH共享的单倍型区块(haplotype blocks)数量更多、频率更高,这为基于共享单倍型匹配的插补算法(如FImpute)提供了更有利的条件。
结论与意义
本研究的核心结论是:在参考群体中包含创始人品种(Nelore和Charolais)能显著提高Canchim牛基因型插补的准确性。 最优策略是构建一个多品种参考群体(multibreed reference population),该群体不仅包含目标复合品种的代表性个体,还应纳入其所有的创始人品种。
这项研究具有重要的理论与实践意义。在理论上,它证实了对于遗传背景复杂的合成品种,其最优插补参考群体并非简单的同品种群体,而是需要涵盖其遗传来源的“祖先库”,这加深了我们对群体遗传结构与插补算法性能之间关系的理解。在实践上,该研究为Canchim牛乃至其他复合畜种的基因组选择项目提供了明确的优化方案。通过采用包含创始人品种的参考群体进行基因型插补,育种者可以在使用成本更低的中低密度芯片的前提下,获得接近高密度芯片的基因型信息质量,从而以更高的成本效益推进遗传改良进程,这对于资源有限的育种项目尤其具有价值。最终,这项研究为提升复合牛种的育种效率、挖掘其遗传潜力提供了坚实的技术支撑。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号