橄榄鲽耐盾纤毛虫病生存性状的基因组预测:统计与机器学习模型的综合评估与优化

《Aquaculture Reports》:Genomic prediction of survival traits for scuticociliatosis resistance in a vaccinated olive flounder cohort: Comprehensive evaluation and optimization of statistical and machine learning models

【字体: 时间:2026年02月21日 来源:Aquaculture Reports 3.7

编辑推荐:

  本研究针对疫苗化养殖背景下橄榄鲽面临的盾纤毛虫病(Scuticociliatosis)这一重大生产威胁,首次系统评估了基因组选择在提升其抗病性方面的应用潜力。研究人员通过构建包含474个个体的接种疫苗队列,比较了包括GBLUP、贝叶斯方法在内的10种基因组预测模型,评估了标记密度与训练群体规模对预测准确性的影响。研究发现,基于GWAS筛选的Top 1000标记的GBLUP模型预测能力最佳,预测准确性可达0.558±0.006,显著优于传统系谱BLUP(PBLUP)。该研究为橄榄鲽抗盾纤毛虫病育种中模型选择与高效育种方案设计提供了关键实践见解,推动了基因组选择在抗寄生虫病育种中的实际应用。

  
在蔚蓝的海水养殖池中,一种名为盾纤毛虫病(Scuticociliatosis)的寄生虫病正悄然侵蚀着“鱼中贵族”——橄榄鲽(Paralichthys olivaceus)的健康与养殖者的收益。这种由寄生虫Miamiensis avidus引起的疾病,已成为韩国济州岛等地区橄榄鲽养殖业面临的主要威胁之一。尽管疫苗的使用在一定程度上降低了死亡率,但其效果受到病原抗原多样性和宿主免疫应答遗传变异的限制。面对这一挑战,育种家们将目光投向了更具前瞻性的策略:通过选择性育种,培育出天生具备更强抗病能力的鱼苗。然而,传统基于系谱的育种方法(如PBLUP)在预测复杂抗病性状,特别是像存活率这样低遗传力性状的育种值时,往往力有不逮,因为它难以精确捕捉个体间真实的遗传关系。
那么,能否借助现代基因组学的力量,实现更精准、更快速的抗病育种呢?基因组选择(Genomic Selection, GS)正是一种革命性的方案。它通过遍布全基因组的分子标记(如单核苷酸多态性,SNP)来预测个体的遗传潜能(基因组估计育种值,gEBV),从而可以在生命早期就筛选出优秀的亲本,加速遗传进展。这种方法在水产养殖,尤其是像橄榄鲽这样具有大家族规模的物种中,展现出巨大潜力。但问题随之而来:为了实现高效且经济的育种,我们需要回答几个关键问题:在众多基因组预测模型中(如GBLUP、贝叶斯方法、惩罚回归、机器学习等),哪种模型最适合预测橄榄鲽的盾纤毛虫病抗性?需要多少数量的遗传标记(标记密度)才能达到最佳的预测效果?又需要多大的训练群体规模才能保证预测的可靠性?更重要的是,在常规接种疫苗的生产环境下评估抗性,其遗传基础是否与未接种时不同,从而需要针对性的育种策略?为了解答这些问题,一支由韩国济州国立大学(Jeju National University)领衔的国际研究团队开展了一项开创性的研究,相关成果已发表在《Aquaculture Reports》期刊上。
为了开展这项研究,研究人员运用了几个关键技术方法。首先,他们建立了一个包含474尾接种疫苗并经过M. avidus活菌攻毒的橄榄鲽子代群体,作为模型训练与验证的数据基础。其次,所有个体均使用定制的70K Affymetrix Axiom SNP芯片进行了高密度基因分型,并经过严格质量控制,最终获得52,046个高质量SNP用于分析。再者,研究系统评估了10种不同的基因组预测模型,包括基于系谱的最佳线性无偏预测(PBLUP)、基因组最佳线性无偏预测(GBLUP)、五种贝叶斯方法(BayesA, BayesB, BayesC, 贝叶斯套索, 贝叶斯岭回归)、两种正则化回归(岭回归和弹性网络)以及随机森林(RF)。最后,为了评估模型性能并优化参数,研究采用了重复10次的5折交叉验证策略,并系统分析了不同标记密度(从500到50,000个SNP)和不同训练群体规模对预测能力的影响。
研究结果
2.1. 描述性统计、亲本指派与基因组亲缘关系
攻毒实验持续了12天,接种疫苗组的生存概率和中位生存时间均显著高于未接种的对照组。从接种队列中筛选出的474尾鱼构成了研究群体。亲本指派确定了60个父系半同胞家系。基于全基因组SNP计算的基因组关系矩阵(GRM)热图显示了个体间的亲缘关系结构。遗传力估计显示,形态性状(体长、体宽、体重)具有中等遗传力,而三个生存性状(二元存活、攻毒后天数[DPC Date]、攻毒后小时数[DPC Time])的遗传力较低(0.08-0.11)。遗传相关分析表明,生存性状之间以及生存性状与体宽之间存在中度到高度的正遗传相关。
2.2. 基因组估计育种值(gEBV)的预测模型评估
通过对10种模型的评估比较发现,对于所有三个生存性状,GBLUP和贝叶斯方法(BA, BB, BC, BL, BRR)的预测能力均一致且显著地优于传统的PBLUP、弹性网络和随机森林方法。例如,对于二元存活性状,贝叶斯岭回归(BRR)表现最佳。GBLUP在所有性状上的预测准确性(0.64–0.72)显著高于PBLUP(0.06–0.31),提升超过两倍。
2.3. 标记配置与密度优化的影响
研究评估了不同标记密度和选择策略对GBLUP模型预测能力的影响。关键发现是,基于全基因组关联分析(GWAS)重要性排序(GWAS-ranked)选择的标记,其预测表现始终优于随机选择的标记。预测能力随着使用的Top GWAS标记数量的增加而提高,在使用Top 1000个标记时达到峰值(例如,DPC Time的预测能力为0.558±0.006),随后继续增加标记数量,预测能力反而下降。相比之下,随机选择标记的策略未能表现出清晰的性能提升趋势。
2.4. 群体规模对预测能力的影响
训练群体规模显著影响了GBLUP模型(使用Top 1000 GWAS标记)的预测性能,且这种影响因性状而异。对于DPC Time性状,当训练群体规模达到200个个体时,预测能力即达到最优平台(0.50-0.55),继续增加规模未带来显著提升。而对于DPC Date和二元存活性状,分别需要约300个和350个以上的训练个体才能获得稳定且最优的预测。小规模的训练群体(50-100个个体)会导致所有性状的预测准确性显著降低。研究结果明确了针对不同生存性状进行有效基因组预测所需的最小训练群体规模阈值。
研究结论与意义
这项研究首次在接种疫苗的橄榄鲽育种群体中,为盾纤毛虫病抗性生存性状优化了一个基因组预测框架。主要结论是,基因组预测(尤其是GBLUP和贝叶斯模型)在预测低至中等遗传力的生存性状时,其表现显著优于传统的系谱预测方法。其中,连续的时间性状(如DPC Time)比二元存活性状更容易被准确预测。一个核心发现是,基于GWAS的标记优先选择策略能通过富集与表型相关的SNP,大幅提升基因组预测能力,最优效果出现在使用约1000个Top GWAS标记时。同时,预测能力随训练群体规模增大而提高,但在约300个个体时达到平台期,这为设计高性价比的育种方案提供了关键数据支持。
该研究的重要意义在于为水产抗病育种提供了切实可行的“操作指南”。它明确指出,在橄榄鲽抗盾纤毛虫病的育种项目中,应优先采用GBLUP或贝叶斯类模型,并利用GWAS初步筛选出的关键标记来构建低成本、高效率的基因分型芯片。同时,约300个个体的训练群体规模是一个经济有效的“甜蜜点”,有助于在保证预测精度的前提下控制育种成本。更为深远的是,该研究强调了在“疫苗化”生产环境下直接评估和选择抗病性的必要性,因为接种疫苗可能改变抗性的遗传结构,在此环境下选择的亲本才能确保其后代在实际养殖中表现出最佳的抗病性能。这项工作不仅为橄榄鲽,也为其他水产养殖物种对抗寄生虫病的基因组育种计划奠定了方法论基础,标志着基因组选择从理论走向实践、助力水产养殖业可持续发展的重要一步。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号