《Theoretical and Applied Genetics》:Enhancing genomic prediction ability of blast resistance using genome-wide association study-derived marker weights in two rice (Oryza sativa L.) populations
编辑推荐:
本研究针对水稻稻瘟病抗性基因组选择(GS)中传统GBLUP模型假设所有标记贡献均等、可能忽略关键抗性位点的局限性,创新性地将GWAS结果整合到GS框架中,评估了FST-w、AE-w和?log10(p)-w三种标记权重策略。研究发现,基于加性效应(AE-w)和P值(?log10(p)-w)的加权方法在单性状和多性状模型中显著提升了叶瘟(BL)和穗瘟(PB)严重度的预测能力(最高提升37%),并降低了标准化均方根误差(nRMSE)。该研究为利用GS+GWAS策略加速水稻持久抗稻瘟病育种提供了重要理论依据和实践方案。
稻瘟病是由稻瘟病菌(Magnaporthe oryzae)引起的水稻毁灭性病害,每年给全球水稻生产造成10%至30%的产量损失,严重时甚至导致绝收。培育抗病品种是防治该病最经济有效的策略。水稻对稻瘟病的抗性可分为由单个主效基因控制的完全抗性和由多个微效基因控制的定量抗性。尽管已有100多个稻瘟病抗性基因(Pi基因)被报道,但由于病原菌生理小种易变异,完全抗性易被克服,而定量抗性虽然持久,但其遗传基础复杂,传统育种方法难以有效利用。
随着基因分型成本的下降和高密度单核苷酸多态性(SNP)芯片的应用,基因组选择(Genomic Selection, GS)作为一种先进的育种技术,能够利用全基因组标记信息对个体进行遗传评估,从而加速遗传增益。其中,基因组最佳线性无偏预测(GBLUP)是应用最广泛的模型之一。然而,传统GBLUP模型假设所有标记对性状的贡献相等,这可能会稀释主效抗病位点的贡献,限制其对复杂性状(如稻瘟病抗性)的预测准确性。
为了解决这一问题,研究人员开始探索将全基因组关联分析(Genome-Wide Association Study, GWAS)与GS相结合的策略,即利用GWAS的结果为不同的标记赋予权重,构建加权的基因组关系矩阵(G矩阵),从而发展出加权GBLUP(wGBLUP)模型。这种GS+GWAS的策略有望更充分地利用基因组信息,提高对稻瘟病抗性的预测能力。然而,不同加权策略(如基于群体分化指数FST、标记加性效应平方AE-w或关联分析P值负对数?log10(p)-w)在预测叶瘟和穗瘟抗性方面的效果如何,尤其是在不同遗传背景的水稻群体中是否稳定有效,仍有待深入评估。
为此,研究人员在《Theoretical and Applied Genetics》上发表了题为“Enhancing genomic prediction ability of blast resistance using genome-wide association study-derived marker weights in two rice (Oryza sativa L.) populations”的研究论文。该研究旨在剖析两个遗传背景各异的水稻群体(SSD Tropics群体和3K群体)叶瘟和穗瘟抗性的遗传结构,并系统评估三种加权GBLUP模型(单性状ST和多性状MT)在预测这两种抗性方面的表现。
为了开展这项研究,作者主要运用了以下几项关键技术方法:研究材料包括由10个恢复系杂交衍生的1484个F6家系组成的SSD Tropics群体,以及从全球3000份水稻种质资源中选取的204份 accession 组成的3K群体。在田间自然发病条件下评估了叶瘟和穗瘟严重度等性状。利用1k-RiCA v4.2 SNP芯片对SSD Tropics群体及其亲本进行基因分型,获得1094个SNP标记,经过滤和填补后保留671个高质量SNP;从Rice SNP-Seek数据库获取3K群体的100万个SNP标记,经过滤和选择性连锁不平衡修剪(SLDP)后获得9126个高质量SNP用于分析。表型数据分析采用两阶段方法,第一阶段使用累积logit混合模型(分类性状)或高斯连接函数模型(数量性状)估算每个基因型的调整均值及其Smith权重;第二阶段利用调整均值拟合混合线性模型,估算方差分量、遗传力、基因型相关性和最佳线性无偏估计(BLUE)。群体结构和连锁不平衡分析采用主成分分析(PCA)和ADMIXTURE软件。全基因组关联分析(GWAS)使用混合线性模型(MLM)并校正亲缘关系和群体结构。基因组预测则通过五折交叉验证比较了未加权GBLUP与三种加权GBLUP(FST-w, AE-w, ?log10(p)-w)在单性状(ST)和多性状(MT)模型下的预测能力和标准化均方根误差(nRMSE)。
遗传变异 within each population for all traits
模型诊断统计量显示所有性状的模型均完美收敛,有效样本量高,参数估计精度高。两个群体中所有性状的遗传方差均显著,基因型与环境的互作方差也存在但小于遗传方差。所有性状的广义遗传力估计值较高(0.63-0.82),表明表型变异主要由遗传因素决定。在SSD Tropics群体中,家系内的方差高于家系间方差。两个群体中所有性状的BLUE值均呈连续且相对正态分布。
Genetic correlation and clustering in SSD Tropics and 3K populations
在两个群体中,叶瘟(BL)和穗瘟(PB)严重度之间存在中度正遗传相关(0.43-0.44)。病害严重度与农艺性状(如抽穗期DF和植株活力VG)的相关性普遍较低。多变量分析显示,前两个主成分分别解释了SSD Tropics和3K群体表型多样性的66.0%和80.5%。层次聚类将两个群体各分为三个 distinct clusters,其中某些簇表现出较低的平均病害严重度。
Population structure revealed by principal component analysis
在SSD Tropics群体中,根据交叉熵曲线确定最佳亚群数为10(K=10),群体结构主要受家系关系影响,分子方差分析(AMOVA)表明家系内遗传变异(50.8%)高于家系间变异(42.5%)。在3K群体中,确定最佳亚群数为4(K=4),PCA前两个主成分清晰区分了四个亚群,解释了6.7%和3.6%的遗传方差。
Marker-trait associations for leaf blast and panicle blast severity
通过单性状GWAS分析,在两个群体中鉴定到多个与叶瘟和穗瘟抗性相关的显著标记-性状关联(MTAs)。在SSD Tropics群体中,在6号和8号染色体上检测到与叶瘟严重度相关的显著MTAs,在6号染色体上检测到与穗瘟严重度相关的显著MTAs。连锁不平衡(LD)区块分析确定了包括qtl6.6和qtl8.3在内的QTL区域。在3K群体中,在1、6和12号染色体上检测到显著MTAs,并定义了qtl1.6、qtl6.18和qtl12.17等QTL区域。基因本体论搜索在QTL区域内鉴定出多个候选基因,其中最显著的MTAs位于6号染色体的Os06g0286700位点,该位点对应已知的Pi2/Pi9抗病基因簇;另一个显著MTA Pi33_3与Pi33基因连锁。单倍型分析显示,携带Pi2/Pi9或Pi33有利等位基因的单倍型组具有较低的平均病害严重度。
Predictive ability of weighted and unweighted genomic prediction models
基因组预测评估显示,在SSD Tropics群体中,未加权GBLUP对叶瘟和穗瘟严重度的平均预测能力分别为0.78-0.81和0.62-0.67。在3K群体中,未加权GBLUP对叶瘟和穗瘟严重度的平均预测能力分别为0.74-0.90和0.62-0.85。在所有情况下,基于加性效应(AE-w)和P值(?log10(p)-w)的加权方法 consistently 表现出最高的预测能力,相较于未加权模型,预测能力提升幅度达4%-37%。FST-w方法的改进效果因群体而异。多性状(MT)模型的预测能力与单性状(ST)模型相似或略低。
Root mean square error of weighted and unweighted genomic prediction models
在所有加权模型中,标准化均方根误差(nRMSE)均显著低于未加权模型。其中,?log10(p)-w和AE-w方法导致的nRMSE降低幅度最大(在SSD Tropics群体中降低3.8%-11.3%,在3K群体中降低7.5%-35.3%),而FST-w方法的降低幅度较小。
本研究通过整合GWAS与GS,成功揭示了水稻叶瘟和穗瘟抗性的复杂遗传架构,并鉴定出包括Pi2/Pi9和Pi33在内的关键抗病基因位点。研究结果表明,利用GWAS衍生的标记权重(特别是基于加性效应AE-w和P值?log10(p)-w的方法)构建加权基因组关系矩阵,能显著提高GBLUP模型对稻瘟病抗性的预测准确性和可靠性,提升幅度最高达37%,同时显著降低预测误差。这种GS+GWAS策略有效地克服了传统GBLUP模型平等对待所有标记的局限,更充分地利用了基因组信息,尤其加强了对具有较大效应抗病位点的捕捉。该研究为在不同遗传背景的水稻育种群体中实施高效、精准的基因组选择提供了重要的方法学优化和实践指南,对加速培育具有持久和广谱抗稻瘟病能力的水稻新品种、保障全球水稻生产安全具有重要的理论和实践意义。未来研究可进一步探索将基因型与环境互作效应整合到加权模型中,以提升模型在不同环境下的预测稳定性和适用性。