《The Plant Genome》:Using genomic selection to examine subgenome dominance and epistasis in allopolyploid strawberry
编辑推荐:
本文综述了利用基因组选择(GS)模型,在佛罗里达大学草莓育种群体的6718个基因型中,探究亚基因组(A、B、C、D)与上位性效应对九个性状(包括产量、品质和抗病性)的遗传贡献。研究表明,亚基因组显性呈现表型依赖性,B亚基因组平均贡献最大;上位性解释了12%–46%的遗传变异。通过纳入亚基因组和上位性效应的基因组选择模型,预测能力提升了1%–34%,为多倍体作物复杂性状的遗传解析和育种改良提供了新见解。
引言
多倍化是真核生物中广泛存在的进化力量,在物种形成和多样化中扮演关键角色。异源多倍体(Allopolyploid)通过多个物种杂交后染色体加倍形成,其基因组包含来自不同祖先物种的多个亚基因组(Subgenome)。许多重要作物,如小麦、棉花、咖啡和草莓(Fragaria × ananassa),均为异源多倍体。在这些作物中,亚基因组显性(Subgenome dominance)现象经常出现,对基因表达、表观遗传调控和基因保守性产生强烈影响。尽管在分子水平上对亚基因组显性已有广泛研究,但在表型水平上的探索甚少。本研究旨在利用来自佛罗里达大学草莓育种群体的大规模数据集(6718个基因型),通过考虑亚基因组和上位性效应的多核基因组选择模型,探究亚基因组相互作用对九个表型预测的重要性,以评估每个草莓亚基因组的遗传贡献。
材料与方法
1. 育种材料与表型分析
本研究数据涵盖2013年至2023年连续10个生长季节。表型数据分为两类:产量表型试验和病理学试验。产量相关表型包括平均单果重(Average Weight)、可溶性固形物含量(Brix)、等外果率(Culls)、硬度(Firmness)和市场产量(Marketable Yield)。四种病害抗性表型包括由Phytophthora cactorum引起的疫霉冠腐病(Phytophthora crown rot, PhCR)、由Macrophomina phaseolina引起的炭腐病(Charcoal rot, CR)、由Colletotrichum gloeosporioides复合种引起的炭疽冠腐病(Colletotrichum crown rot, CCR)以及由Podosphaera aphanis引起的白粉病(Powdery mildew, PM)。病害抗性通过接种试验评估,并使用病情进展曲线下面积(Area under the disease progress curve, AUDPC)进行量化。使用混合线性模型校正季节、重复和基因型与环境互作效应,并计算广义遗传力(H2)。
2. 基因型数据
研究个体使用iStraw 35K和Fana 50K两种单核苷酸多态性(Single-nucleotide polymorphism, SNP)芯片进行基因分型。通过比对和插补,最终使用了可明确映射到草莓四套亚基因组(A、B、C、D,各含7条染色体)的42,543个SNP标记,其亚基因组分布较为均衡。
3. 基因组选择模型
为测试建模亚基因组显性和上位性效应的重要性,本研究依次测试了五种基因组选择模型(见表2):
- •
加性模型(Additive):作为基准模型,仅包含全基因组加性效应。
- •
亚基因组模型(Subgenome):将全基因组加性效应分解为四个独立的亚基因组加性效应。
- •
加性+上位性模型(Additive+Epistasis):在加性模型基础上,增加全基因组水平的上位性(加性×加性)效应。
- •
亚基因组+上位性模型(Subgenome+Epistasis):在亚基因组模型基础上,增加所有可能的亚基因组间上位性互作效应。
- •
亚基因组+协方差模型(Subgenome+Covariance):在亚基因组模型基础上,考虑由选择压力导致的亚基因组间遗传协方差。
使用贝叶斯方法通过“BGLR”R包进行模型拟合和遗传参数估计。通过两种交叉验证方案评估模型预测性能:1) 剔除季节交叉验证(Delete-season CV),模拟预测新环境中新基因型,最为严格;2) 10折交叉验证(10-fold CV),评估包含更多高亲缘关系个体时的模型表现。
结果
1. 表型遗传参数
九个表型的广义遗传力(H2)估计值范围从低(硬度,0.13)到高(白粉病,0.80)。所有表型的遗传方差估计均显著(p = 0.05)。基因型与季节互作(VGxS)相对于遗传方差(VG)的比例在不同性状间差异很大。
2. 亚基因组效应
每个亚基因组的遗传贡献在不同表型间差异很大。平均而言,B亚基因组贡献的遗传变异最多(33%),其次是A亚基因组(27%)、C亚基因组(23%),D亚基因组贡献最少(17%)。对于平均单果重、可溶性固形物含量、等外果率、市场产量和白粉病,亚基因组贡献较为平衡;而对于硬度、疫霉冠腐病、炭腐病和炭疽冠腐病,则表现出不平衡的亚基因组贡献模式,其中某个亚基因组占据主导(贡献率在51.1%至68.2%之间)。
3. 遗传架构
加性遗传方差占所有表型总遗传方差的大部分。基于加性+上位性模型,上位性平均贡献了28%的遗传变异,范围从平均单果重的12%到等外果率的46%。使用亚基因组+上位性模型时,加性遗传比例基本保持不变。最高密度概率区间分析显示,六个不同的亚基因组间互作对总遗传变异的贡献大致平衡。亚基因组+协方差模型结果与亚基因组+上位性模型相似。
4. 模型比较与预测能力
在剔除季节交叉验证中,所有模型和性状的平均预测能力为中等至较高(范围0.37–0.68)。尽管统计上不显著(p = 0.05),但加性+上位性模型、亚基因组模型和亚基因组+上位性模型的预测能力始终等于或高于基准加性模型。亚基因组+上位性模型平均比加性模型预测能力高3%。
在10折交叉验证中,除平均单果重和可溶性固形物含量外,预测能力普遍更高。亚基因组+上位性模型在硬度、市场产量、疫霉冠腐病、炭腐病和白粉病上显著优于其他所有模型(p = 0.05)。在此场景下,亚基因组+上位性模型相对于加性模型将预测能力提高了8%–34%。
仅使用单个亚基因组内核的亚基因组模型,其预测能力相比使用全部四个亚基因组的完整模型显著下降,这凸显了多亚基因组共同建模的必要性。
5. 模型拟合优度
在所有九个表型中,亚基因组+上位性模型的偏差信息准则(Deviance information criterion, DIC)值均为最低,表明其对数据遗传架构的拟合最优。加性+上位性模型的DIC值次之。
讨论
1. 亚基因组显性对表型的影响具有多变性
本研究发现亚基因组贡献在不同表型间差异很大。这与先前小麦转录组研究结果一致,即亚基因组显性具有细胞类型和时间特异性。草莓中某个表型显性的亚基因组有时与已知的主效基因座相关,但并非总是如此。研究结果揭示了草莓亚基因组显性的高度复杂性和表型特异性。这为理解分子水平上(基因含量、表达、表观修饰)观察到的A亚基因组显性,与表型水平上观察到的多样化亚基因组贡献模式之间的关系提供了新的视角。
2. 草莓表型的遗传架构
研究结果表明上位性在草莓中扮演重要角色,这与草莓、甜樱桃和马铃薯等其他作物的研究报道一致。尽管加性遗传方差占主导,但上位性,特别是亚基因组间的上位性,对所有研究的表型均有贡献。然而,由于多基因上位性分析的数学复杂性和对大数据量的要求,未来仍需更大规模的数据集来深入探索。
3. 草莓中的基因组选择
本研究使用的基因组选择训练集规模远超以往报道,使得预测能力平均提高了39%。研究首次报道了针对疫霉冠腐病、炭腐病和炭疽冠腐病的可靠基因组选择预测能力,表明与标记辅助选择相比,基因组选择能解释更多遗传变异并提供更高的遗传增益。
包含上位性和亚基因组效应的基因组选择模型在预测能力和模型拟合度上均一致优于基准加性模型。预测能力的提升幅度与模型估计的上位性比例直接相关。两种交叉验证方案的结果都证实了这些改进的稳健性。在育种计划中,使用包含上位性项的模型能更准确地分解加性和上位性遗传变异,有利于选择具有正向上位性互作的等位基因组合,对于以选择最佳无性系为目标的草莓育种尤为重要。
结论
本研究为理解异源八倍体草莓的亚基因组显性本质提供了新见解。尽管A亚基因组在分子水平上占主导,但在表型水平上,亚基因组的贡献模式高度多样化,且呈现表型依赖性。D亚基因组在所研究性状中贡献的遗传变异始终最少,与其最低的基因含量相符。研究证实上位性对九个草莓表型的复杂遗传架构有重要贡献。最后,本研究强调了基因组选择在草莓育种计划中日益增长的效用。随着训练集的扩大,基因组选择的预测能力持续提高,而能够解析复杂互作(如上位性)的模型也变得更加可行。未来仍需进一步的实证研究,以更好地理解包含亚基因组效应和上位性的基因组选择模型在实际育种中的应用价值。