《Genes》:Identification of Candidate Gene Controlling Soluble Sugar Degradation During Postharvest Storage of Sweet Corn Based on BSA-Seq
Mengyun Ren,
Meixing Wang,
Dong Wang,
Yifeng Huang and
Longgang Du
编辑推荐:
这篇研究论文并非综述,而是原创性研究。它系统探究了猪饲料效率相关性状(包括达100kg日龄(DAYS_100)、100kg背膘厚(BFT_100)和30-100kg阶段饲料转化率(FCR_30_100))的遗传参数和遗传结构。研究利用1301头约克夏猪的高密度基因型数据,通过全基因组关联研究(GWAS)鉴定出多个与性状显著相关的数量性状位点(QTL)和候选基因(如ETV4、CAMK1D等),功能富集分析提示这些基因在胆汁酸代谢、蛋白质泛素化等生物学过程中发挥重要作用。该研究为理解猪饲料效率的遗传机制提供了新见解,有助于指导猪的遗传改良。
猪是全球最重要的肉类生产家畜之一。在养猪生产中,饲料成本约占总成本的65%。因此,提高饲料效率是猪育种计划的主要目标。关键的生长性状,如达到目标体重的日数(DAYS)和背膘厚(BFT),由于易于测量,通常被用来评估猪的生产性能。此外,饲料转化率(FCR)是衡量饲料效率的关键指标,定义为每单位增重所消耗的饲料量。较低的FCR不仅能降低生产成本,还能减少氮磷排泄,有利于环境可持续性。然而,大规模个体采食量的表型记录一直具有挑战性,限制了FCR的遗传评估。近年来,自动化饲喂系统的进步使得能够对个体采食量进行精确、高通量的测量,为解析猪饲料效率的遗传结构提供了机会。
1. 引言
复杂性状的遗传参数是理解其遗传性质的基础。先前研究表明,饲料效率性状与生长性状、体构性状、繁殖性状等存在遗传相关,表明FCR与其他复杂性状之间的遗传联系。全基因组关联研究(GWAS)为揭示人类和家畜复杂性状与疾病的遗传结构提供了机会。例如,先前研究发现了几个与猪饲料效率性状相关的基因组区域。然而,这些研究仅使用低覆盖度数据来探索猪饲料效率性状的遗传基础。基因型填充策略为提高基因型数据的基因组覆盖度和识别与复杂性状相关的潜在致病变异提供了机会。这些研究为探索猪饲料效率相关性状的遗传结构提供了全面视角。因此,为了阐明猪饲料效率相关性状的遗传基础,本研究收集了1301头具有基因型的约克夏猪的三个饲料效率相关性状数据。首先,我们估计了这些性状的遗传参数,包括遗传力和遗传相关。随后,我们进行了GWAS以探究其遗传基础。最后,为了探究候选基因的潜在功能,我们对GWAS信号的候选基因进行了注释和功能富集分析。
2. 材料与方法
2.1. 群体与数据
我们收集了一个约克夏育种群体,包括来自福建光华百斯特有限公司的1301头母猪。所有母猪在统一的营养和管理条件下饲养。所有母猪均饲喂至体重达到约100公斤。所有猪只分组饲养,配备奥斯本采食记录设备系统。该系统利用射频识别(RFID)通过电子耳标进行个体识别,并精确记录试验期间的个体采食量。采食数据由系统自动收集,用于后续计算饲料转化率(FCR)。基础日粮主要以玉米和豆粕组成,旨在满足NRC(2012)推荐的营养需求。所有猪只在试验期间饲喂相同的日粮。
从每头试验猪的耳组织中采集样本。采集后,样品置于含有70%乙醇的离心管中保存。对于基因型数据,共有1301头猪使用“中兴一号”50K SNP芯片进行基因分型,获得了45,073个单核苷酸多态性(SNP)。为确保基因型质量,我们使用plink v1.90进行了质量控制。质量控制后,基于猪基因组参考面板,使用Beagle v5.1将基因型从50K填充至全基因组序列(WGS)分辨率。之后,我们过滤掉了具有多重等位基因、剂量R平方小于0.8或次要等位基因频率小于0.01的低质量SNP。最终,保留了10,401,626个SNP用于下游分析。
对于表型数据,我们收集了三个表型,包括达100kg日龄(DAYS_100)、100kg背膘厚(BFT_100)和30-100kg阶段饲料转化率(FCR_30_100)。DAYS_100定义为从出生到体重达到100kg所需的天数。BFT_100是在体重达到100kg时,通过超声波测量倒数第三和第四肋骨之间的位置获得的。FCR_30_100在30kg至100kg阶段评估。对于每个性状,排除了超过3个标准差的生理上不合理的记录。
2.2. 遗传参数估计
为了研究这些生长性状的遗传参数,我们使用GCTA v1.94.1估算了狭义遗传力(h2)。此外,我们使用双变量线性混合模型来计算这些生长性状之间的遗传相关。线性混合模型如下:
?? = ???? + ???? + ??
其中??是表型记录向量。b是固定效应,包括年份和季节。??~N(0, Gσg2)是加性遗传效应。G是基因组关系矩阵,σg2是加性遗传方差。??~N(0, Iσe2)是残差效应。I是单位矩阵,σe2是残差方差。??和??分别是固定效应b和加性遗传效应??的设计矩阵。
2.3. 全基因组关联研究(GWAS)
我们使用GCTA v1.94.1对每个生长性状进行了全基因组关联研究。线性混合模型如下:
?? = ????β??+ ???? + ???? + ??
其中??是表型记录向量。????是SNP ??的平均中心化基因型向量,编码为0、1和2。β??是SNP ??的效应大小。b是固定效应,包括年份和季节。??~N(0, Gσg2)是加性遗传效应。G是基因组关系矩阵,σg2是加性遗传方差。??~N(0, Iσe2)是残差效应。I是单位矩阵,σe2是残差方差。??和??分别是固定效应b和加性遗传效应??的设计矩阵。我们设定p < 5 × 10?4为显著阈值以获得显著SNP。
2.4. 条件分析
为了获得这些生长性状的独立SNP,我们使用GCTA v1.94.1的COJO模块,基于每个性状的GWAS汇总统计量进行了条件分析。我们使用基因型数据作为连锁不平衡(LD)参考面板。对于独立变异,我们进行了变异效应预测,以通过Ensembl接口预测变异功能位置。
2.5. 候选基因与功能注释
我们基于独立SNP定义了数量性状位点(QTL)。我们将独立SNP上下游1Mb的区域定义为QTL。位于QTL区域的候选基因基于猪基因组注释(Sus scrofa 11.1)使用BEDtools v2.31.1进行注释。使用DAVID对候选基因进行基因本体(GO)富集分析和京都基因与基因组百科全书(KEGG)通路分析。
3. 结果
3.1. 三个性状的表型摘要与遗传参数
表型记录的摘要统计显示,表型数据的分布基本符合正态分布。此外,我们发现FCR_30_100的平均值为2.29 ± 0.23,表明该群体的饲料效率相对中等。为了研究这些生长性状的遗传参数,我们估算了这些性状的狭义遗传力。DAYS_100、BFT_100和FCR_30_100的遗传力分别为0.25 ± 0.04、0.40 ± 0.05和0.23 ± 0.04,表明这些生长性状具有中等到高度的遗传力。为了进一步探究这些性状之间的遗传关系,我们估算了这些性状之间的遗传相关和表型相关。我们发现这些性状之间的遗传相关为正。同时,BFT_100和DAYS_100具有微弱的负遗传相关(?0.01 ± 0.12)。此外,我们发现性状FCR_30_100与DAYS_100(0.51 ± 0.11)和BFT_100(0.28 ± 0.12)呈正遗传相关,表明这些性状之间存在中等到高度的相关。
3.2. 三个生长性状的全基因组关联研究(GWAS)
为了鉴定与三个生长性状相关的SNP,我们对每个性状进行了GWAS。总共,我们鉴定出114、90和5个SNP分别与BFT_100、DAYS_100和FCR_30_100显著相关。经过条件分析后,分别有7、5和4个SNP独立地与BFT_100、DAYS_100和FCR_30_100相关。
此外,为了鉴定独立SNP的候选基因,我们注释了每个QTL的最近基因,发现了几个与生长性状相关的候选基因。例如,最近基因ETV4与12号染色体上的DAYS_100显著相关。最近基因CAMK1D与10号染色体上的BFT_100显著相关。此外,我们发现了一些与三个生长性状相关的新基因。例如,未注释的候选基因ENSSSCG00000045751与3号染色体上的FCR_30_100相关。未注释的候选基因ENSSSCG00000026302与BFT_100相关。总之,全基因组关联研究发现了几种与饲料转化率和生长性状相关的候选基因。
3.3. 候选基因的功能注释富集
为了鉴定三个生长性状的候选基因,我们为每个独立SNP定义了数量性状位点(QTL),并注释了候选基因列表。之后,我们对每个性状的候选基因进行了功能注释。我们发现BFT_100的候选基因在生物过程和免疫通路中富集,如蛋白质成熟、氧化还原酶活性的负调控和细胞毒性T细胞焦亡,表明免疫过程与背膘形成之间存在潜在联系。此外,DAYS_100的候选基因在翻译和微绒毛膜术语中富集,代表了基础生物过程在生长中的重要性。值得注意的是,我们发现FCR_30_100的候选基因在胆汁酸代谢过程和蛋白质泛素化术语中富集,表明能量代谢在猪饲料转化过程中的重要性。总之,与饲料效率相关性状相关的候选基因在重要的生物过程中发挥着至关重要的作用。
4. 讨论
在本研究中,我们系统地探索了饲料效率相关性状的遗传参数。结果表明,这些饲料效率相关性状具有中等到高度的遗传力。D. N. Do等人发现约克夏猪的剩余采食量(RFI)遗传力为0.39,且与FCR存在高度的遗传相关(从0.76到0.99),表明RFI和FCR之间存在高度的遗传联系。最近的一项研究发现,饲料效率相关性状的遗传力范围在0.13到0.36之间。此外,我们研究了FCR_30_100、DAYS_100和BFT_100之间的遗传相关。其中,DAYS_100和BFT_100显示出较低的遗传相关。在本研究中,我们发现FCR与DAYS_100(0.51 ± 0.11)和BFT_100(0.28 ± 0.12)呈中度相关。Tusingwiire等人显示日采食量与重要经济性状之间存在低到中度的遗传相关(范围从0.04到0.29)。Coyne等人也发现猪的体重与饲料效率呈正相关。这些结果表明FCR与关键生长性状之间存在中到高度的联系。
我们进一步利用GWAS探索了饲料效率相关性状的遗传结构。在本研究中,我们发现了一系列与饲料效率相关性状相关的候选基因。例如,候选基因ETV4与12号染色体上的DAYS_100显著相关,该基因与脂肪沉积有关,支持了该基因与DAYS_100之间的联系。此外,候选基因CAMK1D与BFT_100显著相关。先前研究也发现,CAMK1D作为2型糖尿病的遗传热点,可能与采食激活和代谢调节有关。此外,FCR的GWAS发现,新的候选基因ENSSSCG00000045751与FCR_30_100相关,这表明其对饲料效率的潜在调节作用。一项荟萃分析系统地鉴定了与饲料效率性状相关的候选基因,强调MED18、PHACTR4和ABCC2基因是FCR的有力候选基因。另外,功能富集分析显示,与饲料效率及饲料效率相关性状相关的候选基因高度富集于生物分子的生物合成、消化和代谢过程。在本研究中,FCR_30_100的候选基因也与胆汁酸代谢过程和蛋白质泛素化术语相关,表明了这些候选基因的潜在功能。
在本研究中,我们调查了饲料效率相关性状的遗传参数和遗传基础。首先,我们调查了饲料效率相关性状的遗传参数,这为了解这些性状的遗传特性提供了全面的见解。此外,与先前研究相比,本研究利用填充后的基因型数据进行GWAS,部分提高了与饲料效率相关性状相关的SNP的发现率。再者,本研究调查了每个性状候选基因的潜在生物学功能,发现候选基因在能量代谢过程中发挥着至关重要的作用。这些结果有助于我们理解饲料效率相关性状的遗传基础。实际上,除了遗传影响外,环境因素也会影响饲料效率相关性状。例如,肠道微生物组的组成与饲料效率相关,这表明微生物群落对塑造宿主生产参数有贡献。此外,本研究缺乏对候选基因的实验验证。另外,多组学数据为理解复杂性状背后的潜在遗传调控提供了全面的见解。因此,未来的研究可能需要考虑环境的影响,整合多组学数据,并对候选基因进行实验验证。
5. 结论
本研究揭示了饲料效率相关性状的遗传基础。候选基因,如DAYS_100中的ETV4基因、BFT_100的CAMK1D基因和FCR_30_100的ENSSSCG00000045751基因,可用于进一步研究。