《Plants》:Genome-Wide Association Study of Yield-Related Traits and Photoperiod Response in Rice
Ziming Zang,
Chang Liu,
Zhaoqin Wang,
Cheng Fan and
Juncong Chen
编辑推荐:
本综述系统综述了利用全基因组关联研究(GWAS)结合新型混合线性模型(Fast3VmrMLM)解析水稻产量相关性状遗传基础的最新进展。研究通过对529份水稻种质资源进行高密度SNP扫描,定位了141个显著的数量性状核苷酸(QTNs),并整合光周期胁迫下的差异表达与功能富集分析,筛选出182个光周期响应候选基因。研究特别关注小效应位点的检测,揭示了光周期通过调控多效性基因网络影响产量形成的潜在机制,为水稻高产精准分子育种提供了关键候选基因资源。
材料与方法
本研究选取了529份亚洲栽培稻种质资源构成遗传多样性群体,涵盖籼稻、粳稻和Aus型等多个亚种。全基因组重测序产生了约67亿条高质量读数,经质量控制与基因型填充后获得4,945,006个高质量单核苷酸多态性(SNPs)用于后续分析。研究针对10个关键产量相关性状进行表型数据收集与统计分析,包括抽穗期(HD)、株高(PH)、穗数(NP)、有效穗数(NEP)、单株产量(Y)、小穗长度(SL)、粒长(GL)、粒宽(GW1)、粒重(GW2)和粒厚(GT)。为揭示性状间关联,研究进行了皮尔逊相关性分析并绘制了成对相关性图谱。
全基因组关联分析采用整合了全基因组扫描与机器学习的两阶段压缩混合模型Fast3VmrMLM进行,显著性阈值设定为LOD值≥3.0。为对比,同时使用了IIIVmrMLM方法。利用连锁不平衡衰减图确定候选基因筛选区间,并在中国水稻数据中心进行基因注释以识别已知基因。为挖掘光周期响应基因,研究对GEO数据集GSE163030进行了差异表达分析,筛选标准为|log2FoldChange| > 1且错误发现率校正后p值<0.05。通过agriGO v2.0进行基因本体(GO)功能富集分析。通过Ensembl Plants进行拟南芥同源基因比对,并使用geneHapR软件包进行单倍型与表型差异分析以验证候选基因。
结果
表型统计分析显示,单株产量变异系数最高(0.45),其次为穗数与有效穗数(均为0.43),粒厚变异最小(0.07)。相关性分析揭示有效穗数与穗数几乎完全正相关(r = 0.99),两者均与单株产量显著正相关。
关联分析方面,Fast3VmrMLM方法检测到141个与目标性状相关的显著QTNs,其中47个为表型变异解释率(PVE)低于1%的小效应位点,占总QTNs的33%,其累积贡献率达33.48%。相比之下,IIIVmrMLM仅检测到69个QTNs,且未能检测到PVE<1%的位点。例如,在粒宽(GW1)性状中检测到23个显著QTNs,其中16个为小效应位点;在粒重(GW2)性状中检测到5个显著QTNs。研究发现多个QTNs同时与多个性状关联,表现出多效性潜力。
基于连锁不平衡衰减阈值(200 kb窗口),在141个显著QTNs附近共定位到92个先前已验证的水稻产量相关基因。其中,21、13、14和14个已知基因分别与株高、有效穗数、粒宽和粒厚相关。研究发现了多个已知基因簇,例如染色体3上vg0303116237位点附近的四个基因(LOC_Os03g06120、LOC_Os03g06139、LOC_Os03g06240、LOC_Os03g06410)均与产量性状相关。基因LOC_Os05g09520同时与粒长、粒厚和粒宽相关,而LOC_Os02g01590和LOC_Os09g10960则同时与穗数和有效穗数相关,提示这些基因可能具有多效性。
通过差异表达分析,从3855个未报道基因中鉴定出360个光周期响应差异表达基因(DEGs)。GO富集分析进一步从中筛选出182个基因,它们显著富集于六个与生物过程相关的GO条目中。
基因表达分析显示,许多基因的表达模式在长日照(LD)与短日照(SD)处理间存在差异。例如,与粒长和粒宽相关的基因LOC_Os11g45610在LD处理下08:00时表达变化显著,而在SD下同一时间点变化微弱。与穗数相关的基因LOC_Os04g48290和LOC_Os04g48350在LD下12:00时表达响应强烈,在SD下则无此现象。同时,同一光周期处理下不同时间点的基因表达也存在动态变化。
通过与拟南芥基因进行同源性比对,从182个候选基因中筛选出62个具有显著同源性的基因,并最终确定了6个高置信度的多效性候选基因:LOC_Os02g02210、LOC_Os05g09640、LOC_Os09g12590、LOC_Os11g37700、LOC_Os11g45720和LOC_Os11g45730。
对候选基因LOC_Os02g02210进行的单倍型分析将529个自交系划分为9种单倍型。t检验表明,在不同光周期下,单倍型001与002在产量性状上存在极显著差异,单倍型003与006在产量性状上、单倍型001与002及002与005在粒宽性状上均存在显著差异,证实了该基因与产量相关性状的密切关联。
讨论
与传统单基因GWAS方法相比,Fast3VmrMLM模型在检测小遗传效应QTNs方面展现出显著优势。研究不仅检测到多个已知产量相关基因簇,还通过单倍型-表型关联分析揭示了六个具有多效性潜力的关键候选基因。整合GWAS与转录组数据为候选基因预测提供了互补证据,凸显了多组学策略在基因挖掘中的价值。光周期作为核心环境变量,可能通过调控这些基因的表达时序与水平来影响最终产量性状。例如,LOC_Os05g09640对短日照胁迫更为敏感,而LOC_Os02g02210对光周期响应强烈,可能在粒宽和产量相关性状中发挥重要调控作用。小效应基因虽个体对表型变异的解释力有限,但其通过多效性网络产生的累积或互作效应对于复杂数量性状的形成具有不可忽视的贡献。
结论
本研究利用整合了全基因组扫描与机器学习的压缩混合模型Fast3VmrMLM,成功检测到与水稻产量相关性状关联的141个QTNs,并在其附近定位到92个已知产量相关基因。通过差异表达与GO功能富集分析鉴定出182个光周期响应候选基因。经由组织特异性表达分析、拟南芥同源基因比对及单倍型-表型差异分析,最终确认了LOC_Os02g02210等六个多效性候选基因。这些发现强调了小效应位点的重要性,并提示了光周期调控与水稻产量相关基因表达之间的潜在关联,为深入解析水稻产量遗传机制及开展精准分子育种提供了宝贵的候选基因资源。