《Nature Communications》:Pangenome and resequencing analyses reveal flowering evolution and genetic control in Cerasus
编辑推荐:
李属(Prunus)樱桃亚属(subgenus Cerasus)包含大量具有观赏、食用和药用价值的物种。然而,该类群有限的基因组资源限制了对结构变异(SV)以及关键物候性状遗传基础的系统分析。研究人员在此组装了8个来源于不同樱桃亚属物种的基因组。结合已发表的1
李属(Prunus)樱桃亚属(subgenus Cerasus)包含大量具有观赏、食用和药用价值的物种。然而,该类群有限的基因组资源限制了对结构变异(SV)以及关键物候性状遗传基础的系统分析。研究人员在此组装了8个来源于不同樱桃亚属物种的基因组。结合已发表的13个基因组,构建了由21份材料、代表17个物种的泛基因组。物候学观察显示,不同材料之间开花时间存在显著差异。综合比较基因组学、转录组学和群体遗传学分析,研究结果锁定了开花时间的候选调控因子。研究发现,MADS-box基因AGAMOUS-LIKE 9(AGL9)与开花进程密切相关。异位表达(ectopic expression)与瞬时过表达均表明,PavAGL9可加速休眠解除后的开花进程。进一步结果显示,PavBPC6能够结合PavAGL9启动子并抑制其转录,提示其发挥负调控作用。此外,PavAGL9可与PavSEP1和PavPMADS2发生物理互作,提示其在花器官发育中具有协同作用。该泛基因组资源为樱桃亚属建立了较为完整的基因组研究框架,并为开花进程的调控机制提供了新的认识。
该论文发表于《Nature Communications》,围绕樱桃亚属(Cerasus)的基因组多样性、系统演化以及开花性状遗传调控展开系统研究。樱桃亚属隶属于广义李属(Prunus sensu lato),包含约70个物种,兼具观赏、食用与药用价值,并在欧亚大陆及北美温带地区广泛分布,东亚尤其是中国、日本和朝鲜半岛是其多样性中心。尽管甜樱桃、中国樱桃、酸樱桃等栽培种具有重要经济价值,但该类群长期存在分类争议,传统形态学划分与分子系统发育证据并不完全一致,尤其是若干曾被归入矮生樱桃类群(Microcerasus)的物种在系统位置上仍存分歧。与此同时,樱桃等多年生木本植物基因组杂合度高,既往短读长测序策略难以有效解析插入、缺失、倒位、易位等结构变异(SV),从而限制了对开花时间等复杂农艺性状遗传基础的认识。因此,构建覆盖野生与栽培多样性的高质量泛基因组,并结合群体变异和功能分析解析开花调控网络,成为推进樱桃分子育种和演化研究的重要前提。
研究人员新组装了8个遗传背景多样的樱桃亚属基因组,并整合13个已发表基因组,构建了包含21份材料、覆盖17个物种的樱桃亚属泛基因组CERASUSpan v1.0。在此基础上,研究进一步整合219份樱桃材料的重测序数据,系统绘制SNP、InDel与SV变异图谱,并结合开花物候记录、选择清除分析、全基因组关联分析(GWAS)以及转录组共表达分析,解析开花进程的遗传基础。研究最终鉴定出PavAGL9是与开花进程显著相关的核心候选基因;功能实验证实PavAGL9促进休眠解除后的开花推进,而PavBPC6通过结合PavAGL9启动子抑制其转录,构成上游负调控模块;同时PavAGL9与PavSEP1、PavPMADS2发生蛋白互作,提示其参与MADS-box复合体并可能协同调控花器官发育。总体而言,该研究不仅为樱桃亚属提供了系统性的泛基因组资源,也为理解开花物候演化及其遗传调控提供了重要基础。
在技术方法方面,研究主要采用长读长测序、Hi-C辅助组装和已发表基因组整合构建21份材料的图泛基因组;基于219份樱桃材料既有重测序数据进行SNP、InDel与SV分型、群体结构分析、选择信号扫描和GWAS;对上海统一栽培条件下的21份材料开展开花物候观测,并对P. avium “Tieton”、P. mahaleb、P. pseudocerasus三个代表性物种在2024生长季三个时间点采集花芽样本进行RNA-seq和WGCNA分析;随后结合qRT-PCR、瞬时过表达、拟南芥稳定转化、Y1H、EMSA、Dual-LUC、Y2H、BiFC和Co-IP等实验开展候选基因功能验证。
研究结果首先体现在“The pangenome reference for Cerasus (CERASUSpan v1.0)”部分。研究人员对8个樱桃亚属物种完成了de novo基因组组装,其中包括二倍体和四倍体材料,组装连续性、大小与质量评估均达到较高水平,并利用Hi-C锚定到8条拟染色体。随后将其与13个已发表基因组整合,形成覆盖17个物种的21份材料泛基因组。基于310个单拷贝直系同源基因构建的系统树显示,在食用樱桃中,P. avium与P. pseudocerasus的亲缘关系远于其与P. cerasus。转座元件(TE)注释表明,不同基因组中TE总长度差异明显,长末端重复转座子(LTR)是最主要组分,且其扩张与基因组大小显著相关。泛基因组模拟结果显示,纳入超过17个基因组后泛基因组趋于稳定,核心基因家族在超过19个基因组后趋于稳定。研究共将基因家族划分为核心、软核心、可缺失和私有四类,提示樱桃亚属既存在高度保守的基因组骨架,也具有丰富的可变基因成分。通过与P. avium “Tieton”参考基因组比较,共鉴定出大量SV,主要为缺失和插入,且不同类型SV沿染色体分布不均:缺失多位于染色体臂,插入则更集中于着丝粒附近并与高LTR密度区域重合。图泛基因组的建立进一步增强了对多单倍型和复杂结构变异的表征能力。
在“Variations in the blooming phenophase of the Cerasus species”部分,研究人员在中国上海统一环境条件下对21份樱桃亚属材料开展物候观测,发现不同材料之间开花时间差异显著,其中P. cerasoides、P. campanulata和P. pseudocerasus开花较早。为厘清系统发育背景,研究基于单拷贝直系同源基因构建了扩展系统树,结果表明P. humilis、P. tianshanica和P. tomentosa等传统Microcerasus类群物种与Prunophora更接近,而非形成樱桃亚属内部的单系群,这为相关分类争议提供了基因组证据。研究进一步鉴定出411个与开花相关的直系同源基因家族,PAV分析虽显示部分物种缺失较多开花相关基因,但缺失模式与开花时间并无显著相关性,说明基因存在/缺失并非决定开花时间差异的主要因素。结合三个代表物种在三个时间点的RNA-seq数据和加权基因共表达网络分析(WGCNA),研究从与花发育高度相关的模块中筛选出跨物种候选基因,并通过与拟南芥(A. thaliana)同源基因映射比较,最终发现AGAMOUS-LIKE 9(AGL9)在早花和晚花物种之间呈现最显著的表达差异。
在“Genetic diversity and population structure analysis of Cerasus”部分,研究人员利用已发表重测序数据,构建了219份樱桃材料的高分辨率变异图谱,共获得853,236个SNP、217,080个InDel和4283个高可信SV,并通过PCR对随机抽取的15个SV全部完成实验验证,支持其可靠性。基于SV的系统树将219份材料划分为5个主要簇,但无论是SV、SNP还是InDel构建的系统关系,都与开花物候分组不呈明显对应关系。主成分分析(PCA)和ADMIXTURE分析显示群体分化较弱、混合祖先成分普遍存在,这与甜樱桃长期克隆繁殖及群体间遗传分化有限相一致。尽管中性遗传结构较浅,这一材料群体仍可为后续开花性状解析提供有效基础。
在“Selection signature analysis of the blooming phenophase”部分,研究围绕219份材料的盛花期表型开展选择信号分析。研究将材料按开花时间初步分组,并保留早花、中花和晚花三个极端类别用于比较,以增强表型对比和统计效能。F
ST分析表明,早花与晚花比较具有最强遗传分化。进一步结合核苷酸多样性(π)与F
ST的联合筛选,研究在不同比较组合中鉴定出多个SNP、InDel和SV候选区段及其关联基因。GO富集分析显示,这些基因涉及DNA解旋酶活性、液泡膜、谷胱甘肽转移酶活性和泛素连接酶复合体等功能,提示染色质调控、氧化还原稳态、蛋白降解与胁迫应答过程可能参与开花调控。值得注意的是,在区分早花与晚花的SNP候选区段中,chr7:28.1–28.15 Mb区间具有最高π比值,其中一个位于PAV07G053280和PAV07G053290上游的SNP与GWAS信号重叠。PAV07G053290编码核孔复合体蛋白NUP205,已知可通过昼夜节律途径影响开花。与此同时,PAV01G05220(PavAGL9)在所有基于SNP的比较中都表现出较强选择信号。此外,PavGA2ox8、PavCSTF77、PavDCL3、PavARP6、PavGAI/RGA和PavCOP1等多个与开花调控相关的基因也被选择信号和GWAS提示,说明樱桃开花时间具有多层级、由编码变异和顺式调控变异共同塑造的遗传架构。
在“Functional analysis of PavAGL9 associated with flowering progression”部分,研究将PavAGL9确立为开花进程关键候选因子。表达分析显示,PavAGL9在花芽形成和休眠解除后开花推进阶段显著上调,且这一表达趋势在多个樱桃亚属物种中较为一致。亚细胞定位实验表明PavAGL9定位于细胞核,符合其作为转录因子的功能特征。在拟南芥中过表达PavAGL9可使植株早花,并上调AtFT表达;在已满足低温需求(chilling requirement)的甜樱桃花芽中瞬时过表达PavAGL9同样促进提早开花,并显著上调PavFT与PavAP1表达。这些结果共同说明,PavAGL9主要参与休眠解除后的开花推进,而非休眠解除本身。
在“PavBPC6 binds the PavAGL9 promoter and represses its transcription to modulate flowering progression”部分,研究聚焦PavAGL9的上游调控。研究人员首先利用PlantRegMap预测74个候选转录因子,再结合共表达网络分析锁定与PavAGL9表达相关性最强的PavBPC6。酵母单杂交(Y1H)证实PavBPC6可直接结合PavAGL9启动子;基序分析与电泳迁移率变动分析(EMSA)进一步表明,该结合位点对应启动子中的非典型GAGA基序。双荧光素酶(Dual-LUC)实验显示,PavBPC6显著抑制PavAGL9启动子活性;在甜樱桃花芽中的瞬时过表达则导致开花延迟并伴随PavAGL9转录水平下降。由此可见,PavBPC6是PavAGL9的直接转录抑制因子,参与甜樱桃开花进程的负调控。跨物种序列比较还发现,该结合基序在樱桃亚属多数物种中保守,而在P. tianshanica和P. humilis中缺失,提示该调控模块在樱桃亚属内部具有较强保守性,但在Microcerasus相关谱系中发生了分化。
在“PavAGL9 physically interacts with PavSEP1 and PavPMADS2”部分,研究进一步分析PavAGL9在MADS-box蛋白复合体中的作用。酵母双杂交(Y2H)结果显示,PavAGL9能够与PavSEP1和PavPMADS2直接互作;双分子荧光互补(BiFC)与免疫共沉淀(Co-IP)实验在植物体内进一步验证了这些蛋白互作关系。由于SEP和AP1/FUL类MADS-box蛋白通常参与花器官命运决定与花发育程序,这些结果支持PavAGL9作为蛋白复合体组分参与花器官发育相关调控。
讨论部分强调了本研究在资源建设和机制解析两方面的意义。首先,属级泛基因组较物种级泛基因组更能覆盖广泛序列变异与旁系同源基因分化,为复杂演化关系和性状解析提供框架。该研究借助21个基因组的比较分析,澄清了樱桃亚属内部若干稳定支系,并指出部分传统Microcerasus物种并不构成樱桃亚属内单系群,从而为传统分类与基因组证据的衔接提供了依据。其次,研究虽已识别大量SV及其潜在性状关联,但作者也指出目前样本尚未完全覆盖中国野生樱桃亚属的全部序列多样性;同时,虽然开花表型在统一环境下记录,来自差异原生生境的材料仍可能存在残余表型可塑性,因此GWAS和选择信号仍需谨慎解释。对于PavAGL9,研究认为其功能更偏向休眠解除后开花推进,而非休眠解除的初始控制;但在甜樱桃中开展稳定遗传转化和跨物种调控验证仍具有技术难度,因此部分保守性推断仍有待进一步实验支持。总体上,该研究显著扩展了樱桃亚属的基因组资源,为开花生物学研究、功能基因发掘和未来分子育种奠定了基础。
结论部分可概括翻译为:本研究通过构建覆盖17个物种、21份材料的樱桃亚属泛基因组,建立了系统解析该类群基因组多样性、系统演化与开花调控的研究框架。综合群体遗传学、比较基因组学与转录组学证据,PavAGL9被鉴定为与开花进程密切相关的关键基因。功能实验证明PavAGL9可促进休眠解除后的开花推进,而PavBPC6通过直接结合其启动子并抑制转录发挥负调控作用;同时PavAGL9与PavSEP1、PavPMADS2的物理互作提示其参与花器官发育相关MADS-box蛋白复合体。该研究不仅加深了对樱桃亚属开花演化和遗传调控的理解,也为后续分子育种和基因组辅助改良提供了重要资源。