《Functional & Integrative Genomics》:The reference genome sequence of the scarlet follicle, Sterculia lanceolata, reveals a paleo-polyploidization and its impact on fruit quality and fruit dehiscence
编辑推荐:
为了解决由于基因组资源匮乏而长期制约萍婆(Sterculia lanceolata)遗传研究与育种应用的问题,本研究利用PacBio HiFi和Hi-C等技术,首次构建了该物种染色体级别的高质量参考基因组,揭示了其独立的全基因组加倍(WGD)事件如何驱动果实开裂相关关键基因家族(SHP1/2, FUL, IND, ALC)的扩张,并阐明了该事件对种子营养成分(如淀粉代谢)积累的遗传基础。该基因组为锦葵科进化研究及萍婆分子育种提供了关键资源。
萍婆(Sterculia lanceolata)是一种兼具观赏与药用价值的锦葵科(Malvaceae)树种,在亚洲亚热带地区广泛分布。其根、叶、种子常用于治疗跌打损伤,且种子富含营养。尽管其生态与经济价值显著,但由于缺乏完整的核基因组信息,其关键的农艺性状(如独特的果实开裂方式和种子营养成分积累)背后的遗传机制和进化历史一直是个谜。此前,关于萍婆属的研究多局限于形态描述和转录组测序,这严重阻碍了对其性状分子基础的深入解析。为了填补这一空白,并为锦葵科植物的进化与遗传改良提供新的见解,研究人员开展了此项研究。
本项研究成果已发表在《Functional & Integrative Genomics》期刊上。
为完成此项研究,作者团队运用了几个关键的技术方法。首先,研究材料(叶片、根、茎、功能叶和种子)采集自中国海南省三亚市。研究人员综合利用了PacBio HiFi长读长测序、Illumina短读长测序和Hi-C(高通量染色体构象捕获)技术,进行了染色体级别的基因组组装。利用k-mer分析进行基因组调查。通过整合从头预测、同源比对和转录组证据,完成了基因结构预测与功能注释。此外,通过同义替换率(Ks)分布分析、同线性(Synteny)分析和系统发育分析,揭示了萍婆及其近缘物种的全基因组加倍(WGD)事件和核型进化历程。研究还通过代谢物谱分析了种子发育过程中营养成分的动态变化,并通过系统发育分析鉴定了与果实开裂相关的关键转录因子基因家族。
研究结果
染色体级别基因组组装
研究人员成功构建了萍婆的高质量染色体级别参考基因组。最终组装的基因组大小为602.8 Mb,重叠群N50为29.3 Mb,通过Hi-C技术将绝大部分序列锚定到20条假染色体上,对应于2n=40的二倍体基因组。BUSCO评估显示基因组组装完整性高达98.7%。此外,还成功组装了其叶绿体(160,400 bp)和线粒体(161,707 bp)完整基因组。
重复序列特征与基因组注释
基因组中重复序列占59.59%,其中长末端重复序列(LTR)占40.94%。共注释到35,873个蛋白质编码基因,注释集的BUSCO完整度为96.4%。与近缘物种相比,萍婆具有更多的基因数量。
古老的全基因组加倍塑造进化动力学
通过Ks分布分析,在萍婆基因组中发现了两个显著的峰值:一个在Ks≈1.6处,代表了锦葵科共享的古老多倍化事件;另一个在Ks≈0.3处,代表了萍婆谱系特异的一次近期全基因组加倍(WGD)事件。系统发育分析将萍婆明确置于梧桐亚科(Sterculioideae)内,并揭示了锦葵科内多样的多倍化历史,如榴莲(Durio zibethinus)经历了全基因组三倍化(WGT),而棉花的谱系则经历了全基因组五倍化(WGM)。
染色体重排塑造了萍婆独特的20条染色体
核型进化重建表明,锦葵科的祖先核型可能为n=11。萍婆在经历谱系特异的WGD(理论上形成n=22)后,又经历了一系列复杂的染色体重排,包括相互易位(RTA)、末端连接、断裂和丢失,最终稳定形成其当前的n=20(2n=40)核型。
多倍化驱动种子营养成分动态变化与基因积累
对WGD来源并保留的基因进行功能富集分析发现,“种子发育”和“淀粉代谢过程”相关功能显著富集。代谢物分析证实,随着种子成熟,镁(Mg)、磷(P)、钾(K)等关键矿质元素和总淀粉含量显著增加,而与防御相关的类黄酮含量则急剧下降。这表明WGD事件非随机地保留和扩张了与种子营养积累相关的基因,直接塑造了其种子的高营养价值。
与果实开裂相关基因家族的扩张与机制研究
系统发育分析表明,与果实开裂相关的核心调控基因家族,包括SHP1/2、FUL、IND和ALC,在萍婆基因组中均发生了显著的拷贝数扩张。这些基因在拟南芥模型中构成了一个精细的调控网络:FUL在果瓣中表达并抑制开裂区形成,而SHP1/2则激活下游的IND和ALC,共同促进开裂区的分化和木质化,从而确保果实成熟后沿腹缝线准确开裂。萍婆中这些基因家族的扩张,可能使其获得了更复杂、更精确的果实开裂调控能力。
结论与讨论
本研究首次报道了萍婆染色体级别的高质量参考基因组,填补了梧桐属乃至锦葵科基因组资源的空白。研究核心发现是萍婆经历了一次独立的近期全基因组加倍(WGD)事件,该事件是驱动其关键性状进化的核心动力。
在宏观进化层面,这次WGD及随后的染色体重排(如相互易位、断裂)直接导致了萍婆现代核型(n=20)的形成,揭示了多倍体后基因组二倍化的动态过程。
在性状遗传基础层面,研究创新性地将这次WGD事件与具体经济性状直接关联。研究表明,WGD后保留的基因显著富集于“种子发育”和“淀粉代谢”通路,这从遗传学上解释了萍婆种子为何能高效积累淀粉和矿质元素。同时,控制果实开裂的关键基因家族(SHP1/2, FUL, IND, ALC)也因WGD而大规模扩张,这可能增强了其对果实开裂时机和位置的精确调控能力,确保了种子有效传播。这形成了一个从基因组进化事件,到功能基因集扩张,再到最终有利性状形成的完整证据链。
综上所述,该研究不仅为锦葵科的比较基因组学和进化研究提供了宝贵资源,也为萍婆的分子育种、种质资源利用和药用价值开发奠定了坚实的分子基础。通过阐明WGD如何通过提供遗传原材料来塑造重要农艺性状,本研究为理解其他经济作物的性状进化提供了可借鉴的范式。