基于PacBio HiFi与Hi-C测序构建的芒苞草染色体水平基因组填补了芒苞草科关键基因组空白,为单子叶植物进化与药用潜能研究提供基础

《Scientific Data》:The chromosome-level genome assembly of the early monocot species Tofieldia thibetica

【字体: 时间:2026年03月22日 来源:Scientific Data 6.9

编辑推荐:

  为解决早期分化的单子叶植物芒苞草缺乏高质量基因组参考这一关键问题,研究人员开展了芒苞草(Tofieldia thibetica) 染色体水平基因组的组装与注释研究。他们利用PacBio HiFi 和Hi-C 测序技术,构建了一个大小为1,641 Mb、重叠群N50达55.66 Mb的高质量基因组,其中1,362 Mb序列被锚定到15条假染色体上。该研究预测了53,411个蛋白质编码基因,并发现重复序列占基因组的79.53%。该基因组填补了芒苞草科的关键基因组空白,为系统发育基因组学、功能研究及开发其药用潜力提供了重要资源。

  
在浩瀚的植物王国中,单子叶植物是一个极为庞大且多样化的类群,包括了我们熟知的禾本科、兰科、棕榈科等重要经济作物。然而,要理清这个庞大类群的进化脉络,了解其祖先形态和早期分化历史,科学家们需要追溯到它们的“根部”——那些在进化树上最早分支出来的物种。芒苞草(Tofieldia thibetica),这种分布于中国西南部的草本植物,正是单子叶植物谱系中最早分化出来的支系之一,其“活化石”般的地位使其成为理解单子叶植物起源与早期性状演化的关键。然而,长期以来,缺乏一个高质量的芒苞草基因组图谱,就像缺少了一张关键的地图,严重阻碍了相关的比较基因组学和进化生物学研究。同时,芒苞草科植物被认为可能具有药用潜力,但缺乏基因组信息使得相关功能基因的挖掘和代谢途径研究举步维艰。为了填补这一关键空白,为单子叶植物进化研究和潜在的生物资源开发提供坚实的数据基础,研究人员开展了一项针对芒苞草的高质量基因组测序与组装工作,并将研究成果发表于《Scientific Data》期刊。
这项研究主要运用了几个关键技术方法:首先是PacBio HiFi 测序技术,用于产生高精度、长读长的原始测序数据,这是构建高质量连续基因组序列的基础。其次,研究人员采用了Hi-C 染色质构象捕获测序技术,此技术能够揭示染色体在三维空间中的相互作用信息,从而将组装好的长片段(contigs)准确地锚定、排序和定向到染色体水平。此外,研究还通过生物信息学流程对组装好的基因组进行了全面的基因注释,包括预测蛋白质编码基因、非编码RNA以及重复序列的分析等。
研究结果
  • 基因组测序、组装与特征分析
    通过整合PacBio HiFi长读长数据和Hi-C测序数据,研究团队成功构建了芒苞草(T. thibetica)的染色体水平参考基因组。最终的基因组组装大小为1,641 Mb(百万碱基对),其组装连续性指标重叠群N50 达到了55.66 Mb,显示出极高的组装质量。利用Hi-C数据,研究人员成功将1,362 Mb的序列锚定并挂载到15条假染色体 上,基本对应于该物种的单倍体染色体数目。进一步的基因组注释工作共预测出53,411个蛋白质编码基因,其中53,075个基因获得了功能注释。对基因组组分的分析揭示了一个显著特征:重复序列 占据了整个基因组的79.53%,这一高比例的重复序列可能是其基因组大小形成和进化的重要驱动力。
  • 比较基因组学与进化分析
    通过将芒苞草的基因组与其他代表性单子叶植物和双子叶植物进行比较,研究人员得以在基因组尺度上追溯其进化地位。系统发育树分析确认了芒苞草位于单子叶植物基部分支 的系统位置,这为研究单子叶植物的祖先基因组特征提供了直接的参考。比较分析还揭示了基因家族的扩张与收缩情况,以及可能存在的全基因组复制 事件线索,这些信息对于理解芒苞草乃至整个单子叶植物类群在进化过程中的适应性创新具有重要意义。
  • 基因家族与功能注释
    对预测出的5万多个蛋白质编码基因进行功能分类和富集分析,可以帮助我们理解芒苞草的基因功能构成。研究分析了与次生代谢产物 合成相关的基因家族,因为这些化合物常常是药用活性的物质基础。该分析为后续深入挖掘芒苞草的药用价值(例如,可能存在的具有生物活性的萜类、生物碱等化合物合成通路)提供了基因层面的“线索地图”。
结论与讨论
本研究成功报道了芒苞草(Tofieldia thibetica)的染色体水平高质量基因组。这个组装大小达1,641 Mb、包含53,411个预测基因的基因组,不仅是该物种的首个染色体级别参考基因组,更重要的是,它填补了在单子叶植物早期分化关键类群——芒苞草科中长期存在的关键基因组数据空白。该基因组的高连续性(N50 > 55 Mb)和高度完整的染色体锚定,使其成为一个极其可靠的研究基础。
这项工作的意义是多方面的。首先,在基础研究层面,芒苞草基因组作为一个关键的“外类群”或“基部参考”,将为整个单子叶植物的系统发育基因组学 研究提供不可或缺的锚点,有助于更精确地解析单子叶植物内部的进化关系、估算分化时间以及推断祖先基因组状态。其次,在功能研究层面,这个详细的基因图谱为探索芒苞草独特的生物学性状、环境适应性以及潜在的药用活性成分生物合成通路 开启了大门。研究人员可以基于此基因组,定位和克隆感兴趣的功能基因,通过比较基因组学发现芒苞草特有的基因家族,从而为天然产物开发和植物改良提供新的遗传资源。
总之,芒苞草高质量基因组的发布,是连接单子叶植物早期进化历史与现代功能基因组学研究的一座重要桥梁。它不仅加深了我们对一个古老植物谱系基因组结构的认识,也为未来从进化生物学到生物技术应用等多个交叉领域的研究提供了强大的数据引擎和全新的起点。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号