
-
生物通官微
陪你抓住生命科技
跳动的脉搏
在Benincasa中首次重新组装线粒体基因组,揭示了葫芦科植物的结构动态和进化特征
《BMC Plant Biology》:De novo assembly of the first mitochondrial genome in Benincasa reveals structural dynamics and evolutionary insights in Cucurbitaceae
【字体: 大 中 小 】 时间:2026年02月12日 来源:BMC Plant Biology 4.8
编辑推荐:
本研究通过Illumina和Nanopore测序完成小冬瓜(Benincasa hispida)完整线粒体基因组组装,揭示其基因组成(72个基因)、RNA编辑位点(488个)及高重复序列(11.6%),进化分析显示COX1和COX3高度保守,NAD4和RPL2呈现正向选择,系统发育地位确定在Cucurbitales类群,与西瓜(Citrullus lanatus)亲缘关系最近,为分子育种和进化研究提供基础。
Benincasa hispida Cogn. var. chieh-qua How,通常被称为小蜡瓜,是一种广泛种植的葫芦科蔬菜,以其丰富的营养价值和药用功效而闻名。然而,由于缺乏关于B. hispida线粒体基因组(mitogenome)的信息,我们对该器官在葫芦科植物中的进化过程了解甚少。本研究通过测序、组装和全面分析B. hispida的完整线粒体基因组,填补了这一知识空白。
我们采用结合了Illumina和Nanopore技术的集成测序方法,对B. hispida的线粒体基因组进行了从头组装(de novo assembly),随后与其近缘物种进行了比较分析。组装得到的线粒体基因组呈线性结构,由18个contig组成,总长度为431,446 bp,GC含量为44.9%。注释结果显示共有72个线粒体基因,包括40个蛋白质编码基因(PCGs)、27个tRNA基因、4个rRNA基因和1个假基因(rps14)。密码子使用分析表明,以A/T结尾的密码子较为常见;同时预测出488个RNA编辑位点,主要为C到U的转换,这可能增强了蛋白质的疏水性和稳定性。研究还观察到大量重复序列元素,包括106个简单序列重复、20个串联重复和643个分散重复,这些重复序列占基因组的11.6%。此外,我们发现了大量来自叶绿体的转移片段,共有56个同源片段,长度达50,189 bp(占线粒体基因组的11.6%)。比较进化分析显示,大多数蛋白质编码基因(PCGs)处于纯化选择(purifying selection)状态,其中cox1和cox3高度保守,而nad4和rpl2则表现出正选择(positive selection)的迹象。对12种葫芦科植物的核苷酸多样性分析证实了序列的普遍保守性,其中rpl5的变异性最高。基于32个来自代表性被子植物的保守线粒体蛋白质编码基因的的系统发育重建将B. hispida牢固地置于葫芦目(Cucurbitales)分支中,表明其与Citrullus lanatus的亲缘关系最为密切。共线性分析进一步支持了这种密切关系,显示它们的线粒体基因组之间存在广泛的同源区域,同时B. hispida还具有一些独特的结构重排。
本研究首次提供了B. hispida的完整线粒体基因组资源,揭示了其结构复杂性、进化动态和系统发育位置。大量的重复序列及频繁的细胞内基因转移在塑造葫芦科植物线粒体基因组的结构和多样性方面发挥了关键作用。这一基因组基础为未来在Benincasa属及更广泛的葫芦科植物中的分子育种、物种鉴定和进化研究奠定了基础。
Benincasa hispida Cogn. var. chieh-qua How,通常被称为小蜡瓜,是一种广泛种植的葫芦科蔬菜,以其丰富的营养价值和药用功效而闻名。然而,由于缺乏关于B. hispida线粒体基因组(mitogenome)的信息,我们对该器官在葫芦科植物中的进化过程了解甚少。本研究通过测序、组装和全面分析B. hispida的完整线粒体基因组,填补了这一知识空白。
我们采用结合了Illumina和Nanopore技术的集成测序方法,对B. hispida的线粒体基因组进行了从头组装(de novo assembly),随后与其近缘物种进行了比较分析。组装得到的线粒体基因组呈线性结构,由18个contig组成,总长度为431,446 bp,GC含量为44.9%。注释结果显示共有72个线粒体基因,包括40个蛋白质编码基因(PCGs)、27个tRNA基因、4个rRNA基因和1个假基因(rps14)。密码子使用分析表明,以A/T结尾的密码子较为常见;同时预测出488个RNA编辑位点,主要为C到U的转换,这可能增强了蛋白质的疏水性和稳定性。研究还观察到大量重复序列元素,包括106个简单序列重复、20个串联重复和643个分散重复,这些重复序列占基因组的11.6%。此外,我们发现了大量来自叶绿体的转移片段,共有56个同源片段,长度达50,189 bp(占线粒体基因组的11.6%)。比较进化分析显示,大多数蛋白质编码基因(PCGs)处于纯化选择状态,其中cox1和cox3高度保守,而nad4和rpl2则表现出正选择(positive selection)的迹象。对12种葫芦科植物的核苷酸多样性分析证实了序列的普遍保守性,其中rpl5的变异性最高。基于32个来自代表性被子植物的保守线粒体蛋白质编码基因的系统发育重建将B. hispida牢固地置于葫芦目(Cucurbitales)分支中,表明其与Citrullus lanatus的亲缘关系最为密切。共线性分析进一步支持了这种密切关系,显示它们的线粒体基因组之间存在广泛的同源区域,同时B. hispida还具有一些独特的结构重排。
本研究首次提供了B. hispida的完整线粒体基因组资源,揭示了其结构复杂性、进化动态和系统发育位置。大量的重复序列及频繁的细胞内基因转移在塑造葫芦科植物线粒体基因组的结构和多样性方面发挥了关键作用。这一基因组基础为未来在Benincasa属及更广泛的葫芦科植物中的分子育种、物种鉴定和进化研究奠定了基础。