《Frontiers in Genetics》:The complete mitochondrial genome of Apis cerana-southern China (Hymenoptera: Apidae) and insights into the phylogenetics
编辑推荐:
本研究采用PacBio HiFi测序技术完成中华蜜蜂(Apis cerana)华南生态型线粒体基因组(16,137 bp)的高精度组装,揭示其高AT偏好性(84.23%)及13个蛋白编码基因(PCGs)的进化保守性。通过13个PCGs的系统发育分析表明华南型与中部型、阿坝型遗传距离最近,为蜜蜂种群遗传资源保护与演化研究提供重要分子标记(mtDNA)和数据支撑。
1 引言
作为重要的传粉昆虫,中华蜜蜂不仅提供生态服务,还是人类健康食品的来源。近年来受气候变化、人类活动和蜂病影响,其种群数量显著下降。线粒体基因组(mtDNA)因其进化速率快、结构简单和信息丰富,成为研究蜜蜂遗传多样性和系统发育的理想分子标记。本研究通过第三代测序技术解析华南生态型中华蜜蜂的线粒体全基因组,为揭示其环境适应机制和种群演化历史提供数据支持。
2 材料与方法
2.1 样本采集与DNA测序
样本采集自广东省汕头市潮南区红场镇(北纬23.31°,东经115.95°),从同一蜂群取50只雄蜂蛹,经乙醇固定后采用PacBio HiFi技术进行测序。
2.2 线粒体基因组组装与注释
使用Hifiasm v0.19.5对核基因组进行初步组装,通过BLAST比对从contigs中筛选线粒体序列。利用MITOS和GeSeq进行基因注释,tRNA二级结构通过MITOS预测并用Adobe Illustrator重绘。
2.3 序列分析
使用BioEdit计算碱基组成和密码子使用偏好,通过CodonW软件分析相对同义密码子使用度(RSCU)。AT偏好性(AT skew)和GC偏好性(GC skew)分别按公式(A-T)/(A+T)和(G-C)/(G+C)计算。
2.4 系统发育分析
将新组装的线粒体基因组(GenBank: PP692293)与15个已发表蜜蜂线粒体基因组进行比较。以意大利蜜蜂(Apis mellifera)两个亚种为外群,使用PhyloSuite软件对13个PCGs进行多序列比对,通过MrBayes和IQ-tree构建系统发育树。
2.5 核基因组中线粒体DNA片段(NUMTs)分析
采用RagTag将核基因组锚定到染色体水平,通过BLASTn评估线粒体与核基因组的共线性。
3 结果
3.1 线粒体基因组结构与碱基组成
华南型中华蜜蜂线粒体基因组全长16,137 bp,包含13个PCGs、22个tRNA基因、2个rRNA基因和1个AT富集区。碱基组成为A(42.41%)、T(41.82%)、C(9.59%)、G(6.18%),AT含量高达84.23%。37个基因中23个位于主要链(J链),14个位于次要链(N链)。多数PCGs以标准起始密码子ATN启动,ND5、ND4等基因存在TTA作为替代起始密码子。
3.2 蛋白编码基因特征
13个PCGs总长11,055 bp,占基因组68.51%。ND5最长(1,668 bp),ATP8最短(162 bp)。除COX1和COX2外,其余PCGs的AT含量均超过80%。密码子使用分析显示TTA(RSCU=3.84)和AGA(RSCU=3.46)偏好性最强,NNA型密码子占比达41.93%。共线性分析表明18个基因组的PCGs排列高度保守(相似性≥0.95),未发现大规模重排。
3.3 rRNA与tRNA基因
大亚基rRNA(lrRNA)和小亚基rRNA(srRNA)长度分别为1,324 bp和773 bp,由trnV基因分隔。22个tRNA总长1,468 bp,除trnS1缺乏二氢尿嘧啶(DHU)臂外,均呈现典型三叶草结构。tRNA长度变异主要集中于trn-Pro和trn-Thr等基因。
3.4 AT富集区
位于srRNA与trnS1之间的AT富集区长818 bp,AT含量达97.43%,为基因组最高区域。AT skew和GC skew均为负值,表明T和C碱基占优。
3.5 系统发育分析
基于13个PCGs构建的系统发育树将中华蜜蜂分为四大支系:台湾群、婆罗洲群、日韩俄群以及中国大陆群。华南型与中部型、阿坝型亲缘关系最近,而滇南型分化时间最早。支持率显示节点稳定性较高(Bootstrap值51-100)。
3.6 NUMTs分布
Circos图谱显示线粒体同源片段分散于核基因组16条染色体,以chr1、chr6和chr15-16分布较多,符合NUMTs的典型特征。
4 讨论
本研究通过高通量测序获得首个华南型中华蜜蜂高质量线粒体基因组。基因排列与昆虫线粒体基因组原始模式一致,未发现重排现象。密码子偏好性和选择压力分析显示13个PCGs均受纯化选择(dN/dS<1),其中ND1、ND3和CYTB的选择约束相对较弱。系统发育结果支持地理隔离对种群分化的影响,尤其以北回归线为界的形态差异显著。AT富集区作为高变区域,在亚种划分和环境适应研究中具有潜力。
5 结论
华南型中华蜜蜂线粒体基因组填补了该生态型分子数据的空白,系统发育分析为东亚蜜蜂种群演化历史提供新证据。建议结合形态学数据开展多组学整合研究,以制定更精准的蜜蜂遗传资源保护策略。