编辑推荐:
本研究针对斑鳜(Siniperca obscura)基因组资源匮乏的问题,通过整合PacBio HiFi长读长测序与Hi-C染色体构象捕获技术,成功构建了高质量的染色体级别参考基因组。该组装序列长达734.12 Mb,24条染色体锚定率达99.85%,包含23,225个预测基因,为鱼类进化研究和分子育种提供了重要资源。
在中国淡水生态系统中,斑鳜(Siniperca obscura)作为重要的经济鱼类和生态指示物种,其种群资源保护与良种选育工作一直备受关注。然而,由于缺乏高质量的参考基因组,该物种的遗传改良和进化研究长期处于滞后状态。基因组资源的缺失如同"基因黑箱",使得科研人员难以深入解析其生长、抗病等重要性状的分子机制,也制约了与其他鲈形目鱼类的比较基因组学研究。
为打破这一困境,研究团队采用第三代PacBio HiFi(高保真)长读长测序技术结合Hi-C(高通量染色体构象捕获)三维基因组学技术,成功构建了斑鳜染色体级别基因组图谱。该基因组组装大小为734.12 Mb,其中99.85%的序列被精准锚定到24条染色体上,contig N50(重叠群连续长度指标)达到24.59 Mb,scaffold N50(支架连续长度指标)高达30.62 Mb。通过BUSCO(基准通用单拷贝同源基因)评估显示基因组完整性达99.37%,证实组装质量达到国际领先水平。
在基因注释方面,研究共预测出23,225个蛋白编码基因,其中98.50%的基因获得功能注释,BUSCO评估基因集完整性达99.12%。特别值得注意的是,基因组中重复序列占比为30.54%,这一发现为解析鱼类基因组进化提供了新线索。该研究成果已发表于《Scientific Data》期刊,为鲈形目鱼类进化生物学研究和分子育种实践提供了关键数据支撑。
关键技术方法:
研究通过PacBio HiFi长读长测序获取高质量原始数据,利用Hi-C技术进行染色体层级 Scaffolding(支架构建),采用从头预测与同源比对相结合的策略进行基因注释,使用RepeatModeler软件进行重复序列分析,并通过BUSCO评估体系验证基因组完整性。所有分析均基于斑鳜野生个体样本开展。
基因组特征分析
通过K-mer(K-核苷酸序列)频谱分析显示基因组大小约为734 Mb,杂合度为0.35%,表明该物种为二倍体生物。使用Hi-C技术将99.85%的序列锚定至24条染色体,与细胞遗传学观察结果一致。组装连续性指标contig N50(24.59 Mb)和scaffold N50(30.62 Mb)均显著优于已报道的近缘物种。
重复序列注释
采用de novo(从头预测)和同源搜索相结合的方法,共鉴定出30.54%的重复序列,其中转座子(Transposable elements)占比最高(21.83%)。长末端重复序列(LTR)是主要的转座子类型,这一特征与其它硬骨鱼类基因组相似。
基因结构注释
整合转录组证据和同源比对,共预测23,225个蛋白编码基因,平均基因长度为15.23 kb。外显子-内含子结构分析显示平均每个基因包含8.7个外显子,与其它硬骨鱼类基因结构特征相符。通过InterPro(蛋白质家族数据库)和KEGG(京都基因与基因组百科全书)等数据库注释,98.50%的基因获得功能注释。
比较基因组学分析
与大口黑鲈、尼罗罗非鱼等近缘物种的比较显示,斑鳜具有24个保守的染色体片段,但在3号染色体发现一个物种特异的染色体重排事件。正选择分析鉴定出86个快速进化基因,主要富集在免疫应答和环境适应相关通路。
研究结论与讨论:
本研究成功构建了首个高质量的斑鳜染色体级别参考基因组,填补了该物种基因组资源的空白。基因组的高连续性和完整基因为功能基因组学研究奠定了坚实基础。比较基因组学分析揭示了鲈形目鱼类染色体进化规律,正选择基因的鉴定为理解斑鳜环境适应性提供了分子证据。该基因组资源将显著促进鱼类遗传育种、物种保护进化生物学研究的发展。