南非恩古尼山羊高质量染色体级别基因组图谱的构建及其对基因组研究与育种改良的启示

《Scientific Data》:A high-quality chromosome level genome assembly of the South African indigenous Nguni goat (Capra hircus)

【字体: 时间:2026年02月01日 来源:Scientific Data 6.9

编辑推荐:

  本研究针对南非本土恩古尼山羊(Capra hircus)缺乏高质量基因组参考序列的问题,通过整合PacBio HiFi长读长与Illumina NovaSeq Omni-C染色质构象捕获技术,成功构建了染色体级别的高质量基因组组装。该组装总长度为2.85 Gb,包含114个支架和127个contig,N50/L50分别达到97.7 Mb/12和81.34 Mb/12,BUSCO完整性评估达96%,重复序列占比42.86%(LINEs占28.82%),并注释出22,507个基因。该基因组为解析山羊环境适应性遗传机制、提升育种效率及种质资源保护提供了关键数据支撑,成果发表于《Scientific Data》。

  
山羊作为全球重要的畜牧物种,其基因组资源的完善对品种改良、疾病抗性及环境适应性研究具有关键意义。南非本土恩古尼山羊以其小巧体型、多样毛色和卓越的耐逆性著称,是当地社区肉奶生产的重要来源。然而,该品种长期缺乏高质量的基因组参考序列,限制了其遗传潜力挖掘与精准育种策略的制定。为填补这一空白,研究团队通过前沿测序技术构建了恩古尼山羊的高质量基因组图谱,为揭示其独特生物学特征奠定基础。
本研究采用PacBio Sequel IIe平台生成106 Gb的HiFi长读长数据,结合Illumina NovaSeq 6000平台的3亿条Omni-C短读长数据,通过混合组装策略获得染色体级别基因组。组装结果经BUSCO(Benchmarking Universal Single-Copy Orthologs)评估显示96%的基因完整性,重复序列中LINEs(长散在重复序列)占比最高(28.82%),基因注释通过同源预测与转录本支持确认22,507个编码基因。
基因组组装质量评估
通过HiFi与Omni-C数据整合,组装总长2.85 Gb,支架N50达97.7 Mb,contig N50为81.34 Mb,显著优于已有山羊基因组版本。低缺失率(3%)与高连续性表明该组装适用于进化分析与功能基因定位。
重复序列与基因结构特征
重复元件占基因组42.86%,其中LINEs为主导类型(占重复序列的67%)。基因平均长度33,847.2 bp,注释结果包含大量与免疫、代谢及环境适应相关的基因家族,为后续功能研究提供靶点。
本研究提供的恩古尼山羊高质量基因组不仅解决了该品种参考序列缺失的问题,更通过高精度注释为山羊适应性进化、抗病机制解析提供了数据基础。其染色体级别的组装结构有助于育种中标记开发与性状关联分析,推动南非本土山羊资源的可持续利用。该成果的公开将促进全球山羊基因组研究的协作创新,对应对气候变化下的畜牧业挑战具有战略意义。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号