Nature:新工具实现更经济的T2T基因组组装

【字体: 时间:2026年06月05日 来源:AAAS

编辑推荐:

  新加坡科技研究局(A*STAR)旗下基因组研究所的研究人员近日开发出一款人工智能工具HERRO,能够更轻松、更经济地生成完整且高质量的基因组组装结果。这项研究成果于近日发表在《Nature》杂志上。

  

端粒到端粒(T2T)的定相组装正逐渐成为参考基因组的基准,但在技术和资金上仍面临挑战。

二倍体和多倍体基因组若要生成此类组装结果,通常需要将高精度的长读数(如PacBio HiFi读数)与超长的纳米孔Simplex读数相结合,但使用多个平台会增加成本及样本量。

新加坡科技研究局(A*STAR)旗下基因组研究所的研究人员近日开发出一款人工智能工具HERRO,能够更轻松、更经济地生成完整且高质量的基因组组装结果。这项研究成果于近日发表在《Nature》杂志上。

HERRO可校正Oxford Nanopore Technologies(ONT)测序仪生成的纳米孔测序读数中的错误。纳米孔测序仪生成的长读长序列有助于研究人员探究基因组中的复杂区域,如重复DNA、着丝粒以及性染色体中的困难区域。

通讯作者、新加坡基因组研究所的Mile Šikić教授表示:“HERRO展示了人工智能如何使超长纳米孔测序读数足够精确,从而构建高质量的完整基因组图谱。这将使全球范围内的完整基因组组装工作变得更简单、具有可扩展性且经济高效。”

在这项研究中,研究团队主要关注ONT Simplex读数,这些读数由单链DNA产生,其错误率往往高于其他一些测序技术。

HERRO利用深度学习来纠正这些读数中的错误,从而克服了这一限制,并将准确率提高了100倍。这使得研究人员能够使用单一的长读长测序平台生成高质量的基因组组装结果,而无需依赖结合多种技术的复杂工作流程。

基因组组装的挑战之一是区分测序错误和真正的生物学差异。这一点至关重要,因为人类是二倍体,这意味着我们携带的大多数染色体都有两份相似但不完全相同的拷贝。如果错误校正工具过于激进,可能会无意中“抹平”两份拷贝之间的真实差异。

HERRO的设计初衷是具备单倍型感知能力,这意味着它能够在提高ONT Simplex读数准确性的同时,保留两个染色体拷贝的遗传差异。这有助于研究人员构建更准确、更完整的基因组组装,同时避免丢失可能具有重要生物学意义的信息。

通过提高纳米孔测序读数的准确性,HERRO可帮助研究人员提升遗传变异的检测能力,包括与遗传病、癌症及其他疾病相关的结构变异。同时,通过减少对多个测序平台、单独样品制备和大样本量的需求,它也能扩大基因组学的应用范围。

通过将HERRO与Verkko组装工具相结合,研究人员成功重建了多达32条染色体的T2T组装结果(包括具有挑战性的X和Y染色体),并在多个人类基因组中实现100 Mb或更高的NGA50值。

研究团队还证明,HERRO能够对多个人类基因组和几种非人类生物体进行高质量的完整基因组组装。这些结果与采用更复杂的多平台方法生成的组装结果相当或更优,但通过更简单的工作流程实现,且对DNA材料的需求更低。

Oxford Nanopore Technologies公司首席科学官Lakmal Jayasinghe博士表示:“通过利用HERRO校正的纳米孔测序读数,我们证明仅凭单一测序技术即可实现高质量的端粒到端粒基因组组装,在保持准确性的同时简化工作流程。”


相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号