基于ACMG标准的新型CNV致病性自动分类工具Horizon模型评估研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Human Genetics》：Horizon: CNV interpretation through rapid automated ACMG-aligned pathogenicity analysis

【字体：大中小】 时间：2026年02月25日 来源：Human Genetics 3.6

编辑推荐：

　　本研究针对当前拷贝数变异（CNV）致病性临床注释自动化不足的挑战，开发并评估了遵循美国医学遗传学与基因组学学会（ACMG）指南的新型工具Horizon。研究通过包含635个致病性CNV的多个队列验证，证明Horizon在预测致病性上表现优异，总体AUC达0.93，超越了现有主流工具（ClassifyCNV AUC 0.81； AnnotSV AUC 0.85； ISV-CNV AUC 0.84）。尤其擅长分析重复CNV与3–5 Mb大小的CNV。该工具为快速、准确的基因组解读和遗传病诊断提供了强有力的支持，具有重要的临床应用潜力。

拷贝数变异（Copy Number Variations, CNVs）是基因组结构变异（Structural Variations, SVs）中举足轻重的一类，通常指长度大于50个碱基对的DNA片段的缺失或重复。这些变异构成了人类基因组可观的组成部分（约4.8%–9.5%），其影响范围广泛，从良性表型到严重的发育障碍、神经发育疾病乃至癌症都可能与之相关。随着基因组测序技术的飞速发展，我们能够检测到的CNV数量呈爆炸式增长，然而，如何准确解读这些海量数据，判断其致病潜力，并将其应用于临床诊断，却成为了一道横亘在科研与临床之间的“天堑”。

目前，临床实践中主要依据美国医学遗传学与基因组学学会（ACMG）发布的指南对CNV进行分类，将其划分为致病性（Pathogenic）、可能致病性（Likely Pathogenic）、意义不明确（Variant of Unknown Significance, VUS）、可能良性（Likely Benign）和良性（Benign）五个等级。这项工作高度依赖于临床遗传学家的个人专业知识和经验，不仅耗时耗力，而且存在主观判断差异。虽然已有一些自动化工具出现，如遵循ACMG标准的ClassifyCNV和AnnotSV，或基于机器学习的模型如ISV-CNV，但它们或在性能上仍有提升空间，或与临床指南的契合度不足，限制了其在临床实践中的广泛应用。

那么，能否开发一款既严格遵循权威临床指南，又在性能上超越现有工具的自动化CNV解读“利器”呢？这正是发表在《Human Genetics》上的这项研究试图回答的问题。研究团队开发并系统评估了名为“Horizon”的新型CNV分类模型，它旨在通过一种基于排序的算法，整合多个专有数据库和符合ACMG标准的变异遗传模型，实现对CNV致病性的快速、自动且高精度的分析。

为了验证Horizon的实力，研究人员精心构建了三个独立的CNV队列进行“大比武”：一是包含42个经过临床遗传学家严格鉴定并验证的致病性CNV的“发现队列”；二是从已发表文献中系统收集的448个致病性CNV的“文献队列”；三是包含145个新发（de novo）致病性CNV的“新发队列”，总计635个变异。他们将Horizon的表现与三个现有的主流工具——ClassifyCNV、AnnotSV和ISV-CNV进行了头对头的比较。

主要技术方法概述

研究采用了回顾性队列分析的方法。数据来源于已发表的涉及神经发育障碍、罕见病等多种疾病的研究，以及一个特定的临床发现队列。所有CNV均统一至GRCh38/hg38参考基因组。核心评估指标为接收者操作特征曲线（Receiver Operating Characteristic curve, ROC）及曲线下面积（Area Under the Curve, AUC），同时计算了灵敏度、特异度等。Horizon模型本身是一个基于ACMG指南规则的工作流，其输入为包含基因组坐标、CNV类型（缺失/重复）和合子性（杂合/纯合）的文本文件，通过评估变异长度、与致病基因的重叠、人群频率、外显子影响等多个参数进行分类。比较分析中，使用Friedman检验评估不同工具间AUC差异的统计学显著性。

研究结果

•
总体性能卓越

综合所有队列的分析显示，Horizon展现了强大的分类能力，总体AUC达到0.93，显著优于ClassifyCNV（AUC 0.81）、AnnotSV（AUC 0.85）和ISV-CNV（AUC 0.84）。统计检验证实了这种性能差异的显著性。这表明Horizon在整体上具有更优的致病性鉴别能力。
•
在各队列中表现稳定
1. 1.
  发现队列：在这个“金标准”队列中，Horizon取得了最高的AUC（0.96），准确率达0.9611，且未将任何致病性CNV误判为良性。
2. 2.
  文献队列：尽管该队列数据来源复杂，可能存在断点不精确等问题，Horizon仍以AUC 0.75领先于其他工具，并且同样保持了保守性，未将致病性变异降级为良性。
3. 3.
  新发队列：对于新发变异，Horizon的AUC高达0.96，再次证明了其可靠性，尤其是在区分致病性变异方面优势明显。
•
对不同类型和大小CNV的分析
1. 1.
  CNV类型：有趣的是，Horizon在解读重复（Duplication）CNV时表现出色，甚至在发现队列中其AUC（0.98）略高于缺失（Deletion）CNV（0.94）。鉴于重复CNV的致病效应通常更难以预测，这一优势尤为可贵。
2. 2.
  CNV大小：在所有队列中，Horizon对大小在3–5 Mb（兆碱基对）之间的CNV判断最为准确，AUC值最高。对于小于1 Mb的CNV（通常更难解读），其表现也相当稳健。
•
跨疾病表型的一致性

研究还将数据按表型分为神经发育障碍（Neurodevelopmental Disorders, NDD）和罕见病（Rare Disease）两个亚组进行分析。结果显示，Horizon在这两类疾病中均表现稳定，AUC分别达到0.83和0.82，表明其分类能力不受特定疾病类型的限制，具有较好的普适性。

结论与展望

本研究系统评估了Horizon模型这一新型的、完全遵循ACMG指南的CNV自动分类工具。结果表明，Horizon在多个独立数据集上均实现了高精度的致病性预测，其综合性能超越了当前广泛使用的同类工具。其优势主要体现在：1）高精度与稳健性：总体AUC达0.93，在各队列和不同CNV类型中表现稳定；2）保守且可靠：倾向于将证据不足的致病性变异分类为VUS而非错误地降为良性，减少了假阴性风险；3）处理复杂情况的能力：在传统上难以分析的重复CNV和中等大小CNV上表现优异。

这项研究的成功，意味着在临床基因组学中实现快速、标准化CNV解读的目标又迈进了一大步。Horizon模型通过整合全面的基因组特征和严格的临床指南，为遗传诊断提供了一个强有力的辅助工具。它不仅有助于缩短诊断周期，提高诊断准确性，还能减轻临床遗传学家的工作负担，促进基因组数据在精准医疗中的有效转化。当然，研究也指出了当前的一些局限性，例如测试数据来源于不同技术平台可能带来的异质性，以及未深入结合表型数据进行基因型-表型关联分析。未来，通过持续更新和优化其内嵌数据库，并进一步整合临床信息，Horizon有望在基因组诊断领域发挥更核心的作用，推动个性化医疗策略的发展。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号