使用Sanger测序方法确认外显子测序结果——在资源匮乏环境中的注意事项
《Molecular Genetics & Genomic Medicine》:Confirmation of Exome Sequencing Results Using Sanger Sequencing—Considerations in a Low-Resource Setting
【字体:
大
中
小
】
时间:2026年05月01日
来源:Molecular Genetics & Genomic Medicine 1.6
编辑推荐:
**摘要**
**背景**
外显子测序(Exome Sequencing, ES)现已被广泛认为是诊断发育障碍(Developmental Disorders, DD)的首选方法。国际指南建议在诊断过程中,应使用Sanger测序等正交方法对ES结果进行验证后再进行报告。然而
**摘要**
**背景**
外显子测序(Exome Sequencing, ES)现已被广泛认为是诊断发育障碍(Developmental Disorders, DD)的首选方法。国际指南建议在诊断过程中,应使用Sanger测序等正交方法对ES结果进行验证后再进行报告。然而,最新的指南认为,对于符合严格质量标准的变异进行确认性检测是多余的。在ES尚未常规实施的情况下,权衡这种做法的成本效益至关重要。非洲发育障碍解析项目(Deciphering Developmental Disorders in Africa, DDD-Africa)旨在促进资源匮乏地区基因组医学的公平应用,重点是将ES用于解决非洲地区的发育障碍问题。
**方法**
我们对首批64名接受ES检测并发现目标变异的受试者进行了确认性Sanger测序。严格的质量控制参数有助于减少假阳性变异的检测。
**结果**
所有通过ES检测出的高置信度变异(n=38)均通过Sanger测序得到确认,而低置信度变异(n=32)被确认为假阳性。
**结论**
在资源有限的情况下,如果应用了可靠且基于上下文的质量阈值,那么使用Sanger测序等正交方法来确认ES结果是不必要的。这一建议消除了基因组医学实施的重要障碍,有助于全球范围内加速基因组技术的普及。
**1. 引言**
发育障碍(DD)是一组由于精神或身体发育异常或延迟而引起的疾病,通常在产前、出生时或幼儿期被诊断出来。由于遗传和等位基因的异质性以及临床表现的高度多样性,DD的诊断较为困难。新的测序技术,如靶向下一代测序(Next-Generation Sequencing, NGS)面板和外显子/基因组测序(Exome/Genome Sequencing, ES/GS),由于测序化学和变异检测算法的进步(FitzPatrick和Firth 2020),实现了更高的分辨率和更广泛的检测范围,并且随着技术成本的降低而变得更加经济实惠。过去十年中,由于测序化学和变异检测算法的进步(Cheng等人2023),NGS在临床应用中的效用呈指数级增长,并迅速应用于诊断领域(Vink?el等人2021)。美国医学遗传学学会(American College of Medical Genetics, ACMG)现在推荐将ES/GS作为儿童DD的一线诊断工具(Manickam等人2021)。然而,与高收入国家相比,资源匮乏地区基于NGS的诊断测试的普及程度仍然很低。国际指南目前仍建议在诊断过程中,使用正交方法验证ES/GS的结果后再进行报告(Rehder等人2021;Crooks等人2023)。这通常是通过Sanger测序来实现的,尽管该方法在检测单核苷酸变异和小插入/缺失方面具有显著优势,但其高昂的成本和低通量限制了其广泛应用。近年来,越来越多的证据表明NGS结果的准确性和可靠性,这使得是否还需要进行正交确认变得值得质疑(Beck等人2016;Arteche-López等人2021;De Cario等人2020)。鉴于确认性Sanger测序会增加诊断时间并需要额外的技术和资金投入,这在资源匮乏地区的全球基因组医学实施中是一个重要考虑因素。世界卫生组织(World Health Organization, WHO)在其最近报告中认识到基因组医学对全球健康的益处,并通过建立基因组技术咨询小组来支持这一目标(Ambrosino等人2024;WHO 2022)。非洲发育障碍解析项目(DDD-Africa;https://h3africa.org/index.php/ddd-africa/)是一个跨学科的合作项目,旨在为非洲大陆的资源匮乏医疗系统建立实用且可扩展的NGS检测框架。该项目专注于利用ES来分析两个非洲国家(南非和刚果民主共和国)参与者的遗传因素对DD的影响。本文描述了我们在资源匮乏地区为NGS检测提供实用确认建议的努力,以加速基因组医学在非洲的应用。我们评估了中等深度ES的准确性以及减少Sanger测序确认需求所需的质量指标,并进一步考虑了这种做法在资源匮乏环境中的成本效益。
**2. 材料与方法**
2.1 研究对象和样本
本研究纳入了来自更大规模DDD-Africa研究的64名参与者。DDD-Africa项目获得了威特沃特斯兰德大学(University of the Witwatersrand)人类研究伦理委员会(Medical)(证书编号:M230567)和金沙萨大学(University of Kinshasa)(参考编号:ESP/CE/050/2018)的批准。所有参与者均符合研究纳入标准,包括:(i)中度至重度发育迟缓;或(ii)两个或多个不同器官系统的多重畸形;或(iii)一种主要畸形以及具有临床意义的轻微异常或畸形特征;或(iv)轻度发育迟缓伴有具有临床意义的轻微异常或畸形特征。使用改良的盐析方法(Miller等人1988)从外周血中提取基因组DNA(gDNA)。gDNA用70%乙醇溶液纯化后,重新悬浮在Tris-EDTA缓冲液中,随后使用Nanodrop 2000分光光度计(Thermo-Fischer Scientific, USA)评估样本的数量和质量。
2.2 外显子测序和数据分析
使用Index Sequence Capture (ISC)和Twist库捕获试剂盒(Twist Bioscience, USA)将基因组DNA酶切至450 bp。该试剂盒包含用于gDNA样本片段化的酶,以及末端修复、A-尾接、接头连接和文库扩增所需的试剂。完成核心文库构建后,根据应用需求使用通用接头。接头连接的文库通过PCR进行扩增和索引。样本以96-plex的形式在Illumina NovaSeq 6000平台(Illumina, USA)上进行2×150双端测序。尽管Sanger测序在检测单核苷酸变异和小插入/缺失方面仍是金标准,但由于其高昂的成本和低通量限制,近年来越来越多的证据表明其局限性。近年来,越来越多的证据证明了NGS结果的准确性和可靠性,从而质疑是否仍需进行正交确认(Beck等人2016;Arteche-López等人2021;De Cario等人2020)。考虑到确认性Sanger测序会增加诊断时间并需要额外的技术和资金投入,这在资源匮乏地区的全球基因组医学实施中是一个重要因素。世界卫生组织在其最近报告中认识到基因组医学对全球健康的益处,并通过建立基因组技术咨询小组来支持这一目标(Ambrosino等人2024;WHO 2022)。DDD-Africa项目是一个合作性的跨学科倡议,旨在为非洲大陆的资源匮乏医疗系统建立实用的NGS检测框架。本研究重点利用ES分析两个非洲国家参与者的遗传因素对DD的影响。我们描述了在资源匮乏地区为NGS检测提供实用确认建议的努力,以加速基因组医学在非洲的应用。我们评估了中等深度ES的准确性以及限制Sanger测序确认需求所需的质量指标,并进一步考虑了这种做法在资源匮乏环境中的成本效益。
**3. 结果**
所实现的外显子测序覆盖率为中等深度,平均达到31.6倍,范围在8倍至80倍之间。经过ACMG-AMP分类和质量过滤后,70个被分类为致病性或可能致病的变异(ACMG分类IV和V)接受了Sanger测序。其中38个变异(表1)符合质量标准(高置信度变异),平均VAF为0.62(范围:0.31–1.00),DP为49.5(范围:14.0–147.0)。所有高置信度变异均通过Sanger测序得到确认。ID
基因
HGVS命名法
DP(参考;替代)a
替代(+;?)b
VAF
D3S.0011
GLI3
NM_000168.6:c.418A>T
39(26;13)
13(8+;5?)
0.33
D3S.0013
MTOR
NM_004958.4:c.5395G>A
38(16;22)
22(10+;12)
0.58
D3S.0014
SETBP1
NM_015559.3:c.2612T>C
63(38;25)
25(11+;14?)
0.40
D3S.0015
NFIX
NM_001365902.3:c.293del
53(19;37)
37(19+;18?)
0.70
D3S.0016
PGAP3
NM_033419.5:c.557G>C
52(0;52)
52(31+;21)
1.00
D3S.0021
NSD2
NM_001042424.3:c.3155_3178del
26(18;8)
8(3+;5?)
0.31
D3S.0024
DNMT3A
NM_022552.5:c.1122+1G>A
32(11;21)
21(12+;9?)
0.66
D3S.0028
PPP2R1A
NM_014225.6:c.773G>A
93(47;46)
46(18+;28)
0.49
D3S.0033
UBE2A
NM_003336.4:c.129dup
21(1;20)
20(11+;8?)
0.95
D3S.0034
CHD7
NM_017780.4:c.8528del
44(21;23)
23(14+;9?)
0.52
D3S.0035
OCRL
NM_000276.4:c.2396C>T
29(0;29)
29(17+;12)
1.00
D3S.0037
C12orf57
NM_138425.4:c.184C>T
75(0;80)
75(41+;34?)
1.00
D3S.0043
CDH2
NM_001792.5:c.1885G>C
44(25;19)
19(6+;13?)
0.43
D3S.0044
NEK1
NM_001374418.1:c.3035A>C
27(13;14)
14(6+;8?)
0.52
D3S.0047
ARID1B
NM_001374820.1:c.2819del
37(19;18)
18(11+;8?)
0.49
D3S.0050
CHD7
NM_017780.4:c.5833C>T
46(25;21)
21(10+;11)
0.46
D3S.0051
CHD7
NM_017780.4:c.232C>T
40(23;16)
16(7+;9?)
0.40
D3S.0052
MECP2
NM_001110792.2:c.961C>T
21(0;21)
21(12+;9?)
1.00
D3S.0053
AUTS2
NM_015570.4:c.376C>T
53(30;23)
23(14+;9?)
0.43
D3S.0056
PLP1
NM_001128834.2:c.44C>T
49(0;49)
49(23+;26)
1.00
D3S.0058
MFSD8
NM_152778.4:c.1350+1del
17(0;17)
17(16+;1?)
1.00
D3S.0064
SMAD4
NM_005359.6:c.1498A>G
57(27;30)
30(18+;12)
0.53
D3S.0066
EHMT1
NM_024757.5:c.2073dup
63(28;35)
35(22+;13)
0.56
D3S.0071
EHMT1
NM_024757.5:c.2712+1G>A
52(30;22)
22(4+;18?)
0.42
D3S.0081
SCN2A
NM_001040142.2:c.727C>T
56(34;22)
22(15+;7?)
0.39
D3S.0082
SON
NM_138927.4:c.5753_5756del
102(53;49)
49(24;23?)
0.48
D3S.0086
STXBP1
NM_003165.6:c.416C>T
31(21;16)
16(5+;11?)
0.52
D3S.0089
MEF2C
NM_001193347.1:c.963T>A
83(41;42)
42(23+;19)
0.51
D3S.0094
DDX3X
NM_001356.5:c.931C>T
147(97;50)
50(29;21)
0.34
D3S.0098
OFD1
NM_003611.3:c.702dup
60(33;27)
27(17+;10)
0.45
D3S.0107
TFE3
NM_006521.6:c.560C>T
17(7;10)
10(3+;7?)
0.59
D3S.0108
XYLT2
NM_022167.4:c.1703_1721del
67(3;64)
64(34+;30)
0.96
D3S.0111
PTEN
NM_001304717.5:c.1129C>A
66(39;27)
27(6+;21?)
0.41
D3S.0114
CACNA1A
NM_001127222.2:c.2381A>G
35(14;19,1,1)
19(8+;11?)
0.54
D3S.0118
FLNA
NM_001110556.2:c.620C>T
17(0;17)
17(8+;9?)
1.00
D3S.0119
RPS6KA3
NM_004586.3:c.734A>G
14(0;14)
14(6+;8?)
1.00
D3S.0124
PACS1
NM_018026.4:c.607C>T
22(11;11)
11(6+;5?)
0.50
D3S.0129
MAPK1
NM_002745.5:c.952G>A
93(40;53)
53(31+;22)
0.57
a
DP(参考;替代):覆盖深度(参考等位基因计数;替代等位基因计数)。
b
替代(+;?):替代等位基因计数(正链上的计数次数;反链上的计数次数)。所有38个高置信度变异都通过Sanger测序得到了确认(图2)。低置信度变异的平均VAF为0.27(范围:0.07–1.0),DP为22(范围:2.0–91.0),并且没有通过Sanger测序检测到(表S2)。进一步检查发现,至少有13个低置信度变异发生在复杂的基因组区域(同聚物区域和/或A-T富集区域)。图2在图形查看器中打开。
Sanger测序电泳图和IGV可视化显示了两个高置信度变异。(A)C12orf57高置信度变异,VAF=1.00,DP=75,通过Sanger测序得到确认;(B)PACS1高置信度变异,VAF=0.50,DP=22。尽管C12orf57变异的值远高于PACS1变异,但两者都符合高置信度变异的质量参数。IGV可视化中,红色代表正链,蓝色代表反链。作为一组在ES中被确认为假阳性呼叫的变异的例子,有四个样本在CEP290基因中呈现移码变异,其中三个样本显示相同的变异(NM_025114.4: c.1666_1667insA,在D3S.0020、D3S.0039和D3S.0104中)(表S2)。尽管我们的研究没有达到质量参数,但这两个CEP290变异之前在ClinVar中被报告为致病变异。这促使我们决定通过Sanger测序进行确认,结果这些变异并不存在(图3)。图3在图形查看器中打开。
Sanger测序电泳图和IGV可视化显示了CEP290(外显子17)的假阳性变异。在变异位置的电泳图上看不到与原始序列的任何差异(黑色箭头),证实了两个样本的假阳性结果,这两个样本在VEP分析后被呼叫了不同的变异。样本D3S_0020_01_1中发现的变异的VAF很低(0.07),如IGV所示,而D3S_0088_01_1的该区域的整体覆盖度(底部)没有达到DP≥10的质量指标,总共只有6个读数。
4讨论
在这项研究中,我们提供了证据,表明符合严格质量标准的ES变异呼叫确保了高阳性预测值,从而否定了绝对需要正交Sanger测序验证的必要性。我们展示了使用DP≥10和VAF≥0.3的质量参数,即使在中等覆盖度的ES数据中,也能产生一组高度可能是真正阳性的高置信度变异。DP和VAF是易于获取的质量指标,可以在常用的可视化工具(如IGV)中进行评估,这些工具不一定需要专门的技能。这对于在资源有限的环境中实施基因组医学实践具有重要意义,因为这可能消除在低收入和中等收入国家(LMIC)更广泛地实施ES/GS测试的一个关键障碍。尽管有越来越多的证据支持这一点(Beck等人2016;Arteche-López等人2021;McCourt等人2013;Sikkema-Raddatz等人2013;Strom等人2014;Baudhuin等人2015),国际专家们仍然对是否总是需要Sanger测序来确认NGS检测到的变异持犹豫态度。应该注意的是,关于Sanger确认测试实用性的研究在设计和方法评估上差异很大,因此很难达成共识。同样,也没有共识可以实施的质量阈值来减少确认测试的需要。鉴于这种现状,分子病理学协会和国家遗传咨询师协会(Crooks等人2023)对文献和实验室实践进行了严格的调查,并为开始基于NGS的测试的实验室提供了指导方针。这些建议之一是,对于那些技术标准严格证明能够确保NGS单独具有高阳性预测值的变异呼叫,不需要进行确认测试。我们认为这里提出的发现可以为其他资源受限环境的实验室提供指导,以便根据当地情况和限制来实施外显子测序。如果资源允许,仍然可以考虑对质量较低但临床相关的变异进行Sanger确认,尽管我们的研究显示这些变异作为真正阳性的置信度较低。重要的是要认识到,由于NGS已成为研究和临床诊断设置中的主导技术,基于LMIC的实验室现在更有可能获得NGS平台(Inzaule等人2021)。例如,近年来非洲大陆的NGS基础设施得到了显著扩展,特别是在COVID-19大流行之后,对病原体监测的需求增加(Mboowa等人2024;Pronyk等人2023)。然而,这些投资几乎完全集中在NGS仪器上,没有包括Sanger测序设备。这种基础设施的现实进一步限制了常规确认测试的可行性,并强调了开发针对当地情况的稳健、基于证据的NGS质量阈值的重要性。在考虑确认测试的必要性时,还需要确保方法是正交的。当NGS和Sanger测序的结果不一致时,需要调查哪种方法正确反映了变异,而不是假设任何一种方法总是正确的。特别是在人口在全球知识库中代表性不足的国家实施时,这一点尤为重要。众所周知,非洲的基因组数据在全球知识库中的代表性显著不足,因此未描述的SNV可能会干扰Sanger和NGS化学中的引物结合位点,导致等位基因丢失和假阴性结果(Silva等人2017;Neupauerová等人2016)。在这种情况下,依赖Sanger确认可能无法提供可靠的ES/GS确认方法。二次确认还会延长周转时间,延迟阳性分子诊断的好处。Strom等人(2014)报告称,需要变异确认的报告平均延迟至少1周,如果需要重新测序,延迟可能会更长。在资源受限的环境中,复杂的物流(如测序试剂的进口和交付)可能会进一步加剧延迟,在某些情况下,试剂在到达之前就过期(Vogel等人2021)。多次尝试后难以扩增和测序的变异可能会阻止及时的患者反馈,降低总体诊断效率。在资源受限的环境中,用于Sanger确认的资金和人员可以更好地用于为更多人群提供ES/GS测试。总体而言,尽管本研究的样本量不大,但我们的发现提供了重要的实证支持,表明常规确认高质量NGS识别的变异可能并不总是必要的。重要的是,这些发现为其他资源受限环境的实验室提供了指导,以便根据当地情况和限制来实施外显子测序。作者贡献
概念化:A.L.、K.D.、N.C.、Z.L.;数据管理:I.S.、M.M.、N.L.、S.S.;资金获取:A.K.、A.L.、K.D.、N.C.、Z.L.;调查:I.S.、N.L.、M.M.、S.S.;方法学:A.K.、N.C.、Z.L.;可视化:I.S.、N.C.、N.L.、M.M.、S.S.;Z.L.;原始草稿撰写:I.S.、M.M.、N.C.、N.L.、R.K.、S.S.、Z.L.;撰写-审阅和编辑:A.K.、A.L.、K.D.、I.S.、N.C.、N.L.、M.M.、R.K.、S.S.、Z.L.致谢
我们衷心感谢DDD-Africa研究的参与者。作者们想感谢约翰内斯堡威特沃特斯兰德大学人类遗传学部门、国家卫生实验室服务和病理学学院的临床和遗传学团队。资金
作者声明,本研究的研究、作者身份和/或文章的发表获得了财政支持。本出版物中报告的研究得到了美国国立卫生研究院国家精神卫生研究所的资助,资助编号为U01MH115483和5U01HD114537。内容仅代表作者的观点,不一定代表美国国立卫生研究院的官方立场。伦理声明
DDD-Africa获得了威特沃特斯兰德大学人类研究伦理委员会(医学)的批准(证书编号:M230567)以及金沙萨大学的批准(参考编号:ESP/CE/050/2018)。根据IRB规定,从所有参与者那里获得了知情同意,并且所有个人级别的数据都通过使用代码和编号系统进行了去标识。利益冲突
作者声明没有利益冲突。数据可用性声明
数据可从EGA数据库访问,访问号为EGAS00001008319。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号