血液样本中43,617个镶嵌染色体改变的模式与驱动因素

《Nature Genetics》:Patterns and drivers of 43,617 mosaic chromosomal alterations in blood

【字体: 时间:2026年05月20日 来源:Nature Genetics 29

编辑推荐:

  研究人员利用新开发的高分辨率计算方法,对英国生物样本库(UK Biobank)中484,081名参与者的血液来源全基因组测序数据进行分析,共鉴定出43,617个常染色体镶嵌染色体改变(mCA)。研究发现,长度≤1 Mb的短mCA聚集于53个基因组热点区域,其中

  
研究人员利用新开发的高分辨率计算方法,对英国生物样本库(UK Biobank)中484,081名参与者的血液来源全基因组测序数据进行分析,共鉴定出43,617个常染色体镶嵌染色体改变(mCA)。研究发现,长度≤1 Mb的短mCA聚集于53个基因组热点区域,其中46个此前未被发现,部分热点提示染色体脆性位点是体细胞缺失的反复来源。13q14区域的慢性淋巴细胞白血病(CLL)相关缺失在65–70岁个体中的检出率达1%,提示该镶嵌突变或可纳入CLL的临床筛查与遗传关联研究。此外,38个基因的罕见蛋白编码变异与拷贝中性杂合性缺失(CN-LOH)突变的克隆扩增显著相关(P < 1.2 × 10?5;错误发现率 < 0.01),这类突变通过改变这些变异的等位基因剂量发挥作用,表明CN-LOH诱导的等位基因替换是克隆选择的关键靶点。研究结果揭示,随着年龄增长,人类血液基因组以可预测的方式积累mCA。
该研究聚焦血液克隆造血(CH)中镶嵌染色体改变(mCA)的演化规律与驱动机制,发表于《Nature Genetics》。当前领域对mCA的认知仍受限于检测技术的分辨率与样本量:既往大规模研究多依赖SNP芯片数据,难以检测短片段(~1 Mb)及低克隆比例(<1%)的mCA,且缺乏对特定mCA自然史的精细解析。为此,研究人员基于英国生物样本库(UK Biobank)近50万份血液全基因组测序(WGS)数据,开发新型计算流程,系统绘制mCA图谱并揭示其遗传驱动因素。
关键技术方法包括:针对英国生物样本库484,081名40–70岁参与者(血液采集时年龄)的WGS数据,优化mCA检测算法——改进覆盖深度建模、过滤种系拷贝数变异(CNV)、结合单倍型测序片段计数,并通过读段深度与等位基因失衡分析确定拷贝数状态;针对13q14缺失区域设计靶向读段深度检测策略,将检出下限降至2%克隆比例;采用Fisher精确检验与全基因组关联分析(GWAS)评估罕见与常见变异对CN-LOH克隆扩增的影响;通过Hi-C染色质互作数据与断点分布分析mCA形成机制。
研究结果如下:
分析英国生物样本库WGS数据检测到43,617个常染色体mCA:新方法较既往SNP芯片分析灵敏度提升2倍,可准确分配所有mCA的拷贝数状态,且技术假阳性极低。检测有效性获多证据支持:mCA基因组分布与前人研究一致,检出率随年龄显著上升(40–44岁0.04个/人 vs 65–69岁0.14个/人),全外显子测序(WES)可复现等位基因失衡信号,且90%的SNP芯片检出mCA可被WGS数据验证。WGS尤其提升了两类mCA的检出:大片段低克隆比例mCA(等位基因失衡<0.01者检出增加2.8倍)与小片段中高克隆比例mCA(<1 Mb者检出增加10.5倍),并鉴定出5.6倍的全染色体CN-LOH突变。
WGS分析鉴定局灶mCA与mCA断点:短间隙mCA热点分析新发现41个缺失热点(34个为WGS新增)与12个重复热点。48个热点中>25%的mCA获断点 discordant 读段支持,断点位置与等位基因失衡水平各异,证实体细胞起源。新热点特征异于已知热点:缺失更短(100–700 kb)、聚焦性更低,多位于癌症常见脆性位点(如MACROD2、RBFOX1),年龄富集度更低,提示其可能源于发育早期脆性位点突变而非衰老期克隆选择。16p11.2缺失女性更多,13q14(DLEU2)与NRXN1缺失男性更多。断点解析显示88%的缺失无微同源(≤3 bp),提示非同源末端连接是主要修复机制;另发现159例复杂结构变异,包括易位与倒位。
CLL相关13q14缺失的克隆扩增随衰老普遍发生:靶向读段深度分析将13q14缺失检出量提升至2,906例(较SNP芯片增加5倍),70岁时检出率达1.1%。多数13q CN-LOH事件作用于13q14缺失(109/149例高克隆比例事件致双等位失活),27%无拷贝数降低,提示可能存在表观遗传调控机制。生存分析显示,单等位13q14缺失的10年无CLL生存率随克隆比例升高而下降(<5%克隆比例:92% vs >10%克隆比例:72%),与双等位失活的13q CN-LOH进展风险相似。GWAS分析显示,CLL相关mCA(13q14缺失+12三体)可鉴定出18个显著易感位点,优于传统CLL结局分析(12个位点),其中15个与已报道CLL风险位点重合。断点分析显示13q14缺失断点聚集于10–100 kb尺度,Hi-C数据提示B细胞中该区域染色质环化促进反复缺失;短缺失更易达高克隆比例,且合并CN-LOH的13q14缺失更短,提示长缺失可能因包含必需基因而受选择限制。
CN-LOH突变作用于38个基因的罕见蛋白改变变异:负担检验鉴定出38个基因的罕见蛋白编码变异与重叠CN-LOH突变显著相关,多数基因为首次发现。功能富集显示这些基因参与DNA双链断裂响应(P = 1.0 × 10?7)、凋亡(P = 5.1 × 10?6)、细胞因子信号(P = 1.3 × 10?6)与蛋白质泛素化(P = 6.3 × 10?4)。相位分析显示,多数CN-LOH通过“二次打击”增加增殖优势等位剂量,但也发现4个基因(如CFLAR、IL2RB)存在回复嵌合现象——CN-LOH移除有害变异实现“天然基因治疗”;造血癌细胞系必需基因中,225个基因的CN-LOH更倾向于移除有害变异,仅154个倾向于二次打击(P = 3.1 × 10?4)。罕见LoF变异的外显率随年龄升高,TM2D3 LoF携带者65–69岁时外显率达69%。
常见变异对CN-LOH扩增的贡献有限:排除罕见变异驱动的CN-LOH后,仅鉴定出5个常见变异关联位点(含已报道的DLK1位点)。多基因评分(PGS)分析显示,CN-LOH倾向于扩增携带更高增殖潜能(白细胞计数PGS更高)的单倍型,且该效应随变异对白细胞计数的效应增强而增强。遗传力分析估计,CN-LOH方向性的常见变异遗传力平均为0.08(标准误0.03),提示除等位剂量差异外,其他机制亦驱动CN-LOH克隆扩增。
讨论部分总结:该研究通过WGS提升了mCA检测分辨率,揭示了基因组脆性驱动的短缺失热点与13q14缺失的高流行率,并系统鉴定了CN-LOH的靶基因。研究发现CN-LOH可通过改变等位剂量(包括回复嵌合)介导克隆选择,且常见变异对其方向性影响有限。这些结果强调CN-LOH的适应性由所携带的等位变异决定,需结合具体变异解读临床风险。13q14缺失的高检出率提示需进一步明确其临床管理策略,而跨祖先、多组织的mCA研究将是未来深入解析克隆选择机制的重要方向。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号