《Nature Medicine》:Deleterious coding variation associated with autism is shared across ancestries
编辑推荐:
本刊推荐:为填补自闭症谱系障碍(ASD)遗传学研究在非欧洲裔人群中的巨大空白,GALA(Genomics of Autism in Latin American Ancestries)联盟联合了横跨美洲的多个队列,对超15,000个拉丁美洲(AMR)个体(含4,717名ASD患者)进行了大规模测序。研究成功识别了35个具有全基因组显著性的自闭症相关基因,发现与欧洲(EUR)队列的研究结果存在大量重叠,并证实自闭症的遗传生物学基础在不同种族间具有高度一致性,有力地支持了现有遗传检测方法在多样化人群中的适用性,同时也凸显了开展更具包容性遗传研究的迫切性。
自闭症谱系障碍(ASD)是一种复杂的神经发育障碍,其遗传学基础在过去十年中取得了显著进展,尤其是在编码区罕见有害变异(deleterious coding variation)的识别方面。然而,一个不可回避的现实是,绝大多数基因发现研究都基于欧洲裔(European, EUR)人群。全球范围内,欧洲裔仅占人口的16%,这种研究重心的倾斜不仅限制了我们对全球人群遗传风险的全面理解,还可能加剧不同种族在遗传诊断和医疗服务获取方面业已存在的不平等。例如,已有研究指出,非欧洲裔个体在接受遗传检测后,结果不明确的比率更高,这很可能是由于在解释基因组变异时的不确定性造成的。为了直面这一挑战,填补全球自闭症遗传图谱中的关键空白,一个名为GALA(Genomics of Autism in Latin American Ancestries)的跨国研究联盟应运而生。
该联盟汇集了来自美洲各地的研究者,对超过15,000名拉丁美洲(Admixed American, AMR)血统的个体进行了迄今为止最大规模的测序研究,其中包括4,717名被诊断为ASD的参与者。这项研究不仅旨在描绘拉丁美洲人群中的自闭症罕见变异图谱,更核心的目标是探究自闭症的遗传结构是否在不同种族背景的人群中存在差异。研究结果发表于《Nature Medicine》杂志,为理解自闭症的跨种族遗传同质性提供了强有力的证据。
为了回答这些问题,研究人员整合了多种关键方法和技术。他们首先建立了涵盖美洲10个不同站点的GALA队列,收集了包括ASD先证者及其父母、未患病兄弟姐妹在内的家族样本。通过主成分分析(PCA)和随机森林分类器,对超过15,000名个体进行了精确的遗传背景(ancestry)推断,从而严格定义了研究的AMR人群。在遗传数据获取方面,研究主要依赖于全外显子组测序(WES),并对部分样本进行了全基因组测序(WGS)。利用优化的流程进行了严格的质量控制,以识别罕见的、新发的(de novo)和遗传的编码序列变异,包括单核苷酸变异和小型基因拷贝数变异(CNV)。在基因发现阶段,研究人员采用了先进的TADA(transmission and de novo association)算法。该算法能够整合新发变异、遗传变异、病例-对照变异数据、基因组约束性评分(如LOEUF)以及小型基因CNV信息,从而更有效地识别与ASD显著相关的基因。在临床意义评估方面,研究使用了VarSome和Neptune等临床遗传学软件平台,按照美国医学遗传学与基因组学学会(ACMG)的指南,对识别出的变异进行致病性或可能致病性(P/LP)分类,以评估现有遗传检测流程在不同人群中的表现。
研究结果
拉丁美洲ASD患者的罕见变异图谱
研究共分析了6,977名个体,包括4,717名ASD病例。在严格的质量控制下,识别出6,555个罕见的新发编码序列变异。分析发现,与未受影响的兄弟姐妹相比,ASD先证者在高度受约束基因(表现为低LOEUF评分)中,蛋白质截短变异(PTV)和有害错义变异(MisB)的发生率显著升高。这证实了在拉丁美洲人群中,罕见有害变异同样富集于进化上高度保守的基因,这一模式与在欧洲裔人群中的发现一致。
基因组约束评分在不同种族间的校准
研究人员评估了源自欧洲裔人群的基因约束性指标(如LOEUF)在非欧洲裔人群中的适用性。结果显示,尽管现有的LOEUF评分在应用于AMR样本时略显保守(即预测的约束性略强于实际观察),但对于约束性最强(即LOEUF值最低)的那部分基因,其评分在不同人群间具有良好的校准性。由于已发现的自闭症相关基因大多属于这类高度受约束的基因,因此这一发现证明了现有约束性评分在跨种族研究中的实用性。
拉丁美洲人群中的自闭症基因发现
利用TADA分析,研究在拉丁美洲人群中鉴定出35个达到全基因组显著性水平(错误发现率FDR < 0.05)的自闭症相关基因,其中16个基因的FDR < 0.01。这些基因包括已明确的自闭症基因(如DYNC1H1、SCN2A、SYNGAP1等)和新兴的候选基因(如MARK2、YWHAG、PACS1、RERE、SPEN等)。重要的是,当与一个剔除了AMR样本的大型欧洲裔队列(FuCOMP)的结果进行比较时,发现了高度的重叠。在GALA中发现的35个基因里,有19个在FuCOMP队列中也显示出显著信号。对重叠基因的变异计数分析表明,观察到的变异数量与基于欧洲裔数据预期的数量基本一致。此外,许多在GALA中发现的基因也在其他神经发育障碍(如严重发育障碍)的队列或临床数据库中得到了支持。基因本体和表型富集分析表明,这些基因主要涉及突触功能、神经元发育以及社交和重复行为相关的生物学过程和表型。
对临床遗传学的启示
为了评估遗传发现在临床中的可转化性,研究使用临床软件分析了所有新发变异和X连锁遗传变异。结果显示,无论是专注于ASD相关表型,还是扩展到更广泛的神经发育障碍(NDD)相关表型,在AMR和非AMR个体中均能检测到被归类为致病/可能致病(P/LP)的变异。然而,分析也揭示了一些差异:欧洲裔个体中P/LP变异的检出率(5.61%)略高于非欧洲裔个体(4.54%)。这种差异部分归因于现有临床数据库(如Neptune所依赖的)对非欧洲裔人群中变异信息的收录不足,导致对非欧洲裔个体中变异的分类率(判定为P/LP或不确定意义)较低。尽管存在差异,但总体结果表明,关注罕见有害新发变异的现有临床遗传学方法在不同种族背景中具有可转化性。研究人员强调,为了进一步提高跨人群遗传检测的效能,关键是要在分析中纳入所有相关人群的等位基因频率数据,并尽可能减少对既往报道的、可能带有偏倚的“致病”变异的依赖。
研究结论与讨论
本研究通过GALA联盟的大规模工作,首次系统地描绘了拉丁美洲人群中自闭症的罕见变异遗传图谱。核心结论是:自闭症的遗传生物学基础在不同种族人群间是一致的,未检测到种族背景的显著影响。 研究证实,与欧洲裔人群类似,拉丁美洲人群中的自闭症遗传风险也高度集中于一组进化上高度保守的基因,并由罕见的新发有害变异主导驱动。研究人员成功鉴定了35个与该人群ASD显著相关的基因,且这些发现与在欧洲裔人群中的研究结果存在大量重叠。
这一发现具有多重重要意义。首先,在科学认知层面,它强有力地支持了自闭症核心生物学机制的跨种族保守性。无论个体的遗传背景如何,那些对大脑发育和功能至关重要的基因(通常表现为高度进化约束)一旦发生有害突变,都可能导致自闭症风险升高。这暗示针对这些共同通路的干预策略可能具有普适性潜力。其次,在临床实践层面,研究结果支持了现有以检测罕见有害变异为核心的遗传检测流程在多样化人群中的适用性。尽管在P/LP变异检出率上存在微小差异,但本研究表明,只要在分析中充分纳入跨种族的等位基因频率信息,当前的检测方法能够有效地识别出大多数具有高度破坏性的致病变异。这对于在全球范围内推广和实现自闭症的精准遗传诊断至关重要。
当然,研究也指出了当前遗传医学中的不足和未来方向。非欧洲裔个体中P/LP检出率相对较低,部分源于研究不足导致的临床数据库偏差。这突显了持续开展包容性遗传研究的极端重要性,只有通过在更多样化的人群中积累数据,才能完善变异数据库,减少解读的不确定性,最终消除健康差异。此外,对本地祖先推断等更精细分析的需求,也指出了未来基于全基因组测序数据进行深入探索的价值。
总而言之,GALA研究不仅填补了自闭症遗传学地图上的关键空白,更重要的是,它传递了一个充满希望的信息:在理解自闭症根本生物学机制的道路上,人类是共通的。这项研究为在全球范围内建立更公平、更有效的自闭症遗传诊断和未来治疗策略奠定了坚实的科学基础。