《Current Opinion in Genetics & Development》:Recent advances in the neurogenomics of autism spectrum disorder
编辑推荐:
神经基因组学揭示自闭症谱系障碍的遗传异质性及多组学技术应用,罕见变异(如剪接调控基因PTBP2)和常见变异(如GWAS显著位点)共同贡献疾病风险,通过CRISPR编辑、类器官模型及机器学习整合多维度数据,解析基因调控网络异常并探索个性化干预策略。
Ashlesha Gogate | Maria H Chahrour
德克萨斯大学西南医学中心尤金·麦克德莫特人类成长与发展中心,美国德克萨斯州达拉斯市 75390
神经基因组学为自闭症谱系障碍(ASD)的遗传基础提供了深刻的见解,现在越来越认为ASD是一组各自罕见的疾病。这篇综述综合了该领域的最新进展,探讨了罕见和常见遗传变异如何共同导致ASD的发生。为了从功能上解释尽管存在遗传异质性但仍出现的生物通路汇聚现象,研究人员应用了多组学方法来识别在ASD中受到破坏的基因调控网络。高通量技术,如 clustered regularly interspaced short palindromic repeats (CRISPR) 编辑和大规模并行报告基因检测,被用于人类诱导多能干细胞和类器官,以弥合遗传关联与生物功能之间的差距。最后,机器学习方法在整合和利用这些复杂数据集以指导个性化干预方面发挥着关键作用。
引言
自闭症谱系障碍(ASD)是一组神经发育障碍,其特征是表型多样性和复杂的遗传结构[1]。其表现从轻微到严重不等,核心症状包括沟通障碍、社交行为缺陷、兴趣范围狭窄以及重复性行为[2]。根据美国疾病控制与预防中心2025年的估计,ASD的患病率每年都在增加,大约每31个儿童中就有1个受到影响[3]。这一增长可以归因于多种因素,包括公众意识的提高、诊断标准的扩展以及基因组技术的进步[4]。近年来,神经基因组学在识别与ASD相关的遗传元素以及开发强大的功能验证技术方面取得了显著进展(见图1和表1)。这些进展有助于弥合遗传发现与我们对这些元素如何破坏大脑功能的理解之间的差距,最终导致ASD的临床表现。鉴于发现的快速步伐和新数据的不断涌现,对这一领域的简要回顾非常及时且至关重要。
部分内容
罕见变异在自闭症谱系障碍中的高影响力
ASD具有高度遗传性,最近的研究估计其遗传率约为80%[5]。其中一类重要的遗传因素是高度外显的新生或遗传的罕见变异,它们占总体遗传风险的15-20%[6]。在全外显子测序(WES)和全基因组测序(WGS)中,研究人员在ASD患者中发现了大量富含罕见编码变异的基因,包括蛋白质截短变异、非同义变异和拷贝数变异。
常见变异对自闭症谱系障碍的贡献
除了罕见变异外,常见遗传变异也至少贡献了50%的ASD风险,尽管每个变异的效应大小较小[6]。迄今为止进行的最大规模的ASD全基因组关联研究(涉及18,381名ASD患者和27,969名对照组)仅发现了五个具有全基因组显著性的ASD风险位点(rs910805、rs10099100、rs201910565、rs71190156和rs111931861)[13]。这些位点包括剪接调节因子PTBP2(rs201910565)和MacroD2(rs71190156)等。
遗传异质性背后的共同生物学机制
遗传学研究已经确定了数百个与ASD相关的基因[1]。尽管存在这种异质性,许多基因在ASD中都涉及核心生物通路、细胞类型和基因表达程序的破坏[22, 23]。研究较为深入的通路包括突触传递(例如NLGNs、NRXNs、SHANKs)[24, 25, 26]、信号传导(例如CTNNB1、TSC1/2、PTEN)[27, 28]、染色质重塑(例如KMTs、KDMs、AUTS2、CHDs)[30, 31, 32, 33]、蛋白质稳态(例如FMR1、UBE3A)[34, 35]以及RNA[35]等。
转座元件和长链非编码RNA在自闭症谱系障碍中的作用
最近的研究将ASD研究扩展到了传统的基因组测序(PGCs)之外,强调了转座元件(TEs)和长链非编码RNA(lncRNAs)作为潜在的调节因子和ASD相关分子病理的贡献者。生物信息学分析表明,三类TEs——内源性逆转录病毒(ERV)[44]、长散布核元件-1(L1)[45, 46]和Alu元件[47, 48, 49]——与ASD相关的分子改变有关。研究发现,外周血单核细胞中的ERV水平升高,而L1元件在ASD患者中也有异常表达。
多组学揭示自闭症谱系障碍中的基因调控景观
大脑由具有特定功能的多种细胞类型组成。对ASD患者尸体的分析发现了转录程序的异常。大规模RNA-seq研究显示,ASD患者的皮质和小脑中存在广泛的转录失调[50, 56],而单细胞转录组学方法则确定了受到特定分子病理影响的特定细胞类型,包括上层皮质兴奋性神经元、小胶质细胞等。
高通量功能验证技术
为了确定不同类型的ASD是否都涉及一组共同的分子通路,研究人员应用了高通量功能表征方法,包括clustered regularly interspaced short palindromic repeats (CRISPR)-Cas9编辑和大规模并行报告基因检测(MPRA),并结合了传统的体外和体内系统以及先进的人类诱导多能干细胞(hiPSCs)和脑类器官模型。
利用机器学习技术推进自闭症谱系障碍研究
ASD研究正进入一个由人工智能(AI)和机器学习(ML)驱动的时代。这些技术可以处理和整合大规模复杂的数据集,构建预测模型,从而提高诊断准确性并指导以患者为中心的护理[75]。传统的诊断程序主要依赖于临床观察和手动评分。一组研究人员利用这一计算机会,开发了一种深度学习方法来进行客观特征分析。
结论
尽管在识别ASD的遗传风险因素方面取得了显著进展,但仍有一部分ASD风险尚未得到解释。双胞胎研究表明,大部分ASD风险可归因于遗传因素;然而,病毒感染、妊娠并发症以及金属和农药暴露等环境因素也起着作用[80]。要理解这种“缺失的遗传性”,需要整合所有可用的神经基因组学技术(见图1和表1)。
利益冲突声明
作者声明他们没有已知的可能会影响本文所述工作的竞争性财务利益或个人关系。
致谢
我们感谢Wei-Chen Chen和Emily Oh对这篇综述提出的宝贵意见。这项工作得到了德克萨斯大学西南医学中心和Walter and Lillian Cantor基金会(MHC)的支持。