大脑调控网络的哺乳动物演化：从基因到行为的跨物种整合视角

《Annual Review of Animal Biosciences》：Evolution of Mammalian Regulatory Networks in the Brain

【字体：大中小】 时间：2026年03月09日 来源：Annual Review of Animal Biosciences 8.7

编辑推荐：

　　这篇综述系统探讨了哺乳动物大脑调控网络及其复杂行为的演化机制。文章融合了单细胞组学（scRNA-Seq）、空间转录组学和基因编辑等前沿技术，解析了从分子、细胞类型、神经环路到行为层面的跨物种保守与差异，揭示了行为多样性与基因调控网络演化之间的深层联系。

哺乳动物大脑演化与行为多样性

哺乳动物大脑在不同谱系中演化，支撑了令人惊叹的多样性行为。其中一些行为是特定谱系独有的，例如人类的语言能力。其他许多行为则通过趋同或平行演化产生，包括声音学习、回声定位、成对结合、社会群体规模以及睡眠相关行为等。塑造这些行为的进化压力，无论是为了适应特定环境还是性选择，最终都作用于参与相关神经环路的大脑区域和细胞类型内的基因表达水平。利用高通量基因表达测量技术，如微阵列和RNA测序，研究者得以研究与各种行为演化相关的基因表达模式。通过构建基因共表达网络，例如应用加权基因共表达网络分析等方法，可以识别功能相关的基因模块，但基于大量细胞（bulk）表达实验构建的网络存在局限，其相关性可能源于特定细胞类型中的高表达，也可能源于跨细胞类型的特定通路共调控。

神经细胞类型的分子特征

理解基因表达差异与神经环路、行为关系的基础，在于研究跨神经细胞类型和神经元亚型的基因表达。神经元亚型的定义标准多样，包括形态学特征、细胞构筑、投射目标、电生理特性、使用的神经递质或特定基因的表达。近年来，得益于测量单个细胞或细胞群内基因表达和表观遗传特征的新技术，已能够通过更广泛的基因表达模式来表征神经元亚型。这些技术主要分为基于分选细胞群的测量和单细胞测量。单细胞基因组学方法因其能在给定组织中定量测量数十种细胞类型的基因组特征而占据主导地位，可测量基因表达、开放染色质、DNA甲基化等。在基因组层面分析单细胞后，利用这些数据集识别独特细胞类型和神经元亚型仍面临计算挑战。最直接的方法是应用标准聚类方法，然后将每个簇视为一个独特的细胞类型。也存在机器学习引导的方法。尽管在确定神经元亚型方面存在挑战，但单细胞方法已经为理解哺乳动物调控网络提供了宝贵见解。比较研究表明，当基础数据来自大量转录组学或单细胞基因表达时，可能存在共同和不同的调控网络。最令人兴奋的领域之一是能够同时利用跨单细胞的变异性和多模态信息的方法。特别是，单细胞开放染色质测量的基因组分辨率可以识别跨细胞群的转录因子结合位点差异，这是重建细胞类型特异性转录因子网络的基础。这些重建调控网络的方法也正被用于研究其演化。

将神经细胞类型置于其大脑区域和神经环路的背景中

多种空间基因组学方法被开发出来，用于在组织背景下测量基因组特征。一类方法使用条形码微珠，类似于非空间液滴法，但增加了位置信息。另一种方法通过对基因序列互补的多重荧光探针来实现细胞级分辨率。这些空间转录组学方法允许将分子和解剖学信息整合到跨条件的神经元功能研究中。单细胞基因组技术发展的一个新兴领域是同时分析基因组信息和连接性。最近，这些技术已与单细胞基因组技术相结合，将神经元的连接性与其分子特征联系起来。例如，Epi-retro-seq技术结合了逆行性腺相关病毒、分子条形码和单核基因组学，根据神经元投射的脑区来标记皮层神经元亚型。其他技术则依赖于条形码狂犬病毒，这可以使技术在不同物种间更可靠地扩展。

细胞类型特征的演化

比较不同模态的计算方法也被用于比较跨物种的表达模式。一些最早的比较研究，特别是针对远缘物种，会首先单独识别每个物种的细胞类型，然后以矩阵格式进行比较。另一种目前文献中占主导地位的方法，是通过跨物种归一化数据集来比较细胞类型。尽管这些方法非常强大和成熟，但它们也突显了一个概念上的担忧：正如没有明确的细胞类型定义一样，也没有明确的同源细胞类型定义。在很大程度上，主要的神经元类别甚至不同的亚型在哺乳动物和更远缘的物种中都是高度保守的。例如，爬行动物和哺乳动物在发育过程中的转录因子模式、主要大脑结构和主要神经元类别之间存在深刻的同源性。鸟类和哺乳动物虽然没有分层的皮层，但构成这些皮层的许多神经元亚型之间存在直接的同源性。哺乳动物内部神经元亚型之间甚至有更大的相似性。例如，皮层和纹状体中微妙的亚类在物种间有直接的同源物，并表达相似水平的标志物基因。尽管基因表达模式存在这些相似性，表观遗传特征似乎存在更大的分歧。因此，即使基因表达模式保持保守，控制这些基因表达模式的调控网络也可能发生了分化。

连接基因组与大脑

哺乳动物的行为复杂性编码在基因组序列中。数以百计的分子上不同的哺乳动物神经元亚型各自参与各种不同的疾病状态和行为，其功能基于其所处的组织环境。每个不同亚型神经元的功能取决于其表达的基因。例如，长程投射神经元表达与轴突导向相关的基因。基因组通过几种方式编码这些神经元亚型、相关环路和行为的功能。首先，编码基因本身的核苷酸差异可导致功能差异。蛋白质氨基酸序列的差异可导致蛋白质功能差异。长链非编码RNA已被越来越多地认为是神经发育和功能的调节因子，显示出大脑和发育阶段特异性的表达。比较分析表明，长链非编码RNA的出现和分化也可能有助于谱系特异性的神经表型。其他非编码RNA的演化也可能在大脑演化中发挥重要作用。

越来越多的证据表明，顺式调节差异在复杂性状的演化中起作用。例如，基因组序列的顺式差异可影响剪接模式。跨物种基因表达水平的差异可能由各种转录和转录后机制介导，包括非翻译区的微小RNA结合位点、上游开放阅读框或启动子和远端增强子等顺式调节元件的差异。值得注意的是，多种DNA序列变异可以改变局部DNA甲基化模式、组蛋白修饰、开放染色质和3D染色质组织，所有这些都调节神经元谱系中调节区域的可及性和使用。在组蛋白修饰水平，在灵长类动物中观察到关键基因附近的广泛差异。在单细胞基因组实验中观察到的跨灵长类动物的开放染色质差异，已将特定的细胞类型（包括少突胶质细胞）与人类特异性调节模式的演化联系起来。基因组序列与功能之间的关系也可以在基因组结构水平上观察到。从序列预测基因组相互作用的机器学习模型可以捕捉到实验观察到的跨演化差异。各种基因组序列差异很可能影响在一个或多个细胞亚型背景下的基因功能，这些细胞亚型构成支撑演化行为的神经环路的一组大脑区域。

相对于其他器官，大脑显示出非常高的保守性。在基因水平，受到最强选择压力的蛋白质编码序列功能类别是神经发育转录因子，包括许多建立主要大脑结构和细胞类型身份的基因。这种保守性也延伸至顺式调节元件。例如，核苷酸水平保守性的比较显示，在神经祖细胞中活跃的增强子比平均水平保守得多。对人类神经元亚型基因表达模式的研究提供了一些线索，说明这种选择压力为何如此强烈。绝大多数神经基因并不局限于一种神经元亚型，而是存在于许多亚型中。因此，对单个神经基因的任何破坏通常会影响跨多个大脑区域的一整套神经元亚型。人类自闭症谱系障碍中广泛的表现型，是基因与行为之间一对多关系的一个例证。通常，影响单个基因的突变会影响多种表型。

虽然单个核苷酸常被用作基因组保守性的度量指标，但神经元远端增强子甚至在核苷酸水平之上表现出更强的保守性。增强子活性可以在物种间保守，即使单个核苷酸存在大量更替。因此，像phyloP这样的核苷酸保守性评分在预测增强子活性相关特征（如开放染色质）是否保守方面表现不佳。远端增强子的活性是在发育过程中该神经元亚型中激活的特定转录因子组合的结果。这些转录因子协同作用，基于基因组序列特征的复杂模式结合到基因组的特定调节元件。这为每种神经元亚型创建了一个独特的调控代码，控制其在哺乳动物大脑中的功能。最近的研究中，训练了神经网络模型，可以准确预测细胞类型特异性的开放染色质，无论基因组序列是来自灵长类还是啮齿类。这表明决定神经元身份的复杂转录调控网络组合在许多哺乳动物中是高度保守的。此外，基因组的同源调节元件通常在细胞类型特异性开放染色质方面是保守的，即使许多单个核苷酸并不保守。换句话说，可以观察到进化压力作用于维持一个区域的细胞类型特异性调节功能，即使单个核苷酸的保守性很低。

这些结果表明，自然选择的作用是保守控制哺乳动物神经元亚型身份的复杂转录网络。除了氨基酸变化、剪接变异以及增强子和微小RNA等顺式调节元件外，核苷酸序列差异也可能影响表观基因组。

哺乳动物和鸟类的比较基因组学

大脑结构和神经细胞类型在哺乳动物和鸟类之间跨越3亿年演化的显著保守性进一步强调，大脑区域可能是通过现有增强子和调控网络的扩展演化而来的。早期研究认为鸟类缺乏六层新皮层，从而得出鸟类大脑在进化上是原始的结论。然而，基础的解剖学研究挑战了这一观点，发现了鸟类大脑类似区域与哺乳动物新皮层之间的连接模式相似性，表明两者都源自鸟类、爬行动物和哺乳动物最后共同祖先的核状皮层。发育生物学和环路分析的方法学进展为我们提供了测试这些进化假说的新工具。对鸟类大脑的高分辨率绘图揭示，高背侧和背侧脑室嵴由跨核边界迭代重复的柱状神经元回路组成，类似于哺乳动物皮层的微回路。这些发现表明，羊膜动物皮层组织的差异可能反映了空间结构而非新细胞类型的演化，保守的细胞转录和发育框架连接了不同谱系的皮层形态。

在声音学习的例子中，有大量证据表明，同源的神经环路、大脑区域和细胞类型在遥远的哺乳动物和鸟类谱系中被共同选择以演化出该行为。所有被研究的鸣声学习物种都演化出了一个特殊的前脑感觉运动学习回路，位于皮层、丘脑和纹状体之间，这在它们更近缘的非鸣声学习亲属中不存在或很原始。类似地，从发声皮层到运动神经元的长程投射在鸣声学习物种中显著更强。

对这些回路的转录组比较揭示了前脑发声回路中的趋同性与趋同的基因表达特化模式相关联。当按大脑区域分层组织时，鸣禽和人类的表达谱突出了禽类和人类表达之间的特定对应关系。这些对应的大脑区域显示出与突触可塑性、神经连接性和活动依赖性转录相关基因的上调，这些基因与人类言语和语言回路有关。大量基因表达差异可能源于神经元亚型内部和跨神经元亚型的基因表达差异。首先，大脑区域的细胞类型组成可能保持一致，但一个或多个细胞类型中的基因表达可能被调节。或者，即使区域内的细胞类型保持一致，它们的比例也可能不同。最后，整个细胞类型可能在一个物种的大脑区域中缺失，但在另一个物种中存在。在声音学习的案例中，有证据表明大量转录组学中与声音学习相关的差异部分归因于所有这三种假设，包括新神经元亚型的出现。最近一项在鸣禽大脑中使用单细胞RNA测序的研究发现，在控制其他运动行为的邻近脑区中，歌曲核RA中存在独特的长程投射神经元亚型。

大规模、以大脑为中心的组学联盟的可用性日益支持这些类型的比较和机制研究。诸如PsychENCODE、发育GTEx和非人灵长类GTEx等项目提供了跨发育阶段、大脑区域和物种的全面转录谱，支持跨物种的细胞类型、回路和调控网络比较。与这些努力相结合，艾伦脑图谱提供了小鼠和人类大脑基因表达的高分辨率空间图谱，促进了转录数据与解剖和空间组织的整合。这些资源共同为跨物种分析提供了重要基础，旨在理解大脑的分子、细胞和回路水平特征在物种间如何保守或分化，并将这些特征与复杂行为和神经表型联系起来。

这些发现表明，复杂行为（如声音学习）的演化可以通过共同选择现有转录网络、通过环境特异性激活基因调控、细胞类型特化和回路重组来实现。除了神经细胞群类型和丰度的变化外，进化转变也可能通过保守细胞类型在回路内的空间分布和组织差异而发生。在不改变细胞类型身份或比例的情况下，网络拓扑结构可能发生的变化，代表了选择塑造行为相关回路的另一条途径。通过将行为趋同与细胞和转录特征联系起来，我们可以开始理解复杂性状如何演化——无论是通过新细胞身份的出现、细胞类型比例的谱系特异性变化，还是它们在回路内空间组织的变化。

推断调控网络演化面临的挑战

深入研究其他系统中关于重建神经网络调控的文献，可以为了解神经细胞类型和大脑结构演化背后的调控网络提供见解。一项DREAM挑战比较了不同方法和数据来源对重建模拟数据准确性的贡献。他们发现，删除或扰动网络中节点所产生的观察结果，在时间序列研究中更有价值。直观上，这些实验有助于厘清基因间的关联哪些是直接的因果关系。扰动实验在从生物学数据重建基因调控网络方面也被证明是无价的。例如，基因相互作用已被用于研究酵母中网络的演化，吗啉代反义寡核苷酸敲低被广泛应用于研究棘皮动物的演化。尽管扰动实验在揭示调控网络方面具有强大能力，但其在大脑研究中的应用仍然有限。

使用扰动实验研究哺乳动物大脑调控网络演化存在若干挑战。然而，新技术正在出现以克服这些挑战。在传统模式生物中，转基因动物仍然是操纵基因或基因调控的主要技术。这些技术与高通量表型分析相结合，可以将基因与行为联系起来。使用病毒载体递送遗传物质可以更快、更便宜地操纵调控网络，但效率较低。慢病毒载体可以注射到大脑中，将其携带的基因直接整合到基因组中。基于腺相关病毒工具的开发为研究人员提供了更有效地将遗传物质递送到多种哺乳动物大脑中的能力。特别是能够穿过血脑屏障的系统性AAV可以将遗传物质递送到大脑的很大部分，尽管在较大的哺乳动物中效率会降低。这些载体的效率具有物种特异性，但它们仍然为跨物种扰动大脑调控网络提供了更可靠的途径。

随着可靠递送调控元件选项的改进，操纵调控网络的方法也得到了改进。RNA干扰通过递送与目标基因互补的短发夹RNA来干扰基因表达。除了调控RNA本身，CRISPR-Cas9基因编辑系统提供了直接编辑大脑细胞内基因组的机会。在该技术中，Cas9核酸酶介导基因组编辑本身，而一个与基因组中位点互补的引导RNA控制编辑发生的位置。CRISPR-Cas9系统已针对关注整个基因或调控元件功能（而非特定核苷酸）的案例进行了改造。在CRISPR干扰系统中，引导RNA递送一个与抑制性蛋白融合的失活Cas9，以抑制附近的基因或调控元件。CRISPR激活系统则使用激活辅因子来增强特定基因座的调控活性。这些系统相对于AAV包装容量的大小，导致其更广泛应用中出现了一些实际问题。一种解决方案是将CRISPR干扰或CRISPR激活系统基因工程改造到小鼠体内，这样只需要递送短的引导RNA。其他解决方案依赖于工程化更短的蛋白质，以适配特定AAV的包装限制。

CRISPR技术效率的提高为在集合实验中分析数十个基因座提供了手段。在Perturb-seq方法中，一个引导RNA文库被递送到已稳定表达dCas9-KRAB抑制复合物的细胞群中，允许在不同的细胞中抑制不同的调控元件。每个引导RNA都带有条形码，因此单细胞转录组实验可以恢复哪些调控元件被抑制以及该细胞内源基因的表达谱。该技术的更新版本允许对特定碱基对进行高分辨率编辑，已成功应用于体外解读阿尔茨海默病相关的炎症调控网络。将这些系统应用于体内操纵调控网络一直是一项具有挑战性的任务，因为存在通量和递送问题。然而，目前正在开发结合多种技术以实现体内高通量操纵的新方法。随着这些技术的成熟，可以在更多物种中恢复更庞大、更稳健的调控网络。

靶向特定细胞类型的能力为研究细胞类型特异性调控网络以及细胞类型在行为中的作用提供了额外的力量。对于转基因动物，特定基因被敲除的品系可以与标记特定细胞类型的其他品系杂交。在病毒载体的情况下，病毒对转导特定细胞类型或神经元亚型的嗜性可能已经存在。将病毒工具与细胞类型特异性调控元件结合也可以提高特异性。细胞类型特异性调控元件可以从细胞类型特异性基因的启动子中获取，也可以从大脑表观基因组数据中获取。新方法利用机器学习来优先考虑调控元件，甚至创建合成调控元件。

大规模并行报告基因分析为研究遗传差异如何影响分子表型提供了另一种机制。MPRA是一类利用分子条形码测量多达数十万序列功能的技术。它们已被开发用于顺式调控元件、非翻译区以及其他特征如上游开放阅读框。由于被测试的序列是合成的，因此有机会在一次实验中测试同源区域的功能。例如，已经有一些实验测试了人类和近缘非人灵长类动物基因座的功能。与其他基因组技术一样，在使MPRA在体内发挥作用方面也存在挑战，但最近通过利用小鼠转基因或能够通过血脑屏障进行系统性转导的AAV取得了进展。这些技术的高通量特性允许在单次实验中分析数十个同源调控元件。展望未来，这些方法可用于构建给定基因座的详细调控演化历史，甚至将测量的调控元件活性与跨物种复杂性状的注释联系起来。调控元件功能的高通量测量与上述机器学习方法是互补的，后者可以基于序列特征预测调控元件是否具有活性。这些技术相结合，可以推断调控网络的哪些组成部分在物种间是保守的，哪些已经分化。

订阅生物通快讯

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯