编辑推荐:
这篇研究综述介绍了一种名为“SPERRFY”(空间位置编码用于重建轴突纤维连接规则)的数据驱动分析框架。该框架将连接组学(connectomics)与空间转录组学(transcriptomics)数据相结合,利用典型相关分析(Canonical Correlation Analysis, CCA)从基因表达梯度中推断出潜在的“接线位置信息”(wiring positional information, wiring PI),从而在全脑尺度上检验和扩展了Sperry的化学亲和理论(chemoaffinity theory),为理解大脑神经网络如何被遗传编码提供了新的定量工具和分子见解。
引言:从化学亲和理论到全脑尺度解码
大脑神经环路的复杂结构是高级脑功能的基础,而理解这些环路如何被遗传程序设计和连接是神经科学的基本问题之一。自1963年Roger Sperry提出化学亲和理论(chemoaffinity theory)以来,该理论认为神经元依赖化学梯度作为位置信息(positional information, PI)来识别轴突投射的目的地。这一理论在视觉系统等具有拓扑结构的简单感觉回路中得到了广泛研究和验证,例如视网膜-顶盖系统中的Eph受体和ephrin配体梯度。然而,对于大脑皮层等更复杂的神经网络,其连接规则是否也遵循类似的化学亲和原则,长期以来缺乏系统性研究。近年来,全脑神经连接图谱(连接组,connectome)和空间基因表达图谱(空间转录组,spatial transcriptome)数据的公开,为在全脑尺度上探索这一问题提供了前所未有的机会。本研究开发的SPERRFY框架,正是为了解码实际大脑数据中基于化学亲和理论的“接线位置信息”(wiring PI)。
SPERRFY框架概述:整合连接组与转录组数据
SPERRFY(Spatial Positional Encoding for Reconstructing Rules of axonal Fiber connectivitY)是一个数据驱动的分析框架,其核心目标是发现能够基于化学亲和理论最好地解释实际神经环路的潜在定量梯度,即wiring PI。该框架整合了来自艾伦小鼠脑图谱(Allen Mouse Brain Atlas)的神经连接数据和空间基因表达数据。其工作流程是:首先,将连接数据转化为神经投射的源区和目标区配对的基因表达谱;然后,应用无监督机器学习方法——典型相关分析(Canonical Correlation Analysis, CCA),来发现源区和目标区基因表达向量之间的隐藏相关结构。
CCA能够从两组数据(源区基因表达矩阵Xs和目标区基因表达矩阵Xt)中,找出多对权重向量a(i)和b(i),使得加权投影Xsa(i)和Xtb(i)之间的相关性最大化。这些投影结果就构成了源区和目标区的wiring PI梯度,即PIs(i)(r)和PIt(i)(r)。SPERRFY假设轴突投射更倾向于在源区和目标区wiring PI值相似的区域之间形成。通过这种方式,SPERRFY将化学亲和理论中假设的分子梯度,量化为基因表达水平的加权组合。
小鼠全脑连接中的wiring PI梯度分析
研究团队将SPERRFY应用于艾伦脑图谱的小鼠数据。所使用的连接数据是Oh等人提供的介观连接组数据,表现为右半球213个脑区之间的有向二进制连接矩阵,并专注于13个主要脑区(MR)之间的长程连接。基因表达数据则是这213个脑区中763个基因的表达水平矩阵,并利用主成分分析(PCA)降维至50维以减少噪声。
应用SPERRFY后,研究识别出了源-目标连接对之间的潜在相关结构,其中前5对结构表现出特别强的相关性,并且在留一法验证中保持一致。将这5对wiring PI梯度的空间分布在标准小鼠大脑上进行可视化,发现它们在大脑中平滑分布,具有较高的空间自相关性。
- •
第一对wiring PI梯度在空间上高度相关,分布模式相似,表现为大脑前部值高、后部值低,这可能与连接矩阵中前后模块化的组织方式有关。
- •
第二对梯度的源区和目标区分布差异显著,可能编码了特定脑区对(如皮层到丘脑)之间的偏好性方向关系。
- •
第三对梯度在源区(丘脑)和目标区(皮层)表现出特征性高方差,暗示其可能控制从丘脑到皮层的投射。
- •
第四和第五对梯度在每个主要脑区内部表现出更大的变异,更可能反映更精细尺度(即脑区内)的连接模式。
与wiring PI分布相似的基因筛选
推断出的wiring PI可能代表了轴突连接背后的空间分子梯度。为了识别与wiring PI对相关的候选基因,研究筛选了其空间表达模式与已识别的wiring PI梯度相似的基因。通过计算763个基因的空间表达模式与每个wiring PI分量之间的余弦相似性得分,找到了与各wiring PI最相似的顶级基因。
值得注意的是,在第二对wiring PI分量中,发现了与Ephb6和Efnb2的强相似性,两者都是Eph/ephrin信号家族的成员,已知在视觉等感觉系统的拓扑投射中起作用。这支持了SPERRFY推断的wiring PI梯度的生物学合理性。其他wiring PI分量也显示出与神经连接潜在相关基因的对应关系,例如第一对PI与涉及兴奋性突触传递的基因(如Grm5 (mGluR5)、Grin2b、Dlg4 (PSD-95)、Camk2a)以及神经发育相关基因(如Nrg1、Pcdh19)相似;第三对PI与在皮质发育中起作用的粘附GPCR家族成员Gpr56相似;第四对PI与关键轴突导向受体Robo2相似;第五对PI与Sonic Hedgehog (Shh) 信号共受体Boc相似。这些结果表明,wiring PI的空间结构重现了已知或推测参与神经环路形成的基因分布。
利用wiring PI重建连接组结构
为了验证化学亲和理论在实际小鼠全脑环路中的作用,研究测试了从基因表达数据中识别出的wiring PI是否可用于重建神经连接组结构。重建基于一个假设:源区和目标区wiring PI值相似的脑区对更可能存在神经连接。通过计算前5对wiring PI梯度的总差异值dPI(rs, rt),并设定阈值来重建二值连接矩阵。
评估结果显示,基于wiring PI重建的连接模式与实际连接组结构高度匹配,在留出测试集上接收者操作特征曲线下面积(AUC)达到0.88,而仅基于脑区间物理距离的模型AUC仅为0.70左右。这表明wiring PI编码了无法仅用几何距离解释的、具有生物学意义的信息。进一步分析发现,dPI与物理距离在所有脑区对中相关性较弱(r=0.26),在已连接的脑区对中相关性几乎不存在(r=0.03),这支持了wiring PI编码了非平凡空间邻近性可解释的连接特异性。
与随机化神经连接模式的比较
为了评估SPERRFY是否可能从随机连接数据中偶然提取出相关的wiring PI梯度结构,研究构建了两种零模型:
- 1.
全局随机化模型:在保持总连接数不变的前提下完全随机化连接模式。SPERRFY无法从此类随机模式中提取出相关的wiring PI结构,重建性能也极低。
- 2.
局部随机化模型:仅打乱每个主要脑区对内部的连接,而保持宏观尺度的连接模块。应用SPERRFY后,其提取的相关性和重建性能高于全局随机化模型,但低于原始数据。有趣的是,前两对相关结构仍然表现出与原始数据相似的高相关性,且其wiring PI梯度的空间分布也与原始数据相似,表明它们主要反映不同主要脑区对之间的全局连接。而第三到第五对相关结构在此模型中的相关性显著低于原始数据,说明它们捕获了与局部连接相关的信息。
这些发现表明,存在两种类型的wiring PI:一种代表全局连接模式,另一种代表局部连接模式,突出了它们在多尺度上调控神经连接的潜在作用。研究还测试了在随机化中保留连接距离和网络拓扑属性的零模型,以及空间自相关保留的基因表达随机化零模型,结果均确认从小鼠大脑数据中提取的wiring PI捕获了大脑实际连接中固有的、独特的信息。
讨论与展望
本研究通过开发SPERRFY框架,扩展了Sperry的化学亲和理论,用于探究遗传程序化的位置信息如何塑造全脑神经连接。SPERRFY的主要贡献包括:1)将化学亲和理论的应用扩展到包括高阶皮层在内的多脑区复杂轴突连接分析;2)通过将提取的wiring PI与基因表达模式关联,为实验探索参与神经连接的分子提供了机会;3)该方法可应用于其他物种和数据集,有助于发现跨物种的通用连接规则或物种特异性特征。
SPERRFY采用数据驱动的统计视角,与已有的生成模型(如遗传连接组模型)和描述性研究(如基因表达相似性与连接性的关联分析)形成互补。它通过识别投射源区和目标区之间相关的分子特征,为定量检验全脑范围内的化学亲和样组织提供了框架。
当然,研究也存在一些局限性,例如使用的是成年小鼠数据,未涉及发育动态;数据本身存在采样变异性和测量噪声;以及本研究主要关注相关性,尚未建立因果关系。未来的研究可以通过应用发育阶段转录组数据、整合更高分辨率定量数据集以及对SPERRFY筛选出的候选基因进行实验验证来克服这些局限。尽管如此,本研究为未来探索神经环路形成的分子机制奠定了坚实基础,将推动神经科学的进一步发展。