编辑推荐:
这篇综述创新性地提出“通过行走评估的电路逻辑”(CLAW)分析框架,深入解析了在虚拟决策任务中,皮质-基底节-丘脑(CBGT)网络内信息流动的瞬时动态。研究揭示了决策过程可解构为“审议”与“承诺”两个关键阶段,分别由间接通路、苍白球-纹状体通路和直接通路主导,并映射到三个控制集合(反应性、顺从性、选择性)来动态调控决策策略(如漂移扩散模型DDM参数)。研究为理解CBGT网络如何协调快速与慢速两种决策模式,以及相关神经精神疾病的病理机制提供了重要的计算神经科学见解。
引言
决策是一个复杂的过程,涉及外部感觉信号和内部学习信息的整合,直到积累足够的证据以选择并执行一个动作。皮质-基底节-丘脑(CBGT)网络被认为是决策过程的核心回路。传统的漂移扩散模型(DDM)通常将决策参数(如边界高度a、漂移率v)视为在多次试验中保持恒定的静态量。然而,近期研究挑战了这一假设,表明决策者会根据实时需求调整策略,提出了“动态”证据积累的概念,允许漂移率和边界高度在单次试验内变化。这引出了两个核心问题:第一,神经活动在单个决策过程中如何流经CBGT网络的不同区域?第二,CBGT网络的复杂动力学如何引发出快速的、试验内的决策策略变化?
为了解决这些问题,本研究开发并应用了一种名为“通过行走评估的电路逻辑”(CLAW)的新型计算框架。该框架能够追踪虚拟决策任务中,CBGT网络内神经活动的瞬时流动。此外,本研究在一个更接近生物现实的CBGT回路模型中,复现了先前研究提出的三个控制集合(反应性、顺从性、选择性),并将CBGT动力学的变化映射到决策相关策略的演变上。
结果
CBGT活动与CLAW
研究的主要目标是提取单个决策过程中,证据积累期间信息流经CBGT回路的时序动态。为此,研究模拟了一个CBGT网络的脉冲神经元模型,执行简单的二选一任务。通过遗传搜索算法生成了300个具有不同突触权重配置的网络,每个网络模拟了50次试验,并收集了所有CBGT群体的时间依赖性放电率。
研究采用CLAW框架对决策过程中的高概率网络状态进行分析。CLAW图揭示了决策制定的两条不同路径:内CLAW(与低概率直接进入决策的状态相关)和外CLAW(与高概率直接进入决策的状态相关)。内CLAW路径与审议相关,包含两个不同的审议循环:初始审议循环(如状态63 ? 55 ? 183 ? 191)和第二审议循环(如状态247 ? 243 ? 251)。这些循环为网络提供了重新考虑当前证据轨迹的灵活性,反映了选项仍在被权衡的阶段。外CLAW路径则以单向过渡为特征,明确地引向最终选择,表现出不断增强的确定性和对选择的承诺。
模型包含了三条不同的通路:直接通路(绿色,促进动作选择)、间接通路(蓝色,抑制动作选择)和苍白球-纹状体通路(金色,向纹状体提供上行反馈抑制)。分析表明,当直接通路的D1-直接棘状投射神经元(dSPN)在某个动作通道中占据主导时,过程会绕过两个审议阶段,迅速承诺于相应动作,导致决策时间短。相反,如果间接通路的D2-间接棘状投射神经元(iSPN)更快激活,则试验会在审议上花费更多时间,决策时间更长。此时,丘脑底核(STN)和苍白球外侧段Arkypallidal神经元(GPeA)也被激活,进一步减缓了决策制定。因此,相对占主导的CBGT通路决定了系统做出决策的速度:直接通路加速决策,而间接和苍白球-纹状体通路则使其减速。
为了减少单个状态放电率变异性的影响,研究将所有CLAW状态划分为六个区域。区域I是“启动区”,包含刺激前的状态。区域II和V分别对应内CLAW的初始和第二审议阶段。区域III和IV分别对应外CLAW的左侧和右侧分支,代表对特定动作的强烈承诺。区域VI是一个单一的中性状态。基于各区域的通路主导情况,研究确认了对选择的承诺发生在某个动作通道的直接通路变得足够主导时(区域III和IV),而间接和苍白球-纹状体通路激活的增加则有助于持续的审议(区域II和V)。
CLAW与决策策略
先前的研究利用典型相关分析(CCA)在CBGT网络活动中识别了三个低维度的控制集合,每个集合与决策策略的特定变化相关。本研究在包含苍白球-纹状体通路的CBGT网络架构中复现了这一分析,恢复了三个与先前工作几乎相同的成分:
- 1.
选择性集合:与漂移率v以及左右通道间的放电率差异强烈相关,驱动证据积累朝向特定决策。
- 2.
反应性集合:与皮质-丘脑系统和直接通路的整体活动相关,负向加载于边界高度a和起始时间t0,调节证据评估开始的快慢和决策所需的证据水平。
- 3.
顺从性集合:与间接和苍白球-纹状体通路的成分相关,正向加载于a但负向加载于t0,反映了积累的证据转化为决策承诺的难易程度。
通过将CBGT放电率的时间序列投射到控制集合空间,研究考察了控制集合参与度的时序过程。研究发现,快速决策与慢速决策的主要区别在于驱动开始变化的时间。对于快速试验,反应性和顺从性组分的驱动在决策过程中点附近更早、更剧烈地上升,表明系统早期采取行动来调节反应速度和选择所需的证据程度。而选择性驱动在决策时间接近结束时才显现出适度偏差。对于慢速试验,三个集合的驱动变化时间更为相似,且反应性和顺从性集合的增幅明显小于快速试验。这表明,调节整体决策速度的关键成分是反应性和顺从性。
研究进一步利用控制集合与DDM参数的关系,考察了CBGT网络活动流如何调整决策策略参数。将CLAW区域间过渡相关的CBGT放电率变化投射到控制集合空间,进而映射到DDM参数空间。分析揭示了以下动态:
- •
漂移率:沿外CLAW承诺时(如区域I/II到III/IV),漂移率发生强烈变化,产生明确的方向性偏好,并迅速导向动作选择。沿内CLAW审议时,漂移率受影响较小。
- •
边界高度:随着试验向选择承诺推进,出现了“边界塌缩”现象,即决策所需的证据量减少,促进了动作承诺。唯一的例外是在启动区与初始审议区(区域I和II)之间的过渡期间,边界高度几乎保持不变,表明在决策开始时采取了更为谨慎的策略。
- •
起始时间:无论采取何种决策路径,起始时间t0consistently shortened。这反映了网络状态进展得越深入,对积累开始的预测时间就越早,意味着决策过程“准备”得更充分。
讨论
本研究通过整合脉冲神经网络模型和CLAW等数据分析技术,揭示了单个决策过程中高度动态的证据积累过程。研究发现,嘈杂的证据积累过程在功能上可分为审议和承诺两个不同阶段,每个阶段由不同CBGT子网络之间的竞争与合作所控制。CBGT区域的整体活动平衡在过程早期调节做出决策所需的证据程度,反映了对审议阶段的控制。最终,对称性破缺使得动作特异性的直接通路成分介入,在相对接近选择发生时触发从审议到承诺的过渡。
研究结果支持了直接和间接CBGT通路在决策过程中进行动态竞争而非孤立运作的观点。此外,通过包含苍白球Arkypallidal神经元,并强调决策过程关键阶段通路间竞争如何决定其进程,丰富了这一图景。当系统在决策早期采用反应性、顺从性状态时,与某一选项相关的直接通路可以获得力量并加速网络进行动作选择(外CLAW)。在其他情况下,间接通路的影响占主导,将系统推向与延长审议相关的运动抑制状态(内CLAW)。在此过程中,间接通路与苍白球-纹状体通路之间以及跨动作通道的竞争决定了审议的程度。
本研究证实,在包含苍白球Arkypallidal神经元的情况下,控制集合结构得以保留,并且从审议到承诺的过渡源于控制集合活动的演变。基于此,研究将CLAW区域过渡相关的CBGT网络活动变化转化为单个DDM参数的演变,为不同的决策策略提供了时间依赖性的算法解释。特别是,研究发现快速试验早期决策边界高度迅速降低,而慢速试验在更长时间内保持高决策边界。这与“边界塌缩”的概念相符。此外,决策策略的动态性超出了边界塌缩,还包括漂移率和起始时间等其他关键参数。
研究结果支持了以下观点:原型苍白球神经元(GPeP)与STN和GPi的连接构成了经典间接通路的一个组成部分,而Arkypallidal苍白球神经元(GPeA)在调节CBGT回路中的上行信息处理方面发挥着关键作用。模拟和分析表明,这两种GPe亚群可能对控制个体决策的动态做出不同的贡献。在审议阶段,GPeP活动的减少起到了“刹车”作用,而GPeA的激活则通过直接抑制纹状体来完成对反应的阻断。Arkypallidal神经元对iSPN和dSPN的抑制在决策过程的不同阶段扮演着不同的角色,两者都有助于回路内的持续竞争。
在方法学上,CLAW分析依赖于对每个时间步每个CBGT核团放电率的二值化,利用二值化速率定义活动状态,并追踪状态间随时间的转移。这种方法为研究神经回路活动的动态和演变提供了新工具。
本研究提出了几个未来探索的方向,包括引入多巴胺驱动的皮质-纹状体可塑性、非对称证据、以及对网络轨迹和决策结果的扰动(如改变奖励条件、对特定细胞群进行光遗传学刺激)的影响。研究结果还提出了几个可通过实验验证的预测,例如快速决策应具有独特的早期dSPN活动激增及相关GPi放电下降,而iSPN活动增强和GPeP活动减少则与转入慢速审议行为状态相关。光遗传学操作(如早期GPeP刺激或iSPN抑制)有望阻断进入审议状态,而GPeA神经元刺激应导致审议延长。此外,控制集合分析预测,即使是快速决策,在引发选择承诺的通道特异性dSPN激增之前,整个CBGT网络(GPeP和GPi除外)的大部分活动也应出现可辨别的上升。