从“价值评估”到“动作选择”的神经枢纽:灵长类腹侧纹状体的动态计算与多巴胺调控机制

《Nature Communications》:Role of the primate ventral striatum as a neural hub bridging option valuation and action selection

【字体: 时间:2026年03月29日 来源:Nature Communications 15.7

编辑推荐:

  本刊推荐:面对大脑如何将内部选项价值表征转化为实际动作选择这一决策核心问题,研究团队聚焦灵长类多巴胺-腹侧纹状体系统。通过单神经元记录、电刺激与光遗传学操控,发现腹侧纹状体神经元活动可动态地从编码选项价值(value-modulated)向表征动作选择(choice-modulated)演变,揭示了其作为连接价值评估与动作选择神经枢纽的新功能,并证实了多巴胺输入在此过程中的因果作用。这项发表于《Nature Communications》的研究拓展了强化学习理论框架,为理解价值驱动决策的环路机制提供了新见解。

  
在日常生活中,从选择早餐到规划职业路径,我们时刻在进行决策。做出恰当决策,通常依赖于大脑评估可选方案预期结果(哪个更好?)并选择最具回报动作(选哪个?)的能力。这背后,大脑如何将抽象的“价值”信息转化为具体的“动作”指令,是一个根本性的科学问题。在脑科学的强化学习理论框架中,腹侧纹状体和它的“老师”——中脑多巴胺神经元,被认为是编码和更新选项预期价值的核心神经基质,它们通过“奖赏预测误差”信号来优化价值表征。然而,一个关键问题依然悬而未决:大脑究竟如何将这些内在的价值表征与最终的动作选择联系起来?腹侧纹状体仅仅是价值的“记录员”,还是能更主动地参与“拍板”过程?这项发表在《Nature Communications》上的研究,为我们揭示了腹侧纹状体在决策中一个前所未被充分认识的重要角色。
为回答上述问题,研究团队在猕猴身上设计并应用了一套基于价值的序列决策任务。实验中,猕猴需要先后评估两个视觉对象(每个对应不同的液体奖励量),并决定是否通过释放按钮的动作来“选择”第一个对象。通过结合在体单神经元记录、局部脑区电刺激以及对多巴胺输入进行光遗传学操控等多种尖端技术,研究人员系统探究了腹侧纹状体在决策过程中的动态编码规律及其因果作用。
关键技术方法包括
  1. 1.
    行为学与电生理记录:训练三只猕猴完成定制的价值决策任务,并在任务执行期间,从两只猕猴的腹侧纹状体记录125个单个神经元的活动。
  2. 2.
    模型比较与数据分析:采用模型比较分析等方法,解析神经元活动是更受选项价值(value-modulated)、动作选择(choice-modulated),还是介于两者之间(intermediate)的调制,并分析信号出现的时间动态和转换关系。
  3. 3.
    控制实验验证:通过简单的按钮释放运动任务,验证腹侧纹状体的“选择调制”信号并非单纯反映动作执行本身。
  4. 4.
    因果性干预实验
    • 电刺激:在猕猴决策期间(第一个对象呈现时),对腹侧纹状体56个位点进行电刺激,观察其对猕猴动作选择(是否选择第一个对象)的影响。
    • 光遗传学:向中脑多巴胺神经元(黑质致密部和腹侧被盖区)注射携带光敏感通道蛋白(ChRmine)的腺相关病毒载体,在决策期间用激光特异性激活投射至腹侧纹状体的多巴胺输入,并在50个腹侧纹状体位点观察其行为效应。
  5. 5.
    组织学验证:实验后通过免疫组化验证光遗传学实验中ChRmine蛋白在多巴胺神经元胞体及其在腹侧纹状体轴突末梢的表达。
研究结果如下
价值决策任务与猕猴行为
研究发现,三只猕猴能够根据第一个对象的价值决定是否选择它,价值越高,选择概率越高,决策反应时也越短。这表明猕猴成功地将选项估值与动作选择关联起来。
腹侧纹状体中选项估值与动作选择的神经特征
研究人员记录了腹侧纹状体神经元在决策期间的活动,发现了复杂的编码模式。许多神经元的活动并非简单地反映价值,而是不同程度地整合了价值信息和猕猴的动作选择。通过模型比较分析,可将神经信号分为三类:
  • 价值调制信号:活动主要反映第一个对象的价值。
  • 选择调制信号:活动主要反映猕猴是否选择释放按钮。
  • 中间信号:活动同时受价值和选择的显著调制。
信号的时间动态与转换
最关键的是,这些信号在时间上呈现有序的动态变化。在第一个对象呈现后,价值调制信号最早出现,随后是中间信号,最后是选择调制信号。许多神经元个体也展示了从价值调制到选择调制的信号演变。这种动态过程再现了从选项估值到动作选择的决策时间进程。控制实验表明,选择调制信号不能简单地归因于按钮释放这一运动动作本身。
电刺激腹侧纹状体对猕猴动作选择的影响
在猕猴决策期间电刺激腹侧纹状体,能特异性改变其动作选择。这种影响在第一个对象价值中等(猕猴选择犹豫不决时)最为明显。刺激效应具有位点特异性,有些位点刺激增加选择概率,有些则降低。该效应独立于对单纯运动反应时的影响,表明腹侧纹状体活动在价值决策中具有因果作用。
光遗传学促进多巴胺输入对猕猴动作选择的影响
决策期间,在腹侧纹状体用激光激活多巴胺轴突末梢,同样能改变猕猴的动作选择,其效应模式(增加或降低选择概率)和条件依赖性(在中等价值时最显著)与电刺激结果类似。这表明,决策过程中传递至腹侧纹状体的多巴胺信号,能够因果性地影响动作选择。
研究结论与讨论归纳
本研究揭示,多巴胺-腹侧纹状体系统在价值决策中扮演着超越传统“价值编码与更新”框架的、更为主动的角色。腹侧纹状体神经元活动能从初始编码选项价值,逐渐演变为编码动作选择,仿佛在执行从“价值”到“动作”的实时翻译。这种动态转换表明,腹侧纹状体是连接“估值”与“择行”的神经枢纽。电刺激与光遗传学结果进一步证实了腹侧纹状体及其多巴胺能调制在动作选择过程中的因果性贡献。
在讨论中,作者将这一发现置于更广阔的学术背景中。以往研究多强调前额叶、顶叶皮层在“价值到动作”转换中的作用,或认为腹侧纹状体主要编码整合后的动机驱力,而背侧纹状体更直接参与动作选择。本研究则提出腹侧纹状体本身就能主动进行这种转换计算。腹侧纹状体作为“边缘-运动”接口,其解剖位置使其天然适合整合来自前额叶皮层、杏仁核等脑区的价值与情绪信息,并通过基底神经节直接和间接通路影响运动输出。电刺激产生的促进或抑制选择的双向效应,可能与同时激活了表达D1受体(促进“趋近”)的直接通路神经元和表达D2受体(促进“回避”)的间接通路神经元有关。同样,多巴胺输入的双向效应,也可能源于其对这两类通路神经元的不同调控(通过D1受体易化直接通路,通过D2受体抑制间接通路)。然而,这些具体机制有待未来通过细胞类型特异性操控等技术在灵长类中进一步验证。
总之,这项研究刷新了我们对决策神经环路的理解,将腹侧纹状体定位为决策过程中动态整合信息并驱动选择的关键枢纽,并强调了多巴胺在决策“进行时”(而不仅是在结果反馈后)的重要作用。这为理解包括成瘾、强迫症、决策障碍在内的多种精神疾病的环路机制提供了新的理论基础。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号