情境不一致性会选择性调节情绪和奖励敏感性

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Neuropsychologia》：Contextual incongruency selectively modulates emotion and reward sensitivity

【字体：大中小】 时间：2026年03月01日 来源：Neuropsychologia 2

编辑推荐：

　　情绪与奖励决策的上下文一致性对行为策略和神经机制的影响研究。通过两种修改的Iowa赌博任务实验结合EEG技术，探讨上下文一致性与不一致性如何调节情绪-奖励处理及决策行为。研究发现，上下文不一致时情绪敏感性降低但奖励敏感性保持，支持双过程理论，并揭示FRN和P300在神经层面的动态变化。

王俊晶|张毅|孙赛

广东外语外贸大学应用心理学系，中国广州510006

引言

情绪与基于奖励的决策过程紧密相连（Elliott等人，2023年；Lerner等人，2015年）。一方面，情绪可以作为隐性的线索，在人们没有意识到的情况下影响评估和决策（De Vleminck等人，2023年；Rolls，2023年；Zhou等人，2023年）。另一方面，情绪也可以作为显性的反馈，提高人们对决策结果的意识和敏感度（Priolo等人，2021年；Xu等人，2024年）。新兴的证据表明，情绪信息与结果价值之间的情境关系在决策过程中对情感和动机信号的编码方式起着关键作用（Genevsky等人，2025年；Priolo等人，2024年）。这里的“情境”指的是情绪价值与奖励效用之间的关系，一致的情境意味着情感信号与结果价值之间的一致性，而不一致的情境则意味着两者之间的不匹配。从双过程的角度来看，一致的情境更可能引发自动的、自下而上的情感处理，因为情绪价值和奖励效用传递了一致的动机信号（Bennett等人，2023年；Chen等人，2025年）。相比之下，不一致的情境则需要更多的深思熟虑的、自上而下的控制机制来解决这种冲突。与这一观点一致的是，在教育环境中，情绪与奖励的一致性与更高的自动参与度和更好的学习成果相关，而不一致性则会增加认知负荷和自我控制的需求（Cui等人，2025年）。类似的机制似乎也适用于成瘾行为，包括物质使用、赌博和互联网成瘾，在这些行为中，嵌入在一致情境中的情绪显著线索会放大线索反应性并偏向于不适当的决策模式，从而增加复发的风险（LeCocq等人，2020年）。相反，当情绪价值与奖励效用冲突时，预期违反会增加，认知需求也会上升，这会将资源从自动评估过程中转移出来。这种转变重塑了情绪信息在评估和学习过程中的权重，减弱了其对行为的直接影响，并强调了情境不一致性在决策中的功能性作用。因此，引入这种不一致性，并结合自我控制机制的参与，可能有助于打破线索驱动的偏见，减轻成瘾和抑郁行为（Harlé等人，2013年；LeCocq等人，2020年）。尽管情绪、奖励及其相互作用已经被广泛研究，但它们在情境中的调节机制和神经基础仍然知之甚少。具体来说，目前尚不清楚情境信息在神经系统中是如何表示的，以及它如何与决策过程中更自动或更受控制的处理方式相关联。本研究旨在通过探讨与情境调节的情绪和奖励处理相关的神经特征，以及这种编码如何与行为适应相关联，来填补这一空白。通过解决这些问题，可能会提供关于如何利用情境信息来微调行为策略和指导学习及不适当行为的新机制见解。

为了实证研究这些过程，以往的研究通常使用爱荷华赌博任务（IGT；He等人，2023年；Orm等人，2024年；Zanini等人，2024年），以及其他一系列基于奖励的决策任务（Azocar等人，2024年；Demidenko等人，2024年；Effah等人，2024年；Mahlberg & Weidemann，2024年；Wang等人，2025年；Zhu等人，2023年）。在一项修改后的IGT中，研究人员使用带有正面或负面情绪的面孔作为线索，而不是传统的四副盲牌，发现参与者更倾向于选择与正面情绪相关的牌组，尽管在不一致的情境下正面情绪带来的奖励较低。这表明无论在何种情境下，正面情绪都会增强决策中的评估（Hinson等人，2006年）。另一项研究表明，在不一致的情境下，IGT的表现（即安全选择与风险选择之间的差异）比在一致情境下更低（Davies & Turnbull，2011年）。Watanabe等人（2013年）使用基于概率的奖励决策任务并结合强化学习的计算建模发现，当参与者受到恐惧面孔的提示时，他们的学习速度更快。在另一项基于概率的价值决策任务中，Evans等人（2011年）观察到，即使经济结果相同，参与者也更喜欢微笑的面孔。除了客观的行为测量指标（如表现、选择和学习速度）外，一项研究还发现，基于得失差异的相同结果的美感评分在快乐和悲伤的情境下有显著差异。总体而言，这些发现突显了情绪线索对结果评估的情境依赖性调节效应（Bandyopadhyay等人，2019年）。

当使用情绪面孔作为反馈时，A?te等人（2013年）发现，在一致情境下，参与者更倾向于选择与正面情绪相关的牌组以获得更高的奖励。相比之下，Priolo等人（2021年）发现，在不一致情境下，参与者更倾向于选择与正面情绪相关的牌组。除了经济领域外，情绪刺激也被用于涉及竞争和合作的社会情境中的反馈（Chen等人，2017年；Scharlemann等人，2001年）。例如，Scharlemann等人（2001年）发现，当参与者看到微笑的竞争对手时，他们更倾向于合作。在另一项任务中，Chen等人（2017年）观察到，当参与者在做出选择后收到经济和情绪反馈时，他们对损失的反应比对收益的反应更慢，而当看到合作者的愤怒表情时，他们对损失的反应比对收益的反应更快。这些研究共同强调了情境的一致性对情绪反馈引导的决策的影响。

尽管先前的研究已经探讨了情境因素在情绪和基于奖励的决策中的作用（Aite等人，2013年；Alacreu-Crespo等人，2020年；Davies & Turnbull，2011年；Hinson等人，2006年），但它们对决策策略的影响及其背后的机制仍需进一步探索。鉴于决策的动态性质，仅依赖汇总统计信息（如每副牌的奖励试验总数、累积收益、净分数和主观感受（Doshier等人，2024年；Salice等人，2024年）可能无法捕捉决策过程中的持续变化（Steingroever等人，2013年；Worthy等人，2013年）。在各种物种中，适应性行为依赖于专门的神经回路，这些回路整合了持续的结果反馈和奖励历史，以在动态环境中灵活调整选择（Amodeo等人，2017年；Mehrotra & Dube，2023年），这突显了在决策过程中考虑这些实时适应机制的必要性。

在决策中使用的各种策略中，一种常用的方法是“赢则继续/输则改变”（WSLS）策略，该策略旨在通过利用最近的反馈来最大化收益（Kim等人，2021年；Westerman等人，2025年；Yoshizawa等人，2023年）。这种策略包括在获得奖励后重复选择，在遇到非奖励后切换到另一种选择（Byrne & Silla，2023年；Chau等人，2015年；Worthy等人，2013年；Zhang等人，2023年）。换句话说，个体依赖于他们最近关于奖励或非奖励的经验来指导未来的行为（Fujimoto等人，2024年）。WSLS策略也可能反映了情境如何与内部决策过程相互作用，促进习惯性（自动的）和目标导向（深思熟虑的）学习（Sun & Wang，2020年；Sun等人，2023年；Sun等人，2020年）。Worthy等人（2013年）证明，与其他强化学习模型相比，WSLS在重复的价值基础任务（如IGT）中更有效地捕捉了决策策略。因此，在当前的设置中，像WSLS这样的行为策略可以作为隐藏状态的敏感度指标，特别是关于情绪和情境对基于奖励的决策的调节效应。

关于基于奖励的决策的神经特征，先前的EEG研究表明，与反馈相关的负性波（FRN）和P300（Lin & Jia，2023年；Ludyga等人，2025年；Pegg & Kujawa，2024年）对结果评估过程敏感。FRN是在前中央记录点出现的负向偏移，在反馈后250到350毫秒达到峰值（Fassbender等人，2023年；Sun等人，2020年），在损失后比在胜利后更强，据认为起源于内侧前额叶皮层或前扣带回皮层（ACC）（Gehring & Willoughby，2002年；Miltner等人，1997年）。P300是一个在中顶叶出现的正向波，其在刺激开始后300到600毫秒达到峰值，在胜利后比在损失后更强，并伴随着FRN（Li等人，2023年；Liu等人，2025年；Weber & Bellebaum，2024年）。早期研究证实，FRN和P300都对奖励处理的各个方面敏感，包括其幅度、价值或两者（Guo等人，2019年；Li等人，2023年；Liu等人，2025年；Wu & Zhou，2009年；Yeung & Sanfey，2004年）。此外，研究发现FRN和P300追踪了情绪价值对结果评估的影响（Chen等人，2017年；Wang等人，2017年；Yang等人，2020年）。除了FRN和P300之外，早期P2波在刺激开始后150到300毫秒达到峰值（Schuermann等人，2012年；Yu等人，2020年），可能反映了注意力资源的分配（Ashley等人，2004年；Carretie等人，2005年；Carretie等人，2011年；Wang等人，2021年；Yuan等人，2007年），区分了不同情绪（Lu等人，2016年；Wang等人，2021年）和基于奖励的决策中的结果（Kiat等人，2016年；Polezzi等人，2008年；Schuermann等人，2012年）。

在这项研究中，我们使用了两种修改后的IGT范式结合EEG来探讨情境信息如何调节情绪-奖励处理并指导行为策略。我们关注情境不一致性是否通过不同的机制选择性地调节情绪和奖励处理，以及当情绪作为线索与作为反馈时，情绪与奖励之间的情境关联是否一致地影响决策策略。在行为上，我们假设情境的一致性与不一致性会选择性地调节情绪和奖励处理，从而以不同的方式塑造随后的决策策略（Maxwell等人，2025年）。在神经上，与结果评估和情绪处理相关的FRN和P300预计会受到情境一致性的调节。此外，我们假设情绪线索和反馈会对行为策略产生不同的影响，线索主要影响选择形成，而反馈主要影响结果评估，这反映在处理的早期（例如P2波）和后期（例如FRN、P300波）阶段的不同神经特征中。

方法

引入了两种修改后的爱荷华赌博任务（IGT）范式，以研究一致与不一致的情境关联如何不同地调节情绪和奖励处理并指导后续的决策动态。在实验1中，使用情绪面孔作为线索，而在实验2中，情绪面孔作为反馈。在这两个实验中，所有参与者的脑电波形都通过EEG进行了监测。

实验1：行为策略和表现

在试验层面的行为策略中观察到了情境、奖励和情绪之间的显著交互效应（F（1,31）= 178.68，P < 0.001，η_p² = 0.852）。为了进一步研究情境关联如何调节行为策略，我们分别分析了在一致和不一致情境下奖励和情绪的交互效应。

在一致情境下（图2A），我们观察到了奖励和情绪之间的显著双向交互效应（F（1,31）=

讨论

适应性决策依赖于情绪和奖励相关信息的动态整合，情境不一致性在其中起着选择性和功能性的关键调节作用。与双过程模型一致，我们的行为发现表明，当情绪价值与奖励效用冲突时，对情绪信息的敏感性会选择性减弱，而奖励敏感性则保持不变。这种模式表明从自动决策向策略性决策的转变

结论

本研究探讨了情绪信号和情境信息如何共同塑造基于奖励的决策，并提供了关于情绪和奖励信息的整合如何指导行为和神经层面的新机制见解。通过两个实验，我们展示了情绪线索和反馈强烈调节决策行为和神经处理，但这些效应依赖于情境。行为数据表明，情绪敏感性降低了

CRediT作者贡献声明

张毅：撰写——审阅与编辑，撰写——初稿，可视化，软件，方法论，正式分析，数据管理。王俊晶：撰写——审阅与编辑，撰写——初稿，可视化，验证，监督，软件，资源，项目管理，方法论，调查，资金获取，正式分析，数据管理，概念化。孙赛：撰写——审阅与编辑，撰写——初稿，可视化，验证，监督，项目

未引用的参考文献

Bellebaum等人，2010年；Harle等人，2013年；Jia等人，2021年；Li等人，2023年；Pintzinger等人，2017年；Zhang等人，2023年。

利益冲突声明

作者声明没有利益冲突。

致谢

本研究得到了东北促进全球跨学科科学研究人员（TI-FRIS）的支持，教育部的青年领导者海外计划（24YJCZH295），广东省的哲学与社会科学研究项目（GD24YJY07），以及广东省大学特色创新项目（2023KTSCX032）的支持。资助者没有参与研究的设计。

联系信箱：

粤ICP备09063491号

引言

方法

实验1：行为策略和表现

讨论

结论

CRediT作者贡献声明

未引用的参考文献

利益冲突声明

致谢

热点排行