从信息论的角度解释认知努力

《Philosophical Psychology》：An information-theoretic account of cognitive effort

【字体：大中小】 时间：2026年05月11日 来源：Philosophical Psychology 2.1

编辑推荐：

　　摘要认知努力是一个重要的现象，然而目前的心理学研究仍面临一些未解决的挑战。这些挑战包括关于自我耗竭效应是否存在的分歧、难以解释似乎能够缓解这一效应的多种调节因素，以及努力的双重性。本文通过在广泛的信息论框架内采用主动推理方法来应对这些挑战。本文从主动推理中提取了认知能力的定

　　摘要
认知努力是一个重要的现象，然而目前的心理学研究仍面临一些未解决的挑战。这些挑战包括关于自我耗竭效应是否存在的分歧、难以解释似乎能够缓解这一效应的多种调节因素，以及努力的双重性。本文通过在广泛的信息论框架内采用主动推理方法来应对这些挑战。本文从主动推理中提取了认知能力的定义，即从习惯性思维转向目标导向思维的信息成本，该成本通过库尔贝克-莱布勒散度（Kullback-Leibler divergence）进行了正式量化。从这个角度来看，那些被认为是反对自我耗竭效应存在的实验被视为无效的，而努力的双重性则被解释为在能力有限的主体中准确性と复杂性之间的权衡。自我耗竭效应被理解为复杂性受限的结果，而各种调节因素则被解释为降低了估计的复杂性。我得出结论，主动推理为认知努力提供了一个令人满意的解释，它解决了关键问题，并加深了我们对日常生活中认知努力及其表现的理解。

关键词：
认知努力；自我耗竭效应；目标状态；习惯性；努力的双重性

1. 引言
认知努力是日常生活中执行任务时一个基本的心理现象。然而，当前的研究尚未完全解决与之相关的两个关键问题。首先是努力的双重性，即认知努力既具有厌恶性（例如，人们会选择回报较低的任务以减少努力支出），也具有价值性（例如，自己组装宜家家具的参与者认为这些家具比未组装家具的人更有价值）。第二个问题是自我耗竭效应，它描述了在完成一项认知要求较高的任务（例如解谜）之后，在随后需要认知努力的任务（例如抵制诱惑性食物）中自我控制能力下降的现象（Baumeister等人，2018年；Inzlicht & Schmeichel，2012年；Inzlicht等人，2014年；Kurzban等人，2013年；Muraven & Baumeister，2000年；Muraven等人，1998年）。自我耗竭效应的一个挑战是它是否真的存在，因为一些最近的研究未能重现早期研究中的现象（Hagger等人，2016年；Xu等人，2014年）。另一个谜团是为什么不同的因素，如自我肯定或愉快的活动，可以减少或改变这种效应，而现有的理论对此解释不足。

关于认知努力的心理学理论大致分为两大类：直接成本理论和机会成本理论。顾名思义，这两种理论都将认知努力视为一种成本。直接成本理论认为这种成本源于有限内部资源的耗尽，而机会成本理论则认为它来自于放弃其他选择所错失的潜在回报。然而，正如我稍后在本文中详细阐述的，这两种理论都无法解决上述两个关键问题。鉴于现有心理学理论的局限性，我提议我们超越心理学范畴，以获得对认知努力的更合理理解。最近，在信息论框架内出现了一种计算视角（Lancia等人，2023年；Parr等人，2023年；Zénon等人，2019年）。这种方法将大脑活动概念化为信息处理，并将认知努力定义为与心理动作相关的信息成本。它还提供了一种数学工具来量化这一成本：即心理动作的先验概率分布与后验概率分布之间的库尔贝克-莱布勒（Kullback-Leibler，KL）散度。我将在本文后面详细讨论这一数学工具。然而，关于认知努力的计算理论仍存在一些问题。首先，当前的计算理论未能令人信服地解释为什么认知努力应该被理解为一种信息成本，或者为什么信息本身构成了一种成本。其次，信息论框架内的现有文献尚未解决心理学中围绕认知努力的关键争论。第三，存在三种不同的认知努力计算理论，目前尚不清楚哪种定义具有最大的解释能力。

基于心理学和计算文献中发现的挑战，本文的结构如下：第2节概述了当前心理学理论中认知努力的关键问题，并提供了主要挑战的详细信息。第3节介绍了定义认知努力所需的信息论框架的核心组成部分。我还解释了从计算角度研究认知努力的意义，特别是将其视为信息成本的必要性。第4节，我借鉴主动推理框架，将认知努力定义为从习惯性思维转向目标导向思维的偏离。我还探讨了两种替代计算理论的问题，并展示了主动推理理论如何有助于解决自我耗竭效应的重复性危机。第5节和第6节展示了如何使用认知努力的主动推理定义来解释努力的双重性、自我耗竭效应及相关现象。

这种认知努力的计算定义具有广泛的意义。我用它来解释认知努力的厌恶性源于占用了本可用于处理无目标认知需求的有限认知资源，这对个体的长期福祉至关重要。这一观点表明，避免认知努力并不一定表示懒惰或迟钝。相反，它反映了在追求目标特定方面的适应性与适应环境中的无目标但又有价值方面的适应性之间的审慎权衡。这种见解鼓励人们对避免认知努力的倾向采取更加宽容的态度，并对其有更富有同情心的理解，这对个体的心理健康有益。

2. 关于认知努力的心理学研究
目前有许多关于认知努力的心理学解释。心理学家通常将这些解释分为两类：直接成本理论和机会成本理论。直接成本理论认为努力成本源于可消耗资源的消耗，而机会成本理论则认为成本来源于放弃其他选择所带来的收益损失。尽管这两种分类常被视为对立的，但实际上它们在直觉上是相互关联的。如果资源有限或可消耗，那么主体就必须放弃其他选择的好处才能专注于主要任务。即便如此，将现有的心理学解释分为直接成本和机会成本框架仍然是合理的。在直接成本理论下，主体根据消耗的资源量来评估努力成本；而在机会成本理论下，主体根据失去的收益来评估成本。因此，两者之间的区别在于主体如何感知和计算努力成本。最近的哲学讨论区分了可消耗资源和有限但不可消耗的资源（Massin，2017年）。考虑到这种区别以及直接成本理论和机会成本理论之间的区别，我总结了现有的认知努力解释。

尽管有这些不同的解释，关于认知努力的某些问题仍然理解不足。第一个问题是为什么努力具有两个看似对立的方面：厌恶性和价值性。努力的厌恶性体现在个体对费力任务的厌恶，以及避免费力工作的倾向，甚至选择回报较低的任务以最小化努力支出（Dreisbach & Fischer，2015年；Kool等人，2010年；Kurzban，2016年；Shenhav等人，2017年）。努力的价值性意味着努力本身就有价值，相对独立于所达到的结果——努力本身就能为结果增添价值。宜家效应就是一个经典例子，说明努力本身的价值。对于同样的宜家家具，自己组装家具的参与者认为这些家具比未组装家具的人更有价值（Norton等人，2012年）。类似的研究发现，当扑克筹码被用作正确回答的奖励时，通过努力获得筹码的个体觉得这些筹码比未获得筹码的个体更有激励作用（Lewis，1965年）。Lewis（1965年）也注意到了努力的这一双重性特征。Inzlicht及其同事最近将其称为“努力悖论”（Inzlicht等人，2018年）。然而，“悖论”一词通常用于描述自相矛盾的陈述。在执行努力的情况下，体验到努力的厌恶性和价值性并不一定同时发生，因此它们并不严格矛盾。例如，在宜家效应的情况下，价值感是在努力之后产生的，而厌恶感则发生在努力过程中甚至之前。因此，使用“悖论”一词可能不够准确，更合适的称呼是努力的双重性。

认知努力是一种努力形式，这种双重性特征也适用于它。其中一个解释是“努力正当理由效应”（effort justification effect）。这一理论基于认知失调理论，认为努力的价值性是在努力之后为了缓解认知失调而产生的。换句话说，努力的不适感以及决定进行费力行动导致了失调状态，这促使主体重新评价这一行动，赋予其更大的价值（Aronson & Mills，1959年）。然而，有些情况表明，预期的未来努力（Olivola，2011年；Olivola & Shafir，2013年）或他人的努力（Olivola，2011年）也能增加感知价值，这使得这一理论受到质疑。此外，这一理论认为努力的价值性在很大程度上是主观构建的，本文对此保持中立态度。如果有一种更客观的解释，那么“正当理由效应”就不是最优的解释。

在认知努力研究中另一个有争议的问题是自我耗竭效应。自我耗竭指的是在完成一项认知要求较高的任务（例如解谜）之后，在随后需要认知努力的任务（例如抵制诱惑性食物）中动机下降的现象（Baumeister等人，2018年；Inzlicht & Schmeichel，2012年；Inzlicht等人，2014年；Kurzban等人，2013年；Muraven & Baumeister，2000年；Muraven等人，1998年）。然而，近年来对自我耗竭效应的存在提出了强烈质疑。不仅在相同的实验设计下未能重现这一效应（Hagger等人，2016年；Xu等人，2014年），而且最初支持这一效应的元分析（Hagger等人，2010年）也因出版偏倚和对小样本效应的过度强调而受到批评。经过调整这种偏倚后，分析表明效应大小并不显著（Carter等人，2015年）。鉴于这一重复性失败以及各种证据的支持，心理学中的直接成本理论和机会成本理论都承认了这一问题，并对自我耗竭效应的存在表示不确定。

注1：然而，如果自我耗竭效应确实不存在，那么人们在完成费力任务后仍然报告耗竭感的原因仍然不清楚。

另一个导致关于自我耗竭效应争论持续存在的因素是似乎可以缓解这一效应的各种调节因素（假设其存在）。实证证据表明，多种因素，如增加的激励（Muraven & Slessareva，2003年）、对自我控制能力的信念（Job等人，2010年、2013年）、自我肯定（Schmeichel & Vohs，2009年）以及其他干预措施（Derrick，2013年；Heckman等人，2012年），都可以减轻自我耗竭效应，使个体更愿意在后续的认知任务中付出努力。

直接成本理论中的解释（如表1第1节所示）强调了可消耗的代谢资源。这一解释因未能解释自我耗竭效应的各种调节因素而受到批评。很难找到一种单一的代谢资源，能够被所有这些因素所恢复。机会成本理论之所以流行，部分原因正是由于这种基于可消耗资源的限制。相比之下，机会成本账户采用了一种过程模型视角，提出自我消耗反映了从追求外部奖励向内部奖励的动机转变（Inzlicht & Schmeichel, 2012; Inzlicht et al., 2014）。该模型可以有效地解释某些调节因素，例如金钱激励，这些激励明显增强了与认知努力相关的外部奖励，从而提高了动机。然而，它难以解释那些不明显增加外部奖励的因素，比如自我确认或参与娱乐活动（例如吸烟或看电视）。表1. 当代对认知努力的心理学解释概览。下载CSV显示表格。

鉴于心理研究中关于认知努力的上述挑战，我建议引入一种新的视角来应对这些争论，即将认知努力概念化为行动的信息成本。这种视角基于香农（Shannon, 1948）提出的信息论框架。香农的理论成功地使用数学工具形式化了信息的概念。这种数学处理使得信息——原本是一个直观且抽象的概念——能够被理解为一个可量化的属性，类似于能量。在日常情境中，“信息”一词通常指的是新知识的获取。信息论保留了这种用法，并将新知识与不确定性联系起来，因为获取新知识可以被视为减少不确定性。我们的日常生活中充满了不确定性。例如，我们可能不知道明天的天气如何，或者提交的论文是否会被人文学术期刊接受。减少这种不确定性有助于我们更有效地适应环境。这种不确定性减少，或等效地说信息的增加，是用概率来数学衡量的。世界上的事件通常是概率性的，而不是确定性的。概率量化了一个事件发生的可能性，从而反映了与该事件相关的不确定性程度。事件的概率越高（例如太阳从东方升起），相关的不确定性就越低，当事件发生时获得的信息就越少。这种关系与我们的直觉一致：我们对一个事件的确定性越高，其实际发生的信息量就越少。这就是概率如何用量化的方法来衡量具有单一结果的事件的不确定性。

让我们再进一步考虑一个可能有多种结果的事件，比如明天的天气，它可能是下雨、晴天、多云或下雪。与这个事件相关的不确定性程度取决于这些可能结果的概率分布。当各种结果的概率相似时，分布相对均匀或随机。高度的随机性对应于高不确定性，因为我们对哪个结果会发生不太有信心。相反，当一个结果的概率明显高于其他结果时，分布的随机性较低。较低的随机性意味着较低的不确定性，因为我们可以更准确地预测实际结果。这种随机性与不确定性之间的关系与常见经验一致，比如回答选择题。当一个选项看起来比其他选项更有可能是正确答案时，我们对正确答案的不确定性就会减少。随机性与不确定性程度之间的关系与我们的选择题经验相符。

对事件的不确定性不是静态的，而是动态的。例如，我们可能最初对明天的天气非常不确定，关于可能天气结果的概率分布相对随机。然而，新的相关信息（比如观察到天空中的厚云层）可以更新这个分布，使其变得不那么随机，并减少不确定性。为了量化这种新知识所提供的信息量，我们可以测量获取新信息前后事件不确定性的减少程度。这涉及到计算两个概率分布之间的距离：获取新信息之前的分布（先验分布）和整合新信息之后的分布（后验分布）。Kullback-Leibler散度（KL散度）是一种用于量化这两个分布之间统计距离的数学工具。更直观地说，KL散度衡量了当我们用新信念更新旧信念时信念的变化程度。这些信念可能涉及当前状态，比如将信念从“我的老板是个难以相处的人”更新为“我的老板是个随和的人”。它们也可能涉及应该采取的行动，比如将信念从“我应该放松什么也不做”更新为“我应该赶上30分钟后离开的火车”。这些信念可以是心理上的，即代理人有意识地持有的信念，也可以是非个人的，即无意识运作的理解。更新信念的成本是通过旧信念中包含的信息与新信念中包含的信息之间的差异来衡量的。在信息论框架中，这种差异被称为KL散度。需要注意的是，这里的信念并不意味着个体明确表达的心理学信念。相反，我们使用这个术语来指代统计信念，包括明确的命题性心理学信念以及对世界和自我的隐含理解。这种解释在接下来的讨论中始终适用。

关键的是，虽然新知识有助于信念更新，但存储这些知识会消耗大脑有限的容量。这就是为什么获取新知识会产生成本，通常被称为信息成本。新知识提供的信息越多，它减少的不确定性就越多，消耗的成本也就越高。在信息论框架内，减少不确定性和获取信息是同一事物的两个方面。通过获取信息来减少不确定性。例如，通过获取新的天气信息（如云层状况或湿度水平）来减少对明天天气的不确定性。因此，每当不确定性减少时，就是获取了信息。然而，由于计算能力是有限的，为了减少特定的不确定性而获取信息会消耗一部分这种有限的容量。这往往会牺牲使用该容量进行其他信息获取的潜在好处，这就构成了成本（另一种看待这种二元性的方式是，减少不确定性总是会带来复杂性成本，因为新信息意味着增加了信念。然而，如果复杂性妨碍了个体在世界上导航的能力，那么复杂性可能是代价高昂的——换句话说，复杂性可能会消耗太多用于获取其他有用信息的容量）。重要的是，这种解释也表明直接成本账户与机会成本账户是兼容的。消耗有限的容量会带来特定不确定性减少的直接成本，而伴随的、其他可能的不确定性减少所失去的好处则构成了机会成本。

这种信息论框架已经扩展到解释人类活动，基于人类活动是信息处理活动的观点（van Dijk et al., 2010; Tishby & Polani, 2011）。在这种背景下，感知是指更新个体对世界状态的理解。这与我们的直觉一致：感知是通过整合新的感官信息来改变我们对世界的理解。这是一个将环境中的新信息整合到个体理解中的过程。行动则朝相反的方向工作。行动是通过个体向环境中插入信息来更新世界状态的变化。例如，假设当前状态是待在家里，而现在我正离开家去咖啡馆；如果没有去咖啡馆这个行动，我的下一个状态仍将保持待在家里。正是通过这个行动，我的下一个状态变成了在咖啡馆里。从这个意义上说，行动的实施更新了个体将到达的状态，即更新了状态转换。这就是为什么各种计算框架将行动形式化为状态转换。可以看出，尽管感知和行动的目标不同（识别世界的当前状态与确定要采取的状态转换），但它们都考虑了当前状态。

由于这两种主要的人类活动可以被形式化为信息处理，因此它们的相关成本也可以用信息成本来量化。感知的成本指的是个体的世界信念更新的程度，这可以通过先验分布和后验分布之间的Kullback-Leibler（KL）散度来衡量。行动实施的成本指的是状态转换更新的程度，也通过状态转换的先验分布和后验分布之间的KL散度来衡量。前面的讨论提供了一种理解行动成本的数学方法。正如我们下面将探讨的，采用信息论视角的研究将认知努力定义为心理行动的成本。因此，需要解释什么是心理行动。如前所述，信息论方法将行动理解为基于当前状态和未来状态的信息的状态转换改变。心理行动通常与物理行动相对立。虽然关于如何区分两者仍有持续的争论，但我采用了哲学中广泛使用的一个标准（Fiebich & Michael, 2015），该标准将物理行动定义为直接导致身体状态变化的行动，而心理行动则不是。根据这个标准，我将物理行动定义为改变身体状态转换，而将心理行动定义为改变心理状态之间的转换。在这种背景下，心理状态主要指的是注意力的分配，无论是明确的还是隐含的。注意力分配调节了与身体状态相关的输入的精确度（参见神经增益）。这就是心理行动和物理行动相互联系的地方。

以下例子可能有助于澄清这种区别。假设你感觉到身后有一个飞行的物体。如果你选择举起手来保护后脑勺，这就是一个物理行动。这样的行动直接改变了你的身体状态的轨迹。如果没有这个行动，你的身体状态将从后脑勺完好无损转变为受损。然而，有了这个行动，状态则转变为保护后脑勺完好无损。相反，如果你没有移动手，而是将注意力转移到身后的声音上以确认是否有飞行的物体，这就是一个心理行动。心理行动不会直接导致身体状态的变化；相反，它更新了你的注意力状态的轨迹。如果没有这个心理行动，你的注意力可能仍然集中在前面的物体上。有了这个心理行动，你的注意力从向前集中转移到向后集中。

根据这种逻辑，认知努力可以理解为从先验分布到心理状态转换后验分布的距离。由于现有的信息论工作对这些先验和后验分布有不同的理解，接下来我将比较这些工作，以得出最佳的解释。

采用信息论视角来定义认知努力的现有工作实际上展示了三种不同的解释。主动推理工作提供了其中之一（Parr et al., 2023）。然而，尽管主动推理工作明确指出认知努力中的先验分布是习惯性分布，但它并没有明确指出后验分布是目标导向的分布——这也是我将在本节中论点的核心。这种澄清为在第5节和第6节中采用主动推理账户来解决心理学挑战做准备。此外，由于还有其他两种采用信息论视角对认知努力的理解，因此有必要将主动推理定义与其他两种进行比较。在本节中，我还将简要比较并提出如何解释自我消耗效应的复制失败，并将其作为支持认知努力的主动推理账户的初步证据。在主动推断框架内的认知努力
Parr及其同事最近发表的一篇论文提出了一个关于认知努力的主动推断定义，将其理解为习惯分布（也称为先验分布）与情境敏感分布（也称为后验分布）之间的Kullback-Leibler（KL）散度。我认为这种情境敏感分布对应于目标导向分布。所谓目标导向分布，指的是目标状态的表征会影响心理行为的分布。这里的目标准表征是对未来状态的语义化预期，例如，我明确预期想要吃一些食物。这种与对未来状态的非语义化预期（如无意识地维持血糖水平在适当范围内）形成对比。因此，行为的目标导向分布意味着行为受到语义化表达的未来状态预期的影响。例如，如果在咖啡馆购买三明治的行为是由想要食物的语义化预期驱动的，那么它就是目标导向的；而如果是出于维持血糖稳态的非语义化预期而进行的，则是习惯性的。

这两种行为类别之间的区别在心理学研究中已经得到了充分的证实。习惯性行为被认为依赖于情境的表征以及该情境与特定反应之间的学习关联（Wood & Rünger, 2016）。习惯性行为的前提是习惯的形成，这涉及到情境（例如咖啡馆）、反应（例如购买三明治）和奖励（例如缓解饥饿）之间强烈关联的建立。一旦这些关联牢固建立，再次遇到类似情境并识别出它（例如咖啡馆）时，就会自动触发相应的奖励反应（例如购买三明治来缓解饥饿）。这种自动触发关联反应的过程构成了习惯性行为的实现。这种解释突出了习惯性行为执行的情境依赖性：通过将当前情境识别为之前经历过的情境，相应的习惯性反应被激活。相比之下，目标导向行为不仅依赖于情境识别，还依赖于对未来状态的语义化预期。习惯性行为与目标导向行为的关系通常表现为个体优先选择习惯性行为，只有在检测到情境变化时，才会调用语义化表征来影响行为的选择和执行，从而导致目标导向行为。

主动推断对习惯性行为和目标导向行为的观点与心理学理解是一致的。它将习惯性行为定义为完全基于记忆中的状态-反应关联的状态转换，而目标导向行为则是由对未来状态的语义化预期引导的状态转换（Maisto et al., 2019; Pezzulo et al., 2015）。当一个人遇到以前经历过的情况（例如进行正式演讲）且那种情况下的常规反应（例如使用特定的技术术语）是可靠的时候，他们会根据记忆从一个状态转换到另一个状态。但如果情况是新的或不同的（例如与领域外的人进行非正式交谈），或者他们记忆中的反应不可靠时，个体就会根据对接下来会发生什么的预期来决定如何行动（例如，预期领域外的听众能够理解演讲内容）。

值得注意的是自动反应与习惯性反应之间的区别。自动反应是由生物学决定的，而习惯性反应则是通过反复的关联学到的。由于自动反应是生物学决定的，它们很难被改变，甚至几乎是不可能的。例如，惊跳反射是对突然刺激的快速反应，它是与生俱来的，基于身体的生物结构，不需要学习。它的触发速度极快，几乎没有机会进行刻意抑制，因此很难被改变。相比之下，习惯性反应是后天习得的，可以有意识地调节。因此，克服习惯性反应主要是认知努力的目标。

以一个具体的例子来说，想象一下你第一次见到姻亲，他们准备了一道你非常不喜欢的菜。尽管这种社交情境是新的，但品尝到糟糕菜肴的经历却是重复的。过去遇到这种情况的经验塑造了习惯性反应。根据文化背景的不同，这些习惯也会有所不同。在更严格的文化中，人们可能会养成掩饰厌恶的习惯；而在鼓励自由表达的文化中，人们可能会养成公开表达厌恶的习惯。在这种情况下，表达厌恶的冲动和掩饰厌恶的冲动都是通过先前的经验形成的习惯性反应。相比之下，吃糟糕食物时胃部的恶心感和呕吐的冲动是自动反应，它们是与生俱来的，很难被刻意抑制。

我认为，在主动推断对认知努力的解释中提到的情境敏感分布与目标导向分布的概念完全一致。这一观点得到了两组证据的支持。首先，Parr等人（2023）指出了两种情况下认知努力不存在的情形：冷漠状态和无法解决的不确定性情境。我将这两种情况都理解为缺乏对目标状态的语义化表征，因此影响了心理行为。冷漠表示普遍缺乏兴趣，意味着对未来结果没有任何预期。这种预期的缺失意味着这些表征不会影响身体或心理行为的选择。关于无法解决的不确定性情境，重新审视主动推断理论是有启发性的，该理论将目标状态定义为具有高但可解决不确定性的状态（Parr et al., 2022）。在这里，不确定性指的是个体对世界的内部（统计）信念与实际世界状态之间的不匹配。长期减少这种差异是代理的最终目标。因此，感知、行为和预期（后者是行动规划的基础）都有助于减少这种不确定性。预期能长期减少不确定性的状态（例如饿的时候获取食物）是被期望的，而没有可解决不确定性的状态则不是。如果所有状态都缺乏可解决的不确定性，那么就不会期望特定的未来状态，因此行为不会受到预期未来状态表征的影响。

其次，追溯“情境敏感”这一术语到早期的主动推断文献（Friston et al., 2016），可以看出其用法与行为主义心理学中的用法是一致的（Thrailkill & Bouton, 2015）。在这种心理学传统中，情境不敏感的行为指的是习惯性行为，而情境敏感的行为则是目标导向的行为。从这个角度来看，主动推断研究者也可以使用“情境敏感分布”来指代目标导向分布。因此，主动推断的工作实际上将认知努力定义为从习惯性心理行为到目标导向心理行为之间的Kullback-Leibler（KL）散度。这种散度相当于更新心理状态转换所需的信息成本，即从遵循习惯性路径转变为遵循目标导向路径所需的信息成本。

实际上，除了主动推断框架外，还有两种采用信息论视角的解释也提出了认知努力的计算定义。一种基于强化学习（Gershman, 2020; Lai & Gershman, 2021; Lancia et al., 2023），另一种源自Zénon及其同事的工作（Zénon et al., 2019）。为了支持我采用主动推断解释，我将简要回顾这两种解释，并认为它们作为认知努力的表述不够合适。

4.2.1. 与强化学习工作的比较
在强化学习解释中，认知努力被定义为心理行为的边际分布与状态依赖分布之间的散度。我从至少两个角度质疑这一定义。首先，我质疑心理行为的边际分布是否真的存在。如第3节所讨论的，行为可以被视为状态转换，它用于更新或重新导向原有的状态转换轨迹。在我看来，采取任何形式的行动都必须考虑当前状态。例如，正是通过考虑当前状态（例如我头顶上方有一个飞行物体）及其可能的转换（例如物体可能会击中我的头部），个体才会启动另一个转换（例如举起手来保护头部）。这些考虑有时可能是语义化表达的（例如如果我现在不采取行动就会被击中），也可能以非概念化的形式出现（例如一种普遍的威胁感）。从数学角度来看，边际分布是状态独立的。然而，行为是状态依赖的，受到当前状态和相关潜在状态转换的影响。因此，心理行为的分布不能被描述为边际分布。

其次，强化学习研究将后验分布定义为心理状态依赖的分布，这引起了担忧。如上所述，习惯性行为依赖于当前状态和状态-反应关联，而目标导向行为不仅依赖于这些因素，还依赖于对未来状态的语义化预期。在这方面，强化学习将认知努力中的后验分布等同于习惯性分布。因此，认知努力被定义为从边际分布偏离到习惯性分布的成本。这意味着当个体从所谓的状态独立心理行为（即边际行为分布）转变为习惯性心理行为时，就会产生认知努力。然而，认为进行习惯性行为会产生认知努力的观点与我们直觉理解不太一致。

4.2.2. 与Zénon等人工作的比较
Zénon及其同事（Zénon et al., 2019）将认知努力定义为包含三种类型的成本。第一种成本涉及使用新的感官信息来更新个体对当前状态的表征。例如，如果我利用视觉线索提醒自己面对的是非学术听众而非学术听众，就会产生这种成本。这种成本的大小取决于更新过程中使用的信息量。第二种成本涉及使用状态信息来更新触发习惯性行为的奖励反应。例如，当我意识到自己面对的是非学术听众时，我可能会将心理习惯从使用正式术语调整为使用更简单的日常语言。这里的成本相当于更新习惯性反应所需的信息成本。第三种成本涉及使用与目标相关的信息来将反应从习惯性行为调整为目标导向行为。例如，如果我发现听众对我的某个部分感到困惑，我可能会设定澄清这一部分的目标。这个目标促使我将反应从习惯性心理行为（例如在心中组织下一部分的词语）调整为目标导向心理行为（例如在心中寻找关于困惑部分的更多细节）。这种成本相当于将心理行为从习惯性调整为目标导向所需的信息成本。

可以看出，主动推断解释仅将Zénon等人工作中提到的第三种成本视为认知努力。具体来说，在主动推断中，认知努力被定义为在实现目标的过程中偏离心理习惯的信息成本。相比之下，Zénon等人的解释包含了额外的元素。我认为主动推断解释在两个方面优于Zénon等人的解释：首先，它在解释心理学中的几个持续争论方面具有很强的解释力（如第5节和第6节所讨论的）；其次，它为解决所谓的自我损耗效应的复制危机提供了一个有前景的视角。在这里，我主要关注Hagger等人（2016）报告的实验发现，这些发现被认为是支持自我损耗效应无法复制的重要证据。Hagger等人使用序列任务范式来测试处于损耗状态的参与者在第二项自我控制任务中的表现是否较差。然而，如果我们采用这样的理解：认知努力是从习惯性心理行为中偏离的成本，那么就可以理解为什么Hagger及其同事使用的实验范式中不会出现自我损耗效应。在Hagger及其同事的研究中，损耗组被要求在第一个自我控制任务中比对照组付出更多的认知努力。在最初的任务中，参与者需要在屏幕上看到字母“e”时按下按钮。损耗组被指示如果字母“e”出现在元音旁边或距离元音一个字母的位置时则不要做出反应，而对照组则没有得到这样的额外指示。然而，结果显示两组在随后的自我控制任务中的表现没有显著差异。这一发现被视为反对自我损耗效应存在的证据。据我理解，损耗组和对照组在第一个自我控制任务中都没有形成心理习惯。因此，执行第一个自我控制任务并没有涉及到任何从既定习惯中的偏离。根据主动推理理论的定义，实验中的参与者并没有付出认知努力。由于自我损耗效应通常被认为是由过度认知努力引起的，我们可以预期两组中都没有出现自我损耗效应。

我声称两组在最初的自我控制任务中没有形成习惯的原因与Hagger及其同事研究中使用的试验数量较少有关。在他们的实验中，参与者总共只完成了170次试验（20次练习试验和150次主要试验），内容是识别字母并作出反应。这个数量可能不足以建立起每当屏幕上出现字母“e”时就按下按钮的习惯反应。此外，现有的动物研究表明，响应（例如按按钮）和情境线索（例如字母“e”出现在元音旁边或距离元音一个字母的位置）之间的重复配对并不一定会导致习惯的形成（Colwill & Rescorla, 1985）。习惯的形成通常需要更广泛的训练和更复杂的实验设计。鉴于这些条件，我们有理由质疑Hagger及其同事的研究中的参与者是否真的形成了习惯。

这种对偏离习惯与自我损耗效应之间联系的解释与最近关于Hagger等人复制失败的研究评论一致（Baumeister & Vohs, 2016; Dang, 2016）。Baumeister设计了“e-跨越任务”来检测自我损耗效应。最近，Baumeister及其同事指出，Hagger等人项目中的“e-跨越任务”跳过了必要的习惯形成阶段。在Baumeister及其同事的原始设置中，习惯是在每次出现“e”时都进行跨越操作（Baumeister et al., 1998）。相应地，在Hagger等人的设置中，习惯应该是当参与者看到“e”时按下计算机键。然而，这种习惯形成阶段并没有包含在Hagger等人的研究中（Hagger et al., 2016），这被认为是复制失败的一个原因（Baumeister & Vohs, 2016; Dang, 2016）。此外，Dang的评论重新分析了Hagger等人项目的数据，发现在损耗条件下，参与者报告的努力感与他们的任务表现呈正相关。这种正相关表明了努力感与损耗效应之间的关联。

有些人可能会觉得难以接受Hagger及其同事的研究中的参与者没有付出认知努力这一观点。然而，如果我们区分认知努力和行动实施的整体认知成本，这一说法就更容易理解了。在主动推理框架中，认知努力被定义为从习惯性心理行为转向目标导向心理行为的成本，这只是实施行动所涉及的更广泛认知成本的一个组成部分。为了选择一个适当的行动，个体可能需要参与多个心理过程。这些过程包括更新对当前状态的理解、更新与情境相关的反应，以及在面对新或不熟悉的情境时，调整反应方式，使其与目标状态保持一致。所有这些过程都需要记忆检索和信息维护，这会消耗有限的认知资源，因此是具有成本的。我认为认知努力只是行动实施所涉及的总认知成本的一部分。下图（图1）展示了认知努力与行动实施的整体认知成本之间的关系。

图1. 行动实施的整体认知成本的组成部分。

这张图说明了行动实施的整体认知成本包括三个主要部分：更新“我处于哪种情境”理解的 costs、更新“在这种情境中有哪些习惯性行为”理解的 costs，以及从习惯性控制转向目标导向控制的 costs，即认知努力。这些组成部分与整体认知成本的中心概念相关联。

根据这一区分，论文预测长期执行习惯性行为也可能导致认知疲劳。尽管这类行为在认知上不费力，但它们仍然会消耗认知资源。这一预测值得进一步研究。在接下来的章节中，我将详细阐述将认知努力定义为从习惯性心理行为转向目标导向心理行为如何解决心理学研究中的关键问题。尽管主动推理学者没有强调这一点，但我将指出，主动推理理论实际上与将努力定义为伴随某种行动的主观感受是一致的。更具体地说，主动推理理论认为这种行为是从习惯性路径向目标导向路径的偏离。正如哲学讨论所指出的，当前的 effort 理论主要遵循两种方法：将 effort 视为由主体执行的行动，或将 effort 视为伴随某些行动的主观感受（Bermúdez, 2025; Bermúdez & Massin, 2023; Wolpe et al., 2024）。主动推理理论属于后者，通常被称为基于感受的 effort 定义（Bermúdez, 2025; Bermúdez & Massin, 2023）。因此，主动推理理论与最近那些主张将 effort 定义为主观感受并拒绝使用“effort exertion”等表达的哲学讨论是一致的（Wolpe et al., 2024）。与这种哲学观点相比，主动推理理论更清楚地指出了伴随 effort 感受的行动类型，解释了 effort 感受的出现是因为行为偏离了习惯以实现目标。通过这种方式，将 effort 与其伴随的行动区分开来，并使用更精确的术语，可以帮助减少该领域的混淆。

主动推理理论与哲学讨论的另一个共识是，它认为 effort 感受源于计算能力的消耗，而这种消耗与广泛的神经活动有关。最近的哲学研究也表达了这一观点，认为认知努力可能以多种方式表现出来——与注意、记忆或思维转变相关的控制信号可能在特定情境中构成认知努力（Shepherd, 2023）。正如在后续关于“自我损耗效应”的章节中讨论的，损耗效应中观察到的多样性调节因素与这种对 effort 的广泛理解密切相关。然而，现有的哲学研究往往强调 effort 的负面方面，并在一定程度上基于这一方面来定义 effort（Bermúdez, 2025; Bermúdez & Massin, 2023）。相比之下，主动推理理论旨在同时强调 effort 的两个方面，即它的负面性和其价值性。这种强调更符合关于 effort 双重性质的心理学发现。

主动推理理论还可以被视为融合了不同基于感受的 effort 定义的见解。一种哲学定义将 effort 感受视为抵抗某种冲动所产生的感受（Bermúdez, 2025）。主动推理理论认同这一观点，并通过将相关冲动识别为习惯性行为轨迹来进一步发展它。主动推理理论还将偏离的成本理解为习惯性轨迹与目标导向轨迹之间的差异，这反映了亚个人的比较过程，并与比较者理论一致。此外，它将 effort 感受视为偏离的成本，这与基于选择的理论中的成本计算思想相符。未来的研究应该进一步探讨信息理论方法和哲学讨论之间在理解 effort 方面的这些联系。

此外，主动推理理论关于认知努力的观点也可以得到实证研究的支持。Morsella及其同事的研究表明，持有不相容的行动意图本身就会引发冲突的主观体验（Morsella et al., 2009）。主动推理理论认为认知努力是由于两种意图之间的分歧所产生的主观冲突感受：即采取习惯性行动的意图和采取目标导向行动的意图。

正如我在引言中提到的，尽管关于认知努力的计算理解已经提出了一段时间，但研究人员尚未解释计算理论如何解决心理学中的关键问题。现在，我将把主动推理理论与心理学研究中的这些关键问题联系起来。在这一节中，我将重点讨论 effort 的双重性质，即认知努力既被认为是令人不快的，也被认为是有价值的。在第六节中，我将回到自我损耗的问题。

5.1. 负面性

正如第2节所指出的，认知努力是令人不快的，表现为个体对认知上费力的任务的厌恶和回避（Dreisbach & Fischer, 2015; Kool et al., 2010; Kurzban, 2016; Shenhav et al., 2017）。如果将认知努力理解为从习惯性心理行为中的偏离，这种负面性就变得可以理解了。需要从习惯性路径转向目标导向路径表明旧的世界模型与实际世界状态之间存在不匹配。正是这种不匹配导致了不愉快的感觉。重要的是，不匹配可以有不同的形式，并不是所有的不匹配都会产生负面性。在费力的情况下，不匹配有两个关键特征：（1）它涉及世界的模型，而不仅仅是关于世界的单个信念；（2）它表明在旧模型下不确定性增加了。模型是指关于世界的一系列相互关联的信念，它是长时间重复经验的结果，反映了人们对世界的普遍理解。相比之下，个体信念代表了更具体的、特定情境下的理解。因此，模型层面的不匹配表明了普遍理解上的广泛不准确，而个体信念层面的不匹配只表明了局部不准确。

进一步来说，如果一种不匹配表明遵循旧模型带来的不确定性低于预期，那么这个模型就比个体认为的更准确。这种情况下不会产生负面性。只有当不匹配表明遵循模型带来的不确定性高于预期时，才会产生负面性。例如，如果一个意外的幽默结局让我笑了并表扬了我的朋友，那么这种不匹配是关于这个笑话的具体信念的不准确，但这并不挑战我对世界的普遍理解。或者，如果我最初担心一次工作面试，但后来发现它比预期的更顺利，那就是我的先前信念与实际体验之间的不匹配，但由于这种不匹配表明的不确定性低于预期，因此不会产生负面性。相比之下，在需要努力的情况下，习惯反映了人们对世界规律性的普遍理解（因为习惯是在长时间尺度上逐渐形成并融入到模型中的）。当遵循这些习惯不再带来曾经的价值时，采取需要努力的行动就变得必要了。在主动推理框架中，价值的降低意味着不确定性的增加。因此，需要偏离习惯性行动，即采取需要努力的行动，这表明现有的世界模型是不准确的，继续遵循它只会增加不确定性。正是这种信号引起了厌恶感。认知努力表明了与环境的不匹配。更直观地说，无法依赖熟悉的习惯表明世界不再像以前那样可预测或熟悉。这种陌生感的增加加剧了认知努力的厌恶性质。另一种厌恶感来源于有限认知容量的占用。如前所述，一个人的知识与现实之间存在不匹配。这种不匹配实际上驱使主体去获取额外信息，以确定哪些状态转换适合当前情境。这些信息正是当前状态（例如非学术听众）转化为目标状态（例如我认为应该让听众理解我的演讲）的方式。这些额外信息消耗了大脑有限的认知容量，从而减少了可用于其他心理任务的资源。人们可能会想知道这种解释与第二节中讨论的机会成本理论有何不同，后者将认知努力的成本解释为与放弃的替代方案相关的收益损失（Kurzban等人，引用2013）。从计算角度来看，这两种解释之间的差异变得明显。在机会成本理论中，认知努力的成本是基于预期失去的替代方案收益来计算的。然而，在主动推理理论中，这种成本是通过衡量从习惯性行为到目标导向行为的分歧来计算的。从计算角度来看，机会成本计算非常耗费资源且可能难以处理。替代方案的数量众多，评估所有替代方案以确定总的机会损失将消耗大量认知资源。此外，鉴于时间限制，全面考虑所有替代方案通常是不现实的。主动推理方法提供了一个更易处理的解决方案，它只要求比较同一变量上的两个概率分布。作为节俭的生物，人类更有可能采用主动推理理论所描述的计算策略，即评估心理行为分布的变化。

5.2 价值性

与对认知努力厌恶性的各种解释相比，很少有心理学研究对其价值性提供了复杂的解释。我认为，将认知努力定义为偏离心理习惯也可以阐明其价值性。主动推理理论强调了与行为相关的两种价值：实用价值和认知价值（Smith等人，引用2022）。实用价值指的是实现特定目标的价值，而认知价值指的是获取关于环境的新信息的价值。新信息是有价值的，因为它有助于更全面地理解环境并支持长期生存。实用价值与结果相关：只有当结果满足目标要求时才能实现。相比之下，认知价值不依赖于结果。例如，参加学术会议既具有实用价值也具有认知价值。假设一个人参加会议的目标是展示自己的工作。成功的演讲产生了实用价值，因为它涉及到实现职业奖励的具体计划。相比之下，与他人社交和了解他们对研究的看法通常超出了这个计划，而是产生了新的信息，从而产生了认知价值。在需要努力的情况下，主体从熟悉的、习惯性的路径偏离到目标导向的、不太熟悉的路径。这种偏离被认为是产生新信息，因此产生了认知价值。从信息论的角度来看，认知努力中的厌恶与价值性的共存反映了在能力有限的主体中复杂性与准确性之间的常见权衡。此类主体的决策受到最小化复杂性减去准确性的净值的驱使——也就是说，在避免过度复杂性的限制下最大化准确性（Smith等人，引用2022）。准确性是有回报的，因为它表明表现与预期目标的一致性。相比之下，复杂性是代价高昂的，代表了更新后的世界表征与先前表征之间的差异程度。更新知识是费力的，因为它消耗了有限的认知容量，这些容量本可以分配给其他心理过程。对于偏离心理习惯的行为，其价值来源于准确性的提高，因为获取新的、特定于目标的信息增强了实现预期目标的可能性；厌恶感则来源于复杂性的增加，因为获取新信息消耗了有限的认知资源。这种权衡体现在日常经验中。在不熟悉的情境中，我们必须减少对习惯性反应的依赖，更多地了解当前情境如何导致期望的结果。将这些新信息整合到我们的信念系统中会感到复杂，我们不喜欢这种感觉，但拥有这些信息提高了达成目标的机会，因此被认为是有价值的。因此，主动推理理论对认知努力的双重方面提供了一个令人满意的解释，即它反映了决策的核心要素。

6. 自我消耗效应和其他现象

在第4.2节中，我反驳了围绕自我消耗效应的复制危机，并说明了为什么Hagger及其同事工作的所谓复制失败实际上并不支持这种效应不存在的主张。现在我将展示如何理解自我消耗效应，即作为我在前一节中提到的复杂性与准确性之间权衡的结果。如前所述，对于能力有限的主体来说，认知复杂性是代价高昂的，必须加以限制。从习惯性行为偏离到目标导向的行为会增加认知复杂性，因此需要限制。我将自我消耗效应解释为主体如何限制偏离习惯的程度。我们人类隐含地依赖于消耗感作为信号，以防止我们过于偏离心理习惯和增加复杂性。

正如第5节所讨论的，限制复杂性的目的是为了确保有足够的认知资源用于当前目标之外的其他心理需求。正如主动推理框架所强调的，最小化不确定性是人类行为的最终追求。在这里，不确定性指的是个体对世界的内部理解与实际世界之间的不匹配。换句话说，最小化不匹配，或等效地，最大化匹配（即适应性），是最终目标。通过这种方式，获取实现目标的信息实际上是在追求目标状态的适应性提高。然而，无论是目标状态还是无目标状态都对个体的长期福祉都很重要。假设我在实验室进行斯特鲁普任务，我的目标是报告单词的墨水颜色（例如，将印有蓝色墨水的“red”报告为“blue”）。然而，假设实验室的天花板不稳定，有倒塌的风险。为了避免受伤，我必须分配足够的认知资源来注意天花板，尽管这与我的当前目标无关。在这种情况下，特定于目标的方面是屏幕上的彩色单词，而无目标的方面是可能危险的天花板。环境中的无目标方面指的是可能尚未被语义表征的方面（例如，应该注意掉落的天花板的明确想法），但这些方面仍然影响生存和福祉。认知资源必须在两种类型的请求之间适当分配。

自我消耗效应可以被视为一种机制，它限制了对特定于目标处理的资源分配，从而确保有足够的资源来处理无目标的、但可能至关重要的环境方面。根据定义，自我消耗效应表明获取无目标信息不足。这种无目标信息获取是一个主观估计，受多种因素影响，包括自我效能、情绪等。此外，这种主观估计是累积的：在给定时间段内对无目标信息获取的估计有助于总体估计的无目标信息获取。如前所述，无目标信息和特定于目标的信息获取竞争相同的有限计算容量。如果在过去的一段时间里，主体参与了消耗大量容量来获取特定于目标信息的密集认知任务，那么该时间段内的估计无目标信息获取量将会很低。这种估计会触发消耗感，阻止主体进一步参与特定于目标的信息获取。这种对自我消耗效应的理解意味着，缓解这种效应的调节因素通过提高对环境重要无目标方面的适应性来发挥作用。当这种估计的适应性提高时，对复杂性成本的约束就会降低，相关的消耗感也会随之减弱。下面，我将在这个框架内解释现有的关于缓解自我消耗效应的调节因素的研究结果（表2）。

表2. 缓解自我消耗效应的调节因素

在主动推理框架内还可以解释与认知努力相关的其他现象。由于篇幅限制，这里只提供两个进一步示例。第一个是日常观察到的现象，即练习可以减少，在某些情况下甚至可以消除认知努力。这是因为，通过足够的练习，个体形成了能够正确完成任务的心理习惯，而不需要引用目标状态来指导心理行为。在这种情况下，个体依赖于新建立的心理习惯。对这些习惯的偏离很小，因此认知努力也很小。第二个案例是目标分解可以降低认知努力。这是因为由子目标指导的心理行为较少的偏离习惯性行为。考虑解决一个困难数学问题的任务，这涉及各种心理行为，如集中注意力、检索相关知识和在心中模拟可能的解决方案。在这种情况下，习惯性的心理行为可能包括走神或在遇到困难时迅速放弃。如果将整个目标分解为较小的子目标，例如首先仔细阅读问题，然后回忆相关公式，接下来确定它们的应用方式，每个子目标所需的偏离习惯性行为的程度就会较小。因此，实现每个子目标所需的认知努力低于直接实现整个目标所需的认知努力。

6.6.1 结论性评论

本文迄今为止从主动推理框架中提取了认知努力的定义，这是一种越来越有影响力的解释认知和意识的方法。在这个框架内，认知努力是从习惯性行为偏离到目标导向的行为。尽管提出了另外两种基于计算的认知努力定义，一种基于强化学习，另一种来自Zénon等人的工作，但两者都存在重要限制。强化学习定义将认知努力定义为从状态独立的行为偏离到状态依赖的行为。然而，这种观点忽略了所有行为本质上都是状态依赖的，因为它们涉及主体对状态转换的调节以避免不良结果。Zénon等人提出的定义似乎描述的是实施行为的总体认知成本，而不是认知努力。主动推理框架内的现有工作尚未应用于心理学中关于认知努力的持续辩论。根据所提出的定义，所谓的自我消耗效应的复制失败可以解释为支持这种定义的证据，而不是其不存在的证据。努力的双重性可以理解为能力有限的个体在准确性与复杂性之间所做的必要但并不矛盾的权衡。自我损耗效应被解释为一种限制认知复杂性的机制，因为如果不加以限制，认知资源将不足以关注那些虽然无目标但仍然重要的环境因素。此外，自我损耗效应的各种调节因素也被视为影响行动实施复杂性的因素。除了对当前心理学术讨论的理论贡献外，采用主动推理来解释认知努力还具有现实意义，尤其是在日常生活中。正如多位学者所指出的，过度疲劳在现代社会中变得越来越普遍（Han, Citation2015）。许多人感到被众多要求所压倒，经常经历疲劳甚至职业倦怠。同时，社交媒体上的大量建议促使人们相信我们应该并且能够始终保持精力充沛和情绪积极。这种频繁疲劳的现实与持续积极的理想之间的矛盾会产生情绪紧张，甚至可能导致更严重的情绪障碍。综上所述，本文强调，对认知努力的回避和厌恶是能力有限个体的固有特征，不应将其误解为迟缓或懒惰。相反，它们起到了保护作用，有助于保留认知资源来处理那些无目标但可能具有重要性的环境因素，这对于长期生存和幸福感至关重要。认识到这一点有助于我们在日常生活中以更加同情和平衡的心态面对认知努力和努力回避的现象。在这方面减少自我指责和自我评判可能对心理健康产生积极影响。本文还指出了一些亟待进一步探讨的问题。例如，对认知努力与行动实施总体认知成本之间的区分需要进一步研究。此外，不同信息论观点下对认知努力的解释也需要更多研究。特别是，强化学习框架下的认知努力解释的局限性值得更深入的讨论，因为这一框架可能源自该领域长期以来的“无模型”传统，即倾向于将关于世界的先验信念排除在代理的构成要素之外。未来的研究可以更深入地解决这些问题。

热点排行