综述：用于联合行动与沟通的预测处理框架

【字体：大中小】 时间：2026年03月09日 来源：Physics of Life Reviews 14.3

编辑推荐：

　　本文综述提出了一种创新的、整合性的预测处理理论框架，旨在解释人类联合行动与沟通的认知神经基础。作者们认为，传统的基于特定个体（Agent-specific）预测模型的理论存在局限，因此提出了“个体中性（Agent-neutral）”预测模型作为新的核心机制。该框架主张，在成功的联合行动（如共同抬桌子、合奏音乐）或沟通（如自然语言对话）中，参与者并非仅预测自己或他人的单独行为，而是构建并使用共享的、中性的预测模型来预估集体行动的结果，并协同最小化关于这些集体结果的预测误差。文章系统阐述了该框架衍生的三个核心主张：1）协同个体使用中性预测模型来优化集体结果；2）他们通过言语和非言语沟通交互式地更新与对齐这些模型；3）中性模型支持动态的角色分配。本文不仅梳理了支持这些主张的计算模型与实证证据，还指出了未来的研究方向，并探讨了该框架在理解人类社交性、发展障碍及人机交互等领域的广泛应用潜力。

在探索人类如何超越个体局限，通过精妙协作达成共同目标这一核心问题上，认知科学、神经科学和社会科学面临着巨大挑战。传统的解释往往侧重于共享意图、集体承诺或心智理论等概念，但一个能够统一解释从物理协同（如共舞）到语言对话等各种形式联合行动的计算框架仍亟待建立。近期，一篇题为《A Predictive Processing Framework for Joint Action and Communication》的综述文章，为我们带来了一个令人耳目一新的理论视角。该综述的核心，是提出并详细阐述了一个基于“个体中性（Agent-neutral）预测模型”的整合性预测处理框架。

1. 从“特定个体”到“个体中性”：预测模型的范式转换

预测处理理论认为，大脑不断生成关于世界的内部模型，并利用这些模型预测感官输入，通过最小化预测误差来感知世界和指导行动。以往将这一理论应用于社会互动时，通常假设个体拥有并运行着多个模型：一个用于预测和控制自己的行动，另一个（或多个）用于模拟和预测他人的行动与意图。这被称为基于特定个体的模型。

本文提出的新框架则实现了一个根本性的转变：从特定个体视角转向个体中性视角。其核心思想是，在成功的联合行动中，参与者会过渡到使用一个共享的、个体中性的预测模型。这个模型的关键特征在于，它预测的是集体行动的聚合结果，而不再区分结果是由“我”还是“他人”的贡献所导致。例如，当两人一起抬一张桌子时，个体中性模型预测的是桌子在合力的作用下会如何运动，而不是分别预测“我施加的力会使桌子怎样”以及“他施加的力会使桌子怎样”。

如图1所示，左侧展示了传统的特定个体模型路径：个体观察同伴动作，推断其意图，然后规划自己的互补行动。右侧则展示了个体中性模型路径：个体直接推断由双方共同控制的任务相关变量（如总所需力度），并基于此来规划行动。这种转变带来了多方面的优势：它减轻了认知负荷，因为无需构建和整合多个模型；提高了协调效率，允许灵活的在线上调整（如一方自动补偿另一方力度的不足）；并且能优雅地扩展到多人场景，避免了为每个参与者单独建模的复杂性。

2. 核心主张一：协同个体使用共享的个体中性预测模型

基于上述范式转换，文章提出了三大主张。第一项主张是，协同个体会使用共享的个体中性预测模型来预测和优化集体结果与联合行动。

这意味着，在像二重奏、团队运动或共同搬运物品这样的任务中，参与者的大脑并非仅仅在监测“我的动作结果”与“他的动作结果”，而是在监测“我们的动作结果”。他们努力最小化的是关于这个集体结果的预测误差。一些计算模型，如“一人二重奏（duet for one）”、“互动推理（interactive inference）”和“想象中的我们（imagined we）”，已经以不同的方式实现了这种个体中性的思想。

实证研究也为此提供了支持。例如，脑电图（EEG）研究发现，在二重奏演奏中，那些改变了和声（一种集体结果）的错误，比仅改变单个音符的错误，会引发更大的误差相关电位变化。功能磁共振成像（fMRI）研究也识别出了一个在联合行动中监控错误的特定脑网络。这些发现暗示，神经系统确实存在对集体结果层面的监测机制。

3. 核心主张二：通过沟通交互式地更新与对齐中性模型

然而，共享的模型不会自动完美对齐。世界的动态变化和个体间的差异要求模型必须能够被更新和校准。因此，第二项主张指出，协同个体会通过言语和非言语沟通，交互式地更新他们的个体中性模型，以更好地对齐它们。

这个过程被称为“互动式对齐（interactive alignment）”。它涉及一个微妙的平衡：大部分时间，参与者需要按照共享模型的预测行事，以保证行动的可预测性和协调性；但当模型出现偏差时，又需要有人主动引入“意外（surprise）”来促使对方更新模型。例如，在车队中，头车突然驶入一条不熟悉的路线，这会暂时“惊吓”后车，但也传递了关于道路状况的新信息，促使后车更新其内部地图。

在感觉运动沟通中，这种策略表现为：当一方拥有更多关于共同目标的信息时（如知道要搬到哪里），会有意地使自己的动作更加夸张或清晰，以降低同伴的不确定性，帮助其推断出正确意图。在语言对话中，说话者交替使用可预测的表述来维持共同语境，并引入新信息（制造意外）来丰富和更新这个共享的理解框架。研究表明，大型语言模型（如GPT-4）所依赖的“下一个词预测”目标，本质上与人类对话中通过预测和最小化意外来对齐意义的过程相似。

4. 核心主张三：共享中性模型支持动态角色分配

许多联合行动涉及任务分解和角色分配，如团队烹饪或搬家。第三项主张认为，共享的个体中性模型天然地支持这种动态的角色分配。

与预设了固定角色的特定个体模型不同，个体中性模型本身并不绑定具体执行者。这为协同个体根据任务进展、个人能力或突发情况，灵活地协商、承担或交换子目标和角色提供了基础。例如，一个团队成员在完成自己的分内工作后，可以动态地去协助另一位遇到困难的同伴。这种灵活性源于模型关注的是集体目标的实现，而非谁做了什么。

当然，动态分配也有成本，它需要持续的沟通和协调。因此，在长期合作中，群体会在灵活性和稳定性之间进行权衡，最终可能形成稳定的角色惯例，以减少每次互动的认知成本。计算模型显示，通过推断彼此负责的任务，小团队能够快速对齐计划、协调工作。

5. 框架的意义、联系与展望

这个新框架将联合行动与沟通置于统一的预测处理原理之下，为理解人类社交的个体基础提供了全新视角。它与强调“第二人称”视角的社会认知研究、关注文化实践与共享期望的“通过他者思考”框架等理论脉络相呼应，并通过计算神经科学的原理将它们更紧密地联系起来。

该框架催生了一系列新颖的实证预测，例如：协同个体的大脑应能监测并最小化关于集体结果的预测误差；干扰这些中性预测会损害协调表现；在角色分配任务中，低效的安排会引发特定模式的预测误差等。验证这些预测需要开发新的实验范式和神经记录技术（如超扫描技术）。

在应用层面，此框架潜力巨大。它有助于我们深入理解从厨房协作、外科手术到音乐合奏等各种现实世界的联合行动。在临床方面，它为研究自闭症谱系障碍等社交沟通障碍提供了新思路，这些障碍可能源于个体中性模型构建或互动对齐机制的异常。在技术领域，该框架为设计能与人类进行自然、高效交互的人工智能和机器人系统指明了方向，提示我们培养机器的“个体中性”表征可能对实现真正的人机协作至关重要。

总之，这篇综述提出的个体中性预测处理框架，标志着我们在理解人类如何“一起思考、一起行动”的道路上迈出了重要一步。它揭示，我们的预测大脑本质上是互动式的，我们通过共享的模型推断共同居住的世界，并协同规划改变世界的行动方案。这不仅深化了对人类独特社交能力的科学认识，也为连接从脑科学到人工智能的多个前沿领域搭建了理论桥梁。

热点排行