张航课题组揭示大语言模型作为精准“心理侧写师”的内在推理机制

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年05月31日 来源：北京大学心理与认知科学学院

编辑推荐：

　　然而，这一前沿应用也引出了两个递进的核心科学问题：首先，大语言模型是否真的能够精准捕捉并重构出个体复杂的心理特质网络？其次，如果大模型具备这种能力，其背后的机制究竟是依赖于真正的心理学推理，洞察并内化了人类的深层心理结构，还是仅仅是对海量训练语料中表面词汇的语义模式匹配？ 2026年4月，北京大学心理与认知科学学院、北京大学IDG麦戈文脑科学研究所、北大-清华生命科学联合中心张航课题组，与北京大学智能学院贺笛课题组合作，在国际人工智能顶会ICLR发表题为“From Five Dimensions to Many: Large Language Models as Precise and Interpretable Psychological Profilers”的研究论文

我们在做MBTI或各种心理测试时，常常会发现一个有趣的现象：一个自测高度内向的人，往往在社交焦虑等测试上也会获得偏高的得分。事实上，人类的各项心理特质从来都不是孤立存在的，而是相互交织、协同变化，构成了一张错综复杂的心理特质网络。近年来，大语言模型（LLMs）在模拟人类行为和群体特征方面展现出了惊人的潜力，甚至已被广泛应用于生成具有特定人格的虚拟智能体。然而，这一前沿应用也引出了两个递进的核心科学问题：首先，大语言模型是否真的能够精准捕捉并重构出个体复杂的心理特质网络？其次，如果大模型具备这种能力，其背后的机制究竟是依赖于真正的心理学推理，洞察并内化了人类的深层心理结构，还是仅仅是对海量训练语料中表面词汇的语义模式匹配？

2026年4月，北京大学心理与认知科学学院、北京大学IDG麦戈文脑科学研究所、北大-清华生命科学联合中心张航课题组，与北京大学智能学院贺笛课题组合作，在国际人工智能顶会ICLR发表题为“From Five Dimensions to Many: Large Language Models as Precise and Interpretable Psychological Profilers”的研究论文。该研究系统评估了大语言模型重建人类心理特征网络的能力，发现大模型不仅能精准捕捉心理特征间的复杂关联，还能主动过滤人类自评数据中的随机误差与测量噪声，从而提纯并重建出复杂心理结构。

研究团队设计了一套创新的零样本角色扮演预测范式。研究者首先将真实人类被试的大五人格量表得分（仅包含20个题目的数字评价）作为极简输入，在此基础上要求多种前沿大语言模型扮演该特定个体，用以预测该个体在感知压力、应对方式、特质焦虑等另外9个不同心理学量表上的具体逐题得分。在分析阶段，与以往仅关注单题预测准确率的常规一阶方法不同，该研究创新性地引入了二阶分析，重点对比人类真实数据与模型生成数据在输入大五人格与输出待预测心理特质间的相关性矩阵上的结构一致性。这种宏观视角跳出了对孤立得分的表层拟合，严苛检验了大模型是否真正复现了人类心理特征协同变化的深层网络。

图1. 实验核心流程图

注：展示了以大五人格得分为极简输入，利用大语言模型预测多维度心理学量表得分，并通过对比相关性矩阵进行二阶分析的零样本角色扮演预测范式。

研究发现，所有参评大模型不仅能高度还原人类真实的心理特征网络，还系统性地增强了各项特征间的相关性，研究团队将这一现象定义为“结构放大（Structural Amplification）”。且该放大倾向越强，模型的预测准确率越高。为了揭开其内在机理，研究团队进行了信度分析与双向噪声干预。结果表明，大模型生成数据的内部一致性显著高于人类真实数据。另一方面，降低人类数据噪声会增强其内在的相关结构，而向模型预测中注入噪声则会显著削弱其结构放大效应。这种双向干预的结果印证了大模型能够自发滤除人类自评数据中的随机测量噪声，从而提纯并重建出更符合理论预期的底层心理网络。

图2. 实验一主要结果

注：证实了大模型不仅能高度还原人类真实的心理特征网络，还会系统性地增强特征间的相关性（放大系数k > 1.0），展现出“结构放大”现象；且该放大效应越强，模型的整体预测准确率越高。

此外，为了打开大模型推理的“黑箱”，研究团队解析了具备深度思考能力模型的内部推理轨迹。分析表明，大语言模型采用了一种系统的两阶段推理机制：在信息选择阶段，模型并非依赖表面的语义关联，而是优先识别和提取高维度的心理学因子，展现出概念驱动的特征；在信息压缩阶段，模型会将数字输入提炼为高度浓缩的自然语言摘要。研究发现，这段摘要并非原始数据的简单重复，模型仅凭该摘要即可在一定程度上复刻“结构放大”现象，将其与原始数据结合甚至能进一步提升放大及预测效果。这表明大模型并非单纯依靠词汇的模式匹配，而是具备了更为抽象的特征构建和推理能力。

图3. 实验二主要结果

注：揭示了大模型内部的两阶段推理轨迹：在信息选择阶段，模型虽未能在表层的题目层级（Item-level）实现精准匹配，但成功实现了对高维心理因子层级（Factor-level）的提取；在信息压缩阶段，模型仅凭生成的自然语言摘要即可有效复刻“结构放大”现象，将其与原始数据结合甚至能进一步提升放大效果。

该研究为评估大语言模型的人类心理模拟能力提供了全新的心理测量学范式，为揭示其内在的推理机制提供了可解释的认知视角，有力地证明了大语言模型具备超越表面语义匹配的抽象心理特征构建与推理能力。同时，该工作也为利用大模型进行复杂的个体行为模拟和计算社会科学研究提供了计算框架。

北京大学生命科学联合中心博士生刘仪飞为本文第一作者。北京大学智能学院助理教授贺笛与北京大学心理与认知科学学院、IDG麦戈文脑科学研究所、北大-清华生命科学联合中心张航研究员为共同通讯作者。北京通用智能研究院的研究员卢义龙博士也为本研究做出了重要贡献。本研究获得国家自然科学基金和北大-清华生命科学联合中心等资助。

原文链接：Liu, Y.-F., Lu, Y.-L., He, D., & Zhang, H. (2026). From Five Dimensions to Many: Large Language Models as Precise and Interpretable Psychological Profilers. In The Fourteenth International Conference on Learning Representations. https://openreview.net/forum?id=JXFnCpXcnY

2026-05-30

联系信箱：

粤ICP备09063491号

热点排行