《NEUROSCIENCE AND BIOBEHAVIORAL REVIEWS》:Emotion Recognition Deficits in Alzheimer’s Disease: A Meta-Analysis.
编辑推荐:
背景:情绪识别是社交认知的核心组成部分,对有效的人际沟通至关重要。越来越多的文献表明,这种能力在阿尔茨海默病(Alzheimer’s disease, AD)中受损,但其缺陷的程度和性质仍不清楚。本项荟萃分析旨在量化AD个体相对于健康老年人(healthy o
背景:情绪识别是社交认知的核心组成部分,对有效的人际沟通至关重要。越来越多的文献表明,这种能力在阿尔茨海默病(Alzheimer’s disease, AD)中受损,但其缺陷的程度和性质仍不清楚。本项荟萃分析旨在量化AD个体相对于健康老年人(healthy older adults, HOA)的情绪识别损伤程度。
方法:通过系统检索确定了24项符合条件的研究,这些研究比较了AD个体与HOA的情绪识别表现。采用随机效应模型计算合并效应量(Hedges' g)。在影响诊断后进行主要分析,并通过敏感性分析检验了有影响力研究的影响。亚组分析探讨了刺激模态的作用,而荟萃回归则评估了简易精神状态检查量表(Mini-Mental State Examination, MMSE)评分、年龄和教育年限的潜在调节作用。此外,还进行了发表偏倚分析。
结果:主要荟萃分析显示,AD患者的情绪识别存在巨大且具有统计学意义的损伤(g = –1.059,p < .0001)。MMSE评分显著调节了该效应,整体认知状态较高与较小的缺陷相关。年龄和教育年限对结果无显著影响。亚组分析显示,在面部和非面部任务中损伤程度相当,不同刺激模态之间无显著差异。
结论:情绪识别在AD中存在实质性损伤。尽管该缺陷的程度与整体认知状态相关,但不太可能完全由其单独解释。这些发现支持了AD中社交认知功能障碍的相关性,强调了更具生态效度的评估范式的重要性,并对痴呆症背景下的以人为本护理和日常人际功能具有重要意义。
1. 引言
阿尔茨海默病(Alzheimer’s disease, AD)是全球痴呆症的主要原因,其特点是多个认知领域(尤其是记忆)的进行性衰退。除了这些核心缺陷外,AD还会影响一系列对日常社交互动至关重要的功能,包括解释和回应社交与情绪线索的能力。社交认知是指使个体能够感知、解释和回应他人意图、情绪和行为的一系列过程。在此领域内,情绪识别是一个基本组成部分,定义为从面部表情、声音韵律或肢体线索中识别他人情绪状态的能力。情绪识别应区别于更广泛的情绪处理,也区别于神经精神症状(如冷漠或抑郁),后者在AD中高度普遍,但反映的是情感和行为障碍,而非解码社交信号的特异性缺陷。同样,情绪识别在概念上区别于情绪性记忆增强等现象。情绪识别困难具有重要的功能性后果。此领域的损伤会损害人际沟通、减少社交参与并增加照护者负担。这些缺陷被认为源于参与社交和情绪处理的神经网络(包括额颞叶和边缘区域,如杏仁核、前扣带回皮层和颞叶)的破坏。尽管这些区域也与记忆有关,但它们在社交认知中的作用突显出AD相关损伤超出了传统评估的认知领域。尽管对AD社交认知的兴趣日益增长,但关于情绪识别的发现仍不一致。许多研究报告AD个体与健康老年人(healthy older adults, HOA)相比表现更差,但这些缺陷的程度和性质差异很大。一些证据表明,对负面情绪的识别相对于正面情绪不成比例地受损,而其他研究则表明基本情绪相对保留,但在更复杂或细微的表达上存在缺陷。这种不一致性使得将情绪识别解释为AD可靠特征变得复杂。有几个因素可能导致这种异质性。研究间的方法学变异性很大,包括任务模态(如静态与动态刺激)、刺激类型(面部、声音或多模态线索)、检查的情绪类别以及结果测量的差异。此外,临床异质性(特别是疾病严重程度和诊断标准的差异)可能会影响观察到的效应。值得注意的是,认知缺陷意识减退在AD中很常见,并可能进一步使任务表现的解释复杂化,因为个体可能在识别准确性受损的情况下表现出完整的情绪反应性或对其反应的信心。之前的荟萃分析试图综合这些文献,但现在受到几个因素的限制。早期工作未纳入过去十年研究的大量增长,包括使用更多样化和更具生态效度的任务范式。此外,先前的综合通常结合了不同的痴呆亚型或更广泛的社交认知领域,而不是专门关注临床定义的AD中的情绪识别。另外,潜在的调节因素(如认知严重程度和任务特征)尚未得到系统检验。鉴于这些局限性,有必要进行一次更新且重点明确的荟萃分析。本研究旨在量化AD个体与HOA相比情绪识别缺陷的程度,同时明确解决异质性来源。具体来说,我们检验了整体认知状态和关键方法学特征(包括任务特征和结果测量)的调节作用。通过澄清情绪识别损伤的程度和变异性,本研究旨在更精确地描述AD中的社交认知功能障碍。
2. 方法
本研究依据系统综述和荟萃分析首选报告项目(Preferred Reporting Items for Systemic Reviews and Meta Analysis, PRISMA)指南进行,并在国际前瞻性系统综述注册库(International Prospective Register of Systematic Reviews)注册。在2025年1月至2025年5月期间,对PubMed、Web of Science和Cochrane Library数据库进行了系统性文献检索。检索涵盖了2000年1月至2025年5月发表的记录。检索词通过布尔运算符组合,涵盖四个概念块:阿尔茨海默病/AD/痴呆症、情绪/情绪识别/面部识别/面部表情/声音韵律/情感处理、老年人/健康老龄化/老年/健康对照、神经心理学测试/任务表现与分析/准确性/反应时间/缺陷/调节因素/社交认知。这些术语针对出版物的标题、摘要和/或关键词。此外,使用通用互联网搜索引擎对灰色文献进行了补充检索,应用了相同的发表日期限制。通过参考管理软件和人工检查移除重复项。标题和摘要筛选由两位评审员独立进行,随后对可能符合条件的研究进行全文评估。任何分歧通过讨论解决,必要时咨询第三位作者。研究符合条件需满足:1)比较阿尔茨海默病(AD)参与者和健康老年人(HOA)的情绪识别表现;2)报告可纳入荟萃分析的定量结果(如准确性、反应时间);3)是2000年至2025年间以英文发表的同行评议实证文章;4)包含足够的统计信息来计算AD与HOA组间差异的效应量。研究被排除如果:1)主要关注其他痴呆症(如帕金森病、额颞叶痴呆);2)缺乏健康老年对照组;3)是病例报告、综述、荟萃分析、评论或非实证文章;4)仅报告单个AD参与者的数据。关于诊断定义,研究仅当阿尔茨海默病诊断是使用公认的临床诊断框架确定时才符合条件。在所有纳入文献中,诊断最常基于NINCDS–ADRDA或DSM标准,并得到临床评估和神经心理学评估的支持。未明确报告诊断标准的研究仅在明确陈述了可能的阿尔茨海默病正式临床诊断时才被纳入。纳入研究的方法学质量使用纽卡斯尔-渥太华量表(Newcastle–Ottawa Scale, NOS)进行评估。由两位评审员独立进行评估,分歧通过讨论或第三方裁决解决。数据提取遵循PRISMA指南。提取的变量包括:1)作者和发表年份;2)样本量;3)平均年龄和标准差;4)人口统计学变量;5)教育年限;6)MMSE评分;7)情绪识别测试和刺激类型;8)研究设计;9)主要发现。为确保效应量的统计独立性,从每项研究中选取一个情绪识别结果纳入主要荟萃分析。当报告多个情绪识别任务或结果时,应用了预定义的选择层次。优先选择整体或复合情绪识别分数,而非特定情绪的子分数。当执行多个任务时,选择最直接评估情绪识别(而非更广泛的社交认知结构)且在所有研究中最常用的任务。当两种指标都可用时,优先选择基于准确性的结果而非反应时测量,以最大限度地提高研究间的可比性。所有分析均使用RStudio(R版本4.5.1)进行,采用metafor和dmetar包。效应量计算为AD组与HOA组之间的标准化平均差(Standardised Mean Difference, SMD; Hedges' g)。鉴于预期的方法学和临床异质性,使用随机效应模型估计合并效应量。使用Cochran's Q统计量、I2指数和组间方差估计量τ2评估异质性。通过森林图目视检查、置信区间重叠检查和留一法影响诊断相结合的方式识别潜在有影响力的研究。根据这些诊断标准,有三项研究显示效应量过大,并对合并估计值产生显著影响。考虑到可用研究数量有限以及随机效应模型对极端值的敏感性,这些研究从主要荟萃分析中排除,以获得更稳定和保守的整体效应量估计。重要的是,排除这些有影响力的研究并不意味着其发现无效。相反,极端效应量可能反映了在本次荟萃分析中无法完全建模的有意义的临床或方法学差异(例如任务特征、样本构成或疾病严重程度)。因此,通过重新引入这些研究进行敏感性分析,以评估主要发现对其纳入的稳健性。亚组分析用于检验效应量是否因刺激模态而异,比较使用面部情绪识别任务的研究与采用替代格式(如视频、绘图或基于身体的线索)的研究。为进一步探索异质性的潜在来源,进行了荟萃回归,使用年龄、MMSE评分和教育年限作为调节因素,分别独立检验。此外,还检验了MMSE与刺激模态(面部与非面部)之间的交互作用,以评估认知状态是否调节了任务格式与情绪识别表现之间的关系。在荟萃回归分析之前,进行了共线性诊断。最后,通过漏斗图目视检查和Egger回归检验评估发表偏倚。
3. 结果
3.1. 研究选择与特征
初步检索共获得1490篇文章,在移除重复项后,有861篇进入筛选流程。根据标题和摘要信息,有63项研究符合选择标准,被认为有资格进行更深入分析。经过全文审查,排除了40篇文章,最终共有23项研究被纳入进一步的荟萃分析过程。此外,通过其他方法确定的一篇文章被纳入,加上通过数据库纳入的23项研究,最终共有24项研究符合定量综合条件。在所有纳入的研究中,总样本包括1,358名参与者:626名被诊断为阿尔茨海默病的个体(平均年龄 = 73.53岁;平均MMSE = 22.95)和732名健康老年人(平均年龄 = 70.96岁;平均MMSE = 29.12)。纳入研究的详细特征,包括任务类型和刺激模态,均在文中呈现。
3.2. 情绪识别表现:总体效应
对21项评估AD个体与HOA相比情绪识别表现的研究进行了随机效应荟萃分析。使用Hedges' g计算的合并效应量表明,与HOA相比,AD组存在巨大且具有统计学意义的缺陷:g = –1.059,95% CI [–1.219, –0.899],t(21) = –13.79,p < .0001。标准化均差的负方向反映了跨研究的一致证据,表明AD个体在识别情绪表达方面准确性降低。95%预测区间[–1.376, –0.742]表明,未来的研究也可能报告相同方向的实质性损伤,增强了该效应的临床相关性。组间异质性为中度至实质性(I2= 53.3%,τ2= 0.0179),尽管Cochran's Q检验未达到统计学显著性。
3.3. 按刺激类型进行的亚组分析
为检验刺激模态是否调节情绪识别表现,亚组分析比较了使用面部刺激的研究(k = 16)与采用替代模态(k = 6,包括绘图和视频片段)的研究。两个亚组在相同方向上都产生了巨大且具有统计学意义的合并效应量,表明无论刺激类型如何,AD组相对于HOA的表现都持续较差。对于使用面部刺激的研究,合并效应量为g = –1.0290,95% CI [–1.2173, –0.8407],τ2为0.0184,I2值为23.2%,表明低到中度异质性。使用非面部刺激的研究显示出略大的合并效应(g = –1.1596,95% CI [–1.5809, –0.7383]),并伴有稍高的异质性(τ2 = 0.0341,I2 = 23.9%)。然而,亚组差异检验无统计学显著性,Q(1) = 0.49,p = .4830,表明没有可靠证据表明刺激模态改变了效应的大小。
3.3.1. 荟萃回归分析
为探索效应量间异质性的来源,进行了一系列单变量荟萃回归,使用关键的研究水平特征作为潜在的调节因素。平均年龄(k = 22)未产生显著的调节效应,F(1, 20) = 0.6373,p = .4341,回归系数不显著(b = –0.0124,95% CI [–0.0448, 0.0200])。这表明,实足年龄不能解释各研究间情绪识别缺陷的变异性。相比之下,MMSE评分作为效应量的显著调节因素出现(k = 17),F(1, 15) = 11.10,p = .0046。正的回归系数(b = 0.0794,95% CI [0.0286, 0.1303])表明,AD组的认知功能越高,情绪识别表现的组间差异越小。教育年限对效应量无显著调节作用,无论是在AD组(F(1, 15) = 1.81,p = .1990;b = 0.0392,95% CI [?0.0230, 0.1013])还是在HOA组(F(1, 15) = 0.0069,p = .9351;b = ?0.0024,95% CI [?0.0631, 0.0584])皆是如此。最后,一个包含MMSE评分与刺激模态交互作用的组合模型产生了显著的整体检验结果,F(3, 13) = 3.43,p = .0491。然而,没有一个单独的系数达到统计学显著性,且MMSE × 刺激交互项不显著(b = 0.0291,p = .5951),表明没有证据表明认知状态的调节作用因刺激类型而异。
3.4. 敏感性分析
为评估主要发现对纳入三项因效应量过大而被识别为有影响力的研究的稳健性,进行了敏感性分析。当将这些研究重新引入分析(k = 25)时,合并效应量仍然巨大且具有统计学意义(g = ?1.1387,95% CI [?1.4156, ?0.8617],p < .0001)。尽管纳入这些研究增加了合并效应量和异质性估计值的大小,但结果的方向和统计学显著性没有改变。这表明关于AD情绪识别受损的主要结论是稳健的,同时也表明极端效应量可能导致观察到的异质性。
3.4.1. 发表偏倚
通过漏斗图和Egger回归检验分析发表偏倚的存在。漏斗图的目视检查未表明研究分布存在明显不对称。Egger回归检验的结果不显著(p = .9410),偏倚估计值为–0.1074(SE = 1.4322),表明没有小样本效应或因选择性发表导致的系统性偏倚的证据。
4. 讨论
通过整合21项研究的数据,本项荟萃分析发现,阿尔茨海默病(AD)个体与健康老年人相比,在情绪识别方面存在巨大且具有统计学意义的损伤。这一发现支持了社交认知功能障碍是AD有意义组成部分的观点,其影响超出了传统评估的领域(如记忆)。同时,观察到的研究间实质性异质性表明,这些缺陷并不统一,需要谨慎解释。从理论角度来看,这些发现与社交认知的分布式模型基本一致。模拟基础理论表明,识别他人情绪部分取决于观察者中重叠的感知、感觉运动和情感过程,而更广泛的社交脑框架则强调相互连接的额颞叶和边缘系统在解码与社交相关的情绪信号和支持关于他人感受与意图推断中的作用。目前的结果显示,损伤是显著但可变的,这与这些整合系统的破坏相一致,而非单一情绪功能的特异性缺陷。从这个意义上说,AD中的情绪识别困难可能反映了解码社交信号所需的感知、认知和情感过程协调性的崩溃。研究间观察到的异质性也有助于解释文献中报告的混合结果。虽然一些研究描述了对基本情绪识别的相对保留,但其他研究报告了更广泛的损伤或效价特异性效应。我们的结果表明,这些差异不太可能反映单一的、统一的损伤模式。相反,它们可能由方法学和临床因素共同驱动。任务设计的差异(例如使用静态与动态刺激、情绪类别的变化以及所呈现表达的复杂性)可能涉及不同的认知和神经过程。此外,疾病严重程度和样本特征的变异性可能导致观察到的效应量差异。本项荟萃分析量化了整体缺陷,但并未消除这种异质性,表明研究间的变异性反映了方法学差异和AD人群内真正的差异。整体认知状态作为一个显著的调节因素出现,较高的MMSE评分与较小的情绪识别缺陷相关。这表明,情绪识别任务的表现至少部分与整体认知衰退相关。然而,这种关系应谨慎解释。MMSE是一个相对粗略的测量工具,它不能分离特定的认知领域,如执行功能、语义处理或视觉感知能力,而这些都可能对情绪识别表现有贡献。因此,目前尚不清楚哪些认知过程主要驱动了这种关联。此外,任务需求(包括注意负荷和感知复杂性)可能会独立于整体认知状态而影响表现。未来使用更精细的神经心理学测量进行的研究对于澄清这些关系至关重要。在任务层面,亚组分析表明,情绪识别缺陷存在于不同的刺激模态中。不仅在使用静态面部表情的研究中观察到了损伤,在使用替代格式(如眼部区域刺激、视频片段或绘图)的研究中也观察到了损伤。尽管非面部任务的效应在数值上更大,但这些差异在统计学上并不显著。这种模式强化了AD中的情绪识别困难不限于单一模态的观点。同时,它也突显了现有文献的一个重要局限性。面部情绪识别任务仍然是最常用的方法,但其生态效度长期以来一直受到质疑。更具自然主义特征的范式,包括动态和情境丰富的刺激,可能更好地捕捉现实世界社交互动的复杂性,应更系统地纳入未来的研究中。从神经生物学的角度来看,目前的发现与支持情绪和社交处理的分布式网络的参与是一致的。通常与情绪识别相关的区域,如杏仁核、前扣带回皮层和颞叶,已知在AD中也受到影响。情绪识别损伤更可能是由于这些网络内连接性的破坏(包括边缘结构与颞顶叶和额叶区域之间相互作用的改变)所引起,而非孤立的区域功能障碍。这种网络层面的解释与更广泛的将AD视为大规模脑系统疾病的模型相一致,并可能有助于解释个体间行为学发现的变异性。这些发现也具有实际意义。识别他人情绪的困难会扰乱人际沟通,导致误解,并增加照护者负担。这种损伤可能无法通过标准认知评估轻易捕捉,但它们对日常功能和生活质量有明显影响。因此,情绪识别任务可以作为传统评估的有用补充,特别是在疾病的早期阶段。然而,需要进一步的工作来确定其敏感性和特异性,以及它们作为干预目标的潜在作用。应承认几个局限性。相对较少的研究数量限制了调节因素分析的范围,也限制了对不常用任务范式的检查。此外,研究设计和报告实践的变异性限制了结果的可比性。未来工作中,情绪识别评估的更大标准化(包括更清晰地报告任务特征和参与者概况)将有助于更精确的综合。总之,本项荟萃分析表明,阿尔茨海默病患者在情绪识别方面表现出实质性损伤。虽然这些缺陷与整体认知衰退相关,但并不能完全由其解释,可能反映了多种认知和神经过程共同作用的影响。它们在不同任务模态中的存在及其对日常社交功能的相关性,突显了将社交认知视为AD核心特征的重要性。对这些过程的更详细了解,可能为疾病的理论模型和更以人为本的护理方法提供信息。