Rowland通用痴呆评估量表(RUDAS)诊断准确性研究的系统评价与Meta分析：揭示其在跨文化医疗环境中的应用价值与教育背景影响

《npj Dementia》：Diagnostic accuracy of the Rowland Universal Dementia Assessment Scale (RUDAS) for the detection of dementia

【字体：大中小】 时间：2026年03月10日 来源：npj Dementia

编辑推荐：

　　为解决传统认知筛查工具存在语言与教育背景偏倚的难题，本研究对Rowland通用痴呆评估量表(RUDAS)用于全因痴呆诊断的准确性进行了系统评价与Meta分析。在二次医疗场景中，使用推荐阈值(22/23)时，RUDAS显示出84%的合并敏感性与70%的特异性，但其表现受被评估者教育水平影响，提示需针对不同人群建立标准数据。

痴呆，作为一种全球性的公共卫生挑战，其影响正随着全球人口老龄化而急剧扩大。预计到2050年，全球痴呆症患者人数将飙升至1.39亿，其中超过70%的病例将集中在低收入和中等收入国家。然而，令人担忧的是，痴呆的识别率在许多高收入国家也低于50%，在一些资源有限的地区则近乎空白。及时诊断不仅对患者获取治疗和支持至关重要，也是世界卫生组织（WHO）全球行动计划中的核心行动领域。

认知测试是痴呆诊断评估中的重要环节。临床中广泛使用的简易精神状态检查（MMSE）和蒙特利尔认知评估（MoCA）等工具，虽然在英语人群中表现出色，但其诊断准确性在非英语母语或低教育背景的人群中会受到语言和文化偏倚的显著影响。这种偏倚可能导致误诊，加剧医疗不公。在全球范围内，尤其是在专科服务匮乏的低收入和中等收入国家，痴呆评估常由非专科医生完成。因此，临床亟需一种既能在不同文化间保持公正，又便于操作的认知筛查工具。

正是在这样的背景下，Rowland通用痴呆评估量表（RUDAS）应运而生。它于2004年在澳大利亚开发，初衷正是为了克服在多元文化和语言人群中检测痴呆的困难。该量表包含六个项目，评估记忆、运用、语言、判断、绘画和身体定向等多个认知领域，总分0-30分，操作简单，且被设计为可通过口译员以任何语言进行。自诞生以来，RUDAS已被翻译成多种语言并在全球多个场景中得到应用。然而，此前关于其诊断准确性的系统性综述，因纳入了可能夸大其表现的病例-对照研究设计，其结果可能存在偏倚。为了更准确地评估RUDAS在真实世界临床环境（即包含介于痴呆与非痴呆之间“灰色地带”患者的人群）中的表现，一项新的、排除了病例-对照研究设计的系统评价和荟萃分析（Meta分析）显得尤为必要。这项研究发表在《npj Dementia》期刊上。

研究者们应用了一套严谨的方法学体系来回答核心问题。他们系统地检索了多个电子数据库，纳入了将RUDAS与已确立的痴呆诊断标准（如DSM-IV、DSM-5、ICD-10）进行比较的横断面研究，并明确排除了病例-对照研究以最大程度减少谱偏倚。在文献筛选、数据提取和方法学质量评估（使用QUADAS-2工具）环节，均由两名研究者独立完成。最终纳入的研究数据通过双变量随机效应模型进行合并分析，计算汇总的敏感性和特异性及其95%置信区间（95% CI），并绘制了森林图和汇总受试者工作特征（SROC）曲线。

研究结果

搜索结果

经过系统的检索与筛选，研究最终纳入了来自9个不同国家的11项研究，共计3607名参与者。这些研究涵盖了从记忆门诊到社区人群的多种场景。

二次医疗场景中纳入研究的特征

8项在二次医疗场景（如记忆门诊、老年科门诊）中进行的研究被详细分析。这些研究在不同国家使用不同语言版本的RUDAS，样本量从97到204人不等，参与者的平均年龄和教育水平存在差异，痴呆患病率在34%到75%之间。

社区场景中纳入研究的特征

另有3项在社区中进行的研究，由于其中两项采用了复杂的抽样策略且分析未回推到源人群，其数据未被纳入最终的荟萃分析进行汇总。

目标病症：痴呆及其亚型

所有研究均未报告RUDAS对特定痴呆亚型（如阿尔茨海默病痴呆、血管性痴呆）的诊断准确性，因此本综述仅关注RUDAS对全因痴呆的诊断表现。

语言

纳入的研究共使用了11种不同语言版本的RUDAS。部分研究在单一母语人群中使用，部分研究则包含了需要通过口译员进行评估的多语言背景参与者。

纳入研究的方法学质量

使用QUADAS-2工具评估显示，部分研究在患者选择、盲法实施或患者流程方面存在较高的偏倚风险。

RUDAS的诊断准确性

二次医疗场景中RUDAS的诊断准确性

在二次医疗场景中，对7项报告了推荐阈值（22/23）下数据的研究进行荟萃分析。结果显示，在此阈值下，RUDAS的汇总敏感性为84%（95% CI: 70–92），汇总特异性为70%（95% CI: 57–80）。汇总SROC曲线下面积（AUC）为0.83。

社区场景中RUDAS的诊断准确性

社区研究的结果因方法学异质性无法合并。其中一项在巴西进行的、方法学最稳健的大规模社区研究（n=1583）显示，在22/23阈值下，敏感性高达95%，但特异性仅为68%。该研究的最佳阈值出现在20/21分。

教育水平对个体研究中痴呆诊断最佳阈值的影响

分析发现，教育水平显著影响RUDAS的最佳诊断阈值。在二次医疗场景中，文盲人群的最佳阈值最低（18/19），而平均教育水平最高的研究（如瑞典、丹麦）则报告了更高的最佳阈值（23/24或24/25）。巴西的社区研究也证实，无正规教育人群的最佳阈值（19/20）低于有1-4年学校教育的人群（20/21）。

结论与讨论

本项系统评价与Meta分析从全球11项研究中提取数据，旨在评估RUDAS在多元医疗与社区场景中诊断全因痴呆的准确性。研究发现，在二次医疗场景中，使用推荐的22/23分阈值时，RUDAS表现出合理的诊断准确性，其汇总敏感性为84%，特异性为70%。这一结果与此前纳入病例-对照研究的综述相比，敏感性估计值更高，而特异性估计值更低，这可能是由于本次综述通过排除病例-对照设计而减少了谱偏倚所致。

本研究最重要的发现之一是揭示了教育水平对RUDAS最佳诊断阈值存在潜在影响。尽管RUDAS开发之初的报告称其表现不受教育年限影响，但本次纳入的研究，特别是那些包含文盲或极低教育水平参与者的研究，普遍报告了更低的最佳阈值。这表明，RUDAS中某些项目（如立方体临摹）的表现可能仍与教育背景相关。这一发现强调了在将RUDAS应用于不同教育背景人群时，需要谨慎解读其得分，并凸显了为不同场景和人群建立规范数据的紧迫性。

此外，RUDAS常被宣传为适合通过口译员在不同文化和语言中使用。本综述发现，半数以上研究涉及了需要通过口译员进行评估的参与者，但相关研究中均未详细说明对口译员的培训情况。不准确的口译可能影响评估结果，这是在临床应用RUDAS时需要考虑的另一个实际因素。

从临床意义来看，在二次医疗场景中使用22/23的阈值，RUDAS能较好地识别出真正的痴呆患者（高敏感性），但也会产生相对较多的假阳性结果（特异性较低）。这意味着，如果将所有筛查阳性者都转诊进行全面的诊断评估，可能会导致成本效益低下，并给假阳性者带来不必要的焦虑。提高阈值可减少假阳性，但会以漏诊更多真性病例为代价。因此，在实际应用中，最佳阈值的确定可能需要结合目标人群的教育水平等因素进行综合考量。

总之，RUDAS作为一种简单的纸笔测试，在多种医疗场景和不同国家中显示出区分痴呆与非痴呆的实用价值。然而，当前高质量研究数量有限，且研究间存在较大异质性。本研究表明，RUDAS并非完全不受教育背景影响，其在社区场景中的证据尤其不足。未来亟需更多高质量研究，以提供针对不同人群和场景的RUDAS应用证据，并推动建立相应的规范数据，从而真正实现其在全球范围内，特别是在资源有限和服务不足的地区，作为一种公平、有效的痴呆筛查工具的价值。

订阅生物通快讯

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯