综述：高体重青少年及成人进食障碍问卷诊断准确性更新的系统评价

《International Journal of Eating Disorders》：Identifying Eating Disorders in Adolescents and Adults Living With Higher Weight: An Updated Systematic Review of Questionnaire Diagnostic Accuracy

【字体：大中小】 时间：2026年05月23日 来源：International Journal of Eating Disorders 4.3

编辑推荐：

　　目的：更新关于自评进食障碍（Eating Disorder, ED）问卷在高体重青少年及成人中诊断准确性的相关证据。方法：系统检索5个数据库2020年至2025年11月的文献（PROSPERO注册号CRD420251186115）。纳入研究以临床访谈为参照标准

目的：更新关于自评进食障碍（Eating Disorder, ED）问卷在高体重青少年及成人中诊断准确性的相关证据。方法：系统检索5个数据库2020年至2025年11月的文献（PROSPERO注册号CRD420251186115）。纳入研究以临床访谈为参照标准，报告自评问卷用于识别高体重人群ED及进食障碍行为（Disordered Eating Behaviors, DEBs）的诊断准确性。采用叙述性合成方法，将新研究证据与既往已识别研究共同整合分析。结果：共纳入32项研究（含5项新研究），报告了成人13种问卷、青少年5种问卷的诊断准确性。问卷诊断准确性评估覆盖的疾病/行为包括：任意ED（成人5种问卷，青少年无）、暴食障碍（Binge-Eating Disorder, BED，成人8种、青少年2种）、DEBs（如暴食、清除行为，成人4种、青少年1种）、失控进食（Loss-of-Control Eating, LOC，成人1种、青少年2种）、神经性贪食症（Bulimia Nervosa, BN）、非典型神经性厌食症（Atypical Anorexia Nervosa, AAN）、清除障碍及夜间进食综合征（各1项成人研究，青少年无）。进食障碍检查问卷（Eating Disorder Examination Questionnaire, EDE-Q，7项研究；灵敏度0.16–0.88；特异度0.54–1.0）、暴食量表（Binge Eating Scale, BES，6项研究；灵敏度0.37–0.98；特异度0.48–0.96）及进食与体重模式问卷（Questionnaire on Eating and Weight Patterns, QEWP，6项研究；灵敏度0.07–1.0；特异度0.0–1.0）的应用最为广泛。讨论：针对高体重人群ED问卷诊断准确性的评估进展有限。目前仍缺乏青少年问卷诊断准确性证据，且除BED外，可用于识别其他ED的足够灵敏的问卷不足。评估现有问卷在高体重人群中的诊断准确性仍是研究的优先方向。

1 引言

进食障碍与高体重可共存。高体重人群（含临床肥胖）因共享的风险与维持因素，发生ED的风险升高。研究显示，BN、BED及复发性暴食行为在高体重人群中的12个月及终生患病率均高于低体重人群，存在疑似ED的青少年也更常伴随高体重状态。肥胖治疗人群中约14%存在BED，1%存在BN，但限制性ED的真实患病率可能被低估——此类疾病在高体重人群中易被漏诊，源于临床对“ED可跨越体重谱分布”的认知不足，导致患者延迟获得ED治疗或被分配至强度更低的治疗方案。

随着对两者共病的认知提升，2020年后发布的临床肥胖治疗指南均推荐评估ED症状，但缺乏标准化的实操流程。首部针对高体重人群ED管理的临床实践指南建议，所有寻求减重支持的就诊者均需接受ED筛查，首选简短筛查问卷（如初级保健进食障碍筛查表），初筛阳性者需进一步使用综合评估问卷（如EDE-Q）评估，必要时行临床访谈确诊。但指南同时指出，现有工具多在低体重人群中开发，可能存在对高体重人群的污名化表述或不适用条目。

识别高体重人群ED的核心挑战在于，现有筛查与评估问卷未经过全谱系ED诊断准确性的验证。2022年的系统评价显示，截至2020年9月的研究高度集中于暴食及BED的识别，仅少数成人问卷、无青少年问卷被评估用于其他ED（如BN、AAN）的识别。SCOFF是唯一被评估用于识别成人任意ED的简短筛查工具，但其灵敏度与特异度在不同研究中差异显著，且该工具基于《精神障碍诊断与统计手册第四版》（DSM-IV）开发，难以覆盖DSM-5定义的全部ED类型。EDE-Q作为最常用的评估问卷，仅1项研究验证其对任意ED的识别能力，且在高体重人群中的灵敏度略低于低体重人群。该问卷最初针对低体重人群的AN与BN开发，已有研究提示其部分条目在高体重人群中表现存在差异，因子结构可能不适用于该群体，仍需进一步探索。

鉴于ED筛查与评估已被推荐为高体重人群（尤其是接受肥胖治疗者）常规照护的一部分，本综述旨在梳理ED问卷在该人群中的诊断准确性研究进展。

2 方法

2.1 方案与注册

本综述为2022年发表的截至2020年9月文献的系统评价的更新版本，方法学遵循《Cochrane诊断试验准确性系统评价手册第二版》，报告符合《系统评价与荟萃分析优先报告条目》（PRISMA）及其诊断试验准确性扩展声明。更新版方案已在PROSPERO注册（CRD420251186115），与原方案基本一致，更新内容包括：纳入语言不再限制为英文，对非英文文献使用机器翻译评估 eligibility。

2.2 纳入标准

研究特征：纳入2020年至2025年11月发表于同行评审期刊的研究，排除干预期间开展的研究以避免偏倚。研究设计：纳入横断面研究，报告ED问卷的同时效度及诊断准确性指标（如灵敏度、特异度、阳性预测值、阴性预测值），排除仅评估内容效度、结构效度的研究。参与者：纳入10–17岁青少年及≥18岁成人，高体重定义为青少年成人等效体重指数（Body Mass Index, BMI）≥25 kg/m²、BMI z评分>1、BMI≥同年龄同性别人群第85百分位，或临床诊断为超重/肥胖；成人BMI≥25 kg/m²或临床诊断为超重/肥胖。若研究纳入全体重谱人群且单独报告高体重亚组数据，则纳入该部分数据。排除运动员、孕妇及糖尿病、胃肠道疾病等特定临床人群研究。待评价测试：纳入自评ED问卷（含筛查工具与评估问卷），排除家长或临床医师代评问卷。参考标准：以临床诊断访谈为参照。目标疾病：纳入基于DSM-5的喂食与进食障碍及对应症状，排除正念饮食、食物成瘾等非DSM-5收录疾病的研究。

2.3 数据源与筛选流程

系统检索CINAHL、EMBASE、MEDLINE、APA PsycINFO、APA PsycTests共5个电子数据库，检索词涵盖人群、诊断、待评价测试、结局四类主题词与自由词。文献去重后导入Covidence软件，由2名独立研究者完成标题摘要与全文筛选，分歧通过讨论解决，全程记录排除原因。

2.4 数据提取

使用Covidence定制化工具提取新纳入研究的数据，由1名研究者提取、另1名独立核对，提取内容包括研究基本信息、参与者特征、待评价测试、参考标准、截断值及诊断准确性指标。

2.5 偏倚风险与适用性评估

采用诊断准确性研究质量评价工具第二版（Quality Assessment of Diagnostic Accuracy Studies 2, QUADAS-2）评估偏倚风险与适用性，由2名独立研究者完成，分歧通过讨论解决。不计算总分，任一领域判定为高风险或不明确则整体视为“存在偏倚风险”；适用性任一领域判定为高风险或不明确则视为“存在适用性担忧”。同时对2022年纳入的原研究重新使用QUADAS-2评估（原研究使用旧版QUADAS工具）。

2.6 数据合成

采用无荟萃分析的合成（Synthesis Without Meta-Analysis, SWiM）指南指导叙述性合成，优先参考大样本量、低偏倚风险的研究结果。临床解读时优先考虑高灵敏度问卷以降低漏诊风险。使用证据图谱可视化呈现成人与青少年的问卷覆盖范围、评估诊断及对应灵敏度。

3 结果

更新检索共识别2816篇文献，最终纳入32项研究（含5项新研究）。26项研究针对成人，6项针对青少年；研究开展于美国、意大利、比利时等多国，样本量35–1133例，成人平均年龄27.6–53.1岁，青少年12.8–14.3岁，成人平均BMI 35.2–52.2 kg/m²，12项研究女性占比≥80%，多数研究（成人21项、青少年4项）在临床场景开展，7项成人研究招募减重手术人群。所有研究均存在偏倚风险，主要源于待评价测试领域与流程时序领域的判定不明确或高风险，无研究存在适用性担忧，因此结果权重主要由样本量驱动。

3.1 成人诊断准确性结果

共评估13种问卷的诊断准确性。任意ED的评估仅涉及5种问卷，其中仅SCOFF在多研究中验证，灵敏度波动范围为0.67–1.0。BED的评估涉及8种问卷，BES应用最广泛，6项研究中有4项显示其在截断值15–17时灵敏度>0.8。暴食行为的评估涉及4种问卷，QEWP应用最多但灵敏度变异较大，尤其对主观性暴食的识别灵敏度偏低。其余疾病（BN、AAN、清除障碍、夜间进食综合征、LOC进食）均仅单研究验证。

新增的3种成人问卷中，EDE-Q共7项研究，对客观性暴食的灵敏度高于主观性暴食，其约束分量表对BED的识别灵敏度低于其他分量表或总分，原4因子结构在高体重人群中拟合度不佳，仅1项研究提出任意ED的截断值为3.1，另有非纳入研究提出女性人群截断值为超重3.15、肥胖3.26。BES共6项研究，新研究支持截断值15–18更适合筛查以降低漏诊风险，其最初即在肥胖治疗人群中开发。LOC/暴食筛查工具为新增工具，1项研究显示其对LOC进食的灵敏度为0.72–0.79，对暴食的灵敏度为0.64–0.85，作者建议通过补充隐喻解释、增加行为与情境条目提升准确性，尚需后续验证。

3.2 青少年诊断准确性结果

共评估5种问卷的诊断准确性。BED的评估仅2种问卷各有1项研究，灵敏度均为1.0；EDE-Q儿童/青少年版共3项研究，对暴食的灵敏度为0.57–0.79，但最优截断值尚未明确；LOC进食的评估涉及2种新问卷，单独使用时灵敏度均为0.42，联合使用后提升至0.50，特异性较高但灵敏度不足，无法作为有效筛查工具。

4 讨论

本综述纳入的32项研究中仅5项为近5年发表，且仅有1项针对青少年人群，所有新研究均聚焦于暴食、BED或LOC进食，无任何问卷被验证可覆盖高体重人群的全谱系ED识别。新增证据仅补充了EDE-Q与BES在暴食相关行为中的准确性数据，虽出现了新的LOC进食筛查工具，但敏感性不足，仍推荐使用可覆盖更广ED类型的进食障碍肥胖问卷（EDO）。

当前证据仍高度集中于暴食相关障碍，仅5项研究评估任意ED的识别能力，缺乏足够灵敏的工具识别限制性ED，青少年中甚至无任何工具可评估非暴食类ED。高体重伴限制性ED的人群易被漏诊，而此类人群的疾病严重程度与低体重人群相当，且尚无工具验证对回避/限制性摄食障碍（Avoidant/Restrictive Food Intake Disorder, ARFID）的识别能力，这一空白使得临床无法推荐统一的全谱系ED筛查工具。

简短筛查工具层面，近5年无进展，SCOFF仍是唯一验证过任意ED识别能力的工具。BED筛查中，成人的BEDS-7、青少年的CBBEQ与ADO-BED前2题显示出潜力，但均未在近5年得到重复验证。其他已在社区样本中验证灵敏度优于SCOFF的简短工具（如初级保健进食障碍筛查表、进食障碍筛查表、InsideOut研究所筛查器）尚未在高体重人群中单独验证准确性。正在开发的覆盖全体重谱的儿童青少年筛查问卷“筛查儿童青少年进食”（Screening Kids' And Teens' Eating）值得期待，此类工具的验证应成为研究优先方向。

综合评估问卷层面，仍无工具被验证可识别所有ED诊断，EDE-Q对任意ED的识别仍仅基于1项小样本女性研究，且需更高的截断值，其用于暴食评估的稳定性也存在异质性。BES对BED的识别表现相对可靠，可作为针对性评估工具，但无法满足全谱系评估需求。

特定人群层面，青少年证据缺口尤为突出，无任何工具可识别非暴食类ED，而青春期是ED发病高峰，亟需开发适配青少年的专用工具。此外，纳入研究普遍存在性别与文化多样性不足的问题，绝大多数研究对象为白人女性，针对男性及多元文化背景人群的专用问卷（如进食病理症状量表、男性进食障碍评估量表、肌肥大导向进食测试）尚未在高体重人群中验证准确性，未来研究需优先纳入多元背景参与者以保证工具的普适性。

本综述的优势在于严格以临床访谈为参照，确保了证据的临床相关性，但也存在局限：多数研究在临床场景开展，7项减重手术研究可能存在应答偏倚；不同研究对ED与DEBs的定义不一致，可能导致同一问卷的准确性结果异质性；样本的多样性不足限制了结果的推广性。

5 结论

高体重青少年及成人的ED问卷诊断准确性研究进展缓慢，仅LOC进食、暴食及BED相关工具有所更新，全谱系ED识别工具的证据仍严重不足。未来研究需优先开发或验证适配高体重人群的专用问卷，同时确保工具适用于多元背景的群体，以支撑临床指南的落地实施。

热点排行