《International Journal of Eating Disorders》:Identifying Eating Disorders in Adolescents and Adults Living With Higher Weight: An Updated Systematic Review of Questionnaire Diagnostic Accuracy
编辑推荐:
目的:更新关于自评进食障碍(Eating Disorder, ED)问卷在高体重青少年及成人中诊断准确性的相关证据。方法:系统检索5个数据库2020年至2025年11月的文献(PROSPERO注册号CRD420251186115)。纳入研究以临床访谈为参照标准
目的:更新关于自评进食障碍(Eating Disorder, ED)问卷在高体重青少年及成人中诊断准确性的相关证据。方法:系统检索5个数据库2020年至2025年11月的文献(PROSPERO注册号CRD420251186115)。纳入研究以临床访谈为参照标准,报告自评问卷用于识别高体重人群ED及进食障碍行为(Disordered Eating Behaviors, DEBs)的诊断准确性。采用叙述性合成方法,将新研究证据与既往已识别研究共同整合分析。结果:共纳入32项研究(含5项新研究),报告了成人13种问卷、青少年5种问卷的诊断准确性。问卷诊断准确性评估覆盖的疾病/行为包括:任意ED(成人5种问卷,青少年无)、暴食障碍(Binge-Eating Disorder, BED,成人8种、青少年2种)、DEBs(如暴食、清除行为,成人4种、青少年1种)、失控进食(Loss-of-Control Eating, LOC,成人1种、青少年2种)、神经性贪食症(Bulimia Nervosa, BN)、非典型神经性厌食症(Atypical Anorexia Nervosa, AAN)、清除障碍及夜间进食综合征(各1项成人研究,青少年无)。进食障碍检查问卷(Eating Disorder Examination Questionnaire, EDE-Q,7项研究;灵敏度0.16–0.88;特异度0.54–1.0)、暴食量表(Binge Eating Scale, BES,6项研究;灵敏度0.37–0.98;特异度0.48–0.96)及进食与体重模式问卷(Questionnaire on Eating and Weight Patterns, QEWP,6项研究;灵敏度0.07–1.0;特异度0.0–1.0)的应用最为广泛。讨论:针对高体重人群ED问卷诊断准确性的评估进展有限。目前仍缺乏青少年问卷诊断准确性证据,且除BED外,可用于识别其他ED的足够灵敏的问卷不足。评估现有问卷在高体重人群中的诊断准确性仍是研究的优先方向。
1 引言
进食障碍与高体重可共存。高体重人群(含临床肥胖)因共享的风险与维持因素,发生ED的风险升高。研究显示,BN、BED及复发性暴食行为在高体重人群中的12个月及终生患病率均高于低体重人群,存在疑似ED的青少年也更常伴随高体重状态。肥胖治疗人群中约14%存在BED,1%存在BN,但限制性ED的真实患病率可能被低估——此类疾病在高体重人群中易被漏诊,源于临床对“ED可跨越体重谱分布”的认知不足,导致患者延迟获得ED治疗或被分配至强度更低的治疗方案。
随着对两者共病的认知提升,2020年后发布的临床肥胖治疗指南均推荐评估ED症状,但缺乏标准化的实操流程。首部针对高体重人群ED管理的临床实践指南建议,所有寻求减重支持的就诊者均需接受ED筛查,首选简短筛查问卷(如初级保健进食障碍筛查表),初筛阳性者需进一步使用综合评估问卷(如EDE-Q)评估,必要时行临床访谈确诊。但指南同时指出,现有工具多在低体重人群中开发,可能存在对高体重人群的污名化表述或不适用条目。
识别高体重人群ED的核心挑战在于,现有筛查与评估问卷未经过全谱系ED诊断准确性的验证。2022年的系统评价显示,截至2020年9月的研究高度集中于暴食及BED的识别,仅少数成人问卷、无青少年问卷被评估用于其他ED(如BN、AAN)的识别。SCOFF是唯一被评估用于识别成人任意ED的简短筛查工具,但其灵敏度与特异度在不同研究中差异显著,且该工具基于《精神障碍诊断与统计手册第四版》(DSM-IV)开发,难以覆盖DSM-5定义的全部ED类型。EDE-Q作为最常用的评估问卷,仅1项研究验证其对任意ED的识别能力,且在高体重人群中的灵敏度略低于低体重人群。该问卷最初针对低体重人群的AN与BN开发,已有研究提示其部分条目在高体重人群中表现存在差异,因子结构可能不适用于该群体,仍需进一步探索。
鉴于ED筛查与评估已被推荐为高体重人群(尤其是接受肥胖治疗者)常规照护的一部分,本综述旨在梳理ED问卷在该人群中的诊断准确性研究进展。
2 方法
2.1 方案与注册
本综述为2022年发表的截至2020年9月文献的系统评价的更新版本,方法学遵循《Cochrane诊断试验准确性系统评价手册第二版》,报告符合《系统评价与荟萃分析优先报告条目》(PRISMA)及其诊断试验准确性扩展声明。更新版方案已在PROSPERO注册(CRD420251186115),与原方案基本一致,更新内容包括:纳入语言不再限制为英文,对非英文文献使用机器翻译评估 eligibility。
2.2 纳入标准
研究特征:纳入2020年至2025年11月发表于同行评审期刊的研究,排除干预期间开展的研究以避免偏倚。研究设计:纳入横断面研究,报告ED问卷的同时效度及诊断准确性指标(如灵敏度、特异度、阳性预测值、阴性预测值),排除仅评估内容效度、结构效度的研究。参与者:纳入10–17岁青少年及≥18岁成人,高体重定义为青少年成人等效体重指数(Body Mass Index, BMI)≥25 kg/m2、BMI z评分>1、BMI≥同年龄同性别人群第85百分位,或临床诊断为超重/肥胖;成人BMI≥25 kg/m2或临床诊断为超重/肥胖。若研究纳入全体重谱人群且单独报告高体重亚组数据,则纳入该部分数据。排除运动员、孕妇及糖尿病、胃肠道疾病等特定临床人群研究。待评价测试:纳入自评ED问卷(含筛查工具与评估问卷),排除家长或临床医师代评问卷。参考标准:以临床诊断访谈为参照。目标疾病:纳入基于DSM-5的喂食与进食障碍及对应症状,排除正念饮食、食物成瘾等非DSM-5收录疾病的研究。
2.3 数据源与筛选流程
系统检索CINAHL、EMBASE、MEDLINE、APA PsycINFO、APA PsycTests共5个电子数据库,检索词涵盖人群、诊断、待评价测试、结局四类主题词与自由词。文献去重后导入Covidence软件,由2名独立研究者完成标题摘要与全文筛选,分歧通过讨论解决,全程记录排除原因。
2.4 数据提取
使用Covidence定制化工具提取新纳入研究的数据,由1名研究者提取、另1名独立核对,提取内容包括研究基本信息、参与者特征、待评价测试、参考标准、截断值及诊断准确性指标。
2.5 偏倚风险与适用性评估
采用诊断准确性研究质量评价工具第二版(Quality Assessment of Diagnostic Accuracy Studies 2, QUADAS-2)评估偏倚风险与适用性,由2名独立研究者完成,分歧通过讨论解决。不计算总分,任一领域判定为高风险或不明确则整体视为“存在偏倚风险”;适用性任一领域判定为高风险或不明确则视为“存在适用性担忧”。同时对2022年纳入的原研究重新使用QUADAS-2评估(原研究使用旧版QUADAS工具)。
2.6 数据合成
采用无荟萃分析的合成(Synthesis Without Meta-Analysis, SWiM)指南指导叙述性合成,优先参考大样本量、低偏倚风险的研究结果。临床解读时优先考虑高灵敏度问卷以降低漏诊风险。使用证据图谱可视化呈现成人与青少年的问卷覆盖范围、评估诊断及对应灵敏度。
3 结果
更新检索共识别2816篇文献,最终纳入32项研究(含5项新研究)。26项研究针对成人,6项针对青少年;研究开展于美国、意大利、比利时等多国,样本量35–1133例,成人平均年龄27.6–53.1岁,青少年12.8–14.3岁,成人平均BMI 35.2–52.2 kg/m2,12项研究女性占比≥80%,多数研究(成人21项、青少年4项)在临床场景开展,7项成人研究招募减重手术人群。所有研究均存在偏倚风险,主要源于待评价测试领域与流程时序领域的判定不明确或高风险,无研究存在适用性担忧,因此结果权重主要由样本量驱动。
3.1 成人诊断准确性结果
共评估13种问卷的诊断准确性。任意ED的评估仅涉及5种问卷,其中仅SCOFF在多研究中验证,灵敏度波动范围为0.67–1.0。BED的评估涉及8种问卷,BES应用最广泛,6项研究中有4项显示其在截断值15–17时灵敏度>0.8。暴食行为的评估涉及4种问卷,QEWP应用最多但灵敏度变异较大,尤其对主观性暴食的识别灵敏度偏低。其余疾病(BN、AAN、清除障碍、夜间进食综合征、LOC进食)均仅单研究验证。
新增的3种成人问卷中,EDE-Q共7项研究,对客观性暴食的灵敏度高于主观性暴食,其约束分量表对BED的识别灵敏度低于其他分量表或总分,原4因子结构在高体重人群中拟合度不佳,仅1项研究提出任意ED的截断值为3.1,另有非纳入研究提出女性人群截断值为超重3.15、肥胖3.26。BES共6项研究,新研究支持截断值15–18更适合筛查以降低漏诊风险,其最初即在肥胖治疗人群中开发。LOC/暴食筛查工具为新增工具,1项研究显示其对LOC进食的灵敏度为0.72–0.79,对暴食的灵敏度为0.64–0.85,作者建议通过补充隐喻解释、增加行为与情境条目提升准确性,尚需后续验证。
3.2 青少年诊断准确性结果
共评估5种问卷的诊断准确性。BED的评估仅2种问卷各有1项研究,灵敏度均为1.0;EDE-Q儿童/青少年版共3项研究,对暴食的灵敏度为0.57–0.79,但最优截断值尚未明确;LOC进食的评估涉及2种新问卷,单独使用时灵敏度均为0.42,联合使用后提升至0.50,特异性较高但灵敏度不足,无法作为有效筛查工具。
4 讨论
本综述纳入的32项研究中仅5项为近5年发表,且仅有1项针对青少年人群,所有新研究均聚焦于暴食、BED或LOC进食,无任何问卷被验证可覆盖高体重人群的全谱系ED识别。新增证据仅补充了EDE-Q与BES在暴食相关行为中的准确性数据,虽出现了新的LOC进食筛查工具,但敏感性不足,仍推荐使用可覆盖更广ED类型的进食障碍肥胖问卷(EDO)。
当前证据仍高度集中于暴食相关障碍,仅5项研究评估任意ED的识别能力,缺乏足够灵敏的工具识别限制性ED,青少年中甚至无任何工具可评估非暴食类ED。高体重伴限制性ED的人群易被漏诊,而此类人群的疾病严重程度与低体重人群相当,且尚无工具验证对回避/限制性摄食障碍(Avoidant/Restrictive Food Intake Disorder, ARFID)的识别能力,这一空白使得临床无法推荐统一的全谱系ED筛查工具。
简短筛查工具层面,近5年无进展,SCOFF仍是唯一验证过任意ED识别能力的工具。BED筛查中,成人的BEDS-7、青少年的CBBEQ与ADO-BED前2题显示出潜力,但均未在近5年得到重复验证。其他已在社区样本中验证灵敏度优于SCOFF的简短工具(如初级保健进食障碍筛查表、进食障碍筛查表、InsideOut研究所筛查器)尚未在高体重人群中单独验证准确性。正在开发的覆盖全体重谱的儿童青少年筛查问卷“筛查儿童青少年进食”(Screening Kids' And Teens' Eating)值得期待,此类工具的验证应成为研究优先方向。
综合评估问卷层面,仍无工具被验证可识别所有ED诊断,EDE-Q对任意ED的识别仍仅基于1项小样本女性研究,且需更高的截断值,其用于暴食评估的稳定性也存在异质性。BES对BED的识别表现相对可靠,可作为针对性评估工具,但无法满足全谱系评估需求。
特定人群层面,青少年证据缺口尤为突出,无任何工具可识别非暴食类ED,而青春期是ED发病高峰,亟需开发适配青少年的专用工具。此外,纳入研究普遍存在性别与文化多样性不足的问题,绝大多数研究对象为白人女性,针对男性及多元文化背景人群的专用问卷(如进食病理症状量表、男性进食障碍评估量表、肌肥大导向进食测试)尚未在高体重人群中验证准确性,未来研究需优先纳入多元背景参与者以保证工具的普适性。
本综述的优势在于严格以临床访谈为参照,确保了证据的临床相关性,但也存在局限:多数研究在临床场景开展,7项减重手术研究可能存在应答偏倚;不同研究对ED与DEBs的定义不一致,可能导致同一问卷的准确性结果异质性;样本的多样性不足限制了结果的推广性。
5 结论
高体重青少年及成人的ED问卷诊断准确性研究进展缓慢,仅LOC进食、暴食及BED相关工具有所更新,全谱系ED识别工具的证据仍严重不足。未来研究需优先开发或验证适配高体重人群的专用问卷,同时确保工具适用于多元背景的群体,以支撑临床指南的落地实施。