《International Urogynecology Journal》:Instruments for the Assessment of Fecal and Anal Incontinence: A Scoping Review
编辑推荐:
摘要
引言与研究假设
粪便失禁(Fecal Incontinence, FI)与肛门失禁(Anal Incontinence, AI)显著影响患者生活质量,涉及生理、情感及社会功能多个维度。精准的评估工具对于疾病诊断、病情监测及治疗效果评价至关重要。
方法
研
摘要
引言与研究假设
粪便失禁(Fecal Incontinence, FI)与肛门失禁(Anal Incontinence, AI)显著影响患者生活质量,涉及生理、情感及社会功能多个维度。精准的评估工具对于疾病诊断、病情监测及治疗效果评价至关重要。
方法
研究人员遵循Arksey与O’Malley提出的框架开展范围综述。检索数据库涵盖EMBASE、MEDLINE(PubMed)及PEDro,检索时限为各数据库建库至2025年2月。纳入标准为开发、验证或跨文化改编FI/AI评估工具的英文或葡萄牙语文献。
结果
共纳入52项研究,对应52种评估工具。多数工具为自评问卷(n=34,占65.4%),主要评估生活质量。仅少数工具报告了完整的心理测量学验证及正式的跨文化改编流程,且鲜有工具涉及客观肛管直肠运动或感觉功能评估。
结论
尽管现有工具种类较多,但在功能评估、心理测量学完整性及跨文化适应性方面仍存在显著空白。
引言
粪便失禁(FI)定义为无法自主控制液态或固态粪便排出[1],肛门失禁(AI)为更广泛概念,同时包含无法自主控制排气[2]。上述定义被国际临床指南广泛采纳[3]。两类疾病均显著降低患者生活质量,引发羞耻感、心理困扰及社会孤立[3]。
FI可分为被动型失禁(无预警漏便)、急迫型失禁(有预警但无法控制)及混合型。危险因素包括肛管括约肌及耻骨直肠肌结构与功能缺陷、肛管直肠感觉异常(减退或过敏)、结肠或直肠储存能力下降[4]。多数患者中,粪便性状与直肠排空动力学至关重要,腹泻或结肠推进过快可暴露潜在控便机制缺陷[5]。
正常肛门控便依赖多重机制:静息状态下肛管闭合、感知直肠内粪便或气体存在的能力、盆底肌反射性激活、对直肠感觉的认知识别、足够的直肠储存能力,以及耻骨直肠肌与肛管括约肌的正常功能。粪便性状与共病情况亦影响控便机制[6,7]。
鉴于FI与AI病因、影响因素及临床影响的复杂性,需采用特异性评估工具以实现精准诊断与监测。此类工具应兼顾生理功能改变及生活质量受损维度[8]。在盆底功能障碍领域(如尿失禁),已发展出症状严重程度量表、生活质量问卷及疾病特异性工具等多种评估手段[9,10],其多样性反映了工具目标、适用人群及心理测量学特性的差异,凸显了依据用途批判性评估工具的重要性。本研究旨在通过范围综述,系统梳理并描述可用于评估FI与AI的工具。
材料与方法
研究采用Arksey与O’Malley提出的五阶段框架[11]:确定研究问题、识别相关研究、筛选研究、提取数据、汇总与报告结果。纳入标准为专门针对FI和/或AI开发或验证的评估工具,语言限定为英文或葡萄牙语。若工具专为FI或AI设计且不限于单一性别,则混合人群(男、女、儿童)研究亦可纳入。仅包含肛门失禁相关条目的广义盆底功能障碍问卷不予纳入。因属范围综述,豁免伦理委员会审批。
研究问题为“文献报道的用于评估肛门与粪便失禁的工具有哪些?”。具体目标包括:(i)识别可用工具;(ii)描述其特征(含适用人群与评估领域);(iii)审查报告的测量学特性;(iv)明确现有工具的不足。
检索策略覆盖EMBASE、MEDLINE(PubMed)及PEDro数据库,不设发表时间限制,检索时限为建库至2025年2月,最终检索于2025年2月完成。由两名研究者独立筛选标题与摘要,分歧通过讨论或由资深研究者裁决解决。表1详述各数据库检索策略、检索文献量及检索日期。
所有记录导入Rayyan软件(Rayyan Systems Inc., Cambridge, MA, USA;
https://www.rayyan.ai)进行去重与管理。经全文筛选后,数据提取至Microsoft Excel(Microsoft Corporation, Redmond, WA, USA;
https://www.microsoft.com)。提取条目包括文献信息、语言、翻译与验证流程、目标人群、工具目的、工具类型(问卷或量表)、评估领域及心理测量学特性(内容效度、结构效度、信度、灵敏度、特异度、判别效度、反应度及假设检验)。数据提取由两名研究者独立完成,分歧通过共识解决。
结果以描述性及主题性方式汇总报告,辅以图表展示工具分布规律,明确现有工具的优势与不足。
结果
初检获得6024条记录,剔除重复文献1035条(17.18%)后,剩余4989条(82.82%)进入初筛。两名研究者首先依据标题筛选,纳入184条(3.69%),排除4805条(96.31%)。随后阅读摘要,纳入61条(33.15%),排除123条(66.85%)。最终因无法获取全文(含会议摘要及未公开全文的会议论文)排除9条(14.75%),具体流程见图1(PRISMA流程图)。
纳入工具的特征总结见表2,报告的测量学特性分布见表3。代表性工具包括粪便失禁生活质量量表(Fecal Incontinence Quality of Life Scale, FIQL)、Wexner评分、国际尿失禁咨询问卷-肠道模块(International Consultation on Incontinence Questionnaire-Bowels, ICIQ-B)、低位前切除综合征评分(Low Anterior Resection Syndrome, LARS)及多种疾病与人群特异性问卷(详见附录1)。
工具开发地域分布广泛,但以英语国家为主(n=24,46.2%)。美国占比最高(n=11,21.2%),其次为法国(n=5,9.6%)、英国、巴西与荷兰(各n=4,7.7%),其余国家占比均低于6%,呈现分散的全球分布特征。
25种工具(48.1%)已被译为其他语言,27种(51.9%)仅存原语言版本。仅7种工具(13.5%)明确报告遵循翻译后的正式跨文化适应流程。
目标人群分布异质性显著。多数工具针对FI或AI成人患者(不限年龄)(n=30,57.7%);针对女性的工具占21.2%(n=11);针对儿童群体的工具占15.4%(n=8);仅针对男性的工具占3.9%(n=2);仅1种工具(1.9%)专门针对老年人(≥60岁)。整体表明工具开发对人群的覆盖广泛但不均衡。
工具形式分为患者报告结局指标与临床医生评定工具。患者自评问卷占65.4%(n=34),临床医生评定量表占32.7%(n=17),1种工具(1.9%)结合两者。工具用途多样,包括生活质量评估、症状严重程度评估、诊断、治疗监测、筛查、FI分型及就医障碍识别,部分工具兼具多重用途。
测量学评估完整性差异较大。表3总结了报告的心理测量学特性频率、定义及解读说明。内容效度与结构效度在大多数研究中得到评估(n=47,90%),5种工具(9.6%)未报告信度。灵敏度与特异度评估较少,判别效度与反应度的评估在各研究中不一致。
工具条目数介于3至40余条。虽领域分类不一,但最常评估的领域包括排便控制与紧迫感、漏便或便秘频率、生活质量、社会心理与情感影响、自主性与功能状态及自我感知。
讨论
本范围综述旨在系统梳理并描述FI与AI评估工具。结果显示工具在设计、目标人群及测量学评估方面存在显著异质性,且在功能评估、跨文化适应及测量学完整性方面存在重要空白。
现有工具以患者报告结局指标为主,多聚焦于症状频率与生活质量影响。尽管这些维度对反映FI与AI的社会心理负担至关重要,但客观或功能性指标的缺失构成主要局限。涉及肛管直肠运动功能、盆底肌功能及感觉机制的测量极少被纳入,而这些机制是控便的核心。此类内容的缺失可能限制诊断准确性并阻碍个体化治疗方案制定。客观盆底肌功能评估已被证实是全面盆底评估的关键组成部分,应在临床与科研中补充自评结果[12]。
工具长度与结构差异显著,从仅含数条目简短量表至超过40条目的综合问卷不等。简短工具虽利于繁忙临床环境使用,但可能因过于简略而无法全面覆盖FI与AI的多维特性;冗长问卷则可能不适用于认知障碍者或时间受限的临床场景。这种变异性凸显了在可行性与内容效度间寻求平衡的挑战,也强调了工具设计的审慎必要性。
另一重要发现是工具开发的地域与语言集中性。多数工具源自英语国家(尤其是美国),反映特定医疗体系与文化背景。尽管部分工具被翻译,但正式跨文化适应流程的报告率极低。此局限引发对跨人群测量等效性的担忧,因语言细微差别、文化规范及健康观念可能影响症状报告与影响感知。严格的跨文化适应流程对于确保评估工具原版本与译版本在概念、语义及测量上的等效性至关重要[13]。
在测量学严谨性方面,工具间存在显著差异。内容效度与结构效度常被报告,而其他关键特性(如信度、灵敏度、特异度、判别效度及反应度)的评估则不一致。部分广泛应用工具缺乏全面的测量学评估,降低了对其测量精度及检测临床有意义变化能力的信心。充分的验证(含信度与反应度测试)是健康研究与临床实践中结果评估的前提[14]。既往对FI特异性生活质量工具的批判性综述同样指出,即使在常用工具中,预测效度与反应度也存在不足[15]。
目标人群的多样性进一步凸显当前评估策略的碎片化。虽然多数工具在成人肠功能障碍人群中验证,部分工具针对特定亚群(如盆底功能障碍女性、儿童、神经或肿瘤患者),但机构养老老年人、多重残疾人群等重要群体仍未被充分代表。这种包容性的缺失构成额外空白,限制了现有工具的普适性。
综上,目前尚无单一工具能全面整合FI与AI的所有相关维度——主观症状负担、生活质量影响及客观功能评估。未来工具研发应致力于结合患者报告结局与肛管直肠运动及感觉功能测量,同时进行严格的测量学验证与跨文化适应。此类整合将提升诊断准确性、促进个体化治疗规划并增强临床与科研场景的可比性。其他临床领域(如炎症性肠病试验)同样强调多模式评估的必要性[16]。
本范围综述存在方法学局限。作为范围综述,未对纳入研究的方法学质量或偏倚风险进行正式评估,限制了个体工具稳健性的比较。此外,仅纳入英文与葡萄牙语文献,可能导致遗漏其他语言开发的工具。纳入研究的异质性及测量学特性报告的不一致性也限制了工具间的直接比较。部分研究涉及混合人群且未行性别分层分析,限制了部分工具对女性的适用性判断。
本综述指出的局限性应在现有证据背景下解读,并不否定现有工具的使用价值。多种工具在评估症状严重程度与生活质量影响方面仍具实用价值(尤其适用于临床与科研)。然而,在控便评估的主客观成分整合及测量学验证完整性方面,重要空白依然存在。
未来研究应着重开发与验证整合肛管直肠功能评估与患者报告结局的工具。同时需更重视全面的测量学评估(包括反应度与跨文化适应),以确保工具在不同人群与临床环境中的适用性。
本综述提供了现有工具的结构化图谱,有助于识别研究空白,并为FI与AI评估领域的未来发展提供依据。
结论
本综述强调了当前FI与AI评估工具的异质性与局限性。现有工具未能充分覆盖功能评估、测量学稳健性及跨文化适用性,亟需更全面且经过严格验证的评估工具。