《Journal of Clinical Epidemiology》:Evaluating the accuracy of screening titles and abstracts for progressing to full text screening by one versus two independent reviewers: Part 1 of a meta-research study of rapid review methodological trade-offs
编辑推荐:
用单人评审筛查慢性腰背痛干预措施文献时敏感性较低(48.8%-66.3%),但特异性较高(88.0%-93.3%),存在5.0%-6.3%的假阴性误排,主要因对干预措施界定模糊,建议结合双盲评审和英文限制筛查提高准确性。
Melissa Corso | Lauren Ead | Ginny Brunton | Stefano Negrini | Andrea C. Tricco | Pierre C?té
安大略理工大学健康科学学院,地址:2000 Simcoe Street N, Oshawa, Ontario L1H 7K4, 加拿大
摘要
目的
本研究旨在通过比较一名评审者和两名评审者分别对三篇关于慢性原发性腰痛干预措施有效性研究的论文标题和摘要进行筛选的准确性,来评估这种方法的可靠性。次要目标包括计算评审者间的一致性、分析被错误分类的论文情况以及不同评审者的表现,并对仅限英文论文和被错误排除的论文进行敏感性分析。
设计与方法
一名评审者根据标准筛选标准对论文的标题和摘要进行筛选,其结果与两名评审者的共识筛选结果进行对比。我们使用两名评审者的结果作为基准,计算了敏感性、特异性、阳性预测值(PPV)和阴性预测值(NPV)及其95%置信区间(CI)。同时,我们还计算了评审者间的一致性、被错误分类的论文比例及其原因,并对仅限英文论文的数据进行了敏感性分析。
结果
一名评审者的敏感性在48.8%至66.3%之间,特异性在88.0%至93.3%之间;阳性预测值在40.6%至51.8%之间,阴性预测值在93.6%至95%之间;评审者间的一致性在0.39至0.50之间。有5.0%至6.3%的论文被该评审者错误地归类为阴性结果。错误分类的主要原因与对相关干预措施和对照组的评估有关,例如无法明确区分干预措施的作用。敏感性分析表明,仅针对英文论文进行筛选可以提高敏感性和阳性预测值,而特异性和阴性预测值没有变化。
结论
在快速文献筛选过程中,仅使用一名评审者可能会遗漏符合条件的论文。我们建议不要单独依赖Kappa系数来评估筛选质量,因为该系数会受到分类不平衡的影响,并建议加入准确性指标以反映评审者之间分类结果的差异。
通俗语言总结
本研究探讨了单名评审者与两名评审者共同筛选研究文章在系统评价中的准确性。研究针对慢性原发性腰痛的常见治疗方法进行了三项评估。
单名评审者可能会遗漏两名评审者认为相关的研究论文,但在排除无关论文方面表现较好。大约5%至6%的符合条件的论文被单名评审者错误地排除。大多数错误发生在评审者对治疗措施的适用性存疑时。
将筛选范围限制在英文论文上可略微提高筛选的准确性,但无法完全避免遗漏相关研究。由于使用了人工智能将中文研究翻译成英文,因此需要进一步研究这种方法的实用性。
总之,虽然单名评审者可以节省时间,但增加了遗漏重要证据的风险。研究人员在依赖单名评审者时应保持谨慎,并采取额外的质量保证措施以减少偏见。