《International Psychogeriatrics》:Research waste among randomized controlled trials of delirium: A cross-sectional study
编辑推荐:
目的:评估谵妄随机对照试验(randomized controlled trials, RCTs)中研究浪费(research waste)的患病率、特征及相关因素。方法:本研究为一项横断面研究(cross-sectional study),数据来源于Clin
目的:评估谵妄随机对照试验(randomized controlled trials, RCTs)中研究浪费(research waste)的患病率、特征及相关因素。方法:本研究为一项横断面研究(cross-sectional study),数据来源于ClinicalTrials.gov数据库。研究纳入了2000年至2024年间注册的126项三期/四期谵妄RCTs。通过PubMed和Google Scholar确定试验的出版状态(publication status)。使用CONSORT报告指南(Consolidated Standards of Reporting Trials checklist)评估报告充分性(reporting adequacy),并使用Cochrane偏倚风险工具(Cochrane Risk of Bias tool)评估方法学缺陷。研究浪费被定义为符合以下任何标准:未出版(non-publication)、报告不充分(CONSORT依从性<75%)或存在可避免的设计缺陷(根据Cochrane标准评为高风险或不确定风险)。结果:研究浪费高度普遍,影响了92.9%的RCTs。仅有22.2%的试验被完全出版。在已出版的试验中,关键方法学细节(分配隐藏、盲法)的报告率低于80%,且67.9%存在可避免的设计缺陷。大样本量(≥100名参与者)独立地与更高的出版可能性相关(校正OR=4.23, 95% CI: 1.43–14.41, P = 0.013),而来自产业界或其他外部资金则与较低的出版可能性相关(校正OR=0.05, 95% CI: 0.00–0.53, P = 0.027)。国际和多中心设计显示出减少研究浪费的趋势,但在多变量模型中未达到统计学显著性。结论:三期/四期谵妄RCTs存在严重的研究浪费,凸显了为这一老年综合征生成证据的关键缺口。亟需强制披露结果、提高报告透明度,并优先开展高质量、大规模的协作研究,以优化资源配置并改善这一脆弱人群的结局。
谵妄是一种急性、波动性的注意力障碍和认知功能损害综合征,是老年住院患者,特别是重症监护、术后或姑息治疗环境中患者常见且严重的并发症[1], [2]。其发生与不良临床结果密切相关,包括住院时间延长、功能恢复延迟、长期认知障碍、死亡率增加,以及对家庭照护者造成显著的情感负担和心理困扰[3], [4]。尽管人们普遍认识到其高发病率和严重危害,但针对谵妄预防和治疗的有效干预措施仍然不足。临床实践指南的制定迫切需要高质量的循证医学证据。在过去二十五年里,大量的随机对照试验(RCTs)旨在探索谵妄的非药物和药物干预,以期改善患者预后、减轻疾病负担,并缓解患者及其家庭的痛苦[5], [6]。
在循证医学框架下,三期和四期RCTs是评估干预措施有效性和安全性的最高级别研究设计,为临床指南提供核心证据[7]。高质量的三期/四期RCTs对于建立谵妄预防和管理的标准方案至关重要。然而,这些大规模试验的成功不仅取决于其严谨的设计和执行,还取决于研究结果的完整报告和广泛传播[8]。无论因为设计缺陷、执行偏差还是结果未公布而未能完全实现其科学价值的研究,都构成了对有限研究资源、研究者努力和参与者贡献的重大浪费[9]。
事实上,研究浪费已成为循证实践中不可忽视的全球性挑战。研究浪费发生在研究周期的所有阶段,包括因未充分考虑现有证据而导致的不恰当的研究问题或设计、因各种原因未出版阴性或中性结果,以及出版时方法和结果报告不透明或不充分[10]。这些问题不仅导致宝贵研究资源的无效消耗,违反研究伦理原则,增加参与者的不必要风险,而且严重阻碍了可靠证据的综合、解读和转化为临床实践,最终减缓了医学进步。在外科和肿瘤学等多个领域,横断面分析揭示了大约80%的RCTs受到不同形式研究浪费的影响,凸显了这一问题的普遍性和严重性[11], [12]。然而,在神经精神病学和老年病学领域,特别是在病因复杂、干预措施复杂、评估工具和结果测量通常具有主观性的谵妄研究中,研究浪费的整体负担、具体表现及相关因素尚未得到系统和全面的评估[13]。
因此,本研究旨在系统检索并评估注册在ClinicalTrials.gov数据库中的、针对谵妄的三期/四期RCTs,首次量化该领域研究浪费的总体负担,并深入分析其特征和分布。研究人员重点关注试验结果的未出版、已发表文献的报告充分性,以及已发表试验中是否存在可避免的设计偏差。本研究的目标是揭示当前谵妄临床研究生态系统中的效率差距,识别与减少研究浪费相关的潜在保护因素,从而为未来设计、实施、报告和传播更高效、透明和负责任的高质量谵妄RCTs提供实证依据和改进方向。
研究人员使用了几个主要技术方法。首先,本研究采用横断面研究设计,数据来源于ClinicalTrials.gov数据库,纳入标准为2000年至2024年间注册的三期/四期谵妄RCTs。其次,通过PubMed和Google Scholar检索确定试验的出版状态。第三,使用CONSORT 2010报告指南清单评估已发表手稿的报告充分性,对于药物干预手稿评估37个项目,对于非药物干预手稿评估40个项目,达到75%以上项目即视为报告充分。第四,使用Cochrane偏倚风险工具对所有已发表的RCTs进行设计缺陷(方法学偏差)评估,涵盖选择、实施、检测、损耗和报告等偏倚领域。最后,研究定义研究浪费为符合未出版、报告不充分或存在可避免设计缺陷(高风险或不确定风险)中的任何一项,并使用卡方检验或Fisher精确检验进行组间比较,采用Logistic回归模型识别与出版状态和研究浪费相关的因素。
研究流程与注册RCTs特征:本研究预定义的搜索策略最初从ClinicalTrials.gov数据库中确定了1543条相关临床试验记录。最终,126项符合条件的谵妄RCTs被纳入分析。超过60%的RCTs于2010年至2019年间开展。研究设计以平行组(122项RCTs, 96.83%)和双臂(104项RCTs, 82.54%)为主,最常用的盲法为四盲(50项RCTs, 39.68%)。大多数研究在国内进行(81.75%),且为单中心(68.25%)。样本量≥100名参与者的RCTs数量与<100名参与者的相似(65项 vs. 61项)。从地理分布看,近一半(57项RCTs, 45.24%)的主要研究者(PI)位于北美。研究的主要目的以预防(60项RCTs, 47.62%)和治疗(58项RCTs, 46.03%)为主。在资金来源方面,绝大多数(120项RCTs, 95.24%)获得了产业界或其他外部资助(表1)。进一步分类分析纳入RCTs评估的干预措施,绝大多数试验(119项RCTs, 94.4%)研究药物干预,而仅一小部分(7项RCTs, 5.6%)关注非药物方法。在药物试验中,右美托咪定(Dexmedetomidine)是测试最多的单一药物,出现在35项RCTs(27.8%)中,其次是氟哌啶醇(Haloperidol)(19项RCTs, 15.1%)、涉及丙泊酚(Propofol)的比较(17项RCTs, 13.5%)和褪黑素/雷美替胺(Melatonin/Ramelteon)(9项RCTs, 7.1%)。
出版状态:共有28项RCTs(22.22%)的结果已出版。与未出版的RCTs相比,已出版的RCTs在多中心性、国际化和样本量方面存在显著差异。具体而言,已出版的RCTs中国际多中心招募的比例显著更高(P=0.014),采用多中心设计的比例也更高(P=0.009)。同时,已出版的RCTs样本量显著更大,78.57%拥有≥100名参与者,而未出版的RCTs中这一比例仅为43.88%(P=0.001)。在其他特征(如开始时间、干预类型、设计、盲法、PI地理分布、主要目的或资金来源)方面,两组间未观察到统计学显著差异。进一步分析谵妄RCTs中测试频率最高的干预措施的出版状态,在频率最高的六种干预措施中,右美托咪定试验量最大,共35项,其中14项(40.0%)已出版。氟哌啶醇在19项试验中进行了研究,出版率为36.8%。相比之下,褪黑素/雷美替胺在高频干预措施中出版率最低,9项试验均未出版(0%)。为识别与出版状态相关的特征,研究人员进行了单变量和多变量Logistic回归分析。单变量分析显示,国际多中心招募(OR=3.68, 95% CI: 1.06–12.89, P=0.037)、多中心设计(OR=3.09, 95% CI: 1.23–7.78, P=0.016)和大样本量(OR=4.31, 95% CI: 1.67–12.65, P=0.004)与出版呈正相关。相反,产业界或其他外部资金与出版呈负相关(OR=0.10, 95% CI: 0.00–0.79, P=0.047)。在纳入单变量分析中P值<0.2的特征进行的多变量分析中,只有大样本量(OR=4.23, 95% CI: 1.43–14.41, P=0.013)显示出独立且显著的正相关。产业界或其他外部资金(OR=0.05, 95% CI: 0.00–0.53, P=0.027)与出版呈独立且显著的负相关。多中心性和国际化在多变量模型中未显示出独立关联。
报告充分性与设计缺陷:在28项已出版的RCTs中,研究人员根据CONSORT声明评估了其报告充分性。结果显示,26项RCTs(92.86%)报告充分,其余2项RCTs(7.14%)报告不充分。大多数项目报告率较高,但在报告一些关键方法学细节方面存在缺陷。具体而言,实施随机分配序列的机制、实施分配隐藏的人员、干预提供者或结果评估者盲法的细节,以及完整试验方案的可用性等项目的报告率均低于80%。此外,研究人员发现19项RCTs(67.86%)存在可避免的设计缺陷。与盲法相关的风险较高:14.29%的研究在结果评估盲法方面被评为不确定风险,14.29%在参与者和人员盲法方面被评为高风险。近一半的研究(46.43%)在“其他偏倚”方面存在高风险。
研究浪费:绝大多数RCTs(117项, 92.86%)受到研究浪费的影响,仅有9项(7.14%)没有。三种最常测试药物的浪费率均超过88%:右美托咪定(88.57%, 31/35)、氟哌啶醇(89.47%, 17/19)和丙泊酚(88.24%, 15/17)。与受浪费影响的RCTs相比,无研究浪费的RCTs在招募范围、研究中心数量和样本量方面存在显著差异。具体而言,无浪费的RCTs中国际多中心招募的比例显著更高(P=0.008),采用多中心设计的比例也更高(P=0.010)。此外,所有无浪费的RCTs样本量均为≥100名参与者,而超过一半(52.14%)受浪费影响的RCTs样本量<100名参与者(P=0.003)。无浪费的RCTs的主要研究者更多来自北美(77.78% vs. 42.74%),尽管此差异无统计学显著性(P=0.166)。在其他特征(如开始时间、干预类型、研究设计、臂数、盲法、主要目的或资金来源)方面,两组间未发现显著差异。为进一步识别与“存在研究浪费”结局独立相关的因素,研究人员进行了Logistic回归分析。单变量分析显示,国际多中心招募(OR=0.10, 95% CI: 0.02–0.48, P=0.003)和多中心设计(OR=0.14, 95% CI: 0.03–0.57, P=0.008)是与较低研究浪费风险相关的保护因素。构建了纳入招募范围和研究中心数量的多变量Logistic回归模型,结果显示,在多变量模型中,这两个因素均未保持独立的统计学显著性(招募范围:OR=0.27, 95% CI: 0.03–1.67, P=0.173;研究中心数量:OR=0.27, 95% CI: 0.04–2.19, P=0.172),表明它们对研究浪费的影响可能重叠或相互作用。
讨论部分总结:本研究首次系统评估了三期/四期谵妄RCTs中的研究浪费情况。研究结果表明,谵妄RCTs的总体出版率较低,已发表文献的方法学报告质量存在显著缺陷,绝大多数试验未能完全实现其科学价值。这些结果凸显了优化这一高负担疾病领域临床研究生态系统的紧迫性,以确保研究投资获得最大回报。研究发现,只有约22%的已注册试验结果被完全出版。这一低出版率甚至低于其他医学领域报道的水平,再次证实了“出版偏差”这一系统性问题。值得注意的是,大样本量是与出版可能性相关的最稳定因素。这可能因为大规模试验通常拥有更充足的资源、更强的学术合作网络和更高的完成优先级,这些都直接增加了结果出版的可能性。然而,非部门资金与较低出版率之间的关联信号值得进一步调查。尽管其在多变量模型中的独立性有限,但它仍提示需要持续关注商业资助试验的结果传播,以确保所有结果,特别是阴性结果的透明度。此外,在已发表文献中,尽管大多数研究形式上符合CONSORT报告的基本要求,但关键方法学方面(如随机化、分配隐藏和盲法)的报告率普遍低于80%。这种报告透明度的缺乏直接导致大量研究在偏倚风险评估的相应领域被评为“高风险”或“不确定风险”,特别是盲法和“其他偏倚”领域。这意味着即使研究已发表,其内部有效性和证据的可靠性也因缺失信息而受到严重损害。这不仅阻碍了系统评价和荟萃分析的有效开展,也使得临床医生和指南制定者难以准确评估干预措施的真实效果,构成了另一种形式的隐性研究浪费。从临床角度来看,谵妄研究浪费中最令人担忧的方面是阴性或中性结果的可能丧失。虽然仅凭注册数据无法确定这些未出版试验的具体结果,但关于出版偏差的文献有力地表明,未能证明统计学显著性的研究被出版的可能性要小得多。鉴于大多数此类试验是药理学干预措施且样本量充足,极有可能许多“被充分测试”的干预措施(如特定的抗精神病药或镇静方案)对谵妄的预防或治疗无效。这些阴性发现未能传播,导致临床医生认为某些干预措施只是“未经研究”,而实际上严格的试验可能已经驳斥了其有效性。这延续了资源浪费的循环,因为未来的研究者可能无意中重复无效的研究路线。此外,高达92.9%的三期/四期谵妄试验受到至少以下一种情况的影响:未出版、报告不充分或存在可避免的设计缺陷。单变量分析表明,国际多中心合作和多中心设计模式与较低的研究浪费风险相关。这暗示更广泛的合作、更标准化的操作程序和更严格的同行监督可能作为保护因素,提高研究质量和完成度。然而,在多变量模型中,这两个因素的独立效应不再显著,表明它们的影响可能相互交织或共同依赖于更深层的结构性因素,如杰出的研究领导力、充足的资金和机构保障。因此,研究人员认为,减少研究浪费不仅需要关注单个试验的设计,还需要构建一个支持高质量、高完成度、高透明度研究的更广泛环境。
研究结论:本研究揭示,在三期/四期谵妄RCTs中,研究浪费广泛存在且严重。绝大多数试验由于结果未出版、方法学报告不充分或存在可避免的设计缺陷,未能完全实现其科学价值。尽管国际多中心、大规模研究在减少浪费方面显示出积极趋势,但总体而言,该领域的临床研究效率亟待提高。这些发现强调了通过倡导所有试验结果的透明披露、严格执行方法学报告标准,以及优先支持设计严谨、协作、高质量的研究,来系统性减少资源浪费的必要性。只有这样,才能加速可靠证据的产生,最终改善谵妄的预防和管理,使患者和医疗系统受益。