《JBI Evidence Implementation》:Comparing theory-driven and intuition-based approaches to inform implementation strategies in practice: an exploratory two-arm cluster-randomized head-to-head implementation trial
编辑推荐:
本文是一篇探讨实施科学方法的实证研究,系统比较了在改善林奇综合征(LS)遗传性癌症筛查路径时,基于理论(TDF)与基于直觉两种实施策略开发路径的差异。研究通过双臂整群随机试验设计,在澳大利亚七家医院开展,主要评估两种方法在提高风险适宜的肿瘤检测和遗传服务转诊率方面的有效性。结果表明,理论驱动方法在改善高风险患者转诊记录缺失这一关键次要结局上效果更优,但主要结局的证据尚不确定。文章创新性地建立了一套“头对头”比较的实施科学方法论模板,为未来大规模评估理论在实施策略中的贡献提供了可行范式。
引言
在医疗保健领域,通过实施策略来改变专业人员的临床实践以提高医疗质量,其设计与评估常依赖于行为理论。理论驱动的方法被认为能更深刻地理解行为改变背后的机制。然而,支持理论驱动方法优于非理论驱动(或“直觉”驱动)方法的证据多为间接,且面临挑战。为明确评估理论在实施策略中的影响,有必要在控制其他变量的前提下,将理论成分与直觉成分区分开来。本研究旨在填补这一空白,通过一项探索性双臂整群随机试验,在遗传性癌症——林奇综合征(LS)的筛查与转诊实践中,直接比较理论驱动与直觉驱动两种策略发展路径的效果。
背景与目标
林奇综合征是一种遗传性癌症易感综合征。美国、欧洲和澳大利亚的指南均推荐对所有结直肠癌(CRC)患者进行具有成本效益的、阶梯式的肿瘤检测,随后对高风险肿瘤结果的患者进行基因检测。然而,先前的研究揭示了澳大利亚多家主要医院在LS肿瘤检测和转诊方面存在显著差距。鉴于实施理论在基因组学领域的应用有限,LS的转诊流程为研究理论驱动与直觉驱动的实施方法提供了一个理想的临床情境。
本研究的主要目标是,在基因组医学的背景下,比较两种完全结构化、仅在设计策略时使用理论与否存在差异的实施方法,在改善林奇综合征检测和遗传服务转诊这一临床实践元素上的有效性。本研究被定位为探索性试验,核心重点在于建立一个可用于“头对头”比较不同实施方法的方法学模板。
试验设计
试验招募了澳大利亚新南威尔士州、维多利亚州和西澳大利亚州八家公立医院网络。每家医院被视为一个整群(集群),被随机分配至理论驱动组或直觉驱动组(1:1比例),并按所在州和CRC手术量进行分层。最终,七家医院参与了试验。整个实施过程采用一个由七个步骤组成的结构化方法,两组在步骤1-3和6-7上完全相同。
两组的关键区别在于第4步(障碍识别)和第5步(策略设计):
- •
理论驱动组:采用理论域框架(Theoretical Domains Framework, TDF)来系统识别行为改变的决定因素。识别出的障碍被映射到具有证据支持、能与特定TDF领域建立机制性联系的行为改变技术(Behavior Change Techniques, BCTs),以指导医院特异性策略的制定。
- •
直觉驱动组:医疗保健专业人员完全基于自身的经验和实践知识,通过一般性的焦点小组讨论来识别障碍并提出解决策略,不使用任何正式的理论框架。
为防止两组间相互影响,由两个独立的研究分析团队分别负责指导两组的策略设计工作。
结局指标与数据分析
试验评估了从2017年1月1日至2021年9月30日期间,在七家医院接受CRC切除术的所有患者的数据。主要结局是患者在CRC切除术后2个月内完成风险适宜的LS肿瘤检测和遗传服务转诊的比例。次要结局包括:1)肿瘤检测结果缺失的比例;2)在已完成肿瘤检测且结果为高风险的患者中,缺乏遗传服务转诊记录的比例。
分析采用差异中的差异(difference-in-differences)方法,比较从试验前阶段到实施/实施后阶段,两组间在实践改变上的差异。统计模型使用了广义估计方程,并调整了患者年龄、性别、癌症分期、健康保险等协变量,以考虑患者群体的差异。
结果
共有3321名患者的数据被纳入分析。
- •
主要结局:理论驱动组的风险适宜路径完成率从试验前的79.6%提升至实施后的94.5%,而直觉驱动组则相对稳定(77.2% vs 74.4%)。调整后的风险比(aRR)为1.22,但其95%置信区间(0.92–1.61)跨越了1,p值为0.1713,表明两组间在主要结局上的差异没有统计学意义。值得注意的是,这一结果在很大程度上受到一家大型医院(H4,直觉驱动组)的影响,当排除该医院后,效应值趋于无效(aRR = 1.00)。
- •
次要结局:
- 1.
肿瘤检测缺失:理论驱动组在减少检测缺失方面显示出更大的减少趋势(aRR = 0.24, 95% CI: 0.07–0.87, p = 0.0306),但在经过多重检验校正后,未达到预设的统计学显著性阈值。同样,这一结果也主要归因于医院H4。
- 2.
转诊记录缺失:在肿瘤检测完成且结果为高风险的患者中,理论驱动组在减少转诊记录缺失方面表现出显著且更大的改善(aRR = 0.50, 95% CI: 0.41–0.61, p < 0.0001)。敏感性分析显示,该结果并非仅由某一家大医院驱动,具有一定的稳健性。这种差异是由于理论驱动组的三家医院转诊缺失均有所减少,而直觉驱动组的三家医院中有两家的转诊缺失反而增加。
探索性分析还发现,患者年龄与转诊记录缺失显著相关,年轻患者(尤其是年龄小于40岁)的转诊缺失比例远低于年长患者(年龄大于70岁)。
讨论
这项探索性试验为比较理论和直觉驱动的实施策略建立了严格的方法学框架。研究发现,理论驱动的方法在改善高风险患者遗传服务转诊这一具体环节上表现出更强的效果。这可能是由于理论驱动的方法(使用TDF和BCTs)能够更系统、更深入地处理复杂的障碍,例如涉及知识、技能、信念、情绪和社会影响等方面的障碍。相比之下,直觉驱动策略往往更侧重于提供信息和解决实际问题。
然而,对于涉及多步骤的LS检测和转诊整体路径(主要结局),理论驱动方法的优势并不确定,结果受到医院间异质性和个别医院表现的显著影响。过程评估报告指出,组织文化、实施团队的变动、策略实施的时机与方式等背景因素,都可能对结果产生重要影响。
本研究的一个关键启示是,对于像LS这样相对罕见、检测流程多步骤的疾病,要设计有足够统计学效力来检测临床诊断率差异的大规模实施试验极具挑战。基于本试验数据的样本量估算表明,若要进行以LS诊断率为主要结局的集群随机试验,可能需要超过100家医院的参与。因此,关注中间结局(如检测完成率、转诊率)以及选择更常见疾病或高发情境,对于未来进行有效的“头对头”比较研究至关重要。
临床实践与研究意义
对于临床实践而言,本研究提示,基于TDF等理论的结构化方法,可能更有助于促成临床医生行为的一致性改变,特别是在改善高风险患者的系统化转诊方面。理论在解决复杂行为障碍时可能更具价值。
对于实施科学研究而言,本研究成功示范了一种严格控制变量、专门比较理论成分贡献的试验设计方法。它强调了详细记录策略设计、实施过程以及进行深入过程评估的重要性,这对于理解策略如何及为何起作用至关重要。尽管在主要结局上未发现确凿差异,但该研究为未来在更大规模和不同临床背景下,积累关于理论驱动策略有效性的证据提供了可复制的模板。
结论
这项探索性头对头实施试验比较了理论驱动与直觉驱动的方法在改善林奇综合征肿瘤检测和遗传服务转诊方面的效果。研究表明,理论驱动的方法在改善一项关键次要结局(高风险患者的遗传转诊)上取得了更明显的进展,但在主要临床结局上并未显示出确凿的差异。研究结果强调了背景因素在实施成功中的关键作用。本研究建立的方法学框架为未来大规模评估理论在实施策略中的附加价值奠定了基础。鉴于理论在推进科学理解方面的既定价值,将本试验开发的方法应用于更大规模的研究,可能为理论驱动策略的比较有效性提供确凿证据。