
-
生物通官微
陪你抓住生命科技
跳动的脉搏
修改后的墨尔塔格式安全诊断评分标准在全科医学培训中的应用:来自实际实施研究的初步有效性证据
《BMC Medical Education》:A modified murtagh-style safe diagnostic rubric for general practice training: preliminary validity evidence from a real-world implementation study
【字体: 大 中 小 】 时间:2026年05月10日 来源:BMC Medical Education 3.2
编辑推荐:
摘要背景安全诊断推理是一般实践培训中的核心能力,但同时也充满挑战,尤其是在信息有限、不确定性普遍存在以及诊断错误会直接影响患者安全的一线环境中。尽管Murtagh的诊断框架提供了一个临床直观的结构,但在资源较少且非英语授课的培训环境中,其对教育的应用和结构化评估仍尚未得到充分探索
安全诊断推理是一般实践培训中的核心能力,但同时也充满挑战,尤其是在信息有限、不确定性普遍存在以及诊断错误会直接影响患者安全的一线环境中。尽管Murtagh的诊断框架提供了一个临床直观的结构,但在资源较少且非英语授课的培训环境中,其对教育的应用和结构化评估仍尚未得到充分探索。本研究的目的是评估一种改良版的Murtagh风格安全诊断评分标准(MM-SAFE-Dx)及其在一般实践培训中的应用。
本研究是在中国东北部哈尔滨医科大学第一附属医院进行的一项单中心回顾性真实世界实施研究。2025年,通过三个自愿参与的培训轮次实施了改良版的Murtagh风格安全诊断培训项目。共有83名一般实践培训生和住院医师参与了研究,提供了145次评分评估案例。使用非参数方法分析了基线和随访的基于案例的评估结果,初步验证了MM-SAFE-Dx评分标准的真实性,包括其内部一致性、基于基线的区分度、响应性、情境敏感性和实际评分稳定性。
整体教育效果较为温和,但趋势上是积极的。将初次接触与重复使用的效果区分开来后,从基线到初次接触期间变化甚微,而后续轮次的评估显示出了与累积学习过程一致的持续改进,尽管并非所有比较都达到了统计学显著性。敏感性分析进一步表明,未经校正的基于基线的分层会产生以低水平学习者为主的短期效应的矛盾结果,而基于纵向数据的分层则产生了更易于解释的结果。这些发现表明,从初次接触复杂诊断评分标准获得的基线测量值可能无法可靠地反映学习者的实际诊断能力。
在这种资源有限且环境多样的一般实践培训环境中,MM-SAFE-Dx评分标准显示出初步的真实世界有效性和实际教育用途。除了评估特定培训项目外,本研究还揭示了一个更普遍的方法学问题:在陌生且资源波动的环境中引入的结构化诊断工具,在其教育效果能够被有效解释之前,可能需要引导实施和针对具体情境的分析校准。
安全诊断推理是一般实践培训中的核心能力,但同时也充满挑战,尤其是在信息有限、不确定性普遍存在以及诊断错误会直接影响患者安全的一线环境中。尽管Murtagh的诊断框架提供了一个临床直观的结构,但在资源较少且非英语授课的培训环境中,其对教育的应用和结构化评估仍尚未得到充分探索。本研究的目的是评估一种改良版的Murtagh风格安全诊断评分标准(MM-SAFE-Dx)及其在一般实践培训中的应用。
本研究是在中国东北部哈尔滨医科大学第一附属医院进行的一项单中心回顾性真实世界实施研究。2025年,通过三个自愿参与的培训轮次实施了改良版的Murtagh风格安全诊断培训项目。共有83名一般实践培训生和住院医师参与了研究,提供了145次评分评估案例。使用非参数方法分析了基线和随访的基于案例的评估结果,初步验证了MM-SAFE-Dx评分标准的真实性,包括其内部一致性、基于基线的区分度、响应性、情境敏感性和实际评分稳定性。
整体教育效果较为温和,但趋势上是积极的。将初次接触与重复使用的效果区分开来后,从基线到初次接触期间变化甚微,而后续轮次的评估显示出了与累积学习过程一致的持续改进,尽管并非所有比较都达到了统计学显著性。敏感性分析进一步表明,未经校正的基于基线的分层会产生以低水平学习者为主的短期效应的矛盾结果,而基于纵向数据的分层则产生了更易于解释的结果。这些发现表明,从初次接触复杂诊断评分标准获得的基线测量值可能无法可靠地反映学习者的实际诊断能力。
在这种资源有限且环境多样的一般实践培训环境中,MM-SAFE-Dx评分标准显示出初步的真实世界有效性和实际教育用途。除了评估特定培训项目外,本研究还揭示了一个更普遍的方法学问题:在陌生且资源波动的环境中引入的结构化诊断工具,在其教育效果能够被有效解释之前,可能需要引导实施和针对具体情境的分析校准。