监督机制重要吗？一项关于腹腔镜模拟器培训在本科生教育中作用的随机对照研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Frontiers in Surgery》：Does supervision matter? A randomized controlled study of laparoscopic simulator training in undergraduate education

【字体：大中小】 时间：2026年05月11日 来源：Frontiers in Surgery 1.8

编辑推荐：

　　**摘要** **背景**：基于模拟的训练是外科教育的基石，然而关于持续指导与独立实践对新手相比的影响的证据仍然有限。本研究旨在评估在腹腔镜模拟训练中，持续远程视频指导与独立训练的有效性。 **方法**：本研究是一项随机对照试验，共有20名没有腹腔镜经验的医学生参与。参与

　　**摘要**
**背景**：基于模拟的训练是外科教育的基石，然而关于持续指导与独立实践对新手相比的影响的证据仍然有限。本研究旨在评估在腹腔镜模拟训练中，持续远程视频指导与独立训练的有效性。
**方法**：本研究是一项随机对照试验，共有20名没有腹腔镜经验的医学生参与。参与者被随机分配到两个组：一组接受实时视频指导（监督组，n=8），另一组进行自主练习（独立组，n=12）。训练使用Simball Box模拟器进行（“绳索竞赛”任务）。结果指标包括客观的任务完成时间以及通过问卷调查获得的关于难度的主观评价和反馈的价值。
**结果**：两组在从热身到第一个练习的任务完成时间上都有显著改善（监督组：p<0.001；独立组：p=0.020）。虽然在主要结果（第一次无监督的绳索竞赛测试中的表现时间）上没有发现统计学上的显著差异，但监督组在早期练习中的完成时间倾向于更快。值得注意的是，监督组在训练后报告的难度感知显著降低（p=0.049），而独立组则认为仅通过模拟器获得的反馈价值显著降低（p=0.003）。
**结论**：与独立练习相比，远程实时指导显著降低了难度感知，并防止了对反馈价值的贬低。这些发现支持了一种混合课程模式，即在早期阶段提供资源密集型指导以促进心理运动技能的掌握，随后进行独立的训练量训练。

**1 引言**
基于模拟的训练已成为外科教育早期的基石，它为受训者在对患者进行操作之前提供了一个安全、可控的环境来掌握技术技能。腹腔镜手术需要高级的心理运动能力和空间感知能力——这些技能对新手来说往往难以掌握。因此，虚拟现实（VR）和模拟训练器被广泛采用，以弥补理论知识与操作能力之间的差距。许多研究表明，结构化的模拟器训练可以提高表现并减少腹腔镜任务中的错误率。尤其是Ahlberg等人（1）证明，基于熟练度的VR训练显著降低了外科住院医生在初次腹腔镜胆囊切除术中的错误率。Enochsson等人（2）强调了空间感知能力和游戏经验在模拟器表现中的预测作用，表明个体因素对学习曲线有显著影响。在本科生医学学生中，研究表明模拟器训练即使在外科教育的早期阶段也能提高技术技能。Ahlborg等人（3）发现，在腹腔镜模拟器训练中提供个性化反馈可以缩短器械移动路径长度并提高任务效率。类似的，远程指导干预也被证明比自主练习更能提高精度和表现（4）。这些发现强调了在基于模拟的学习中指导和反馈的关键重要性。在另一项随机临床试验中，Seymour等人（5）报告称，接受VR训练的住院医生在腹腔镜胆囊切除术中的表现明显优于未接受系统模拟器训练的医生。Grantcharov等人（6）的一项涉及16名外科受训者的随机临床试验表明，接受VR模拟器训练的受训者在手术室中的表现显著优于对照组。
近期基于模拟的教育进展越来越多地关注结构化、可适应性和基于证据的培训框架。Pan等人（7）的一项随机试验表明，围绕基于证据的教学模型设计的腹腔镜培训课程显著提高了外科受训者的操作表现，凸显了结构化课程在现代技能获取中的价值。同样，Zhou等人（8）报告说，在高容量教学医院中，高度模拟和可适应的培训系统提高了住院医生的腹腔镜技能发展，突显了灵活、技术增强型培训环境的日益融合。这些最新发现补充了远程和混合模拟方法的发展，强化了评估监督式与独立训练模式在本科生学习中的相关性。尽管有这些进展，但关于持续指导与独立实践对本科生影响的证据仍然有限。确定实时指导是否比自主训练具有可测量的优势对于优化资源分配和设计有效的模拟程序至关重要。
本随机对照试验的目的是评估在腹腔镜模拟训练中，持续、视频指导的远程指导与独立训练的有效性。我们假设实时指导将带来更高的技术熟练度，这将通过更短的任务完成时间和更高的自信心得到证实。

**2 材料与方法**
2.1 **研究设计**
这项前瞻性随机对照试验在瑞典乌梅奥大学进行，旨在评估在腹腔镜模拟训练期间，持续远程视频指导与无指导对医学生的影响。
2.2 **参与者**
最初计划纳入40名医学生，基于功效分析。然而，由于招募速度较慢，在招募20名学生后研究提前终止。纳入标准包括注册医学课程且无腹腔镜手术经验。排除标准包括之前接受过模拟器培训或手术操作。所有参与者均获得了书面知情同意。
2.3 **样本量和功效计算**
在之前的研究中（未发表的数据），我们发现接受指导的学生在绳索测试中的表现提高了2.1毫米/秒，而对照组提高了0.6毫米/秒（4）。第一组的标准差为1.8毫米/秒。假设差异相同，需要总共36名受训者才能达到70%的功效以检测组间统计学上的显著差异。根据组间任务完成时间比较观察到的效应大小，进行了事后功效分析。使用实际样本量20名参与者，统计功效约为28%至35%，具体取决于比较内容。这证实了研究相对于事先估计的70%功效（需要36名参与者）来说效能不足。
2.4 **培训前问卷**
培训前和培训后的问卷改编自之前在腹腔镜模拟研究中使用的工具，并由两名资深外科医生和一名教育专家审阅，以确保面效和内容效。
2.5 **随机化**
参与者以1:1的比例使用计算机生成的随机序列进行随机分配。使用4、6和8的块大小，并随机变化以防止分配预测。通过由未参与参与者招募或评估的独立研究人员生成的自动化随机程序确保分配隐蔽。只有在参与者完成基线问卷后才披露组别分配，以保持隐蔽性。
2.5.1 **模拟器和任务**
训练使用Simball? Box模拟器（Surgical Science Sweden AB，哥德堡，瑞典）进行。每位参与者完成了以下内容：
- **热身和训练**：所有参与者，无论组别如何，都从包含“绳索竞赛”程序的热身练习开始。该任务要求在Simball? Box中使用腹腔镜器械将一根线穿过八个环圈。记录完成练习所需的总时间。随后，参与者在有无远程视频指导的情况下练习了20分钟。
- **最终测试任务**：所有参与者，无论组别如何，都进行了三次无监督的最终绳索竞赛。记录了这三次练习的时间。
2.5.2 **培训后问卷**
在完成最终任务后，参与者立即完成了培训后问卷，以评估难度感知、培训的实用性、收到的反馈的价值以及对未来使用模拟器的态度。
2.6 **结果指标**
2.6.1 **客观结果**
- **任务完成时间（秒）**
2.6.2 **参与者感知的结果**
- 培训前和培训后的问卷得分，涉及难度感知、反馈价值和动机。
主要结果是第一次无监督绳索竞赛测试（测试1）的完成时间，该测试在培训干预后立即进行。选择这个时间点是为了捕捉监督对早期表现的直接影响。测试2和3的完成时间被预先定义为次要结果，以反映后续的表现轨迹。对于关键结果，计算了95%的置信区间（CIs），以提供组间差异的精度估计。
2.7 **数据收集**
在乌梅奥大学进行的模拟练习被记录下来，随后由独立观察者（LE）根据完成时间进行了评估。记录设备设置遵循了该团队之前描述的协议（4）。问卷在培训前后进行。性能指标由模拟器软件自动记录，但不幸的是未能保存。模拟器本地存储缓冲区的临时故障导致运动学指标（如器械移动路径长度、角度运动、错误计数）无法自动导出。这些数据无法恢复。然而，通过视频回放可以获取任务完成时间，作为主要的表现指标。
2.7.1 **统计分析**
连续变量以平均值±标准差或中位数（IQR）表示，并使用独立t检验或Mann–Whitney U检验进行比较。分类变量使用卡方检验进行分析。使用Spearman等级相关系数探索基线变量（如游戏习惯、态度）与表现之间的相关性。p值<0.05被视为统计学上显著。
2.7.2 **伦理考虑**
该研究获得了瑞典伦理审查机构的批准（参考编号2023-02208-01）。所有参与者均获得了书面知情同意。

**3 结果**
3.1 **参与者流程和特征**
20名医学生被随机分为两组：持续指导组（n=8）和独立练习组（n=12）。约70%的参与者为女性，反映了当前的医学院学生群体特征。在基线时，两组在任务完成时间上没有显著差异（表1）。
表1：协变量
| 协变量 | 监督组（n=8） | 独立组（n=12） | 总计（n=20） | P值 |
|------------|---------|--------------|==========|---------|---------|---------|
| 性别 | 男 | 2（25.0%） | 4（33.3%） | 6（30.0%） | 0.690 |
| 女 | 6（75.0%） | 8（66.7%） | 14（70.0%） | | |
| 玩电脑游戏 | 否 | 4（50.0%） | 8（66.0%） | 12（60.0%） | 0.582 |
| 是 | 4（50.0%） | 4（33.0%） | 8（40.0%） | | |
| 游戏类型 - 射击游戏 | 否 | 5（62.5%） | 10（83.3%） | 15（75.0%） | 0.292 |
| 是 | 3（37.5%） | 2（16.7%） | 5（25.0%） | | |
| 移动游戏 | 否 | 5（62.5%） | 8（66.7%） | 13（65.0%） | 0.292 |
| 是 | 3（37.5%） | 4（33.3%） | 7（35.0%） | | |
| 年龄（岁） | 平均值（SD） | 24.4（2.7） | 25.6（4.9） | 25.1（4.1） | 0.487 |
| 基线任务时间 | 秒 [平均值（SD） | 388（109） | 347（172） | 363（148） | 0.529 |然而，在监督组中，相应问题的训练前后的得分没有显著变化，保持在同一水平（4.5 vs 4.6；p = 0.685）。3.3.1.1 子组分析3.3.1.1.1 游戏经验报告有电脑游戏经验的参与者完成第三项测试的平均时间为137秒，而没有这种经验的参与者为249秒（p = 0.063）（表4）。报告玩射击游戏的参与者完成第三项测试的速度显著快于那些没有玩这种游戏的参与者（130±13秒 vs 207±130秒；p = 0.037）。在有手机游戏经验的参与者和没有这种经验的参与者之间，测试完成时间没有观察到统计学上的显著差异，尽管在第三项测试中存在完成时间更快的趋势（p = 0.102）（表4）。表4 绳索赛跑完成时间（秒）阶段平均值标准差平均值标准差P值有游戏经验n=11无游戏经验n=9热身333127401171p=0.341现场测试11976219275p=0.856现场测试216870223112p=0.225现场测试313722249155p=0.063玩射击游戏n=5不玩射击游戏n=15热身344135370156p=0.728现场测试12058319163p=0.755现场测试21538220695p=0.269现场测试313013207103p=0.037玩手机游戏n=7不玩手机游戏n=13热身3121243911570.238现场测试119142197780.814现场测试2173612031070.425绳索赛跑完成时间与游戏经验的关系。3.4 性别差异在绳索赛跑完成时间方面，我们没有观察到性别之间的统计学显著差异；然而，男性完成现场测试3的速度略有加快（140±33秒 vs 208±134秒；p = 0.092）（表5）。在热身（p = 0.627）、测试1（p = 0.639）或测试2（p = 0.233）中没有发现显著差异。通过对热身过程和测试1之间的绳索赛跑时间进行成对分析，我们发现女性的时间显著提高（173秒；p = 0.001），而男性的提高不太明显（159秒；p = 0.058）。表5阶段女性N=14男性N=6P值平均值标准差平均值标准差热身373161340123p=0.627现场测试12005918285p=0.639现场测试22089915873p=0.233现场测试3*20813414033p=0.092绳索赛跑完成时间与性别差异的关系。3.4 讨论在这项随机对照试验中，我们证明了在腹腔镜模拟器培训的初始阶段进行持续的远程指导显著降低了感知难度。它还提高了初始练习的任务完成时间，尽管没有比独立练习更显著的提升。这些发现支持了我们的主要假设，并表明实时指导是本科医学教育中早期技能习得的关键催化剂。尽管受监督的参与者在早期表现更快，感知难度更低，但在最终表现时间上没有检测到统计学上的显著差异。由于研究的样本量有限，且仅以完成时间为唯一评估指标，这些不显著的结果需要谨慎解释。我们的结果与之前的研究一致，并扩展了这些研究，证明了结构化模拟在早期外科培训中的价值（5, 6）。早期的探索性研究表明，模拟器训练可以提高手术室操作表现（5），基于课程的练习可以提高新手腹腔镜技能（6）。基于这些经验，Ahlberg等人（1）表明，基于熟练度的VR训练减少了早期胆囊切除术中的术中错误，强调了有指导的、基于标准的练习的教育重要性。更具体地说，本试验证实了实时指导的有益影响：结果反映了个性化反馈（3）和远程远程指导（4）的好处，这两者都强调了及时指导在塑造高效工具路径和任务执行中的关键作用。与许多先前比较培训与不培训的研究不同，我们的监督与独立培训的比较解决了本科课程中的一个实际问题，即一对一辅导资源有限，如果监督者不能亲自在场，则必须有效地组织这些资源。我们的发现与模拟器设计的最新进展一致，例如Finocchiaro等人描述的模块化和经过验证的结肠镜平台，这强调了在基于模拟的教育中 realistic haptic feedback、结构化培训进展和客观表现评估的重要性（IEEE Access, 2023）。结合这些原则，进一步强调了在初始技术技能习得过程中监督仍然是一个重要催化剂（12）。最近的系统评价和元分析也强化了这些发现：基于模拟的课程一致提高了操作表现并减少了错误率（9）。此外，认知负荷理论表明，在早期技能习得期间提供结构化指导可以优化学习效率（10, 11）。子组分析与现有文献一致。尽管没有基线优势，但有更多游戏经验的参与者在第三项练习中表现得更快，这与视觉空间能力和游戏经验可以预测模拟器表现和学习曲线的发现一致。基于性别的差异是探索性的，鉴于样本量较小，应谨慎解释。由于主要结果定义为测试1，此时组间没有统计学显著差异，必须在研究的有限功率背景下进行解释。如前所述，较小的样本量增加了第二类错误的可能性，不显著的结果不能解释为等效性的证据。优点包括随机设计、客观的时间完成指标以及与主观结果的三角验证。5 局限性本研究的主要局限性是样本量较小（n = 20）。由于招募困难，试验提前终止。因此，相对于事先的计算，研究的样本量不足。尽管事先的计算表明需要36名参与者才能达到70%的统计功率，但最终只有20名参与者参与。事后功率分析显示，实际达到的功率约为28%–35%，大大增加了第二类错误的风险。因此，我们不能排除第二类错误的风险以及可能错过的组间微妙差异。然而，效应大小的一致方向——无论是主观还是客观测量都倾向于支持监督——表明这是一种真正的模式，而不是随机效应。此外，单中心设计和缺乏延迟保留测试限制了关于长期技能维持的发现的一般性。另一个局限性是由于模拟器软件的存储故障而丢失了详细的运动性能指标。因此，只能分析任务完成时间。6 结论和教育意义尽管样本量有限，这项研究提供了初步证据，表明远程实时监督优于无监督练习，有助于新手掌握腹腔镜手术。数据支持一种混合课程模型：资源密集型的监督（或远程指导）应在“热身”和 initial procedural attempts 期间前置，以建立正确的心理运动模式并减少挫败感。尽管在最终任务表现上没有统计学上的显著差异，且样本量有限，我们的发现主要支持监督培训作为有益的早期阶段干预，而不是总体表现优势的确切证据。一旦达到基本能力，学习者可以继续进行独立的、基于指标的量化的培训。正如Oussi等人（4）所展示的，远程指导为传统上与监督培训相关的资源瓶颈提供了一个可扩展的解决方案。未来具有足够样本量的试验应该关注这种混合模型的成本效益及其对手术室技能转移的影响。

联系信箱：

粤ICP备09063491号

热点排行