《Nurse Education in Practice》:The Potential Impact of Generative AI Across Miller’s Pyramid of Clinical Competence: A Systematic Review
编辑推荐:
护理教育中生成式人工智能(GenAI)的应用效果及局限基于米勒临床能力金字塔的系统综述发现GenAI在知识(知)和应用能力(知如何)层面有效但缺乏真实实践(做)研究,需结合专家在循环(EITL)框架实现安全整合。
作者:Yea Seul Yoon、Wonhee Baek、Hyemi Jo、Chaebin Hong、Yoonjung Ji
韩国京畿道CHA大学护理学院
摘要
研究目的
本研究旨在系统评估生成式人工智能(GenAI)在支持护理教育中临床能力发展方面的有效性及局限性,通过整合相关证据,为设计教育者主导的、结合专家反馈的混合式教育框架提供依据。
背景
护理教育正面临由生成式人工智能(GenAI)带来的教学创新挑战。这项技术为个性化学习提供了巨大潜力;然而,其在课程中的快速整合尚缺乏系统的证据支持。
研究设计
本研究利用七个数据库(CINAHL、PubMed、Scopus、Web of Science、Embase、PsycINFO和Cochrane)检索了2022年11月至2025年5月期间发表的相关研究。
研究方法
研究根据预先定义的标准进行筛选,并使用混合方法评估工具(Mixed Methods Appraisal Tool)对方法学质量进行评估。随后通过叙事综合法(narrative synthesis)对研究结果进行解读,将发现内容与Miller的临床能力金字塔模型相结合进行分析。
研究结果
共有12项研究符合纳入标准。GenAI的应用主要集中在Miller金字塔的“知晓”(知识)和“知道如何做”(应用)层面,没有研究评估其在实际临床实践(“能够做”层面)中的效果。虽然GenAI模型能够帮助从业者通过执照考试并提升认知与情感方面的表现,但它们也存在局限性,如事实准确性问题、临床判断失误以及表现差异。
结论
GenAI是一种功能强大但容易出错的工具,需要对其进行系统的教学设计调整,而不仅仅是简单的技术采纳。教育者参与验证GenAI生成结果的“专家在循环中”(Expert-in-the-Loop)模式可能是推动护理教育变革的关键。将GenAI融入教育者主导的教育框架中,有助于培养能够批判性和伦理性地运用技术的护理专业人才,从而确保护理服务既专业又以人为本。
注册信息
本研究已在PROSPERO平台注册(注册编号:CRD420251060512)。
引言
护理教育正处于一个关键转折点:全球预计将短缺590万名护士,同时对数字化转型的需求也在加速(世界卫生组织,2020年;Goh和Sandars,2020年)。主要专业组织强调迫切需要将包括人工智能素养在内的数字健康能力融入护理教育中(国际护士理事会,2023年;世界卫生组织,2021年;世界卫生组织,2024年;全国护理联盟,2025年)。然而,受限于师资资源,传统的标准化课程难以提供这些能力要求及Z世代学习者期望的个性化、技术驱动的学习体验(Subardi等人,2026年;Oermann等人,2021年)。这一教学瓶颈使得生成式人工智能(GenAI)作为促进护理教育从知识传递向能力发展的潜在工具受到越来越多的关注——尽管这种潜力在实证层面尚未完全实现。
GenAI的独特之处在于其能够生成新内容,而不仅仅是分类现有数据(Cascella等人,2023年)。自2022年底ChatGPT公开发布以来,包括OpenAI的GPT-4o和o1、Google的Gemini、Anthropic的Claude以及xAI的Grok在内的领先模型在科学评估中的表现已接近博士水平(OpenAI,2024年),并且在专业临床考试中的准确率始终超过80%(Sato等人,2025年;Alohali等人,2025年)。在护理教育领域,新兴证据表明GenAI可以支持临床判断、沟通技能和反思性实践等方面的学习(Bozkurt等人,2025年;Ma等人,2025年),部分原因在于其具备“微适应性支持”功能——即能够实时、个性化地调整教学内容,帮助学习者逐步达到维果茨基提出的最近发展区(Vygotsky,1978年)。然而,GenAI也存在事实不准确、数据隐私问题以及可能引发不适当职业依赖的风险,因此需要谨慎整合而非盲目采用。
为了平衡GenAI的潜力与潜在风险,本研究借鉴了两个互补的框架。起源于医学信息学的“专家在循环中”(Expert-in-the-Loop,EITL)原则为评估教育者监督如何缓解GenAI的局限性提供了理论依据(Holzinger,2016年;Topol,2019年)。在护理教育中,这一原则通过教育者对AI生成的临床场景进行验证以及区分AI辅助与独立临床推理的能力来具体实施(Blomquist等人,2024年;Civaner等人,2022年)。鉴于护理实践中的隐性知识难以被算法编码,这种方法尤为重要(Susskind & Susskind,2023年)。作为分析的结构框架,Miller的临床能力金字塔(Miller,1990年)将临床能力划分为四个层次:“知晓”(基础知识)、“知道如何做”(应用知识)、“展示如何做”(在受控环境中的表现)以及“能够做”(在实际临床中的独立表现)。这些框架共同帮助系统地评估GenAI在各个能力发展阶段的作用,以及教育者监督的必要性。
尽管关于GenAI在护理和健康专业教育中应用的综述文章日益增多,但仍存在关键空白。首先,尽管近期的一些综述(包括基于模拟的分析)从主题或描述性角度探讨了GenAI的应用(Park等人,2024年;Hardie等人,2026年;Neo等人,2025年),但尚未有研究运用临床能力框架来分析GenAI如何促进从基础知识到实际临床实践的转化。其次,一些具有影响力的综述虽然涵盖了多个健康专业领域的GenAI应用(Lin等人,2025年;Pham等人,2025年),但未单独分析护理专业的独特需求,如整体护理、复杂的人际互动和文化嵌入的临床判断。此外,尽管GenAI的风险已被广泛关注(Gosak等人,2024年;Simms,2025年),现有综述缺乏安全整合GenAI的教学框架。虽然EITL模型在医学信息学领域已得到应用,但尚未系统地将其作为解释框架,用于分析GenAI在护理能力发展各阶段的证据。
为填补这些空白,本研究旨在:(1)整合关于GenAI在支持临床能力发展方面的有效性及局限性的证据(涵盖认知、情感和职业成果);(2)探讨如何设计教育者主导的、结合专家反馈的混合式教育框架,以实现安全、有效且符合护理教育实际情况的教育。
本研究遵循PRISMA指南(Page等人,2021年)进行报告。
通过预先定义的搜索策略,从七个国际数据库中初步筛选出1,049条记录:EMBASE(42条)、PubMed(223条)、SCOPUS(215条)、Web of Science(497条)、PsycINFO(11条)、Cochrane(23条)和CINAHL(38条)。剔除重复记录后,剩余739条记录进入进一步筛选阶段。在标题和摘要筛选过程中,有592条记录因与护理教育无关或文章类型不合适等原因被排除。
本研究通过Miller的临床能力金字塔模型,整合了GenAI在护理教育中的应用证据。研究发现了一个基本悖论:GenAI在提升基础和中级临床能力方面展现出巨大潜力,但其可靠性、临床判断能力和情境理解能力仍存在持续局限,这表明需要采用混合式教学模式。
研究表明,尽管GenAI在教育整合仍处于早期阶段,但它作为一种工具,具有提升护理教育的潜力。GenAI的整合可为课程带来超越单纯知识传递的机会,促进护理人员培养当代医疗保健所需的多种临床能力(如临床推理、决策能力和反思性实践)。然而,关键在于如何在GenAI的潜力与潜在风险之间找到平衡。
作者声明没有利益冲突。
(Huang,2023年;Li,2025年)
本研究得到了韩国国家研究基金会(NRF)的支持,资金由韩国政府(MSIT)提供(项目编号:RS-2025-00560101)。
Yoonjung Ji:撰写与编辑、初稿撰写、可视化处理、数据验证、项目监督、资源管理、方法论设计、研究计划制定、资金获取、数据分析、概念构建。
Hyemi Jo:可视化处理、方法论设计、数据分析。
Chaebin Hong:可视化处理、数据分析。
Yea Seul Yoon:撰写与编辑、初稿撰写、方法论设计、数据分析。
关于写作过程中使用生成式人工智能和AI辅助技术的声明
在撰写过程中,作者使用了ChatGPT(OpenAI)辅助进行英语翻译和语言优化。使用该工具后,作者对内容进行了必要的审核和修改,并对最终发布的文章内容负全责。
作者声明不存在可能影响本研究结果的财务利益冲突或个人关系。