在护理教育中实现安全且易访问的人工智能:一个模块化的代理聊天机器人框架,用于比较ChatGPT-4o与一个开源的大型语言模型在慢性伤口护理中的应用

《Nurse Education in Practice》:Secure and Accessible AI in Nursing Education: A Modular Agentic Chatbot Framework Comparing ChatGPT-4o with an Open-Source LLM for Chronic Wound Care

【字体: 时间:2026年03月24日 来源:Nurse Education in Practice 4

编辑推荐:

  模块化代理型AI框架在慢性伤口护理教育中的应用及开源与商业配置对比研究。通过100项问题库验证和专家评估,发现开源框架在临床指南遵循度(56%)和成本效益方面更具优势,尤其在数据安全和机构自主性方面表现突出,但其覆盖广度和准确性稍逊于商业模型。

  
Necip Gürler | Tuba Sengul | Samet Hüsnü Bülbül | Dilek Yilmaz Akyaz | ?zgür Güler | As?m Evren Yanta? | Emir Bedirhan Ayd?n | Holly Kirkland-Kyhn
eKare, Inc., 弗吉尼亚州费尔法克斯, 美国

摘要

目的

开发并评估一个用于护理领域慢性伤口护理教育的模块化智能聊天机器人框架,并比较开源和商业配置的优劣。

背景

将人工智能(AI)整合到护理教育中可以提升学习体验,但由于成本、数据治理以及对模型可靠性的担忧,其广泛采用受到限制。基于检索增强生成(RAG)技术的模块化智能聊天机器人框架可能通过提高准确性、灵活性和本地控制能力来克服这些限制。

设计

采用与国际临床指南一致的100个慢性伤口护理问题数据集进行了一项比较实验性预实施研究。

方法

开发并评估了一个使用RAG技术的模块化智能聊天机器人框架,并使用了开源和商业AI模型。六位专家独立使用5点李克特量表对响应的准确性、相关性、清晰度和覆盖范围进行了评分。分析包括线性混合效应模型和Wilcoxon符号秩检验。数据集的有效性通过Davis技术得到了验证。

结果

两种聊天机器人配置都产生了符合临床指南的准确回答。商业模型获得了更高的总体分数(20分制下平均差异为+1.01,p < 0.001),其中在覆盖范围方面的差异最大(5分制下为+0.39,p < 0.001)。开源配置在遵循指南方面表现出色,有56%的回答完全符合临床建议。

结论

开源的本地部署AI聊天机器人在性能上与ChatGPT-4o相当,同时在成本、安全性和机构自主性方面具有明显优势。它支持基于指南的教学并促进公平获取,使其成为护理教育的一个有前景的工具。

引言

人工智能(AI)通过提供数据驱动的洞察力、互动式学习和增强的临床决策支持,正在迅速改变健康教育(Sallam, 2023; Lee, 2024)。大型语言模型(LLMs)的进步为护理教育提供了通过实时反馈和现实模拟的重要机会。这些学习特性可以支持发展护理实践中安全临床决策和患者护理所需的理论和实践能力(Scerri and Morin, 2023)。系统证据表明,基于AI的教育干预措施能够改善学习者的态度、知识获取、临床技能、自我效能感和满意度,同时支持自主和个性化学习(Jin and Kang, 2024; Shorey et al., 2023; Bodur et al., 2024; Jallad et al., 2024)。AI工具还增强了知识保留和实践技能的发展,尽管效果因情境而异(Akutay et al., 2024; Benfatah et al., 2024)。例如,González-García等人(2025)报告称,使用ChatGPT的护理学生评估分数显著提高,89.5%的学生表示学术表现有所改善。跨临床专业的类似进展进一步展示了AI在诊断支持、风险预测和临床决策方面的潜力,为其在护理教育中的扩展作用提供了更广阔的背景(Tordjman et al., 2025; Xu et al., 2024; Karunanayake, 2025)。尽管有这些好处,但AI在护理教育中的广泛和安全整合仍面临重大挑战。LLMs偶尔会生成流畅但不准确的内容,这被称为“幻觉”,在临床培训环境中存在严重的安全问题(Sallam, 2023)。护理教育工作者特别担心AI生成内容的可靠性和准确性(Zhou et al., 2024)。许多先进的AI工具依赖于基于云的平台,引发了关于数据隐私和机构控制的担忧(Seibert et al., 2021)。财务和技术要求也可能限制访问,特别是在资源有限的护理教育环境中(Wang et al., 2023; Rony et al., 2025)。最近的元分析证据表明,护理教育中AI素养和实施的差异很大,特别是在资源有限的机构中,这加剧了公平性问题(El-Banna et al., 2025; Jembu and Lee, 2025)。这些限制在慢性伤口护理教育中尤为明显,这是一个重要但代表性不足的课程领域,学习者和临床医生在将理论转化为实践方面表现出知识、信心和困难(Sengul et al., 2022; Sengul et al., 2025)。文献强调了需要易于访问的、基于证据的教育模型,这些模型应结合主动学习和决策支持策略,考虑到慢性伤口的临床负担及其在护理课程中的不一致整合(Sengul et al., 2025a; Sengul and Kaya, 2024; Sengul et al., 2024a; Olsson et al., 2019; Sengul et al., 2025)。AI聊天机器人可以通过提供基于证据的信息和支持临床决策及培训来弥补这些差距,准实验证据表明它们提高了知识、认知和参与度(Makhlouf et al., 2024; Shokr, 2025)。这些技术可能有助于在资源有限的环境中标准化临床教育;然而,当前的研究主要集中在短期结果和单一模型实现上,因此在比较评估、长期影响和AI支持教育系统的可扩展性方面存在空白(Makhlouf et al., 2024; Shokr, 2025)。在低收入和中等收入环境中,由于财务和技术障碍限制了对先进数字教育平台的访问,解决这些差距至关重要(Wang et al., 2023; Rony et al., 2025)。自主AI系统作为一种有前景的方法,通过实现动态交互、知识检索和自适应学习支持来解决教育差距(Karunanayake, 2025; Labrague et al., 2025; Gurler et al., 2024)。当与基于指南的资源结合使用时,AI聊天机器人可以提高响应的可靠性并减少护理教育中不准确信息的传播(Swacha and Gracel, 2025; Xu et al., 2024)。这些工具可以支持临床推理,帮助学生将理论知识与床边决策联系起来(Sengul et al., 2022; Olsson et al., 2019),这在慢性伤口护理中尤为重要,因为有限的接触和知识差距可能阻碍能力的发展(Sengul et al., 2022; Sengul et al., 2025)。因此,评估AI支持系统的性能和教育相关性至关重要(Makhlouf et al., 2024; Shokr, 2025)。基于这一理念,本研究介绍了一个用于慢性伤口护理护理教育的模块化智能聊天机器人框架。该系统采用检索增强生成(RAG)架构,在生成响应之前从策划的知识库中检索基于指南的信息,从而提高证据的一致性并减少无根据的输出。本研究开发并评估了这种方法,同时比较了开源和商业AI配置的可行性、教育价值和潜在的整合到护理课程中的可能性。

研究设计

本研究采用了比较实验设计,评估了一个用于慢性伤口护理护理教育的AI支持聊天机器人,该聊天机器人以开源或商业配置实现。评估特别针对慢性伤口护理教育这一需要严格遵循临床指南和复杂情景推理的临床重要领域。

题库有效性

专家小组使用4点Davis量表对所有100个伤口护理问题进行了相关性评分。平均项目级内容有效性指数(I-CVI)为3.48,超过了事先设定的3.0的保留阈值;因此,所有问题都被保留下来用于后续分析。

整体响应质量

图2显示了综合分数的分布(范围4-20)。商业流程生成的答案紧密集中在较高区间,而开源答案则分布较广,最低分为4分。

题库有效性

伤口护理题库的高内容有效性强调了专家驱动设计在AI教育工具中的重要性。每个问题都被临床专家评为高度相关,平均内容有效性指数远高于保留阈值。这一结果表明,评估内容与核心伤口管理能力紧密对齐,确保聊天机器人的回答基于具有教育意义的材料。这种严格的验证至关重要。

结论

本研究表明,尽管商业AI模型整体表现略好,但集成在模块化检索增强框架中的开源AI流程有效地生成了适合护理教育的准确、符合临床标准的内容。该自主框架的模块化设计支持不同语言模型和可定制临床知识库的灵活整合,实现了安全、经济且受本地控制的AI部署。

手稿准备过程中生成式AI和AI辅助技术的声明

在准备本手稿期间,作者仅使用ChatGPT来提高语言清晰度和可读性。AI工具未用于数据分析、研究设计、结果解释或科学内容的生成。所有输出都经过了作者的严格审查、修订和批准,作者对最终手稿的完整性和准确性负全责。

未引用的参考文献

(Wounds Australia, 2016)

CRediT作者贡献声明

Holly Kirkland-Kyhn:写作 – 审稿与编辑,监督。Necip Gürler:写作 – 审稿与编辑,原始草稿撰写,可视化,验证,软件,方法论,调查,正式分析,数据整理,概念化。Tuba Sengul:写作 – 审稿与编辑,原始草稿撰写,验证,监督,项目管理,方法论,调查,概念化。Samet Hüsnü Bülbül:写作 – 审稿与编辑,可视化,资源提供,正式分析,

利益冲突声明

作者声明没有已知的可能会影响本文报告工作的财务利益或个人关系。

致谢

作者感谢专家审稿人对AI生成内容评估的宝贵贡献。
利益冲突声明
作者声明没有利益冲突。

财务披露

作者声明没有财务披露。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号