《European Journal of Physiotherapy》:Artificial intelligence adoption by allied health professionals: a scoping review
研究人员旨在识别物理治疗、职业治疗、言语病理学、足病学和营养学领域中人工智能(Artificial Intelligence, AI)在临床实践中的当前应用,并评估其益处和采用障碍。研究搜索了自2014年以来的Medline、Embase、PsycINFO和CINAHL数据库,并手动筛选了参考文献列表。采用Arksey和O’Malley框架进行范围综述(Scoping Review),并使用大型语言模型(Large Language Models, LLMs)分析数据。ChatGPT Data Analyst GPT ?(版本GPT-5,OpenAI)帮助数据分类。结果显示,自2022年以来,医疗健康领域的人工智能研究迅速增加,当前使用主要集中在医院。实施的人工智能类型包括机器学习和深度学习、自然语言处理(Natural Language Processing, NLP)、生成式AI(Generative AI, GenAI)、专家系统、基于案例的推理以及语音识别与分析。人工智能用于预测和预后、诊断和分类、治疗、实时评估、决策支持和沟通。人工智能实施的风险包括劳动力教育不足、电子医疗记录使用不一致、患者隐私问题以及人工智能工具访问不便。结论是,人工智能在医疗健康专业中的采用有限且可变,主要用于诊断和报告,较少用于治疗。迫切需要教育和培训医疗健康专业人员,以确保其在护理路径中使用人工智能的能力。
引言(Introduction)
全球医疗健康专业人员正迅速采用人工智能(Artificial Intelligence, AI)以提高医疗保健的质量、效率和结果。人工智能是计算机科学的一个领域,利用计算系统执行历史上需要人类智能的任务,例如决策、预测、复杂计算、语言翻译、语音识别和视觉感知。在医疗保健中,机器学习(Machine Learning, ML)、自然语言处理(Natural Language Processing, NLP)和深度学习(Deep Learning, DL)等人工智能技术正被快速采用,以执行涉及推理、学习、内容生成、临床决策制定和问题解决的任务。人工智能技术越来越多地用于支持健康评估、诊断和诊断解释、治疗计划、报告生成、团队沟通和远程监测。人工智能在护理经济中以多种方式应用,包括使用人工智能驱动的成像和诊断、虚拟助手和机器人、机器人技术、虚拟分诊服务、虚拟翻译、支持风险识别和缓解的预测分析、优化护理路径和精准医学。这些人工智能创新旨在提高效率、专业人员之间的协作、报告和服务交付质量。有人认为,人工智能通过增强临床决策、简化流程、优化护理分配和为临床决策提供信息来改善患者结果,从而积极地改变医疗保健。人工智能的使用支持医疗健康专业人员管理日益复杂的患者需求、不断增长的健康数据量以及对个性化护理日益增长的需求。然而,一些医疗健康专业人员在将人工智能纳入常规护理时面临挑战。障碍可能包括对人工智能是什么或如何使用的理解有限、缺乏决策所需数据集的访问、使用人工智能分析电子健康记录的培训有限、数据系统碎片化以及对护理交付中人际方面的担忧。技术能力与劳动力准备采用人工智能之间存在差距。医疗健康专业内的研究仍然分散,对这些技术如何当前被使用、评估或整合到护理中的综合有限。需要识别医疗健康专业人员如何实施人工智能,以及存在哪些风险、挑战和机会。一项范围综述是必要的,以系统地映射现有证据,识别关键主题,并阐明医疗健康实践内人工智能实施的程度、性质和质量。本综述关注物理治疗、职业治疗、言语病理学、足病学和营养学领域,这些是一些最大的医疗健康专业。这些学科也基于其广泛的国际存在和人工智能采用的新兴证据而被选择,以便进行专注和可管理的分析。医疗健康学科如艺术治疗、听力学、营养学、脊椎按摩疗法、咨询、运动生理学、医学放射学、音乐疗法、验光、斜视、矫形器、假肢、整骨疗法、护理人员、药学、社会工作和放射摄影学在医疗保健中扮演着重要角色,但超出了本综述的范围。放射学和药学在人工智能实施方面有广泛的研究。研究问题(Research Questions)
本综述由以下总体问题指导:“人工智能如何在物理治疗、职业治疗、言语病理学、足病学和营养学的临床实践中使用,以提高患者安全、护理质量和健康结果,支持其使用的证据质量如何?”一个子问题是“在这些学科中,人工智能采用的益处、障碍、风险和成本是什么?”
方法(Methods)
范围综述框架(Scoping Review Framework)
本范围综述采用了Arksey和O’Malley开发的框架,由Levac等人完善,并遵循Joanna Briggs Institute(JBI)关于范围综述的综合指南。该方法被选择用于映射现有证据、识别关键概念和差距,并支持快速知识转化,特别是在新兴研究领域。事先方案已在Open Science Framework上发布并注册(注册号r7t4s)。综述过程和报告遵循了系统综述和荟萃分析扩展用于范围综述的首选报告项目(PRISMA-ScR)和Cooper等人管理范围综述的步骤。研究人员进行了范围综述而非系统综述,鉴于这一新兴领域中明显的异构证据。需要映射医疗健康和护理中与人工智能相关的多样化文献的范围和内容。
资格标准(Eligibility Criteria)
PCC(人群、概念、背景)框架和范围综述的资格标准根据Peters等人制定。人群包括医疗健康专业人员,概念聚焦于人工智能使用,背景涵盖多样化的健康和医疗保健环境。仅纳入英文文章。关于可穿戴设备和可穿戴传感器的研究也被排除,因为它们主要关注输入数据。尽管人工智能的首批出版物出现在1960年代,但该领域直到很久以后才获得广泛关注,在过去5-10年中兴趣和发展急剧增加。寻求2014年以后的出版物,以捕捉当代证据。
搜索策略(Search Strategy)
基于PCC元素的搜索术语使用PubMed和MeSH?(医学主题词表)开发,并由大学健康科学图书馆员输入以完善和同行评审策略。2025年4月对Medline、Embase、PsycINFO和CINAHL进行了搜索,随后手动筛选了纳入文章的参考文献列表。Medline的完整电子搜索策略见补充文件S1。
研究筛选和选择(Study Screening and Selection)
筛选和研究选择在Covidence ?(Cochrane Collaboration的系统综述软件平台)中进行。两名审稿人独立筛选标题、摘要和全文,冲突由第三方解决。所有决定均有记录以确保透明度。在全文筛选阶段的研究和排除理由见补充文件S2。
数据提取(Data Extraction)
前20篇文章的试点筛选由2名团队成员(CT和MEM)进行。数据提取在Covidence中按照事先协议执行。未使用自动化工具。提取的数据细节见表3和补充文件S3。数据首先由11名研究团队成员独立提取,随后由两名研究者独立验证以确保准确性和完整性。数据差异通过讨论和小组共识解决。
质量评估(Quality Appraisal)
使用适用于包含混合研究方法综述的质量评估与多样化研究(QuADS)工具评估纳入研究的方法学和报告质量。每个标准根据评分指南评分为0(最低)到3(最高),最高39分。最终的个人研究得分以百分比表示。发现以叙述方式讨论,没有权重或分类为“低”或“高”质量。研究未基于质量评估被排除。审稿人评分差异通过讨论解决。当出现分歧时咨询第三方审稿人。个人研究QuADS评分见补充文件S4。
数据管理、分析和综合(Data Management, Analysis and Synthesis)
数据使用Microsoft Excel进行清理和组织,使用描述性统计总结关键研究特征。与范围综述主题和人工智能在研究中日益增长的角色一致,大型语言模型(Large Language Model, LLM)工具用于初步数据分析,以提高效率并扩展见解。ChatGPT Data Analyst GPT?(版本GPT-5,OpenAI)用于协助数据分组和分类,参考出版年份、医疗健康学科、研究类型、使用的人工智能类型、人工智能使用目的和医疗保健分类。这是一种创新,偏离了初始协议。虽然ChatGPT用于分类,但未用于主题综合、叙述综合或框架综合。这些元素由研究团队成员(CT、MEM)综合。为保持人类监督、科学严谨性和确保准确性,所有人工智能辅助输出由研究人员独立核对源数据。此过程确保在最终解释前的可靠性和可信度。然后,使用描述性叙述综合来呈现表格结果,与综述目标一致。为进一步指导解释和报告,讨论使用PAGER框架构建,突出了模式、进展、差距、实践证据和研究建议,用于健康和社会研究中范围综述的报告。
结果(Results)
研究特征(Study Characteristics)
本范围综述包括50项研究,调查了选定的医疗健康专业领域中人工智能的使用。PRISMA流程图概述了研究选择过程。在50项纳入研究中,33项发表于2023年至2025年之间(2023年n?=?7,2024年 n?=?20,2025年 n?=?6)。识别出多样化的研究设计,包括回顾性研究(n?=?12)、验证研究(n?=?11)、前瞻性观察试验(n?=?9)、可行性研究(n?=?6)和其他(见表3)。研究在全球范围内进行,美国贡献最多(n?=?17),其次是德国和韩国(各n?=?4)。最常报道的人工智能部署与物理治疗相关(n?=?22),其次是言语治疗(n?=?11)、营养学(n?=?6)或涉及多个医疗健康专业组的跨学科护理(n?=?8)。审查的研究在各种健康和研究环境中进行,尽管许多是基于医院的(n?=?32),包括住院康复单元、卒中中心和急性护理设施。非医院环境包括社区护理服务(n?=?9)和大学健康诊所(n?=?9)。13项研究使用了先前在医疗保健地点收集的数据的回顾性分析。样本大小在各研究中差异很大,平均约1361名参与者,中位数为82。范围从少至1到≤10到超过36,000。14项研究未报告年龄组数据,成年人(60-74岁)、儿童(<18岁)、中年人(45-59岁)和年轻人(18-29岁)在各8项研究中报告。其他研究包括30-44岁的成年人和老年人(>75岁)。
现有证据的质量和范围(Quality and Scope of the Existing Evidence)
质量评估显示,大多数研究在适当的使用数据收集工具和使用理由方面得分较高。它们在分析方法的合理性和研究问题与分析方法之间的契合度方面也有很强的得分。相比之下,大多数在研究设计和实施中的消费者参与方面得分较差,只有三项报告了该项目的任何细节。许多研究在记录理论框架方面得分2/3,因为它们提到了人工智能和康复的基础,但未明确讨论基于这些的理论或构建。大多数研究未清楚解释样本的来源群体、参与者数量及其完整特征。招募数据报告不一致。总体而言,从QuADS工具的总可能得分39分中,平均得分为28(范围20-36)。
医疗健康实践中使用的人工智能类型(Types of AI Used in Allied Health Practice)
本综述采用已建立的人工智能分类法,将机器学习、深度学习、自然语言处理、计算机视觉、专家系统、语音识别以及生成式AI(Generative AI, GenAI)和大型语言模型的最新发展分类为不同类型的人工智能,以协助分析。多样化的智能类型已部署在医疗健康研究中,机器学习最常见于25项研究。常见的机器学习方法包括随机森林、支持向量机、逻辑回归和集成方法,通常用于预测、分类和决策支持任务。深度学习在12项研究中使用,主要通过卷积神经网络和人工神经网络。应用示例包括运动分析、言语治疗、营养学和康复。GenAI工具和自然语言处理在5项研究中使用,应用于聊天机器人和自动语音分析。专家系统,包括基于案例的推理,在4项研究中用于支持临床决策和个性化物理治疗干预。计算机视觉用于营养师监测和基于人工智能图像识别的实时食物评估,以及评估骨关节炎患者的运动性能。使用多标准决策算法开发用于肩袖修复的结构化决策支持工具。自动语音识别报告用于失用症和失语症。一些研究还使用了多种或混合人工智能技术。Park等人使用推荐系统(一种提供个性化建议的算法)与行为模型集成,以帮助物理治疗师管理慢性下背痛。Vrouva等人使用了一种混合人工智能系统,将神经模糊逻辑与机器学习结合,以支持肩关节置换术后的预测性康复分类和功能预后。此外,人工智能决策支持工具和三种机器学习算法的组合用于一个面向患者的应用程序,旨在为下背痛提供诊断和治疗建议。
医疗健康实践中的临床应用(Clinical Applications of AI in Allied Health Practice)
在纳入的研究中,人工智能应用于多样化的临床实践领域和功能。最普遍的应用是预测和预后,在21项研究中使用,使用随机森林、逻辑回归、多标准决策和卷积神经网络等模型来预测结果、风险或患者恢复轨迹。在12项研究中应用人工智能以支持治疗。这些实施的人工智能工具指导治疗交付、个性化运动计划或言语康复。7项应用于诊断和分类,包括步态和平衡或语音验证。沟通和NLP应用在3项研究中用于比较机器学习和算法准确性与言语治疗师判断。4项研究使用人工智能进行监测和实时评估,用于运动表现和身体功能、临床医生培训或饮食跟踪。其他研究专注于临床决策支持,包括试验基于人工智能的平台用于糖尿病饮食管理、重症监护室中定制动员以及ChatGPT对轻度认知障碍职业治疗的建议。在功能输入方面,26项研究前瞻性使用人工智能以影响患者结果,24项使用回顾性数据分析进行流程自动化或建模,以指导未来的临床应用。
医疗健康实践中人工智能的益处(Benefits of AI in Allied Health Practice)
超过一半的文章(n?=?29)讨论了医疗健康专业人员将人工智能实施到临床实践中的益处。人工智能被提议可以:(i) 提高筛查和评估的准确性和可靠性;(ii) 提供决策支持和诊断辅助;(iii) 改善服务提供的效率;(iv) 提高患者对医疗健康服务和护理的访问能力;以及 (v) 增强临床教育和培训。值得注意的是,本综述中的随机试验报告了通过人工智能应用程序数字交付物理治疗对脑瘫儿童或下背痛成年人的益处。
人工智能采用的障碍和风险(Barriers and Risks to AI Adoption)
在医疗健康专业人员采用人工智能方面,提到了几种障碍和风险。这些包括:(i) 工作人员没有充分获得关于人工智能是什么以及如何将其实施到临床实践中的劳动力教育和培训;(ii) 数据质量限制;(iii) 对健康数据隐私的担忧;以及 (iv) 人工智能工具访问不便。一些报告表明,最终用户偏好临床医生提供的护理,而不是人工智能输入,特别是在复杂任务中或遇到技术问题时。其他研究强调了在没有熟练临床监督的情况下采用人工智能应用程序的风险,特别是在诊断、修改治疗计划或患者安全方面。也有担忧过度依赖人工智能工具可能导致临床医生技能退化。
经济考虑(Economic Considerations)
一些研究概述了在临床环境中实施人工智能的潜在经济益处,包括改善护理工作重点,如用于重症监护室和卒中康复。一些研究表明,当面对面临床护理可以被人工智能支持的护理取代时,人工智能技术可以降低成本,例如用于骨关节炎的基于互联网的运动或下背痛的物理治疗。机器学习支持床边超声吞咽评估以替代侵入性内窥镜程序,减少了人员配备。其他研究报告说,与人工智能使用相关的成本是实施的障碍。
讨论(Discussion)
本范围综述表明,人工智能目前在物理治疗、职业治疗、言语病理学、足病学和营养学的临床实践中以多样化和演变的方式使用。研究人员评估的大多数研究专注于医疗保健的一个方面,例如预测治疗结果、确定谁最有可能受到伤害、建议谁最有可能从医疗干预中受益,或评估人工智能模式如机器学习、机器人或生成式大型语言模型是否可以改进决策或健康信息的呈现。研究人员审查的没有一篇文章提及人工智能路线图或理论框架来指导医疗健康专业人员如何使用人工智能。尽管现在已经存在几种此类框架来指导医疗健康专业人员如何使用人工智能进行评估、诊断、治疗、教育、评估、结果预测、医疗健康干预记录、消费者参与和沟通。研究人员审查的一些研究展示了人工智能在大型数据集(>1000名参与者)中的应用。其中三项是来自先前医院患者或公共数据存储库的数据集的回顾性分析。有一项超过7,000名患者的试验,从六家医院的电子健康记录中检索数据,以验证人工智能机器学习应用程序预测营养不良并指导营养输入。另一项调查从公共可用数据存储库中检索了2,400名患者记录的回顾性数据,并使用数学建模预测最有可能对物理治疗管理下背痛有反应的患者。仍需要前瞻性研究,针对医疗健康专业人员如何在日常实践中采用人工智能以改善患者结果和服务效率。在本综述中最大的研究中,超过36,000名患者对人工智能支持的物理治疗数字护理平台反应积极。另一项试验显示,应用基于人工智能的机器学习出院预测模型指导超过12,400名住院患者护理的益处。这些研究表明,使用人工智能平台扩展护理可以改善工作流程和效率,对大型队列产生积极影响。与O’Connor等人相似,研究人员发现很少有研究分析真实环境中医疗健康专业人员采用人工智能的益处、障碍、风险或成本。此外,关于医疗健康专业人员实施人工智能的能力和动机水平的讨论有限。Alowais等人指出,如果没有对人工智能相关培训和教育的投资,以及最终用户在实施研究中的有意义参与,成功将人工智能纳入医疗保健系统可能会受到抑制。与最近的一项综述一致,描述足够临床医生培训以产生专家级人工智能应用的研究有限。仍需要协调的跨学科努力来开发实施框架、伦理指南和劳动力培训计划,反映医疗健康实践的现实。还需要政策举措来促进标准化数据系统、治理机制和将人工智能使用与可衡量的护理质量和患者结果改进联系起来的评估框架。
局限性和对实践的影响(Limitations and Implications for Practice)
本综述存在一些局限性。并非所有医疗健康专业都被审查,因为数量众多。此外,人工智能发展的快速步伐意味着一些报告的技术可能已被取代或未出现在文献中。仅纳入了英文出版物,可能排除了相关研究。研究人员审查的研究中消费者或公众参与很少。虽然研究人员使用QUADS工具评估了研究的方法学质量,但未基于此评估排除研究。这可能影响综述结果的强度。使用范围综述方法的进一步局限性是纳入了异构的研究设计、结果和背景。这将数据综合限制在描述性水平。本分析得出的主要实践意义是:(i) 医疗保健组织可以考虑在大型回顾性数据集上使用人工智能机器学习进行预测建模;(ii) 对工作人员进行人工智能应用方面的劳动力教育和培训对于临床实施至关重要;(iii) 人工智能医疗保健应用需要熟练的临床医生监督以确保患者安全和护理质量。
结论(Conclusions)
人工智能在物理治疗、职业治疗、言语病理学、足病学和营养学的临床实践中使用有限且可变。尽管人工智能提高了某些医疗健康过程的效率,但采用人工智能的障碍、风险和成本仍记录不足。需要协调努力来规划和优先考虑未来的医疗健康人工智能研究。迫切需要与医疗专业人员接触,探索优化人工智能整合到医疗保健流程中的方法。
范围综述注册(Scoping Review Registration)
范围综述注册:https://doi.org/10.17605/OSF.IO/R7T4S,09.02.2025
先前展示(Prior Presentation)
本手稿未先前发表。
补充材料(Supplemental Material)
补充材料
数据可用性声明(Data Availability Statement)
为本研究生成和分析的数据包含在本文中。