psychiatric faculty(精神病学科的教师团队)是否具备指导人工智能应用的能力?一项全国性调查

《Academic Psychiatry》:Are Psychiatry Faculty Prepared to Guide AI Use? A National Survey

【字体: 时间:2026年05月10日 来源:Academic Psychiatry 2.8

编辑推荐:

  摘要 目的:评估精神病学教师在本科医学教育(UME)和研究生医学教育(GME)中对人工智能(AI)的了解、使用情况及其认知,并考察他们对学校AI政策的认知程度。 方法:2024年11月至2025年2月期间,向美国105所传统医学和骨科医学学校的 psychiatric

  摘要
目的:评估精神病学教师在本科医学教育(UME)和研究生医学教育(GME)中对人工智能(AI)的了解、使用情况及其认知,并考察他们对学校AI政策的认知程度。

方法:2024年11月至2025年2月期间,向美国105所传统医学和骨科医学学校的 psychiatric clerkship director 以及219个 psychiatry residency program 的 director 发放了全国性调查问卷。该调查评估了AI的使用模式、教师的态度和认知,以及对学校政策的了解情况。数据通过描述性统计和Fisher精确检验进行分组比较分析。

结果:共收到31名UME教师的回应(回应率为29.5%)和46名GME教师的回应(回应率为21%)。所有UME教师和74%的GME教师认为学生使用AI。然而,36%的UME教师和57%的GME教师不了解学校关于学生使用AI的政策。教师对AI政策的了解更为有限(UME为38.7%,GME为63%)。仅有35.5%的UME教师和27.9%的GME教师报告当前实际使用AI的情况,主要应用于研究支持、文献综述和内容开发。总体而言,50%的UME教师和54.1%的GME教师认为AI在医学教育中具有积极作用。

结论:尽管普遍认为学生使用AI,但精神病学教师对学校政策的认知不足,且在课程中整合AI素养的程度很低。这些发现突显了开展教师培训项目、制定明确学校政策以及构建结构化AI课程的紧迫性,以缩小学习者快速采用AI与教育基础设施之间的差距。

人工智能(AI)正在临床实践和医学教育中得到越来越广泛的整合[1, 2]。然而,教师对AI实施的准备程度以及相关学校政策的缺失仍然是一个明显问题,特别是在精神病学领域,因为AI的应用涉及到治疗关系和脆弱患者群体。这项全国性调查研究了精神病学本科医学教育(UME)和研究生医学教育(GME)中教师对AI的了解、使用情况及其认知。对于教育工作者而言,AI的整合面临双重挑战:既要教授AI的临床应用,又要引入基于AI的教学方法。随着AI在精神病学实践中的日益普及[2],这种教学需求更加凸显。“数字治疗联盟”的出现使患者能够与AI技术建立情感联系[3],这促使聊天机器人成为传统心理治疗的替代方案[4]。此外,AI系统可以用于诊断和治疗计划中的临床决策支持[5, 6],并减轻行政负担[7]。随着这些技术 penetrating into 精神病学实践,教师必须具备必要的技能和理解力,以帮助培训生批判性地评估AI工具的能力、局限性、风险和伦理影响。除了教授AI应用外,教育工作者还必须利用这些技术来革新教育方式。精准教育模式利用AI根据个人表现和需求个性化医学教育[8, 9]。对于住院医师而言,机器学习算法可以为临床推理提供反馈[9, 10]。在精神病学领域,基于AI的患者模拟提供了练习高风险场景(如自杀评估)的受控环境,并能生成多样的临床案例[11]。耶鲁医学院的学生反馈称,在完成精神病学轮转后焦虑感有所减轻[12]。尽管AI的潜力巨大,但大多数学校在培养培训生的AI素养或采用AI增强型教学方法方面进展缓慢[13]。值得注意的是,哈佛医学院为一年级学生提供了探讨新兴AI应用及其局限性的课程[14]。其他专业也取得了类似进展:放射学正在开发正式的AI能力培训课程[15],眼科探索了AI辅助学习的方法[16]。纽约大学格罗斯曼医学院使用AI系统分析学术记录和搜索行为,以提供个性化的学习资源[9]。然而,如果没有广泛采用,许多毕业生可能无法适应日益数字化的医疗环境[17],错失提升学习和临床决策能力的关键机会。这种教育差距的影响重大:如果没有充分的准备,教师将无法帮助未来的精神科医生充分利用AI的益处,同时避免对患者护理造成潜在危害。教育工作者必须让培训生能够应对围绕AI部署的复杂伦理问题,包括透明度、算法偏见、患者隐私以及在精神病学护理中技术和人际元素之间的适当平衡[18]。美国精神病学协会认识到这一紧迫性,将AI视为显著影响精神病学实践未来的六个关键领域之一[2]。

几项规定阻碍了AI在精神病学教育中的整合:本科和研究生教育阶段缺乏标准化指导,教师的专业知识也有限[18]。即使制定了指南,若没有能够引导学生进行伦理考量和技术评估的教师,有效实施仍然困难[19]。除了对学生教育的影响外,那些难以接受AI的医学教育工作者可能会遇到负面后果,如工作负担增加、时间利用效率降低以及学生参与度下降[20]。目前,关于美国精神病学教师对AI的态度、认知和使用情况的资料尚不充分。本研究通过针对从事UME和/或GME教学的教师的全国性调查来解决这些问题。问卷内容涵盖AI的使用模式、教师的态度、认知以及对学校政策的了解。通过考察整个教育阶段教师对AI的认知情况,本研究为精神病学教育的课程开发和政策制定提供了重要信息。由于采用探索性设计,本研究事先并未制定具体假设。

方法:通过电子邮件邀请了美国105所传统医学和骨科医学学校的 psychiatric clerkship director 以及219个 psychiatry residency program 的 director。虽然尽力联系所有符合条件的机构,但由于项目经理和协调员的联系信息重叠,无法确保所有有效邮箱的送达。符合条件的GME机构包括美国所有获得研究生医学教育委员会认证的精神病学住院医师项目(共计382个)。项目按照美国医学学院协会的FREIDA电子互动数据库进行地区划分,研究团队成员通过FREIDA和项目网站确定了项目负责人联系信息。项目负责人是主要联系人;必要时也会联系协调员或部门领导。符合条件的UME机构包括所有获得医学教育联络委员会和骨科医学院认证委员会认证的医学学校,这些学校设有精神病学实习项目。为扩大覆盖范围并减少抽样偏差,还通过全国性教育工作者邮件列表(如医学学生教育主任协会ADMSEP和咨询联络精神病学学会)进行了调查分发;但由于机构成员组成和邮件列表的有效性差异,无法确定分发范围的具体人数。参与是自愿的,完成调查不提供任何财务或其他补偿。图1展示了调查的招募和参与流程。

调查工具是与各参与机构的医学教育工作者及一位具有流行病学方法统计学博士学位的专家共同开发的。调查条目经过了内部审查和测试,以确保清晰度和相关性,并在每个机构进行了试点测试,根据试点参与者的反馈进行了迭代改进。该工具基于ADMSEP之前发放的一项未发表的调查(Kelly Cozza博士许可使用)。在获得知情同意后,受访者根据他们的学术角色填写了关于技术在本科医学教育(UME)和/或研究生医学教育(GME)中整合情况的调查问卷。未完成初始同意和引言问题的受访者通常只填写了第一个问题,因此没有数据可供分析。调查主要评估了教师对一般技术使用和医学教育中人工智能(AI)的看法,包含25个独特问题。根据受访者是否为UME或GME分别显示问题。同时担任两种角色的参与者需要完成针对UME和GME的两组问题,导致调查时间延长。调查主要包括多项选择题和李克特量表问题,以及少数开放式文本问题。完整的调查工具可向相应作者索取。

数据使用Wright State University提供的安全网络平台REDCap(Research Electronic Data Capture)进行收集和管理[21, 22]。REDCap专为研究数据捕获和工作流程设计。所有研究程序和协议均得到了Wright State University机构审查委员会的批准,因为该调查对受试者风险较低。参与是自愿的,完成调查不提供任何财务补偿。

回应频率和比例进行了统计。“是/否”问题允许选择“不知道”的选项,报告的比例是选择“是”、“否”或“不知道”的总人数。不同地区、毕业年级规模和校区数量的组间比例也进行了比较。使用Fisher精确检验进行组间比较。数据处理和分析使用R v. 4.3.2软件完成[23]。所有检验均为双尾检验,显著性水平为α=0.05。

结果:共收到31名UME教师(105所学校中的29.5%)和46名GME教师(219个项目中的21.0%)的回应。本科教师地理分布为:中西部地区11人(35.4%),东部和南部地区15人(48.4%)(由于样本量少,这两地区合并计算;5人未报告地区)。研究生教师分布为:中西部地区21人(45.6%),东部和南部地区18人(39.1%)(7人未报告地区)。尽管某些地区和校区规模存在统计学上的显著差异(相关之处已标明),但由于样本量较少,这些发现的可靠性有限。表1提供了更多人口统计信息。

尽管感知模式存在差异,但各级教师都认为学生使用AI。所有UME教师(100%)认为医学生使用AI。在GME受访者中,74%的人表示相信医学生使用人工智能(AI),其余26%的人表示不清楚。值得注意的是,没有GME的教师认为学生不使用AI。教师们认为学生使用AI来完成写作作业(UME:90.3%,GME:70.6%)、综合课程内容(UME:64.5%,GME:52.9%)、创建复习题(UME:67.7%,GME:50.0%)、研究支持(UME:71.0%,GME:76.5%)以及医疗文档(UME:41.9%,GME:55.9%)。图2展示了UME和GME在这些使用场景上的看法差异。

关于学生对AI在教育活动中的使用的看法,受教育程度不同而有所差异。

尽管教师普遍认为学生使用AI,但许多教师并不了解相关的机构政策。当被问及学生AI政策时,36%的UME教师(11/31)和57%的GME教师(26/46)没有回答或不确定他们的机构是否有此类政策。在那些给出明确回答的教师中,UME教师比GME教师更有可能报告存在学生AI政策(UME:14/20,70%;GME:5/20,25%)。

在报告了所在地区的26个UME项目中,不同地区的教师在政策意识上存在差异。东部和南部地区的教师中有更高比例的人不确定是否有学生使用AI的政策(6/15,40%),而中西部和西部地区的这一比例较低(2/11,18.2%)。机构结构似乎也影响了回答结果:多校区学校的教师表现出更高的不确定性或不回答的比例(9/22,40.9%),而单校区学校的教师则较低(2/9,22.2%)。值得注意的是,在那些声称了解情况的教师中,多校区学校的教师中报告存在AI政策的比例更高(10/13,76.9%),而单校区学校则为4/7,57.1%)。此外,在那些声称了解情况的教师中,来自学生人数较多的学校(>200人)的UME教师更有可能报告有学生AI使用政策(5/6,83.3%),而来自学生人数中等(101-200人)的学校为7/11,63.6%或较少(≤100人)的学校为2/3,66%。这些差异在统计上并不显著。

教师对自身使用AI的机构政策了解得更少。在UME教师中,38.7%(12/31)不知道他们的机构是否有此类政策。这种知识差距在GME教师中更为明显,有63%(29/46)表示对AI政策也不确定。在那些给出明确回答的教师中,只有少数人报告存在针对教师使用AI的机构政策(UME:7/19,36.8%;GME:3/17,17.6%)。当被要求评价他们对机构AI政策的看法时,57.1%(4/7)的UME教师和66.7%(2/3)的GME教师认为政策是“适当的”,而28.6%(2/7)的UME教师和33.3%(1/3)的GME教师认为“需要更多信息”。一位UME教师(14.3%)表示他们的政策“不够严格”。

关于机构AI政策的报告因机构结构而异(但统计上并不显著)。在单校区学校的UME教师中,三分之二(6/9,66.7%)回答了这个问题,但没有教师报告存在此类政策。相比之下,多校区学校的59.1%(13/22)的教师做出了回应,其中超过一半(7/13,53.8%)表示他们的机构有与教师使用AI相关的政策。

在所有UME教师中,虽然都表示相信学生使用AI,但45.2%(14/31)没有回答或不确定他们的课程中是否包含AI内容。在那些明确回答课程中是否包含人工智能主题的受访者中,64.7%(11/17)的UME教师和71.4%(20/28)的GME教师表示他们的课程中不包含AI。只有少数受访者(总共14人,其中UME有6人,GME有8人)报告他们的课程中涵盖了与AI相关的内容。在这些受访者中,42.9%(6/14)报告了当前医学中AI的应用,同样比例的人报告了AI的潜在好处。略多一些的受访者,57.1%(8/14;UME有4人,GME有5人),报告了AI的潜在陷阱,而只有28.6%(4/14;UME有2人,GME有2人)表示课程中包括了当前关于AI研究的政策。两组关于学生政策和课程包含情况的回答总结在图3中。

教师使用AI工具的普遍性和看法调查显示,100%(31/31)的UME教师和93.5%(43/46)的GME教师回答了这个问题。在这些教师中,35.5%(11/31)的UME教师和27.9%(12/43)的GME教师表示他们在工作中当前使用了AI。对于那些使用AI的教师来说,AI最常用于研究支持(UME:63.6%,7/11;GME:50.0%,6/12)、文献回顾(UME:45.5%,5/11;GME:41.7%,5/12)以及撰写推荐信(UME:36.4%,4/11;GME:41.7%,5/12)。在UME教师中,AI还用于开发临床前(27.3%,3/11)和实习(63.6%,7/11)课程内容。同样,在GME受访者中,25%(3/12)教师报告使用AI开发教学内容,25%(3/12)教师报告使用AI开发临床或教育材料。学生人数较多的GME项目(>10人)比学生人数中等(6-10人)和较少(≤10人)的项目更可能报告使用AI进行研究和实习内容开发,尽管这些差异在统计上并不显著。观察到地区差异,东部和南部地区的教师中报告使用AI的比例较高(8/15,53.3% vs. 3/11,27.3%),但这种差异在统计上并不显著。东部和南部的教师更可能报告使用AI辅助实习课程内容开发(7/8,87.5% vs. 0/3,0%,p=0.024),而中西部和西部地区的教师则较少。学生人数较多的GME项目(>200人)比学生人数中等和较少的项目更可能报告使用AI辅助撰写推荐信(3/4,75% vs. 0/4,0% vs. 1/3,33%),但这种差异在统计上也不显著。

在评估和临床任务中使用AI的情况有限。两组中只有一位教师(UME或GME)报告使用AI辅助评分,没有人报告使用AI辅助临床表现报告。少数教师报告使用AI进行临床文档编写(UME:2/11,18.2%;GME:3/12,25%)或诊断支持(UME:3/11,27.3%;GME:2/12,16.7%)。

所有调查参与者都被要求评价他们对当前医学教育中AI使用的看法。在UME受访者中,83.9%(26/31)给出了回答,分布如下:非常有害(3.8%,1/26)、有点有害(23.1%,6/26)、既无害也无益(23.1%,6/26)、有点有益(34.6%,9/26)和非常有益(15.4%,4/26)。在GME组中,80.4%(37/46)给出了回答:非常有害(2.7%,1/37)、有点有害(29.7%,11/37)、既无害也无益(13.5%,5/37)、有点有益(45.9%,17/37)和非常有益(8.1%,3/37)。图4展示了这些回答的分布。

总体而言,50.0%(13/26)的UME教师和54.1%(20/37)的GME教师认为医学教育中使用AI是有益的。相比之下,只有26.9%(7/26)的UME教师和32.4%(12/37)的GME教师认为AI的使用是有害的。

人工智能在从医学生到住院医师和执业医生的所有培训层次上都有巨大的潜力来增强医学教育[24, 25]。随着AI技术迅速发展并融入医疗服务,它们对医学教育的影响,特别是在精神病学领域,仍然尚未得到充分探索。本研究提供了关于精神病学教师目前如何使用AI的初步见解,包括他们的使用情况、看法以及对机构政策的认识。我们的研究结果表明,尽管不均衡,但在精神病学培训和实习指导中已经开始了AI的使用。大约三分之一的UME教师和四分之一的GME教师报告他们在工作中当前使用AI。与UME相比,关于GME中AI使用的研究较少。针对住院医师的研究显示了积极的结果,例如辛辛那提儿童医院的研究表明,在实施AI驱动的沟通模拟后,76.5%的住院医师认为这种模拟与传统阅读、教学或在线教育同样有效或更有效[26]。在我们的研究中,AI最常见的应用包括研究目的、实习工作内容开发、文献回顾和推荐信撰写。进一步的研究应该评估AI开发的实习内容对学生教育的有效性,与教育者开发的更传统的讲授方法相比。

我们的研究发现,学生人数较多的GME项目更可能使用AI进行研究和实习内容开发。同样,学生人数较多的UME项目更可能报告使用AI辅助撰写推荐信。由于样本量较小,这些差异在统计上并不显著。然而,这些发现与这样的观点一致,即规模较大、学术需求较高的机构更倾向于采用AI工具。Taylor等人(2024年)[27]的研究调查了2010年至2023年美国教育中AI使用的资金模式,发现斯坦福大学、卡内基梅隆大学和密歇根州立大学等大型机构是最早采用AI的机构之一,因此获得了比服务少数族裔群体的机构(MSIs)更多的研究资金。这些机构的主要资金来源是美国国家科学基金会和美国教育部。这支持了我们的观察,即大型机构可能因为拥有更多的财务资源来使用AI。教师普遍知道学生在使用AI;然而,许多人不清楚他们的机构是否有正式的政策来指导AI的使用。本科生医学教育(UME)的教师对学生相关AI政策的了解似乎比研究生医学教育(GME)的教师略高,尽管两组之间仍有显著差距。教师对与自身相关的AI政策的了解更加有限,特别是在GME教师中。这些发现突显了现有政策认知的不均衡,并强调了需要有意的管理、明确的政策制定和有针对性的教师培训,以支持AI在医学教育中的安全和有效整合[28]。教师发展计划也可能有助于提高对现有政策的认识和理解。潜在策略包括实践研讨会、同伴引导的非正式讨论和异步视频模块——或者这些方式的混合,奥克兰大学William Beaumont医学院的成功经验就是证明[29]。无论采用何种方式,这些计划都应符合美国医学学院协会最近制定的《医学教育者人工智能能力框架》[30]。遵循这些指南可以确保在探索最佳实践时,它们基于一套标准化的工作标准。

我们的研究还支持在健康专业教育中提高人工智能素养的呼声。Lee等人2021年的工作[31]总结了当前关于UME中AI培训的文献,概述了主题和差距。回顾的研究之间存在显著差异,没有达成关于学生在本科医学教育期间应掌握哪些AI相关能力的明确共识。此外,由于结果数据和AI课程评估的有限可用性,无法就实施AI课程的最佳方法提出建议。在我们的样本中,不到一半的受访者能在他们的课程中识别出任何与AI相关的内容。只有少数研究报告了人工智能(AI)的当前应用、潜在益处或潜在陷阱,而讨论政策相关问题的研究则更少——这凸显出了在结构化课程设置方面的显著差距。为了将AI纳入教学,精神病学项目可以借鉴其他专业的研究成果。放射学界已经率先推出了一种五步框架,旨在将AI培训整合到现有的住院医师培训体系中[32]。同样,耶鲁大学也为内科住院医师设立了AI与医学创新培训路径,采用四领域模型帮助学生成从基础素养到高级领导力的转变[33]。通过借鉴这些跨专业的模型,项目可以避免重复开发,而是专注于根据该领域的独特特性来定制AI教学内容。马里兰大学医学院(UME)的项目可以通过咨询同行机构来整合AI教学,或者为感兴趣的学员提供选修课程。

学生们可能会积极响应这些课程变革。最近的一项研究发现,超过80%的医学生对AI作为教学工具持正面看法,许多人认为传统教学方法已经过时[34]。我们的教师受访者也认识到了这一变化,所有UME的教师以及四分之三的GME(Graduate Medical Education)教师都表示,学生在各种学术任务中都在使用AI。然而,如果没有足够的师资培训基础设施,医学教育者可能无法引导学生安全、合规且有效地使用AI。

正如Triola和Rodman[19]以及He[28]所强调的,医学教育界必须采取统一的方法来整合AI——共享最佳实践、制定治理标准,并开发可扩展的课程。我们的研究结果进一步强调了这一需求,特别是在精神病学领域,因为AI应用的伦理、关系和诊断方面需要针对性的策略。

这项研究存在一些局限性。尽管我们努力联系了所有符合条件的机构,但调查仅发放给那些拥有公开电子邮件地址的人员,这可能导致样本选择偏差。由于参与是自愿的,受访者可能更有兴趣或对AI的使用持有强烈观点,从而限制了研究结果对美国所有UME和GME项目的普遍适用性。调查问卷由作者自行设计,尚未经过正式验证。此外,较低的响应率(尤其是GME项目的响应率为21%)进一步增加了样本选择偏差的可能性,因为那些对AI更为熟悉或参与度更高的教师可能更有可能参与调查。最后,鉴于AI在临床和教育领域的快速应用,所报告的教师使用情况只能反映某一时间点的现状,可能低估了当前AI的实际应用程度。

总的来说,这项全国性调查表明,精神病学教师可能已经开始将AI应用于学术研究和教学内容开发中。尽管如此,机构指导和结构化课程设置方面仍存在显著差距。这种缺乏正式监管的情况造成了学习者快速采用AI与现有机构支持之间的巨大差异。为弥补这一差距,医学教育领导者必须优先制定基于证据的AI课程、教师培训计划以及支持AI合规、有效和公平使用的机构政策。更重要的是,未来的研究应优先开发和验证专为精神病教育者设计的全国性AI能力框架。建立这样的框架对于制定标准化课程和机构政策至关重要。随着AI继续重塑医学教育和精神病学实践,精神病学部门在开发负责任、以患者为中心的应用方面具有独特的机会,从而惠及学习者及其服务的群体。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号