针对多场景放射学癌症护理的精细调优大型语言模型聊天机器人:关于交互优化、情感支持及医护人员职业倦怠缓解的随机对照试验

《Journal of Translational Medicine》:A fine-tuned large language model chatbot for multi-scenario radiology cancer care: randomized controlled trial on interaction optimization, emotional support, and provider burnout reduction

【字体: 时间:2026年02月19日 来源:Journal of Translational Medicine 7.5

编辑推荐:

  癌症患者与放射科医生(RHP)的临床互动优化研究。通过两个随机对照试验验证基于DeepSeek R1的聊天机器人(REC)在预约分诊(AT)和检查前准备(PP)场景中显著提升对话质量(事实性4.12 vs 3.39,P<0.001;满意度3.73 vs 3.19,P<0.001),并降低RHP的倦怠指数(疲惫感1.85 vs 2.40,P<0.01)。CT图像质量提升至4.35(P<0.01),MRI达4.12(P=0.02)。但REC在情感复杂的放射科服务场景中表现不足。研究证实场景特异性微调与提示对性能优化至关重要。

  

摘要

重要性

与患有慢性疾病的患者相比,癌症患者更容易出现抑郁和焦虑症状。在临床需求激增和医疗资源有限的背景下,传统的放射工作流程由于沟通效率低下,加剧了患者的心理痛苦以及医疗提供者的职业倦怠。

目标

开发并验证一个基于DeepSeek R1的放射检查聊天机器人(REC),以优化癌症患者与放射科医护人员(RHP)之间的临床互动,从而有效为癌症患者提供情感支持,并减少医护人员的职业倦怠。

设计、研究环境和参与者

从三家三级医院的放射科收集了多种场景的音频记录(预约分诊(AT)、检查前准备(PP)和放射科服务(RCS)(共计36,511分钟)。本研究针对不同的患者群体进行了两项独立的随机对照子试验:子试验1评估预约分诊/检查前准备阶段的参与者(1,424名患者,1:1随机分配到RHP+REC组或RHP组);子试验2评估放射科服务阶段的参与者(638名患者,同样1:1随机分配)。由于患者群体不同,这两项子试验分别进行设计和实施。

干预措施

使用领域特定的对话数据(80%用于训练)和场景特定的提示对REC进行了微调,以GPT-o1作为比较基准。子试验中将患者随机分配到RHP+REC组或RHP组。

主要结果和评估指标

主要结果包括对话质量(共情、挫败感、情绪调节、事实准确性、完整性和满意度);次要结果包括职业倦怠(疲惫感、去个性化和个人成就感)以及图像质量(CT/MRI),所有指标均通过李克特量表和统计测试进行评估。

结果

RHP+REC组在预约分诊(事实准确性:4.12±0.86 vs 3.39±1.21,P<0.001)和检查前准备阶段(满意度:3.73±0.11 vs 3.19±0.18,P<0.001)的表现更优,并且职业倦怠程度更低(疲惫感:1.85±0.91 vs 2.40±1.22,P<0.01)。CT图像质量显著提高(4.35±0.51 vs 4.00±0.52,P<0.01),MRI检查的结果也类似(4.12±0.51 vs 3.79±0.58,P=0.02)。然而,在情绪复杂的放射科服务阶段,REC在共情和情绪调节方面的表现较弱(3.88±0.67 vs 4.42±0.53,P=0.002;3.87±0.19 vs 4.12±0.27,P=0.004)。消融研究证实了微调和场景特定提示对提升性能的必要性。

结论和相关性

总体而言,基于DeepSeek R1的REC显著提升了多场景下的临床互动效果,为癌症患者提供了情感支持,并减少了医护人员的职业倦怠,为优化放射工作流程提供了一个可扩展的解决方案。

试验注册

中国临床试验注册编号:(ChiCTR2500102740) | http://www.chictr.org.cn/ | 注册日期:2025-05-26

相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号