
-
生物通官微
陪你抓住生命科技
跳动的脉搏
针对多场景放射学癌症护理的精细调优大型语言模型聊天机器人:关于交互优化、情感支持及医护人员职业倦怠缓解的随机对照试验
《Journal of Translational Medicine》:A fine-tuned large language model chatbot for multi-scenario radiology cancer care: randomized controlled trial on interaction optimization, emotional support, and provider burnout reduction
【字体: 大 中 小 】 时间:2026年02月19日 来源:Journal of Translational Medicine 7.5
编辑推荐:
癌症患者与放射科医生(RHP)的临床互动优化研究。通过两个随机对照试验验证基于DeepSeek R1的聊天机器人(REC)在预约分诊(AT)和检查前准备(PP)场景中显著提升对话质量(事实性4.12 vs 3.39,P<0.001;满意度3.73 vs 3.19,P<0.001),并降低RHP的倦怠指数(疲惫感1.85 vs 2.40,P<0.01)。CT图像质量提升至4.35(P<0.01),MRI达4.12(P=0.02)。但REC在情感复杂的放射科服务场景中表现不足。研究证实场景特异性微调与提示对性能优化至关重要。
与患有慢性疾病的患者相比,癌症患者更容易出现抑郁和焦虑症状。在临床需求激增和医疗资源有限的背景下,传统的放射工作流程由于沟通效率低下,加剧了患者的心理痛苦以及医疗提供者的职业倦怠。
开发并验证一个基于DeepSeek R1的放射检查聊天机器人(REC),以优化癌症患者与放射科医护人员(RHP)之间的临床互动,从而有效为癌症患者提供情感支持,并减少医护人员的职业倦怠。
从三家三级医院的放射科收集了多种场景的音频记录(预约分诊(AT)、检查前准备(PP)和放射科服务(RCS)(共计36,511分钟)。本研究针对不同的患者群体进行了两项独立的随机对照子试验:子试验1评估预约分诊/检查前准备阶段的参与者(1,424名患者,1:1随机分配到RHP+REC组或RHP组);子试验2评估放射科服务阶段的参与者(638名患者,同样1:1随机分配)。由于患者群体不同,这两项子试验分别进行设计和实施。
使用领域特定的对话数据(80%用于训练)和场景特定的提示对REC进行了微调,以GPT-o1作为比较基准。子试验中将患者随机分配到RHP+REC组或RHP组。
主要结果包括对话质量(共情、挫败感、情绪调节、事实准确性、完整性和满意度);次要结果包括职业倦怠(疲惫感、去个性化和个人成就感)以及图像质量(CT/MRI),所有指标均通过李克特量表和统计测试进行评估。
RHP+REC组在预约分诊(事实准确性:4.12±0.86 vs 3.39±1.21,P<0.001)和检查前准备阶段(满意度:3.73±0.11 vs 3.19±0.18,P<0.001)的表现更优,并且职业倦怠程度更低(疲惫感:1.85±0.91 vs 2.40±1.22,P<0.01)。CT图像质量显著提高(4.35±0.51 vs 4.00±0.52,P<0.01),MRI检查的结果也类似(4.12±0.51 vs 3.79±0.58,P=0.02)。然而,在情绪复杂的放射科服务阶段,REC在共情和情绪调节方面的表现较弱(3.88±0.67 vs 4.42±0.53,P=0.002;3.87±0.19 vs 4.12±0.27,P=0.004)。消融研究证实了微调和场景特定提示对提升性能的必要性。
总体而言,基于DeepSeek R1的REC显著提升了多场景下的临床互动效果,为癌症患者提供了情感支持,并减少了医护人员的职业倦怠,为优化放射工作流程提供了一个可扩展的解决方案。
中国临床试验注册编号:(ChiCTR2500102740) | http://www.chictr.org.cn/ | 注册日期:2025-05-26
生物通微信公众号
知名企业招聘