针对多场景放射学癌症护理的精细调优大型语言模型聊天机器人：关于交互优化、情感支持及医护人员职业倦怠缓解的随机对照试验

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Translational Medicine》：A fine-tuned large language model chatbot for multi-scenario radiology cancer care: randomized controlled trial on interaction optimization, emotional support, and provider burnout reduction

【字体：大中小】 时间：2026年02月19日 来源：Journal of Translational Medicine 7.5

编辑推荐：

　　癌症患者与放射科医生（RHP）的临床互动优化研究。通过两个随机对照试验验证基于DeepSeek R1的聊天机器人（REC）在预约分诊（AT）和检查前准备（PP）场景中显著提升对话质量（事实性4.12 vs 3.39，P<0.001；满意度3.73 vs 3.19，P<0.001），并降低RHP的倦怠指数（疲惫感1.85 vs 2.40，P<0.01）。CT图像质量提升至4.35（P<0.01），MRI达4.12（P=0.02）。但REC在情感复杂的放射科服务场景中表现不足。研究证实场景特异性微调与提示对性能优化至关重要。

摘要

重要性

与患有慢性疾病的患者相比，癌症患者更容易出现抑郁和焦虑症状。在临床需求激增和医疗资源有限的背景下，传统的放射工作流程由于沟通效率低下，加剧了患者的心理痛苦以及医疗提供者的职业倦怠。

目标

开发并验证一个基于DeepSeek R1的放射检查聊天机器人（REC），以优化癌症患者与放射科医护人员（RHP）之间的临床互动，从而有效为癌症患者提供情感支持，并减少医护人员的职业倦怠。

设计、研究环境和参与者

从三家三级医院的放射科收集了多种场景的音频记录（预约分诊（AT）、检查前准备（PP）和放射科服务（RCS）（共计36,511分钟）。本研究针对不同的患者群体进行了两项独立的随机对照子试验：子试验1评估预约分诊/检查前准备阶段的参与者（1,424名患者，1:1随机分配到RHP+REC组或RHP组）；子试验2评估放射科服务阶段的参与者（638名患者，同样1:1随机分配）。由于患者群体不同，这两项子试验分别进行设计和实施。

干预措施

使用领域特定的对话数据（80%用于训练）和场景特定的提示对REC进行了微调，以GPT-o1作为比较基准。子试验中将患者随机分配到RHP+REC组或RHP组。

主要结果和评估指标

主要结果包括对话质量（共情、挫败感、情绪调节、事实准确性、完整性和满意度）；次要结果包括职业倦怠（疲惫感、去个性化和个人成就感）以及图像质量（CT/MRI），所有指标均通过李克特量表和统计测试进行评估。

结果

RHP+REC组在预约分诊（事实准确性：4.12±0.86 vs 3.39±1.21，P<0.001）和检查前准备阶段（满意度：3.73±0.11 vs 3.19±0.18，P<0.001）的表现更优，并且职业倦怠程度更低（疲惫感：1.85±0.91 vs 2.40±1.22，P<0.01）。CT图像质量显著提高（4.35±0.51 vs 4.00±0.52，P<0.01），MRI检查的结果也类似（4.12±0.51 vs 3.79±0.58，P=0.02）。然而，在情绪复杂的放射科服务阶段，REC在共情和情绪调节方面的表现较弱（3.88±0.67 vs 4.42±0.53，P=0.002；3.87±0.19 vs 4.12±0.27，P=0.004）。消融研究证实了微调和场景特定提示对提升性能的必要性。

结论和相关性

总体而言，基于DeepSeek R1的REC显著提升了多场景下的临床互动效果，为癌症患者提供了情感支持，并减少了医护人员的职业倦怠，为优化放射工作流程提供了一个可扩展的解决方案。

试验注册

中国临床试验注册编号：(ChiCTR2500102740) | http://www.chictr.org.cn/ | 注册日期：2025-05-26

热点排行

新闻专题

联系信箱：

粤ICP备09063491号