利用隐私保护型大型语言模型提取预后数据：一项头颈肿瘤领域临床医生与人工智能合作的回顾性评估

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《npj Precision Oncology》：Prognostic data extraction harnessing a privacy-preserving large language model: a clinician-AI collaborative retrospective evaluation in head and neck oncology

【字体：大中小】 时间：2026年06月07日 来源：npj Precision Oncology 8

编辑推荐：

　　摘要隐私法规以及专家验证的局限性限制了大型语言模型（LLMs）在电子健康记录结构化中的应用。我们评估了本地部署的LLMs，利用零样本提示从1,360份头颈癌报告（涉及882名患者）中提取30个预后变量。其中50份报告由三位放射肿瘤科医生进行了分层审查（每份报告30个字段，共50份

摘要

隐私法规以及专家验证的局限性限制了大型语言模型（LLMs）在电子健康记录结构化中的应用。我们评估了本地部署的LLMs，利用零样本提示从1,360份头颈癌报告（涉及882名患者）中提取30个预后变量。其中50份报告由三位放射肿瘤科医生进行了分层审查（每份报告30个字段，共50份报告，3位评审者；共做出4,500个决策），以此为Llama3.3-70B模型建立了一个多数投票参考标准。该模型实现了98.6%的F1分数，并获得了高水平的临床一致性，处理每份报告的时间仅为53秒。在另外七种模型（规模为2.6B至70B）中，GPT-OSS-20.9B（F1分数为89.4%）和MedGemma-27B（F1分数为88.5%）表现最佳。将LLMs提取的HPV状态、吸烟史以及Charlson合并症评分整合到多变量Cox比例风险模型中（考虑年龄、性别和T/N分期），通过1,000次自助法（bootstrap）内部验证，显著提高了无病生存率（比值比检验p = 0.014；ΔC指数 + 0.071）和局部区域无复发生存率（p = 0.026；ΔC指数 + 0.108）。这项临床与人工智能的协作评估表明，本地部署的LLMs能够实现保护隐私的同时，提供高效的肿瘤委员会支持、纵向数据管理以及预后预测功能。

联系信箱：

粤ICP备09063491号

摘要

热点排行