
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用隐私保护型大型语言模型提取预后数据:一项头颈肿瘤领域临床医生与人工智能合作的回顾性评估
《npj Precision Oncology》:Prognostic data extraction harnessing a privacy-preserving large language model: a clinician-AI collaborative retrospective evaluation in head and neck oncology
【字体: 大 中 小 】 时间:2026年06月07日 来源:npj Precision Oncology 8
编辑推荐:
摘要隐私法规以及专家验证的局限性限制了大型语言模型(LLMs)在电子健康记录结构化中的应用。我们评估了本地部署的LLMs,利用零样本提示从1,360份头颈癌报告(涉及882名患者)中提取30个预后变量。其中50份报告由三位放射肿瘤科医生进行了分层审查(每份报告30个字段,共50份
隐私法规以及专家验证的局限性限制了大型语言模型(LLMs)在电子健康记录结构化中的应用。我们评估了本地部署的LLMs,利用零样本提示从1,360份头颈癌报告(涉及882名患者)中提取30个预后变量。其中50份报告由三位放射肿瘤科医生进行了分层审查(每份报告30个字段,共50份报告,3位评审者;共做出4,500个决策),以此为Llama3.3-70B模型建立了一个多数投票参考标准。该模型实现了98.6%的F1分数,并获得了高水平的临床一致性,处理每份报告的时间仅为53秒。在另外七种模型(规模为2.6B至70B)中,GPT-OSS-20.9B(F1分数为89.4%)和MedGemma-27B(F1分数为88.5%)表现最佳。将LLMs提取的HPV状态、吸烟史以及Charlson合并症评分整合到多变量Cox比例风险模型中(考虑年龄、性别和T/N分期),通过1,000次自助法(bootstrap)内部验证,显著提高了无病生存率(比值比检验p = 0.014;ΔC指数 + 0.071)和局部区域无复发生存率(p = 0.026;ΔC指数 + 0.108)。这项临床与人工智能的协作评估表明,本地部署的LLMs能够实现保护隐私的同时,提供高效的肿瘤委员会支持、纵向数据管理以及预后预测功能。
生物通微信公众号