可解释的微调大型语言模型有助于为罕见疾病制定基因检测决策

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《npj Digital Medicine》：Interpretable fine-tuned large language models facilitate making genetic test decisions for rare diseases

【字体：大中小】 时间：2026年05月20日 来源：npj Digital Medicine 15.1

编辑推荐：

　　摘要临床决策通常依赖于专家判断，并遵循既定的指南，但这些指南难以标准化和抽象化以便实际应用。例如，在罕见病诊断中选择基因检测面板或全外显子/基因组测序（WES/WGS）时，常常需要参考美国医学遗传与基因组学学会（ACMG）的基于证据的推荐意见。传统的机器学习（ML）模型在预测合适

摘要

临床决策通常依赖于专家判断，并遵循既定的指南，但这些指南难以标准化和抽象化以便实际应用。例如，在罕见病诊断中选择基因检测面板或全外显子/基因组测序（WES/WGS）时，常常需要参考美国医学遗传与基因组学学会（ACMG）的基于证据的推荐意见。传统的机器学习（ML）模型在预测合适的基因检测方法时往往存在可解释性方面的局限性。我们提出了一种假设：大型语言模型（LLMs）可以通过理解和应用包含思维链（CoT）的临床指南来“模仿”临床医生的推理模式。我们开发了RareDAI这一综合方法，通过分析异构的临床数据（包括非结构化笔记和结构化的Phecodes）来应对这一挑战。利用七个特定领域的问题，我们指导Llama 3.1和Qwen 3模型生成结构化的思维链输出。通过我们提出的自蒸馏微调（SDFT）方法对这些输出进行优化，使模型能够在提出建议之前产生可解释的推理过程。在内部数据和外部数据上，RareDAI在所有指标（准确性、精确度、召回率和F1分数）上的表现均优于传统的监督微调方法和基础LLMs（如Llama 3.1、GPT-4），提升幅度可达10–20%，有效帮助临床医生在医疗系统中选择合适的诊断方式。

联系信箱：

粤ICP备09063491号

摘要

热点排行