
-
生物通官微
陪你抓住生命科技
跳动的脉搏
可解释的微调大型语言模型有助于为罕见疾病制定基因检测决策
《npj Digital Medicine》:Interpretable fine-tuned large language models facilitate making genetic test decisions for rare diseases
【字体: 大 中 小 】 时间:2026年05月20日 来源:npj Digital Medicine 15.1
编辑推荐:
摘要临床决策通常依赖于专家判断,并遵循既定的指南,但这些指南难以标准化和抽象化以便实际应用。例如,在罕见病诊断中选择基因检测面板或全外显子/基因组测序(WES/WGS)时,常常需要参考美国医学遗传与基因组学学会(ACMG)的基于证据的推荐意见。传统的机器学习(ML)模型在预测合适
临床决策通常依赖于专家判断,并遵循既定的指南,但这些指南难以标准化和抽象化以便实际应用。例如,在罕见病诊断中选择基因检测面板或全外显子/基因组测序(WES/WGS)时,常常需要参考美国医学遗传与基因组学学会(ACMG)的基于证据的推荐意见。传统的机器学习(ML)模型在预测合适的基因检测方法时往往存在可解释性方面的局限性。我们提出了一种假设:大型语言模型(LLMs)可以通过理解和应用包含思维链(CoT)的临床指南来“模仿”临床医生的推理模式。我们开发了RareDAI这一综合方法,通过分析异构的临床数据(包括非结构化笔记和结构化的Phecodes)来应对这一挑战。利用七个特定领域的问题,我们指导Llama 3.1和Qwen 3模型生成结构化的思维链输出。通过我们提出的自蒸馏微调(SDFT)方法对这些输出进行优化,使模型能够在提出建议之前产生可解释的推理过程。在内部数据和外部数据上,RareDAI在所有指标(准确性、精确度、召回率和F1分数)上的表现均优于传统的监督微调方法和基础LLMs(如Llama 3.1、GPT-4),提升幅度可达10–20%,有效帮助临床医生在医疗系统中选择合适的诊断方式。