
-
生物通官微
陪你抓住生命科技
跳动的脉搏
EyeRAG:一种基于图检索和增强生成的系统,用于实现眼科领域安全、准确的临床对话
《npj Digital Medicine》:EyeRAG: graph retrieval-augmented generation for safe and accurate clinical dialogue in ophthalmology
【字体: 大 中 小 】 时间:2026年06月07日 来源:npj Digital Medicine 15.1
编辑推荐:
摘要大型语言模型有望改变眼科临床沟通方式,但面临事实不准确(幻觉)和领域知识有限等挑战。本研究介绍了EyeRAG,这是一种基于指南的GraphRAG系统,用于眼科对话,它整合了OphthaKG(一个专门从临床指南构建的领域特定知识图谱)。我们在120个临床场景中评估了EyeRAG
大型语言模型有望改变眼科临床沟通方式,但面临事实不准确(幻觉)和领域知识有限等挑战。本研究介绍了EyeRAG,这是一种基于指南的GraphRAG系统,用于眼科对话,它整合了OphthaKG(一个专门从临床指南构建的领域特定知识图谱)。我们在120个临床场景中评估了EyeRAG的表现(青光眼、糖尿病视网膜病变和白内障各40个场景),使用了六种大型语言模型(GPT-4o、Gemini 2.5 Flash、Grok 4、Llama 3.3 70B、Claude Sonnet 4、DeepSeek-V2.5)以及四种RAG配置,评估了其临床准确性和以患者为中心的相关性。通过大型语言模型作为评判者和经过认证的眼科医生在内部/外部数据集上的验证,EyeRAG的表现优于传统的LLM和标准RAG。在评估中,EyeRAG获得了最高排名(内部数据集平均分为1.61±1.04,外部数据集平均分为1.72±1.18)。专家们给EyeRAG的平均评分为1.0,其中幻觉现象的发生率降至3.3%(而基线为30%)。EyeRAG展示了开发安全、可解释且基于临床知识的语言模型的潜力,这些模型可以作为在临床医生监督下设计的辅助工具,专门用于弥合临床医生与患者之间的沟通差距。它主要作为患者解释的工具,而非临床决策工具,通过在专业监督下将复杂的检查结果转化为易于理解的对话内容,帮助进行患者咨询和远程眼科诊疗。
生物通微信公众号