EyeRAG：一种基于图检索和增强生成的系统，用于实现眼科领域安全、准确的临床对话

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《npj Digital Medicine》：EyeRAG: graph retrieval-augmented generation for safe and accurate clinical dialogue in ophthalmology

【字体：大中小】 时间：2026年06月07日 来源：npj Digital Medicine 15.1

编辑推荐：

　　摘要大型语言模型有望改变眼科临床沟通方式，但面临事实不准确（幻觉）和领域知识有限等挑战。本研究介绍了EyeRAG，这是一种基于指南的GraphRAG系统，用于眼科对话，它整合了OphthaKG（一个专门从临床指南构建的领域特定知识图谱）。我们在120个临床场景中评估了EyeRAG

摘要

大型语言模型有望改变眼科临床沟通方式，但面临事实不准确（幻觉）和领域知识有限等挑战。本研究介绍了EyeRAG，这是一种基于指南的GraphRAG系统，用于眼科对话，它整合了OphthaKG（一个专门从临床指南构建的领域特定知识图谱）。我们在120个临床场景中评估了EyeRAG的表现（青光眼、糖尿病视网膜病变和白内障各40个场景），使用了六种大型语言模型（GPT-4o、Gemini 2.5 Flash、Grok 4、Llama 3.3 70B、Claude Sonnet 4、DeepSeek-V2.5）以及四种RAG配置，评估了其临床准确性和以患者为中心的相关性。通过大型语言模型作为评判者和经过认证的眼科医生在内部/外部数据集上的验证，EyeRAG的表现优于传统的LLM和标准RAG。在评估中，EyeRAG获得了最高排名（内部数据集平均分为1.61±1.04，外部数据集平均分为1.72±1.18）。专家们给EyeRAG的平均评分为1.0，其中幻觉现象的发生率降至3.3%（而基线为30%）。EyeRAG展示了开发安全、可解释且基于临床知识的语言模型的潜力，这些模型可以作为在临床医生监督下设计的辅助工具，专门用于弥合临床医生与患者之间的沟通差距。它主要作为患者解释的工具，而非临床决策工具，通过在专业监督下将复杂的检查结果转化为易于理解的对话内容，帮助进行患者咨询和远程眼科诊疗。

联系信箱：

粤ICP备09063491号

摘要

热点排行