今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

EyeRAG:一种基于图检索和增强生成的系统,用于实现眼科领域安全、准确的临床对话

《npj Digital Medicine》:EyeRAG: graph retrieval-augmented generation for safe and accurate clinical dialogue in ophthalmology

【字体: 大 中 小 】 时间:2026年06月07日 来源:npj Digital Medicine 15.1

编辑推荐:

  摘要大型语言模型有望改变眼科临床沟通方式,但面临事实不准确(幻觉)和领域知识有限等挑战。本研究介绍了EyeRAG,这是一种基于指南的GraphRAG系统,用于眼科对话,它整合了OphthaKG(一个专门从临床指南构建的领域特定知识图谱)。我们在120个临床场景中评估了EyeRAG

  

摘要

大型语言模型有望改变眼科临床沟通方式,但面临事实不准确(幻觉)和领域知识有限等挑战。本研究介绍了EyeRAG,这是一种基于指南的GraphRAG系统,用于眼科对话,它整合了OphthaKG(一个专门从临床指南构建的领域特定知识图谱)。我们在120个临床场景中评估了EyeRAG的表现(青光眼、糖尿病视网膜病变和白内障各40个场景),使用了六种大型语言模型(GPT-4o、Gemini 2.5 Flash、Grok 4、Llama 3.3 70B、Claude Sonnet 4、DeepSeek-V2.5)以及四种RAG配置,评估了其临床准确性和以患者为中心的相关性。通过大型语言模型作为评判者和经过认证的眼科医生在内部/外部数据集上的验证,EyeRAG的表现优于传统的LLM和标准RAG。在评估中,EyeRAG获得了最高排名(内部数据集平均分为1.61±1.04,外部数据集平均分为1.72±1.18)。专家们给EyeRAG的平均评分为1.0,其中幻觉现象的发生率降至3.3%(而基线为30%)。EyeRAG展示了开发安全、可解释且基于临床知识的语言模型的潜力,这些模型可以作为在临床医生监督下设计的辅助工具,专门用于弥合临床医生与患者之间的沟通差距。它主要作为患者解释的工具,而非临床决策工具,通过在专业监督下将复杂的检查结果转化为易于理解的对话内容,帮助进行患者咨询和远程眼科诊疗。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:图检索、眼科指南、幻觉缓解、临床辅助、剂量说话、医患沟通|眼科医生远程诊疗、青光眼筛查、代谢综合征管理、糖尿病眼底病变、白内障手术规划、临床安全第一|图检索系统、知识图谱结合医疗、语义理解评估、知识注入增强、减少模型幻觉、基于指南检索、学术影响力显著、临床验证高、患者信任度提升

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号