今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

RESPECT:一个用于知情同意的对话式AI系统,具备高准确性、安全性,并以利益相关者为评估核心

《npj Digital Medicine》:RESPECT: a conversational AI system for informed consent with accuracy, safety, and stakeholder-centered evaluation

【字体: 大 中 小 】 时间:2026年05月10日 来源:npj Digital Medicine 15.1

编辑推荐:

  摘要知情同意(Informed Consent, IC)是临床研究的基石。知情同意通常包括书面材料,尤其是在临床试验中,还包括研究者和参与者之间的口头讨论。实际上,这两部分内容往往都是固定模板化的,这限制了进行有意义、个性化对话的机会。尽管大型语言模型(Large Languag

  

摘要

知情同意(Informed Consent, IC)是临床研究的基石。知情同意通常包括书面材料,尤其是在临床试验中,还包括研究者和参与者之间的口头讨论。实际上,这两部分内容往往都是固定模板化的,这限制了进行有意义、个性化对话的机会。尽管大型语言模型(Large Language Models, LLMs)为提高知情同意的可用性提供了可能性,但要实现这一潜力,需要在研究应用之前确保模型的回答准确、安全且恰当。我们开发了RESPECT(RESearch Participant Engagement and Consent Tool)这一基于LLM的知情同意辅助工具,该工具利用检索增强生成(Retrieval-Augmented Generation, RAG)技术将回答内容基于知情同意的原始文档。通过留一法交叉验证(leave-one-out cross-validation)和问题重述分析(question rephrasing analysis),我们验证了该系统的信息检索能力,结果表明其具有较高的准确性。我们引入了一个新的安全评估框架,该框架衡量两个维度:恰当的拒绝行为(系统拒绝应不回答的问题的频率)和实用性(系统回答应回答的问题的频率)。这种方法通过绘制拒绝-实用性曲线(Refusal–Utility Curve, RUC)来概括简单的拒绝率,这种曲线类似于接收者操作特征曲线(Receiver Operating Characteristic, ROC-AUC曲线)。与GPT-4相比,RESPECT在恰当拒绝行为方面表现显著更好,但代价是在回答合法问题时的实用性有所下降。我们通过与研究人员的评估,对RESPECT的准确性、全面性和用户满意度进行了评估。RESPECT是首个针对研究场景开发的基于RAG技术的LLM知情同意辅助工具,通过更高的恰当拒绝率显著提升了安全性。这种新的RUC评估框架为研究人员提供了评估LLM系统安全性与实用性之间权衡的工具,有助于他们在医疗研究中做出明智的决策。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:知情同意|LLM系统评估|RAG技术|拒绝-实用性曲线|医疗研究应用|跨领域评估模型

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号