五种人工智能聊天机器人在提供脑震荡健康建议方面的可靠性和可读性：比较了基于检索增强模型和预训练模型的性能

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Scientific Reports》：Reliability and readability of five AI chatbots for concussion health advice across retrieval augmented and pretrained models

【字体：大中小】 时间：2026年05月04日 来源：Scientific Reports 3.9

编辑推荐：

　　摘要生成式人工智能正在迅速融入患者教育的工作流程中，但其在治疗脑震荡方面的安全性仍不明确。本研究运用CHART框架对五个平台进行了评估，特别对比了基于检索增强（RAG）技术的生成模型与标准预训练的大型语言模型（LLMs）。我们从Google Trends中提取了11个高频率的患者

摘要

生成式人工智能正在迅速融入患者教育的工作流程中，但其在治疗脑震荡方面的安全性仍不明确。本研究运用CHART框架对五个平台进行了评估，特别对比了基于检索增强（RAG）技术的生成模型与标准预训练的大型语言模型（LLMs）。我们从Google Trends中提取了11个高频率的患者查询，并通过零样本协议对这些查询进行处理。随后，两位盲法的神经外科医生使用四种经过验证的工具对这些生成结果进行了评分：DISCERN和EQIP用于评估治疗和信息质量，GQS用于评估整体内容质量，JAMA基准用于评估透明度。不同模型之间的可靠性指标存在显著差异（DISCERN和EQIP，p?p?p?=?0.373），而基于JAMA标准的透明度评分普遍较低（p?

联系信箱：

粤ICP备09063491号

摘要

热点排行