
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于人工智能的儿科牙科决策支持:ChatGPT-5与Gemini Advanced的比较研究
《BMC Oral Health》:AI-based decision support in pediatric dentistry: a comparative study of ChatGPT-5 and gemini advanced
【字体: 大 中 小 】 时间:2026年02月21日 来源:BMC Oral Health 3.1
编辑推荐:
人工智能辅助诊断在儿童牙髓治疗中的应用:对比ChatGPT-5与Gemini Advanced 2.0 Flash模型遵循AAPD指南的准确性,发现前者更高(72.8% vs 67.2%),但两者均需作为辅助工具使用。
在儿童牙科中,将临床决策与基于证据的指南保持一致对于治疗成功至关重要。人工智能应用根据美国儿童牙科学会(AAPD)的指南提供决策支持的潜力正受到越来越多的关注。本研究旨在全面比较OpenAI ChatGPT-5和Google Gemini Advanced 2.0 Flash模型在提供符合2020–2024年AAPD牙髓治疗指南的响应方面的能力。
根据AAPD的《乳牙和未成熟恒牙的牙髓治疗指南(2020年)》、《乳牙活髓治疗指南(2024年)》以及《乳牙非活髓治疗指南(2020年)》,共准备了27个问题,其中9个为是/否(二分式)问题,18个为开放式问题。两位不同的研究人员在10天内每天三次(上午、下午、晚上)使用这两种模型(ChatGPT-5和Gemini Advanced 2.0 Flash)在新聊天会话中提出这些问题。总共1,620个响应根据预定义的、基于指南的标准被分类为“正确”、“错误”或“咨询专家”,并参考了AAPD指南中的相应建议。数据通过皮尔逊卡方检验(Pearson Chi-Square test)进行分析。
ChatGPT-5模型在其72.8%的响应中提供了与指南一致的信息,而Gemini Advanced的这一比例为67.2%。两种模型之间的响应分布差异具有统计学意义(卡方检验,p = 0.000)。这些结果表明,与Gemini Advanced(2.0 Flash)相比,ChatGPT-5在回答儿童牙髓治疗决策支持问题时提供了更一致且更符合指南的响应。
基于人工智能的聊天机器人具有作为儿童牙科临床决策支持工具的潜力。ChatGPT-5的准确性高于Gemini Advanced,因为它提供的响应在很大程度上与AAPD指南中概述的牙髓治疗方案一致。然而,在某些关键情况下,这两种模型都可能提供错误或不足的指导。因此,这些工具应被视为辅助性的临床决策支持工具,不应替代牙医的专业知识和临床判断。开发更全面地整合儿童牙科领域基于证据的指南的人工智能模型将提高它们在临床实践中的可靠性。