
-
生物通官微
陪你抓住生命科技
跳动的脉搏
人类专业知识还是人工智能?一项关于指甲疾病诊断的前瞻性研究
《npj Digital Medicine》:Human expertise or artificial intelligence? A prospective study on nail disorder diagnosis
【字体: 大 中 小 】 时间:2026年06月03日 来源:npj Digital Medicine 15.1
编辑推荐:
摘要人工智能(AI)在分析指甲疾病模式方面展现出巨大潜力。这项前瞻性、比较性研究对比了皮肤科医生的诊断能力与大型语言模型(LLMs)的表现。我们使用指甲疾病的临床图像,评估了皮肤科医生以及四种免费多模态LLMs(GPT-4o、Grok 3、Claude Sonnet 4和Gemi
人工智能(AI)在分析指甲疾病模式方面展现出巨大潜力。这项前瞻性、比较性研究对比了皮肤科医生的诊断能力与大型语言模型(LLMs)的表现。我们使用指甲疾病的临床图像,评估了皮肤科医生以及四种免费多模态LLMs(GPT-4o、Grok 3、Claude Sonnet 4和Gemini 2.5 Flash)的诊断准确性。17位皮肤科医生在70.6%(95%置信区间:65.5–75.2%)的病例中正确诊断了主要疑似病症(SD),而在同时考虑主要疑似病症和鉴别诊断(SD + DD)的情况下,正确诊断率为80.3%(95%置信区间:75.7–84.2%)。不同级别的皮肤科医生的诊断准确性有所差异,从住院医师(SD + DD的准确率为68.3%)到指甲疾病专家(96.0%)依次提高。相比之下,AI模型的正确诊断率分别为25.0%(95%置信区间:16.8–35.5%)和35.0%(95%置信区间:25.5–45.9%)(p < 0.001)。AI算法正确分类了13.9%的肿瘤病例和52.3%的非肿瘤病例(SD + DD,p < 0.001)。目前可免费获取的通用AI模型在独立诊断指甲疾病方面的可靠性有限,在没有临床监督的情况下不应使用。虽然这些系统可能有助于提出鉴别诊断建议,但其性能仍存在波动,需要在更大规模、更具临床代表性的数据集中进行进一步验证。