人工智能为常见的脊柱手术生成了手术报告：这些报告与实际情况的差距有多大？

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Current Orthopaedic Practice》：Artificial intelligence generated operative reports for common spine surgeries: how close are they to the real thing?

【字体：大中小】 时间：2026年02月21日 来源：Current Orthopaedic Practice 0.3

编辑推荐：

　　本研究比较了AI生成的与专科脊柱外科医生撰写的手术记录，发现医生识别能力与其专业经验相关，AI报告在语言、细节等方面获认可，多数人支持AI用于未来手术记录。

　　```section>

研究设计：

这是一项随机对照的调查研究。

目的：

评估人工智能（AI）生成的报告与经过专业培训的脊柱外科医生撰写的手术报告之间的相似程度。

文献综述：

大型语言模型（LLMs）是生成式人工智能（AI）的一个子集，旨在生成类似人类的文本。LLMs 已经证明能够在各种领域生成上下文准确、详细且连贯的文本。它们在提高医疗效率方面的潜力，尤其是在简化医疗文档（如手术记录）方面，正受到越来越多的关注。

方法：

使用 ChatGPT-3（OpenAI）生成了两种常见脊柱手术的手术报告：前路颈椎椎间盘切除术和融合术（ACDF）以及腰椎显微椎间盘切除术。由一位经过专业培训的脊柱外科医生撰写了相应的手术报告。这些报告被随机分配给骨科或神经外科的主治医生、进修医生和住院医生，要求他们判断每份报告是否由 AI 生成。

结果：

共有 52 名参与者完成了调查。对于 ACDF，69.2% 的人正确识别出 AI 生成的报告（P=0.050）；对于腰椎显微椎间盘切除术，这一比例为 61.5%（P=0.239）。在逐个比较中，正确识别的比例分别提高到了 ACDF 的 79.2%（P=0.004）和腰椎显微椎间盘切除术的 60%（P=0.317）。随着培训水平的提高，准确率也有所提升，从住院医生的 55.6% 上升到主治脊柱外科医生的 100%。大多数参与者表示，AI 生成的报告具有类似人类的语言风格（86.3%）、足够的细节（68.6%）、必要的手术步骤（78.4%）以及准确的描述（68.6%）。值得注意的是，87.5% 的参与者表示有兴趣在未来将 AI 应用于手术文档中。

结论：

随着培训水平的提高，AI 生成的手术报告的区分度也在提高。这些报告与外科医生撰写的报告有许多共同特征，并且受到了积极评价，这表明 AI 可能在未来的手术文档中发挥作用。

证据等级：II

通俗语言总结：本研究比较了由 AI（ChatGPT-3）和经过专业培训的脊柱外科医生撰写的脊柱手术报告。参与者（包括外科医生和住院医生）被要求判断哪些报告是由 AI 生成的。结果显示，经验更丰富的外科医生在区分 AI 生成的报告方面表现更好，准确率从住院医生的 55.6% 上升到主治外科医生的 100%。AI 生成的报告通常被认为具有类似人类的语言风格和足够的细节，大多数参与者对将来使用 AI 进行文档编写表示感兴趣。这表明 AI 可能在手术文档中发挥重要作用，提高效率并保持文档质量。

本文本由机器生成，可能存在不准确之处。常见问题解答

```

热点排行

新闻专题

联系信箱：

粤ICP备09063491号