一种新型的人工智能辅助白光内镜模型在心脏萎缩诊断中的应用：一项多中心研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Annals of Medicine and Surgery》：A novel Artificial Intelligence-assisted white light endoscopic model in the diagnosis of cardia atrophy: a multicenter study

【字体：大中小】 时间：2026年05月10日 来源：Annals of Medicine and Surgery 1.6

编辑推荐：

　　**摘要（通俗语言总结）** **背景与目的：** 胃黏膜萎缩症不仅局限于胃底区域，还与胃癌密切相关。然而，在内镜检查中准确判断胃底萎缩存在困难。 **方法：** 本研究是一项多中心前瞻性研究，共有895名患者被分为训练集和验证集，用于建立胃底萎缩的诊断模型。其中220名

　　**摘要（通俗语言总结）**
**背景与目的：** 胃黏膜萎缩症不仅局限于胃底区域，还与胃癌密切相关。然而，在内镜检查中准确判断胃底萎缩存在困难。
**方法：** 本研究是一项多中心前瞻性研究，共有895名患者被分为训练集和验证集，用于建立胃底萎缩的诊断模型。其中220名患者被纳入内部测试集，354名患者被纳入外部测试集。在内部和外部测试集中，分别由三名资深内镜医生和三名初级内镜医生进行在线诊断，并将他们的诊断结果与人工智能（AI）辅助系统的诊断结果进行比较。
**结果：** 在内部测试数据集中，AI辅助诊断系统的准确性、敏感性和特异性分别为0.927、0.941和0.919，阳性预测值（PPV）为0.878，阴性预测值（NPV）为0.962，曲线下面积（AUC）为0.967。在外部测试数据集中，这些指标分别为0.918、0.894和0.931，PPV为0.874，NPV为0.943，AUC为0.953。研究表明，AI辅助系统的诊断准确性、敏感性、特异性、PPV和NPV均高于资深内镜医生的结果。AI辅助系统的接收者操作特征曲线（AUC）在内部和外部测试集中的值分别为0.967和0.953。热图显示AI系统与内镜医生的诊断结果高度一致。
**结论：** 我们新开发的人工智能辅助系统在识别胃底萎缩方面表现优于资深内镜医生，可辅助内镜医生进行诊断并指导针对性活检。

**简要说明：**
这项多中心前瞻性研究开发并测试了一种人工智能辅助系统，用于诊断内镜检查中难以准确判断的胃底萎缩。胃底以外的胃黏膜萎缩（开放型萎缩）与胃癌密切相关，因此可靠地识别胃底区域的萎缩情况十分重要。研究人员利用895名患者的数据构建和验证了该系统，在内部测试集对220名患者进行了测试，在外部测试集对354名患者进行了测试。结果显示，AI辅助系统的准确性、敏感性、特异性、PPV和NPV均优于资深内镜医生。

**引言：** 肠型胃癌（GC）在高发病率地区更为常见[1]。萎缩和肠化生（IM）是肠型胃癌的重要癌前病变[2]。研究发现，广泛性萎缩患者的癌变风险是轻度萎缩患者的9.4倍[3]。Kimura-Takemoto分类法基于内镜下对萎缩程度的评估，在亚洲国家被广泛用于胃癌风险分层，其结果与组织学评估的一致性良好[4]。多中心研究也表明，开放型萎缩与胃癌风险存在显著关联[5]。基线检查时存在严重或开放型胃底萎缩的患者应接受密切监测，以早期发现癌前病变[6]。传统白光内镜诊断胃底萎缩的准确率仅为42%[7]，与组织学变化存在较大差异。尽管组织学是内镜下诊断胃部病变的金标准[8]，但根据更新的Sydney系统，至少需要进行五次非针对性活检才能全面评估胃部状况[9]。然而，活检无法实时评估黏膜状况，且存在耗时、费用高昂和出血风险增加等问题[10]。由于胃底的解剖位置特殊，识别和诊断胃底萎缩仍面临挑战，需要新技术来辅助诊断并指导针对性活检。近年来，图像增强内镜（IEE）技术在诊断胃底萎缩方面显示出一定优势[11,12]，但其诊断仍依赖于先进设备和经验丰富的内镜医生。基于深度卷积神经网络算法的AI系统在胃癌、食管癌的诊断以及消化内镜检查质量提升方面取得了显著进展[13–16]。AI系统也被应用于辅助胃底萎缩的诊断，但仍存在选择偏倚[17]、多为回顾性研究[18]等局限性，目前尚无关于AI辅助胃底萎缩诊断的研究。因此，本研究旨在开发一种高效、高准确性的AI诊断系统，并通过多中心测试加以验证，以降低胃癌癌前病变筛查的难度，便于对胃底萎缩患者进行分层随访管理。

**研究设计与参与者：**
本研究在中国五家医疗机构进行。研究使用了吴江市人民医院和南京鼓楼医院进行胃镜检查的患者的内镜图像数据，训练和测试了一种用于白光内镜下识别胃底萎缩的AI辅助系统。为进一步验证该系统的通用性，研究还纳入了吴江市人民医院、宁波医养中心丽惠丽医院、台州市人民医院和安顺市人民医院患者的内镜图像进行内部测试，并使用了其他医院的患者图像进行外部测试。该研究以曲线下面积（AUC）作为主要终点，根据既定方法估算了所需样本量[19]。参数包括：预期AUC为0.90（零假设AUC0为0.5），双侧显著性水平α为0.05，功效（1?β）为0.80，以及估计的胃底萎缩患病率为27.1%[20]。根据这些参数，估计所需样本量为200–250人。

**胃底区域的识别：** 胃的初始区域，即胃食管交界处（GEJ）周围的区域，属于胃的解剖结构，通常指GEJ下方2–3厘米范围内的环形区域。内镜观察时需按顺时针方向进行反折观察，包括前壁、大弯侧壁和小弯侧壁。

**胃底萎缩的诊断标准：**
胃底萎缩的诊断基于白光内镜下的观察结果及病理学诊断：
(1) 在白光内镜下，胃底黏膜变薄，呈现白色、灰白色或黄色，失去正常红色。
(2) 病理学上，胃底黏膜萎缩表现为小腺体消失，被杯状细胞替代。所有病理结果由两位资深病理学家共同审核；若两位病理学家意见不一致，由资历更深的病理学家做出最终诊断。

**亮点：**
- **创新的人工智能辅助诊断系统：** 我们开发了一种专门用于标准白光内镜下胃底萎缩诊断的人工智能系统，解决了消化内镜诊断中的关键难题。
- **优越的诊断性能：** AI系统在多中心内部和外部测试集中的准确性、敏感性、特异性和AUC分别为0.927、0.918和0.967/0.953，显著优于资深和初级内镜医生。
- **增强的检测与可解释性：** 该系统不仅能准确识别胃底区域，还能通过热图提供可视化解释，突出显示与专家评估高度一致的萎缩区域，有助于指导针对性活检。
- **促进诊断一致性：** 该AI工具表现稳定，不受操作者经验影响，有望在不同医疗环境和内镜医生水平下标准化胃底萎缩的诊断，有助于早期评估胃癌风险。

**多中心验证：** 该模型基于大型前瞻性多中心数据集进行训练和验证，提高了研究的可靠性和普适性。

**纳入与排除标准：**
- **纳入标准：** 参与者年龄≥18岁，同意接受胃镜检查和活检，并能签署知情同意书；胃镜白光图像清晰，胃底黏膜完全可见。
- **排除标准：** 胃底溃疡、肿瘤及其他病变患者；曾接受胃底ESD或EMR手术患者；有胃部手术史或重建史的患者；上消化道出血患者；凝血功能异常患者；严重的心脏、肝脏或肾脏功能障碍患者；孕妇和哺乳期妇女；精神疾病或严重心理障碍患者；不愿接受胃镜检查和活检的患者；正在服用口服抗凝药或其他非甾体抗炎药的患者；最近一个月内参与过其他临床研究的患者；临床数据记录不完整的患者。

**图像质量控制：**
本研究使用的图像是由日本奥林巴斯医疗系统（Olympus Medical Systems, Tokyo）的GIF-H290内镜系统记录的，格式为BMP或JPG。所有白光内镜图像均由两位具有7年以上胃镜操作经验（累计检查超过8000例）的资深内镜医生仔细审核后纳入研究，他们筛选出胃底萎缩的图像，并通过病理学确诊后用于模型训练。接收者操作特征曲线（ROC曲线）被绘制出来，并计算了AUC值，以评估人工智能辅助系统在内部和外部测试数据集上的诊断性能。P值<0.05被认为在统计学上具有显著性。所有统计分析均使用SPSS 27软件进行。

**结果**
**基线临床数据**
这项多中心研究共纳入了482名患有贲门萎缩的患者，共计获得了2372张贲门图像。其中男性311名，女性171名，平均年龄为59.15±11.16岁。训练集和验证集包括292名患者，共计1273张贲门图像；内部测试集包括84名患者，共计371张贲门图像；外部测试集包括106名患者，共计728张贲门图像。此外，还有987名非食管狭窄患者，共计获得了4046张贲门图像，包括409名男性和578名女性，平均年龄为51.61±13.47岁。训练集和验证集包括603名患者，共计2453张贲门图像；内部测试集包括136名患者，共计562张贲门图像；外部测试集包括248名患者，共计1031张贲门图像。在在线医生测试数据集中，内部测试集（220例）和外部测试集（354例）分别由另外三名具有超过7年胃镜检查经验（执行超过8000例检查）的资深内镜医师和三名经验不足3年（执行少于1000例检查）的初级内镜医师独立审核。基线特征见表1，患者分配和研究流程见图2。

**表1：基线特征**
| 总计 | 训练和验证数据集 | 内部测试数据集 | 外部测试数据集 | 贲门萎缩患者数 | 平均年龄（±标准差） | 性别（男/女） | 贲门图像数量 | 每患者图像数量 |
|------|------------|--------------|-------------|------------|--------------|------------|----------------|
| 482 | 292 | 84 | 106 | 59.15±11.16 | 311/171 | 2372 | 4.92 |
| | | 84 | 371 | 58.58±11.32 | 198/409 | 1273 | 8.12 |
| | | 106 | 60.32±10.81 | 51.61±13.47 | 171/578 | 371 | 28.24 |
| | | 603 | 2453 | 562 | 409 | 248 | 1031 |
| | | 136 | 55.78±12.19 | 578 | 336 | 1031 | 22.38 |

**AI辅助系统在内部和外部测试数据集中的性能**
在内部测试数据集中，AI辅助系统的准确率为0.927，敏感性为0.941，特异性为0.919，阳性预测值（PPV）为0.878，阴性预测值（NPV）为0.962，AUC为0.967（见图3A，表2）。该系统在外部测试数据集中的表现也相当，准确率为0.918，敏感性为0.894，特异性为0.931，PPV为0.874，NPV为0.943，AUC为0.953（见图3B，表2）。数据充分证明了该AI辅助系统在评估贲门萎缩方面具有出色的诊断性能。

**不同经验的内镜医师与AI辅助系统诊断性能的比较**
结果显示，AI辅助系统的性能优于所有内镜医师，包括经验丰富的资深医师和经验不足的初级医师：在内部测试数据集上，AI辅助系统的准确率（0.927 [95%置信区间[CI] 0.891–0.964] 对比 0.774 [95% CI 0.738–0.810]；P < 0.01）、敏感性（0.941 [95% CI 0.884–0.997] 对比 0.730 [95% CI 0.673–0.787]；P < 0.01）、特异性（0.919 [95% CI 0.876–0.963] 对比 0.802 [95% CI 0.757–0.846]；P < 0.01）、PPV（0.878 [95% CI 0.820–0.936] 对比 0.694 [95% CI 0.636–0.753]；P < 0.01）和NPV（0.962 [95% CI 0.930–0.993] 对比 0.828 [95% CI 0.786–0.869]；P < 0.01）均优于资深内镜医师；在外部测试数据集上，AI辅助系统的准确率（0.918 [95% CI 0.881–0.956] 对比 0.867 [95% CI 0.843–0.891]；P < 0.01）、敏感性（0.894 [95% CI 0.827–0.961] 对比 0.841 [95% CI 0.795–0.887]；P < 0.01）、特异性（0.931 [95% CI 0.894–0.969] 对比 0.882 [95% CI 0.851–0.913]；P < 0.01）、PPV（0.874 [95% CI 0.807–0.941] 对比 0.791 [95% CI 0.750–0.832]；P < 0.01）和NPV（0.943 [95% CI 0.905–0.981] 对比 0.912 [95% CI 0.886–0.938]；P < 0.01）也优于资深内镜医师（见表2）。此外，AI辅助系统与资深内镜医师之间的观察者内一致性也比与初级内镜医师之间的观察者内一致性更高（表3）。

**AI辅助系统的可解释性**
我们展示了四张代表性的热图（均来自贲门萎缩图像数据集），突出了AI辅助模型关注的区域。值得注意的是，热图分析所标识的区域与资深内镜医师评估的萎缩区域高度吻合，证明了AI辅助系统的可解释性。从实际应用的角度来看，这些突出区域可以被视为空间预测贲门萎缩区域的贡献因素（见图4）。AI辅助系统的辅助发现可以为内镜医师提供有价值的临床指导，帮助确定活检部位。

**讨论**
在内镜检查过程中，贲门难以准确定位和观察[21]。此外，贲门的观察还受到胃部充盈状态、贲门区域的生理功能以及患者不适等因素的影响[22,23]。对于经验不足的操作者而言，误诊和漏诊的风险可能会增加。人工智能辅助内镜诊断在消化道疾病诊断中的应用正在增加[24]。研究发现，人工智能辅助内镜可以帮助识别上消化道的多个部分[25]，但关于贲门的研究更多集中在贲门癌、胃食管反流病和巴雷特食管等特定疾病上[26]，对贲门本身的识别关注较少。本研究建立了一个贲门识别模型，能够更准确地识别贲门的大弯、前壁和小弯以及后壁。这将有助于内镜医师，特别是初级内镜医师或基层医院的内镜医师更好地理解贲门结构，提高贲门病变的检测率，并可用于内镜检查的质量控制。贲门萎缩的诊断和分级可以预测胃癌（GC）的风险，并帮助确定内镜监测的间隔时间[27]。重度萎缩与胃癌的发展密切相关[5,28]。根据Kimura–Takemoto分类对萎缩性胃炎进行分级与使用更新的Sydney系统和OLGA系统的组织学评估有良好相关性[5,28,29]。Kimura–Takemoto分类可以预测胃上皮病变进展为胃癌的风险[30]，尽管新手内镜医师的诊断一致性低于经验丰富的内镜医师。然而，研究表明经过培训后，诊断一致性可以显著提高并保持稳定[31]。白光源内镜是诊断萎缩性胃炎的基础，但其诊断准确性尤其是对贲门萎缩的诊断准确性，很大程度上取决于内镜医师的经验[7,32]。图像增强内镜的应用显著提高了胃黏膜萎缩诊断的敏感性和特异性，但通常需要丰富的专业知识积累[33]。近年来，内镜诊断从单一的形态学观察发展为多模态技术的综合应用。最近的研究将基于卷积神经网络的辅助检测系统应用于萎缩性胃炎的诊断[17]。一项多中心研究使用双中心数据训练了一个AI系统，以辅助诊断萎缩性胃炎/胃黏膜异型增生（GA/IM）。其诊断性能与专家相当，显示出在辅助诊断胃癌前病变方面的巨大潜力，但该研究基于IEE（图像增强内镜）诊断。除了IEE，各地学者还使用白光源内镜进行了多项关于萎缩性胃炎诊断的研究[18]。另一项回顾性研究[18]建立了一个基于白光源内镜图像的AI辅助识别模型。然而，该算法无法准确评估萎缩性胃炎的严重程度，这可能导致观察者间差异。另一项研究开发了一个AI系统，能够分别以93%、95%和99%的准确率诊断轻度、中度和重度萎缩性胃炎[34]，但这是一项单中心回顾性研究，且图像主要来自胃窦，未包括贲门的诊断。我们前瞻性地收集数据开发了AI辅助的贲门萎缩诊断模型，该模型在内部测试和外部验证数据集中均表现出高准确率、敏感性和特异性。此外，我们发现AI辅助系统的性能优于经验丰富和不足的内镜医师，并且无论时间和经验如何，都能做出稳定准确的诊断，促进了医学诊断的一致性。然而，仍存在一些局限性。首先，本研究仅关注贲门萎缩；其次，该研究仅使用静态图像进行训练、识别和诊断，而内镜检查是一个动态过程。未来可以考虑添加动态视频训练，以更真实地模拟内镜检查过程，提升系统的临床适用性。最后，萎缩性胃炎有多种原因，如幽门螺杆菌感染、自身免疫因素等，不同原因导致的萎缩表现可能有所不同，未来的研究将对此进行探讨。

**总结**
本研究开发了一种新型的AI辅助贲门萎缩诊断系统，它可以帮助内镜医师使用白光源内镜识别贲门萎缩，并可用于未来的内镜检查质量控制。

联系信箱：

粤ICP备09063491号

热点排行