SALV数据集注册表:用于唾液腺肿瘤研究和人工智能辅助诊断工具的专家精选数字化临床病理数据集

《Head and Neck Pathology》:The SALV-Dataset Registry: An Expertly Curated Digital Clinicopathological Dataset for Salivary Gland Tumor Research and AI-Assisted Diagnostic Tools

【字体: 时间:2026年06月07日 来源:Head and Neck Pathology 3.2

编辑推荐:

  唾液腺肿瘤罕见且形态多样,给诊断和科学研究带来挑战。本研究展示了SALV数据集注册表的第一阶段;这是一个全国性的、经专家精选并完全数字化的临床病理资源,旨在支持研究并开发辅助唾液腺肿瘤病理诊断的人工智能(AI)工具。方法:通过荷兰国家组织病理学和细胞病理学网络

  
唾液腺肿瘤罕见且形态多样,给诊断和科学研究带来挑战。本研究展示了SALV数据集注册表的第一阶段;这是一个全国性的、经专家精选并完全数字化的临床病理资源,旨在支持研究并开发辅助唾液腺肿瘤病理诊断的人工智能(AI)工具。方法:通过荷兰国家组织病理学和细胞病理学网络与注册表(PALGA)收集了在莱顿大学医学中心(1999–2024年)诊断的唾液腺肿瘤切除标本,共纳入685例。将苏木精-伊红染色切片数字化,并由三组头颈病理学家根据《2023年WHO头颈肿瘤分类》独立审查。不一致和模棱两可的病例通过共识会议解决,并可获取免疫组织化学、分子分析和临床数据。量化了三组间的观察者间一致性(Fleiss’ kappa),并确定了原始诊断与共识诊断之间的一致性(Cohen’s kappa)。结果:685例肿瘤中,75%为良性,24%为恶性,1%为恶性潜能不确定。腮腺最常受累(86%),舌下腺恶性率最高(100%)。罕见实体虽有代表,但数量仍有限。观察者间一致性为中等(κ=0.64;95% CI 0.60–0.67)。原始诊断与共识诊断之间的一致性极佳(Cohen’s κ=0.89;95% CI 0.86–0.92)。修订后43例(6%)被重新分类,其中11例(2%)诊断类别发生改变。结论:本研究证明了大规模、专家数字化修订唾液腺肿瘤的可行性,并为未来的临床病理学和基于AI的研究奠定了坚实基础。随着全国范围的扩展,SALV数据集注册表将为唾液腺肿瘤诊断中的AI训练、验证和临床导向建模提供全面资源。
论文解读文章

**研究背景与问题**
唾液腺肿瘤是一类罕见且形态高度异质性的肿瘤,在2023年世界卫生组织(WHO)头颈肿瘤分类中描述了36种独立实体。由于分类的持续演进、形态学特征的重叠以及大多数病理学家接触唾液腺肿瘤频率较低,准确诊断面临显著挑战。既往研究报告专家复查后诊断不一致率介于8.3%至29%之间,凸显了诊断困难。数字病理学和人工智能(AI)有望提高诊断准确性与一致性,但现有研究受限于小型单中心队列,罕见亚型代表性不足,且缺乏高质量数字化数据集。为填补这一空白,研究人员启动了SALV数据集注册表——一项全国性倡议,旨在构建经专家精选且完全数字化的唾液腺肿瘤临床病理资源。该研究展示了首批来自莱顿大学医学中心(LUMC)的685例切除标本的系统修订与数字化成果,并通过观察者间一致性和与原发诊断的一致性分析验证了修订过程的可靠性。该研究为预计超过5000例的全国性注册表奠定基础,以支持大规模临床病理研究和AI辅助诊断工具开发。论文发表在《Head and Neck Pathology》。

**关键技术方法**
研究人员通过荷兰国家组织病理学和细胞病理学网络与注册表(PALGA)回顾性识别了LUMC在1999年至2024年间所有原发性和复发性唾液腺肿瘤切除标本,经排除后纳入685例手术切除的原发性上皮性唾液腺肿瘤。苏木精-伊红(H&E)染色切片以0.25微米/像素分辨率数字化,并上传至Slide Score平台。十六位头颈病理学家分为三组(每组6–8人),独立对数字化切片进行诊断评估,依据2023年WHO分类分配良恶性类别和具体诊断。对于三组诊断一致的病例直接定为共识诊断;不一致或不确定的病例通过在线共识会议解决,必要时参考免疫组织化学(IHC)、分子分析和临床数据。使用Python脚本自动化数据提取与整合,并以Fleiss’ κ和Cohen’s κ量化一致性。

**研究结果**
**患者与肿瘤特征**:685例中,经修订后513例(75%)为良性,165例(24%)为恶性,7例(1%)为恶性潜能不确定。腮腺最常受累(86%),舌下腺恶性率最高(100%)。最常见良性实体为多形性腺瘤(55%)和沃辛瘤(15%);恶性肿瘤中癌在多形性腺瘤中(5%)、腺样囊性癌(4%)、黏液表皮样癌(4%)和腺泡细胞癌(3%)最常见。分子检测在121例(18%)诊断困难病例中进行,主要为定制Archer SalvglandDx panel。

**观察者间一致性**:在573例具有完整三组独立评估的病例中,总体一致率为68%,Fleiss’ κ为0.64(95% CI 0.60–0.67),表明中等一致性。最常见不一致诊断包括:多形性腺瘤与伴不典型特征的多形性腺瘤对比癌在多形性腺瘤中;多形性腺瘤(肌上皮为主)对比肌上皮瘤;腺样囊性癌对比多形性腺癌对比基底细胞腺癌。

**不一致共识诊断**:原始诊断与共识诊断的总不一致率为6%(43/685),Cohen’s κ为0.89(95% CI 0.86–0.92),表明几乎完全一致。恶性病例不一致率(11%)高于良性病例(3%)。11例(1.6%)诊断类别发生改变,其中5例从良性改为恶性,6例从恶性改为良性。重新分类主要由形态学再解读驱动,辅以IHC和/或分子检测支持。例如,一例最初诊断为非特指型腺癌的病例,因检出IDH2 p.(Arg172Met)突变而被修订为纹状管腺瘤。

**临床影响**:多学科小组审查了所有43例不一致诊断,其中9例被认为对当前临床管理具有影响(如调整随访方案),并已传达给治疗医师和患者。

**讨论与结论**
该研究表明构建大规模、经数字化修订的唾液腺肿瘤数据集的可行性。通过三步修订流程(初始独立评估+共识会议),99%病例获得了共识诊断。肿瘤类型分布与既往人口学研究一致,恶性率为24%。值得注意的是,癌在多形性腺瘤中的比例(19%)高于既往报告(9–11%),可能反映了细致修订过程识别了多形性腺瘤的形态背景。观察者间一致性(κ=0.64)与Fuoco等(2023年)报告的中等一致性相似,而原始诊断与修订后诊断的一致性(κ=0.89)处于以往报告不一致率(8.3–29%)的低端。该数据集明确旨在支持AI开发,计划基于全切片图像进行内容检索、监督差异诊断预测和临床结局预测建模。研究局限性包括:单中心来源导致部分罕见实体代表性不足,以及超过二十年的时间跨度引入的异质性。结论:SALV数据集注册表证明了为唾液腺肿瘤构建高质量数字化资源的可行性;随着全国乃至国际扩展的持续推进,它将为AI开发与验证提供关键平台,最终支持这些罕见且异质性强的肿瘤的精准诊断和合作研究。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号