《Egyptian Informatics Journal》:Fully automated Pell & Gregory classification on panoramic radiographs
编辑推荐:
本研究提出了一种基于U-Net架构的全自动化深度学习系统,用于根据Pell & Gregory方法对下颌第三磨牙进行分类。该系统通过引入并自动检测全景X光片上的新解剖标志点,利用其空间关系确定分类。研究使用来自不同患者的全景X光片进行训练与评估,针对左右两侧下颌分别构建数据集,最终在Pell & Gregory分类任务中分别实现了左侧93.24%与右侧91.30%的准确率,展现了可靠性能。这一方法提升了诊断一致性,减少了观察者间的差异,为临床提供了实用工具,展示了人工智能改善口腔诊断流程的潜力。
智慧牙(第三磨牙)是人类口腔中最后萌出的牙齿,常常因为空间不足等原因无法正常萌出,形成“阻生”或“嵌塞”,进而可能引发疼痛、肿胀、邻牙蛀坏、牙根吸收等一系列问题。拔除这些智齿是口腔颌面外科最常见的门诊手术之一。然而,智齿的位置千差万别,其拔除难度和术后并发症风险也各不相同。因此,术前通过影像学手段(如全景X光片)精确评估智齿的位置至关重要。临床上,医生广泛使用Pell & Gregory分类法来评估下颌智齿的垂直深度。然而,这种评估高度依赖于医生的经验、注意力和工作状态,不同医生甚至同一医生在不同时间对同一张X光片的判断都可能存在差异,导致诊断一致性不高。为了解决这一临床痛点,减少人为因素带来的评估变异性,研究人员将目光投向了人工智能。一项发表在《Egyptian Informatics Journal》上的研究,便开发了一种基于深度学习的全自动化系统,旨在如同经验丰富的放射科医生一样,对全景X光片中的下颌智齿进行精准、一致的Pell & Gregory分类。
为了开展这项研究,研究人员利用从土耳其某大学牙科学院收集的全景X光片构建了两个独立的数据集:左侧下颌智齿(牙齿37-38)的373张图像和右侧下颌智齿(牙齿47-48)的328张图像。所有图像均由两位有5年经验的口腔颌面放射科医生根据Pell & Gregory标准进行手动标注和分类。该研究采用的核心方法是基于改进的U-Net模型架构。与直接将整张X光片输入模型进行分类的传统思路不同,本研究创新性地提出了一个“两步走”的混合方法:首先,研究团队定义了五个对Pell & Gregory垂直分类至关重要的解剖标志点,包括第二磨牙(邻牙)的两个咬合面高点、两个牙颈部点(牙釉质牙骨质界)以及第三磨牙(智齿)的最高牙尖点。然后,训练一个定制的U-Net模型来自动、精准地检测这五个点的坐标。最后,基于这些自动检测出的点坐标,通过一套明确的几何规则(例如,判断智齿最高点相对于第二磨牙咬合面线和牙颈线(CEJ, Cemento-Enamel Junction)的位置关系)来最终确定智齿属于Pell & Gregory分类中的A、B或C类。
4.1. 数据集准备
研究构建了针对左侧和右侧下颌的独立数据集。专家手动标记了用于分类的五个关键点,并使用ImageJ软件记录其坐标。这些点被用于训练后续的U-Net模型,以进行自动化检测。
4.2. 自动点检测
U-Net模型在自动检测解剖标志点方面表现出色。通过成功率检测率(SDR, Success Detection Rate)在2毫米、2.5毫米、3毫米和4毫米等不同误差阈值下的评估,模型在左右两侧数据集上均取得了高成功率(例如在4毫米阈值下,右侧达到95.22%,左侧达到93.88%),证明了其定位的准确性。
4.3. 第三磨牙分类
在U-Net模型成功检测出关键点后,研究根据其空间位置关系执行基于规则的Pell & Gregory分类。结果显示,该混合方法在左侧下颌测试集上达到了93.24%的总体准确率,在右侧下颌达到了91.30%。混淆矩阵显示,绝大多数分类错误发生在相邻类别(如A类和B类之间,B类和C类之间),没有出现跨类别(如A类和C类之间)的严重误判。更深入的分析表明,该模型在识别罕见的严重嵌塞(C类)病例方面表现优于传统的端到端CNN(卷积神经网络)模型(如VGG16和ResNet50),后者在处理C类样本时完全失败(F1分数为0),而本研究提出的方法在C类上获得了有效的F1分数。此外,自助法(Bootstrap)置信区间分析也证实了模型性能估计的稳定性。
4.4. ROC/AUC分析对混合架构的局限性
由于本研究采用的混合方法是基于几何规则的确定性分类,而非输出概率分布的端到端分类器,因此无法进行传统的受试者工作特征(ROC)/曲线下面积(AUC)分析。这被强调为一种设计选择,旨在优先保证分类过程的临床可解释性和可验证性。
本研究提出了一种用于下颌第三磨牙Pell & Gregory分类的、基于解剖标志点的全自动深度学习系统,并验证了其高准确性和可靠性。该系统通过U-Net模型自动检测专家定义的五个关键解剖点,然后根据这些点的几何关系进行规则化分类,成功模仿了临床医生的诊断逻辑。实验结果表明,该方法在左右下颌数据集上均取得了超过91%的分类准确率,显著优于直接使用VGG16或ResNet50等传统CNN模型的方法,特别是在处理临床少见的严重嵌塞(C类)病例时优势明显。错误分析显示,所有误分类都发生在解剖结构模糊的相邻类别边界案例中,没有出现跨越分类等级的严重错误,这从临床安全角度是可接受的。该研究的意义在于,它不仅提供了一个高精度的自动化诊断工具,更重要的是,其“检测关键点再推理”的混合框架将专家知识融入AI决策过程,极大地增强了模型的可解释性和临床医生的信任度。这种方法减少了因医生疲劳、经验差异等因素导致的主观判断误差,提升了诊断的一致性和效率。未来,该框架有望扩展到上颌智齿或其他类型牙齿的评估中,并整合到牙科影像软件中,为临床诊断和教育培训提供强有力的智能化支持,从而推动人工智能在口腔医学领域更深入、更可靠的应用。