《Odontology》:Multi-class anatomical landmark detection in periapical radiographs with deep learning
编辑推荐:
本研究旨在开发一种深度学习模型,用于检测并分割来自上颌骨与下颌骨的根尖周片上的多类别解剖标志。研究人员共纳入1930张采用平行投照技术拍摄的根尖周片,标注21个解剖标志,按训练集80%、验证集10%、测试集10%划分。数据集划分前实施几何保持预处理,划分后仅对
本研究旨在开发一种深度学习模型,用于检测并分割来自上颌骨与下颌骨的根尖周片上的多类别解剖标志。研究人员共纳入1930张采用平行投照技术拍摄的根尖周片,标注21个解剖标志,按训练集80%、验证集10%、测试集10%划分。数据集划分前实施几何保持预处理,划分后仅对训练子集进行外观增强。采用YOLOv8x-seg架构训练多类别检测与实例分割任务,以精确率、召回率、F1值、戴斯系数(Dice coefficient)、交并比(Intersection-over-Union, IoU)、平均精度均值(mean average precision)及受试者工作特征(Receiver Operating Characteristic, ROC)曲线进行分析。模型训练稳定且性能一致,总体精确率、召回率与F1值分别为0.820、0.725与0.769,总体Dice系数为0.621。上颌窦、鼻腔窝、鼻腔窝底及鼻中隔等边界清晰的解剖结构检测准确率较高,低对比度标志表现相对不足。置信度依赖性分析显示最优性能出现在较低置信阈值区间(约0.05–0.10)。结果表明,该模型可有效识别根尖周片中的主要解剖标志,但在小尺寸或低对比度结构上仍存在预期局限。尽管上颌骨与下颌骨区域、前后牙位及相似结构的投影依赖性形态存在显著解剖变异,该研究证实深度学习可可靠识别关键解剖标志,有助于在日常牙科实践中实现更安全、一致且具有临床意义的影像判读。
研究背景方面,根尖周片因其高空间分辨率与低失真特性,在牙科临床诊断中具有重要地位,可用于观察牙根、根尖周组织及相关解剖结构。然而二维投影固有的叠加效应与解剖结构形态的高度变异性增加了判读难度,尤其在涉及下颌管、上颌窦底、颏孔等关键区域时,误判可能导致手术并发症。全景片虽可整体展示颌面部结构,但存在放大与失真,锥形束CT(Cone Beam Computed Tomography, CBCT)虽能提供三维信息,却受限于辐射剂量难以常规普及。当前人工智能在牙科影像中的应用主要集中在疾病检测,针对根尖周片的多类别解剖标志自动化识别研究仍较有限。因此,研究人员旨在构建并验证一种深度学习模型,实现对上下颌前后牙区根尖周片中关键解剖标志的自动识别,以提升临床判读的可靠性与安全性。
在方法学方面,研究人员回顾性收集2018年9月至2021年9月伊斯坦布尔奥坎大学口腔颌面放射科的4000张根尖周片,经严格纳入排除标准筛选后获得1930张符合平行投照技术、患者年龄≥18岁且无病理及伪影的高质量影像。所有图像由受过训练的标注人员在颌面放射科医师监督下,使用DentalAi软件标注21类上下颌解剖标志,共计3844个结构。数据集按分层随机抽样分为训练集(80%)、验证集(10%)与测试集(10%)。在划分前采用几何保持预处理(对比度受限自适应直方图均衡化,Contrast-Limited Adaptive Histogram Equalization, CLAHE;双边滤波;轻度对比度调整)以避免数据泄露;划分后对训练集施加外观增强(高斯模糊、噪声、亮度对比度变化等)。模型采用YOLOv8x-seg架构进行多类别检测与实例分割,输入分辨率640×640像素,训练800个epoch,批大小为4,并使用预训练权重。性能评估在独立测试集上进行,指标包括精确率、召回率、F1值、IoU、Dice系数及ROC曲线下面积(Area Under Curve, AUC)。
结果部分显示,模型训练损失稳步下降并保持稳定收敛。总体精确率、召回率与F1值分别为0.820、0.725与0.769,Dice系数为0.621。置信度分析表明,F1值在约0.09时达到峰值,精确率随置信度升高而增加,召回率在低置信度时最高。在类别层面,上颌窦、鼻腔窝、鼻腔窝底及鼻中隔等大面积、边界清晰的结构检测性能最佳;下颌管、腭中缝、颧突等中等尺寸结构表现为中等性能,错误主要来自较高的假阴性率和部分分割不完整;颏孔、切牙孔、下颌舌骨嵴等小尺寸或低对比度结构检测率较低,常因类不平衡与影像重叠被误判为背景。ROC分析显示各类结构AUC介于0.74至0.98之间,其中上颌窦与下颌管分离度最高。混淆矩阵进一步证实大结构分类准确率高,小结构易被漏检,但相邻鼻腔结构间误判较少。视觉评估显示模型在不同牙位均能较好地复现大部分标注结构,但小且边界模糊的标志预测稳定性不足。
讨论部分指出,该研究首次在根尖周片上实现了21类解剖标志的实例分割,弥补了以往研究多集中于全景片或CBCT且类别有限的不足。大面积高对比度结构因形态稳定更易识别,小结构则受限于视野、投影重叠与灰度差异难以检测。置信度分析支持在低阈值范围内可获得更高的综合性能,提示模型更适合作为辅助工具提示候选区域,而非完全替代人工判读。混淆矩阵与可视化结果均印证了类别表现差异,并指出数据分布偏移(domain shift)可能影响模型的泛化能力。临床应用方面,该模型可辅助根管治疗、根尖手术及种植规划,减少将正常解剖误认为病变的风险。研究局限性在于单中心数据来源、部分结构自然代表性不足及未量化标注者间一致性,未来需多中心验证并优化小结构检测策略。结论强调,深度学习在根尖周片解剖标志检测中具有可行性,尤其对清晰结构表现良好,但小且低对比度标志仍需改进。该方法经进一步优化与验证,有望提升日常口腔影像判读的安全性与一致性。