基于深度学习的CBCT辅助诊断系统,用于颞下颌关节盘移位

《Progress in Orthodontics》:CBCT assisted diagnosis system for temporomandibular joint disc displacement based on deep learning

【字体: 时间:2026年02月28日 来源:Progress in Orthodontics 5

编辑推荐:

  **摘要** **背景** 颞下颌关节(TMJ)盘移位的诊断依赖于临床症状和磁共振成像(MRI),但这种方法复杂、成本高昂且耗时。尽管圆锥束计算机断层扫描(CBCT)可以显示出提示TMJ盘移位的间接迹象,但手动解读仍然依赖于专业技能,从而限制了其在临床实践中的应用。本研究旨

  **摘要**

**背景**
颞下颌关节(TMJ)盘移位的诊断依赖于临床症状和磁共振成像(MRI),但这种方法复杂、成本高昂且耗时。尽管圆锥束计算机断层扫描(CBCT)可以显示出提示TMJ盘移位的间接迹象,但手动解读仍然依赖于专业技能,从而限制了其在临床实践中的应用。本研究旨在使用深度学习技术预测CBCT图像中TMJ盘移位的风险。

**方法**
利用330名患者的CBCT图像,开发了一个两阶段的TMJ盘位移筛查模型。在第一阶段,基于YOLOv11训练了一个对象检测模型,使用了30张手动标注的CBCT图像作为参考。共识别出5,238个TMJ感兴趣区域(ROIs),其中2,260个显示出TMJ盘移位的迹象。随后,这些检测到的图像被用来训练一个基于FastViT-t8的二分类模型,其诊断结果以两位经验丰富的口腔颌面放射科医生的MRI诊断为基准。

**结果**
对象检测模型的精确率为0.986,召回率为0.982,mAP50为0.988,mAP50?95为0.534。二分类模型的AUC为0.733(95%置信区间:[0.713–0.756]),AUPR为0.716(95%置信区间:[0.685–0.745),准确率为0.669。

**结论**
所提出的模型展示了使用CBCT图像进行TMJ盘位移初步筛查的能力。虽然其当前的性能还不足以单独用于诊断,但该模型可以作为正畸环境中的实用分流工具,帮助早期识别需要进一步进行MRI检查的患者,并为相关研究提供参考。

**背景**
颞下颌关节(TMJ)盘移位的诊断依赖于临床症状和磁共振成像(MRI),但这种方法复杂、成本高昂且耗时。尽管圆锥束计算机断层扫描(CBCT)可以显示出提示TMJ盘移位的间接迹象,但手动解读仍然依赖于专业技能,从而限制了其在临床实践中的应用。本研究旨在使用深度学习技术预测CBCT图像中TMJ盘移位的风险。

**方法**
利用330名患者的CBCT图像,开发了一个两阶段的TMJ盘位移筛查模型。在第一阶段,基于YOLOv11训练了一个对象检测模型,使用了30张手动标注的CBCT图像作为参考。共识别出5,238个TMJ感兴趣区域(ROIs),其中2,260个显示出TMJ盘移位的迹象。随后,这些检测到的图像被用来训练一个基于FastViT-t8的二分类模型,其诊断结果以两位经验丰富的口腔颌面放射科医生的MRI诊断为基准。

**结果**
对象检测模型的精确率为0.986,召回率为0.982,mAP50为0.988,mAP50?95为0.534。二分类模型的AUC为0.733(95%置信区间:[0.713–0.756]),AUPR为0.716(95%置信区间:[0.685–0.745),准确率为0.669。

**结论**
所提出的模型展示了使用CBCT图像进行TMJ盘位移初步筛查的能力。虽然其当前的性能还不足以单独用于诊断,但该模型可以作为正畸环境中的实用分流工具,帮助早期识别需要进一步进行MRI检查的患者,并为相关研究提供参考。

**背景**
颞下颌关节(TMJ)是颌面区域的一个双侧结构,在咀嚼、说话、吞咽和面部表情等多种口腔和颌面功能中起着关键作用。影响TMJ的疾病非常复杂,其中TMJ盘位移在正畸环境中较为常见。正常情况下,TMJ盘位于髁突顶部,以帮助下颌运动。TMJ盘位移是颞下颌关节紊乱(TMD)的结构表现之一,其中前盘位移(ADD)是最常见的类型。TMD是一组涉及TMJ、咀嚼肌和相邻组织的疾病,包括骨骼和神经肌肉病理 [1]。TMD的临床表现通常包括肌肉或关节区域的不适、头痛、关节声音以及下颌运动异常。在一项使用MRI检查62名无症状志愿者的研究中,共有22人(35%)显示出盘移位,但没有TMD症状或系统性疾病 [2]。目前还没有确凿证据表明标准化正畸干预与TMJ盘位移或TMD的发展之间存在因果关系 [3]。然而,许多研究者认为,在正畸治疗过程中髁突在关节窝内的位置不当可能会引起TMJ不适 [4]。一些具有无症状盘位移的患者在整个正畸治疗过程中可能不会出现不适;但另一些患者可能由于咬合调整和下颌位置的变化而出现关节区域的疼痛或功能障碍,尤其是那些患有ADD的患者。正畸治疗通常持续2.5到3年,大多数患者为青少年或年轻人。这一年龄重叠引入了年龄作为影响正畸患者中TMJ盘位移和TMD发生率的混杂变量。研究表明,首次接受正畸治疗的患者中TMD的患病率在21.1%到73.3%之间,显著高于普通人群 [5, 6],并且在6至15岁的患者中,患病率随年龄增长而增加 [7]。在10至18岁之间诊断出的错颌病例中,TMJ盘位移的发病率随年龄显著增加,男女比例为3:1到9:1 [8, 9]。一项涉及2,461名普通人群的荟萃分析报告显示,成人中咀嚼肌疼痛的患病率为9.7%,关节疼痛为2.6%,前盘位移伴有减少(ADDWR)的患病率为11.4% [6]。这些发现强调了正畸医生在初次咨询时可能遇到已有TMJ盘位移或TMD患者的可能性。由于TMJ症状通常较为微妙,一些患者可能不会经历咔嗒声或疼痛,或者只会有短暂的咔嗒声随后消失,导致患者可能会忽视这种情况。因此,正畸医生应在治疗开始前常规进行TMJ评估,并在必要时将患者转诊给TMJ手术专家。如果在正畸治疗过程中出现症状,及时诊断和管理至关重要。对于正处于下颌生长高峰期的青少年患者尤其重要,因为髁突是下颌的生长中心,必须防止TMD引起的髁突吸收。因此,在开始正畸治疗前早期识别临床症状、影像异常和风险因素非常重要。

**结论**
颞下颌关节磁共振成像(TMJ-MRI)可以全面显示TMJ软组织和硬组织的正常和病理状态,同时清晰地显示相邻区域的血流和积液。因此,TMJ-MRI被广泛用于TMJ评估,并被视为诊断TMJ盘移位的金标准 [10, 11],同时可以有效评估咀嚼肌和韧带等软组织。然而,在临床实践中,TMJ-MRI存在一些局限性,包括耗时的程序、设备可用性有限、技术要求高以及需要口腔颌面放射科医生的专业指导。此外,其在无症状的正畸患者中的实用性相对较低。因此,不建议将TMJ-MRI作为正畸的常规诊断工具,而仅用于有TMJ相关症状的患者的针对性筛查。

圆锥束计算机断层扫描(CBCT)在常规正畸应用中具有显著优势,包括评估阻生牙、检测口腔异常、气道评估、测量牙槽骨高度和体积、分析TMJ形态、骨骼和面部轮廓以及三维牙齿研究 [12]。与MRI相比,CBCT在可视化硬组织结构方面具有更高的可访问性和精度 [13]。因此,CBCT被推荐用于TMJ评估,是评估关节间隙和骨结构等骨骼状况的首选成像方法 [14, 15]。其优势在于三维数据采集、更高的精度和分辨率(无放大或失真),以及更薄的切片厚度 [16, 17]。尽管CBCT无法直接显示TMJ盘,但它可以显示出提示TMJ盘移位的间接迹象,如关节间隙宽度、髁突位置和骨结构的改变,这些变化被认为表明ADD [18]。Ozawa等人使用MRI研究发现,轻度至中度ADD患者的关节间隙明显大于对照组 [19]。类似地,Kurita等人使用MRI研究了ADDWR患者的髁突位置,发现髁突位置比对照组更靠后,两者之间存在统计学上的显著差异,而前盘位移无减少(ADDWoR)组与对照组之间的髁突位置没有显著差异 [20]。相反,Ren等人报告称ADDWoR组的髁突位置比ADDWR组更靠后 [21]。此外,CBCT图像分析显示,ADDWR组的髁突高度以及内外侧和前后维度显著低于正常盘位组,表明髁突形态与盘位移的严重程度相关 [22]。然而,在临床实践中,CBCT不是TMJ盘位移的主要诊断工具,因为它无法有效显示软组织,分析大量切片耗时较长,且临床医生对CBCT图像上TMJ形态变化的主观解读存在差异 [23]。此外,正畸医生通常在解读CBCT上的TMJ结构方面专业技能有限,进一步限制了其在这一领域的诊断效用。

深度学习利用卷积神经网络(CNN)和循环神经网络(RNN)等人造神经网络,非常适合处理包括图像、语音和文本在内的复杂数据类型。深度学习已在医学影像中自动检测病理特征方面得到广泛应用 [24]。CNN算法的训练依赖于大量标注的医学影像数据集,这些数据集用于开发自动识别特定病理模式的预测模型 [25]。使用深度学习辅助方法识别TMJ病理是一个新兴的研究领域。例如,一项研究使用U-Net自动化分割CBCT图像中的下颌支和髁突,平均准确率为0.99 [26]。此外,一个结合形状变异分析器(SVA)的深度神经网络分类器在CBCT扫描中有效识别和分类TMJ骨关节炎 [27, 28]。Kim等人结合改进的U-Net和CNN模型,自动分割和测量CBCT图像中下颌髁突的皮质厚度,表现出高精度 [29]。de Dumast等人开发了一个深度学习模型,通过从CBCT图像的3D表面网格中提取几何特征,将TMJ骨关节炎的形态变化分为五类 [27]。该模型与两位人类专家的分类结果一致率达到91%。Talaat的研究使用YOLOv5模型从CBCT图像快速准确地诊断TMJ骨关节炎,表现出高精度、敏感性、特异性、PPV、NPV和IoU,与人类专家的结果相比具有更高的一致性 [30]。Bianchi等人结合高分辨率CBCT(HR-CBCT)放射组学、临床数据和生物标志物,使用多种机器学习方法开发了一个早期筛查TMJ骨关节炎的模型。该模型结合了XGBoost(极端梯度提升)和LightGBM(轻量级梯度提升机)算法,表现出最佳性能 [31]。尽管在这些应用深度学习技术分析CBCT图像中的TMJ相关骨病变方面取得了显著进展,但目前还没有直接将这些方法用于CBCT为基础的TMJ盘位移诊断的研究。

**方法**
本研究获得了上海交通大学医学院第九人民医院伦理委员会的批准(编号SH9H-2025-T128-2),并遵守赫尔辛基宣言。所有参与者均签订了人类伦理和同意书。本研究纳入了2020年9月至2023年11月期间访问上海交通大学医学院第九人民医院正畸科的330名患者。所有受试者均接受了CBCT和TMJ-MRI检查。排除了孕妇、此前接受过TMD治疗的患者以及可能导致关节畸形的系统性疾病患者。初步筛查由临床医生完成。CBCT检查应在存在充分临床依据的情况下进行,它们可以提供可能影响治疗决策的补充诊断价值。因此,本研究的所有参与者都具备进行CBCT扫描的明确指征。具体来说,当二维放射学检查(如全景片和侧位头影片)提供的信息不足或可能具有误导性时,或者当CBCT提供的三维数据可以直接改变诊断或治疗计划时,就需要进行CBCT检查。在进行CBCT检查之前,已从所有参与者处获得了知情同意。此外,由于TMJ-MRI不是正畸前评估的标准程序,本研究确保所有患者在接受检查前都被告知相关信息并自愿同意。这一同意过程被明确纳入了研究伦理审批中。研究的流程图示见图1。我们的方法包括两个主要阶段:首先是从CBCT图像中检测TMJ区域,其次是分类步骤以评估椎间盘移位的风险。所有模型开发和评估都是在患者级别的分割数据集上进行的,MRI结果作为真实基准。

**图1** 两级深度学习模型用于TMJ椎间盘移位筛查的工作流程图

**图像获取**
对于CBCT扫描,使用了头部固定器和光标定位系统来确定TMJ区域。CBCT扫描时,受试者的面部处于与水平面垂直的矢状面上,Frankfort平面与水平面平行[32]。CBCT图像是使用Kodak 9500系统(Carestream Health, Ruike Medical, 多伦多, 加拿大)获得的。成像设备的配置如下:管电压90 kV,管电流10 mA,视野(FOV)直径20.6厘米,高度18.4厘米。通过多平面重建生成了修改后的矢状图像(厚度1毫米,与髁突的短轴平行)。

**MRI扫描**
在MRI扫描过程中,受试者被置于仰卧位。双表面线圈被小心地放置在两个TMJ的中心,确保线圈靠近关节。选择轴向和冠状图像作为定位图像,在这些图像中可以清楚地看到髁突的最大部分。常规的斜矢状扫描线设置为与髁突的长轴垂直,而斜冠状扫描线则平行于长轴。MR图像是使用Lianying uMR560系统(上海联英医疗科技有限公司,上海,中国)捕获的。质子密度加权成像的参数配置如下:重复时间1700毫秒,回波时间26.04毫秒,矩阵大小256×256,FOV 10×10厘米,切片厚度2.0毫米,切片间距1.0毫米。质子密度加权图像是在闭口状态下获取的,T2加权图像是在开口状态下获取的。在开口阶段,指导患者尽可能张大嘴巴并咬住开口支撑器。

**TMJ评估**
本研究使用TMJ-MRI进行数据标注,以医院的放射科诊断报告作为金标准。诊断过程使用GE Healthcare的Centricity? Universal Viewer软件(版本6.0)进行。两位具有至少8年经验的头颈放射科医生在不知道患者临床细节的情况下,对TMJ-MRI切片进行了评估,包括冠状视图(闭口;每侧8张连续图像)和矢状视图(开口和闭口;每种状态每侧8张连续图像)。对于每个TMJ,放射科医生提供了具体的诊断报告,将椎间盘-髁突关系分类为以下几种之一:正常椎间盘-髁突关系、ADDWR、ADDWoR、ADDWoR伴有内侧或外侧移位、ADDWoR伴有内侧或外侧移位。为了训练二元分类深度学习模型,这些诊断被映射为二元标签。如果诊断结果不是“正常椎间盘-髁突关系”(即ADDWR、ADDWoR和/或伴有内侧或外侧移位),则该关节被标记为“异常”。因此,所有被标记为“异常”的TMJ的CBCT图像也被指定为模型训练用异常图像。两位放射科医生独立进行了评估,他们达成一致的结果被视为“金标准”。对于意见不一致的MRI病例,会重新评估直到达成共识。

**模型架构**
在这项研究中,我们提出了一个基于CBCT文件的两阶段TMJ椎间盘移位识别模型(图2)。模型的第一阶段专注于ROI检测,我们使用了YOLOv11这一先进的对象检测算法来准确定位CBCT图像中的TMJ。在ROI检测之后,第二阶段涉及图像分类,以预测TMJ椎间盘是否存在移位。为此,我们在2D切片上训练并评估了几种深度学习架构,比较了基于Transformer的模型和CNN,以找到最适合我们应用的方案。两级模型的实现细节在补充材料中提供。

**图2** 提出的模型工作流程图

**ROI检测**
在ROI检测阶段,我们使用了YOLOv11,它以实时对象检测的速度和准确性而闻名。YOLOv11模型在一个大型数据集上预训练后,在专门标注了TMJ区域的CBCT图像数据集上进行了微调。这使得模型能够学习到TMJ的独特特征,从而提高了其在复杂和噪声较大的CBCT图像中检测关节区域的能力。TMJ区域的手动标注是使用LabelImg(v1.8.6)工具完成的,这是一个专门为计算机视觉应用中的图像标注任务设计的开源工具包。该工具自动生成了与YOLOv11模型格式兼容的对象标注文件。这个标注过程仅使用全头扫描数据进行了验证。在推理过程中,YOLOv11模型输出了检测到的TMJ区域的边界框,提供了用于裁剪原始CBCT图像的精确坐标,从而分离出ROI以供后续分析。

**图像分类**
一旦TMJ ROI被精确识别并从CBCT体积中分离为2D图像切片,它们就会进入图像分类阶段。这一阶段对于预测TMJ椎间盘的存在与否至关重要。为此,我们使用了一系列具有不同特征的深度学习模型, chacun都适合我们的二元分类任务。我们选择了基于Transformer的模型FastViT和EfficientViT,以及CNN模型MobileNetV3-small和EfficientNet-B1进行比较。选择这些模型是基于它们在计算效率和预测能力之间的平衡能力,这对于需要同时考虑准确性和资源管理的医学成像应用来说至关重要。详细规格和选择这些特定模型变体的理由在补充材料中提供(模型概述和选择理由)。最终模型选择基于对分类准确性和计算效率的全面评估。

**方法论上的关键区别**
切片级模型开发与患者级临床应用的工作流程存在差异。具体来说,本研究严格遵循以下流程:首先,根据所有330名受试者的完整CBCT数据,在患者级别划分训练集和测试集。随后,分配的训练集和测试集分别进行独立的数据处理,包括切片生成和关节区域识别。需要注意的是,为了最大化训练数据的利用并评估切片级的泛化性能,测试集中的所有识别出的TMJ切片被汇集到一个混合数据集中进行评估,有意地将它们与其原始患者标识符解耦。因此,本研究中报告的分类性能指标(包括AUC和准确性)是在这个聚合的测试集上计算的,这些结果并不反映个别患者的诊断性能。相比之下,部署的筛查工具在实际临床应用中是在患者级别操作的。对于给定患者的CBCT扫描,该工具处理包含TMJ的所有切片。最终的患者级风险分数是通过平均所有相应切片得出的异常概率(P_slice)来计算的。这种基于概率的融合策略减轻了单个切片潜在误分类的影响,并提供了全面的患者级评估。

**数据集**
在这项研究中,我们收集了330名患者的330份CBCT数据,以预测TMJ椎间盘移位风险。为了训练YOLOv11模型来检测TMJ,随机选择了30份CBCT扫描并重新构建为矢状二维切片。其中,720张TMJ图像被逐片手动标注。其中556张图像用于训练,164张用于测试。最初训练的YOLO模型应用于所有330份CBCT扫描得到的完整矢状CBCT切片集。该模型最初识别出5,412张包含TMJ区域的候选图像。这些检测结果随后经过手动审查过程,消除错误识别,得到了5,238个精确定位的TMJ-ROI,其中2,260个显示有TMJ椎间盘移位。这些检测到的图像随后被用来训练分类模型。330份CBCT数据集最初被分为两组:正常组和异常组。为了防止数据泄露并确保评估的稳健性,数据在患者级别进行划分,确保来自单个患者的所有图像仅被分配到训练集或测试集中。随后,每组被随机分为7:3的比例,正常组的70%和异常组的70%被分配到训练集(3,286张图像),每组的剩余30%构成测试集(1,952张图像)。

**评估指标**
精度(Precision)、召回率(Recall)、mAP50(在0.5的IoU阈值下的平均精度均值)和mAP50?95被用作对象检测的标准评估指标。精度衡量模型所有阳性预测中正确识别的真正例的比例,计算公式如下:$$\:\text{P}\text{r}\text{e}\text{c}\text{i}\text{s}\text{i}\text{o}\text{n}=\frac{\text{T}\text{r}\text{u}\text{e}\:\text{P}\text{o}\text{s}\text{i}\text{t}\text{i}\text{v}\text{e}\text{s}}{\text{T}\text{r}\text{u}\text{e}\:\text{P}\text{o}\text{s}\text{i}\text{t}\text{i}\text{v}\text{e}\text{s}+\text{F}\text{a}\text{l}\text{s}\text{e}\:\text{P}\text{o}\text{s}\text{i}\text{t}\text{i}\text{v}\text{e}\text{s}}$$(1)召回率衡量数据集中所有实际正例中正确识别的真正例的比例,计算公式如下:$$\:\text{R}\text{e}\text{c}\text{a}\text{l}\text{l}=\frac{\text{T}\text{r}\text{e}\:\text{P}\text{o}\text{s}\text{i}\text{t}\text{i}\text{v}\text{e}\text{s}}{\text{T}\text{r}\text{e}\:\text{P}\text{o}\text{s}\text{i}\text{t}\text{i}\text{v}\text{e}\text{s}+\text{F}\text{a}\text{l}\text{s}\text{e}\:\text{N}\text{e}\text{g}\text{a}\text{t}\text{i}\text{v}\text{e}\text{s}}$$(2)mAP50在固定的IoU(Intersection over Union)阈值0.5下评估所有类别的平均精度。IoU衡量预测边界框与真实边界框之间的重叠程度。较高的IoU表示更好的定位能力。mAP50?95将评估扩展到从0.5到0.95的多个IoU阈值,以0.05的间隔。它计算了这些阈值下的平均精度,提供了对模型性能的更严格和全面的评估。

**每个CNN模型的性能评估**
每个CNN模型的性能使用三个指标进行评估:接收者操作特征(ROC)曲线、精度-召回率(PR)曲线和准确性。ROC曲线提供了一个评估灵敏度和特异性之间权衡的可视化工具。ROC曲线下的面积(AUC)表示更好的整体性能,AUC为1.0表示完美的分类器。PR曲线关注模型在识别阳性案例方面的性能,在处理高度不平衡的数据时比ROC曲线更有信息量。PR曲线下的面积(AUPR)提供了一个单一的标量值,总结了模型在保持高召回率的同时实现高精度的能力。准确性衡量正确分类实例(包括真正例和假正例)在总实例数中的比例,计算公式如下:$$\:\text{A}\text{c}\text{c}\text{u}\text{r}\text{a}\text{c}\text{y}=\frac{\text{T}\text{r}\text{u}\text{e}\:\text{P}\text{o}\text{s}\text{i}\text{t}\text{i}\text{v}\text{e}\text{s}+\text{T}\text{r}\text{u}\text{e}\:\text{N}\text{e}\text{g}\text{a}\text{t}\text{i}\text{v}\text{e}\text{s}}$$(3)

**结果**
不同YOLOv11变体在检测TMJ区域方面的性能指标总结在表1中。从数据可以看出,YOLOv11n在本研究中表现最好,达到了0.986的精度、0.982的召回率和0.988的mAP50,以及0.534的mAP50?95。YOLOv11m紧随其后,精度为0.986,召回率更高为0.972,mAP50得分最高为0.992,表明在0.5的IoU阈值下有强大的对象定位性能。然而,其mAP50?95得分略低于YOLOv11n,表明尽管它在标准IoU阈值下表现优异,但在不同阈值下的性能不够稳健。相比之下,YOLOv11l和YOLOv11x的整体性能较低。YOLOv11l的精确度为0.954,召回率为0.931,mAP50值为0.982,mAP50?95值为0.489,这反映了精确度和召回率都略有下降。YOLOv11x的高召回率表明它几乎能检测到所有TMJ区域的实例,但代价是产生了更多的误报。鉴于这些观察结果,YOLOv11n成为了TMJ区域检测的最佳选择。它不仅实现了接近完美的精确度和召回率,还保持了较高的mAP50和mAP50?95值,展现出在各种IoU阈值下的稳健性能。表1展示了不同YOLOv11变体之间的检测准确性比较。

图3显示了不同深度学习模型在预测TMJ盘移位方面的ROC曲线和AUC值的比较。从图中可以看出,FastViT-t8在这项研究中表现最佳,其切片级AUC达到了0.733,95%置信区间为[0.713–0.756]。鉴于其相对轻量级的架构,这一结果尤其令人印象深刻,说明它在保持计算效率的同时能够实现高性能。FastViT-t8的性能优于其他模型,其AUC比次优模型Efficient_b1高出4.5%。

图4展示了不同深度学习模型在TMJ盘移位二分类方面的PR曲线和AUPR值的比较。FastViT-t8的AUPR达到了0.716,95%置信区间为[0.685–0.745]。与AUPR排在第二位的Mobile-small(0.642)相比,FastViT-t8的提升幅度达7.4%。Efficient_b1是一种广泛使用的深度卷积神经网络,其AUPR为0.624,低于FastViT-t8和Mobile-small。这表明,尽管Efficient_b1的架构更复杂、参数更多,但对于这个特定数据集来说可能不是最佳选择。

图5的条形图展示了不同深度学习模型在TMJ盘移位二分类方面的切片级准确性。FastViT-t8的准确性最高,为0.669,Efficient_b1的准确率为0.641。这些结果与ROC曲线和PR曲线中的高性能一致,表明这些模型在多个评估指标上都很稳健。

深度学习模型虽然功能强大,但在决策过程中往往缺乏透明度,这可能会影响临床信任度和采纳度。为了阐明FastViT-t8卓越性能背后的决策逻辑并评估其预测的临床合理性,我们在图6中使用了梯度加权类别激活映射(Grad-CAM)进行了可视化分析,可视化了每个架构组中表现最佳的模型的关注区域。具体来说,我们分析了FastViT-t8和EfficientViT-m5以及MobileNetV3-small和EfficientNet-B1的关注区域。这些热图是从八个随机选择的患者的每个TMJ-ROI CBCT切片生成的最终特征图得出的(涵盖了正常和异常病例)。结果显示,在所有模型中,FastViT-t8的关注模式在临床一致性上最高,与临床医生在诊断时优先考虑的解剖区域高度吻合。对于被预测为“异常”的病例,FastViT-t8主要关注髁头的前上表面和前关节间隙以及髁小梁骨。在“正常”病例中,FastViT-t8的关注范围更广泛,覆盖了髁头和颈部的整体结构。这种模式与已知的间接放射学征象(例如前关节间隙变宽、髁后位、髁骨形态变化)相对应,表明该模型有效捕捉到了与盘移位相关的间接放射学特征。

为了进一步评估临床实用性和潜在风险,我们在测试集上计算了患者级别的混淆矩阵(表2)。综合分析显示,FastViT-t8在所有模型中表现出最平衡的性能,假阴性率最低(15.2%),这比其他比较模型有显著优势。该模型正确识别了31个真阳性病例,同时只产生了15个假阴性病例。它还表现出很强的特异性,真阴性分类数量最多(n=35),同时保持了可接受的假阳性数量(n=18)。对于筛查工具而言,低假阴性率对于确保临床安全至关重要,因为它直接决定了漏诊的风险。FastViT-t8在这一关键指标上的卓越表现使其特别适合实际临床场景中的初步筛查任务。

开发的模型被实现为一个先进的临床决策支持工具,旨在帮助牙医和口腔颌面专家评估TMJ盘移位的风险[33]。该工具提供了一个简化的界面,使医疗保健提供者能够输入患者的DICOM文件目录,并获得详细的TMJ盘移位风险评估。如图7所示,流程从用户选择包含患者DICOM文件的文件夹开始。系统设计为支持批量上传,允许一次性处理来自单次CBCT扫描的所有切片。

在选择了目录和模型后,点击“上传并分析”按钮即可开始分析。软件随后使用YOLOv11n对象检测算法处理上传的CBCT数据,识别ROI。之后,每个ROI内的切片都由选定的深度学习模型进行分类,以估计TMJ盘移位的概率。处理时间取决于数据集大小和所选模型,通常只需几分钟。

分析完成后,工具以综合格式呈现结果(见图8)。输出包括TMJ盘移位的整体风险概率、高风险切片列表以及一个交互式查看器,使临床医生能够详细检查这些关键区域。用户可以使用“上一页切片”和“下一页切片”按钮浏览高风险的切片,方便全面审查最有可能显示TMJ盘移位的区域。这种方法不仅支持更准确的诊断,还提高了临床工作流程的效率。

本研究提出了一个基于CBCT扫描的两阶段TMJ盘移位识别模型。使用了YOLO算法和基于Transformer的深度学习算法来评估TMJ盘移位的风险。在没有先进行TMJ筛查的情况下开始正畸治疗可能会加剧TMJ的压力,潜在地加重TMJ盘移位或引发TMD症状。因此,在开始正畸治疗之前,对患者的TMJ状况进行彻底的评估是必要的,这包括临床检查和影像学检查。MRI被认为是诊断TMJ盘移位和TMD的“黄金标准”,因为它能清晰地显示盘的位置、形态及其与髁的关系。然而,MRI不适用于诊断骨性病变。CBCT是正畸治疗前的常规检查,它在可视化TMJ的骨结构方面表现出色,允许对髁和关节窝的形态进行多平面测量[18],特别是在评估疑似TMD患者的疾病进展程度和阶段时[34]。结合临床症状,它可以指导有针对性的TMJ-MRI检查。然而,临床医生对TMJ形态变化的解读往往具有主观性,观察者间的可靠性较低[23]。近年来,基于MRI的TMJ盘移位智能诊断研究取得了显著进展。例如,Lee等人开发了一个基于CNN的深度学习模型,用于自动检测MRI图像中的ADD。他们微调的模型实现了0.8775的AUC,集成模型将准确率进一步提高到83%,显示出与人类专家相当的诊断性能[35]。值得注意的是,Bai等人通过提出多模态步进注意力网络(MSANet)并构建了一个AI辅助诊断系统TMJ MRI-Net,进一步推动了该领域的发展。他们的研究证实,AI辅助显著提高了临床医生的诊断效率,将盘移位的诊断AUC提高到0.995[36]。尽管这些基于MRI的深度学习模型性能优异,但由于MRI的高成本和操作复杂性,其在大规模筛查和初级保健中的广泛应用受到限制。

Choi等人采用了传统的放射组学方法,并训练了两种机器学习模型——随机森林(RF)和极限梯度提升(XGBoost)来预测134名患者的247个TMJ的CBCT数据。他们的模型在区分无减小的盘移位方面表现最佳(AUC:0.86),而在区分盘移位和正常盘-髁关系方面,AUC值分别为0.76(RF)和0.75(XGBoost)[37]。他们方法的一个关键优势在于模型的可解释性。然而,这种工作流程严重依赖于精确且耗时的手动分割,引入了操作者间变异性的风险,其性能上限受到手工特征表示能力的限制。

相比之下,本研究采用了端到端的深度学习框架。首先应用YOLOv11模型自动定位TMJ区域,精确度为0.986,消除了手动分割的需要。随后,使用FastViT等视觉模型直接从图像数据中提取与诊断相关的特征,而不依赖于预定义的特征公式。这使得模型能够学习传统放射组学方法可能难以捕捉的成像模式。虽然当前模型的整体AUC为0.733,低于基于放射组学研究的最高值,但所提出的流程实现了从定位到诊断的完全自动化。这减少了对手动输入和专家定义特征的依赖,从而提高了临床工作流程的效率,并显示出进一步优化的潜力。

在这项研究中,我们提出了一个两阶段的TMJ盘移位识别模型,据我们所知,这是首个使用CBCT数据和深度学习方法评估TMJ盘移位风险的研究。在模型的第一阶段,我们验证了YOLO系列对象检测算法在TMJ图像中识别ROI的适用性。结果表明,YOLOv11在ROI检测方面表现出色,实现了高精确度(精确度=0.986)和召回率(召回率=0.982)。然而,在不同置信阈值下的平均精确度(mAP50-95=0.534)仍有改进空间。在第二阶段,我们探索了基于Transformer和CNN的各种深度学习架构对TMJ图像进行二分类。FastViT-t8模型表现最佳,分类AUC为0.733(95%置信区间:[0.713–0.756]),AUPR为0.716(95%置信区间:[0.685–0.745),准确率为0.669。这些结果表明,FastViT-t8在TMJ图像分类任务中表现出稳健的性能,特别是在处理不平衡数据集时,这一点通过AUPR指标得到了体现。通过对多个模型的比较分析,我们发现FastViT-t8在计算效率和分类性能之间取得了最佳平衡。其结构重新参数化设计以及大核卷积的加入使其在保持高分类准确性的同时显著降低了计算复杂性,使其更适合实际临床应用。此外,YOLOv11在ROI检测任务中的高效率为后续分类任务提供了高质量的输入,进一步增强了模型的实用性。

本研究利用CBCT成像(一种常规的正畸前检查)实现了TMJ盘移位的早期检测,为正畸医生提供了重要的基于影像的见解。这种方法不仅有助于快速判断患者是否需要进一步的MRI检查,还能避免不必要的诊断程序,从而降低患者的治疗成本。此外,对于患有颞下颌关节(TMJ) disc移位的无症状患者,它能够及时发现潜在的TMJ病变,有效降低正畸治疗期间出现TMJ相关不适的风险。我们模型的分类预测表现出中等但明显的区分能力,AUC为0.733(95% CI [0.713–0.756]),准确率为66.9%。这些结果表明,该模型作为一个初步筛查工具具备基本能力,适用于社区或门诊环境中的高效分流。其应用有助于通过识别可能需要转诊进行高级TMJ-MRI检查的高风险人群来优化医疗资源的分配。然而,目前的准确率水平尚不足以使其独立作为诊断工具使用。该模型的临床实用性在很大程度上取决于其灵敏度和特异性之间的平衡。高灵敏度有助于排除疾病,降低漏诊风险;而高特异性则更适于确诊病情并减少不必要的程序。因此,明确这些诊断特性对于界定其合适的临床应用场景至关重要。

验证队列中出现的假阴性结果与模型的AUC 0.733相符,需要谨慎解读。这一结果源于几个相互关联的因素:首先,模型仅依赖CBCT提供的间接骨特征来判断disk移位。在MRI确认存在移位但骨变化微小或不存在的情况下,模型缺乏足够的辨别特征进行准确检测;其次,作为筛查工具,模型的灵敏度是针对特异性进行校准的,这导致一些真正阳性病例被遗漏以减少误报;第三,基于切片级概率的平均值进行患者级预测可能会稀释局部异常信号,从而导致假阴性结果。为了降低临床实践中的假阴性风险,该工具应纳入到一个全面的决策工作流程中。由于模型预测仅基于CBCT,因此风险评分(PPatient)必须结合临床体征进行解读。对于模型预测风险较低但具有典型症状(如关节疼痛、咔嗒声或功能受限)的患者,应优先进行临床评估。在这种情况下,应忽略模型输出,转诊进行确认性MRI检查。这种结合人工智能和临床经验的综合策略对于安全应用至关重要,确保该工具支持而非替代专家判断。

尽管本研究取得了显著成果,但仍存在一些局限性:首先,数据来自单一中心,可能限制模型的普适性;尽管采用了数据增强技术,但其效果并不明显;其次,由于难以重现原始放射学评估过程,本研究虽然得到了影像科的诊断报告支持,但未评估两位放射科医生之间的诊断一致性;第三,我们的分类模型基于二维切片进行操作,可能无法完全捕捉CBCT体积中的三维空间信息,这种二维方法可能限制模型整合相邻切片信息的能力,从而影响其对某些形态变化的敏感性;第四,模型在ROI检测和分类方面的表现中等,准确率为66.9%,因此在临床应用中需要谨慎,特别注意降低假阴性风险。未来的研究应包括临床验证以评估模型的有效性。此外,进一步的研究可以优先考虑三个关键方向:首先,通过多中心、大规模的CBCT数据集并改进注释协议和适应CBCT特定灰度和空间特性的增强技术来提高数据质量;其次,模型架构开发应实现端到端集成网络,将切片检测、裁剪和分类整合到一个框架中,利用共享的特征提取来提高计算效率;第三,应开发结合影像学和临床指标(如症状和历史数据)的多模态整合方法,以解决单模态CBCT分析的固有限制并提高TMJ disc移位的诊断准确性。

本研究提出的两阶段识别模型为基于CBCT的TMJ disc移位评估提供了一种新的解决方案。通过整合先进的深度学习技术和高效的计算架构,该模型展示了良好的性能和显著的临床应用潜力。未来的研究将致力于进一步优化模型性能,并扩大其在多中心和多模态数据环境中的适用性,最终提高其满足临床需求的效用。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号