《Frontiers in Immunology》:Deep learning and radiomics-based system for early diagnosis of hip synovitis in juvenile idiopathic arthritis
编辑推荐:
本研究创新性地开发了一种基于深度学习(YOLO-JIA模型)与影像组学(Radiomics)的自动识别系统,用于幼年特发性关节炎(JIA)髋关节滑膜炎的早期诊断。该系统通过自动分割髋关节超声图像中的关节囊区域,并提取关键影像组学特征构建随机森林(RF)分类模型,在内部和外部验证集上分别取得0.88和0.81的AUC值,决策曲线分析(DCA)证实其具有临床实用性。该技术为JIA髋关节受累的早期筛查提供了一种及时、经济、非侵入性的辅助工具。
引言
幼年特发性关节炎(JIA)是儿童时期最常见的慢性风湿性疾病之一,也是导致儿童获得性残疾的主要原因。髋关节作为人体承重和运动的核心枢纽,在高达20%-60%的JIA患者中受累,且髋关节受累往往预示着更严重的疾病负担和更差的预后。持续的关节滑膜炎不仅导致软骨破坏和骨侵蚀,还会干扰正常骨骼发育,造成骨骺早闭和股骨颈畸形等不可逆的结构性损伤。然而,JIA髋关节滑膜炎的早期诊断面临多重挑战,包括患儿缺乏明显临床症状、儿童表达症状能力有限以及实验室指标缺乏特异性。磁共振成像(MRI)虽是评估髋关节滑膜炎的金标准,但费用高昂、耗时长且可及性差。超声检查虽便捷、经济、无辐射,但早期炎症改变往往细微,难以肉眼辨别。近年来,深度学习在医学图像分析领域取得突破,影像组学能够从医学图像中提取大量定量特征,捕捉人眼难以分辨的细微变化,二者结合为疾病诊断带来了新的机遇。
材料与方法
本研究为一项前瞻性诊断研究,招募了2024年1月至2025年12月期间就诊于重庆医科大学附属儿童医院的儿科患者。所有入组患者在就诊时均同期接受MRI和髋关节超声检查。研究队列严格依据MRI金标准分为滑膜炎阳性组和阴性组。纳入标准包括年龄≤16岁、存在髋关节疼痛或活动受限等临床症状、临床和影像学资料完整、MRI与超声检查间隔不超过3天。排除标准包括患有其他自身免疫性疾病、依从性差、未签署知情同意书、存在不可逆关节结构损伤证据。为确保研究结果的稳健性和普适性,还从重庆医科大学附属儿童医院宜宾医院前瞻性收集了一个独立的外部验证队列。研究方案经重庆医科大学附属儿童医院伦理委员会批准。
超声检查使用GE Logiq 11和Logiq e超声系统,配备高频线阵探头。患者取标准仰卧位,双脚外旋,操作者将探头置于髂前下棘处获取股骨头上方盂唇-关节囊区域的横断面图像。MRI检查使用GE Discovery MR 750 3.0T系统,扫描序列包括冠状位和轴位T1FSE、T2脂肪抑制FSE及增强扫描。所有MRI图像由两位经验超过10年的放射科医师独立进行双盲评估。
基于收集的髋关节超声图像,由两位资深肌肉骨骼超声医师使用LabelMe软件对关节囊区域进行像素级标注。标注数据集按8:2比例随机分为训练集和验证集。所有图像经标准化后统一调整为512×512像素,并实施了包括随机旋转(±15°)、随机缩放(0.8-1.2倍)、随机水平/垂直翻转、亮度调整(±20%)和对比度变化(±20%)在内的数据增强策略。
模型构建方面,基于YOLO11架构开发了专门用于JIA髋关节超声图像分析的YOLO-JIA模型。训练过程中加入了早停机制以防止过拟合。模型性能主要通过掩码的平均精度均值(mAP50–95(M))进行评价。
使用训练好的YOLO-JIA模型对分组后的超声图像自动进行感兴趣区域(ROI)分割,经人工审核确保分割准确性后,使用PyRadiomics库从验证后的ROI中提取定量特征,涵盖一阶特征、形状特征、灰度共生矩阵(GLCM)特征、灰度尺寸区域矩阵(GLSZM)特征、灰度游程矩阵(GLRLM)特征、相邻灰度色调差矩阵(NGTDM)特征和灰度依赖矩阵(GLDM)特征等。特征选择采用两阶段策略:首先使用方差分析(ANOVA)筛选出组间差异显著(p < 0.05)的特征,然后使用最小绝对收缩和选择算子(LASSO)回归结合10折交叉验证进行降维,并应用“一倍标准误规则”(1-SE规则)确定最优正则化参数λ,从而选择最终特征子集。
基于筛选出的特征,首先在内部训练队列上构建随机森林(RF)分类模型,并在内部验证集上评估其初步性能。随后,使用独立的外部验证队列严格评估模型的泛化能力和稳健性。同时进行决策曲线分析(DCA)以量化模型在一系列有临床意义的风险阈值下的净临床效益。最终,优化后的最终模型被部署为原型系统,以提供实时临床决策支持。
结果
本研究共使用了524张高质量髋关节超声图像,来源于两个前瞻性入组队列:包含150名儿科患者(80名MRI阳性,70名MRI阴性)的主要队列用于模型开发,以及包含60名患者(每组30名)的独立外部验证队列用于测试泛化能力。YOLO-JIA模型成功构建并用于自动分割。从分割出的关节囊区域共提取了1422个影像组学特征。经ANOVA初步筛选后,应用LASSO回归进行降维,最终选出22个关键特征。基于这些特征构建的随机森林分类模型在验证集上表现出良好的诊断性能。最终,优化后的模型被部署为用于实时临床支持的原型。
YOLO-JIA模型在验证集上表现出色:在目标检测任务中精确度达0.98,召回率达1.0;在语义分割任务中,掩码精确度(Precision(M))达1.0,掩码召回率(Recall(M))达0.99;在更严格的mAP50–95(M)评价指标下仍保持0.86的高分。此外,模型处理单张图像仅需约10.46毫秒,显示出显著的临床适用性。不同病例的分割结果显示,YOLO-JIA的自动分割结果与专家手动分割结果高度一致。
在特征选择阶段,绘制了Lambda正则化参数与二项偏差的关系曲线,显示出典型的U形分布。基于此分布特征,应用“1-SE规则”选择了最优Lambda值,从而从1422个原始特征中筛选出22个具有显著判别力的关键特征。聚类热图分析进一步证实了所选特征在诊断JIA方面具有高效的判别能力。
基于特征重要性权重分析,筛选出简洁高效的特征子集用于构建最终的随机森林分类器。模型在内部验证集上表现出优异的诊断性能,受试者工作特征曲线下面积(AUC)达0.88;在独立外部验证集上AUC为0.81,证实了模型在未见数据上保持了判别能力和泛化性。决策曲线分析结果表明,在广泛的阈值概率范围内,使用该模型进行决策的净临床效益持续优于“全部治疗”和“全部不治疗”策略,凸显了其实际临床效用。成功实现了所构建人工智能模型的本地化部署,并开发了髋关节超声AI扫描系统原型(版本1.0)。该系统能够实时处理超声视频流,动态显示AI处理结果并同步输出滑膜炎风险评估,在实际临床扫描环境中验证了所提模型的实时性能和工程可行性。
讨论
本研究整合深度学习与影像组学技术,构建了用于髋关节超声的YOLO-JIA智能检测模型。该模型在验证集上各项指标表现良好,为JIA髋关节滑膜炎的早期诊断提供了高效可靠的辅助工具。该技术结合了超声检查(无创、快速、经济)和人工智能高效分析能力的优势,能够捕捉和量化人眼难以分辨的细微影像学变化,同时克服了传统超声评估中操作者依赖性高、标准成像平面选择困难等问题。此外,该系统处理速度快、操作简单、成本低,适用于基层医疗机构,有助于改善医疗资源配置,推进JIA髋关节滑膜炎分级诊疗体系建设,为临床实践提供可靠的决策支持工具。
YOLO11的轻量级设计避免了复杂结构带来的高计算开销和过拟合风险,显著提高了处理效率。这种在保证精度的同时兼顾速度的架构特性,使其与医学超声图像分析任务高度兼容。本研究将YOLO11架构引入髋关节超声图像分析领域,结果表明实现了关节囊的高精度自动识别。相比之下,同期训练的UNet模型在该特定任务上表现不佳,其交并比(IoU)仅为77.84%,Dice/F1分数为87.54%,精确度0.67,存在分割精度差、边界对齐度低、假阳性率高等问题,且后处理时间长达123.00毫秒,形成效率瓶颈。而本文提出的基于YOLO的模型在所有指标上均接近完美。这种差异主要源于架构适用性:YOLO端到端的检测-分割框架,结合多尺度融合和注意力机制,能够对超声图像中模糊的滑膜边界进行精确定位和分割,从而获得高精度和高效率。
在特征筛选方面,采用了结合ANOVA和LASSO回归的两阶段特征选择策略。ANOVA能够精确识别两组间差异显著的特征子集,有效减少后续建模过程中的特征噪声。LASSO回归通过其L1正则化机制,自动将冗余或不相关特征的系数压缩至零,从而从高度相关的特征集中选择最具代表性的变量。采用10折交叉验证确定最优正则化参数λ,并结合“1-SE规则”以减轻小样本高维数据直接建模带来的过拟合风险。该方法还显著提高了生物医学特征选择的效率和稳定性,有助于更深入地理解髋关节滑膜炎的影像学表现机制。ANOVA和LASSO的联合应用实现了优势互补,避免了仅关注单个特征显著性而忽视特征间相互作用的问题。与单一方法相比,多阶段特征筛选策略更为稳健,并显著提高了超声影像组学特征的稳定性。
为提高影像组学模型的可解释性,对筛选出的22个关键特征进行了病理生理学分析,这些特征可分为四类,分别对应滑膜炎的特定影像学和病理特征。第一类短游程纹理特征,反映局灶性、斑点状回声模式,可能对应微钙化或致密炎性浸润(高灰度级短游程)或微血管增殖和水肿区域(低灰度级短游程),共同指示滑膜组织的微观异质性。第二类区域异质性特征,量化滑膜内回声强度和区域大小的空间变异性,升高值提示活动性炎症、增殖和纤维化区域呈斑片状分布,是炎症活动的影像学标志物。第三类区域尺度和结构特征,提供滑膜受累范围的信息:前者可能提示广泛的滑膜增厚或积液,后者可能反映与慢性疾病相关的融合性纤维化改变。第四类多尺度纹理特征,源自小波变换,捕获特定频率和方向波段上的纹理变化。这些特征共同提供了滑膜炎的多维度定量表征——涵盖局部纹理不规则性、空间异质性、结构范围和多尺度复杂性——从而将模型的决策基于可识别的病理生理学概念,增强了其临床可解释性和可信度。
随机森林算法不仅能有效捕捉多特征间的协同变化,理解特征变量与目标变量之间复杂的非线性关系,而且对特征尺度的变化不敏感。此外,基于基尼系数的重要性评估全面反映了特征在多个决策路径上的综合贡献,为临床应用提供了必要的可解释性支持。值得注意的是,在测试集中,模型显示出较高的灵敏度但相对较低的特异度,在独立应用时可能产生假阳性结果。然而,在临床筛查和早期诊断的背景下,这种权衡是合理的,因为滑膜炎的早期征象往往细微且不典型。高灵敏度确保了低漏诊率,这对于像JIA这样早期干预至关重要的疾病至关重要。假阳性可通过后续评估和随访解决,而漏诊则可能显著延误治疗。因此,将模型定位为“辅助筛查工具”而非确定性诊断工具,其当前性能是可接受的折衷。在未来工作中,为提高特异度,计划通过纳入更多易混淆的阴性样本来扩展和细化标注数据集。
更重要的是,为凸显所提框架的必要性,还构建并系统评估了若干替代模型。基于YOLO的直接二分类模型在检测和分割任务中表现均不佳,其mAP50–95低于0.69,召回率未超过0.84,反映出定位精度不足和假阴性率高的问题。基于UNet的分割分类模型表现更差,IoU低于42.95%,Dice系数不高于60.09%,表明边界定位和像素级分割存在根本缺陷,且后处理时间超过124.70毫秒,无法满足实时要求。基于ResNet152的直接图像分类器虽对异常类实现了高召回率,但对正常类表现出灾难性失败(召回率仅0.10),凸显了严重的类别不平衡和临床不可靠性。这些单阶段或直接分类方法的共同局限性在于其架构难以在保持高精度和平衡类别灵敏度的同时实现实时处理——尤其是在面对超声图像中组织模糊、对比度低和解剖变异性大的挑战时。相比之下,本研究提出的两阶段框架将精确定位/分割与诊断分类解耦,使每个模块都能针对其特定子任务进行优化。这种设计不仅克服了单一模型在分割精度、类别平衡和推理速度方面的缺点,而且建立了一个系统、稳健且临床可行的诊断流程,满足实时需求。此外,本研究开发的两阶段框架已作为集成的髋关节超声AI扫描系统本地部署,建立了从图像采集到实时分析的闭环工作流。该系统支持逐帧可视化分割结果,允许操作者根据解剖学知识实时评估自动勾勒的轮廓,必要时可立即调整扫描技术进行即时校正。该方法显著减少了因分割误差累积带来的分析偏差,从而增强了方法的稳健性及其在临床实践中的可靠性。
需承认本研究存在若干局限性。样本量相对有限,且大部分数据主要来源于单中心。尽管在独立外部中心的初步验证显示了模型的泛化潜力,但JIA是一种高度异质性的疾病,现有样本可能未能完全捕捉这种多样性,且缺乏亚组分析限制了对模型在不同患者特征中性能的深入理解。因此,模型对更广泛真实世界人群的普适性仍需进一步验证。为解决这些局限性,未来的转化策略应采取多维方法,包括在前瞻性队列中进行多中心临床验证以评估真实世界的泛化能力,以及与超声设备制造商合作集成工作流并开发可用性工程解决方案(如软硬件集成或开发具有用户友好界面的独立工作站)等。
结论
本研究成功开发了一种基于深度学习和影像组学的JIA髋关节滑膜炎早期诊断系统,实现了从超声图像自动分割到滑膜炎诊断的端到端技术流程。该系统为早期筛查提供了一种可行的临床工具,有助于提高早期诊断率,降低严重关节损伤风险,并为基层医疗机构提供可靠的筛查手段。这些进展促进了医疗资源的合理配置,改善了JIA的整体管理,并为人工智能在儿科影像中的临床转化提供了有价值的参考。