青少年特发性脊柱侧弯(AIS)是一种复杂的三维脊柱畸形,主要影响处于生长高峰期的青少年[1]。流行病学研究表明,男性患病率约为2.2%,女性约为4.8%[2]。如果不及时发现和管理,AIS可能会发展成长期并发症,如心肺功能受损和慢性背痛。因此,早期发现、定期监测和及时干预对于有效管理至关重要。这里的“早期发现”指的是在青少年生长关键期(10-18岁)通过无辐射筛查方法识别出疑似脊柱侧弯病例,这发生在出现明显症状或临床咨询之前。这个定义强调了“早期”的两个关键维度:时间上的早期性:在保守治疗(例如支具)最有效的治疗窗口期内发现脊柱侧弯,以免曲线发展到需要手术的程度;路径上的早期性:作为主要的筛查层,从背部表面图像中捕捉早期形态标志,并识别出需要转诊给专家进行评估的个体。筛查阈值基于可见表面不对称性和躯干旋转角度(ATR)≥5°,这是临床推荐进一步放射学评估的标准[3]。与依赖Cobb角测量进行严重程度分类的放射学诊断不同,我们的基于视觉的方法侧重于二分类(正常/疑似异常)。这一策略旨在最大化人群覆盖率,并在健康青少年中减少不必要的辐射暴露,同时促进及时转诊进行保守治疗。
传统的脊柱侧弯筛查依赖于由训练有素的专家在临床环境中进行的放射学成像。然而,反复暴露于电离辐射存在潜在的健康风险[4],而且对临床资源的依赖限制了这种方法在人群层面筛查的可扩展性。因此,需要开发安全、无创、可重复且可扩展的脊柱侧弯筛查解决方案,特别是适合青少年的解决方案。
深度学习因其强大的非线性特征提取和模式识别能力,已成为医学成像领域的变革性工具[5]、[6]、[7]。它在自动化诊断方面取得了突破,应用于各种领域,包括眼科疾病检测[8]、面部表型分析[9]以及从视网膜图像中预测心血管风险[10]。在脊柱侧弯的背景下,应用于背部表面图像的深度学习消除了对电离辐射的需求,并支持频繁的大规模筛查。此外,轻量级网络架构允许在移动设备上部署,便于在家自我检查和长期监测。
尽管取得了令人鼓舞的进展,但基于背部图像的脊柱侧弯检测仍面临几个技术挑战:
(1) 多尺度复杂性:脊柱侧弯表现在局部(例如肌肉不对称)和全局(例如脊柱弯曲)特征上,使用传统的CNN进行全面的特征提取非常困难。
(2) 局部-全局整合:现有方法难以有效地结合细粒度纹理和整体结构信息,限制了诊断性能。
(3) 计算开销:深度、高容量的模型虽然提高了准确性,但增加了计算成本,阻碍了实时和移动设备的部署。
为了解决这些限制,我们提出了LMScoliosis-Net,这是一种专为从背部图像检测脊柱侧弯而设计的轻量级多尺度空间感知网络,它整合了一个轻量级的多分支模块,利用深度可分离卷积和幽灵卷积实现高效的多尺度特征提取,参数减少了77%;一个全局窗口变换器模块用于建模长距离空间依赖性,并补充基于CNN的局部特征;以及一个嵌入在反向残差块中的动态重建增强模块,以细化解剖表示并促进跨层次的语义融合。
本文的主要贡献总结如下:
(1) 我们开发了一个轻量级的分类网络LMScoliosis-Net,用于使用裸露的背部图像进行脊柱侧弯的早期和非侵入性检测。该网络在高筛查准确性和低计算成本之间取得了平衡,适用于资源受限的医疗环境。
(2) 我们开发了一个局部-全局多尺度特征增强模块,以实现高效的多尺度特征提取和关键信息增强。为了在同一层上更有效地提取特征,我们设计了一个目标导向的轻量级多分支块。还引入了一个全局窗口变换器补充块,以在不同层次上提取特征,有效捕捉多尺度信息而不增加推理时间。此外,还加入了一个动态重建增强模块,以进一步整合全局信息,增强关键特征的表示,并促进跨层次特征的有效融合,从而缓解不同特征层次之间的语义差异。
(3) 该模型的性能通过在背部图像数据集以及脑肿瘤分类数据集[11]上进行了验证。实验结果表明,LMScoliosis-Net在脊柱侧弯检测和多任务医学图像分类方面表现出优异的分类性能、鲁棒性和泛化能力。此外,其轻量级设计使其非常适合在移动设备上部署。
本文的其余部分组织如下:第2节回顾相关工作。第3节介绍所提出的架构。第4节讨论实验设置和结果。第5节探讨模型的泛化能力。第6节总结本文。