《Ophthalmology Science》:Quantitative Analysis of Retinal Fluid by a Deep Learning Model in Uveitic Macular Edema
编辑推荐:
目的:评估人工智能(AI)衍生的液体积是否在葡萄膜炎性黄斑水肿(UME)中可为视力结局提供预后价值,并比较模型表现与仅使用中心黄斑厚度(CMT)测量的差异。设计:对“一线抗代谢药物作为类固醇节省治疗”(FAST)临床试验中UME患者的二次亚分析,采用在年龄相关
目的:评估人工智能(AI)衍生的液体积是否在葡萄膜炎性黄斑水肿(UME)中可为视力结局提供预后价值,并比较模型表现与仅使用中心黄斑厚度(CMT)测量的差异。设计:对“一线抗代谢药物作为类固醇节省治疗”(FAST)临床试验中UME患者的二次亚分析,采用在年龄相关性黄斑变性(AMD)及视网膜静脉阻塞(RVO)患者上训练的深度学习分割模型。参与者:来自FAST葡萄膜炎试验的非感染性葡萄膜炎继发UME患者。方法:使用RETOUCH数据集训练的二维U-Net模型,对Heidelberg Spectralis光学相干断层扫描(OCT)图像进行IRF与SRF分割。模型性能通过与二元液体分级结果比对验证。线性混合效应模型评估治疗期间液体消退情况。似然比检验与留一受试者交叉验证评估基线IRF和SRF体积是否较仅用CMT改善视力变化模型的拟合度。主要结局指标:分割准确率、液体体积与视力相关性,以及视力变化与基线液体体积及CMT(对比仅CMT)的关联。结果:模型在RETOUCH数据集上IRF的Dice评分为0.61,SRF为0.74。在FAST数据集中,液体分割与二元分级显著相关(点二列相关:IRF 0.39,SRF 0.63;Mann–Whitney U检验:IRF与SRF P < 0.01)。纵向液体建模未显示两组间IRF或SRF消退的显著差异。然而,在建模视力变化时,基线IRF体积与治疗分组存在显著交互作用(P = 0.02),提示基线IRF与甲氨蝶呤组较差结局的关联强于霉酚酸酯组。似然比检验证实加入IRF与SRF改善了仅含CMT模型的拟合(P < 0.01),但留一受试者交叉验证显示预测误差差异小且不显著。结论:AI驱动的IRF与SRF分割可在UME中实现定量液体测量,并可能较单纯CMT提供额外的视力变化预后信息,尽管尚需更大样本验证其普适性。这些发现支持将AI液体分析整合入临床工作流程,并建议未来临床试验考虑基于AI分析的基线液体特征进行分层。
研究背景方面,眼科人工智能(AI)已在光学相干断层扫描(OCT)图像分析中广泛应用,可自动识别视网膜生物标志物,但这些模型多在常见疾病如年龄相关性黄斑变性(AMD)和视网膜静脉阻塞(RVO)中开发与验证。非感染性葡萄膜炎常用抗代谢药物实现类固醇节省治疗,其中甲氨蝶呤与霉酚酸酯是首选药物。FAST葡萄膜炎试验旨在比较二者的疗效,并在所有访视采集黄斑OCT图像以评估黄斑水肿。然而,目前AI在葡萄膜炎人群中的应用有限,且中心黄斑厚度(CMT)虽常作为视力与疾病活动的预后因子,但在不同疾病队列中其相关性不稳定。因此,研究人员希望验证在AMD和RVO训练的AI液体分割模型能否在UME中提供超越CMT的预后信息。
关键技术方法方面,研究人员采用RETOUCH数据集训练二维U-Net模型,对Heidelberg Spectralis OCT图像进行IRF与SRF分割。模型训练使用PyTorch与MONAI框架,结合Dice损失与交叉熵优化,采用AdamW优化器及学习率调度策略。外部验证在FAST葡萄膜炎试验队列中进行,该队列为非感染性中间、后或全葡萄膜炎患者,随机接受甲氨蝶呤或霉酚酸酯治疗,并在基线和治疗6个月内定期行OCT检查。研究人员通过二元液体分级、点二列相关及Mann–Whitney U检验评估分割结果与人工分级的一致性,并使用线性混合效应模型分析液体体积变化及与视力变化的关联,辅以似然比检验与留一受试者交叉验证评估模型增量价值。
研究结果方面,模型在RETOUCH数据集上的Dice评分分别为IRF 0.61、SRF 0.74、PED 0.61,且在独立验证集上Fleiss’ kappa均超过0.6,显示较高内部一致性。在FAST队列中,AI分割的IRF与SRF体积与二元分级显著相关,并与CMT呈中度至强相关。纵向分析显示,甲氨蝶呤与霉酚酸酯在6个月内对IRF与SRF的消退效果无显著差异。然而,在视力变化模型中,基线IRF体积与治疗分组存在显著交互作用(P = 0.02),即在甲氨蝶呤组中基线IRF越高,视力结局越差,而霉酚酸酯组未见此趋势。似然比检验表明,加入IRF与SRF显著改善仅含CMT模型的拟合(P < 0.01),但交叉验证中预测误差的差异不显著。
讨论与结论部分指出,该研究首次将AI液体分割模型应用于UME,证明跨病种迁移的可行性,并在预后评估中提供了超越CMT的信息。虽然CMT仍是重要指标,但AI分割可区分IRF与SRF,揭示二者在不同治疗下的异质性影响。这一发现提示未来UME临床试验可采用AI液体分析进行基线分层,提高试验效能并减少结果变异。研究人员同时指出本研究的局限,包括模型未在葡萄膜炎数据上专门训练、样本量较小及数据缺失假设可能影响结果推广。总体而言,AI驱动的视网膜液体定量分析为UME的结构评估与功能预后提供了更精细的工具,有望在临床与研究场景中获得广泛应用。