《Neuroradiology》:An automated quantitative report for multiple sclerosis using only 3D T2-fluid-attenuated inversion recovery MRI
编辑推荐:
目的:量化多发性硬化(MS)影像生物标志物(Imaging Biomarkers, QIB)的自动化工具常需非常规MRI序列且缺乏MS参照数据。研究人员开发了一款开源定量报告(QReport),整合已验证的3D T2-液体衰减反转恢复(3D T2-FLAIR)
目的:量化多发性硬化(MS)影像生物标志物(Imaging Biomarkers, QIB)的自动化工具常需非常规MRI序列且缺乏MS参照数据。研究人员开发了一款开源定量报告(QReport),整合已验证的3D T2-液体衰减反转恢复(3D T2-FLAIR)量化方法与多中心MS及健康人(HC)参照模型,并以结构化图形报告呈现结果,以支持临床相关生物标志物的情境化判读。方法:回顾性收集来自MS磁共振成像(MAGNIMS)协作组及附属站点与开源数据集的2516例横断面3D T2-FLAIR扫描,受试者包括MS患者(pwMS)与健康对照(HC)。采用已验证的基于T2-FLAIR算法量化总病灶数目(LC)、区域病灶数目、病灶体积(LV)、全脑体积(BV)及脑年龄差距估计(BrainAGE)。通过分位数回归估计pwMS与HC的分布。设计QReport以图形格式呈现生物标志物及参照模型。由4名神经放射科医师在22例病例中评估QReport输出与目视评估的一致性及其实用性。结果:分析来自14个中心的1723例HC(年龄均值±标准差:54.5±16.0岁;范围18–75岁;女/男:949/774)与793例pwMS(年龄均值±标准差:43.0±11.1岁;范围18–75岁;女/男:538/255)。QReport将单个受试者的测量值对照pwMS与HC的第95、50及5百分位分布进行情境化展示,并包含BrainAGE。94%的评估中QReport输出与目视评估呈中度至完全一致,82%被评为有用。结论:研究人员开发了仅需3D T2-FLAIR输入的MS QReport,整合已验证量化算法并在临床可解释的框架内纳入BrainAGE。
论文解读:基于仅3D T2-FLAIR MRI的多发性硬化自动定量报告(QReport)研究
研究背景与立项依据
目前用于量化多发性硬化(Multiple Sclerosis, MS)影像生物标志物(Quantitative Imaging Biomarkers, QIB)的自动化放射学报告工具在临床实践中普及度有限,主要存在两方面障碍:其一,现有商业化MS定量报告(Quantitative Report, QReport)通常要求同时输入非增强三维T1加权(3D T1-weighted, T1-w)序列和T2-液体衰减反转恢复(3D T2-Fluid-Attenuated Inversion Recovery, 3D T2-FLAIR)序列,而临床常规MS MRI指南并不推荐加扫非增强T1-w序列,修改协议会增加扫描时间和成本;其二,现有工具缺乏MS患者(pwMS)特异的参考模型,仅提供健康对照(Healthy Control, HC)参考,而MS特异性参考模型在解释疾病严重度和预测进展方面优于单纯HC模型。此外,终端用户调研明确推荐开发仅需3D T2-FLAIR输入的工具,并要求在报告中纳入MS及HC双参考人群以辅助QIB解读。为此,研究人员遵循定量神经放射学倡议(Quantitative Neuroradiology Initiative, QNI)框架,开发了仅依赖3D T2-FLAIR、整合已验证单模态算法及MS/HC双参考模型的MS定量报告,并通过多中心神经放射科医师盲法评审完成QNI框架要求的"可信度研究(Credibility Study)"初步临床验证。本文发表于《Neuroradiology》。
主要关键技术方法概述
研究人员回顾性收集来自14个中心(MAGNIMS协作组及附属站点)和开源数据集(NIFD、MPI、ADNI、EPAD)共2516例横断面3D T2-FLAIR扫描,含1723例HC(18–75岁)和793例MS患者(复发缓解型、原发进展型及继发进展型,符合McDonald诊断标准)。全自动处理流程为:①病灶分割采用经MS验证的nicMSlesions仅基于3D T2-FLAIR进行颅骨剥离及病灶分割;②脑组织的分割先做N4偏置场校正与基于补丁的病灶填充(Lesion Filling),再用T2-FLAIR专用脑分割工具(Geodesic Information Flows, GIF v2)行脑组织分割并配准Desikan-Killiany-Tourville(DKT)图谱分区;③计算全颅内容积(Total Intracranial Volume, TIV=白质+灰质+脑脊液容积),脑实质分数(Brain Parenchymal Fraction, BPF)=(脑实质容积即白质+灰质)/TIV;④按同心带法将病灶归类为皮质灰质(Cortical Grey Matter, CGM)、近皮质、深部白质(Deep White Matter, DWM)、脑室周围、小脑、脑干、深部灰质(Deep Grey Matter, DGM)、白质-皮质(Leukocortical)及跨区域(Cross-regional);⑤多中心数据用ComBat经验贝叶斯法校正扫描仪效应;⑥用线性分位数回归建立年龄和性别校正的HC及pwMS参照曲线(第5、50、95百分位);⑦脑年龄差距估计(Brain Age Gap Estimation, BrainAGE)采用已验证的基于T2-FLAIR模型(平均绝对误差MAE=3.08年)。QReport以图形化呈现分割掩膜、总/区域病灶计数(LC)与体积(LV)、BPF、区域脑体积(BV)及BrainAGE,并叠加MS与HC参考分布。可信度研究由4名独立神经放射科医师对22例(17例MS、5例HC)盲法评估QReport各组件与目视读片的一致性(3级Likert)及实用性,用Gwet's一致性系数(Agreement Coefficient, AC)评价评分者间信度。
研究结果
HC队列(HC cohort)
纳入1723例HC,年龄54.5±16.0岁(18–75岁),女949例/男774例,扫描时间2013–2022年,来自多中心及多开源数据集,作为构建HC参考分布的基础人群。
MS队列(MS cohort)
纳入793例pwMS,年龄43.0±11.1岁(18–75岁),女538例/男255例,涵盖RRMS、PPMS、SPMS表型,扫描时间2017–2021年,来自英国国家神经病学与神经外科医院单中心多台 scanners(不同场强及协议),经ComBat校正后用于构建MS参考分布。
The MS QReport
QReport在页眉显示人口学信息;自动选取病灶负荷最大的解剖层面叠加分割掩膜(红=病灶,绿=CGM,紫=DGM);绘制各方位线每层的病灶体素累积曲线以保留三维信息;总病灶体积(Total Lesion Volume, TLV)和BPF以图表对照性别校正的HC及MS参考分布(各年龄层pwMS的LV第50百分位高于HC,45岁后HC第95百分位可超过MS第50百分位;MS的BPF参考曲线全程低于HC);区域脑体积用动画渲染并以相对于HC的年龄性别校正百分位颜色编码(对数色阶突出低百分位);BrainAGE用表盘显示预测脑龄与实足年龄之差(预测>实足→红色,反之→绿色)。示例显示同一TLV在不同年龄参照背景下临床意义不同——50岁MS患者TLV超HC第95百分位及MS第50百分位且BrainAGE+25年、BPF达MS第5百分位、丘脑体积处于HC最低百分位,提示病理性偏离;75岁HC相似TLV仅位于HC第50–95百分位、BrainAGE≈0、BPF及区域BV接近或高于HC第50百分位,属年龄相关性改变。
QReport credibility study(QReport可信度研究)
共纳入22例(17 MS+5 HC),4名医师独立评估产生88条评价。总体94%的评价达中度至完全一致(其中60%为完全一致)。全局指标一致性最高:TLV、BPF、CGM掩膜及BrainAGE>80%评价为中度或完全一致(部分组件100%达2级及以上),病灶掩膜93%中度至完全一致(61%为完全一致)。区域指标多为中度一致:区域LV 81%、DGM掩膜94%、区域BV 90%达中度至完全一致。Gwet's AC2介于0.52(区域BV)~0.86(BPF,95%CI:0.78–0.95)之间(均p<0.001),TLV的AC2=0.80(95%CI:0.71–0.90)。整体82%的评价认为QReport有用,其中TLV估算及可视化97%认为有用(MS病例100%),BPF及BrainAGE 96%认为有用;区域LV及BV约50%认为有用(即便最高一致性下仍有半数评"无用",反映临床对区域细微定量价值的保留态度)。
讨论与结论翻译
研究人员开发了整合已验证3D T2-FLAIR量化算法及MS/HC双参考模型的开源MS定量报告,符合临床用户需求与影像指南,仅需常规检查序列。大样本多中心异质数据构建的通用参照曲线使QIB获得年龄性别校正的情境化解读。初步可信度研究显示QReport输出与专家目视评估中度至完全一致占94%,82%认为具临床实用性,其中全局标志物(TLV、BPF、BrainAGE)一致性与有用性最高。区域量化一致性略低,可能源于FLAIR单模态分区算法局限及自动3D分区与医师2D目视习惯的差异,需配合结构化培训。局限性包括开源队列族裔代表性不足、可信度研究样本量较小及MS参考队列为单中心(已做ComBat校正),未来将开展纵向版QReport及更大规模准确性研究。结论:研究人员构建了仅需3D T2-FLAIR输入、开源、整合MS及HC参照模型并含BrainAGE的临床适用MS定量报告(QReport),经多中心独立神经放射科医师评审证实其与常规目视评估具高一致性与临床有用性。