
-
生物通官微
陪你抓住生命科技
跳动的脉搏
专家方法和自动化方法在新多发性硬化病灶检测中的表现:来自MSSeg2挑战赛的见解
《Scientific Reports》:Performances of experts and automated methods on new multiple sclerosis lesions detection: insights from the MSSeg2 challenge
【字体: 大 中 小 】 时间:2026年05月22日 来源:Scientific Reports 3.9
编辑推荐:
摘要对新发多发性硬化症(MS)病变的评估是一项耗时且困难的任务,可能会导致对患者疾病活动度的低估。因此,开发高效的方法来检测新的T2/FLAIR病变对于辅助临床医生完成这一过程至关重要。在此背景下,我们在2021年组织了MSSeg2挑战赛,旨在比较各种检测新发MS病变的方法。为此
对新发多发性硬化症(MS)病变的评估是一项耗时且困难的任务,可能会导致对患者疾病活动度的低估。因此,开发高效的方法来检测新的T2/FLAIR病变对于辅助临床医生完成这一过程至关重要。在此背景下,我们在2021年组织了MSSeg2挑战赛,旨在比较各种检测新发MS病变的方法。为此,我们构建了一个高质量的数据集,包含100对FLAIR MRI图像,这些图像中新发MS病变的大小均超过3毫米(^3)。从这些来自不同扫描仪和法国临床中心的100对MS患者图像中,有40对在参赛者提交他们的方法之前被分享给了他们。共有24个国际团队的30种方法被提交,并在FLI-IAM专用平台上对剩余的60张图像进行了评估。总体而言,我们发现即使在病变层面,专家的标注结果也存在差异(40%的病变仅由两位或更少的专家进行了标注)。最佳专家的平均F1分数为0.679(标准差=0.345),而最佳方法的平均F1分数为0.698(标准差=0.295),这些方法用于评估35名新发病变的患者。此外,我们没有发现排名靠前的方法与最佳专家在F1分数评估结果上存在显著差异(9种方法在平均F1分数上没有显示出明显差异)。同样,我们也没有发现排名靠前的方法与最佳专家在将患者分类为三个临床相关类别(0个病变、1个或2个病变以及>2个病变)方面的表现存在差异(21种方法在表现上没有显示出明显差异,最佳专家和最佳方法的分类准确率均为85%)。尽管当前自动化方法的结果仍有改进空间,但我们的研究结果突显了它们在检测新发FLAIR MS病变方面的潜在实用性。