基线眼动参数与多发性硬化症患者6年随访时的认知处理速度具有前瞻性关联：一项探索性队列研究 Mariano Ruiz-Ortiz, Cecilia García-Cena, Rosa Hernández-Ramírez, Sara Moreno-García, Andrés Labiano-Fontcuberta, Pablo Montabes-Medina, María del álamo-Díez, Diego Enrique Guzmán-Villamarín, Julián Benito-León

《Journal of Clinical Medicine》：Baseline Oculomotor Parameters Are Prospectively Associated with Cognitive Processing Speed at 6-Year Follow-Up in Multiple Sclerosis: An Exploratory Cohort Study Mariano Ruiz-Ortiz, Cecilia García-Cena, Rosa Hernández-Ramírez, Sara Moreno-García, Andrés Labiano-Fontcuberta, Pablo Montabes-Medina, María del álamo-Díez, Diego Enrique Guzmán-Villamarín and Julián Benito-León

【字体：大中小】 时间：2026年05月10日 来源：Journal of Clinical Medicine 2.9

编辑推荐：

　　摘要背景/目的：多发性硬化症（MS）通常会损害信息处理速度，而这一影响并未被传统的残疾评估指标充分反映。眼动研究能够激活在MS中频繁受损的神经回路，可能提供客观的认知相关性指标。我们研究了基线眼动参数是否与大约6年后的处理速度具有前瞻性关联。方法：44

　　摘要背景/目的：多发性硬化症（MS）通常会损害信息处理速度，而这一影响并未被传统的残疾评估指标充分反映。眼动研究能够激活在MS中频繁受损的神经回路，可能提供客观的认知相关性指标。我们研究了基线眼动参数是否与大约6年后的处理速度具有前瞻性关联。方法：44名MS患者接受了标准化的眼动测试（包括视觉引导的扫视、抑制性扫视和正弦平滑追踪）。在平均5.7年后重新评估了符号数字模态测试（SDMT）。计算了30个基线眼动参数与随访SDMT之间的年龄调整后的Spearman偏相关系数，并应用了假发现率（FDR）校正。敏感性分析包括了Cook距离。结果：三个参数通过了FDR校正：反射性扫视持续时间（即，在开始纠正性扫视之前在错误目标位置停留的时间；ρ = ?0.59，q = 0.0011）、追赶性扫视（ρ = ?0.52，q = 0.0055）和反射性扫视潜伏期（ρ = ?0.44，q = 0.033）。即使在排除有影响的观测值后，结果仍然稳定。在多变量分析中（调整后的R2 = 0.60），反射性扫视持续时间和追赶性扫视与较低的SDMT独立相关（p < 0.001和p = 0.019）。结论：基线反射性扫视持续时间和平滑追踪追赶性扫视与前瞻性随访中的较差认知处理速度有关，这表明基于眼动追踪的指标可以作为潜在的客观相关性指标，需要进一步的前瞻性验证。

1. 引言
认知障碍影响了40-70%的多发性硬化症（MS）患者，并是导致失业和生活质量下降的主要因素[1,2]。信息处理速度减慢可以通过符号数字模态测试（SDMT）可靠地检测出来，这是所有疾病亚型中最常见的认知缺陷领域，也是MS临床试验中的主要认知评估指标[3,4,5]。尽管这一指标具有临床意义，但早期识别出未来几年处理速度会降低的患者仍然是一个未满足的需求：EDSS在评估运动障碍方面对认知功能的敏感性较差[6,7]，而MRI病变负担只能解释部分认知差异[8]。眼动研究提供了一个客观的、无创的窗口，可以观察到在MS中经常受损的额顶叶和小脑回路，这些回路与处理速度直接相关[9,10]。横断面研究表明，抑制性扫视潜伏期、错误率和平滑追踪障碍与MS患者的认知表现相关[11,12,13]。抑制性扫视任务需要前额叶的抑制控制——抑制对周围刺激的反射性扫视并产生朝相反方向的自愿运动——涉及背外侧前额叶皮层和额眼区[14,15]。相比之下，平滑追踪任务涉及小脑-顶叶-前额叶的预测系统；当眼睛落后于移动目标时，会生成补偿性扫视，从而量化这种预测机制的失败[16,17]。尽管已有越来越多的横断面证据，但研究单一点时刻记录的眼动参数是否与多年后的认知状态具有前瞻性关联的研究在MS文献中几乎不存在。2025年发表的一项系统综述确认，现有的所有证据均为横断面研究，且没有一个眼动参数被验证为MS认知结果的纵向预测指标[16]。本研究通过对同一队列进行6年的前瞻性随访，解决了这一空白。我们检查了从标准化基线测试中得出的30个眼动参数是否与随访时的SDMT评分具有前瞻性关联，主要使用Spearman偏相关系数进行分析——这是由于大多数眼动变量分布非正态所致，并预先指定了Cook距离诊断方法来量化个别观测值的影响。

2. 材料与方法
2.1. 参与者和研究设计
这项前瞻性纵向队列研究于2018年4月至5月期间，在西班牙马德里的12月12日大学医院门诊神经科连续招募了成人MS患者。所有参与者在基线时（2018年）接受了标准化的眼动测试，并在平均5.7 ± 0.5年的随访后（2024年）接受了临床和神经心理评估。该研究遵循赫尔辛基宣言，并获得了12月12日大学医院伦理委员会的批准（批准代码17/035，批准日期：2017年1月31日）。所有参与者在入组前均获得了书面知情同意。符合条件的参与者年龄在18-70岁之间，并符合2017年McDonald的MS诊断标准[18]。至少一只眼睛的最佳矫正视力≥0.8。排除标准包括：影响眼动或认知功能的非MS神经系统疾病；具有临床意义的眼科疾病（青光眼、黄斑变性或糖尿病视网膜病变）；过去六个月内进行过眼部手术；以及在测试前24小时内使用了已知会显著影响眼动的药物（苯二氮卓类药物或催眠药）。虽然没有正式的精神病学排除标准，但由于2018年未收集基线时的神经心理数据，因此无法衡量情绪和焦虑对眼动表现的影响，也不能完全排除精神共病潜在的混杂因素。24小时的苯二氮卓类药物洗脱期适用于急性或按需使用的情况；长期使用苯二氮卓类药物的患者由负责检查的临床医生酌情处理，而长期使用对该类药物对眼动指标的潜在影响被认为是研究的局限性。
2.2. 临床评估
在两个时间点，都使用了EDSS[6]来评估身体残疾。随访时，使用书面SDMT[3]来评估认知处理速度；使用每日疲劳影响量表（D-FIS）和0-100的视觉模拟疲劳量表[19,20]来评估疲劳影响；使用贝克焦虑量表（BAI）[21]和贝克抑郁量表-II（BDI-II）[22]来评估焦虑和抑郁。基线时的神经心理数据（包括基线SDMT、疲劳、焦虑和抑郁得分）未在2018年收集，这是研究设计的一个公认局限性。
2.3. 眼动协议和数据采集
眼动数据使用一种已验证在临床环境中准确度（<0.4°）和精度（<0.035° RMS）的非侵入式红外视频眼动仪（VOG）系统进行记录[23,24]。在近红外照明下，以100 Hz的频率记录单眼 gaze。参与者坐在距离24英寸显示器60厘米的房间内，头部运动受到下巴和前额支撑的限制。每次测试前都进行了九点校准。进行了四种眼动测试：(i) 在水平平面上，使用±5°、±10°和±20°的阶梯目标进行视觉引导扫视（22次重复），分别计算每种条件下的潜伏期、峰值速度和增益；(ii) 水平抑制性扫视任务（阶梯目标为±5°、±10°和±20°，22次重复），要求参与者看向与目标相反的方向，从而得到抑制性扫视潜伏期（Δt，ms）、反射性扫视潜伏期（ms；从目标出现到开始朝向目标的自愿前向扫视的时间）、反射性扫视持续时间（Δref，ms；在开始自愿纠正性扫视之前在错误目标位置的停留时间——该参数量化了反射性错误在自愿抑制之前的持续时间，与扫视运动持续时间在概念上不同）、错误次数、成功率和校正率；(iii) 水平正弦平滑追踪（刺激频率0.4 Hz，振幅±20°，峰值目标速度约50°/s，三次8秒的试验），从中提取追赶性扫视（当眼睛落后于移动目标时生成的补偿性扫视）、备用扫视、追踪增益和速度误差；(iv) 垂直正弦平滑追踪（参数相同，三次8秒的试验），从中得出相同的变量。每名参与者共计算了30个眼动参数。关于任务设计、信号处理和参数定义的更多技术细节见原始方法学出版物[17]。回顾了所有44名患者的临床记录：没有参与者在2018年记录时有急性核间性眼肌麻痹（INO）的病史或临床显著的眼震。虽然无法完全排除亚临床眼震，但在质量控制过程中没有因此排除任何试验。
2.4. 统计分析
统计分析使用Python 3.12（NumPy、SciPy、pandas）进行。使用Shapiro–Wilk检验来评估数据的正态性。由于30个眼动参数中有26个显示出显著的非正态性（Shapiro–Wilk p < 0.05），因此预指定了Spearman偏相关系数作为主要分析方法——这是基于年龄调整后的秩残差的Pearson相关系数。Pearson偏相关系数在原始尺度上计算，作为次要分析结果报告。对于每个眼动参数，在部分排除基线年龄后的值，计算了与随访SDMT的Spearman偏相关系数。应用Benjamini–Hochberg程序来控制在30次比较中的假发现率（FDR）为5%。对于具有FDR显著预测因子的结果，构建了包含独立预测因子的多变量线性回归模型（在使用Pearson r进行共线性筛选后选择变量；r ≥ 0.69的变量被视为一个集群，并保留生物学解释最清晰的变量）。预先指定了Cook距离作为敏感性分析，以量化个别观测值对主要关联的影响。使用4/n的阈值来标记影响较大的观测值。预指定了三种分析情景：(1) 全样本；(2) 排除超过Cook距离阈值（4/n）的观测值；(3) 进一步排除由IQR规则（Q3 + 1.5 × IQR）标记的预测变量相关观测值。所有分析都是完整案例分析。一名参与者缺少反射性扫视持续时间数据（没有记录有效的纠正性扫视试验），另一名参与者缺少追赶性扫视数据（在质量控制时排除了质量较差的平滑追踪记录），因此相应的分析n = 42；所有主要分析和联合多变量模型都使用了相同的42名患者子集。一名参与者在随访时的SDMT数据缺失，因此被排除在所有分析之外。

3. 结果
3.1. 样本特征
共纳入44名MS患者。表1总结了人口统计和临床特征。基线时，主要疾病亚型为复发缓解型MS（n = 40，90.9%）；中位EDSS为1.5（IQR 1.0–2.6）。平均病程为11.5 ± 8.8年，症状出现时的平均年龄为31.8 ± 7.7岁。随访时（平均5.7 ± 0.5年），有6名患者从复发缓解型MS转变为持续进展型MS（SPMS），导致随访时7名患者被分类为SPMS（15.9%），中位EDSS为2.0（IQR 1.0–3.6）。未预先规定转换组（n = 6）和非转换组（n = 34）之间的基线眼动参数进行比较，且未报告此类比较的结果；由于样本量较小，任何此类比较都缺乏统计效力。随访时的平均SDMT为44.3 ± 9.8（范围13–66）。
3.2. 探索性筛选：随访时与SDMT的Spearman偏相关
图1显示了所有30个基线眼动参数与随访时SDMT之间的年龄调整后的Spearman偏相关系数。三个参数通过了FDR校正（q < 0.05）：反射性扫视持续时间（ρ = ?0.59，p < 0.001，q = 0.0011，n = 42）、追赶性扫视（ρ = ?0.52，p < 0.001，q = 0.0055，n = 42）和反射性扫视潜伏期（ρ = ?0.44，p = 0.003，q = 0.033，n = 42）。没有其他参数在没有通过FDR校正的情况下达到名义显著性（p < 0.05）。表2提供了主要眼动参数的描述性统计信息。图1显示了所有30个基线眼动参数与随访时SDMT之间的Spearman偏相关系数（根据绝对效应大小排序）。带粗茎和q值注释的实心圆表示通过Benjamini–Hochberg FDR校正的三个参数（q < 0.05）。虚线圆表示无关联。所有相关系数都是偏相关的，已部分排除了基线年龄的影响。
3.3. 影响诊断
通过对反射性扫视持续时间对SDMT回归的Cook距离分析（调整年龄后），发现两个观测值的Cook D略超过4/n阈值（Cook’s D = 0.144和0.113；阈值 = 0.095）。这两个观测值的Δref值位于中间范围（232 ms和282 ms，均在主要分布范围内），SDMT值分别为30和28。值得注意的是，反射性眼跳持续时间最长的参与者（1000毫秒，SDMT = 13）并未超过当前数据集中的Cook’s D阈值（Cook’s D = 0.002），因为回归线非常接近这一观察结果。另外还发现了两个反射性眼跳持续时间的IQR异常值（>Q3 + 1.5 × IQR = 467毫秒）：反射性眼跳持续时间分别为1000毫秒（SDMT = 13）和624毫秒（SDMT = 32）。对于追赶性眼跳，没有发现具有高度影响力的观察结果。图中显示了两个预测因子的部分回归图，并标注了Cook’s D异常值（图2）。图2显示了在剔除基线年龄后，两个主要眼动预测因子与6年随访时SDMT之间的部分关联。每个点代表一个患者；回归线（基于残差的OLS）被叠加显示。(A) 反射性眼跳持续时间与经过年龄调整的SDMT残差（Spearman ρ = ?0.59，p < 0.001）。超过Cook’s D阈值的参与者用红色标注。(B) 平稳追踪追赶性眼跳与经过年龄调整的SDMT残差（Spearman ρ = ?0.52，p < 0.001）。该参数没有发现Cook’s D异常值。

3.4 敏感度分析：三种预先指定的排除情景
三种预先指定的情景的结果显示在图3中，并在表3中进行了总结。对于反射性眼跳持续时间，无论是Spearman相关性还是Pearson相关性，在所有三种情景下都显著：全样本（ρ = ?0.59，r = ?0.71）、排除Cook’s D异常值（ρ = ?0.59，r = ?0.74）以及排除IQR异常值（ρ = ?0.54，r = ?0.52；所有p ≤ 0.001）。对于追赶性眼跳，关联同样稳定：ρ的范围从?0.48到?0.52，Pearson r的范围从?0.46到?0.49，所有p ≤ 0.003。因此，这两种关联都是稳健的，并且不依赖于Cook’s距离或IQR诊断方法所识别的具体观察结果。

3.5 多变量回归模型
共线性筛查显示，反射性眼跳持续时间、反射性眼跳潜伏期和抗眼跳错误指标之间存在高度相关（成对Pearson r = 0.69–0.99），形成了一个单独的抗眼跳抑制失败簇。因此，在多变量模型中，反射性眼跳潜伏期没有与反射性眼跳持续时间一起纳入；选择反射性眼跳持续时间为代表变量，因为它在机制上更具解释性（即自愿纠正前的错误注视持续时间）。追赶性眼跳在结构上独立于这一簇（r = 0.21，p = 0.18），并作为独立的预测因子纳入模型。为了可比性，对追赶性眼跳也应用了相同的三种排除情景（全样本、排除反射性眼跳持续时间中的Cook’s D异常值以及排除反射性眼跳持续时间的IQR异常值）。在全样本多变量模型中，结合年龄信息，调整后R2为0.599（n = 42）。两个眼动参数都具有独立的显著性（反射性眼跳持续时间：β = ?0.033，95% CI [?0.046, ?0.021]，p < 0.001；追赶性眼跳：β = ?0.348，95% CI [?0.636, ?0.059]，p = 0.019）。排除Cook’s D异常值后（n = 40），调整后R2为0.449，两个预测因子仍然显著（反射性眼跳持续时间：β = ?0.030，p = 0.004；追赶性眼跳：β = ?0.356，p = 0.019）。排除IQR异常值后（n = 40），调整后R2为0.425，两个预测因子仍然显著（反射性眼跳持续时间：β = ?0.038，p = 0.005；追赶性眼跳：β = ?0.346，p = 0.024）。

3.6 敏感性分析：同时考虑疲劳、焦虑和抑郁的影响
以下敏感性分析探讨了基线眼动参数与随访时SDMT之间的关联是否独立于患者随访时的情绪和疲劳状态。由于疲劳、焦虑和抑郁是在随访时与SDMT同时测量的，因此它们不能作为基线混淆因素。为了评估眼动关联是否独立于患者随访时的情绪和疲劳状态，使用Spearman相关性进行了预先指定的敏感性分析，并同时调整了FIS疲劳得分、BAI和BDI-II。这些协变量与SDMT均无独立关联（疲劳：p = 0.806；BAI：p = 0.223；BDI-II：p = 0.183；个体Pearson r的范围从?0.13到?0.07，所有p > 0.35）。在所有测试组合中，眼动关联基本保持不变：反射性眼跳持续时间（ρ = ?0.591，p < 0.001，q = 0.0011）、追赶性眼跳（ρ = ?0.481，p = 0.001，q = 0.017）和反射性眼跳潜伏期（ρ = ?0.471，p = 0.002，q = 0.017）的FDR显著性均未受影响。在包含年龄、FIS、BAI、BDI-II、反射性眼跳持续时间和追赶性眼跳的扩展多变量回归模型中（n = 42，adj-R2 = 0.588），只有反射性眼跳持续时间（β = ?0.031，p < 0.001）和追赶性眼跳（β = ?0.331，p = 0.029）具有独立显著性，这证实了眼动信号不受同时存在的情绪或疲劳状态的影响。

3.7 随访时的身体残疾、疲劳、焦虑和抑郁
在后续分析中，基线眼动参数与随访结果（而非SDMT）的关联进行了测试。没有眼动参数在扩展残疾状态量表（EDSS）的变化（ΔEDSS）、疲劳（D-FIS和视觉类比疲劳量表）、焦虑或抑郁的FDR校正后仍然显著（所有q > 0.35）。对于EDSS，仅观察到一个名义上的显著关联：水平平稳追踪速度误差（ρ = 0.41，p = 0.006，q = 0.35，已调整年龄和基线EDSS），但该关联未能通过FDR校正。由于缺乏2018年的基线测量数据，因此无法进一步推断变化分数。

4. 讨论
这项前瞻性6年研究的主要发现是，基线时记录的两个眼动参数与随访时的认知处理速度独立相关：抗眼跳任务中的反射性眼跳持续时间和水平正弦波平稳追踪过程中的追赶性眼跳。这两个参数都通过了FDR校正，在联合多变量模型中保持独立关联（调整后R2 = 0.60），并且在预先指定的Cook’s距离、IQR和同时共变量敏感性分析中都表现稳健。相比之下，基线EDSS与随访时的SDMT无关联（r = ?0.21，p = 0.17），这证实了眼动参数捕获了传统残疾指标中未编码的信息。当小脑-顶叶-前额叶预测系统无法维持移动目标的速度时，会产生追赶性眼跳，这些眼跳用于防止视网膜过度滑动[25,26]。先前的研究表明，多发性硬化症（MS）患者的追赶性眼跳数量比健康对照组更高[17]，并且与EDSS的横断面关联结果并不一致[17,26]。当前的研究结果从纵向角度进一步验证了这一点：基线时的追赶性眼跳数量与六年后的认知处理速度降低独立相关。这种生物学联系可能表明，追赶性眼跳反映了小脑预测编码的失败，而小脑对认知功能（尤其是处理速度和时间预测）的贡献在MS中越来越受到重视[27,28,29]。如结果所示，基线EDSS与随访时的SDMT无关（未调整的Spearman ρ = ?0.21，p = 0.17），这证实了眼动参数捕获了传统残疾指标中未编码的信息。

抗眼跳反射性眼跳持续时间反映了眼睛在开始自愿纠正动作之前停留在错误目标位置的时间长度——这是前额叶抑制失败时间深度的直接指标[14,15,24]。它与随访时SDMT的关联在生物学上是有意义的：这两个参数都反映了MS中常见受损的前额叶-顶叶网络的处理效率。敏感性分析进一步增强了这种关联的可靠性。首先，当排除两个IQR异常值（反射性眼跳持续时间最长的参与者（1000毫秒，SDMT = 13）和第二个极端情况（624毫秒，SDMT = 32）后，Spearman相关性仍然为ρ = ?0.54（p = 0.0003），Pearson r = ?0.52（p = 0.0006）。Cook’s距离分析表明，这些极端观察值实际上并未主导这种关联：Δref = 1000毫秒的参与者的Cook’s D为0.002（远低于0.095的阈值），因为他们的SDMT（13）几乎落在回归线上。略微超出Cook’s D阈值的两个观察值（索引10和16）具有中等的Δref值（232和282毫秒），并不属于明显的异常值——它们的显著性来自于中等残差和略微升高的hat值组合。此外，即使同时调整了随访时的疲劳、焦虑和抑郁，这种关联仍然存在（这些因素与SDMT的关联均不显著），这证实了眼动信号并不代表评估时的患者情绪状态。

尽管存在这些限制，本研究似乎是首批证明多发性硬化症患者多年间眼动参数与认知处理速度存在纵向关联的研究之一。这两个眼动参数可以在标准临床检查中非侵入性地测量，支持将它们作为MS认知处理速度的候选客观指标[30]。这些发现更应被视为假设生成性的：在没有基线认知数据的情况下，这些关联不能直接等同于认知衰退的预测，需要在更大、独立的队列中进行复制，以验证其普遍性。如果得到证实，眼动筛查可能有助于识别需要更密切神经心理监测的患者；然而，临床应用需要在前瞻性设计且具有足够样本量的研究中证明其预测有效性。

热点排行