《Psychophysiology》:How to Improve the Reliability of Aperiodic Parameter Estimates in M/EEG: A Method Comparison
编辑推荐:
本文旨在探讨如何提升脑磁图/脑电图(M/EEG)功率谱中非周期(1/f)参数估计的可靠性。针对当前流行的fooof(specparam)工具箱在提取窄带周期峰时,其数量用户可控所导致的估计变异性、对噪声敏感及可靠性降低等问题,研究人员比较了包括谱估计方法、峰数量设置等多种分析选择,并提出了一种理论驱动的“审查回归”新方法,即在所有频谱中固定移除预期含周期活动的频段再进行回归。研究表明,允许提取更多峰会降低截距和斜率的可靠性,而审查回归法在避免过拟合的同时,提供了比fooof更可靠、稳健的估计,为相关领域的方法学选择提供了重要参考。
大脑的电活动不仅包含我们熟知的、有节奏的“脑波”(如alpha波、beta波),还包含一种无处不在的、看似杂乱的“背景噪声”。这种背景活动在频域上展现出一种独特的模式:功率随着频率的升高而下降,遵循着1/fx的幂律形式。这就是所谓的宽带非周期活动。在过去,这类活动常被视为无意义的噪音而被忽略。然而,近年来科学家们发现,它远非噪音那么简单——它的形态参数(斜率和截距)会随着衰老、临床状态(如多动症)、睡眠乃至认知任务的难度而发生系统性变化,甚至被认为与大脑皮层下神经环路中兴奋性与抑制性输入的平衡有关。这使它一跃成为理解大脑功能与失调的新窗口。
对非周期活动日益增长的兴趣,很大程度上得益于能够将其与窄带周期振荡分离开并进行参数化的方法学进展。其中,fooof(现更名为specparam)工具箱尤为流行。它通过数据驱动的方式检测并拟合频谱中的周期峰(如alpha峰),将其扣除后,再对剩余的“平坦化”频谱进行对数-对数空间下的线性回归,从而得到非周期成分的斜率和截距估计。然而,fooof需要用户设置一些关键参数,特别是允许算法检测的周期峰的最大数量。虽然这增加了分析的灵活性,但检测到的峰数量在不同试次、通道或个体间的变异性,可能会增加对噪声的敏感性,反而降低非周期参数估计的可靠性,最终削弱整个分析流程的统计效力。那么,不同的分析方法选择(如谱估计方法、允许拟合的峰数量)究竟如何影响参数估计的质量?是否存在更优的替代方案?
为了解答这些问题,一项发表在《Psychophysiology》上的研究开展了一项系统性的方法学比较。研究人员使用了两个不同的数据集:一个静息态(睁眼/闭眼)数据集和一个基于多模态停止信号任务的数据集。他们比较了两种常见的谱估计方法(快速傅里叶变换FFT和Welch法),以及多种非周期参数估计方法,包括:允许拟合0、1、3个周期峰的fooof模型(分别记为fooof0、fooof1、fooof3),以及对整个频谱进行回归的“全回归”法,还有他们新提出的“审查回归”法。审查回归法的核心思想是,基于大量前人研究,在清醒状态下头皮记录的周期活动主要集中在theta-alpha-beta频段(如6-16 Hz)。因此,该方法在研究内部固定地从所有频谱中移除这一频段的数据点,仅对剩余频段的功率值进行回归,从而获得非周期参数估计。这样做保证了不同条件、个体间用于估计的数据点是一致的。
研究从几个关键指标评估了这些方法的优劣:1) 产生生理学上不可信的正斜率值(异常值)的频率;2) 非周期参数估计的内部一致性(奇偶试次可靠性);3) 检测已知或预期实验效应的能力(效应量大小)。值得注意的是,研究者特意没有将模型对频谱的“拟合优度”作为核心指标,因为更复杂的模型(如拟合更多峰)天然会有更高的拟合度,但这可能是以过拟合噪声为代价的。
关键技术方法概览:本研究使用了两个独立的数据集,包括静息态(睁/闭眼)和任务态(多模态停止信号任务)脑电数据。核心分析涉及对预处理后的脑电数据进行谱估计(采用FFT和Welch两种方法),并在对数-对数转换后的功率谱上,应用一系列参数估计方法(包括不同设置的fooof算法、全回归法及新提出的审查回归法)来提取非周期成分的斜率和截距。最后,通过非参数统计方法(如置换检验、自助法)比较了各方法在异常值产生率、内部一致性信度及效应量大小等方面的表现。
研究结果:
3.1 描述性统计
不同方法产生的斜率和截距均值略有差异,但重构的非周期谱总体上具有可比性。值得注意的是,某些分析方法产生了正斜率的极端值。
3.2 异常值(不可信值)的出现频率
在静息态和任务态数据中,fooof1和fooof3方法产生了最高比例的正斜率值,这表明这些方法可能错误估计了真实的斜率。在排除了确实由正向频谱(如肌电噪声污染)导致的正斜率后,除fooof1和fooof3外,其他方法的异常值大幅减少。审查回归法在此指标上表现稳健。
3.3 可靠性(内部一致性)
- •
3.3.1 静息态:对于斜率,FFT结合全回归或fooof0产生了最高的奇偶可靠性(>0.9),其次是审查回归。在fooof模型中,允许拟合更多峰(1个或3个)会显著降低斜率和截距的内部一致性。要达到超过0.9的可靠性,非fooof回归方法(包括审查回归)约需30-40个试次,而fooof1或fooof3则需要超过60个试次。
- •
3.3.2 停止信号任务:结果模式与静息态类似。Welch结合全回归、fooof0和审查回归通常产生最高的可靠性,而fooof1和fooof3表现最差。要达到高可靠性,fooof1和fooof3(尤其是结合FFT时)所需的试次数远多于其他方法。
3.4 实验情境下的效应量估计
- •
3.4.1 静息态:
- •
年龄效应:在闭眼条件下,预期中年龄增长伴随频谱平坦化(斜率负值减小)的相关在fooof3和fooof1中效应量最大,审查回归次之。开眼条件下多数方法未发现显著相关。分析发现,fooof1常常会漏检alpha活动而去拟合其他峰(如beta),而fooof3检测到alpha峰的概率更高,这可能意味着fooof1的估计仍受到未扣除的alpha活动污染。
- •
睁闭眼效应:基于前人研究,闭眼状态因缺乏主动视觉处理可能与更强的抑制(更陡的频谱/更负的斜率)相关。全回归、审查回归和fooof0均发现了这一预期模式(闭眼斜率更负)。然而,fooof1和fooof3(去除正斜率后)却显示了相反的模式(开眼斜率更负)。头皮地形图显示,fooof1/3的差异分布与alpha活动类似,而审查回归的差异则更偏向前部,提示fooof1/3的结果可能受到残留alpha活动的混淆,且这种混淆在不同条件下扣除alpha峰的概率不同所致。
- •
3.4.2 停止信号任务:
研究比较了行为上最困难(听觉-视觉停止信号)与最不困难(视觉-视觉停止信号)试次间,刺激呈现前时间窗的频谱斜率差异。预期高需求条件伴随更负的斜率(更陡的频谱)。结果发现,审查回归法检测到了最大的效应量,而允许拟合多个峰的fooof方法效应量明显下降。完全不扣除周期活动的方法(fooof0和全回归)效应量最小。
研究结论与讨论:
本研究系统评估了提升M/EEG非周期参数估计可靠性的不同方法。核心结论是:虽然fooof工具能够产生一致性中等至较高的估计,但其数据驱动、包含多个自由参数(如允许拟合的峰数量)的拟合过程是一把双刃剑。在提高对数据(可能包含噪声)拟合度的同时,也增加了估计的变异性,从而降低了参数的内部一致性可靠性,增加了产生异常值的风险,并削弱了对感兴趣效应的检测能力。研究明确显示,允许算法选择更多的峰会损害这些指标。
作为解决方案,研究者提出的“审查回归”法通过理论驱动,固定移除可能包含周期活动的频段,然后进行回归,能够在避免过拟合的前提下,提供比fooof更可靠、更稳健的非周期参数估计。有趣的是,完全忽略周期活动影响的“全回归”法在一些指标上也表现良好,但它在检测真实实验效应(如任务难度效应)时表现不佳,表明适当的周期活动排除对于获得纯净、有效的非周期参数估计仍是必要的。
这些发现对认知神经科学领域具有重要的实践意义。随着对非周期活动研究的深入,确保其参数估计的可靠性至关重要。本研究强调,在使用fooof等方法时,必须审慎设置其参数,特别是允许拟合的最大峰数量。盲目追求模型对原始频谱的拟合度可能导致误导性的结果。相比之下,审查回归法提供了一种简单、透明、跨个体和条件一致的分析策略,尤其适用于关注非周期成分自身、且期望获得高可靠性估计的相关研究与个体差异研究,为领域内的方法学最佳实践提供了新的重要选择。