《PLOS Computational Biology》:Benchmarking spike source localization algorithms in high density probes
编辑推荐:
本综述首次对常用的神经元峰电位源定位算法(COM、MT、GC)在模拟与实验“金标准”数据下进行了系统性基准测试,不仅评估其在理想条件下的精度,更着重考察了在电极退化(electrode degradation)等长期记录条件下的鲁棒性。研究发现,尽管更复杂的物理模型(如MT)在理想条件下表现更优,但基于启发式(heuristic)的简单方法(如COM、GC)在应对噪声和电极失效时展现出更强的稳健性,为开发适用于长期神经记录、更可靠的脑机接口(brain-machine interfaces, BMIs)定位算法提供了关键洞见与评估框架。
数据与方法
本研究使用了两种具备“金标准”(ground truth)的数据集来评估定位算法。首先是使用MEArec模拟器生成的生物物理现实模拟数据集,该数据集基于幼年大鼠体感皮层第5层的13种细胞模型,在Neuropixel 384通道探针上模拟了包含50个神经元的记录,并添加了高斯噪声。其次,采用了公开的SPE-1实验数据集,该数据集包含了大鼠皮层神经元的同时膜片钳(patch clamp,提供金标准峰电位序列)和细胞外MEA(Neuropixel探针)配对记录,能够近似获得神经元的真实位置。为了模拟长期记录中电极的渐进性失效,研究通过将不断增多的电极信号替换为不相关的高斯噪声来模拟电极退化。数据预处理流程包括带通滤波(300–3,000 Hz)、共模参考以及异常通道检测。随后,利用已知的金标准峰电位序列提取峰电位波形和模板(template)波形,避免了峰电位分选(spike sorting)可能引入的偏差。
定位算法
研究评估了三种广泛使用的峰电位源定位算法,均集成于SpikeInterface软件包中。
- •
质心法:算法基于峰-峰值(peak-to-peak)电压幅值对电极位置进行加权平均来估算神经元位置。该方法计算快速简单,但在物理模型上不够精确,且其估计位置被限制在电极阵列的凸包(convex hull)之内。
- •
单极三角定位法:该方法假设神经元是一个单极点源,其电压信号随距离呈反比衰减。通过构建一个基于实测电压与估计电压之差的损失函数,并利用最小二乘法等优化方法求解,以估计源的位置。本研究使用了SpikeInterface中的默认正则化参数(如局部半径75μm,候选窗1000μm)来实现。
- •
网格卷积法:该方法在比电极阵列更密集的网格上生成一系列理论模板波形,并假设信号呈指数衰减。通过计算实际记录信号与每个理论模板信号的点积(标量积)来衡量相似性,最终以相似性为权重,对理论模板的位置进行加权求和来估算源的位置。本研究同样使用了SpikeInterface的默认参数(如局部半径40μm,取前5%的最佳卷积结果)。
无电极退化条件下的基准测试结果
在无电极退化的理想条件下,使用模拟数据集进行测试时,网格卷积法和单极三角定位法的性能优于质心法。具体而言,在定位精度(估计位置落在真实位置30μm半径内的百分比)和中位数定位误差(估计位置与真实位置之间的欧氏距离)上,网格卷积法和单极三角定位法均显著优于质心法。这是由于质心法固有的局限性导致其估计位置趋向于聚集在阵列中心,而网格卷积法和单极三角定位法则能利用信号强度信息推断出阵列凸包之外、更接近真实神经元位置的点。然而,在更嘈杂的实验数据集(允许误差半径为50μm)中,质心法的表现与网格卷积法相当,并优于单极三角定位法,这初步暗示了质心法对噪声可能具有更好的鲁棒性。在运行速度方面,质心法最快,单极三角定位法因需解决优化问题而显著更慢,这在需要对海量峰电位进行实时定位的应用场景中是一个重要的考量因素。
电极退化条件下的鲁棒性测试结果
研究进一步评估了算法在模拟电极逐步失效(信号丢失)情况下的鲁棒性。结果显示,面对电极退化,质心法和网格卷积法比单极三角定位法表现出更强的稳健性。随着失效电极比例的增加,单极三角定位法由于求解优化问题的信息减少,容易产生过拟合,导致出现大量错误估计,特别是对单个峰电位的定位。相反,质心法的估计结果随着有效电极凸包的缩小而更向阵列中心聚集,网格卷积法的估计则集中在剩余电极周围的网格上,二者都表现出更强的保守性和稳定性。从量化指标看,在模拟和实验数据集中,随着退化水平升高,质心法和网格卷积法的定位精度下降更缓,中位数定位误差增长更慢,且其估计位置相对于无退化时原始位置的“估计漂移”(estimated drift)也更小。这种稳定性对于长期神经记录至关重要,因为稳定的定位有助于在电极逐步失效的过程中持续、准确地追踪同一群神经元。
参数敏感性分析
研究还通过网格搜索考察了单极三角定位法和网格卷积法中关键正则化参数(如radius_um和max_distance_um或percentile)对性能的影响。结果表明,在低退化条件下,正则化程度较低的参数集通常能获得更低的定位误差;然而,随着电极退化加剧,正则化程度较高的参数集(如考虑更小的局部信号半径、限制更窄的解空间)表现更好,这有助于抑制噪声带来的负面影响。这一发现与主要结论一致,即在噪声和退化加剧的条件下,增加算法约束(正则化)是有益的。总体而言,不同参数选择下得出的研究结论是稳健的:在低退化条件下,网格卷积法和单极三角定位法表现更优;而在高退化条件下,质心法和网格卷积法则更具优势。
关键结果与启示
本研究的基准测试揭示了三种定位算法性能的显著差异。在理想条件下,基于更复杂物理模型的网格卷积法和单极三角定位法精度更高。然而,在更接近真实生物环境的实验数据中,尤其是在模拟长期记录中必然发生的电极退化时,质心法和网格卷积法展现出了优于单极三角定位法的鲁棒性。这意味着,对于追求长期、稳定记录的脑机接口应用而言,质心法的简单启发式或网格卷积法的网格约束,可能比理论上更精确但易受噪声影响的复杂模型(如单极三角定位法)更具实用价值。更稳健的定位结果不仅能提升峰电位分选的准确性,还能为评估探针漂移(probe drift)提供更可靠的指标,从而确保对同一神经元群进行长期的、一致性的追踪与分析。
未来方向
本研究公开发布了基准测试的方法代码,并使用了公开数据集,旨在为未来峰电位源定位算法的评估与改进提供一个基础框架。峰电位源定位本质上是一个“三角定位”问题,该问题在电信、地质等领域的空间定位技术中已被广泛研究。例如,模糊逻辑、到达时间差等技术在复杂现实环境中已展现出卓越的无线信号源定位性能。通过借鉴这些相关领域的成熟方法,有望显著提升脑机接口中峰电位源定位算法在真实生物环境下的性能与鲁棒性,推动该领域向更可靠、更实用的方向发展。