《Scientific Reports》:Non-linear relationships between auditory mismatch responses and the inharmonicity of complex sounds
编辑推荐:
本研究旨在探索大脑如何编码复杂声音的非谐波性信息。研究人员通过参数化调控合成声音的非谐波性水平,结合脑电图(EEG)技术,记录了健康志愿者(N=37)的失匹配负波(MMN)和P3a成分。研究发现,非谐波性与MMN波幅呈S型函数关系,P3a波幅则呈倒U型关系,峰值出现在音高辨别阈值附近。结果支持非谐波性可能通过影响基频(F0)提取,参与预测编码中的精度加权过程,深化了对听觉预测加工机制的理解。
想象一下,你身处一个嘈杂的咖啡馆,却能毫不费力地专注于朋友的谈话。这种神奇的“鸡尾酒会效应”背后,是大脑强大的听觉系统在实时解析复杂的声学世界。在这个世界里,声音的谐波性——即声音频谱中各频率成分呈整数倍关系——是帮助我们感知音高、识别声源(如不同人的嗓音)和理解言语的关键线索。大脑像一个高效的预测机器,不断根据过往经验对未来接收到的感官输入(包括声音)进行预测。近年来的预测加工理论认为,大脑不仅生成预测,还会根据感官信号的可靠性或“精度”来调整其对预测的置信度,这一过程被称为“精度加权”。那么,对于听觉信号,什么特性可能影响其“精度”并被大脑用于权重调整呢?有研究者提出,声音的非谐波性(即频率成分偏离整数倍关系)可能是一个关键因素。非谐波性声音频谱包含更丰富的信息,但也可能干扰大脑对基频(F0,决定音高的基本频率)的提取,从而影响预测的可靠性。然而,大脑对非谐波性的神经编码机制,特别是其如何影响与预测误差相关的脑电活动,尚不完全清楚。这促使研究人员开展了一项精细的脑电图研究,旨在揭示听觉失匹配响应与非谐波性水平之间具体的量化关系,以检验非谐波性参与精度加权的假说。
该研究采用参数化设计合成不同非谐波性水平的声音刺激,利用经典听觉Oddball范式诱发并记录37名健康志愿者的脑电图(EEG),主要分析失匹配负波(MMN)和P3a这两个与自动和注意转向的预测误差处理相关的脑电成分。
研究结果
非谐波性与MMN波幅呈非线性(S型)关系
研究人员通过系统改变合成元音的非谐波性参数,创建了一系列声音刺激。在Oddball范式中,当这些不同非谐波性水平的声音作为小概率偏差刺激出现时,会诱发MMN。数据分析表明,MMN的波幅随着非谐波性水平的增加而变化,且这种关系最佳拟合模型为S型(Sigmoid)函数,而非简单的线性或多项式函数。这说明大脑对非谐波性变化的响应存在一个非线性转换点,在达到一定阈值前后,MMN的反应模式发生显著改变。
P3a波幅与非谐波性呈倒U型关系,峰值接近音高辨别阈值
与MMN不同,反映注意自动转向的P3a成分的波幅,与非谐波性水平之间呈现出倒U型关系。P3a的波幅在中等程度的非谐波性水平时达到峰值,而在极低和极高的非谐波性水平时则减小。特别值得注意的是,这个峰值出现的非谐波性水平,恰好位于行为学实验中测得的音高辨别阈值(即被试能开始区分声音音高差异的临界点)附近。这表明,当声音的非谐波性刚好足以开始干扰但尚未完全破坏音高感知时,最能吸引无意识的注意资源。
高非谐波性损害基频(F0)提取
结合上述神经生理学发现,研究者进一步解释,S型MMN响应可能反映了非谐波性对大脑提取声音基频(F0)过程的干扰存在一个临界阈值。当非谐波性超过此阈值时,F0提取变得困难,导致预测误差信号(MMN)的变化模式发生转变。P3a的倒U型关系则暗示,中等程度的预测不确定性(由部分干扰F0提取的非谐波性引起)最易触发注意定向。
结论与讨论
本研究通过精细的参数化操控和高时间分辨率的脑电测量,首次系统揭示了听觉失匹配响应(MMN和P3a)与声音非谐波性之间的具体非线性量化关系。MMN的S型函数关系表明,大脑对非谐波性影响的处理并非线性渐变,而是在特定阈值前后存在不同的加工机制,这为“非谐波性可能通过干扰基频(F0)提取来影响预测精度”的假设提供了直接的神经证据。P3a的倒U型响应模式进一步将神经活动与行为感知阈值联系起来,表明注意系统的自动捕获在预测不确定性达到特定水平时最为敏感。这些发现有力地支持了预测加工理论框架,表明非谐波性可能是听觉系统中用于评估感官信号可靠性、实现精度加权的一个关键声学特征。该研究不仅深化了对听觉皮层信息处理机制的理解,也为探索精神分裂症、自闭症等与预测编码异常相关疾病的听觉感知缺陷提供了新的神经指标和理论视角。此项研究发表于《Scientific Reports》期刊。