听觉–运动同步能力可预测对音乐反应中增强的神经追踪与失匹配检测

《Annals of the New York Academy of Sciences》:Auditory–Motor Synchronization Ability Predicts Enhanced Neural Tracking and Mismatch Detection in Response to Music

【字体: 时间:2026年05月22日 来源:Annals of the New York Academy of Sciences 4.8

编辑推荐:

  个体间听觉–运动同步能力的差异,可通过言语到言语同步测试(speech-to-speech synchronization test,SSS test)的表现加以测量;这种差异可能解释早期音乐听觉加工中的变异,且独立于正式音乐训练。研究人员考察了经该测试识别出

  
个体间听觉–运动同步能力的差异,可通过言语到言语同步测试(speech-to-speech synchronization test,SSS test)的表现加以测量;这种差异可能解释早期音乐听觉加工中的变异,且独立于正式音乐训练。研究人员考察了经该测试识别出的高同步者,是否即使在缺乏音乐专长的情况下,仍表现出对音乐更增强的神经编码与偏差检测。研究采用脑电图(electroencephalography,EEG)对非音乐家进行测量,在被动听觉音乐oddball范式下,比对高同步者与低同步者对旋律偏差和节律偏差的神经反应。结果显示,两组在早期、前注意阶段存在显著神经生理学差异。高同步者对旋律起始的N100波幅显著更大,提示初始感觉编码增强。其对音乐包络的皮层追踪也更优,此结果由多变量时间反应函数(multivariate temporal response function,mTRF)建模测得。关键的是,高同步者对旋律偏差与节律偏差均表现出增强的失匹配负波(mismatch negativity,MMN)反应,表明其自动偏差检测更强。然而,mTRF准确度、N100以及MMN波幅之间未发现显著相关,提示初始感觉编码、包络追踪与高阶偏差检测分别依赖不同的神经机制。这些发现确立了这样一种观点:内在的听觉–运动同步能力能够预测音乐结构在早期、前注意加工阶段中的稳健神经生理优势。
该文发表于《Annals of the New York Academy of Sciences》,核心关注一种并非依赖正式音乐训练、而是体现个体内在听觉–运动耦合差异的能力指标——言语到言语同步测试(speech-to-speech synchronization test,SSS test)所界定的听觉–运动同步能力。既有研究已表明,高同步者与低同步者在语言统计学习、时间注意、额颞网络功能连接以及左侧弓状束(arcuate fasciculus)结构上存在系统差异;同时,音乐领域的大量文献也反复证明,音乐训练会增强失匹配负波(mismatch negativity,MMN)、改善复杂声音的神经编码,并提高对音乐结构的皮层追踪能力。然而,一个尚未被充分澄清的问题是:既往被归因于“音乐专长”的部分神经生理优势,是否在一定程度上其实源于更基础的听觉–运动同步特质,而不完全是长期训练的结果。基于这一问题意识,研究人员将分析对象限定为非音乐家,以最大限度排除正式音乐训练带来的混杂影响,从而直接检验高、低同步者在音乐样刺激的早期听觉加工、包络追踪以及自动偏差检测方面是否存在差异。

围绕这一目标,研究人员提出的中心问题是:听觉–运动同步能力是否会延伸影响音乐刺激的前注意加工阶段,进而塑造大脑对声音起始、时间结构和偏差信息的自动处理。为此,研究建立了一个结合事件相关电位(event-related potential,ERP)与多变量时间反应函数(multivariate temporal response function,mTRF)的分析框架。结果显示,即使在完全控制音乐训练背景之后,高同步者仍表现出更大的N100波幅、更强的音乐包络重建精度,以及对旋律和节律偏差更大的MMN反应,而这些指标之间并不存在显著相关。这表明,听觉–运动同步能力并非仅影响单一加工环节,而是与多个彼此可分离的早期听觉神经过程相关。该研究的重要意义在于,它把个体差异研究从“是否受过音乐训练”进一步推进到“是否具备更强的内在听觉–运动同步倾向”,从而为理解音乐与一般听觉加工的神经基础提供了新的解释框架。

在方法上,研究纳入26名西班牙语母语非音乐家,均来自既有实验室数据库,并依据SSS test复测结果分为高同步组与低同步组,各13人。所有受试者接受被动听觉音乐oddball任务,同时记录脑电图(EEG)。实验材料为生态效度较高的短旋律序列,包含旋律偏差与节律偏差两类deviant刺激。研究主要采用三类分析:其一,提取每段旋律起始诱发的N100成分;其二,基于连续EEG与声音包络,应用mTRF模型评估音乐包络追踪;其三,通过标准刺激与偏差刺激差异波计算MMN,用以衡量自动偏差检测能力。

3 Results

3.1 Early Neural Response to Melody Onset Differentiates Between Groups

研究人员首先考察每段旋律起始所诱发的N100,以评估最早期的听觉感觉编码。结果显示,高同步组与低同步组均出现典型N100,但高同步组的N100波幅显著更大,而潜伏期无显著差异。该结果表明,高同步者并非在反应时序上更快,而是在相近时间进程内表现出更强的初始皮层感觉编码。由于N100通常被视为声音起始加工的重要神经指标,这一发现说明听觉–运动同步能力与旋律起始瞬间的早期感觉表征增强有关。

3.2 Cortical Tracking of the Acoustic Envelope Is Enhanced in High Synchronizers

随后,研究人员利用mTRF模型检验两组对音乐声学包络的皮层追踪能力。结果表明,高同步组的包络重建准确度显著高于低同步组,说明其神经活动更能精确反映音乐时间起伏信息。进一步分析显示,mTRF准确度与N100波幅之间不存在显著相关,无论在总体样本还是分组样本中均如此。由此可见,对音乐包络的连续追踪并不能简单归结为声音起始反应增强,而更可能代表另一相对独立的早期听觉加工机制。该结果支持研究者关于“初始感觉编码”与“连续时间结构追踪”相互区分的判断。

3.3 High and Low Synchronizers Differ in Early Processing of Melodic and Rhythmic Deviants

在偏差检测层面,研究人员分别分析了旋律偏差与节律偏差所诱发的MMN。对于旋律调制条件,高同步组的MMN波幅显著大于低同步组,而潜伏期无显著差异;对于节律调制条件,也观察到相同模式,即高同步组MMN更大,但潜伏期并未改变。这说明高同步者在前注意水平对旋律与节律两类音乐偏差都具有更强的自动辨别能力,而且这种优势主要表现为反应强度增加,而非加工时序提前。

在此基础上,研究进一步通过相关分析探查这些增强反应是否源于共同机制。首先,旋律MMN与节律MMN之间不存在显著相关,提示针对频谱特征与时间特征的偏差预测可能依赖功能上可分离的神经过程。其次,N100波幅与两类MMN波幅之间均无显著相关,说明声音起始的早期感觉编码与稍后阶段的偏差检测并非同一过程的连续量化指标。最后,mTRF包络追踪指标与旋律MMN、节律MMN之间也均无显著相关,说明连续声学结构追踪与偏差检测同样可彼此分离。综合这些结果,研究支持一种“模块化”的早期听觉加工观点:音乐刺激的感觉编码、包络追踪以及高阶偏差检测属于听觉层级中不同但并行增强的加工阶段。

Discussion

讨论部分指出,本研究最重要的贡献在于证明,高同步者与低同步者之间的神经生理差异并不局限于主动任务或语言加工,而是已经延伸至被动音乐聆听中的前注意听觉处理。高同步者在N100、包络追踪以及两类MMN上均表现出更大的响应幅度,且潜伏期大体一致,提示两组可能共享相似的基本加工框架,但高同步者的相应神经系统功能更强。与此同时,多个指标彼此不相关,又进一步说明这些增强并非来自单一上游机制的简单放大,而更可能对应不同层级和不同功能的神经过程。

研究还将结果放在听觉–运动回路框架下加以解释。既往研究显示,高同步者具有更强的额颞区功能耦合及更大的左侧弓状束体积,而弓状束正是关键的运动–听觉通路。基于这一背景,作者认为本研究结果支持如下观点:运动系统可能通过自上而下的方式调节听觉系统中的神经振荡相位重置,从而促进自下而上的知觉加工。这种机制能够解释为何高同步者在旋律起始编码、包络追踪以及偏差检测上均占优势。尤其值得注意的是,MMN通常被视为听觉辨别与感觉记忆精确性的指标,并且常被用来体现音乐训练诱导的神经可塑性。本研究在非音乐家样本中观察到与“音乐专长效应”方向一致的MMN增强,说明部分以往归因于训练的效应,可能也与更基础的听觉–运动同步能力有关。

作者同时强调,本研究发现N100与包络追踪不相关,提示二者可能依赖不同听觉皮层区域或不同类型的神经群体;而MMN与前两者也不相关,则说明自动偏差检测是另一个更高阶但仍属前注意的独立阶段。就理论意义而言,这些结果为预测编码(predictive coding)框架提供了补充证据:高同步者可能形成更精确的听觉预测,因此当旋律或节律规律被破坏时,会产生更强的预测误差信号,也即更大的MMN。

研究同时指出局限性:样本量相对较小,且同步能力仅通过SSS test单一指标加以刻画,未来仍需结合击指同步或节拍知觉等行为任务进一步验证同步表型与神经加工之间的关系。不过,在严格控制音乐训练背景的前提下,本研究已较为清楚地表明,听觉–运动同步能力本身就是解释个体早期音乐听觉神经差异的重要因素。

结论部分可译为:总之,本研究提供了神经生理学证据,支持个体听觉–运动同步能力与早期听觉加工之间存在显著关联。研究人员证明,即使在控制音乐训练影响后,高同步者在声音加工初始阶段仍表现出增强的神经反应,具体体现为更强的N100、更稳健的听觉包络表征以及更大的MMN。上述发现提示,同步能力是与听觉神经生理个体差异相关的重要因素,并为未来探究内在听觉–运动能力如何独立于正式音乐训练而参与听觉知觉提供了研究框架。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号