《Communications Biology》:Linguistic pitch is hierarchically encoded in the right ventral stream
编辑推荐:
为揭示大脑如何将语音基频(f0)线索转化为抽象语言意义,本研究通过脑磁图(MEG)与表征相似性分析(RSA)技术,首次证实右腹侧听觉通路沿上颞回(STG)后前轴存在层级化处理机制:早期听觉区编码声学细节,前颞区生成抽象句子类型表征。该过程受双侧网络Gamma/Alpha振荡调控,并通过左岛盖/前脑岛(Op/aINS)与决策行为直接关联,为言语感知的神经计算模型提供了新证据。
当我们聆听一句话时,大脑如何从声波中捕捉到“这是疑问句还是陈述句”的关键信息?这背后隐藏着言语感知的核心难题:如何将连续的声学信号(如音高变化)转化为离散的语言学范畴。基频(fundamental frequency, f0)作为音调的物理 correlate,既承载着说话人身份信息(如男女声差异),又通过其动态轮廓(如句末升调或降调)决定句子类型。然而,大脑究竟通过怎样的神经机制实现从多变的声学特征到抽象语言意义的“飞跃”,一直是认知神经科学领域的重要挑战。
以往研究表明,f0处理主要依赖右侧颞叶区域,但其层级组织方式与左半球语言通路的类比关系尚不明确。为此,苏黎世大学和乔治城大学的研究团队在《Communications Biology》发表的最新研究中,结合高时间分辨率的脑磁图(MEG)与多模态分析方法,首次揭示了右腹侧听觉通路在语言音调处理中的层级化编码规律,并发现这种编码直接驱动听者的感知决策行为。
研究方法概要
研究通过亚马逊Polly语音合成系统生成法语(伪)词刺激,操纵f0高度(男女声)和动态轮廓(疑问句/陈述句渐变连续体),要求34名母语者进行句子类型判断。采用传感器与源空间解码分析追踪神经表征的时间动态性;通过表征相似性分析(RSA)构建声学细节保留、说话人归一化、句子类型抽象化三类计算模型,结合聚类检验识别表征几何结构的演变;利用定向相位滞后指数(dPLI)分析Gamma/Alpha频段的功能连接方向;最后通过漂移扩散模型(DDM)将神经活动与行为决策参数关联。
结果分析
行为表现反映声学不变性表征
参与者能够准确忽略f0高度和轮廓的连续变化,将刺激二分化为疑问句或陈述句范畴(图1B),表明行为层面已形成抽象化的句子类型表征。
音调表征的时空动态解码
时间解码显示,说话人身份信息从刺激出现即持续可解码,而句子类型信息需在f0轮廓分化后(约370 ms)出现(图1C左)。空间解码揭示双侧颞前网络参与编码,但早期峰值在右半球强度显著更高(峰值1-2: pFDR<0.01),提示右半球在初级处理中的优势(图1C右)。
右腹侧通路的层级化处理证据
RSA结果显示三类表征模型沿右半球上颞回(STG)呈现时空梯度:早期听觉皮层(约550 ms)对应声学细节模型(Model 1),中部STG(约700 ms)对应说话人归一化模型(Model 2),前部STG(约680 ms)及左岛盖/前脑岛(Op/aINS)对应句子类型抽象模型(Model 3)(图2B-C)。这种后前轴推进符合腹侧通路的层级组织原则。
神经表征几何决定行为表现
多维尺度分析(MDS)表明,仅右前STG区的神经表征几何与行为分类结构高度匹配(图2D)。高行为表现者(准确率>95%)的神经表征分离度显著优于低表现者(准确率<75%),且左Op/aINS区的抽象表征强度与证据积累速率(漂移率)正相关(r=0.52, p=0.0003)(图2H-I),说明抽象表征质量直接决定决策效率。
跨半球振荡协调机制
功能连接分析发现,右前STG至左Op/aINS的Gamma频段信息流(600-800 ms)可能传递抽象表征至决策节点;而左Op/aINS至右前运动皮层(PMC)的Alpha频段连接呈现Theta节律调制(图3A),或支持感觉证据的累积整合。
结论与意义
本研究通过多层级证据链证明:语言音调处理遵循右腹侧通路的层级化组织,从早期听觉区的声学特征编码逐步演化为前颞叶的抽象语言学表征。该过程通过双侧网络的Gamma/Alpha振荡协调实现,其中右前STG构建感知范畴,左Op/aINS转化为决策信号。这一发现不仅拓展了双流模型在韵律处理中的应用,更揭示了神经表征几何到行为输出的转化机制,为理解言语障碍的神经基础提供了新视角。