《Cognition》:More than words: Effects of grammaticality and lexical surprisal in self-paced reading
编辑推荐:
语言理解是一个复杂的认知过程,需要实时整合来自语法结构(如主谓一致性)和上下文概率(如词汇意外性)的多重线索。然而,这两类线索如何在句子加工过程中相互作用尚不明确。本研究通过一项荷兰语的自定步速阅读实验,巧妙地将句法违规与词汇概率进行交叉操纵,探讨了二者对主谓一致性加工的影响。研究结果表明,句法结构与词汇概率均独立影响阅读时间,且阅读数据无法被纯粹的叠加或交互模型所解释。更重要的是,数据分析揭示了一种新颖的“结构瓶颈”现象:只有在语法规则得到遵守的前提下,词汇概率线索才会被更可靠地利用。这项工作发表于《Cognition》,为理解语言理解中语法与概率线索的整合机制提供了关键证据,支持了一种基于线索可靠性的加权整合模型。
想象一下,你在阅读或聆听时,大脑几乎是在瞬间完成了从语音或文字到意义的构建。这个过程看似毫不费力,实则依赖着两套强大的“内部算法”:一套是严谨的语法规则,它告诉我们“钥匙”和“是”必须在数量上保持一致;另一套是灵活的概率统计,它让我们能根据前文“在秋天检查”来预测下一个词更可能是“管理员”而非“金发女郎”。长久以来,关于语言理解的核心机制存在一场“语法派”与“统计派”的论战。语法派认为,抽象的句法结构(如短语、从句)是构建意义的基础;统计派则认为,我们对下一个词的预期(即其出现的概率)才是驱动理解的关键。尽管双方都有大量实证支持,但一个根本问题悬而未决:在我们实时处理句子时,这两种力量是各自为政、简单叠加,还是相互影响、动态协作?具体到主谓一致性这种基本的语法关系,上下文提供的词汇概率线索是会放大、削弱,还是根本不影响我们对语法错误的敏感度?澄清这一问题,对于揭示人类语言理解的认知架构至关重要。
为了回答上述问题,来自荷兰马克斯·普朗克心理语言学研究所的Sophie Slaats、Antje S. Meyer和Andrea E. Martin团队进行了一项精心设计的自定步速阅读研究。他们的目标直指核心:在荷兰语中,词汇意外性(lexical surprisal,即一个词在上下文中出现概率的负对数,衡量其不可预测性)如何影响主谓数的一致性加工。研究人员设计了一种巧妙的“交叉”实验范式:他们构造了荷兰语句子,在句子开头使用介词短语(如“在秋天”)来提供足够的前文语境,然后呈现动词,最后是目标名词(主语)。通过操作,他们创建了四种条件的句子:目标名词具有高或低的词汇意外性(例如,低意外性的“管理员” vs. 高意外性的“金发女郎”),同时,目标名词与前面动词的数保持一致(正确)或不一致(错误)。这样,就能同时观察语法正确性和词汇概率各自及其交互作用对阅读时间的影响。共有88名以荷兰语为母语的参与者在线完成了实验,他们以逐词的方式阅读句子,系统记录了他们每个词的阅读时间。数据分析采用了线性混合效应模型和置换检验等先进统计方法,以严谨地评估各因素的影响。
主要技术方法
研究主要采用自定步速阅读这一在线行为实验范式,记录参与者在逐词阅读句子时的反应时间。实验材料通过基于Transformer架构的大型语言模型(GPT-2)的荷兰语版本来量化目标名词的词汇意外性值,以此精确操纵概率线索。数据分析综合运用了线性混合效应模型进行模型比较和统计推断,并使用置换检验来验证统计结果的稳健性。这些方法共同确保了研究能够灵敏地捕捉句法和概率因素对实时语言加工过程的细微影响。
研究结果
研究人员系统分析了目标词(主语名词)及其后三个词(溢出区)的阅读时间数据,得出以下核心发现:
1. 主效应显著:语法与概率各自独立影响加工
阅读时间数据显示出清晰的不合语法效应:无论是在目标词还是其后的三个溢出区,与动词数不一致的名词(错误条件)都比一致的名词(正确条件)引发了更长的阅读时间,这表明读者对语法违规非常敏感。同时,也观察到了显著的词汇意外性效应:较高的意外性值(即更不可预测的词)与较长的阅读时间相关,这一效应从目标词持续到第二个溢出区。这证实了词汇概率在实时理解中的作用。
2. 交互作用揭示“结构瓶颈”
在第一个溢出区,数据分析发现了一个关键的交互作用:词汇意外性效应仅在语法正确的句子中显著,在语法错误的句子中则不显著。这意味着,词汇概率线索(一个词有多不可预测)对阅读速度的影响,高度依赖于当前的语法结构是否完好。当语法关系被破坏(主谓不一致)时,读者似乎不再能有效地利用词汇概率线索来辅助加工。这种模式与作者最初的假设(语法错误时会更多地依赖概率线索)相反,他们据此提出了一个“结构瓶颈” 假说:对于像主谓一致性这样高度可预测且强制的语法依赖关系,对概率线索的利用可能以语法结构的完整性为前提。
3. 动词数的影响
分析还发现,前面动词本身的数(单数或复数)也会影响加工。在目标词位置,对于语法正确的句子,复数动词后的复数名词阅读时间比单数动词后的单数名词更长;而在语法错误的句子中,这种差异消失。在后续区域,动词数的影响减弱或与一致性效应交互。这表明加工过程也受到语言中单复数标记不对称性等因素的影响。
结论与意义
本研究通过精巧的实验设计,首次在同一实验中直接对比并揭示了词汇意外性与主谓一致性在句子实时加工中的复杂关系。主要结论是:语言理解无法被纯粹的句法模型或纯粹的概率模型所完全解释,最佳的模型需要同时纳入两者。更重要的是,研究发现并非简单的叠加效应,而是存在条件化的交互——词汇概率线索的效力受到语法状态的门控,表现为一种“结构瓶颈”。这意味着,在处理像主谓一致这样的核心语法关系时,认知系统会优先确保语法结构的完整性,只有在这个前提下,来自上下文的概率信息才会被充分权衡和利用。
这项研究的意义深远。首先,它在理论上弥合了“语法派”与“统计派”的部分分歧,支持了如语言加工即线索整合(LPCI)等将抽象语法知识与概率信息进行加权整合的模型。其次,它强调了“可靠性”作为权衡不同线索权重的关键原则:在高度可靠和强制的语法规则(如主谓一致)面前,即使是很强的上下文概率线索,其影响力也可能被抑制。最后,方法论上,研究展示了结合计算语言学模型(如GPT-2量化意外性)与精细心理语言学实验的优势,为未来探索更复杂的语言现象提供了范式。这项发表于《Cognition》的工作,为我们理解人类如何高效、稳健地整合多源信息以达成语言理解,迈出了坚实的一步。