在阅读过程中,读者会根据语义和句法约束对即将出现的内容进行预测(例如,Fitz & Chang, 2019)。认知模型认为,生成与上下文相关的预测是支持快速高效语言理解的关键机制之一,也是语言学习的重要工具。至关重要的是,生成与上下文相关的预测并基于输入的语言信息快速更新这些预测的能力,可以说是人类和大型计算语言模型(Language Models, LMs)语言理解中的关键共同计算原理(Goldstein et al., 2022)。然而,尽管有研究表明人类大脑和语言模型在语言处理过程中生成的概念性预测之间存在相似性,但这两者在句法知识和处理方面的潜在相似性仍不明确(Lakretz et al., 2022, Lakretz et al., 2021, Oh et al., 2024)。
造成这一理论差距的原因之一是,直到最近,人们还认为语言模型是通过学习并利用大规模语料库中单词之间的搭配概率来预测词汇内容的,它们并不会学习编码足够强大和抽象的句法依赖关系,从而无法生成基于句法的预测。然而,最近的语言模型架构进展挑战了这一观点,这些进展表明语言模型中存在比之前假设的更复杂和抽象的句法知识(Linzen et al., 2016, Tenney et al., 2019)。具体来说,当语言模型在大量数据上训练以简单预测句子中的下一个单词时,即使没有内置的句法约束,它们也表现出与句法能力一致的行为(Abdou et al., 2022, Ettinger, 2020, Kuribayashi, Ueda et al., 2024, Linzen and Baroni, 2021, Warstadt et al., 2020)。这些语言模型的进步为探讨语言模型中的句法过程本质及其与人类结构处理的相似性提供了可能性。
在本文中,我们使用结构性启动范式来解决这些问题。在人类的语言理解和表达中,结构性启动表现为对重复结构的句子处理速度更快,以及对最近生成的结构使用更频繁。结构性启动范式被认为是测试和回答有关人类语言处理中句法表征本质问题的最有成效的工具之一(Branigan and Pickering, 2017, Pickering and Ferreira, 2008, Wheeldon and Konopka, 2023),主要是因为这种范式可以控制并隔离不同变量对结构处理的影响(即概念/语义、词汇和韵律对结构的影响)。该领域的大部分研究都集中在语言处理是依赖于抽象的结构表征,还是同时受到结构和词汇-语义因素的影响。同样,利用结构性启动范式也获得了语言模型具有句法能力的证据,这与人类数据类似,可以区分由结构约束驱动的模型预测和由词汇-语义约束驱动的预测(Sinclair et al., 2022)。
在这里,我们报告了首次直接比较(a)自然阅读EEG实验中抽象句法预测的神经认知指标与(b)语言模型对相同材料生成的句法预测的计算指标的研究。自定节奏的全句阅读范式使我们能够在自然阅读条件下探索句法启动效应的稳定性。我们研究了人类参与者和语言模型在生成新的结构性启动句和未启动句的句法预测方面的相似性,为人类参与者和语言模型中句法驱动行为和上下文驱动句法预测的相似性提供了新的见解。