《Scientific Data》:The Corpus of Bidirectional Reading of Traditional Chinese Text: An Extension of the Multilingual Eye-Movement Corpus
编辑推荐:
本研究针对传统中文文本横排与竖排阅读的认知差异问题,在Multilingual Eye Movement Corpus (MECO) 框架下,首次基于60名香港参与者的眼动数据,开展了横、纵双向阅读的眼动模式研究。结果表明,两者在时空眼动模式上具有可比性,为理解阅读中普遍与语言特异的认知、视觉及眼动过程提供了支持,有助于发展更全面、生态效度更高的眼动控制模型。
当我们捧起一本书或打开一篇网络文章,视线在字里行间游走,看似自然而然,实则牵涉着一系列复杂而精密的认知、视觉和眼动过程。科学家们通过记录人们阅读时的眼球运动(眼动),构建模型来理解大脑如何指挥眼睛、处理信息。在这一领域,多语言眼动语料库 (Multilingual Eye Movement Corpus, MECO) 项目是重要的国际合作平台。然而,现有模型大多基于从左到右水平书写的语言(如英文),其普适性面临挑战。传统中文书写系统提供了一个独特而宝贵的研究窗口:同一文本可以根据排版需要,以水平(横排)或垂直(竖排)两种方向呈现。这种“双向性”是中文独有的现象,它引出了一个基础而迷人的问题:当阅读方向从熟悉的水平变为垂直时,我们的眼睛如何运动?大脑处理信息的时空模式会发生改变吗?回答这些问题,不仅能揭示中文阅读的特殊性,更能检验现有眼动控制理论的普遍性,对发展更全面、更具生态效度的阅读模型至关重要。这正是《科学数据》(Scientific Data) 期刊上发表的这项研究致力于探索的核心。
为开展这项研究,作者团队主要应用了以下关键技术方法:研究基于MECO项目框架,招募了60名以粤语为母语的香港参与者作为样本队列。核心数据采集依赖于眼动追踪技术,记录参与者阅读传统中文横排与竖排文本时的眼球运动。数据分析则采用了可靠性评估和线性混合效应模型 (linear mixed-effects model),对获取的时空眼动模式指标进行统计比较和技术验证。
研究结果
一个独特的语料库:双向阅读眼动数据的首次集合
本研究构建并发布了首个专门用于传统中文横排与竖排阅读对比的眼动语料库。该语料库是MECO项目的延伸,其最突出的特点是实现了“被试内”与“项目内”的严格对照。即同一批参与者阅读了同一批文本材料,只是排版方向不同。这最大程度地控制了个体差异和材料差异,使得横、纵阅读模式的直接比较成为可能,为相关研究提供了高质量的基础数据。
技术验证:数据可靠,模型有效
在正式进行模式比较前,研究首先对所收集的眼动数据进行了技术验证。通过计算可靠性估计,确认了所记录的眼动指标(如注视时间、凝视时间、回视等)具有可接受的信度。随后,研究使用线性混合效应模型对数据进行了分析。该模型能同时考虑被试和项目带来的随机变异,是处理此类重复测量数据的稳健方法。验证结果表明,数据分析方法可靠,为后续的发现提供了坚实的统计基础。
核心发现:水平与垂直阅读的眼动模式具有可比性
通过细致的模型分析,研究得出了核心结论:在阅读传统中文文本时,水平(横排)阅读与垂直(竖排)阅读所产生的空间和时间眼动模式是相似的,具有可比性。这意味着,尽管文字排列方向发生了90度的改变,但读者眼球运动的宏观规律(如注视点的分布、跳读的幅度、回视的模式)以及处理信息的时间尺度(如对词汇的注视时长)并未发生根本性的、系统性的剧变。这一发现挑战了“阅读方向必然深刻重塑眼动行为”的直觉,提示人类阅读的认知与眼动控制系统可能具备高度的适应性。
结论与讨论
本研究通过构建首个传统中文双向阅读眼动语料库并进行严谨分析,得出了关键结论:传统中文的横排与竖排阅读在眼动模式上表现出可比性。这一结论具有多重重要意义。
首先,在理论层面,它为了解阅读中普遍性与特异性的平衡提供了新证据。眼动模式的相似性支持了某些认知和眼动控制过程可能具有跨书写方向的普遍性,例如基本的词汇识别和眼跳目标选择机制。同时,研究也并未完全否定语言特性的影响,它为进一步精细探测在特定指标或加工阶段可能存在的细微差异奠定了基础。其次,在方法论上,该研究展示了利用语言书写特性(如中文的双向性)作为“自然实验”来检验理论假设的威力。这种基于语言本身特性的比较,比人为创造的实验条件更具生态效度。最后,也是最重要的实践意义在于,本研究发布的语料库本身就是一个宝贵的资源。它支持未来研究开发更全面、更能适应不同书写系统的计算模型,特别是眼动控制模型。一个强大的、生态效度高的模型,不仅应能模拟从左到右的阅读,也应能兼容从上到下或其他方向的阅读,从而更逼近人类阅读能力的全貌。这项工作将MECO项目的覆盖范围扩展到了一个具有独特双向性的书写系统,推动了阅读科学研究向更全面、更普适的方向发展。