基于三元组任务的文字感知:探索不同书写体系、字体设计与专业背景对字符视觉相似性判断的影响

《Visual Cognition》:A method for studying the contextual similarity of characters in Cyrillic, Devanagari, and Latin scripts and exploration of the effects of typeface design and expertise

【字体: 时间:2026年02月17日 来源:Visual Cognition 1.4

编辑推荐:

  本文推荐一篇关于字符视觉感知的研究论文。文章提出了一种新颖的“三元组任务”,通过让参与者从三个字符中选出最不同的一个,来探究西里尔文、天城文和拉丁文中字符的视觉相似性。研究发现,这种“情境相似性任务”能够有效检测字体设计差异,并揭示设计专业背景、母语熟练度等因素对相似性判断的影响。该方法克服了传统双字符对比研究的局限,为理解阅读认知和指导字体设计提供了更细致的数据。

  
字符的视觉相似性是人类感知和文字识别的核心问题之一。传统的相似性研究通常采用双字符比较或单字符识别任务,这些方法未能有效控制“情境效应”,并且大多只聚焦于单一字体或牺牲视觉呈现质量(如低分辨率),使得研究结果难以推广。本文提出并验证了一种新颖的“情境相似性任务”:参与者每次会看到一个由三个字符组成的“三元组”,并被要求选出其中最不同的一个字符,从而默认剩余的两个字符更为相似。这项任务在认知上简单却富有挑战性。
动机
感知相似性判断本质上是具有情境性的。例如,在字母“o, y, z”组成的语境中,“y”和“z”的相似度会因“o”是圆形而显得更高;而在“s, y, z”的语境中,由于“s”和“z”高度相似,“y”和“z”的相似度则会降低。字体设计的目的是在读者可感知的范围内,实现一种统一的风格感。同一字体中的不同字符形状被设计成在视觉上相互协调,这种视觉一致性可以看作字符形状之间情境相似性关系的网络。
然而,字体设计领域不仅关注字体外观,也关心特定设计对阅读流畅度的影响。有充分证据表明,文字识别是基于对单个字符的识别,而非整体词形。过于相似、容易混淆的字符形状会增加阅读难度。但反过来说,适当的视觉一致性是否有助于识别原本不同的字符形状,这一问题仍有待探索。
术语
为避免混淆,本文明确定义了三个术语:
  • 字符:指脚本中的基本单位类别,例如任何字母“a”。
  • 字符形状:指字符的具体形状,例如Georgia字体中的字母“a”。
  • 字符图像:指字符形状在特定材料上的具体呈现,例如本文中显示的字母“a”。
现有方法
以往研究视觉相似性的方法主要包括:让参与者对字符对进行主观评分,或通过识别任务中的错误率、置信度评分和反应时间来间接推导相似性。后者通常需要采用苛刻的呈现条件(如短暂显示、小尺寸、低对比度)来迫使参与者犯错,这可能会加剧低空间频率特征的相对重要性,且大多依赖于参与者对内部表征的记忆。此外,多数研究仅使用单一字体,并且主要集中在拉丁文脚本(特别是英语大写字母),这限制了其在全球化、多语言世界中的可转移性和适用性。
方法
为获得对字体设计效应敏感且无需参与者识别字符的数据,本研究引入了情境相似性任务。该任务基于“最佳-最差任务”范式,将复杂的相似性网络比较简化为一次简单的三选一决策。
参与者
通过便利抽样、社交网络和招募网站共邀请了1721名成年参与者。参与者背景多样,自我报告了79种母语和88种流利阅读的语言。实验通过网络进行,参与者需先完成一份关于其语言背景、阅读习惯和设计经验的问卷。
刺激材料
研究涵盖了西里尔文、天城文和拉丁文三种世界主要书写体系,共使用了28种适用于连续阅读的字体,创建了28个实验变体。为了设计多样性,一半字体为低对比度设计,另一半为高对比度设计。为了控制实验时长,每个字体-脚本组合中仅系统性地选取了8个字符(拉丁文和西里尔文优先小写字母,天城文选择基本辅音),并穷举组合成56个不重复字符的三元组。所有字符图像都以舒适的尺寸和高质量呈现,以确保字体设计的主要差异能被可靠地检测。
过程
在问卷之后,参与者完成一系列三元组判断任务。三个字符被放置在三个大小相同的方块中展示,参与者被要求“点击与其他两个最不相同的字母”。任务强调仅考虑形状,不考虑字符含义,且没有标准答案。三元组及其内部字符的呈现顺序均被随机化。
结果
人口统计学数据与回应
参与者完成了总共96,376次三元组判断。不同三元组的“最不同字符”频率分布在理论最小值(0.33)和最大值(1.0)之间,表明实验任务涵盖了从易到难的广泛谱系。参与者间的一致性系数(AC1)表明,不同脚本的任务难度存在差异。
情境相似性度量与广义字符对相似性
每个三元组任务的三个回应频率,可以解释为在该三元组特定语境下的字符对相似性度量。例如,在Century Schoolbook字体中,字符对“d, i”在“x”的语境下的相似性度量 s(d, i | x)CS= 0.61。由于每个字符对会在多个不同的三元组中出现,可以通过计算其在不同语境下的相似性度量的平均值,得到更广义的字符对相似性度量,并可以构建8×8的相似性矩阵。本研究为所有28种字体生成了此类矩阵。
情境效应
分析表明,当聚合的三元组数量(即考虑的语境字符数量)较少时,计算出的广义相似性度量的方差较大;随着聚合的三元组数量增加,方差迅速减小并趋近于零。这一结果清晰地展示了情境对相似性判断的影响,也说明了传统双字符对比研究在概括人类判断时的简化性。
与已有研究的比较
将本研究生成的字体相似性矩阵,与Simpson等人基于Arial字体双字符评分研究得到的矩阵进行相关性比较,发现所有矩阵都达到了较高的斯皮尔曼等级相关系数,其中Arial字体的矩阵相关性最高。然而,当尝试使用Simpson等人的广义相似性度量来直接预测本研究中所有三元组任务的回应时,预测模型仅能解释36%的方差。这表明,情境相似性任务所收集的数据,并非简单地从某种通用字符对相似性值转换而来,两种任务背后可能涉及不同的决策过程。
字体设计效应
为了探究情境相似性任务对字体设计的敏感性,研究比较了相同三元组在不同字体中的回应。费希尔精确检验的结果显示,字体设计确实对相似性判断产生了显著影响。例如,在字体Futura(无衬线、单层“g”)和PT Serif(衬线、双层“g”)中,对于三元组“g, q, y”,参与者的判断存在显著差异。在Futura中,“y”被明确认为是“最不同的”,可能因为“y”使用了斜线结构,而“g”和“q”都是圆形的。在PT Serif中,“g”也获得了较高的票数,可能因为其更复杂的双层结构使其与“q”的相似度降低。然而,在另一个三元组“g, h, m”中,这种“g”字形的差异则未产生显著影响,可能因为“h”和“m”在这两种字体中看起来都非常相似。
这些结果表明,即使是在相对同质、用于连续阅读的保守字体组中,情境相似性任务也能有效检测出设计细节(如特征的存在与否、突显程度)对感知相似性的微妙影响。
设计专业知识效应
根据参与者自我报告的设计经验,将其分为非设计师、字体/字母设计师和所有设计师(包含字体设计师和其他设计师)三组进行分析。结果显示,字体/字母设计师的“最不同字符”回应频率与非设计师存在显著差异。在参与者间一致性方面,设计师和字体设计师通常比非设计师更为一致,这可能是正规教育的影响。总体而言,结果支持了设计专业知识对字符相似性判断的影响。
脚本流利度与母语效应
根据参与者对特定脚本的流利度和母语背景进行分组分析。一个有趣的发现是,在西里尔文和天城文实验中,非流利读者组内部的参与者间一致性反而更高。这可能是因为参与者对不熟悉的材料处理得更仔细,或者流利/母语参与者的额外语言知识干扰了其判断。
对于天城文,流利度和母语背景的效应均得到统计学上的显著证实;对于西里尔文,仅母语背景效应显著;对于拉丁文,由于数据不足,未能进行有效分析。结果在一定程度上表明,流利度的影响可能比母语背景更强。这些发现与先前关于语言/脚本专业知识对感知影响的研究结论一致。
讨论与结论
研究表明,来自个体字符或字符对任务的数据,不足以验证旨在代表相似性感知的理论模型。情境敏感方法的提出,基于视觉相似性的自然属性:所有相似性判断都是相对的,因而依赖于语境。该方法比个体字符或字符对研究产生了更细致的数据。情境相似性任务在认知上简单,但又足够挑战性,能够引发随参与者背景或刺激物设计差异而变化的判断。通过消除对苛刻观看条件的依赖,有助于显现与字体设计一致性相关的效应。
该方法绕过测试完整字符集的必要性,为比较不同字体的感知相似性提供了新途径,这对分析字体设计流派及其与阅读表现的关系具有潜力。研究采用的刺激物选自三种主要世界脚本的常用字体库,参与者提供了海量且多样化的回应数据。这些由读者感知支撑的数据,为探索内部表征(包括基于特征的结构化方法和机器学习)开辟了新的机会。将视觉相似性视为情境性的,并将字体视为微妙而有效的工具的观点和模型,可以通过提供可测试的设计决策批判工具,将阅读研究的结果与可操作的设计指导联系起来,从而对字符识别、阅读和字体设计研究产生影响。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号