眼睛是面孔检测的核心：重新审视面孔处理的认知基础

《Vision Research》：The eyes are central to face detection: revisiting the foundations of face processing

【字体：大中小】 时间：2026年02月21日 来源：Vision Research 1.4

编辑推荐：

　　本文通过一项开创性的心理物理学研究，深入探讨了面孔检测过程依赖的关键视觉特征。研究者运用Bubbles方法，通过三个精心设计的实验，系统揭示了在区分面孔与噪音、非面孔物体及真实物体时，眼睛区域（特别是高频空间频率信息）始终是面孔分类最关键的诊断性信息来源。这一发现不仅挑战了面孔检测与识别是两个独立认知阶段的传统观念，而且为理解面孔失认症等面孔处理障碍提供了全新的神经机制视角，对推动人脸感知的基础研究和临床诊断具有重要意义。

识别一张脸是人类社会互动中最基本却至关重要的能力，它让我们能够迅速判断出他人的身份、情绪状态甚至意图。这项看似毫不费力的技能，背后是大脑高效处理复杂视觉信息的精密计算。长期以来，科学界对“面孔识别”（即认出这是谁）的机制已有大量研究，普遍认为眼睛区域是关键信息源。然而，对于面孔处理流程的起点——“面孔检测”（即判断眼前是不是一张脸），人们所知相对有限。一个核心的谜题是：面孔检测究竟是一个相对独立、基于整体轮廓的低级过程，还是从一开始就与后续的面孔识别共享着某些精细的视觉信息加工机制？这个问题的答案，对于理解面孔处理的完整神经环路以及像面孔失认症（俗称“脸盲”）这类疾病的根源至关重要。

为了解答这一根本问题，一支研究团队在《Vision Research》上发表了一项研究。他们使用了一种名为“Bubbles”（气泡）的心理物理学技术，该方法能像“打马赛克”一样随机隐藏或揭示图像的不同区域和细节层次（即空间频率），从而逆向推断出被试完成任务时真正依赖的视觉信息。研究人员设计了三个层层递进的实验，以模拟不同难度和场景下的面孔检测任务：实验一（单刺激面孔/非面孔判断）、实验二（两选一迫选任务，以控制反应偏差）和实验三（将非面孔刺激替换为真实物体，增加生态效度）。

在关键的技术方法层面，研究主要采用了：1) Bubbles心理物理学技术，该方法能分解并随机采样图像在水平和垂直位置以及空间频率三个维度上的信息；2) 将刺激图像分解为五个不同的空间频率（SF）带（从高到低：104.96-52.48, 52.48-26.24, 26.24-13.12, 13.12-6.56, 6.56-3.28 cycles per face）；3) 使用QUEST自适应阶梯法在实验中动态调整“气泡”数量，将参与者的准确率稳定在75%；4) 计算分类图像（Classification Images, CIs）并进行基于置换检验的统计分析，以确定与准确行为反应显著相关的图像区域；5) 参与者均为具有正常或矫正至正常视力的成年人，任务在受控的实验室环境下通过MATLAB和Psychophysics Toolbox编程完成。

研究结果部分呈现如下：

2. Experiment 1

在第一个“是脸或不是脸”的任务中，分析结果显示，眼睛、鼻子和嘴巴区域在较低的前三个空间频率带以及所有频带合并时，都与正确的检测反应显著相关。然而，通过重复测量方差分析比较不同面部区域在所有频带合并后的诊断价值，发现眼睛区域的贡献值（Z分数均值M = 9.90）显著高于鼻子（M = 4.20）和嘴巴（M = 4.59），而鼻子与嘴巴之间无显著差异。

3. Experiment 2

在第二个“面孔选择”任务中，所有空间频率带都包含与高准确率显著相关的信息。在最高频带（SF band 5），只有眼睛区域是显著的。对于其他频带，参与者显著利用了包括眼睛、鼻子和嘴巴在内的多个内部特征。综合所有频带的分析再次确认，眼睛（M = 12.35）的诊断性显著高于鼻子（M = 4.66）和嘴巴（M = 6.09），并且嘴巴也显著比鼻子更有用。

4. Experiment 3

在第三个更贴近现实、用真实物体作为非面孔刺激的“面孔或物体”任务中，结果与实验一趋同：眼睛、鼻子和嘴巴区域在前三个空间频率带及所有频带合并时均显著相关。眼睛区域的诊断价值随着空间频率升高而增加，嘴巴在中高频段信息量更大，鼻子则在中间频率段最相关。在所有频带合并后，眼睛区域（M = 9.11）的贡献值依然显著高于鼻子（M = 5.87）和嘴巴（M = 5.62）。

5. General discussion

综合三个实验的结果，研究人员得出了一系列重要结论。首先，眼睛区域是支持面孔检测的最关键、最一致的信息来源，特别是在高空间频率下。这一发现与早期Rousselet等人（2014）的研究结论一致，并得到了Tyler和Chen（2006）研究的支持，表明面孔检测依赖于对眼睛及鼻部周围结构的特定敏感性。

其次，研究揭示了一个更具颠覆性的洞察：面孔检测所使用的诊断性视觉信息模式，与面孔识别（身份辨认）任务中发现的模式高度重叠。这与许多认为检测和识别是分离、独立过程的观点相悖。研究指出，这种重叠可能解释了关于面孔失认症（prosopagnosia）文献中长期存在的矛盾发现。传统上，面孔失认症被认为主要影响身份识别，而检测能力得以保留。然而，本研究表明，如果检测和识别都严重依赖来自眼睛区域的高频信息，那么一些患者在提取这种关键信息上存在普遍困难，就可能同时表现出检测和识别的缺陷。这为理解Xu和Biederman（2014）等研究中报道的患者同时存在检测障碍提供了合理的解释。

此外，研究结果对理解面孔处理的时间进程（如事件相关电位ERP中的N170和N250成分）也有启发。如果N170反映了早期的面孔分类（检测）过程，而N250与更精细的身份识别相关，那么本研究发现检测也依赖较宽范围的空间频率（识别则更集中于中高频），这可能有助于澄清这些ERP成分各自对应的信息处理阶段。

5.1. Limits

当然，研究也存在一些局限性。实验设计（如使用单刺激、静态灰度正面无表情图片）可能无法完全捕捉现实世界中动态、杂乱环境下的面孔检测复杂性。此外，研究本质是探索性的，虽然揭示了信息模式的重叠，但并不意味着检测和识别的认知或神经机制是等同的。三个实验各有优劣，但它们从不同角度为理解面孔检测机制提供了互补的见解。

5.2. Future Directions

未来研究可以结合脑电（EEG）等神经影像学方法，探索面孔检测的时间动态，明确N170/N250等成分与不同空间频率信息处理的关系。测试更多样化的人群（如面孔失认症患者、不同文化背景者）也有助于验证眼睛区域高频信息依赖的普遍性。

6. Conclusion

总而言之，这项研究有力地表明，面孔检测并非面孔识别之前一个简单、粗糙的前奏。相反，它从最初阶段就开始选择性利用那些对面孔识别同样至关重要的诊断性特征——尤其是眼睛区域的高频细节信息。这一发现不仅挑战了将检测与识别严格区分的传统模型，也为理解面孔失认症等障碍提供了一个统一的视角：其核心缺陷可能在于无法有效提取或整合眼睛区域的关键信息，这一缺陷会同时影响检测和识别等多个下游处理阶段。尽管面孔检测是整个面孔处理流程的“大门”，但它仍然是相对被忽视的研究领域。这项研究强调了深入探索这一基础感知阶段的必要性，它对于我们构建完整的人脸感知理论模型具有根本性的重要意义。

热点排行

新闻专题