信号检测论(Signal Detection Theory, SDT)结合多级模型(Multilevel Models)在二元判断(Dyadic Judgments)中的应用:心理学研究中带交叉随机效应的实用教程
《Methods in Psychology》:Signal Detection Theory with Multilevel Models for Dyadic Judgments: A Practical Tutorial for Psychological Research
编辑推荐:
心理学各领域的研究人员常使用原始正确率(raw accuracy scores)解释二分类判断数据,但该方法混淆了辨别力(sensitivity)与反应偏向(response bias),且受不等基线率(base rates)影响。信号检测理论(Signal
心理学各领域的研究人员常使用原始正确率(raw accuracy scores)解释二分类判断数据,但该方法混淆了辨别力(sensitivity)与反应偏向(response bias),且受不等基线率(base rates)影响。信号检测理论(Signal Detection Theory, SDT)为此提供了原理性替代方案,然而多数教程聚焦于单一知觉者任务,未涉及人际与行为研究中的多级结构(multilevel structure)。本教程拓展了标准SDT应用,演示如何在带交叉感知者—目标(crossed perceiver and target)设计的二元判断数据中,将SDT参数嵌入多级广义线性模型(multilevel generalized linear models)进行估计。教程介绍了SDT基本概念,说明如何将SDT参数转化为probit混合模型系数,并提供拟合带交叉感知者与目标随机效应模型的可复现代码,同时给出基于模拟的研究设计指导及用于交互探索核心概念的Shiny应用程序。虽以浪漫兴趣(romantic interest)判断为例演示,该工作流程可推广至任意涉及二分类决策与多级数据结构(multilevel data structures)的心理学领域。
【研究背景与意义】
传统心理学中二元人际判断(如判断交往对象是否对自己有兴趣、是否说谎、是否见过某刺激)常以原始正确率(proportion correct)为指标,但该指标混淆了两个独立心理过程——区分信号与噪声的能力即辨别力(d′或sensitivity),以及作出"是"反应所需的内部证据阈值即决策标准(criterion, c或bias);此外正确率随信号基线率(base rate/prevalence)变化而变化,在不同范式、样本间无可比性。经典SDT可从击中率(Hit Rate, HR)与虚报率(False Alarm Rate, FAR)求得d′和c,但传统做法需先聚合数据、不便纳入预测变量或处理交叉设计(crossed design)下的人际判断数据(同一感知者评多个目标,同一目标被多个感知者评价)。本研究由Iliana Samara发表于《Methods in Psychology》,旨在将等方差SDT(equal-variance SDT)框架嵌入probit联结函数的广义线性混合模型(Generalized Linear Mixed Model, GLMM / probit GLMM),在试次水平(trial-level)保留信息、纳入感知者与目标的双交叉随机效应(crossed random effects: (1+signal|perceiver_id)+(1|partner_id)),直接从后验或最大似然估计中提取群体及个体水平d′和c,并说明编码方式(0/1编码时d′=β_signal, c=?(α+β_signal/2);效应编码?0.5/+0.5时d′=β_signal/2, c=?α/2)、组间差异解读(主效应反映标准偏移,signal×group交互反映辨别力差异)、常见误用规避及基于模拟的功效分析,附R与brms可复现代码及交互Shiny App。该研究使研究者能在控制dyadic非独立性前提下检验敏感度和标准的预测因子影响,解决accuracy paradox带来的理论误判问题。
【主要关键技术方法】
研究人员采用模拟速配(speed-dating)范式下的二元判断数据集(每感知者评判多名伴侣,signal=伴侣真实是否有意(0/1),response=感知者答"有意"(1/0)),设定不等基线率(如15%真有兴趣),按0/1不中心化编码signal变量。建立probit联结GLMM:Φ?1(P(response=1))=α+β_signal×signal+u_perceiver(截距)+v_target(截距)+w_perceiver×signal(感知者随机斜率),其中固定效应β_signal即d′, 截距α参与计算c=?(α+β_signal/2)。采用贝叶斯估计(brms包, Stan后端)设弱信息先验——Intercept~N(0,1.5)、signal斜率~N(0,1)、随机效应SD~Exponential(2),亦可用频因MLwiN/lme4拟合。从后验抽取计算d′和c及组间对比;用模拟不同感知者数×试次数重复拟合评估截距SE以指导样本量设计;提供Shiny App交互演示d′/c变动对HR/FAR/ROC等影响。
【研究结果】
为何浪漫判断需用Signal Detection Theory——accuracy隐藏了什么(Why Signal Detection Theory for Romantic Judgments — What accuracy hides):研究人员指出正确率=prevalence×HR+(1?prevalence)×(1?FAR),固定d′和c时改变prevalence会改变正确率,举男女同等d′但不同c时正确率差异误导为能力差异,说明必须用SDT分解sensitivity与criterion。
解决方案:Signal Detection Theory(The solution: Signal Detection Theory):研究人员阐述等方差SDT两正态分布(噪声N(0,1)、信号N(d′,1))重叠,d′为分布中心距(辨别力),c为决策阈限在潜证据轴上的位置(负值为宽松liberal偏说"是",正为保守conservative偏说"否"),HR=Φ(d′/2?c),FAR=Φ(?d′/2?c);强调回归型SDT允许加入预测变量与多级结构。
为何Dyadic数据需Multilevel SDT(Why multilevel SDT is needed in dyadic data):研究人员说明速配数据为感知者×目标交叉结构,忽略交叉随机效应会低估标准误、掩盖个体及目标异质性,需在GLMM中加入(1+signal|perceiver_id)与(1|partner_id)。
为何Speed-Dating是理想范式(Why speed-dating is an ideal paradigm):研究人员指出速配有可验证互配结果、不确定下yes/no试次级判断、天然dyadic三优势适合演示HR/FAR/d′/c计算、ROC模式及不等prevalence下设计规划。
核心SDT概念(Core SDT Concepts for Romantic Judgments):研究人员介绍两过程(证据累积与阈值决策)、重叠分布直觉、速配判断混淆矩阵(Hit=准确感知有意, False Alarm=过度感知/overperception, Miss=低估/underperception, Correct Rejection)、由计数算d′=z(FAR)?z(HR)与c=?[z(HR)+z(FAR)]/2之例,及ROC空间中等d′曲线(iso-sensitivity contours)与沿曲线移动=标准偏移、跨曲线=辨别力变化。
Dyadic数据的完整回归工作流(A complete regression workflow for dyadic data):
- •
Step 1 数据结构(Structure the data):每行一感知者—目标判断,含perceiver_id, partner_id, signal(0/1), own_interest(可选试次级协变量), response(0/1),不中心化signal。
- •
Step 2 设定Probit GLMM(Specify the Probit GLMM):模型Φ?1(P(Y_ij=1))=α+β×signal_i+randomeffects,解释β→d′, α→参与计算c,含感知者随机截距+随机signal斜率及目标随机截距。
- •
Step 3 拟合模型(Fit the Model):用brms语法family=binomial(link="probit")设弱信息先验并采样。
- •
Step 4 提取d′和c(Extract d′ and c):群体d′=posterior median(β_signal),c=?(α_median+β_signal_median/2);各感知者可据BLUP算个体d′_i,c_i。
- •
Step 5 可视化与解读(Visualize and interpret the estimates):转化SDT参数→绘ROC点及等d′轮廓、d′/c后验分布;组主效→c差异,signal×group→d′差异(0/1编码伴c修正Δc=?(γ_group+β_interaction/2))。
组别操作示例(Group manipulation example (A vs B)):研究人员加入group主效应与signal×group交互,Group A: d′A=β, c_A=?(α+γ_A+β/2+β_interaction/2若A为参照); Group B: d′B=β+β_interaction, c_B=?(α+γ_A+γ_group+(β+β_interaction)/2),演示男女仅有c差异(男更liberal)无d′差之情形,说明沿同一条iso-d′线移动。
常见陷阱与规避(Common Pitfalls and How to Avoid Them):研究人员提醒须报告prevalence;零单元格问题用试次级层级模型partial pooling解决而非+0.5校正;稀疏数据勿聚合至个人水平;须含交叉随机效应防I类错误膨胀;收敛问题调adapt_delta或稍正则先验;勿用accuracy作推断目标;不过度解读微小d′差异。
设计规划与模拟精度(Design planning and simulation-based precision):研究人员在设定感知者异质性(random intercept SD=0.25)、d′≈0.8、c≈0.3、15% signal base rate下,多次模拟不同N_perceivers×N_dates并拟合简化GLMM获截距SE,示40感知者×10次约达SE≤0.15目标,建议依自身假设参数重跑模拟。
【讨论与结论翻译】
本研究表明正确率混淆了辨别力与决策标准致跨情境不稳定及机制难解,将表现分解为d′(区分信号与噪声之能力)与c(决策阈值)可澄清组差异源于线索分辨还是反应偏向。速配范例展示此原则适用于带交叉感知者—目标效应的二元社会判断,工作流程涵盖试次级数据→probit GLMM→参数提取→ROC解读,附带模拟法检验计划研究精度。若干人际知觉理论争议(如Error Management Theory主张男性对性兴趣持更宽松标准而非更低d′)可藉SDT区分sensitivity shift与criterion shift加以检验。该probit系数→SDT参数映射亦适用于participant嵌套或participant×stimulus交叉等其他设计,仅需调整随机效应结构。教程假定等方差高斯SDT与二分类反应,可扩展至不等方差模型(允许信号分布σ≠1)及含自信等级之有序probit模型(多阈值提升d′估计)。SDT为测量模型需结合实质理论解释为何取某c或关注何线索;SDT参数不受prevalence影响使跨研究比较可行。综上,SDT为社会心理学家提供分离"能感知"与"愿推断"之实用途径,此流程不限于浪漫/性兴趣判断,广泛适用于具多级结构的二分类决策如情绪识别、人物知觉、谎言检测、人际敏感性及再认记忆判断,在不等基线率与错误代价不对称领域分离d′与c是获得可诠释推论之必要条件,采纳此框架可增强人际知觉研究跨研究可比性及与辨别—阈值理论的联系。