针对体验采样方法（ESM）研究，对Body Appreciation Scale-2（SBAS-2）的简化版、州级版本（SBAS-2SF）进行了验证

《Body Image》：Validation of a short-form, state version of the Body Appreciation Scale‐2 (SBAS-2SF) for use in experience sampling method (ESM) studies

【字体：大中小】 时间：2026年05月11日 来源：Body Image 5.4

编辑推荐：

　　大卫·威林格（David Willinger）、斯特凡·斯蒂格（Stefan Stieger）、维伦·斯瓦米（Viren Swami）奥地利克雷姆斯卡尔·兰德斯坦纳大学（Karl Landsteiner University）心理学系心理方法学部门摘要身体欣赏是积极身体形

　　大卫·威林格（David Willinger）、斯特凡·斯蒂格（Stefan Stieger）、维伦·斯瓦米（Viren Swami）
奥地利克雷姆斯卡尔·兰德斯坦纳大学（Karl Landsteiner University）心理学系心理方法学部门

摘要
身体欣赏是积极身体形象构建的一个重要方面，可以以特质或状态变量的形式进行测量。身体欣赏的特质测量显示出良好的心理测量属性，但关于状态测量的研究较少，尤其是在经验样本方法（ESM）研究中。本文评估了身体欣赏量表-2（Body Appreciation Scale-2，简称SBAS-2）的简短（3项）状态版本在ESM研究中的心理测量属性（样本量N = 100，项数k = 2187）。结果表明，SBAS-2SF作为特质测量工具具有良好的复合可靠性，并且在日常状态层面也表现出高可靠性（ICC范围为0.81–0.84，泛化系数ρ2 = 0.96）。方差分解显示，大部分变异（73.7%）反映了个体间的稳定差异。多层次验证性因素分析支持其在个体内和个体间层面都呈现单一维度因子结构，且各因子载荷均较强。同时效度通过其与积极唤醒、消极唤醒和自我评估心理健康的适度至强相关性得到支持，同时每日得分聚合值与特质得分之间的高度一致性也证明了这一点。连续时间模型显示，身体欣赏反映了一个高度自我稳定的动态过程（漂移系数a = -1.22），同时仍对日常情绪输入敏感：积极唤醒会对身体欣赏产生正面影响，而消极唤醒和较差的心理健康状况则与较低的身体欣赏水平相关。这些结果表明，SBAS-2SF可用于ESM研究中评估身体欣赏构建，尽管进一步验证工作仍有必要。

1. 引言
身体欣赏被定义为“接受并持有对身体的积极看法，同时拒绝媒体推广的外表理想作为人类美的唯一形式”（Tylka & Wood-Barcalow, 2015a, p. 53）。在当代理论中，身体欣赏被认为最精确地体现了积极身体形象这一更广泛的构建（Swami et al., 2020, Tylka and Wood-Barcalow, 2015b）。此外，身体欣赏通常被视为积极身体形象的一个特质方面，即代表个体对身体的感激、爱和尊重的稳定和普遍倾向（Tylka, 2018; 2019）。这一特质方面通常通过10项的身体欣赏量表-2（Body Appreciation Scale-2，简称SBAS-2）来操作化（Tylka & Wood-Barcalow, 2015a），该量表已被证明具有单一维度因子结构，并在不同群体（如Swami et al., 2023）和国内（如Guan et al., 2026; Soulliard & Vander Wal, 2022）中展现出稳健的心理测量属性。虽然身体欣赏的特质测量已经得到充分验证，但越来越多的人关注从动态、瞬时状态的角度来理解积极身体形象，这也是本研究关注的焦点。

1.1. 状态身体欣赏与简短测量工具的需求
在状态层面，身体欣赏反映了个体在任何给定时刻或短时间内（例如一天之内）对身体的感受和思考方式（Tylka, 2019; Tylka & Wood-Barcalow, 2025）。在实验性和短期干预性研究中，了解这些状态体验尤为重要（例如Couto & Willoughby, 2024; Czepczor-Bernat et al., 2024; Swami, Mohd. Khatib et al., 2020），研究人员希望知道某些情境、经历或日常事件是否会影响状态结果。身体欣赏的这一状态方面通常使用身体欣赏量表-2的状态版本（SBAS-2；Homan, 2016）进行测量，该量表已被证明具有单一维度因子结构（例如Swami, Graf et al., 2024）和足够的聚合效度（Homan, 2016）。然而，SBAS-2的一个缺点是它的长度较长，这可能会增加重复使用时的成本和参与者的负担。一些学者尝试通过使用缩略版SBAS-2来克服这一问题（例如仅包含部分项目；Swami et al., 2022a, Swami et al., 2022b）。虽然这些方法有时可行，但也存在产生人为误差的风险，因为改编后的工具可能缺乏足够的可靠性和/或有效性。例如，在最近的一项每日日记研究中，Batchelor等人（2025）使用了缩略版的SBAS-2（项目条目被修改为指代自上次评估以来的时间），该版本包含了四个因子载荷最高的项目。尽管这个版本的工具具有足够的复合可靠性，但没有报告这四个项目是否仍保持单一维度因子结构。

最近，Tylka等人（2022）开发了SBAS-2的简短版本（SBAS-2SF）。具体来说，他们开发了一个基于理论的3项版本（即根据项目对身体欣赏构建的独特贡献进行选择）和一个基于遗传算法的2项版本。在五项研究中，Tylka等人（2022）报告称，这两种版本的SBAS-2SF都具有良好的心理测量属性，包括单一维度因子结构、足够的复合可靠性、与原始SBAS-2的强相关性以及良好的构念效度。SBAS-2SF的开发预计将通过减少参与者负担和研究成本来促进研究，尤其是3项版本，它为学者提供了用最少的项目数量估计潜在身体欣赏因子的机会（Tylka et al., 2022）。然而，SBAS-2SF是否适合用于密集型纵向研究仍有待验证。因为这些工具最初是为了评估身体欣赏的特质而开发的，它们作为简短状态版本的有效性尚未得到证明。这对于采用密集型纵向设计的研究尤为重要，例如每日日记或经验样本方法（ESM；有时也称为生态瞬时评估或流动评估），在这种方法中，参与者被要求在一段时间内的多个时间点完成简短调查（例如每日结束时或每周多次的半随机时间点；Bolger & Laurenceau, 2013; Mehl & Conner, 2012）。由于ESM研究的目标是生成密集型、纵向和生态有效的数据，因此需要确保使用的工具在适应状态层面评估时是简短、可靠和有效的（Bolger and Laurenceau, 2013, Fuller-Tyszkiewicz, 2019, Stieger and Kuhlmann, 2018）。

1.2. 本研究的目的
本研究旨在评估SBAS-2的状态版本（以下简称SBAS-2SF）在每日日记和ESM研究中的心理测量属性。状态测量通常为一次性应用进行验证，主要通过参考相应的特质测量来确认构念效度（例如通过与个体间特质测量的关联、报告复合可靠性，以及偶尔在两个时间点进行重测信度）。然而，在ESM研究中，状态测量会在一段时间内反复进行（例如在几周内每天多次）。这种密集的纵向结构使得心理测量评估更加细致，因为它区分了两层面的变异：个体间层面（个体间的稳定差异）和个体内层面（个体随时间的变化）。一个测量在个体间层面表现良好的证据并不一定意味着它在个体内层面也能有效地发挥作用。因此，应检查个体内的构念效度，例如使用多层次验证性因素分析（M-CFA）来测试项目是否在个体内部和个体之间都加载到同一潜在因子上（Gabriel et al., 2018）。同样的区分也适用于构念效度，它可以在个体内和个体间层面进行评估。个体内的构念效度可以通过比较瞬时偏差（例如，个体内的瞬间身体欣赏增加是否与瞬间心理健康相关）来评估，而个体间的构念效度可以通过检查个体水平聚合值（例如，个体在整个ESM期间的平均身体欣赏）与特质身体欣赏或其他个体间测量的相关性来评估。同样，也应在这两个层面评估信度。除了传统的个体间复合可靠性指标（例如Cronbach's α、McDonald’s ω或其他类似系数）外，ESM数据还允许估计个体内的可靠性；即，测量工具上的得分在多大程度上能可靠地检测到个体内的变化，而不仅仅是区分不同个体。

与传统的状态工具验证相比，ESM设计还允许研究时间动态，例如个体项目（或工具得分）随时间的变化轨迹。对于瞬时测量，研究响应随时间的持续性（例如通过自回归效应和自相关）以及变异量反映了多大的有意义背景敏感性与随机噪声有关（Beal, 2015）通常是有信息量的。使用动态模型（例如多层次时间序列或动态结构方程模型），可以估计潜在构念的自回归延续性、构念在受到干扰后恢复到典型水平的速度、未解释的个体内变异量，以及时间依赖的关联（例如，另一个变量如何随时间影响潜在过程）。因此，本研究的目标不仅仅是验证SBAS-2的经典状态版本，而是开发和评估一个适应ESM背景的版本（即它对个体内变化敏感，并在个体间和（纵向的）个体内层面上都得到心理测量支持）。

2. 方法
2.1. 参与者和样本量分析
参与者（N = 100）均为德语使用者（来自奥地利和德国），平均年龄为36.0岁（标准差SD = 13.73，范围：18–77岁；1.0%数据缺失）。大约三分之二的参与者为女性（65.0%；男性33.0%；其他性别1.0%；1.0%数据缺失）。在教育资格方面，1.0%未完成任何正规教育，4.0%完成了中等教育，19.0%获得了学徒证书，28.0%获得了进一步的教育证书，44.0%拥有大学学位（3.0%其他资格；1.0%数据缺失）。我们设定目标样本量为N = 100，这是基于先前的模拟结果，即大约2000个总观测值足以稳定估计连续时间模型（Driver & Voelkle, 2018）。为了正式评估我们最终分析样本（n = 98，k = 2140）的充分性，我们使用R语言的simr包进行了事后敏感性Power分析（Green & MacLeod, 2016）。模拟结果显示，检测小的个体内关联的功率大于99%（β = 0.10，α = 0.05），检测非常小的效应的功率为70%（β = 0.05），确认研究具有足够的统计功效。

2.2. 程序
本研究符合机构要求和《赫尔辛基宣言》。由于研究是非侵入性的、匿名的，不涉及制度化参与者（例如患者），参与是自愿的，并且所有参与者均年满18岁或以上，因此无需正式的伦理批准（即豁免政策）。招募采用了多种策略，包括口口相传、来自先前ESM研究的参与者数据库，以及Prolific众包平台（Palan & Schitter, 2018）。我们使用开源平台ESMira（Lewetz & Stieger, 2024）进行项目管理和数据收集。在通过ESMira注册过程中，参与者被提供了项目信息并签署了数字知情同意书。随后，参与者完成了初始调查（基本人口统计信息）和行为调节问卷（BREQ；Rausch Osthoff, 2017），但本研究中未使用这些数据。在28天的时间里，参与者被要求完成每日结束时的调查，包括自我评估的心理健康（1项）和3项的SBAS-2SF（Tylka et al., 2022，我们将其修改为状态版本），以及Russell等人（1989）的情绪网格（见第2.3节）。该调查还包括一项关于身体活动的信息和一项关于智能手机电池状态的信息，但这些信息在本研究中未使用。每日结束时的通知由ESMira自动发送（当地时间晚上7:00，60分钟后提醒，Android智能手机上300分钟后自动删除）。参与者可以调整通知时间以适应个人日程（例如轮班工作）。在4周结束后，参与者完成了最终横断面调查，包括关于一般心理健康的特质方面（1项）、3项的SBAS-2SF（Tylka et al., 2022），以及过去一个月的运动活动（这项数据在本研究中未使用）。

2.3. 测量工具
2.3.1. 身体欣赏量表-2简短版本
参与者完成了德语版本的身体欣赏量表-2（BAS-2；Behrend & Warschburger, 2022）中的项目。在当前研究中，我们特别关注了由三个项目组成的3项简版量表（BAS-2SF；Tylka等人，2022年）的分析，而其他项目则被排除在外。德语版本的特质量表项目来源于Behrend和Warschburger（2022年）的研究：“我欣赏自己身体的不同和独特之处”、“我对自己身体充满爱”以及“我尊重自己的身体”。为了本次研究的需要，我们对参与者的指导语进行了修改，要求他们参考过去一个月的情况。该量表的情境版本的項目相同，但指导语修改为参考过去的一天。特质和情境版本都使用了视觉模拟量表来进行回答，评分范围从1（完全不适用于）到100（完全正确；参见Homan，2016年）。

2.3.2. 自报心理健康
为了评估心理健康，我们使用了单项目自评心理健康量表（SRMH；Ahmad等人，2014年）。在特质版本中，参与者被要求用一个5点量表（1=非常好，5=非常差）来回答一个项目（“总体而言，你认为你的心理健康如何？”）。在每日结束时进行的调查中，参与者也被要求用相同的量表来回答一个项目（“你如何评价你今天的心理健康？”）。由于该量表没有德语版本，我们使用回译法（Brislin等人，1973年）将特质和情境版本从英语翻译成德语。德语版本可从相应作者处获得。

2.3.3. 激动状态
在每天的调查中，使用二维情绪网格模型（Russell等人，1989年）的数字实现来评估参与者的当前情绪状态。参与者通过滑动条（即视觉模拟量表）对两个独立且连续的维度进行评分：价值维度（1=非常不愉快到100=非常愉快）和激活维度（1=困倦到100=高激活状态）。这些结构在之前的ESM研究中已被可靠地使用（例如，Swami等人，2022a，Swami等人，2022b）。为了将这些维度转换为理论上稳健的正激活（PA）和负激活（NA）测量值，我们对二维情绪空间进行了45°旋转。这种程序由Knutson等人（2005年）提出，可以推导出更常被解释的情绪结构。
PA=激活+价值
2NA=激活?价值
这种转换重新定向了原始轴，使得PA维度捕捉到以高能量和愉悦为特征的情绪状态（例如，热情、兴奋），而NA维度捕捉到以高能量和不适为特征的状态（例如，压力、焦虑）。这些衍生的PA和NA分数被用于所有后续的动态分析中。

2.4. 统计分析和数据可用性
所有统计分析都是在R版本4.5.1（R核心团队，2021年）中使用的，使用了lavaan（Rosseel，2012年）、gtheory（Moore，2016年）和ctsem（Driver等人，2017年）软件包。所有数据、分析脚本和材料都可以在https://osf.io/8v4uq网站上找到。

2.4.1. 评估数据质量和预处理
在我们100名参与者中，依从性很高：平均每位参与者完成了21.9份调查（标准差=8.5），中位数是26.5，众数是28份调查（平均值=78.1%，中位数=94.6%，范围=1-29）。需要注意的是，有一名参与者因为意外提交了29份调查；然而，我们决定保留这些数据。对于涉及特质水平预测因子或人口统计特征（例如，性别认同、最终BAS-2SF得分）的分析，由于缺失的特质水平数据，样本量略有变化。对于连续时间模型，我们排除了两名没有提供性别认同信息的参与者，因此共有98名参与者提供了2140份完整的日终调查数据用于纵向分析。对于涉及特质变量的分析（例如，状态平均值与最终BAS-2得分之间的关系），我们采用了列表删除法处理缺失案例，最终得到分析样本量为84人。

2.4.2. 可靠性
为了评估BAS-2SF的复合可靠性（即特质测量），我们计算了最终研究调查的Cronbach的α系数和McDonald的ω系数。其次，为了量化日常状态评估的可靠性并将其方差分解为稳定部分和波动部分，我们使用了泛化理论（G-Theory）。实施了人×项目×情境设计来估计可归因于人、项目、测量情境及其交互作用的方差组分。泛化系数（ρ2）类似于Cronbach的α系数，反映了总观察方差中可归因于项目间和情境间真实分数差异的比例。作为补充分析，我们还基于混合效应模型计算了每个项目的类内相关系数（ICC），以量化可归因于个体间稳定差异的总方差比例。

2.4.3. 内部结构
为了测试SBAS-2SF在稳定和动态情境下的假设性单维因子结构，我们使用R中的lavaan软件包进行了多层次验证性因子分析（M-CFA）。该模型同时评估了个体内部水平（第1层，代表状态变异）和个体间水平（第2层，代表特质变异）的因子结构。在每个层次上都指定了一个潜在因子。由于该量表由三个项目组成，这些项目都加载到一个因子上，因此模型在这两个层次上都是饱和的；因此，我们根据标准化因子载荷来评估模型。

2.4.4. 同时效度和动态效度
为了评估同时效度，我们计算了SBAS-2SF分数与其他相关结构之间的皮尔逊相关系数。首先，我们计算了每日SBAS-2SF分数的平均值与最终特质BAS-2SF分数之间的相关性，以确定状态-特质的一致性。其次，我们检查了SBAS-2SF与正激活和负激活的测量值以及自我报告的心理健康之间的相关性。此外，为了确定这些关联是否仅仅反映了普遍的正向情绪偏见，我们进行了分层多元线性分析来评估状态测量的增量效度。在第一步中，我们将每日正激活、负激活和自我报告的心理健康作为最终特质身体欣赏的预测因子。在第二步中，我们将每日SBAS-2SF的汇总分数加入模型以评估额外的独特方差。最后，为了研究动态标准相关效度，我们采用了连续时间结构方程建模（Driver & Voelkle，2018年）。指定了一个潜在过程模型，其中SBAS-2SF的潜在因子作为结果变量。每日正激活、负激活和自我报告的心理健康被作为随时间变化的预测因子包括在内。该模型允许估计三种关键参数类型：（1）漂移参数，代表身体欣赏激活在受到干扰后返回基线的速度；（2）扩散协方差，代表潜在身体欣赏过程中的未解释随机波动的大小；（3）时间依赖效应参数，代表预测变量随时间对潜在过程的影响。此外，还包含了性别认同作为时间独立的调节变量，以测试测量不变性和差异性动态效应。有两名参与者因缺乏性别认同数据而被排除在分析之外。

3. 结果
3.1. 可靠性和方差分解
为了评估SBAS-2SF适用于纵向测量的适用性，我们首先检查了三个项目的类内相关系数（ICC）。这些值在.81到.84之间（见表1），确认虽然项目分数在个体内部非常一致，但它们保留了足够的时间变化能力来追踪动态变化。G-Theory分析显示，SBAS-2SF分数的大部分方差（73.7%）可归因于个体间的稳定差异，表明该量表捕捉到了一个稳健的特质类成分。然而，相当一部分方差也归因于个体与情境之间的交互作用（8.7%）和残差误差（9.2%），这表明了有意义的个体内波动，从而证明了每日评估的合理性（见表2）。个别参与者的轨迹和依从模式在图1中进行了可视化。这个3个项目组成的量表在纵向评估中显示出非常好的可靠性（泛化系数ρ2=.96）。

表1. SBAS-2SF状态项目的类内相关性和方差分量。
项目之间内部
ICC1 47 1.49
2 9 5.49
3 8 1.78

注：N=100；ICC=类内相关系数。

表2. SBAS-2SF的可靠性：方差分解。
来源方差百分比
测量：个体 44.6 28.7
项目 38.7 47.6
测量：项目 37 6.2
0.2 10.0
项目 37 9 73.7
0.3 0.1

注：N=100；下载高分辨率图片（350KB）
下载全尺寸图片

图1. 参与者的依从性和个体身体欣赏状态轨迹（SBAS-2SF）。每列代表一名参与者（N=100），按他们的BAS-2SF得分中位数从左到右排序。y轴显示了顺序测量编号，说明了依从率（列高度）和脱落模式。颜色表示每次评估时各项目的平均SBAS-2SF得分（范围1-100）。

3.2. 内部结构
M-CFA的模型评估侧重于标准化参数估计的幅度。所有因子载荷在两个分析层次上都具有统计学意义（p<.001）。在个体内部层面，标准化载荷范围从λ=.65到λ=.76。在个体间层面，标准化载荷非常高，范围从λ=.92到λ=.99。值得注意的是，其中一个项目（“我对自己身体充满爱”）在个体间层面的载荷接近完美，表明它是潜在结构的特别强有力标志。

3.3. 同时效度
如表3所示，汇总的SBAS-2SF分数与最终的BAS-2SF特质分数显示出非常高的相关性（Cronbach α=.94；McDonald ω=.94；相关性：r=.94，p<.001），这提供了强有力的证据，表明每日简版评估的平均值捕捉到了与完整特质测量相同的潜在结构。

表3. 按性别划分的汇总SBAS-2SF分数与同时效度测量之间的相关性。
总样本（N=100）女性（N=65）男性（N=33）
状态测量（汇总）正激活 .69 .66
负激活 -.46 -.42
SRMH -.64 -.66
特质测量（最终调查）* BAS-2SF（特质）.94 .84

注：SRMH=自我报告的心理健康。*特质相关性基于减少的样本量（Ntotal=84，Nwomen=56，Nmen=27，Nother=1），因为最终调查中有样本流失。

在情绪状态的同时效度方面，汇总的每日身体欣赏与汇总的正激活呈正相关（r=.69，p<.001），并与负激活呈负相关（r=-.46，p<.001）。我们还观察到与自我报告的心理健康（r=-.63，p<.001）呈负相关。当按性别认同分层时，相关模式基本保持一致，尽管某些幅度有所不同。男性表现出身体欣赏与负激活之间更强的反比关系（r=-.62），而女性表现出身体欣赏与心理健康特质分数之间更强的反比关系（r=-.71）。

在分层多元线性分析中，评估增量效度时，将汇总的SBAS-2SF纳入第二步解释了特质身体欣赏的显著比例的额外方差，F(1, 79) = 227.75，p<.001，ΔR2=31.3%。此外，当将SBAS-2SF加入模型时，之前显著的正激活和负激活效应变得不显著（所有p>.54）。这些发现表明，状态身体欣赏测量捕捉到了超出一般情绪和心理健康状态之外的独特、特定于身体的方差。

3.4. 动态标准效度
为了研究SBAS-2SF的动态标准效度，我们估计了一个连续时间过程模型。参数估计和95%置信区间（CIs）在表4中呈现。身体欣赏的自主回归漂移参数为负值且显著（a=-1.22，95% CI [-1.40，-1.06]），表明存在一个自我调节过程，可以快速恢复到基线。具体来说，这对应于大约14小时的半衰期，表明每日偏离在24小时周期内大部分会消散（见图2）。

表4. 追踪身体欣赏的连续时间SEM参数的参数和95%置信区间。
参数均值 95% CI
性别 95% CI
测量模型 λitem1 1.00 (.)
λitem2 1.21 [1.10, 1.31] -.04
λitem3 1.12 [1.02, 1.22] 0.02
Var(εitem1) 0.30 (.29, .32)
Var(εitem2) 0.29 (.28, .30)
Var(εitem3) 0.31 (.29, .32)
漂移矩阵（A） -1.22 [-1.40, -1.06]
扩散协方差（GdW） 0.31 [0.28, .34]

注：N=98名参与者，k=2140份完整调查；所有显性变量在分析前都进行了标准化。

图2. SBAS-2SF的动态脉冲响应函数。该图表展示了在预测变量出现标准化瞬时增加（1标准差“冲击”）后，潜在身体欣赏的预计轨迹。实线代表基于连续时间参数估计的预期效应；阴影区域表示从模型标准误差得出的95%置信区间。正激活（绿色）预测身体欣赏的立即增加，而负激活（橙色）和SRMH症状（红色）预测减少。正如预期，积极的情绪唤醒显著预测了身体欣赏感的增加（γ = 0.14，95%置信区间[0.11, 0.16]），而消极的情绪唤醒（γ = -0.05，95%置信区间[-0.07, -0.04]）和心理健康状况（γ = -0.09，95%置信区间[-0.11, -0.07]）则预测了随后的下降。最后，我们考察了性别认同是否调节了测量结构或动态效应。所有关于性别调节变量的置信区间都通过了零点检验，这表明测量方差不变性（不同性别的因素载荷没有显著差异）以及动态等价性（情绪和心理健康对身体欣赏感的影响在男性和女性之间是可比的）。

4. 讨论
本研究的主要目的是评估适用于纵向研究的3项目SBAS-2SF的心理测量特性。鉴于关于积极身体形象和身体欣赏感的研究迅速发展（Tylka, 2018, Tylka, 2019），迫切需要一些心理测量学上可靠的工具，以使学者们能够确信他们正在测量的是潜在的结构。虽然已经有很多学术工作致力于建立BAS-2的心理测量特性（例如，Tylka & Wood-Barcalow, 2015a; Swami et al., 2023），但也有必要考虑该工具的简短版本（状态版本）的心理测量特性。总体而言，我们的结果显示SBAS-2SF具有非常好的每日信度，并在个体内部和个体之间都保持了单一的因素结构，且因素载荷的一致性很强。此外，SBAS-2SF的分数显示出强烈的同时效度，而连续时间建模显示身体欣赏感这一结构反映了一个高度自我稳定的动态过程，对日常情感输入非常敏感。我们得出结论，研究人员可以放心使用这一简短工具来可靠地测量状态身体欣赏感，而不会给参与者的经验采样（ESM）设计带来过重的负担。下面我们将更详细地讨论这些发现。

4.1. 纵向信度和内部结构
我们对SBAS-2SF的纵向信度评估表明，尽管个体内部的分数高度一致，但它们仍保留了足够的时间变化，以便在4周的测试期间追踪动态变化。此外，我们的G理论分析显示，虽然SBAS-2SF分数的大部分变异可以归因于个体间的稳定差异，但也有相当一部分可以归因于个体与情境之间的交互作用。总之，这些结果表明SBAS-2SF能够捕捉到有意义的日常身体欣赏感变化，并且可以通过经验采样方法随时间检测到这些变化。值得注意的是，尽管先前的研究已经证明负面身体形象指数（例如，Sala et al., 2021）和积极身体形象指数（例如，身体满意度；Griffiths & Stefanovski, 2019）在一天之内会发生变化，但我们的发现特别扩展了这一证据，适用于身体欣赏感这一结构。虽然我们的研究设计关注的是日间的变化，但我们的结果为越来越多的证据提供了支持，表明身体欣赏感可以被理解为一种动态状态，它会根据日常经历而发生变化。

4.2. 因子有效性评估
SBAS-2SF的因子有效性评估表明，在个体内部和个体之间的分析层面，单一模型都是稳定的。换句话说，SBAS-2SF的三个项目在个体之间以及个体随时间的变化中都单一地评估了一个潜在的身体欣赏感结构。这与先前的报告一致，即3项目版本的BAS-2SF保持了单一结构（Fekih-Romdhane et al., 2023, Tylka et al., 2022）。实际上，也与先前的研究（Tylka et al., 2022）一致，我们的结果显示标准化载荷在个体内部和个体之间都非常好。在个体间层面，其中一个项目（“我对我的身体有爱”）的载荷特别值得注意。Tylka等人（2022）也报告说，这个项目的CFA载荷特别高，表明它可能是潜在身体欣赏感的强烈标志。

4.3. 同时效度和动态标准效度
本研究的结果还表明，SBAS-2SF的分数具有良好的同时效度。首先，SBAS-2SF的总分与身体欣赏感的特质有非常强的相关性。这表明SBAS-2SF可能捕捉到了与其特质对应测量相同的潜在结构。其次，SBAS-2SF的分数与积极和消极的情绪唤醒以及心理健康状况有显著且中等到强的关联。总体而言，前一组结果与先前的ESM研究一致，这些研究表明状态身体形象的结果与状态情绪有关（例如，Stieger et al., 2022）。同样，状态身体欣赏感与心理健康之间的关联也得到了证据的证实，至少在使用特质测量时是这样的（例如，Linardon et al., 2022, Linardon et al., 2023; Swami, Voracek et al., 2024）。我们的数据中也有一些迹象表明，这些关联在男性和女性之间的强度有所不同，但在参与者的（二元）性别认同上是一致的。

4.4. 持续时间和动态过程模型
我们还估计了一个连续时间过程模型，以评估SBAS-2SF的反应在时间上的持续性以及多少变异性反映了有意义的情境敏感性而非随机噪声。就前者而言，我们的结果显示了一个显著的自回归效应，半衰期约为14小时。换句话说，这些结果表明，状态身体欣赏感的任何日常变化都会迅速自我纠正，并在大约24小时内恢复到平衡状态。此外，我们发现情绪状态与状态身体欣赏感的变化显著相关：积极的情绪唤醒与身体欣赏感的提高相关，而消极的情绪唤醒则与降低相关。类似地，较高的心理健康状况与状态身体欣赏感的立即下降相关。

综上所述，这些结果提供了额外的证据，表明SBAS-2SF能够足够敏感地检测到状态身体欣赏感的日变化，并且状态身体欣赏感确实受到情绪唤醒和心理健康状态的有意义影响。虽然可能会认为快速回到平衡状态表明状态身体欣赏感的结果无关紧要，但我们建议不要这样认为。实际上，从我们的结果来看，即使是短暂的心理情绪变化也可能对状态身体欣赏感产生显著影响。如果这种变化以长期的方式发生（例如，长期的心理健康不佳），那么状态身体欣赏感很可能会受到负面影响，进而可能对特质身体欣赏感产生长期影响。尽管目前这仍只是猜测，但状态身体欣赏感的改变如何影响特质结果是一个值得进一步研究的领域。

4.5. 限制和未来方向
我们的结果应在一些限制因素的背景下进行解释。首先，本研究专注于验证BAS-2的3项目简短状态版本。值得注意的是，Tylka等人（2022）也基于遗传算法开发了2项目的SBAS-2SF版本。尽管在某些情况下（例如，当需要极度简洁时）学者可能会发现2项目版本有用，但我们建议使用BAS-2短形式的全部三个项目，因为这个版本允许计算潜在的身体欣赏感因素。其次，我们重申，本研究旨在评估SBAS-2SF在ESM研究中的心理测量特性。因此，我们的结果并不适用于其他设计（如实验研究）中的SBAS-2SF的心理测量特性。

另一个值得记住的点是，在我们的研究中，我们要求参与者以评估日常身体欣赏感的方式完成SBAS-2SF。虽然这与每日日记方法一致（例如，Batchelor et al., 2025），但学者可能希望更频繁地使用该工具（例如，在一天中多次进行）。在这种情况下，可能需要考虑使用SBAS-2SF是否合适，特别是因为这会增加参与者的负担并降低依从性（参见Fuller-Tyszkiewicz et al., 2013）。如果学者希望使用一个能够捕捉状态身体欣赏感的单个项目，那么使用“我对我的身体有爱”这个项目可能是合适的，因为它似乎是潜在结构的强大指标。然而，还需要进一步的工作来确定在ESM研究中使用这个单个项目能在多大程度上充分捕捉状态身体欣赏感结构。

在抽样方面，我们的招募方法意味着我们的样本不应被视为代表更广泛的德国人口。尽管我们的发现与现有研究（Homan, 2016, Tylka et al., 2022）和理论（Tylka and Wood-Barcalow, 2015b, Tylka and Wood-Barcalow, 2025）大体一致，但我们的发现的普遍性可能会受到限制。此外，尽管我们能够考虑（二元）性别认同的调节效应，但考虑其他受访者人口统计特征（如社会经济地位、种族认同和自我感知的身体大小）的影响也会很有用。最后，我们只包括了有限的同时效度评估，使用的是一般心理健康和情绪的测量方法，而不是特定于身体形象的构念。这是出于减少参与者负担和防止调查疲劳的考虑。此外，目前还没有专为ESM研究验证过的积极身体形象工具。虽然理论上可以使用视觉模拟量表等来评估身体（不）满意度，但它们的包含会增加假设猜测和社会期望反应的风险。因此，我们使用一般情绪和心理健康测量方法可能会使一般情绪状态（例如，一个人有多“积极”）混杂与身体欣赏感的关联。尽管我们的增量效度分析表明SBAS-2SF可以预测超出一般情绪唤醒和心理健康之外的特质身体欣赏感，但由于缺乏已知与身体欣赏感无关的构念，我们无法正式评估SBAS-2SF的区分效度。未来的工作应该通过包括更多状态评估来扩展SBAS-2SF的命名网络。

4.6. 结论
尽管存在这些限制，目前的结果表明SBAS-2SF可以自信地用于ESM研究中，以评估状态身体欣赏感结构。显然，人们有兴趣在ESM（参见Stieger et al., 2022）和每日日记研究（例如，Batchelor et al., 2025）中包含状态身体欣赏感的测量。然而，这样做的先决条件是所使用的工具应具有足够的心理测量特性。我们的结果为SBAS-2SF提供了这样的证据：我们发现该工具在纵向评估中是可靠的，对时间变化敏感，保持了单一因素结构，并具有良好的同时效度。因此，我们建议在需要使用简短工具来可靠且有效地评估状态身体欣赏感的未来ESM研究中使用SBAS-2SF。

**作者贡献声明**
David Willinger：撰写 - 审查与编辑，撰写 - 原始草稿，正式分析，概念化。
Stefan Stieger：撰写 - 审查与编辑，监督，项目管理，方法学，调查。
Viren Swami：撰写 - 审查与编辑，撰写 - 原始草稿，概念化。

热点排行