EDI-5作为情绪困扰的指标：工具设计与验证

《Psychiatry Research Communications》：The EDI-5 as an indicator of emotional distress: Instrument design and validation

【字体：大中小】 时间：2026年05月04日 来源：Psychiatry Research Communications 2.3

编辑推荐：

　　维安妮·特鲁希略-冈萨雷斯（Vianney Trujillo-González）| 何塞·古铁雷斯-巴罗索（Josué Gutiérrez-Barroso）| 埃丝特·托拉多-马丁-帕洛米诺（Esther Torrado-Martín-Palomino）| 安娜·帕德龙-阿马斯（

　　维安妮·特鲁希略-冈萨雷斯（Vianney Trujillo-González）| 何塞·古铁雷斯-巴罗索（Josué Gutiérrez-Barroso）| 埃丝特·托拉多-马丁-帕洛米诺（Esther Torrado-Martín-Palomino）| 安娜·帕德龙-阿马斯（Ana Padrón-Armas）
西班牙拉拉古纳大学（Universidad de La Laguna）

**摘要**
从健康社会学的角度来看，情绪困扰最好被理解为一个超越临床诊断的维度性群体构建。本文介绍了EDI-5（情绪困扰指标，Emotional Distress Indicator）的理据、设计与验证过程。EDI-5是一个简短的单维度工具（包含5个项目），用于捕捉核心的负面情绪（紧张、情绪低落、沮丧/抑郁），同时将孤独感作为一个关系维度，并加入一个反向计分的平静/安宁项目作为响应控制指标。该量表在西班牙加那利群岛的三个独立学生样本中进行了测试，样本年龄范围为14至18岁（样本量分别为287、665和1168人）。使用WLSMV进行的验证性因素分析支持其基本为一因素结构，并在各个样本中显示出良好的拟合度（CFI = 0.993–0.995；TLI = 0.986–0.991；SRMR = 0.016–0.023；RMSEA = 0.068–0.082），以及可接受的信度（α = 0.768–0.812；ω = 0.788–0.824）。测量不变性测试表明，该量表在不同性别、年龄组及样本间具有可比性，但并未完全支持跨性别和情境的标量不变性。外部效度证据显示，该量表与相关构念存在一致性的关联，包括与焦虑症状（GAD-7）和睡眠障碍的中等到强相关性，以及与幸福感指标的负相关。作为基准测试，针对可能中度至重度焦虑（GAD-7 ≥ 10）的ROC分析显示出了良好的区分能力（AUC = 0.886和0.820），建议将≥15作为初步的通用参考阈值，其中男孩的阈值建议为≥15，女孩为≥16。由于EDI-5的简洁性和概念清晰度，它适用于群体监测以及教育和社区环境中情绪困扰的初步识别，必要时可进行更具体的评估。

**1. 引言**
世界卫生组织（WHO）将心理健康定义为一种使人能够应对日常压力、发展能力、学习、工作并参与社区生活的状态，它是整体健康和福祉的重要组成部分，介于最佳状态和严重困扰之间（WHO，2022）。在这种框架下，情绪困扰并不等同于临床疾病；相反，它指的是群体层面的心理健康状态以及社会条件对人们生活的影响（Drapeau等人，2012；Poulin等人，2005）。尽管国际诊断系统如《精神疾病诊断与统计手册》（DSM-5）和《国际疾病分类》（ICD-11）在临床实践和流行病学中不可或缺，但它们的分类方法在捕捉困扰的维度特性方面存在局限性（美国精神病学协会，2013；世界卫生组织，2019；Wardenaar和de Jonge，2013）。因此，特别是在全球范围内，尤其是对弱势群体和年轻人影响日益严重的背景下，需要简短而敏感的测量工具来进行监测（Daly和Macchia，2023）。世界卫生组织关于学龄儿童健康行为（HBSC-2022）的研究数据显示，38.5%的青少年报告了与情绪困扰相关的多种身心症状，且这种症状随年龄增长而增加，性别差异明显（女孩为51.2%，男孩为25.2%）（Moreno等人，2025）。这一现实促使机构越来越关注这些指标，例如INJUVE最近在调查中加入了关于情绪困扰的具体问题（青年研究所，2021，2025）。

在这种背景下，EDI-5（情绪困扰指标）被提出作为一种简短的单维度工具，用于测量青少年和青年群体的整体情绪困扰。其概念基础基于压力过程模型和稳态负荷（allostatic load）的概念（Pearlin等人，1981；McEwen和Stellar，1993），将负面情绪的核心维度与孤独感作为关键的心理社会指标结合起来。本文旨在介绍EDI-5作为测量整体情绪困扰指标的理据、设计和验证过程。

**2. 理论框架**
从健康社会学的角度来看，心理健康的研究重点不在于临床诊断，而在于心理社会困扰作为社会条件如何影响幸福感的一个指标。这种方法批判了将问题个体化的倾向（Aneshensel等人，2013）。与区分疾病存在与否的分类模型不同，社会学视角强调困扰的连续性及其对后续疾病发生的预测价值（Wheaton，2007）。正如Mirowsky和Ross（2002）所指出的，构建“人文科学”需要能够捕捉从最佳状态到亚临床表现再到病理形式的不良状态的维度指标和量表，这对于预防也更为有效（Mirowsky和Ross，2002）。

理解困扰起源的一个核心框架是Pearlin等人的压力过程模型（1981）。困扰源于急性压力源（突然的、强烈的事件）和慢性压力（持续的、日常的紧张）。这些影响可以通过保护性资源（尤其是社会支持和应对策略）来缓解，这些资源调节压力与结果之间的关系。关键在于，接触压力源和获得资源的机会都受到社会地位（社会经济地位、性别、年龄、种族）的结构性影响，从而将社会不平等转化为心理健康不平等（Pearlin等人，1981；Aneshensel等人，2013）。Wheaton和Montazer（2010）指出，从压力源到压力再到困扰的路径是非线性的：一个压力源是否成为压力体验取决于具体情境和意义，而压力是否转化为困扰则取决于可用的资源。一个潜在的压力事件可能不会引发压力，即使引发了压力，如果有足够的支持，也可能不会导致困扰。当这些调节机制不足或被慢性压力压倒时，就会出现累积的生理“成本”，即稳态负荷（McEwen和Stellar，1993）。长期的压力会削弱调节系统，损害适应能力，危害健康（McEwen和Stellar，1993；McEwen，1998），并增加抑郁和焦虑的风险（Gou等人，2025）。因此，心理社会困扰可以被视为这种压力的主观表现，以及不利条件下的情绪体验——威胁或暴力与骚扰、不安全感和排斥、社交需求过载（Wheaton和Montazer，2010；Betancor Nuez和Gutiérrez Barroso，2015）。这一观点与一般压力理论一致，该理论认为紧张源于目标受阻、有价值刺激的丧失或持续暴露于负面刺激，从而引发强烈的情绪反应（焦虑、愤怒、失望、抑郁、恐惧）（Agnew，1992）。

Drapeau等人（2012）提供了一个有用的操作定义：困扰是对压力源的非特异性情绪反应，表现为焦虑（不安、紧张）和抑郁（悲伤、沮丧）症状的混合。这种共同的症状基础与焦虑和抑郁的三部分模型一致（Clark和Watson，1991）：两者都包含负面情绪（紧张、情绪低落、恐惧、愤怒），但在具体成分上有所不同（抑郁中的低积极情绪/快感缺失；焦虑中的生理兴奋）。负面情绪还意味着低水平的平静/安宁（Watson等人，1988），并作为主观不适的一般维度，与情绪失调密切相关——这种失调将压力与攻击性等外化行为联系起来（Herts等人，2012；Chung等人，2019）。自尊与不适之间的关联是强烈且相互的：低自尊预示着后续的困扰，反之亦然（Sowislo和Orth，2013；Manna等人，2016）。

在心理社会决定因素中，青少年和青年时期的不想要的孤独感尤为突出（Kirwan等人，2025）。孤独感被概念化为期望关系与实际关系之间的差异，是一种具有生理和心理影响的社会决定因素（Perlman和Peplau，1981；欧盟委员会，2022）。在其社会形式中，它表示社区联系的缺失（Yanguas等人，2018）。孤独感和社交隔离都会增加发病率和死亡率，并与较差的幸福感相关（世界卫生组织，2025）。即使考虑到情境因素，孤独感也是困扰和焦虑抑郁风险的强烈预测因素（Li和Wang，2020；Holt-Lunstad等人，2015）。断开联系和缺乏情感支持是抑郁的关键风险因素（Beutel等人，2017；Choi等人，2019）。纵向研究表明，童年时期的同伴排斥和持续的孤独感轨迹预示着青少年时期更严重的抑郁症状（Pedersen等人，2007；Kirwan等人，2025）。特殊情境（如COVID-19封锁或自然灾害，例如西班牙加那利群岛的拉帕尔马岛火山爆发）会加剧孤独感和困扰，对心理健康产生不利影响（Ahrendt等人，2021；Simon等人，2021；Christ和Gray，2022；Padrón-Armas和Trujillo González，2025）。

从性别角度来看，女性和男性在情绪健康方面的差异嵌入在不同的社会规范和情境中（Torrado Martín-Palomino，2022）。女性在群体和临床研究中的较差心理健康状况不能简单地用生物学差异来解释，而是由生活模式和角色导致的更多压力暴露所造成（Bacigalupe等人，2020）。性别不平等更严重的社会中，心理障碍的差异也更大（Yu，2018）。女性更频繁地使用服务，因类似症状被诊断，也更容易识别不适——这表明痛苦的社会构建存在差异（Yokopenic等人，1983；Bacigalupe和Martín，2021）。这可能导致心理病理化和催眠药及抗抑郁药的过度处方，通常在初级保健中发生，且往往没有专门的诊断（Bacigalupe等人，2020；Valls Llobet，2020）。简而言之，性别作为一种社会决定因素，影响了压力源的暴露以及困扰的表达和管理（López和Laviana，2024）。与感知和认知偏见一致，案例研究表明，年轻男性比年轻女性更不容易识别心理健康问题（Klineberg等人，2011；Olivari和Mellado，2019）。

在这种背景下，EDI-5被设计为一个简洁、敏感且易于应用的工具，用于初步识别和监测群体的整体情绪困扰，而不是进行详尽的诊断评估。与焦虑筛查工具不同，它旨在捕捉更广泛的不良状态，同时通过孤独感纳入关系/情境维度，使其在需要简短高效工具的教育和社区环境中特别有用。其设计优先考虑了简洁性、适用性和敏感性，便于捕捉不同群体中不良情况的情感影响，并将其整合到调查和项目评估中。

**3. 方法论**
**3.1. 工具开发**
EDI-5（情绪困扰指标）是一个简短的单维度筛查工具，用于检测青少年和青年群体的整体情绪困扰水平。它包含五个项目，分别捕捉过去30天内的紧张、情绪低落、沮丧/抑郁和孤独感体验，以及一个反向计分的平静/安宁项目作为响应控制指标。该工具不具有诊断性，旨在将困扰作为一个连续变量进行监测和量化，便于在心理健康流行病学和大规模心理社会调查中使用。EDI-5是对原始EDI-6候选模型的改进版本，旨在减少项目冗余，同时保留该构念的核心理论内容。其设计基于INJUVE（2020）用于评估COVID-19情绪影响的八个项目组合。因此，孤独感是通过INJUVE中的一个项目来评估的（“你感到孤独吗”）。EDI-6候选模型保留了其中六个项目，并基于概念原因排除了两个项目：
(i) “睡眠困难”。鉴于睡眠障碍的多因性（心理、生理和情境因素），尽管在临床上相关，但它并不直接反映负面情绪状态，且会引入与负面情绪无关的变异。我们建议单独测量睡眠，尤其是在年轻人中，因为数字媒体使用等因素可能起作用（González-Pascual等人，2025）；
(ii) “感到愉快”。作为积极情绪的指标，它的缺失主要与快感缺失（抑郁的特征而非焦虑）相关，会导致双因素结构（困扰/幸福感），这与工具的单维度目标相悖（Watson等人，1988；Sandín，2003；Moral de la Rubia，2011）。通过平静/安宁项目保持了心理测量控制功能，该项目位于平静-焦虑连续体上，并与抑郁和压力呈负相关（Sepehri等人，2025）。

随后进行的敏感性分析比较了从语义上重叠的“紧张”和“压力”两个项目派生出的两种五项目版本。两种版本都保留了整体负面情绪及其关系维度（孤独感）的覆盖范围。然而，最终选择了保留“紧张”并排除“压力”的版本，因为它提供了更简洁的表示，消除了由于语义冗余导致的局部依赖性，并在不变性分析中显示出在性别组间的相对更稳定模式。因此，最终的EDI-5并不是一个概念上的新工具，而是对原始EDI-6候选模型的改进版本。

表1列出了INJUVE的所有项目、在工具开发过程中考虑的子集，以及最终EDI-5版本的相应纳入/排除标准。所有项目使用的句干是：“在过去的30天内，你……的频率是多少？”
表1. INJUVE项目，转换为EDI-5格式，以及理由说明。

| INJUVE项目 | EDI-5决策 | 理由 |
|---------|---------|-------------|
| 1. 你感到特别紧张 | 保留 | 捕捉到感知到的紧张情绪，这是痛苦的一个核心组成部分。 |
| 2. 你情绪低落 | 保留 | 反映出一般的低落情绪，这是心理社会不适的独立指标。 |
| 3. 你感到平静而宁静 | 保留（反向计分） | 作为反应对照，与焦虑激活和紧张情绪相对；低分与负面情绪一致。 |
| 4. 你感到沮丧和抑郁 | 保留 | 代表抑郁症状，是痛苦概念化的关键。 |
| 5. 你感到有压力 | 移除 | 最初在六个项目的候选版本中保留，但在修订阶段的敏感性分析后被排除，因为与“紧张”有语义重叠。移除该项目减少了冗余性，并提高了跨性别的可比性，同时保留了该构念的核心内容。 |
| 6. 你有睡眠困难 | 移除 | 多因素症状，引入了超出情绪不适的变异；建议单独评估。 |
| 7. 你感到快乐 | 移除 | 属于积极情绪；其缺失主要对应于快感缺失（特定于抑郁，而非焦虑），并会强制使用双因素结构。 |
| 8. 你感到孤独 | 保留 | 包含痛苦的社会维度，尤其是在青少年中尤为明显。 |

来源：作者阐述。

3.2. 项目表述和回答格式
对于项目2，添加了简要的说明以最大化理解：“你感到情绪低落（感到沮丧、悲伤、缺乏动力……）”。
为了避免INJUVE回答格式中的分布偏差——其完全基于语言的锚点和非中立的中点（从未（1），有时（2），经常（3），几乎总是（4），一直（5）可能会使回答产生偏差——EDI-5使用了一个五点李克特量表，仅在极端点上有锚点：（1）“从未” – （5）“经常”，并且有一个中立的中点。这提高了感知到的区间等距性，并支持将总分视为连续的（范围5–25，分数越高表示痛苦越严重），从而加强了用于验证的心理测量分析。
与长而多因素的测量工具（例如BSI、GHQ、SCL-25、DASS-21、PANAS）相比，EDI-5更注重在大规模调查中的效率和概念清晰度（Drapeau等人，2012；Medvedev，2023）。相对于简短的量表（例如K6/K10、SCL-5、MHI-5），它避免了将情感-情绪核心与认知-评估成分（如“感到无价值”）混合，后者是一个更好的单独评估的独立构念（Kessler等人，2002；Sowislo和Orth，2013）。与其他简短测量工具不同，它明确整合了孤独感，捕捉了痛苦的社会维度，这在青少年中尤为显著。

3.3. 参与者和程序
EDI-5在三个独立的样本中进行了测试：
• 样本1（西班牙加那利群岛El Hierro，2022/23年）。在初中/高中（ESO和Bachillerato）阶段进行人口普查抽样，作为IV岛成瘾计划诊断评估的一部分。
• 样本2（西班牙加那利群岛La Palma，2024/25年）。最初计划在ESO、Bachillerato和职业培训项目中进行人口普查抽样，项目名为“从灰烬中重生：Tajogaite火山对年轻人的健康影响”；最终样本是非概率性的、自愿参与的。
• 样本3（西班牙加那利群岛Santa Cruz de Tenerife省，2024/25年）。非概率性的、自愿参与的样本来自参与“我们看到的和听到的就是我们的吗？文化对针对女性的暴力的影响”项目的初中、高中和职业培训机构。
数据通过在上课时间由教师和/或研究团队监督下使用LimeSurvey进行自我管理调查的方式收集，并获得了知情同意。样本1-2使用了基于ESTUDES（西班牙卫生部）的问卷；样本3使用了新开发的问卷。样本1得到了El Hierro市议会的资助；样本2-3得到了La Laguna大学社会委员会的资助（第三次拨款申请，2024年）。表2总结了样本的社会人口统计特征。

表2. 样本的社会人口统计特征。
| 特征 | 样本1（n%） | 样本2（n%） | 样本3（n%） |
|------------|---------|---------|---------|
| 性别 | 男 | 147（51.22） | 322（48.42） | 586（49.91） |
| | 女 | 140（48.78） | 343（51.58） | 585（50.09） |
| 年龄 | 14-15 | 169（58.89） | 351（52.93） | 522（44.69） |
| | 16-18 | 118（41.11） | 313（47.07） | 646（55.31） |
| 出生国家 | 西班牙 | 229（79.79） | 572（86.02） | 101（86.90） |
| | 其他 | 58（20.21） | 93（13.98） | 153（13.10） |
| 教育程度 | 初中 | 206（71.78） | 372（55.94） | 618（52.91） |
| | 高中 | 81（28.22） | 242（36.39） | 469（40.15） |
| | 职业培训 | - | 51（7.67） | 81（6.94） | |

来源：作者阐述。

3.4. 数据分析
EDI-5的验证遵循了逐步策略，以确保对其心理测量特性的全面评估，符合标准工具验证指南（El-Den等人，2020）。分析使用SPSS v.29和R v.4.5.1（包括lavaan、haven、dplyr、psych包）进行。
描述性分析：我们首先对样本进行了特征描述，并检查了项目分布。
内部结构：我们使用验证性因子分析（CFA）来测试单维模型。由于项目的顺序性质，我们使用了WLSMV（加权最小二乘法，考虑了均值和方差）和多变量相关矩阵（Koziol，2023）。
可靠性：我们使用Cronbach's alpha（Cronbach，1951）和McDonald's omega（McDonald，1999）来估计内部一致性。
测量不变性：我们使用嵌套的多组CFA模型来测试性别、年龄组和样本之间的配置不变性、度量不变性和标量不变性。因为指标被视为有序分类变量，并使用WLSMV进行估计，所以不变性决策主要基于排列检验，使用配置模型的χ2的排列p值来评估配置不变性，以及嵌套比较的Δχ2的排列p值来评估度量和标量不变性（Jorgensen等人，2018；Kite等人，2018）。
根据Chen（2007）的建议，还报告了CFI、RMSEA和SRMR的变化作为补充描述性指标，但它们不是主要的决策标准。
外部有效性：我们检验了收敛性和名义相关性，测试EDI-5是否与外部构念在理论上预期的方向上相关，所有双变量相关性都使用Spearman's rho进行估计。
ROC基准测试：我们评估了接收者操作特征（ROC）性能以估计区分度，并选择了最佳切点。
决策标准：
• CFA/结构有效性：CFI/TLI >.95；RMSEA <.08且90%置信区间上限<.10；SRMR <.08（West等人，2012；Garrido Bermúdez等人，2023；Jordan Mui?os，2021）。
• 可靠性：α和ω >.70（Viladrich等人，2017）。
• 测量不变性：主要决策基于排列检验，使用模型χ2的排列p值来评估配置不变性，以及嵌套模型χ2差异的排列p值来评估度量和标量不变性（Jorgensen等人，2018；Kite等人，2018）。根据Chen（2007）的建议，还报告了传统的拟合指数变化（ΔCFI、ΔRMSEA和ΔSRMR）作为描述性基准——ΔCFI ≤ |.010|，ΔRMSEA ≤.015，ΔSRMR ≤.030（度量）/≤ .010（标量）——但它们不是主要的决策标准。
• 外部有效性证据：
○ 收敛性：与焦虑（GAD-7）和睡眠困难呈正相关；与Rosenberg自尊量表（Rosenberg，1965）和感到快乐的频率呈负相关。
○ 名义相关性：与挫折容忍度（ETF；Oliva Delgado等人，2011）和强迫性互联网使用（CIUS；Ortu?o-Sierra等人，2024）相关。
○ ROC基准测试：主要标准是GAD-7（样本2-3），使用≥10来评估广泛性焦虑障碍（Spitzer等人，2006），以及使用≥8来评估“任何焦虑障碍”（Plummer等人，2016）。我们报告了AUC——常规（≥.60，<.75），良好（≥.75，<.90），非常好（≥.90）——并根据样本间一致性和敏感性-特异性平衡选择了最佳的EDI-5切点，而不仅仅是基于Youden指数的最大值。（Martínez Pérez和Pérez Martín，2023）。
这种策略整合了内部证据（结构、可靠性）、外部证据（收敛性和名义有效性）和筛选性能，支持EDI-5的有效性和应用价值。

4. 结果
表3报告了三个样本中每个EDI-5项目的描述性统计信息。项目的平均值处于响应尺度的中间范围，除了项目4和5，它们的平均值略低。偏度值通常在可接受的范围内（<1），而所有项目的峰度均为负值——通常幅度较大——表明分布没有明显的不对称性，但呈扁平峰态。

表3. 情绪痛苦指标（EDI-5）的描述性统计。
| 项目 | 样本1（n=287） | 样本2（n=665） | 样本3（n=1168） |
|------------|------------|------------|------------|
| 1. 你感到特别紧张 | 3.13（1.35） | 3.22（1.17） | 3.42（1.17） |
| 2. 你情绪低落 | 3.03（1.40） | 3.22（1.17） | 3.34（1.19） |
| 3. 你感到平静而宁静 | 3.13（1.35） | 3.22（1.17） | 3.48（1.19） |
| 4. 你感到沮丧和抑郁 | 2.72（1.37） | 2.52（1.33） | 2.63（1.27） |
| 5. 你感到孤独 | 2.40（1.45） | 2.28（1.41） | 2.50（1.40） |
| | | | |

注：响应范围=1–5。M=平均值；SD=标准差；Sk=偏度；Ku=峰度。项目3（“平静而宁静”）对于EDI-5的总分是反向计分的；描述性统计以原始方向显示。

表4详细列出了按性别划分的EDI-5项目的描述性统计信息。在三个样本中，女孩在所有负面情绪项目上的平均值始终高于男孩，在正面情绪项目（项目3，平静/宁静）上的平均值低于男孩。ANOVA测试显示所有项目的性别差异具有统计学意义（p<.01）。

表4. 按性别划分的EDI-5描述性统计。
| 项目 | 样本1 | 样本2 | 样本3 |
|------------|------------|------------|------------|
| 1 | 2.75（1.25） | 2.42（1.28） | 3.48（1.19） |
| 2 | 2.52（1.28） | 2.53（1.30） | 3.48（1.19） |
| 3 | 2.60（1.25） | 2.55（1.20） | 3.67（1.24） |
| 4 | 2.26（1.27） | 2.24（1.25） | 2.79（1.35） |
| 5 | 2.07（1.28） | 2.11（1.35） | 2.74（1.54） |

注：所有项目的单因素ANOVA在性别上均具有显著性（p<.01）。M=平均值；SD=标准差；响应范围1–5。项目3（平静/宁静）在这里是正向计分的，但对于EDI-5的总分是反向计分的。

表5展示了三个样本中EDI-5总分的描述性统计。平均分数略低于理论中点（15），并且分散度在各样本中一致（SD=4.62–4.91）。与项目级别的发现一致，女孩在所有样本中的得分显著高于男孩，表明整体痛苦程度更高。总分分布大致对称（Sk<0.35），略呈扁平峰态（Ku≈?0.82至?0.84），支持使用参数检验进行组间均值比较。

表5. EDI-5总分的描述性分析。
| 样本 | M（平均值） | SD（标准差） | Sk（偏度） | Ku（峰度） |
|------------|---------|---------|---------|---------|
| 样本1 | 14.07（4.87） | 0.02 | ?0.84 | 12.02（4.41） |
| 样本2 | 16.21（4.39） | 0.34 | ?0.82 | 11.73（4.61） |
| 样本3 | 13.50（4.62） | 0.22 | ?0.83 | 11.90（4.21） |

我们使用WLSMV进行了验证性因子分析（CFA）来评估EDI-5的结构有效性。在最初的六个项目的候选模型中，三个样本的总体拟合度较弱，适当的拟合要求允许项目1（“你感到特别紧张”）和项目5（“你感到有压力”）之间存在相关残差。然而，这被解释为由于语义重叠导致的局部依赖性，而不是首选的实质性解决方案，因为这种重叠可能会部分夸大内部一致性估计和CFA拟合指数。因此，我们测试了两个替代的五个项目的规格，保留了“紧张”或“有压力”。尽管两个版本的总体拟合度相似，但保留“有压力”的版本在不变性分析中的表现较差，特别是在标量水平上。为了在保持模型简洁性的同时最大化跨性别的可比性，最终的EDI-5保留了项目“你感到特别紧张”并排除了项目“你感到有压力”。EDI-5在三个样本中都显示出一致的良好拟合（表6）：CFI=.993–.995，TLI=.986–.991，SRMR=.016–.023，RMSEA=.068–.082。

表6. EDI-5模型的验证性因子分析拟合度。
| 样本 | χ2（自由度） | CFI | TLI | RMSEA [90%置信区间] | SRMR |
|------------|---------|-----------|-----------|-------------|
| 样本1 | 15.59 | 5.99 | 3.98 | .082 | .035, .132 |
| 样本2 | 20.34 | 5.99 | 4.99 | .068 | .039, .100 |
| 样本3 | 32.76 | 5.99 | 4.98 | .069 | .048, .092 |

使用最终的EDI-5模型，我们检查了每个项目在情绪痛苦因子上的标准化因子载荷（λ）（图1）。项目2和在所有三个样本中都支持了构型不变性（pperm = .679、.749 和 .836），表明男孩和女孩具有相同的基本单因素结构。在样本2和3中支持了度量不变性（pperm = .402 和 .294），但在样本1中不支持（pperm = .038）。在样本2和3中并未明确支持标量不变性（pperm = .013 和 < .001）。尽管在样本1中标量步骤不显著（pperm = .083），但由于样本1中不支持度量不变性，这一结果应谨慎解读。

•按年龄划分：在所有三个样本中都支持了构型不变性（pperm = .071、.189 和 .742）。在样本1中支持了度量不变性（pperm = .935），而在样本2和3中观察到轻微偏离（pperm = .042 和 .011），尽管传统的拟合指数只有小幅变化。在所有三个样本中，标量步骤都不显著（pperm = .116、.474 和 .436），这表明不同年龄组之间存在大致的可比性，主要在两个较大样本的度量层面上存在轻微偏差。

•跨样本比较：在综合测试中支持了构型和度量不变性（pperm = .904 和 .411），但不支持标量不变性（pperm < .001），尽管传统的拟合指数只有小幅变化。成对比较表明，这种标量不等性与涉及样本3的比较更为明显，而样本1与样本2之间的对比在标量步骤上仅处于临界水平（pperm = .060）。

表8. EDI-5模型的测量不变性。

不变性 χ2 (df) CFI RMSEA [IC 90%] SRMR pperm ΔCFI ΔRMSEA ΔSRMR
性别 (S1) 构型 18.413 (10) .992 2.077 [-.006, .131] .029 .679
度量 39.591 (14) .976 6.113 [-.073, .156] .051 -.016 .036 .022
标量 61.108 (28) .968 8.091 [-.060, .122] .085 -.008 -.022 .034
性别 (S2) 构型 23.638 (10) .995 .064 [-.031, .098] .018 .749
度量 21.351 (14) .998 .040 [-.000, .072] .021 .402 .003 -.024 .003
标量 54.646 (28) .991 .054 [-.032, .075] .049 -.007 .014 .028
性别 (S3) 构型 32.983 (10) .994 .063 [-.040, .087] .018 .836
度量 28.503 (14) .996 .042 [-.019, .064] .021 .294 .002 -.007 -.021
标量 121.894 (28) .976 .076 [-.062, .090] .064 <.001 -.020 .034 .043
年龄 (S1) 构型 29.915 (10) .987 .118 [-.071, .168] .051 .071
度量 25.115 (14) .993 .075 [-.021, .121] .052 .935 .006 -.044 .001
标量 43.530 (28) .990 .062 [-.019, .097] .053 .116 -.003 -.012 .001
年龄 (S2) 构型 29.653 (10) .994 .077 [-.046, .110] .033 .189
度量 43.623 (14) .991 .080 [-.054, .107] .047 -.003 .003 .014
标量 55.275 (28) .992 .054 [-.033, .075] .038 .474 .001 -.026 -.009
年龄 (S3) 构型 37.050 (10) .994 .068 [-.046, .092] .017 .742
度量 54.860 (14) .992 .071 [-.052, .091] .027 .011 -.002 .003 .010
跨样本构型 66.720 (15) .995 .070 [-.053, .087] .026 .904
度量 53.795 (23) .997 .044 [-.028, .059] .029 .411 .002 -.026 .003
标量 149.363 (51) .990 .052 [-.043, .062] <.001 -.007 -.001

注：WLSMV方法。pperm指的是构型不变性的模型χ2的基于排列的p值，以及度量和标量不变性的嵌套模型χ2差异的基于排列的p值。

总体而言，EDI-5在性别、年龄和样本之间显示出稳定的构型结构，对年龄相关性和跨样本结构可比性的支持比完全跨性别或跨情境的阈值等价性更强。与模型比较分析一致，这种模式比保留“压力”项的另一种五项规格更受青睐，特别是在跨性别可比性方面。

为了提供外部有效性证据，我们检查了EDI-5与概念相关指标之间的关联（表9）。对于收敛有效性，EDI-5与焦虑症状（GAD-7）呈正相关且相关性较强（ρ = .763 和 .587，p < .001），与睡眠困难也呈中等强度的相关性（ρ = .426–.483，p < .001）。作为逆向收敛证据，它与积极情感/幸福感指标呈负相关，且相关性为中等到强（ρ = ?.522、?.523 和 ?.444，p < .001），这与理论预期方向一致。对于规范性有效性，较高的EDI-5得分与较低的挫折容忍度（ETF；ρ = .334，p < .001）和更强的强迫性互联网使用（CIUS；ρ = .346–.352，p < .001）相关，这与将情绪失调与适应不良行为联系起来的框架一致。总体而言，相关模式是一致的，大多数情况下强度适中，并且在方向上是一致的，这加强了EDI-5作为情绪困扰测量工具的有效性。

为了评估EDI-5的基准效用，我们在样本2和3中进行了ROC曲线分析。如图2所示，总体的区分度良好。以GAD-7 ≥10作为主要基准，保留的通用阈值是≥15。样本2的曲线下面积（AUC）为0.886（95% CI [0.858, 0.913]），样本3的AUC为0.820（95% CI [0.794, 0.847]）。阈值选择不仅基于最大Youden指数，还考虑了跨样本一致性和敏感性と特异性之间的平衡。

使用GAD-7 ≥10作为主要基准，表10总结了样本2和3中EDI-5的ROC分析结果。这些结果应被视为针对另一种自我报告测量的升高焦虑相关症状水平的基准测试，而不是临床病例检测的证据。样本2的区分度良好（AUC = 0.886，95% CI [0.858, 0.913]），样本3的区分度也可以接受（AUC = 0.820，95% CI [0.794, 0.847]）。阈值选择不仅基于最大Youden指数，还考虑了跨样本一致性和敏感性と特异性之间的平衡。根据这一标准，保留了≥15作为通用的临时参考阈值。由于没有建立按性别的完全标量不变性，还进行了按性别分层的分析，建议男孩的临时参考值为≥15，女孩的临时参考值为≥16。

我们还检查了更包容的GAD-7 ≥8标准作为敏感性基准，鉴于先前的证据表明这一阈值可能为识别任何焦虑障碍提供可接受的敏感性–特异性平衡，尽管附近的阈值（7–10）通常表现相似。在我们的数据中，这一更敏感的基准得出了大致相似的模式，并没有实质性地改变保留阈值的实际解释，尽管男孩的敏感性–特异性平衡似乎不如女孩。

5. 讨论

主要目标是开发和验证EDI-5作为情绪困扰指标的有效性。从心理测量学角度来看，该量表显示出可接受的内部一致性和坚实的结构有效性。CFA结果支持基本上是单因素解决方案，其中项目在抑郁症状上的负荷最大，而在紧张感上的负荷较为适中。反向键定的平静/宁静项目负荷为负且较为温和，这是预期的，但仍然被保留，因为它有助于控制顺从反应，并且在概念上与平静–焦虑连续体保持一致。最终选择的EDI-5是一个更为简洁的解决方案，减少了语义冗余，同时保留了该构念的核心内容。总体而言，模型拟合在三个独立样本中是稳定的。

测量不变性分析进一步支持了量表的稳健性和可复制性。EDI-5在年龄方面的可比性模式比性别方面的更好。在三个样本中都支持了构型不变性，整体模式表明存在大致的可比性，只有两个较大样本在度量层面上存在轻微偏离。按性别划分，构型不变性始终成立，在两个较大样本中支持了度量不变性，而标量不变性并未得到明确支持。跨样本，构型和度量属性也是稳定的，尽管标量等价性并未得到完全支持。这与不同情境之间的差异一致——例如较小的非首都岛屿（特别是样本2的灾后情境）与较大的区域情境（样本3）之间的差异。因此，当前结果更符合稳定的结构可比性，而不是完全的跨性别等价性。按性别实现标量可比性的难度更大可能反映了女孩/女性面临更多压力（Bacigalupe等，2020），男孩/男性较低的认知/心理健康素养（Klineberg等，2011；Olivari和Mellado，2019）由于性别社会化（Torrado Martín-Palomino，2022），或者两者的结合。鉴于性别作为社会决定因素，我们建议报告按性别分组的估计值（López和Laviana，2024）。

收敛有效性和规范性有效性证据增强了EDI-5作为青少年情绪困扰简要指标的实用性。收敛有效性通过与GAD-7（焦虑的一个核心但非全面的组成部分）的中等强度正相关得到支持（Drapeau等，2012），以及与睡眠困难的中等强度正相关，睡眠困难是抑郁症和焦虑症的跨诊断症状（美国精神病学协会，2013）。同时，与GAD-7的相关强度应考虑到一般困扰指标和焦虑症状测量之间的部分重叠。与自尊（RSES）的负相关与理论和先前的证据一致，即自尊与困扰之间的相互联系（Sowislo和Orth，2013；Manna等，2016）。规范性有效性通过与挫折容忍度（ETF）和强迫性互联网使用（CIUS）的中等关联得到支持，这与将情绪失调与适应不良行为和应对缺陷联系起来的框架一致（Pearlin等，1981；Herts等，2012；Chung等，2019；González-Pascual等，2025）。总体而言，相关模式在方向上是一致的，且大多数情况下强度适中。

这些发现将EDI-5定位为一个简洁的、单一维度的测量工具，与情绪困扰的维度概念相一致。这与心理健康社会学一致，后者将困扰视为一种社会模式化的连续体，而不是诊断性的二分法（Aneshensel等，2013；Mirowsky和Ross，2002；Wheaton，2007）。孤独感的包含增强了该工具的社会敏感性，因为它与较差的心理健康和幸福感有很强的关联，并且能够捕捉到困扰的关系维度（Holt-Lunstad等，2015；Li和Wang，2020）。

从病因学角度来看，EDI-5的项目可以理解为由于暴露于压力源和支持及应对资源的缺乏而产生的情感表现。换句话说，该工具捕捉了不利社会条件的“心理成本”，而没有将其具体化为临床标签。它结合了效率性和适用性，适用于人群监测，并且通过关注负面情感，避免了将这一构念与自我评价等认知成分混为一谈（Kessler等，2002；Sowislo和Orth，2013）。EDI-5还通过GAD-7指标对焦虑相关症状水平的基准测试进行了评估，表现出对性别的敏感性。总体临界值≥15在不同情境中显示出最稳定的模式——包括火山爆发后的灾后情境（Padrón-Armas和Trujillo González，2025）——并且适用于特定标准（GAD-7 ≥10；Spitzer等，2006）和更敏感的标准（GAD-7 ≥8；Plummer等，2016）。鉴于没有建立明确的性别标量等价性，以及按性别分层的ROC结果，可以考虑性别特定的阈值（女孩≥16；男孩≥15），同时保留≥15作为通用的临时参考值。尽管这些阈值没有解决潜在的测量不等性，但它们可能为每个性别组提供更平衡的敏感性–特异性特征，适用于分类目的。在实际操作中，遵循分层工作流程模型，如果EDI-5测试结果呈阳性，首先应进行简短的多领域后续评估（例如，焦虑、抑郁症状、睡眠和社交联系），只有在确认存在困难或问题持续存在时，才推荐转介至专业资源。研究的局限性包括：采用横断面设计（无法进行因果推断）；缺乏经过验证的多项抑郁量表（如贝克抑郁量表-II [BDI-II]（Beck等人，1996年）和/或患者健康问卷-9 [PHQ-9]（Kroenke等人，2001年）以验证信度；使用来自加那利群岛的青少年样本，这需要在其他人群和年龄段中进行重复验证；以及依赖自我报告，这可能带来社会期望和读写能力的偏差。此外，所提出的ROC阈值是在同一样本中得出的，因此应在外部验证之前视为初步结果。需要进行纵向研究，包括重复测试和反应性分析。此外，孤独感的评估仅使用了一个来自INJUVE量表的单一项目，这限制了对孤独感这一概念的更详细心理测量。从心理社会学的角度来看，由于结构性因素同时影响压力暴露和资源可用性，未来的研究应不仅对生理反应进行分类，还应探讨压力源（Wheaton和Montazer，2010年）。因此，研究应将EDI-5与情境指标（如社会经济状况、社会支持）结合使用，并在可能的情况下，结合应激负荷的生物标志物，以全面理解生理反应的机制（McEwen和Stellar，1993年）。在方法学上，使用锚定案例可以（1）调整分数以纠正识别/读写能力偏差；（2）识别识别能力较低的群体（如男孩/男性或社会经济地位较低的青少年；Klineberg等人，2011年；Olivari和Mellado，2019年；von dem Knesebeck等人，2013年），从而指导更有针对性和公平的干预措施——尽管精心设计和措辞至关重要（Grol-Prokopczyk等人，2015年）。

6. 结论
本研究开发并验证了EDI-5，这是一种情绪困扰的测量工具，具有可接受的心理测量性能、足够的可靠性和稳定的单因素结构。其贡献体现在两个方面：首先，作为一种维度测量工具，它符合社会学中将困扰视为连续体的观点，能够分析从轻微不适到临床临界值范围内的社会决定因素，这使其特别适用于教育和社区环境中的应用研究，符合超越诊断阈值评估困扰的建议。其次，作为一种初步筛查和监测的简短工具，它提供了具有公共卫生价值的参考阈值，可用于与升高的焦虑相关症状水平进行比较。其简洁性和易于使用的特点使其适用于人口研究、大规模调查以及需要快速评估的医疗保健或灾后情境。总体而言，EDI-5是一种有效、高效且多用途的工具，结合了研究严谨性和实际应用性，有助于监测、早期识别和后续评估，支持更加精确、能反映社会复杂性的卫生政策。

**作者贡献声明**
Vianney Trujillo-González：撰写——审稿与编辑、撰写——初稿、可视化、方法学、调查、数据分析、概念化。
Josué Gutiérrez-Barroso：撰写——审稿与编辑、验证、监督、方法学。
Esther Torrado-Martín-Palomino：撰写——审稿与编辑、验证。
Ana Padrón-Armas：撰写——审稿与编辑、撰写——初稿、方法学、调查、数据分析、概念化。

**伦理/同意**
所有程序均遵守《赫尔辛基宣言》和国家关于未成年人研究的法规。已获得机构许可；已取得家长/监护人的同意及学生的同意。伦理审批由作者所在机构批准（详情可索取）。

**作者身份与原创性**
本手稿为原创作品，未曾发表过，也未在其他地方提交。所有作者均同意最终版本并同意提交。

**资金来源**
El Hierro议会（样本1）和La Laguna大学社会委员会（样本2-3）。资助方未参与研究设计、分析、解释、撰写或提交决定。

热点排行