综述：数字认知行为疗法治疗武装部队及退伍军人群体失眠的有效性：一项随机对照试验的系统性回顾与荟萃分析

《Sleep Medicine》：Efficacy of digital cognitive behavioural therapy for insomnia in Armed Forces and Veteran populations – A systematic review and meta-analysis of randomised controlled trials.

【字体：大中小】 时间：2026年05月02日 来源：Sleep Medicine 3.4

编辑推荐：

　　亚历克斯·J·罗克利夫|索菲亚·伊莎贝尔·里贝罗·佩雷拉英国陆军健康与表现研究，陆军总部，布伦海姆大楼，马尔伯勒线路，安多弗，汉普郡，SP11 8HT **摘要** **背景** 失眠在武装部队（AF）和退伍军人中非常普遍，严重影响了军队的战备状态和生活质量。

　　亚历克斯·J·罗克利夫|索菲亚·伊莎贝尔·里贝罗·佩雷拉
英国陆军健康与表现研究，陆军总部，布伦海姆大楼，马尔伯勒线路，安多弗，汉普郡，SP11 8HT

**摘要**
**背景**
失眠在武装部队（AF）和退伍军人中非常普遍，严重影响了军队的战备状态和生活质量。虽然认知行为疗法（CBT-I）是治疗失眠的一线方法，但在军事环境中其可及性有限。尽管数字CBT-I提供了一种可扩展的替代方案，但针对这一人群的证据仍然有限且尚未进行系统整合。本系统评价和荟萃分析旨在评估数字CBT-I对武装部队人员失眠严重程度的疗效。

**方法**
2025年7月12日至8月30日期间，搜索了四个电子数据库（PubMed、CENTRAL、Ovid MEDLINE、Ovid PsycINFO、Ovid Embase和Web of Science），并补充了灰色文献的搜索。纳入标准为：根据DSM-5标准诊断为失眠的武装部队人员（n = 5）或失眠严重指数（ISI）≥14的参与者（n = 1）。将数字CBT-I干预措施与最低接触对照组进行比较。参与者不受年龄、服役状态、共病情况、干预方式或环境的影响。使用随机效应模型对治疗后ISI分数的变化进行荟萃分析，并对随访结果进行描述性评估。采用RoB 2评估偏倚风险，使用GRADE评估证据确定性。

**结果**
共有5项随机对照试验（RCT）符合纳入标准（n = 309名干预组；n = 249名对照组）。汇总后的治疗效果显示，数字CBT-I在减轻失眠严重程度方面具有显著的中等到大的效果，但存在较高的异质性（I2 = 74%）。去除其中一项研究后，异质性显著降低，而总体效果仍然稳健。可获得的随访ISI分数表明治疗效果可维持长达12个月。三项研究报告了具有临床意义的ISI降低（≥6分）。总体偏倚风险不明确或较高，主要是由于报告不足和失访率较高。证据确定性被评为中等。

**结论**
尽管研究数量有限，但数字CBT-I已被证明能有效减轻具有复杂健康需求的武装部队人员的失眠严重程度。未来的研究应关注数字疗法的参与度和失访问题，以优化其在军事环境中的实施和治疗效果。

**1.0. 引言**
在高度监管的环境中工作并经常参与高风险活动（如战斗）是军事服务的重要组成部分，要求具备高水平的作战效能。未能达到军事服务的标准可能会对作战能力产生负面影响，导致部队战斗力下降。慢性睡眠障碍是危及武装部队人员整体成功和健康的一个不理想但普遍存在的问题（Thomas等人，2024年）。睡眠障碍在现役军人（Bai等人，2023年；Troxel等人，2015年；Good等人，2020年；Hunt等人，2016年；Alger等人，2024年）和退伍军人（Byrne等人，2021年；Hughes等人，2018年；Molloy和Murphy，2023年）中普遍存在。这种不适应的睡眠行为会损害军人的健康和战斗力（Kurapov等人，2025年），尽管没有证据支持将睡眠限制视为提高作战效能的手段，但文化规范仍然强化了这种做法（Troxel等人，2015年）。这些误解以及其他导致睡眠问题的因素（如不规律的工作时间表、不良的睡眠环境、训练期间的长期睡眠限制（Rawcliffe等人，2024年；Larsen等人，2022年）、部署需求、战斗暴露、污名化（Thomas等人，2022年；Bai等人，2023年）共同促进了条件反射行为的形成和恶化，包括昼夜节律紊乱、睡眠呼吸障碍以及最常见的失眠（Alger等人，2024年；Mysliwiec等人，2013年）。

全球武装部队人员普遍存在睡眠时间短、睡眠质量差和睡眠障碍发生率高的问题（Alger等人，2024年）。数据显示，约63%的美国平民能够获得推荐的7-8小时睡眠，而只有28%的平民报告每晚睡眠时间少于6小时（Krueger和Friedman，2009年）。相比之下，军事研究显示慢性睡眠不足的发生率显著更高，69-72%的武装部队人员每晚睡眠时间少于6小时，仅有27-30%的人能够获得推荐的7-8小时睡眠（Mysliwiec等人，2013年；Luxton等人，2011年）。有战斗经历的军人受影响更为严重，战斗伤害进一步增加了慢性睡眠不足的风险（<5小时/晚）（Luxton等人，2011年）。在压力或威胁加剧的情况下，不适应的睡眠行为（如浅睡眠或片段化睡眠）可能被视为“保护性”的；然而，睡眠中断并不仅限于这些作战环境（Rawcliffe等人，2024年；Larsen等人，2022年）。

武装部队人员和退伍军人的失眠发生率高于平民。数据显示，美国军事人员中失眠的估计率为27-54%，是普通成年人口的2-3倍（Mysliwiec等人，2013年；NIH，2005年）。类似的趋势也出现在其他国家：加拿大武装部队人员的失眠发生率为约41%，而平民为约17%（Richardson等人，2017年；Morin等人，2024年）；在英国，约70%的退伍军人符合DSM-5的失眠标准，而平民为约30%（Molloy和Murphy，2023年；De Lange等人，2024年）。从作战角度来看，慢性睡眠不足限制了军人从繁重身心压力中的恢复，影响第二天的表现，包括降低战斗杀伤力，从而增加人员风险，特别是在安全关键任务中（LoPresti等人，2016年；Williams等人，2014年）。这些问题因武装部队人员中睡眠不足和失眠的高发率而更加严重，因此迫切需要既有效又可扩展、成本效益高且能适应其独特挑战的治疗方法。

认知行为疗法（CBT-I）是治疗失眠的一线方法（AASM，2023年），包括睡眠限制疗法、刺激控制疗法、睡眠卫生教育、放松策略以及调整对睡眠的错误认知（Schutte-Rodin等人，2008年）。CBT-I通常包括为期6周的治疗计划，每周与经过培训的临床医生进行1-2小时的面对面会议。对一级证据的回顾（n = 15项）表明，传统的（即面对面的）CBT-I能有效改善平民失眠患者的睡眠和其他健康相关指标（如抑郁、焦虑、自杀念头、日间功能），其临床相关效应大小通过失眠严重指数（ISI）和/或临床访谈的变化来确定（Knutzen等人，2024年；Trauer等人，2015年）。根据症状严重程度、患者偏好、共病情况和同时使用的药物，常开具药物治疗失眠（如苯二氮卓类药物、非苯二氮卓类催眠药和镇静抗抑郁药）（Schutte-Rodin等人，2008年；Sateia等人，2017年）。然而，在军事环境中使用镇静药物存在额外的操作考虑，包括第二天的认知和运动功能受损、安全关键任务中的风险增加以及可能影响部署能力和作战准备。在平民和武装部队人员中进行的RCT表明，CBT-I产生的睡眠质量改善与药物治疗相当或更优，且副作用显著较少（Zhang等人，2022年）。此外，CBT-I还显示出有助于减少或停止长期使用催眠药物（Mitchell等人，2012年；Enomoto等人，2022年；Morin等人，2006年）。尽管CBT-I具有成熟的临床效果，但由于人员限制、成本和可扩展性限制，在作战和训练环境中难以实施，导致军队人员的睡眠优化能力存在缺口。虽然这些挑战也影响公共卫生组织，但在军事环境中还存在其他障碍，如频繁更换驻地、有限的睡眠相关治疗选项或临床专业知识、由于作战需求导致的高失访率，以及寻求睡眠相关医疗服务的保密性和污名化问题（Mysliwiec等人，2016年）。为应对这些限制，开发了不同临床参与程度的数字CBT-I改编版本。数字CBT-I（dCBT-I）包括远程提供的临床指导形式（如通过远程医疗或视频会议）和完全自动化的、无需指导的互联网或应用程序程序（如Sleepio、Insomnia Coach和SHUTi）。虽然远程提供的临床指导CBT-I改善了地理可及性，但无法解决人员短缺问题。相比之下，自动化数字平台具有更高的可扩展性，可能为军队人员提供更可行的解决方案。

这些方法旨在使CBT-I更易获取、更具成本效益和可扩展性，同时有效减轻失眠严重程度。对一级证据的回顾（n = 11项）（Zachariae等人，2016年）显示，dCBT-I在改善平民失眠严重程度方面与面对面CBT-I相当，效果为中等到显著。另一项质量相似的回顾（一级证据，n = 15项）（Seyffert等人，2016年）专门研究dCBT-I，发现其效果与面对面CBT-I相当，并且在治疗后48周内仍可持续。考虑到武装部队人员和退伍军人面临的独特睡眠相关压力，目前尚不清楚从平民人群得出的建议是否适用于军事环境。通过填补这一文献空白，本系统评价和荟萃分析希望为国防组织的临床实践和政策提供参考，以改善军队的睡眠、整体健康和作战效能。

**2.0. 目的**
本系统评价和荟萃分析旨在确定dCBT-I对武装部队人员（包括现役人员和退伍军人）失眠严重程度的影响程度。我们假设基于CBT-I核心组件的dCBT-I干预措施将显著改善武装部队人员的失眠严重程度，优于被动或等待名单对照组。

**3.0. 方法**
本评价遵循Cochrane干预系统评价手册（Lefebvre等人，2024年）和系统评价和荟萃分析的优先报告项目（PRISMA）指南（补充1 - PRISMA系统评价和荟萃分析检查表）。由于学术限制，本系统评价未在PROSPERO平台上预先注册。

**3.1. 入选标准**
使用PICOS框架（Methley等人，2014年）概述了研究入选标准：
- **人群**：接受过全面培训的现役军事人员（即目前在军队服役并已完成初始训练、可参与作战的人员），无论所属军种（陆军、海军或空军），以及符合DSM-5失眠标准或失眠严重指数得分≥14的退伍军人；参与者年龄需≥16岁（英国陆军，2025年），无年龄上限限制；
- **干预措施**：提供dCBT-I干预措施的研究，包括远程医疗（电话或视频会议）和自我指导的移动应用程序或网站，基于传统（即面对面）CBT-I的核心临床验证组件（如睡眠卫生教育、刺激控制、睡眠限制、放松/唤醒减少、认知疗法）；
- **对照组**：被动或等待名单对照组；
- **结果**：通过临床访谈或自我报告的失眠严重指数问卷评估失眠严重程度；
- **研究设计**：来自任何国家的随机对照试验或试点RCT。

排除以下情况的研究：
1) 参与者未接受过全面培训的现役军人（如新兵或学员）；
2) 失眠未作为研究结果；
3) 评估简化版、单组分或衍生形式的dCBT-I的研究，因为这些形式的干预效果明显低于完整的多组分dCBT-I；
4) 比较dCBT-I与其他干预措施（如仅与面对面CBT-I）的研究。来源和搜索策略
本综述是作为学术评估的一部分进行的；因此，文献搜索和提取的工作由一名审稿人（AJR）完成（即文献搜索和数据提取），遵循PRISMA 2020声明中概述的报告结构（图1）。为了减少单一审稿人方法可能导致的选择偏倚，另一位作者（SIRP）对所有研究标题、摘要和全文文章进行了独立的回顾性筛选，并根据预定义的标准验证了所有纳入研究的资格。此外，还使用R包citationchaser（Haddaway等人，2021）进行了反向/正向引文搜索，以增强研究识别并降低筛选遗漏的风险。搜索了多个电子数据库：PubMed、CENTRAL、Ovid MEDLINE、Ovid PsycINFO、Ovid Embase和Web of Science，时间范围为2025年7月12日至8月30日。此外，还进行了灰色文献搜索，并审查了纳入文章的参考文献列表。搜索结合了关键词、MeSH和EMtree（Ovid Embase）术语、自然语言术语以及布尔运算符（见搜索策略，附录A，表5）。没有对语言或出版日期施加任何限制。使用Rayyan软件（Ouzzani等人，2016）来检测重复项并筛选摘要和全文文章。在全文审查之前，对相关参考文献列表进行了手工搜索，并与纳入/排除的研究进行了交叉参考。

下载：下载高分辨率图片（631KB）
下载：下载全尺寸图片

图1. PRISMA流程图，展示了本系统评价和荟萃分析过程中研究的流程。每个阶段识别的记录数、筛选数、评估资格数和纳入数，以及排除的原因。

*搜索的Ovid数据库：Embase、MEDLINE和PsycInfo；来源：Page MJ等人，BMJ 2021;372:n71. doi: 10.1136/bmj.n71.3.3。ISI的变化决定了dCBT-I对患有失眠的武装部队人员的有效性。ISI具有出色的内部一致性（Cronbach α > 0.90）以及在老年匹配社区样本中检测失眠病例的高敏感度（86%）和特异性（88%）（Morin等人，2011）；与睡眠日记和多导睡眠图相比，具有良好的同时效度（r = 0.32-0.55），并且在中老年人中基线（r = 0.55）、治疗后（r = 0.69）和随访时（r = 0.72）具有中等到高的项目级相关性（Bastien等人，2001）。鉴于ISI作为关键结果的强大能力（Edinger等人，2021），能够准确检测失眠严重程度的治疗效果，以及Cochrane手册建议只包括最相关的结果（McKenzie等人，2023），因此没有包括其他主要或次要结果。

3.4. 数据提取
对于每项纳入的研究，使用Cochrane的标准RCT提取表（可在此处获取）提取数据。表1提供了研究特征的总结。由于研究数量不足（即n < 10），因此未进行发表偏倚评估或潜在调节因素的元回归分析（Sterne等人，2017）。生成了治疗后（从基线ISI的变化）的汇总效应量估计的森林图（图4和图5）。如果可用，还提取了所有研究中关于ISI持续效果（表2）和不良事件（表3）的数据。

表1. 纳入研究的特征

参考文献
*参与者
n 随机化
年龄
性别（% 男性）
种族**
共病
研究设计
IGC
IGC
IGC
IGC
Chao等人，2021
海湾战争退伍军人
85
55 ± 7
54 ± 6
8
99
64
78
GWI, PTSD, MDD
2组；远程医疗 vs 仅监测
Nazem等人，2023
退伍军人
23
13
9 ± 8
39 ± 8
8
48
67
67
77
MH功能
2组；SHUT-I移动应用程序（无指导） vs 教育
Malarkey等人，2024
退伍军人和现役人员
12
54
2 ± 12
42 ± 10
9
68
17
95
4
mTBI, 抑郁症, PTSD
2组；SHUT-I移动应用程序（无指导） vs 教育
TAYLOR等人，2017a, TAYLOR等人，2017b
退伍军人和现役人员
100
33 ± 7
33 ± 8
8
27
96
23
9
PTSD, 抑郁症, 焦虑症
3组；互联网dCBT-I（无指导） vs 面对面CBT-I vs 最小接触
Kuhn等人，2022
退伍军人
50
44 ± 6
45 ± 8
8
69
36
88
4
抑郁症, 焦虑症
2组；失眠教练移动应用程序（无指导） vs 等待名单
*所有研究都在美国进行；IG = 干预组；CG = 对照组；每组参与者的平均±标准差统计信息。
**= 最常见种族/民族的比例（例如，白人）。
$= 作为研究资格的一部分包括的共病。

表2. 随访时失眠严重程度的持续效果
研究
随访，n 参与者
报告的随访数据
随访时的持续效果
TAYLOR等人，2017a, TAYLOR等人，2017b
6个月，n 34
6个月随访时的ISI得分未报告
是。作者描述了面对面组和dCBT-I组在治疗后和随访之间没有显著变化（所有p>0.05），表明变化的持久性
Chao等人，2021
6个月，n 28（仅dCBT-I）
仅报告了dCBT-I的随访ISI得分（表2）
是。相对于治疗后平均±标准差ISI得分（13.7 ± 5.6），在6个月时发现并报告了dCBT-I导致的失眠严重程度持续减少（12.7 ± 7.3）
Kuhn等人，2022
3个月，n 42
报告了dCBT-I和对照组的随访ISI得分（表3）
是。相对于治疗后平均±标准差ISI得分（13.2 ± 4.4），在3个月时发现并报告了dCBT-I导致的失眠严重程度持续减少（11.9 ± 4.0）
Malarkey等人，2024
3个月，n 41
报告了dCBT-I和对照组的随访ISI得分（图2a）
是。相对于治疗后平均±标准差ISI得分（11.0 ± 7.0），在3个月时发现并报告了dCBT-I导致的失眠严重程度持续减少（12.0 ± 7.0）
Nazem等人，2023
6个月，n 16
5
12个月，n 16
6
两个随访时间点的ISI得分均报告（表2）。
是。相对于治疗后平均±标准差ISI得分（11.6 ± 6.7），在6个月（10.5 ± 6.8）和12个月（10.7 ± 6.7）时发现并报告了dCBT-I导致的失眠严重程度持续减少
跨干预组和对照组的随访ISI结果，显示了每个时间点的样本量（n），摘要统计（例如，平均±标准差，如果有的话），以及是否报告了随访数据以评估治疗效果的持续效果。

表3. 纳入研究中的不良事件报告和安全性结果
研究
人群
不良事件报告程序
报告的不良事件
TAYLOR等人，2017a, TAYLOR等人，2017b
现役人员和退伍军人
在每次面对面治疗会话中以及作为每两周一次的通话中监测对照组和dCBT-I队列
•n 131
由64名参与者
•一般健康，与研究无关
•n 1人报告因减少催眠药物而失眠症状加重
•n 6人报告佩戴Actiwatch引起的皮肤刺激
Chao等人，2021
退伍军人
未报告
未报告
Kuhn等人，2022
退伍军人
在“感知到的负面后果”主题下自我报告
n 0
用户未报告与使用dCBT-I相关的任何问题或问题
Malarkey等人，2024
现役人员和退伍军人
未报告
未归因于研究参与的重要伤害。没有任何参与者报告意外效果
Nazem等人，2023
退伍军人
未报告
未报告
未报告：作者未披露报告程序，也未报告是否发生不良事件。

3.5. 数据综合与分析
3.5.1. 效应量估计
使用R中的metafor包内的escalc函数计算了Hedges’ g（Hedges，1981）作为标准化平均差（SMD）。使用限制最大似然（REML）估计拟合了随机效应模型，以解释预期的研究间异质性。使用R包metafor：[A Meta-Analysis Package for R]（Viechtbauer，2010）在R（R Core Team，版本2024.04.2+764）中生成了森林图。SMD的解释如下：g = 0.2 表示小但可能有意义的效应；g = 0.5 表示中等且明显的意义效应；g = 0.8 表示大且显著的意义效应（Cohen，1988）。

3.5.2. 异质性和敏感性分析
使用metafor包（v4.6.0）中的rma函数（Wolfgang，2010）和R核心团队软件（v4.0.4；维也纳，奥地利）通过Q和I2统计量评估异质性。使用随机效应模型，alpha p = 0.05来确定显著的异质性（Deeks等人，2024）。治疗后的汇总效应量估计的I2估计在森林图中显示，并解释如下：0% 表示未观察到异质性；25% 表示低异质性，50% 表示中等异质性，75% 表示高异质性（Higgins和Thompson，2002）。进行了留一法敏感性分析，通过依次移除每项研究并重新估计汇总效应和异质性来评估单个研究的影响（Deeks等人，2024）。

3.5.3. 偏倚风险
使用Cochrane手册中的RoB 2工具（Higgins等人，2024，可在此处获取：Rob 2工具）独立评估每项研究的RoB。根据所采用的方法学质量和潜在系统偏倚的来源程度独立评估每项研究。RoB领域和分类标准显示在图2和图3中。

下载：下载高分辨率图片（414KB）
下载：下载全尺寸图片

图2. 根据指导文件（Higgins等人，2019）提供的偏倚风险总结。

下载：下载高分辨率图片（145KB）
下载：下载全尺寸图片

图3. 根据指导文件（Higgins等人，2019）提供的偏倚风险图，以比例形式显示。

3.5.4. 证据确定性（GRADE）
使用GRADEpro GDT软件（可在此处获取：GRADEpro）根据GRADE标准（RoB、不一致性、间接性和不精确性）量化治疗后ISI的证据确定性。总体RoB和GRADE结果显示在发现总结中（表4），分为高、中等、低或非常低（Schünemann等人，2023）。

表4. 失眠严重程度指数（ISI）：发现总结
研究
基线ISI
治疗后（Δ BL）
随访（Δ BL）
估计效应
总体RoB
GRADE（治疗后）
Chao等人，2021
退伍军人
干预：远程医疗CBT-I
IG: 21.0 ± 5.0
CG: 19.5 ± 4.7
总体：20.3 ± 4.6
n IG= 39; CG= 46
IG: 11.0 ± 7.0 (-10)
CG: 18.0 ± 5.0 (-1.5)
n IG= 39; CG= 39
IG: 12.0 ± 7.0 (-9)
n IG= 28
CG: 无随访
治疗后：-1.5（无随访[6m]数据）
不清楚
Nazem等人，2023
退伍军人
干预：SHUTi（自我指导）
IG: 16.9 ± 4.6
CG: 16.3 ± 4.3
总体：16.6 ± 4.5
n IG= 116; CG= 115
IG: 11.6 ± 6.7 (-5.3)
CG: 14.9 ± 4.9 (-1.4)
n IG= 91; CG= 98
（6个月）
IG: 10.5 ± 6.8 (-6.4)
CG: 13.9 ± 6.8 (-2.4)
n IG= 77; CG= 88
（1年）
IG: 10.7 ± 6.7 (-5.6)
CG: 13.8 ± 4.8 (-2.5)
n IG= 79; CG= 87
治疗后：-0.6
随访（6m） -0.5
随访（1年）：-0.5
不清楚
Malarkey等人，2024
现役人员及退伍军人
干预：SHUTi（自我指导）
IG: 19.7 ± 4.0
CG: 18.9 ± 5.0
总体：19.3 ± 4.5
n IG = 82; CG = 24
IG: 13.7 ± 5.6 (-6.0)
CG: 16.6 ± 5.7 (-2.3)
n IG= 33; CG= 17
IG: 12.7 ± 7.3 (-7.4)
CG: 13.7 ± 5.6 (-5.2)
n IG= 29; CG= 12
治疗后：-0.5
随访（3m）：-0.1
High

Taylor等人，2017
现役人员
干预：互联网自我指导CBT-I
IG1: dCBT-I
IG2: 面对面
CG: 等待名单
IG1: 19.0 ± 5.8
IG2: 18.8 ± 5.7
CG: 19.4 ± 5.7
总体：19.1 ± 5.7
n IG1 = 34; IG2 = 33; CG = 33
IG1: 12.6 ± 5.7 (-6.4)
IG2: 9.6 ± 6.0 (-9.2)
CG: 16.1 ± 5.9 (-3.3)
n IG1 = 30; IG2 = 27; CG = 29
随访（6m）未报告
n IG1 = 14; IG2 = 20;
CG: 未报告
治疗后IG1: -0.4（与CG相比）
治疗后IG2: -1.1（与CG相比）
治疗后（IG1 vs IG2）：-0.5
不清楚
Kuhn等人，2022
退伍军人
干预：失眠教练（自我指导）
IG: 16.8 ± 4.0
CG: 16.9 ± 4.0
总体：16.9 ± 4.0
n IG = 25; CG = 25
IG: 13.2 ± 4.4 (-3.6)
CG: 14.8 ± 4.4 (-2.1)
n IG = 24; CG = 24
IG: 11.9 ± 4.0 (-4.9)
CG: 15.8 ± 4.2 (-1.1)
n IG = 20; CG = 22
治疗后：-0.2
随访（3m）：-0.9
不清楚

4.0. 结果
4.1. 研究选择
在初步的1,339条记录中，去除了重复项后，共筛选出1,279条记录（图1：PRISMA流程）。手动搜索了六篇系统评价。通过灰色文献识别出47篇潜在文章，所有这些文章在全文审查后被排除。评估了53篇全文文章的资格。5项RCT（n 随机化 = 591）符合纳入/排除标准。其中一项研究使用了指导性dCBT-I（即远程医疗）（Chao等人，2021）。其他所有研究都使用了无指导的互联网或基于应用程序的dCBT-I。最小接触的对照组包括等待名单（Chao等人，2021，Kuhn等人，2022，TAYLOR等人，2017a，TAYLOR等人，2017b）和无指导的互联网-教育（Malarkey等人，2024，Nazem等人，2023）。除了TAYLOR等人，2017a，TAYLOR等人，2017b（三组平行设计；等待名单 vs dCBT-I vs 面对面CBT-I）外，其他所有研究都采用了两组平行设计。研究的治疗持续时间都标准化为6周，除了参与者的人口统计信息见表1。基线ISI评分表明存在临床意义的失眠（Bastien等人，2001年）。大多数纳入的研究对药物类型的报告不足。共病情况普遍存在，最常见的是抑郁和PTSD（表1）。4.2. 研究的可靠性（RoB）评估所有研究都使用了可接受的计算机生成的随机化程序；然而，由于报告有限，有三项研究被评为“不明确”。所有研究都采用了个体层面的随机化。大多数研究采用了1:1的分配比例，除了Malarkey等人（2024年）采用了有利于分配到dCBT-I组的3:1比例。所有研究都应用了意向治疗（ITT）分析。TAYLOR等人（2017a，2017b）由于数字编程问题而出现了数据丢失。然而，经过敏感性分析后，这种数据丢失并未影响报告的结果。Nazem等人（2023年）排除了睡眠日记数据少于7天的六名参与者（这被定义为纳入分析的最低阈值）；没有研究使用插补方法处理缺失数据。各研究之间的流失率差异很大，主要是由于与参与者的联系中断；只有Malarkey等人（2024年）报告了完成者和退出者之间的差异。所有研究都使用了自我报告的ISI（7项量表）；然而，临床意义的阈值有所不同。由于参与者可能知道自己的治疗分配情况，因此无法实现盲法。预先指定的主要和次要结果都得到了报告，但有四项研究提供的不良事件数据有限。4.3. 结果的综合所有纳入研究的基线ISI评分均达到了临床意义（≥14 ISI），没有报告显著的组间差异。所有研究都参与了治疗后分析（n = 414），并显示出与对照组相比ISI显著降低。在一项将dCBT-I与面对面CBT-I进行比较的三臂RCT中（TAYLOR等人，2017a，2017b），也显示出ISI显著降低。除了Kuhn等人（2022年）外，所有研究都报告了中度到较大的效果，其中五项研究中有三项基于≥6 ISI点的阈值报告了临床意义上的失眠严重程度降低。由于Chao等人（2021年）和TAYLOR等人（2017a，2017b）发现随访数据不完整，无法进行随访ISI结果的荟萃分析，导致支持效应大小估计的研究数量不足。然而，在其余报告随访ISI评分的研究中，ISI的改善在很大程度上得以保持，有一项研究在3个月随访时报告了ISI进一步降低（Kuhn等人，2022年）（表2）。与对照组相比，dCBT-I的有效性被认为是中等的（Hedge’s g = -0.7，95%CI: -1.1，-0.3，p = 0.008）。然而，观察到了显著的异质性（I2 = 74.2%），这可能部分反映了干预措施实施的临床差异。因此，进行了留一法敏感性分析，以评估单个研究对原始汇总估计的影响。逐步排除每项研究后，汇总效应大小的范围为SMD = -0.5至-0.8，效应的整体方向没有变化（即负SMD表明dCBT-I优于对照组）。然而，异质性的大小和统计显著性存在差异。具体来说，去除Chao等人（2021年）的研究后（图5），汇总效应大小降低（从-0.7降至-0.5），并且精度提高（95% CI -0.7至-0.3），异质性显著降低（I2从74%降至0%，p = 0.068），表明这项研究直接导致了观察到的研究间差异。值得注意的是，Chao等人（2021年）评估的是同步远程健康dCBT-I，而其余研究采用的是几乎没有临床医生接触的无人指导的dCBT-I。治疗强度、个性化和治疗支持的差异可能部分解释了Chao等人（2021年）观察到的更大效应大小以及由此产生的研究间差异。由于研究数量不足，无法进行潜在调节因素的荟萃回归，因此需要基于叙述性解释（第6节：讨论）。总体而言，研究的可靠性主要是不明确或较高的，主要是由于流失率和报告限制。尽管专门针对武装部队人员开展的研究数量有限，但dCBT-I通常与临床意义上的失眠严重程度降低相关，并且似乎与面对面CBT-I相当，在报告随访ISI结果的研究中这种益处得到了维持。下载：下载高分辨率图像（264KB）下载：下载全尺寸图像图4. 治疗后的汇总效应大小估计；主要结果的均值差异和标准差（SD）以及相应的汇总效应大小估计（SMD，Hedge’s g）。IG：dCBT-I，CG：最小接触。汇总的负SMD表明dCBT-I优于CG，并显示出统计学上显著的（p<0.01）中度到较大的效应。效应大小存在显著变异。研究权重相对均衡，但效应大小估计的变异，特别是Chao等人（2021年）所示，导致高异质性，这表明研究间存在不一致性。下载：下载高分辨率图像（231KB）下载：下载全尺寸图像图5. 从汇总效应大小估计中排除Chao等人后的敏感性分析。汇总的负SMD表明dCBT-I优于CG，显示出统计学上显著的（p<0.001）中度效应。这种留一法敏感性分析（即去除Chao等人）表明，原始分析中的高I2几乎完全是由Chao等人引起的，因为其效应较大，现在显示的整体效应比最初估计的更为温和和一致（I2 0.0%）。Chao等人（2021年）观察到的基线和治疗后ISI之间的显著均值差异被认为主要是由于其基线ISI评分高于大多数其他研究（表4），但主要是由于dCBT-I实施方式的差异（远程健康[每周电话通话]）。在纳入的试验中，dCBT-I通常耐受性良好，报告的不良效应很少或短暂（表3）。常见的效应包括治疗初期出现的轻微日间嗜睡或疲劳——这与睡眠限制疗法的急性效应一致——通常在未经干预的情况下会自行缓解。在收集和报告不良事件数据的研究中，没有报告与研究相关的严重不良事件。值得注意的是，除了两项研究外，所有纳入的研究招募的都是退伍军人而非现役人员。因此，虽然操作安全性在现役军事环境中是一个关键考虑因素，但在退伍军人群体中，执行安全关键任务时警觉性或认知表现的暂时性损害的风险可能不太相关和/或更易于管理。尽管如此，这些发现表明dCBT-I对于军事相关人群是安全的；然而，未来涉及现役人员的试验应系统地评估和报告不良事件，特别是那些可能影响操作表现的不良事件，以全面确定dCBT-I在高风险军事环境中的安全概况。表4. 估计效应（组Δ）：标准化均值差异（SMD）。n：参与者总数。效应大小类别：小效应：= 0.2；中等效应：= 0.5；大效应：= 0.8。总体= 组别均值 ± SD。IG= 干预组；CG= 对照组。Post-Tx：总体可靠性来自图2- 偏倚风险总结。由于高偏倚风险，证据的确信度从高降为中等（Schünemann等人，2023年）。所有研究都报告了IG在治疗后和随访时ISI的降低，表明效果持续。除了TAYLOR等人（2017a，2017b）显示面对面CBT-I有小效应外，所有研究都显示dCBT-I有优势。三项研究（Chao等人，2021年，Malarkey等人，2024年，TAYLOR等人，2017a，2017b）基于≥6点的最小缓解阈值报告了治疗后dCBT-I的临床显著ISI降低（Morin等人，2011年；Bastien等人，2001年）。Nazem等人（2023年）报告的ISI降低接近缓解阈值。5.0. 讨论所有纳入的研究都是双臂或三臂平行RCT。尽管无法实现参与者盲法，但所有试验都使用了可靠的计算机生成的随机化，大多数研究采用了块程序以确保组间平衡。dCBT-I的治疗实施在所有研究中是一致的，只有一个例外，并且所有研究都在其治疗模式中保留了经过临床验证的CBT-I组成部分，从而避免了与不同CBT-I组成部分的暴露和效果相关的偏倚。本综述对共病、药物使用和既往病史的研究排除标准故意设定得较为宽松。这被认为是一个优势，因为它使得能够综合实用（以效果为导向）的RCT，从而增强了结果在现实军事环境中的普遍性和适用性。失眠在武装部队人员中非常普遍，首次有证据表明，在军事环境中，指导性和无人指导的dCBT-I干预在治疗后和随访时都显示出有效的治疗效果。这些结果与其他在平民中的证据一致，这些证据报告了dCBT-I在现实环境中的适度治疗效果（Seyffert等人，2016年，Zachariae等人，2016年，Knutzen等人，2024年）。失眠严重程度是主要的治疗目标，但所有研究都报告了客观测量的睡眠指标的显著改善，以及常见的共病情况，包括心理健康和身体健康功能、PTSD、GWI和抑郁。在所有纳入的研究中，出现了一个一致的模式：ISI的降低伴随着主观睡眠连续性的临床意义改善，但在更广泛的功能和心理健康结果方面的效果则变化较大。在所有研究中都观察到睡眠效率（SE）、入睡潜伏期（SOL）和入睡后唤醒时间（WASO）的改善，并且在这些研究中经常接近或达到了既定的临床缓解阈值（SE ≥ 85%；SOL/WASO ≤ 30分钟）（Ancoli-Israel等人，2002年），表明ISI的降低是基于睡眠行为的真正正常化。然而，总睡眠时间在试验中基本保持不变，这表明CBT-I主要巩固了睡眠而不是延长了睡眠时间。除了睡眠特定的结果外，抑郁症状显示出最一致和临床意义上的次要改善，几项研究报告的降低接近或超过了缓解阈值，在某些情况下，与ISI变化有很强的相关性，支持失眠改善与情绪之间的机制联系。相比之下，焦虑和PTSD症状的效果较小且不那么一致，很少达到缓解标准，这突显了dCBT-I在调节睡眠和情绪方面的相对特异性（Bhattacharya等人，2023年）。功能结果，包括疲劳和与健康相关的生活质量，在研究中都有所改善，但效应大小通常小于ISI的改善，表明部分但不是完全恢复。值得注意的是，这些效果的幅度和速度因实施方式而异：临床指导的dCBT-I（例如，Chao等人，2021年）产生了最大和最快的改善，包括在多个领域明显超过临床阈值，而完全自动化的数字干预（即所有其他研究）显示出延迟但仍然具有临床意义的效应，这可能是由于参与度和依从性的作用（Nwosu等人，2022年）。除了其对失眠的明确疗效外，dCBT-I似乎还通过缓解共病心理健康症状带来了更广泛的治疗益处，支持其作为在具有复杂、重叠健康状况的武装部队人群中的一种可扩展的、跨诊断的干预措施（Alruwaili等人，2023年；Parasidis，2016年）。总体而言，这些发现表明，尽管dCBT-I在不同实施格式下都能可靠地实现临床意义上的失眠严重程度和睡眠连续性的降低，但在更广泛的心理健康和功能恢复方面效果较为有限，尤其是在抑郁和疲劳方面效果最强，而在焦虑、PTSD和客观睡眠持续时间方面的影响较小（Lee等人，2023年）。在纳入的研究中，一个关键观察是始终使用了最小接触对照条件（例如，等候名单或睡眠教育），这排除了特定治疗效果与非特定因素（如期望效应或注意力效应）之间的区分。因此，观察到的效应大小可能高估了dCBT-I相对于主动干预的具体疗效。因此，尽管当前证据支持dCBT-I优于不治疗或低强度干预，但它并没有证明其优于主动治疗或标准护理在这一特定人群中的优势。然而，这一局限性应在更广泛的证据基础上进行解释，该证据表明dCBT-I在某些人群中可以实现与临床医生提供的CBT-I相当的失眠严重程度改善（Kallestad等人，2021年，TAYLOR等人，2017a，2017b，Simon等人，2023年）。尽管如此，当前的荟萃分析中无法进行直接比较，需要进一步的头对头试验来确认不同实施方式在武装部队和退伍军人人群中的等效性。6.0. 证据的质量证据的确信度被评为中等，表明存在一些方法学限制，但结果被认为是可靠的。所有研究都采用了可接受的计算机生成的随机化程序，其中两项研究使用了研究统计学家来设计/执行随机化。在大多数研究中，尚不清楚随机化是否独立于研究团队进行。一些研究中作者被列为治疗提供者，这增加了由于了解治疗分配而产生的偏倚风险（RoB）。尽管有些研究没有明确告知参与者哪一组被假设为最有效，但由于分布式认知行为疗法（dCBT-I）需要所有参与者的积极参与，因此无法对参与者进行盲法处理——这是行为干预中常见的限制（Boutron等人，2008年）。一些研究使用行为记录（actigraphy）得出的睡眠测量数据来帮助减少资格筛选和治疗阶段的潜在偏倚，而其他研究则在干预开始前对参与者进行了关于预期治疗益处的访谈。在一项研究（Malarkey等人，2024年）中，没有观察到中度至重度治疗预期的参与者在ISI（失眠症状指数）得分上的差异。然而，那些认为自己接受了dCBT-I的参与者报告的ISI降低幅度数值上大于那些不确定或认为自己接受的是对照组的参与者。虽然没有其他研究在治疗后进行了这种类型的评估，但报告偏倚的可能性，特别是预期偏倚，对于自我报告结果的有效性是一个需要考虑的因素。

纳入的研究采用了平行随机对照试验（RCT）设计，并且所有研究都基于 intention-to-treat（ITT）分析报告了结果（Mccoy，2017年），从而保持了随机化的有效性，并减少了治疗效果估计的偏倚，使其更适用于现实世界的情况。对所有纳入研究的荟萃分析表明，在治疗后，对于最小接触对照组，治疗效果存在高度且统计上显著的异质性。Chao等人（2021年）报告的效果大小估计被认为是观察到的高变异性的一个可能原因。因此，进行了一次留一法敏感性分析，结果显示主要分析中观察到的显著异质性在很大程度上可归因于Chao等人（2021年）的研究。排除这项研究后，异质性显著降低，表明研究间的变异主要是由一个具有相对较大效果大小的有影响力研究造成的。去除该研究后，合并的效果估计值减弱，表明剩余研究中的治疗效果更为温和且一致。Chao等人（2021年）报告的ISI得分降低幅度较大，这可能反映了基线、临床和干预相关因素的综合作用。潜在的中介因素包括“天花板效应”，即基线ISI症状较重的个体通常会有更大的改善（McCurry等人，2021年）。此外，Chao等人（2021年）是唯一一项纳入了临床诊断为GWI（创伤后应激障碍）的武装部队人员的研究，并且提供了为期8周的引导式同步远程健康dCBT-I干预，而其他研究主要采用了非引导式或支持较少的dCBT-I模式。基线症状严重程度的增加、治疗时间的延长，以及引导式远程健康dCBT-I相对于非引导式dCBT-I的公认优势——例如通过个性化、实时互动增强了治疗联盟——以及在某些情况下相对于面对面CBT-I的优势（例如更大的灵活性和可及性），可能是观察到较大ISI降低的关键因素。这些因素代表了临床和方法学异质性的关键潜在来源（Choi和Kang，2025年）。

除了Chao等人（2021年）的研究外，所有剩余的研究在治疗实施方面都表现出一致性，然而所有研究都使用了经过临床验证的CBT-I内容。尽管关于内容顺序或参与者是否复习材料的细节不明确，但这些一致性增强了人们对观察到的效果反映了核心CBT-I模块的有效性而非实施方式变异性的信心（Lutz等人，2022年）。相比之下，比较组设计的差异是显而易见的。注意力匹配——一种将特定治疗效果与非特定因素（期望、参与度、互动）区分开来的关键策略——在数字治疗试验中很少使用（Lutz等人，2022年）。所有研究都使用了最小接触对照组，这可能导致由于注意力匹配不足而使效果大小被夸大（Cuijpers等人，2023年）。非特定因素本身（参与度、期望、动机）已知可以增强dCBT-I的效果（Espie等人，2012年），进一步强调了在研究设计和治疗效果解释中选择比较组的重要性（Zachariae等人，2016年）。尽管纳入的研究报告的参与者人口统计特征和共病情况大致相似（表4），但这些因素仍然是治疗反应的重要调节因素，特别是在比较响应者和非响应者之间的差异时。失眠经常与抑郁症、焦虑症和PTSD等心理健康状况共存，更大的共病负担可能通过跨诊断机制影响基线严重程度和对dCBT-I的反应性（Dolsen等人，2014年）。

由于数据有限和响应者标准的一致性不足（>7分与≥8分ISI降低），无法对响应者亚组进行荟萃分析。只有一项研究（Kuhn等人，2022年）进行了事后分析，报告称响应者（≥8分降低）的基线ISI得分显著更高。相比之下，Malarkey等人（2024年）没有发现不同人口统计或临床特征之间的二分响应者组别，表明结果反映了改善的连续性。同样，Nazem等人（2023年）发现约30%的参与者符合响应者标准（>7分降低），与基本或临床人口统计特征没有明显关联。总体而言，这些发现强调了定义响应者的一致性的方法学重要性，以及需要进行足够有力的亚组分析以识别预测治疗反应的特征。

在军事人群中，额外的异质性来源可能来自退伍军人和现役人员之间的差异。退伍军人通常具有更慢性的症状特征、更高的操作压力累积暴露和更大的共病负担（Nichter等人，2019年；Goetter等人，2020年），而现役人员可能经历更急性、由操作引起的睡眠中断（Farhadian等人，2022年）。从现役状态转为退伍军人状态是一个关键时期，这与睡眠障碍和不良心理健康结果的增加风险相关。证据表明，退伍军人报告的慢性失眠、噩梦和睡眠片段化率更高，通常与PTSD、抑郁症和焦虑症等共病状况同时发生（Germain等人，2013年；Mysliwiec等人，2013年；Pigeon等人，2017年）。这被认为是由于反复的操作暴露的累积影响，以及在服役期间形成的过度唤醒和适应性不良的睡眠行为（Troxel等人，2015年）。此外，军事结构的丧失、社会支持的变化以及重新融入平民生活的挑战可能会加剧睡眠和心理健康问题。常规生活的中断、就业不稳定以及获得结构化医疗服务的途径减少可能导致出院后睡眠障碍的持续或恶化（Rattray等人，2023年）。相比之下，现役人员的睡眠中断可能更多是由情境驱动的（例如轮班工作、训练要求、部署），如果及早处理，这些中断可能更容易通过行为干预来解决（Mysliwiec等人，2013年）。这些中断通常表现为不规律的睡眠-觉醒时间表、昼夜节律失调以及由操作需求引起的睡眠限制，而不是退伍军人群体中更常见的慢性、共病驱动的睡眠病理（Nichter等人，2019年）。因此，现役人员早期的或亚临床的睡眠障碍可能是一个关键的预防和干预窗口，特别是通过可扩展的行为方法如dCBT-I。这些在慢性程度、情境和共病方面的差异可能会影响基线严重程度和对dCBT-I等干预的反应性，因此在跨军事人群汇总结果时代表了重要的临床异质性来源。

心理社会障碍（例如污名化和自力更生的文化）和职业压力源（例如流动性及战斗暴露）可能会影响参与度和维持联系的难度，从而影响军事环境中的临床需求和治疗参与度。脱落率是dCBT-I有效性的一个统计上的调节因素（Zachariae等人，2016年；Soh等人，2020年），在不同研究中差异很大，可能会影响效果估计（Bell等人，2013年）。根据纳入研究报告的数据质量，TAYLOR等人（2017a；TAYLOR等人，2017b）报告了从基线到6个月随访期间的总体脱落率相对较高，分别为面对面CBT-I组约58%、dCBT-I组约41%、对照组约12%。同样，Malarkey等人（2024年）报告了从基线到3个月随访期间dCBT-I组（60%）和对照组（69%）的高脱落率，其中最大的脱落发生在基线到治疗之间（约52%）。相反，Nazem等人（2023年）在一个纵向设计中描述了较高的保留率，报告了总共11名参与者流失。然而，不清楚这种脱落发生在研究的哪个阶段（即基线、干预后、6个月或12个月随访）；因此，无法进一步分析。Kuhn等人（2022年）报告了从基线到3个月随访期间dCBT-I组和对照组分别为20%和15%的总体脱落率。同样，Chao等人（2021年）报告了dCBT-I组（21%）和对照组（15%）的相似脱落率，尽管研究时间较长（长达6个月随访）。每项研究都提供了参与者流失原因的数据，最常见的原因是随访/联系问题（41%），其次是参与者退出/脱离（28%）、干预相关问题（16%）和医疗原因（6%）。这些发现表明，在数字治疗背景下，脱落主要由行为和参与度相关因素驱动，而不是临床或安全相关问题。在更广泛的数字心理健康研究中，一致的低参与率和高退出率与用户参与度不足、参与度指标差以及未能充分满足参与者需求有关，这些因素限制了效果的有效性和结果的普遍性（Smith等人，2025年）。跨数字心理健康和mHealth干预（包括移动应用程序和互联网提供的疗法）的荟萃分析显示了显著的脱落率——合并的退出率通常在约20%到约38%之间——并且参与度挑战（例如使用率低、长时间不活跃）比临床严重程度更能预测退出（Miquel等人，2025年）。此外，在涉及创伤聚焦CBT的心理治疗研究中，发现军事人员和退伍军人的退出风险显著高于平民，一项个体参与者数据荟萃分析报告军事/退伍军人的退出率为约42%，而平民样本为约23%（Wright等人，2024年）。这表明行为决定因素在平民和军事人群中普遍存在，尽管现役军人和退伍军人之间的具体障碍可能有所不同。

数字治疗中脱落的一个关键决定因素是个性化的局限性，定义为干预根据个人需求和情况动态调整内容、交付和节奏的能力（Nwosu等人，2022年）。大多数经过临床验证的dCBT-I程序是线性结构的“一刀切”干预，没有考虑个体层面的调节因素（Heward等人，2024年；Hitch等人，2023年）。来自心理健康RCT的新兴证据表明，将生成式人工智能（Gen-AI）整合到数字平台中可以提高参与度、增加完成率、减少脱落率并改善临床结果（Habicht等人，2025年；McFadyen等人，2024年）。这使得GenAI成为解决此处观察到的主要脱落驱动因素——即脱离和随访丢失——的一个有前景的方向，尽管其在dCBT-I中的应用仍然相对较少探索。

大多数参与者是退伍军人，只有两项研究涉及现役人员。退伍军人在年龄、健康状况和持续操作压力暴露方面与现役人员不同，他们通常具有更高的慢性失眠率、共病率和药物使用率（Mysliwiec等人，2013年）。因此，研究结果可能更多地反映了退伍军人的情况，这可能限制了其对于现役武装部队人员的普遍性。由于所有研究都在美国进行，军事文化、医疗系统和操作需求的差异可能会限制这些发现对其他国家人员的适用性。所有参与者都是接受过战斗或非战斗部署的训练士兵（无论是现役还是退休）；因此，尽管有睡眠问题和临床显著失眠的证据，但这些发现不太可能适用于新兵（Rawcliffe等人，2024年；Rawcliffe等人，2025年；Larsen等人，2022年）。审查各研究的资格标准表明，所有研究都采用了有效性方法，尽量减少排除以增强结果对现实世界军事环境的普遍性。虽然这提高了生态有效性，但减少了对潜在混杂因素的控制。共病的普遍性可能会影响相对于仅患有失眠个体的治疗效果。然而，失眠很少单独出现，共病可能反映了这一人群的独特暴露情况。在大多数研究中，共病与失眠同时改善，这与平民中的结果一致（Soh等人，2020年），从而支持了dCBT-I在不同人群中的跨诊断潜力。此外，排除常见的共病（如PTSD、抑郁症）可能会影响研究结果在现实世界中的适用性和真正疗效，并妨碍我们理解那些可以通过优化来更好地满足个体临床需求的潜在可调节因素（如参与度、治疗可及性、依从性和退出率）。9.0. 限制因素

评估dCBT-I在武装部队和退伍军人中疗效的随机对照试验（RCT）数量有限，这是主要的限制之一，导致无法进行全面的荟萃分析，从而难以得出更可靠的治疗效果汇总估计，尤其是在随访阶段。这类研究本身就难以实施，资源需求较高，并且由于无法对参与者进行治疗类型的盲法处理，容易产生实施偏差和期望偏差。此外，高退出率——通常由低参与度引起——可能还受到污名化和寻求治疗的文化障碍的影响（Troxel等人，2015年），这突显了需要更好地理解影响治疗反应的情境和个体因素，特别是在武装部队人员中。所有纳入的研究都来自美国，参与者主要是退伍军人、男性和白人。尽管世界各地的军队存在某些共同的职业要求，但在医疗保健可及性、文化观念、轮班模式以及性别特定因素（女性比男性更容易失眠）等方面存在重要差异（Zeng等人，2020年），因此必须考虑这些因素，以确保临床验证的dCBT-I平台能够真正适应不同的军事群体并具有普遍性。

这项系统评价和荟萃分析没有进行前瞻性注册，因为学术提交并不要求注册。作者承认缺乏前瞻性注册是一个限制，因为它可能会降低关于预先指定方法的透明度，并增加选择性报告的风险。然而，作为学术评估工作的一部分，事先已经制定了一个概述评价目标、资格标准和分析方法的方案，并在整个评价过程中得到了遵守。为了尽量减少重复研究的风险，在研究开始前搜索了PROSPERO和相关文献数据库，未发现直接重复的研究。评价按照PRISMA指南进行和报告，以确保方法学的透明度。

所有参与者都是受过训练的士兵，平均年龄约为45岁。相比之下，“未经训练”的新兵（包括初级士兵，平均年龄约为16岁）中临床显著的睡眠问题和失眠症状非常普遍（Rawcliffe等人，2023年；Rawcliffe等人，2024年；Crowley等人，2012年）。根据AASM指南（可在此处获取），大多数dCBT-I项目排除了18岁以下的参与者（Sleep Easy和Night Owl项目除外），这反映了在这一人群中疗效证据有限。目前，只有少数非军事群体的研究报告了中等程度的治疗效果（Cliffe等人，2020年；Tsai等人，2022年）。鉴于每年约有1000名初级士兵进入英国的基础训练，其中约80%报告有与失眠一致的睡眠问题（Rawcliffe等人，2023年；Rawcliffe等人，2024年），因此有必要进一步研究dCBT-I在年轻军事群体中的疗效，包括潜在的治疗反应调节因素。各研究中的治疗后随访时间大致一致（6-8周），但随访时间点各不相同，从3个月到1年不等。因此，很难可靠地确定dCBT-I在武装部队人员中的长期疗效。RCTs通常使用至少3个月的随访期来比较治疗效果。然而，未来的RCTs鼓励进行更长时间的随访，因为独特的职业压力、高共病率和护理连续性的障碍可能会影响dCBT-I在这一群体中的疗效持久性。

参与者的平均ISI得分表明他们有中度失眠，这需要进一步研究以评估dCBT-I对轻度及重度失眠的武装部队人员的有效性。虽然各研究中失眠严重程度和ISI版本的分类是一致的，但用于定义临床缓解的阈值（≥7分至≥9分）和反应者标准有所不同，尽管引用了相同的参考文献（Bastien等人，2001年；Morin等人，2011年）。这种不一致性影响了研究之间的可比性，可能导致对dCBT-I效果的临床意义误判。只有三项研究提供了不良结果的详细信息，没有研究报告特定的不良事件。对于从事安全关键任务的武装部队人员（操作车辆、武器处理、需要做出生命攸关的决策），副作用具有实际意义。睡眠限制疗法是CBT-I的核心组成部分，可能会暂时加重白天的嗜睡、易怒或认知失误——这些效应在平民中是可以管理的，但在军事环境中可能很危险。因此，严格收集和报告包括武装部队人员在内的试验中的不良结果对于指导风险-收益评估、确保dCBT-I在军事环境中的安全性和可扩展性实施至关重要。

这项系统评价的另一个限制是仅关注ISI结果作为dCBT-I的唯一衡量标准，而没有纳入更广泛的关联变量（如抑郁、焦虑、PTSD）。将分析限制在ISI上可以提供一个清晰且可比较的失眠特异性效果估计，但可能会低估dCBT-I在这一人群中的更广泛的临床和职业相关性。未来整合多模式结果的研究综合将对于全面了解dCBT-I对武装部队人员的治疗潜力和局限性至关重要。10.0. 结论

本系统评价中包含的RCT证据表明，无论是否指导，dCBT-I在减少武装部队人员的失眠严重程度方面都是有效的。失眠和其他睡眠问题仍然是这一人群中的重要健康问题，尽管军队越来越认识到临床验证和及时获得治疗的重要性，但文化规范仍然降低了对其重要性的认识（Mysliwiec等人，2016年；Barrow等人，2024年）。这些观念构成了阻碍有效睡眠政策在军队组织中接受和持续实施的重大且持久的障碍。它们强调了需要在整个国防范围内开展倡议，教育军事领导和临床医生了解dCBT-I的可用性和疗效，并将其纳入现有的健康和福祉政策及初级护理途径中。基于最新证据（Habicht等人，2025年；McFadyen等人，2024年），鼓励未来的研究探索将生成式人工智能（Gen-AI）整合到临床验证的、无指导的dCBT-I中的变革潜力。只要保持安全性和临床相关性（Ning等人，2024年），大型语言模型在提供更加个性化的治疗方面的能力进步可能有助于克服已知会削弱数字疗法整体效果的低参与度和高退出率问题（Nwosu等人，2022年）。这对于面临独特职业压力和需求的群体（如军队）尤为重要。

**作者贡献声明**
Sofia Isabel Ribeiro Pereira：撰写——评审与编辑、监督
Alex J Rawcliffe：撰写——评审与编辑、原始草稿撰写、项目管理、方法学、调查、正式分析、概念化

热点排行