ECogFun?VR项目对患有多动症（ADHD）的儿童和青少年执行功能的影响：一项随机对照试验

《Research in Developmental Disabilities》：Effects of the ECogFun?VR program on executive functioning in children and adolescents with ADHD: A randomized controlled trial

【字体：大中小】 时间：2026年05月11日 来源：Research in Developmental Disabilities 2.6

编辑推荐：

　　索妮娅·佩雷斯-罗德里格斯（Sonia Pérez-Rodríguez）| 卡门·古铁雷斯-拉米雷斯（Carmen Gutiérrez-Ramírez）| 卡门·维达尔-拉米雷斯（Carmen Vidal-Ramírez）| 阿拉塞利·奥尔蒂斯-鲁比奥（Araceli Ortiz

　　索妮娅·佩雷斯-罗德里格斯（Sonia Pérez-Rodríguez）| 卡门·古铁雷斯-拉米雷斯（Carmen Gutiérrez-Ramírez）| 卡门·维达尔-拉米雷斯（Carmen Vidal-Ramírez）| 阿拉塞利·奥尔蒂斯-鲁比奥（Araceli Ortiz-Rubio）| 安娜·加拉奇-戈麦斯（Ana Garach-Gómez）| 何塞·马蒂亚斯·特里维尼奥-华雷斯（José Matías Trivi?o-Juárez）| 路易莎·阿拉瓦尔-费尔南德斯（Luisa Arrabal-Fernández）| 英马库拉达·梅迪纳-马丁内斯（Inmaculada Medina-Martínez）| 杜尔塞·罗梅罗-阿尤索（Dulce Romero-Ayuso）
格拉纳达大学物理治疗与职业治疗系，西班牙格拉纳达18071

**摘要**

**背景**
执行功能（EF）障碍，特别是计划和组织方面的困难，极大地限制了患有注意力缺陷多动障碍（ADHD）的儿童和青少年的日常生活自主性。基于虚拟现实（VR）的干预措施提供了生态学上有效的环境，可能有助于策略学习并促进功能泛化。本研究评估了ECogFun-VR的有效性，这是一个多模态的、结构化的程序，将明确的EF策略指导与沉浸式VR实践相结合。

**方法**
本研究采用平行组随机对照试验，共有80名9至17岁的ADHD患者参与。参与者被分配到ECogFun-VR组（n=38）或等待名单对照组（n=42），后者仅接受标准化药物治疗。干预包括12次每周一次的个别治疗。在基线（T0）和干预后（T1）进行评估。主要结局指标为功能规划能力和日常生活表现（Zoo Map子测试，W-ADL）。次要结局指标包括家长报告的执行功能（BRIEF-2）、情绪能力（EQ-i:YV）、时间组织能力（Time-S）、感觉执行功能（EPYFEI-Escolar）以及神经心理学指标（WISC-IV数字广度测试；NEPSY-II听觉注意力；TMT；Stroop测试）。分析采用了调整后的意向- treatment方法，并辅以Complier Average Causal Effect（CACE）估计。

**结果**
主要结局指标（Zoo Map指标；W-ADL）在两组之间没有显著差异。干预组在工作记忆操作方面显示出显著改善（WISC-IV数字广度测试向后部分，p=0.030，d=0.50）。包括情绪人际能力和时间组织能力在内的几个次要领域显示出轻微到中等的、非显著的支持干预的趋势。CACE分析结果与意向- treatment结果一致。

**结论**
ECogFun-VR程序在某些认知能力方面产生了选择性提升，尤其是在工作记忆操作方面，但在12周内并未在更高层次的功能结果上带来显著变化。研究结果表明，计划和组织技能可能需要更长的干预时间、更高的干预强度或更多的泛化支持才能实现可测量的功能改善。VR支持的EF干预仍是针对ADHD青少年进行目标技能发展的有前景的方法。

**1. 引言**
神经发育障碍（NDDs）在幼儿期出现，并在学龄期间随着认知和社会需求的增加而变得更加明显（Francés等人，2022年；Posner等人，2020年）。这些障碍的特点是持续存在的缺陷，影响个人、社会和学术功能（Francés等人，2023年）。其中，注意力缺陷多动障碍（ADHD）表现为注意力不集中、多动和冲动三种发展性症状（Hinshaw，2018年）。关键在于，这种障碍与执行功能（EF）的缺陷密切相关，尤其是在计划和组织等高级功能领域。这些缺陷严重损害了日常生活活动（ADL）的功能独立性（Irwin等人，2021年；Kosheleff等人，2023年），常导致学业表现不佳、社交冲突、心理健康问题以及整体生活质量下降（Danckaerts等人，2010年；Giannakopoulos，2025年；Küpper等人，2012年）。鉴于其对认知控制、情绪调节和社会互动的深远和多方面影响，ADHD仍然是一个重要的全球健康问题，目前估计学龄儿童和青少年的患病率为5.6％至7.6％（Salari等人，2023年；P. Song等人，2021年；Thomas等人，2015年）。为了减轻这些影响，基于证据的临床指南提倡根据每个人的年龄、症状严重程度和共病情况制定多模态、个性化的干预措施（Eom & Kim，2024年）。在过去十年中，创新的数字疗法干预被证明是解决这些复杂需求的有效辅助手段（Wang和Reid，2011年；Zhao等人，2024年）。数字干预在提高认知功能、行为自我调节、治疗依从性和社交技能发展方面显示出有效性（Lin和Chang，2025年；Puspitasari和Setiawati，2025年）。在这一数字领域中，虚拟现实（VR）在评估和干预方面展现出了卓越潜力（Cie?lik等人，2020年；Gkora和Drigas，2024年）。VR提供了沉浸式、引人入胜的环境，自然增强了持续注意力，并有助于减少冲动等核心症状（Tabrizi等人，2020年）。此外，VR通过将认知任务嵌入模拟的现实世界场景中来针对EF缺陷（Martin-Moratinos等人，2025年），具有很高的生态学有效性（Bashiri等人，2017年；Schena等人，2023年）。这些虚拟环境允许安全、系统地练习复杂的、多步骤的任务，而这些任务通常难以通过传统的桌面方法实现（Marten等人，2024年；McKay等人，2022年；Mühlberger等人，2020年）。尽管有这些技术进步，大多数关于ADHD的VR研究仍集中在基础EF方面，如抑制控制和基本注意力。因此，针对高级EF（尤其是计划和组织）的干预措施及其直接转化为功能自主性的研究仍存在空白（Wang等人，2024年；Marten等人，2024年；Wang和Reid，2011年）。为了解决这一问题，开发了ECogFun-VR程序，该程序结合了已建立的神经康复框架和沉浸式技术（Pérez-Rodríguez等人，2025年）。该程序基于认知功能（Cog-Fun）模型和多任务 paradigm（MET）。Cog-Fun方法通过游戏化、职业化环境促进执行策略的获取和自我效能感（Hahn-Markowitz等人，2011年；Hahn-Markowitz等人，2016年；Hahn-Markowitz等人，2017年；Kastner等人，2022年；Levanon-Erez等人，2019年）。同时，MET paradigm用于评估和训练复杂多任务活动中运动和认知过程之间的相互作用（Cipresso等人，2014年；Pedroli等人，2013年）。证据表明，基于MET的任务比传统神经心理学测量方法更能敏感地检测出现实世界中的执行功能缺陷，如分心、执行效率低下和违反社会规则的行为，从而对日常行为挑战具有更好的预测能力（Cuberos-Urbano等人，2018年）。通过利用沉浸式VR来传递这些基于证据的策略，ECogFun-VR旨在提高动机和参与度，同时确保技能在日常生活中的转移（Rajaprakash & Leppert，2022年）。因此，本随机对照试验旨在检验ECogFun-VR程序在加强ADHD儿童和青少年的高级执行功能和日常生活技能方面的有效性。我们假设接受ECogFun-VR干预的参与者在计划、组织和功能独立性方面将比等待名单对照组有显著改善。

**2. 方法**
2.1. 患者和公众参与**
根据Consolidated Standards of Reporting Trials（CONSORT）指南（Hopewell等人，2025年）和Standard Protocol Items: Recommendations for Interventional Trials（SPIRIT）（Chan等人，2013年），本研究的设计、实施或报告过程中没有患者的直接参与。然而，该研究是在与临床和社区利益相关者的合作下进行的，包括格拉纳达大学、当地医院的神经儿科部门以及两个非政府组织。所有参与机构均位于西班牙格拉纳达省。

2.2. 试验设计**
该研究采用平行组设计，将实验组与接受标准化治疗的等待名单对照组进行比较。研究在ClinicalTrials.gov上进行了前瞻性注册（https://clinicaltrials.gov；标识符：NCT05368324）。

2.3. 试验方案修改**
自初始发布以来，试验方案未作任何修改。完整的方案已在之前发表（Pérez-Rodríguez等人，2025年）。本研究获得了省级生物医学研究伦理委员会的批准（参考编号：0931-N-22，2022年7月1日）。

2.4. 试验环境**
所有干预环节均在大学校园内的专用实验室进行，以确保环境受到控制和标准化。

2.5. 参与资格**
参与者于2022年至2024年间通过三个合作临床和社区服务招募：一家公立医院的神经儿科单元和初级保健中心。招募通过医生推荐和与这些服务提供的后续护理家庭的直接联系进行。医生在常规预约期间向符合条件的家庭解释研究目的、程序和纳入标准。研究团队联系了表示感兴趣的家庭，评估他们的资格并邀请他们参与。所有参与者及其监护人都在提供知情同意书之前获得了详细的书面和口头信息。9至17岁（含）的ADHD临床诊断儿童和青少年通过格拉纳达大学、当地医院的神经儿科部门以及两个合作非政府组织的沟通和推广渠道被邀请参与。纳入标准包括年龄在9至17岁之间，并确诊为ADHD，且在研究期间要么接受稳定的药物治疗，要么不接受药物治疗。诊断通过神经儿科部门和合作中心提供的报告进行验证。

2.6. 排除标准**
排除标准包括除ADHD之外的其他共病情况，以减少潜在的混淆因素。本研究符合赫尔辛基宣言（Gandevia & Tovell，1964年）的伦理原则，并获得了省级生物医学研究伦理委员会的批准（参考编号：0931-N-22，2022年7月1日）。严格遵循了知情同意程序：所有参与者及其主要监护人获得了关于研究范围和目的的详细解释。书面知情同意书来自父母或法定监护人，而参与者的口头同意则来自他们本人。

2.6. 干预措施和对照组**
2.6.1. 实验组（ECogFun-VR）
ECogFun-VR（执行-认知-功能-虚拟现实）是一项专门为增强ADHD儿童和青少年的EF和日常生活表现而设计的结构化、多模态干预措施。该程序由持证职业治疗师（SPR、CGR、CVR）按照标准化协议进行，每次60分钟，每周12次。

2.6.1.1. 会议结构和实施**
每次干预分为两个30分钟的模块，旨在帮助从理论策略学习过渡到功能应用：
2.6.1.1.1. 第一模块：基于策略的执行功能训练
该部分侧重于明确指导和支持认知策略的练习，涵盖基本和高级EF，包括计划、组织、抑制控制、时间管理和情绪调节。治疗师介绍会议目标并示范元认知策略。为了培养自主性和自我调节能力，参与者被赋予决定模块内活动顺序的权力。

2.6.1.2. 第二模块：在沉浸式VR环境中的应用
所获得的策略在Oculus Quest-2头戴设备支持的沉浸式、高保真VR环境中得到应用（图1）。

**图1. 会议第二部分：练习已获得的知识和计划组织策略、材料管理和时间管理、问题解决及情绪调节。**

2.6.1.3. 辅助策略和依从性**
为了加强事件、时间和任务的前瞻记忆，参与者在两个模块期间佩戴手表以监测时间并在特定时刻提供口头提醒。此外，参与者被分配了家庭“泛化任务”以在自然环境中巩固策略。为了促进依从性和动机，实施了基于积分的奖励系统（代币经济）。根据任务表现和努力程度积累积分，在项目结束时兑换奖励，以增强对延迟奖励的耐受性——这是ADHD的一个核心缺陷。表1总结了ECogFun-VR程序的每次会议结构和内容。

**表1. ECogFun-VR多模态干预程序的会议结构和内容。**

**会议重点**
1. 心理教育和自我意识：提高对ADHD相关挑战在家庭、学校和社会环境中的认识。
2. 主动性和自我监测：设定目标、识别问题、优先处理行动并应用系统的问题解决策略。
3. 工作记忆和前瞻记忆：训练策略以增强工作记忆和事件、时间及任务的前瞻记忆。
4. 自我监测和抑制控制：培养自我动机、主动性和抑制控制。
5. 计划和组织I：开发排序活动、组织材料和制定结构化计划的策略。
6. 抑制控制和环境适应：应用自我导向策略和环境调整以支持注意力和行为调节。
7. 情绪调节I：学习和练习日常活动中情绪控制的策略（“冷静行动”）。
8. 灵活性和情绪调节II：管理愤怒和情绪反应以减少适应不良行为。
9. 时间管理I：理解拖延现象并应用有效的时间规划策略。
10. 时间管理II：练习日常时间管理，重点关注屏幕使用和移动设备使用。
11. 任务监督和问题解决：根据紧急性和重要性优先处理任务；扩展问题解决策略并评估结果。
12. 高级计划和ADL组织：监控行动、保持职业平衡并完成生态学上有效的任务（“混乱平面”场景）。

**注：**每次会议持续60分钟，包括两个部分：(a)认知策略训练；(b)使用Oculus Quest-2头戴设备在沉浸式VR场景中的练习。

2.6.2. 等待名单对照组**
对照组采用等待名单设计，继续接受标准化药物治疗，任何药物方案的修改都会系统地报告给研究团队。在这种临床背景下，标准化药物治疗通常包括刺激性药物（如哌醋甲酯），由神经儿科医生根据常规临床实践和国家指南开具和调整。对照组和实验组都接受常规药物治疗，因为药物治疗是纳入标准之一。干预措施是在不改变现有药物方案的情况下添加的，药物方案仍由临床专业人员负责。赞助商和研究团队在药物管理或治疗决策方面没有发挥作用。2.7. 结果数据收集由独立评估者与提供干预的治疗师合作完成。信息来源包括系统性的会话记录以及参与儿童或青少年及其父母填写的标准化评估工具。所有评估都在预定的时间点进行：基线（T0）和12周项目结束后的干预后（T1），以确保参与者之间的方法一致性。首席研究员（DRA）监督数据管理，并在整个研究过程中监控数据完整性，以尽量减少报告中的潜在偏差。社会人口统计数据（如年龄、性别）和临床结果是通过Swanson, Nolan和Pelham评分量表（SNAP-IV）收集的。该量表用于测量儿童和青少年的ADHD和对抗性违抗障碍的核心症状（Abhayaratna等人，2023年）。它包含符合DSM-IV标准的分项，涉及注意力不集中、多动/冲动和对抗行为，由父母和教师在李克特类型量表上评分。解释基于每个子量表的平均得分，得分越高表示症状越严重。使用规范数据和临床临界值来区分典型行为和具有临床意义的行为。该量表在监测治疗反应方面表现出较高的可靠性和结构有效性（Abhayaratna等人，2023年）。问卷由父母填写。本研究的主要结果是计划和组织技能以及日常生活活动（ADL）的功能表现。这些通过《儿童执行功能障碍行为评估》（BADS-C）的Zoo Map子测试和Waisman日常生活活动量表（W-ADL）进行评估。Zoo Map子测试（BADS-C）提供生态学上有效的执行功能测量，特别针对计划和组织能力（Ballhausen等人，2017年）。在任务中，参与者需要在遵守特定规则和环境限制的情况下制定动物园地图的路线。表现基于参与者生成有效计划、最小化违规行为和在执行过程中保持自我监控的能力（Oosterman等人，2013年）。较低得分通常表示核心执行过程（包括计划、认知灵活性和策略性行为）存在缺陷。W-ADL是一种护理者报告的工具，用于评估具有发育和神经精神状况个体的功能独立性（Maenner等人，2013年）。它评估儿童和青少年独立完成基本和工具性日常生活活动的程度，包括个人护理、家务任务和社区功能。较高得分表示更大的自主性，而较低得分则反映了对外来护理者的更大依赖性（Maenner等人，2013年）。W-ADL作为监测适应功能和治疗结果的生态相关工具，表现出稳健的可靠性和有效性（Maenner等人，2013年）。这份问卷由参与者的父母填写。执行功能的次要结果使用以下工具进行了评估：《执行功能行为评分量表第二版》（BRIEF-2）；《韦氏儿童智力量表》第四版（WISC-IV）的数字广度前向子测试；NEPSY-II的听觉注意力子测试；Trail Making测试A和B；Stroop颜色和单词测试；儿童和青少年的自我时间管理评分（Time-S）；以及EPYFEI-学校问卷和Bar-On情绪商数量表：青少年版（EQ-i: YV）。BRIEF-2（家长版）用于评估日常执行功能困难（Lace等人，2022年；Maldonado等人，2017年）。它由父母、教师或青少年（自我报告）填写，评估抑制、情绪控制、工作记忆、组织和认知灵活性等领域。BRIEF-2提供指数分数（行为调节、情绪调节和认知调节）和全球执行功能综合得分，提供执行功能的全面概况。较高得分表示执行功能更困难。该工具表现出稳健的心理测量属性，并在临床和研究环境中广泛用于识别执行功能障碍和监测干预结果（Gioia等人，2024年）。WISC-IV的数字广度子测试是基于表现的听觉注意力和工作记忆测量。它要求参与者回忆越来越长的数字序列，既向前又向后。前向条件主要评估听觉注意力和即时记忆广度，而后向条件则会增加工作记忆、心理操作和执行控制的要求。数字广度的表现对神经发育障碍中的注意力调节和执行功能缺陷敏感（Guimar?es等人，2024年；Wechsler，2015年）。心理测量研究显示了其稳健的内部一致性和结构有效性，支持其作为短期和工作记忆过程指标的可靠性（Becker等人，2024年）。该测试由参与儿童和青少年完成。NEPSY-II听觉注意力子测试是一种神经心理学测量，用于评估儿童和青少年的选择性和持续性听觉注意力和抑制控制（Brooks等人，2009年）。在这个任务中，参与者需要根据考官的指示指向特定的刺激，涉及注意力调节和反应抑制过程。低分表示选择性或持续性注意力困难、反应时间慢、抑制控制问题或工作记忆缺陷。这些子测试表现出足够的高内部一致性和稳定性。这项评估适用于所有参与儿童和青少年。Trail Making测试（TMT）用于评估执行功能，包括注意力、处理速度和认知灵活性（Gerber等人，2012年）。A部分主要测量视觉扫描和心理运动速度，而B部分评估认知灵活性和分配注意力。表现基于完成时间和错误率进行解释，更长的时间或更多的错误表明认知效率降低。根据年龄和教育的调整后的规范数据进行解释，B部分相对于A部分的不成比例的损害通常被认为是执行功能障碍的证据。TMT表现出足够的可靠性、有效性和对神经状况的敏感性（Kang等人，2011年；Wagner等人，2011年）。在这项研究中，该测试适用于儿童和青少年。Stroop颜色和单词测试是一种广泛使用的神经心理学测量方法，用于评估选择注意力、认知控制和抑制过程（Barreto等人，2016年）。任务要求个体命名可能与文字颜色一致（例如，用红色印刷的“red”）或不一致（例如，用蓝色印刷的“red”）的单词。表现通常通过不同条件下的完成时间和错误频率进行评估。较大的干扰效应——反映在不一致条件下的延迟反应潜伏期或增加的错误率——被解释为抑制控制减弱和注意力调节缺陷的指标。该测试表现出足够的光谱测量属性和时间稳定性（Li等人，2024年；Luque，2018年；Rivera等人，2017年；Rodríguez Barreto等人，2016年）。儿童和青少年完成了这项评估测试。Time-S是一种标准化的自我报告工具，用于评估学龄儿童和青少年在日常活动中的时间管理技能（Sk?ld & Janesl?tt，2017年）。它评估规划、组织和遵守日常惯例等领域，较高得分表示更有效的时间管理策略。解释基于相对于年龄适宜规范的总体和子量表得分，其中较低得分表明时间组织和自我调节方面存在困难。实证研究支持该量表的可靠性和结构有效性，强调其对执行功能障碍的敏感性及其在理解日常表现挑战方面的生态实用性（Sk?ld & Janesl?tt，2017年）。EPYFEI-Parents是一种家长报告的工具，用于评估儿童和青少年在日常环境中的执行功能和感官处理（Romero-Ayuso等人，2018年）。它捕捉家长对其孩子在抑制、工作记忆、灵活性、情绪调节和感官调节等领域的能力的看法。通过将总体和子量表结果与规范数据进行比较来解释得分，其中较高的困难表示更大的执行和感官处理缺陷。实证研究支持该问卷的可靠性和结构有效性，强调其对检测神经发育障碍中的功能障碍的敏感性及其在将执行功能与日常生活表现联系起来的生态实用性（Romero-Ayuso等人，2018年）。EQ-i: YV是一种自我报告工具，用于评估7-18岁儿童和青少年的情绪和社会功能（Gilar-Corbi等人，2021年）。它评估情绪智力的核心领域，包括人际技能、压力管理、适应性和一般情绪。分数使用标准化规范进行解释，较高分数表示较强的情绪和社会能力，而较低分数可能表明情绪调节、人际关系或应对策略方面的困难。研究支持EQ-i:YV的可靠性和结构有效性，其使用与学术成就、社会适应和心理幸福感等重要发展结果相关（Gilar-Corbi等人，2021年）。儿童和青少年完成了这份问卷。2.7.1. 治疗依从性和忠实度治疗依从性被系统地记录下来。干预由接受过ECogFun-VR协议事先培训的持证职业治疗师提供，以确保标准化实施（SPR、CGR、CVR）。通过多层次策略监控治疗忠实度。每次会话结束后，治疗师会完成一份标准化清单，记录对手册的依从性和计划活动的执行情况。此外，首席研究员（DRA）通过定期观察会话、审查文档并根据需要提供反馈来监督这一过程。这种多层次的忠实度策略确保了干预在参与者之间的统一实施，并将可能的偏离协议情况最小化。2.8. 广告研究期间未报告与干预相关的不良事件。2.9. 样本量G*Power软件（版本3.1.9.7）被用于估计统计功效和效应大小。样本量是通过先验功效分析计算的，主要结果定义为BRIEF-2。根据之前的研究和21项干预研究的回顾（Maeir等人，2014年；Zhao等人，2024年），每个组至少需要30-34名参与者才能在α = 0.05（双尾）的显著性水平下达到80%的功效，假设效应大小为d = 0.69。考虑到潜在的20%脱落率，最终目标样本量定为80名参与者，每组40名（Zhao等人，2024年）。尽管BRIEF-2由于其稳健的心理测量属性和先前干预研究中可用的效应大小而作为功效分析的参考测量，但在研究开发过程中还纳入了其他生态学上有效的、基于表现的结果（BADS-C Zoo Map和W-ADL），以捕捉计划和日常生活独立性的功能变化。因此，尽管这些措施未用于初始样本量计算，但在结果部分中予以强调。根据CONSORT建议，样本量计算仅基于主要结果；因此，先验功效分析中没有纳入假发现率或多重检验的调整。次要结果未用于确定样本量，被视为探索性的。此澄清是为了确保关于功效计算和试验统计框架的假设的透明度。2.10. 随机化和分配隐藏使用计算机生成的随机化软件（Research Randomizer）进行了简单连续随机化。参与者被分配一个唯一的数字标识符，然后被分配到实验组或等待名单对照组。由于简单随机化不施加平衡限制，因此产生的分配在组间产生了38/42的分布，这在方法的预期变化范围内。没有应用分组或分层程序。为了确保分配隐藏，随机化序列由未参与招募、评估或干预提供的独立研究人员生成和存储。序列保存在受密码保护的文件中，只有在每个参与者完成基线评估后才会揭示组分配。这一程序防止了评估者和治疗师预测或影响分配，并确保随机化后无法更改治疗分配。2.11. 盲法实施了双盲程序，以最小化确定性和观察偏差。所有基线（T0）和干预后（T1）的临床评估都由受过培训的评估者进行，他们对参与者的组分配不知情，并且完全独立于提供干预的职业治疗师。为了保持这种盲法，明确指示参与者及其家庭在评估会话期间不要透露他们的治疗状态。2.12. 统计方法使用统计测试和分布图的视觉检查来检验连续变量的正态性。分类变量以频率和比例呈现，而连续变量则根据情况报告为带有标准差或中位数和四分位范围的均值。基线特征进行了描述性总结，未进行统计显著性测试，这符合CONSORT指南。为了评估干预效果，对每个连续结局进行了协方差分析（ANCOVA）模型的分析。在所有模型中，干预后的得分（T1）作为因变量，组别（干预组与对照组）作为固定因素，相应的基线得分（T0）作为协变量。这种方法推荐用于具有前后设计的随机对照试验，因为它比仅基于干预后得分或简单变化得分的分析提供了更精确和无偏的治疗效应估计（Assmann等人，2000年；Pocock等人，2002年；Vickers和Altman，2001年）。对于每个模型，我们报告了估计的边际均值（EMMs）、带有95%置信区间的调整后组间差异、p值、偏η2和效应大小（调整后的d和Hedges’g）。对于次要结局没有应用多重比较校正，因为这些分析是探索性的，且试验仅针对主要终点进行样本量设计。由于干预组的依从性不完全（p? ≈ 0.92），我们还使用了Bloom的估计器（Δ_IT_T / p?）来估计编译器平均因果效应（CACE）。CACE分析仅针对主要结局进行，因为这些结果代表了因果干预效应，适合使用工具变量估计。缺失数据很少。对于BRIEF-2，有11个值（13.25%）缺失。这些情况使用适当的基于模型的程序进行了插补，以保留所有意向治疗分析的参与者。统计显著性设定为p < .05。所有分析均使用SPSS 28.0（IBM公司，2021年）进行。

3. 结果
2022年11月至2024年2月期间，共有86名儿童和青少年接受了这项研究的访谈。有6名参与者因不符合纳入标准（在研究期间开始新的药物治疗或药物治疗不稳定）而被排除在外的。最终样本由80名患有ADHD的儿童和青少年组成，他们被随机分配到干预组或对照组（干预组38名参与者，对照组42名；见图2）。

图2. CONSORT流程图。

3.1. 基线时的参与者特征
共有80名参与者纳入研究；58名（72.5%）为男性，22名（27.5%）为女性；平均年龄=11.75±2.36岁。基线社会人口统计学和临床特征见表2。根据CONSORT指南，基线数据未进行显著性测试，并且两组在描述上似乎相当。

表2. 实验组和对照组的基础人口统计学和临床特征

| 空单元 | 实验组（n=38） | 对照组（n=42） |
|-------|-----------|-----------|
| 年龄 | 12.21±2.57 | 11.33±2.09 |
| 性别 | n (%) | n (%) |
| 女性 | 10 (26.3%) | 12 (28.6%) |
| 男性 | 28 (73.7%) | 30 (71.4%) |
| ADHD亚型 | 注意力缺陷型 | 多动-冲动型 |
| | 11 (28.9%) | 16 (38.1%) |
| | 多动-冲动型 | 合并型 |
| | 27 (71.1%) | 26 (61.9%) |
| 药物治疗 | 是 | 否 |
| | 25 (65.8%) | 13 (34.2%) |
| 母亲职业 | 管理和商业高管或高级技术人员 | 零售和个人服务所有者或艺术家及运动员 |
| | 96 | 2 |
| 中层管理和监督人员或保护和安全服务人员 | 25 |
| 技术或半技术工人 | 16 | 21 |
| 非技术工作 | 57 | 6 |
| 其他（未指定） | 6 | 1 |

3.2. 坚持性
坚持性定义为完成≥80%的计划任务。有3名参与者未能达到这一标准（58.33%，66%，33%的参与者中途退出）。非坚持者的平均坚持性为52.44%。总体而言，干预组中有35/38（92.1%）的参与者达到了坚持性门槛并按计划完成了项目。有1名参与者退出（退出率为2.6%）。低坚持性的案例被视为非坚持者，而不是失访者，因为他们完成了T1评估。

3.3. 敏感性分析（CACE）
为了解释不完全的坚持性，CACE估计与ITT结果一起报告。各方法的结果一致；例如，“数字跨度后向”任务的CACE约为0.48 [0.05, 0.92]。使用分配作为工具的工具变量（2SLS）分析显示，坚持性没有显著的因果效应（B = 14.00, SE = 51.76, t = 0.27, p = 0.788; R2 =.002），表明干预的效果不能归因于坚持性的差异。

3.4. 主要结局
调整后的ANCOVA显示，各组在主要结局上没有统计学上的显著差异。在“动物园地图”任务中，调整后的组间差异在错误（Δ = –0.32, 95% CI [–1.41, 0.76], p = .555, d = –0.13）、计划时间（Δ = 10.42, 95% CI [–24.60, 45.44], p = .555, d = 0.13）和执行时间（Δ = –13.18, 95% CI [–38.63, 12.28], p = .306, d = –0.23）方面都很小且不显著。“W-ADL”也显示出小的、不显著的差异（Δ = 0.58, 95% CI [–1.58, 2.74], p = .594, d = 0.14）。完整模型估计（EMMs，带95%置信区间的调整后差异、p值、偏η2和调整后的d/g）见表3。就幅度而言，主要结局的效应大小都很小，表明两组之间几乎没有差异。有关调整后效应大小的可视化总结，请参见图3。

表3. 带有CACE（Bloom）的调整后ANCOVA结果（ITT）

| 结局 | 调整后均值（对照组）[95% CI] | 调整后均值（干预组）[95% CI] | 调整后差异 [95% CI] | pd (g) | 偏η2 | CACE (Bloom) [95% CI] |
|---------|------------------|------------------|--------------|---------|------------|
| 动物园地图错误 | 2.35 [1.59, 3.10] | 2.02 [1.24, 2.80] | -0.32 [-1.41, 0.76] | -0.13 | 0.005 | -0.35 [-1.53, 0.83] |
| 动物园地图计划时间 | 100.95 [76.70, 125.20] | 111.38 [86.19, 136.57] | 10.42 [-24.60, 45.44] | 0.555 | 0.13 (0.13) | 0.005 |
| 动物园地图执行时间 | 72.93 [55.29, 90.56] | 59.75 [41.43, 78.07] | -13.18 [-38.63, 12.28] | 0.306 | -0.23 | 0.014 |
| W-ADL | 24.88 [23.34, 26.42] | 25.45 [23.94, 26.97] | 0.58 [-1.58, 2.74] | 0.594 | 0.14 (0.14) | 0.005 |
| | | | | | | |
| | | | | | |

次要结局

| SNAP-IV注意力缺陷 | 15.55 [13.19, 17.91] | 16.80 [14.67, 18.93] | 1.25 [-2.00, 4.50] | 0.44 | 0.26 (0.25) | 0.016 |
| SNAP-IV多动-冲动 | 13.15 [11.22, 15.07] | 13.27 [11.60, 14.94] | 0.12 [-2.53, 2.77] | 0.92 | 0.03 | 0.000 |
| SNAP-IV总分 | 27.41 [23.59, 31.24] | 29.77 [26.46, 33.08] | 2.35 [-2.97, 7.68] | 0.37 | 0.32 | 0.02 |
| | | | | | | |
| 时间-S因子1 | 18.24 [7.58, 8.91] | 8.59 [7.93, 9.25] | 0.35 [-0.59, 1.28] | 0.46 | 0.17 | 0.008 |
| 时间-S因子2 | 14.68 [13.69, 15.68] | 14.82 [13.82, 15.81] | 0.13 [-1.28, 1.55] | 0.85 | 0.04 | 0.001 |
| 时间-S因子3 | 11.53 [10.66, 12.40] | 11.71 [10.85, 12.58] | 0.18 [-1.04, 1.41] | 0.76 | 0.07 | 0.001 |
| 时间-S因子4 | 7.03 [6.34, 7.72] | 7.86 [7.17, 8.54] | 0.82 [-0.15, 1.80] | 0.09 | 0.40 | 0.04 |
| 时间-S总分 | 10.34 [9.69, 10.98] | 10.74 [10.09, 11.38] | 0.40 [-0.51, 1.31] | 0.38 | 0.21 | 0.01 |
| EPYFEY因子1 | 123.44 [20.84, 26.04] | 23.25 [20.65, 25.85] | -0.19 [-3.87, 3.49] | 0.91 | -0.03 |
| | | | | | | |
| EPYFEY因子2 | 1.93 [0.69, 3.18] | 2.93 [1.68, 4.18] | 0.99 [-0.77, 2.76] | 0.26 | 0.30 | 0.023 |
| EPYFEI因子3 | 10.77 [8.81, 12.73] | 10.47 [8.51, 12.43] | -0.30 [-3.07, 2.48] | 0.83 | -0.06 |
| | | | | | | |
| EPYFEI因子4 | 10.98 [9.38, 12.59] | 8.88 [7.28, 10.48] | -2.10 [-4.38, 0.17] | 0.069 | -0.49 |
| | | | | | |
| EPYFEI总分 | 34.42 [31.09, 37.75] | 31.37 [28.04, 34.71] | -3.04 [-7.77, 1.68] | 0.20 | -0.34 |
| EQ-i:YV情绪 | 103.51 [99.53, 107.50] | 108.39 [104.05, 112.73] | 4.87 [-1.02, 10.76] | 0.10 | 0.39 | 0.039 |
| | | | | | | |
| EQ-i:YV人际 | 102.17 [97.51, 106.83] | 108.30 [103.22, 113.38] | 6.13 [-0.77, 13.04] | 0.08 | 0.43 |
| | | | | | | |
| EQ-i:YV适应性 | 105.03 [100.24, 109.82] | 108.93 [103.63, 114.23] | 3.90 [-3.25, 11.04] | 0.28 | 0.26 |
| | | | | | | |
| EQ-i:YV压力管理 | 94.65 [90.77, 98.53] | 95.98 [91.69, 100.27] | 1.33 [-4.46, 7.11] | 0.64 | 0.11 |
| | | | | | |
| IET EQ-i:YV | 100.98 [96.45, 105.50] | 106.26 [101.24, 111.27] | 5.28 [-1.50, 12.06] | 0.12 | 0.38 |
| | | | | | |
| BRIEF-2全球执行功能指数 | 72.48 [69.31, 75.66] | 73.93 [70.48, 77.38] | 1.45 [-3.27, 6.17] | 0.54 | 0.16 |
| | | | | | |

3.5. 次要结局
3.5.1. SNAP-IV症状
在注意力缺陷（Δ = 1.25, 95% CI [–2.00, 4.50], p = .440, d = 0.26）、多动（Δ = 0.12, 95% CI [–2.53, 2.77], p = .925, d = 0.03）或总分（Δ = 2.35, 95% CI [–2.97, 7.68], p = .376, d = 0.32）方面，未发现显著的组间差异。效应大小从小到中等不等。详见表3和图3。

3.5**次要结果**
在SNAP-IV测试中，注意力不集中、多动症症状和总分方面的组间差异未达到显著性水平，效应量较小至中等。在更广泛的文献中，结构化和沉浸式干预已被证明可以减轻ADHD的核心症状，并改善社会情感适应能力（Hong et al., 2022; Ou et al., 2020; Shema-Shiratzky et al., 2019; H. Song et al., 2025）。基于这些发现，当前的结果可能表明症状水平的改变是可能的，但可能需要增加干预剂量、加强生态实践或提供更好的泛化支持，才能在随机设计中达到统计显著性。在Time-S研究中，因素4显示出最大的（但不显著的）趋势（d ≈ 0.40），这可能表明时间组织过程的敏感性较高，但缺乏足够的统计支持。在更广泛的文献中，基于VR的联合干预措施被报道可以减少冲动行为（Cho et al., 2004）、提高抑制控制能力（H. Song et al., 2025）和改善自我控制/抑制能力（Wong & Qin, 2023），这有助于解释为什么在更广泛的功能变化可检测之前，活动启动和时间结构化的早期变化就可能出现。同样，当任务同时涉及多种认知过程（如回顾性记忆、执行控制、规划和监督）时，执行策略的生态转移（尤其是那些涉及计划、时间管理和持续监控的策略）更有可能发生（Gongsook et al., 2012; Seesj?rvi et al., 2025）。
关于家长报告的结果，EPYFEI试验中没有显示出组间差异的统计学显著性，某些指标（如因素4、总分）趋向于对照组（表3）。尽管如此，观察到的注意力和问题解决方面的变化方向与描述类似情境下执行注意力和日常问题解决能力中等影响的报告大体一致（Kona? et al., 2024; Schena et al., 2023）。从更广泛的文献来看，家长报告用于捕捉日常功能的改善，特别是在注意力和问题解决策略方面，这些改善可能在随机对照试验中检测到显著差异之前就已经出现（Barba et al., 2019; Schena et al., 2023; Visone et al., 2022）。因此，虽然当前的EPYFEI结果尚不显著，但从方向上看，它们与生态基础训练能够转化为日常变化的观点是一致的，这一假设需要通过更长时间的干预、多来源的验证和后续评估来验证。

**EQ-i:YV指数得分（人际关系、情绪、总体EI）**也显示出中等程度的积极效应，但未达到显著性水平，这表明情感/人际能力可能对项目元素更敏感，尽管置信区间接近零。详见表3和图3.4.3。

**神经心理学结果**
唯一具有统计学显著性的效应体现在WISC-IV的数字广度逆向测试中（效应量中等），表明干预组在执行工作记忆操作方面有所改善。其他神经认知指标（如NEPSY-II听觉注意力、认知灵活性、TMT-A/B）显示出小到中等的非显著效应，置信区间跨越零值。这一结果表明，尽管在更广泛的行为或功能领域中没有普遍的改善，但在核心执行过程中仍存在选择性提升。从实施角度来看，工作记忆操作（数字广度逆向）的显著提升与注意力及灵活性方面的非显著但方向一致的效果相符，这与文献中的发现一致，即基于VR的训练可以针对特定的执行成分进行训练，即使广泛的行为评分变化缓慢（Gallai et al., 2024; Guedj et al., 2023; Martin-Moratinos et al., 2025; Romero-Ayuso et al., 2021; Zhang and Wang, 2023），这一观点得到了关于注意力和认知的元分析结果的强化（Corrigan et al., 2023）。

**依从性、ITT和CACE解释**
依从性很高（约92%达到或超过80%），并对主要结果进行了CACE评估。关键的是，CACE的发现与ITT结果一致，工具变量模型（2SLS）表明依从性对结果没有显著的因果影响，降低了整体零假设/温和结果模式是由依从性差异造成的可能性。

**解释和机制**
综合来看，结果表明存在针对性的改进，而非全面的改变：（a）执行工作记忆（数字广度逆向）有所改善；（b）情感/人际领域和时间组织显示出有希望但未达到显著性的趋势；（c）功能性执行指标基本保持不变。一个合理的解释是，基础执行过程和情感能力可能对结构化训练反应更快，而复杂的多层生态行为则需要更多时间、强度和明确的泛化支持才能表现出可检测的改善。

**优势与局限性**
该研究具有严格的随机对照试验设计、高依从性、使用ANCOVA调整后的估计值以及纳入CACE以增强因果解释的能力。这些特点共同提高了内部有效性，并提供了对干预效果的全面了解。

**几个考虑因素**
首先，样本量较小可能限制了检测微妙组间差异的统计能力，尤其是在多个次要终点上，这反映在宽置信区间中。试验仅包含一个干预周期且没有进行长期随访，从而限制了对效果持久性的推断。方法学上的限制在于样本量确定是基于BRIEF-2进行的，而BADS-C和W-ADL被作为主要的功能结果；由于在设计时这些功能指标的效应量不可用，因此可能无法有效检测到较小的效应。此外，在多次次要分析中未进行正式的多重比较调整，增加了I型错误的风险；因此，对次要结果应谨慎解释。从干预角度来看，干预的持续时间和强度可能不足以引起高级执行过程（如抽象规划或情绪调节）的可测量变化，这些通常需要更大的干预剂量或巩固才能在行为层面体现出来。关于测量方法，依赖家长报告的工具（如BRIEF-2、EPYFEI）可能存在响应偏差，因为感知到的变化可能受到期望或情境因素的影响；来自多来源的证据和客观指标（如神经心理学表现或神经生理指标）的交叉验证可以缓解这种担忧。

**影响和未来方向**
尽管统计显著性有限，但在情感/人际领域和时间组织方面观察到的中等趋势，以及工作记忆操作的显著改善，为优化提供了实际目标。未来的试验应：（i）增加干预时长/强度；（ii）纳入更多种族多样化的样本；（iii）加强泛化和生态转移支持；（iv）进行纵向随访以评估效果的持续性和日常功能的转化。

**结论**
本研究提供了对多模态干预在执行功能、时间感知、情绪和神经心理学方面影响的细致评估。虽然主要结果在组间没有显著差异，但干预在工作记忆操作（数字广度逆向）方面产生了统计学上的显著改善，并在几个情感/人际和时间组织指标上显示出中等程度的非显著趋势。总体而言，证据表明存在选择性的认知-情绪反应，而不是广泛的功能变化。优化干预剂量、加强生态实践和泛化支持可能是将这些选择性改善转化为日常功能改善的关键。

**作者贡献声明**
Immaculada Medina-Martínez：撰写——审阅与编辑、方法论；
Dulce Romero-Ayuso：撰写——审阅与编辑、监督、方法论、研究、资金获取、概念化；
Garach-Gómez Ana：研究；
Trivi?o-Juárez José-Matías：撰写——审阅与编辑、方法论；
Arrabal-Fernández Luisa：撰写——审阅与编辑、研究；
Sonia Pérez-Rodríguez：撰写——审阅与编辑、初稿撰写、方法论、研究、概念化；
Carmen Gutierrez-Ramírez：研究；
Carmen Vidal-Ramírez：研究；
Araceli Ortiz-Rubio：撰写——审阅与编辑、监督。

**写作过程中生成式AI和AI辅助技术的使用**
在准备本手稿期间，作者使用了Microsoft Copilot来辅助文本编辑和语言润色。作者随后审查、修改并批准了所有内容，并对稿件的完整性和准确性负全责。

**资助**
本研究得到了Takeda-Shibuya的资助。资助方未参与本研究的设计、数据收集、分析或解释，也未参与手稿的撰写。

热点排行