探讨数字表型技术在预测侵入性体验方面的应用价值

《European Journal of Psychotraumatology》：Examining the utility of digital phenotyping for the prediction of intrusive experiences

【字体：大中小】 时间：2026年05月11日 来源：European Journal of Psychotraumatology 4.1

编辑推荐：

　　**摘要** **背景：** 与目睹创伤事件相关的侵入性体验是创伤后应激障碍（PTSD）的核心症状，并且已被证明可以通过创伤周围的情绪激活来预测。然而，关于创伤周围情绪激活在侵入性体验发展中的作用的研究受到了依赖于自我报告量表的限制。 **目的：** 本研究旨在考察创伤周围情

　　**摘要**

**背景：** 与目睹创伤事件相关的侵入性体验是创伤后应激障碍（PTSD）的核心症状，并且已被证明可以通过创伤周围的情绪激活来预测。然而，关于创伤周围情绪激活在侵入性体验发展中的作用的研究受到了依赖于自我报告量表的限制。

**目的：** 本研究旨在考察创伤周围情绪激活的面部、焦点和语言表型是否也能有助于预测侵入性体验。

**方法：** 这项纵向研究招募了81名大学生，记录了他们对模拟创伤（车祸视频）的反应。从这些记录中提取了参与者的面部、声音和语言特征，以及他们的自我报告的情绪体验，并将这些数据输入到机器学习（随机森林回归）模型中，以预测他们在接触模拟创伤三天后是否会经历侵入性体验。

**结果：** 随机森林回归模型能够预测对提醒他们模拟创伤的触发因素的反应差异（R2 = 0.23），以及他们是否对模拟创伤有生动的记忆（R2 = 0.55）。声音和语言特征对预测对触发因素的反应贡献最大，而最初自我报告的记忆生动性则对预测三天后的记忆生动性贡献最大。

**结论：** 这些发现表明，面部、声音和语言表型结合自我报告测量方法，可以用于预测大学生样本在接触模拟创伤后特定侵入性体验的发生。需要进一步在临床样本中进行研究，以证明其在预测PTSD患者的侵入性体验方面的有效性。

**亮点：**
- 本研究考察了从模拟创伤的记录中提取的面部、声音和语言特征是否可以用来预测侵入性体验。
- 机器学习模型主要利用声音和语言特征来预测接触模拟创伤后对创伤提醒的反应差异。
- 另一个模型依靠自我报告的生动性来预测模拟创伤记忆的平均生动性差异。

**背景：** 与目睹创伤事件相关的侵入性体验是创伤后应激障碍（PTSD）的核心症状，研究表明这些体验可以通过创伤周围的情绪激活来预测。然而，由于研究依赖于自我报告量表，关于创伤周围情绪激活在侵入性体验发展中的作用的探索受到了限制。

**目的：** 本研究旨在探讨创伤周围情绪激活的面部、焦点和语言表型是否也能帮助预测侵入性体验。

**方法：** 本研究招募了81名大学生，记录他们对模拟创伤（车祸视频）的反应。从这些记录中提取了面部、声音和语言特征以及他们的情绪体验，并将其输入到机器学习模型中，以预测他们在接触模拟创伤三天后是否会经历侵入性体验。

**结果：** 随机森林回归模型能够预测对模拟创伤触发因素的反应差异（R2 = 0.23）以及他们对模拟创伤的生动记忆（R2 = 0.55）。声音和语言特征对预测反应差异的贡献最大，而初始自我报告的记忆生动性对预测三天后的记忆生动性贡献最大。

**结论：** 研究结果表明，面部、声音和语言表型结合自我报告测量方法，可以用于预测大学生在接触模拟创伤后特定侵入性体验的发生。需要在临床样本中进一步研究这种方法，以证明其在预测PTSD患者侵入性体验方面的有效性。

**关键词：** 创伤后应激障碍；侵入性体验；数字表型；情绪；机器学习参与者还被要求提供他们出生时的年龄和性别。2.2.3. 数字表型使用OpenWillis（Worthington等人，引用2024年）和Linguistic Inquiry and Word Count – 第22版（LIWC-22）（Boyd等人，引用2022年）软件，从面部、声音和语言表型的角度分析了对车祸视频的反应。OpenWillis利用DeepFace来逐帧测量面部动作编码系统（FACS）（Ekman & Friesen，引用1978年）单位的强度，范围从-1（情绪表达低于基线）到1（情绪表达高于基线），从而产生面部情绪表达分数。FACS单位指数化了脸部中单个和一组肌肉的活动强度（每个都有其自己的面部动作单位），这些肌肉与六种主要情绪相关：悲伤、恐惧、惊讶、愤怒、厌恶和恐惧（Ekman & Friesen，引用1978年）。DeepFace在识别其先前训练过的面部标志点方面被证明准确率为97%（Taigman等人，引用2014年），在识别人类情绪方面的准确率为94%（Venkatesan等人，引用2023年）。Parselmouth是OpenWillis中的软件包，用于测量声音变量（Jadoul等人，引用2018年）。Parselmouth是Python的Praat软件库的实现（Boersma & Weenink，引用2024年），它可以产生声音变量，如音量、平均基频（‘f0_mean’）（参见补充材料中的术语表，其中包含OpenWillis和LIWC-22变量），以及基频的偏差。它还可以测量和产生更复杂的声音特征，如CPP（倒谱峰值显著性；‘cpp_var’）和MFCCs（梅尔频率倒谱系数，例如‘mfcc12_var’）。Praat软件在其他声音软件中表现出良好的聚合效度和识别声音特征的可靠性（Burris等人，引用2014年）。OpenWillis使用WhisperX将音频转换为文本，以便进行语言分析。WhisperX的词错误率为9.7%，这比以往的语音转文本模型有所改进（Bain等人，引用2023年）。Valence Aware Dictionary和sEntiment Reasoner（VADER）（Hutto & Gilbert，引用2014年）使用基于规则的算法分析提取文本的语言情感，产生从-1（负面情感）到1（正面情感）的平均分数，以表示文本的情感价值。LIWC-22库软件（Boyd等人，引用2022年）用于计算提取文本中的单词数量，为每个词典提供的单词数量打分（例如，‘Affect’单词的数量）。LIWC软件与其他文本分析软件相比，在情绪测量（观察者评分和自我报告测量）方面表现出更高的区分效度和聚合效度（Bantum & Owen，引用2009年）。2.2.4. 情绪量表参与者在10点的视觉模拟量表上评估观看车祸视频后的负面感受程度（1=完全不负面；10=极端负面）。2.2.5. 干扰测量在观看车祸视频三分钟后，以及每天三个时间点，在观看视频后的七天内，对参与者进行了六项干扰测量。这些干扰测量部分来自Intrusive Memories Questionnaire（IMQ）（Baker & Goodson，引用2023年），但根据其与PTSD相关的重要方面的相关性，还增加了一些更具体的测量，如生动性、图像和情绪强度（Clark等人，引用2015年；Doron-LaMarca等人，引用2015年；Morina等人，引用2013年）。每个测量指标分别代表了干扰的单独组成部分：记忆体验、对触发因素的反应、图像体验、情绪体验以及干扰的生动性。按照相同的顺序，每个测量都询问以下陈述的真实性：‘视频的记忆浮现在我的脑海中’、‘其他事情不断让我想起视频’、‘我不经意间想到了视频’、‘很难将视频中的图像从脑海中抹去’、‘我对视频有强烈的情绪波动’以及‘我对视频的记忆非常生动’（1=完全不真实；5=极其真实）。每天三个时间点上参与者对这些问题的平均得分被定义为以下六项干扰测量：记忆、触发因素、想法、图像、情绪和生动性。这六个测量具有“良好”到“优秀”的内部一致性水平（α=0.89），表明它们指标的是相同的干扰体验基础结构。2.3. 流程参与者通过Microsoft Teams观看了一个描绘车祸后果的视频。然后使用QuickTime记录了他们对视频的反应，描述了一分钟。在提供此回应三分钟后，他们被给了六项干扰测量陈述，并被指导如何下载和使用智能手机生态瞬间评估（SEMA-3）应用程序，该应用程序每天在三个时间点（上午10点、下午2点和下午6点）向参与者发送干扰问题。2.4. 数据分析我们使用R统计软件版本4.3.1（R Core Team，引用2021年）和Python中的Scikit-learn包（Pedregosa等人，引用2011年），评估了随机森林回归模型的估计能力，这些模型使用了从参与者记录中提取的所有面部、声音和语言变量（参见补充材料中的变量术语表），以及他们在观看车祸视频三分钟后进行的相应干扰测量，来预测六个干扰测量的平均分数。随机森林回归模型中没有包括其他测量变量。最初的计划是分析六项干扰测量在参与者被要求回答问题的七天内的平均分数。然而，从第四天开始，缺失条目的数量显著增加，影响了平均分数基于真实数据还是估算数据的比例。因此，决定平均干扰分数将基于参与者前三天的分数。在这三天内，如果参与者回答了超过50%的SEMA-3问题，则他们被保留在分析中。R统计软件中有一个名为MissForest的随机森林包，用于估算那些被保留的参与者的缺失分数，因为它在处理非线性和高维数据方面已被证明有效（Stekhoven & Bühlmann，引用2012年）。在数据被估算并且计算了车祸视频后三天内干扰测量的平均值后，使用嵌套交叉验证方法来构建和估计机器学习（随机森林回归）模型的性能，以预测平均干扰测量的变化。选择随机森林方法是因为它在预测方差方面的表现已经得到证实（相对于其他机器学习方法，例如正则化回归），具有对抗过拟合的鲁棒性，并且需要最少的超参数调整（Chen等人，引用2020年；Gregorutti等人，引用2017年）。递归特征消除（RFE）方法被用来减少随机森林模型中的特征数量，因为这种方法已被证明可以提高随机森林模型的性能，因为它能够解释复杂特征集之间的交互作用（Gregorutti等人，引用2017年）。预测变量的缩放、RFE特征选择和随机森林模型训练是在嵌套交叉验证的内部折叠中完成的，以确保特征缩放和选择不会将信息从训练集泄露到测试集中，从而最小化偏差。嵌套交叉验证被认为是评估模型性能的合适替代方法，因为它使用的测试样本与特征选择和模型训练是独立的，因为模型性能的估计与外部测试集的实际性能非常接近（Vabalas等人，引用2019年；Varma & Simon，引用2006年）。选择了最小化均方根误差（RMSE）的特征，并在“最佳模型”中保留下来，用于预测每个干扰测量的方差。RMSE是目标变量（干扰测量）上实际分数和预测分数之间差异的均方误差（MSE）的平方根。使用RMSE、平均绝对误差（MAE）和R2在五个外部折叠中评估了该模型的估计性能，提供了平均RMSE、MAE和R2分数。MAE指的是目标变量（干扰测量）的实际值和预测值之间的平均绝对差异，而R2是模型使用预测变量（数字表型变量和即时自我报告测量）捕获的目标变量（干扰测量）变化的程度。基于随机森林中所有决策树产生的Gini不纯度平均降低程度，计算了每个预测变量的特征重要性分数，因为这种方法已被证明比其他方法（如Shapley附加解释（SHAP）重要性分数）更能准确表示特征重要性（Wang等人，引用2024年）。这些Gini重要性分数用于为每个干扰测量创建随机森林回归模型的特征重要性图。整个实验过程如图1所示。图1. 实验过程。 UNSW=新南威尔士大学。请阅读该图的详细描述。该图显示了一个包含新南威尔士大学学生和机器学习分析的六部分示意图。第一个矩形表示有81名新南威尔士大学学生参与。第二个矩形表示参与者观看了一个被描述为车祸视频的模拟压力源，一个向右的箭头指向招募。第三个矩形显示了一个带有圆形指示器的小方块，并注明响应被记录了一分钟。第四个矩形表示提取了数字生物标记，并列出了三个类别：面部、声音和语言。从这个框出来的一条对角线指向一个大的矩形，说明了嵌套交叉验证中的随机森林回归，其中包含两个堆叠的块图，分别用黑色和白色段标记训练折叠和测试折叠。一个向右的箭头从嵌套交叉验证框指向最后一个矩形，显示了一个垂直条形图，标题为特征重要性图，垂直轴上有多个标记的预测变量，水平轴上的Gini重要性值范围从0.00到大约0.20。所有数据都是近似的。显示全尺寸3. 结果3.1. 随机森林回归模型用于预测参与者在观看视频三天后是否会记得视频（记忆）的随机森林回归模型的平均R2为-0.09，使用了199个特征。用于预测其他事物是否会在观看视频三天后提醒参与者想起视频（触发因素）的随机森林回归模型的平均R2为0.23，使用了201个特征。用于预测参与者在不想的时候是否会想到视频（想法）的随机森林回归模型的平均R2为-0.18，使用了198个特征。用于预测参与者在观看视频三天后是否会看到视频图像（图像）的随机森林回归模型的平均R2为-0.13，使用了201个特征。用于预测参与者在观看视频三天后是否会对视频有强烈情绪（情绪）的随机森林回归模型的平均R2为-0.21，使用了198个特征。用于预测参与者对视频的记忆是否非常生动的随机森林回归模型的平均R2为0.55，使用了198个特征。表1展示了每个干扰测量的随机森林回归性能指标。表1. 随机森林回归模型的性能指标。下载CSV显示表格3.2. 数字表型特征重要性图2显示了对于预测干扰变量（触发因素和生动性）的平均分数变化重要的数字表型变量的特征重要性图。音频数据（主要是‘mfcc12_var’，但也包括‘dur_med’和‘mfcc6_var’）和语言变量（如‘tentat’和‘prep’）对随机森林回归模型预测车祸视频后三天内对触发因素反应平均可能性的变化能力有贡献。参与者在观看视频三分钟后对所看到图像的生动程度的自我报告是随机森林回归模型预测他们对车祸视频记忆生动程度变化能力的最重要变量。音频数据（‘loudness_mean’）和语言变量（‘Social’）在这个模型中也是相关特征，但重要性低于自我报告变量。图2显示了随机森林回归模型中(a)触发因素和(b)生动程度的特征重要性图表。该图展示了两个水平条形图，总结了来自随机森林回归模型的入侵变量特征重要性得分。顶部的条形图标题为“触发因素特征重要性图”，左上角标注为(a)。纵轴从上到下依次列出预测因子：mfcc12_var、tentat、dur_med、mfcc6_var、mfcc8_var、prep、article、Immediate_trigger、loudness_mean、Affect、syllables_per_min、mfcc6_mean、f0_mean、words_per_min和surprise_std。横轴标有Gini重要性得分，数值范围从0.00到0.25，每单位增加0.05。mfcc12_var的条形最长，约为0.27，而其他所有条形都较短，集中在0.08左右。底部的条形图标题为“生动程度特征重要性图”，标签为(b)。纵轴从上到下依次列出预测因子：Immediate_vividness、loudness_range、Social、f1_mean、mfcc2_mean、time、surprise_std、surprise_mean、mfcc8_mean、i、auxverb、cpp_var、hnr_range、female和they。横轴同样标有Gini重要性得分，数值范围从0.0到0.5，每单位增加0.1。Immediate_vividness的条形最长，略高于0.5，其次是loudness_range，约为0.1，其余预测因子的条形都较短，均在0.05以下。所有数据均为近似值。

4. 讨论
本研究考察了使用暴露于模拟创伤（车祸视频）时收集的数字表型和自我报告变量构建的随机森林回归模型预测暴露后三天内侵入行为变化程度的能力。通过嵌套交叉验证流程调整后的模型被估计能够以“可接受”的程度预测参与者在观看视频后三天内是否对模拟创伤的触发因素产生反应的变化（Chicco等人，引用2021）。能够通过编码过程中收集的情绪体验/压力指标来预测对提醒的反应性与过去关于模拟创伤的研究结果一致（Clark等人，引用2015；Rattel等人，引用2019）。对于预测参与者是否对视频提醒产生反应的变化而言，重要的变量是特定的声学和语言变量，而不是他们在观看视频三分钟后进行的自我报告测量，这表明使用数字表型来预测这种侵入性体验的价值。研究发现对预测这些指标变化重要的MFCC变量之前已与心理压力相关联（Taguchi等人，引用2018），支持了创伤后情绪压力与持续侵入性体验和情绪反应性相关的双重表征理论（Brewin & Burgess，引用2014）。这也支持基本情绪理论（Keltner等人，引用2019），发现非言语情绪表达的测量与主观情绪反应性的自我报告评分之间存在一致性和连贯性。这些特定的声学和语言变量的相关性也支持了我们的假设，即与预测创伤后状况指标最相关的数字表型与预测PTSD评分相关的变量相似（Blechert等人，引用2013；Kirsch & Brunnhuber，引用2007；Scherer等人，引用2013；Schererbraucks等人，引用2022）。对过去创伤事件触发因素的反应通常伴随着生理唤醒的增加和行为变化（O’Donnell等人，引用2010；Ozer等人，引用2003），这可以解释为什么使用旨在测量创伤后情绪唤醒的数字表型构建的随机森林模型能够预测这种侵入性变化。随机森林回归模型被估计能够在一定程度上预测参与者在观看视频三天后对模拟创伤记忆的生动程度的变化（Chicco等人，引用2021）。面部、声音和语言变量对模型性能的贡献远小于参与者在观看视频三分钟后自我报告的记忆生动程度，这可能是因为报告的生动心理意象与生理上可检测的情绪反应没有直接关系。这与研究发现一致，即暴露于模拟创伤后经历的生动侵入性与参与者通常经历的心理意象的生动力特征自我报告有关，而不是他们的创伤后情绪反应（Morina等人，引用2013）。这些发现支持这样的观点：个体对生动心理意象的自我报告测量可能是预测侵入体验这一方面的最有效方法。随机森林模型无法预测参与者在观看视频后三天内是否有关于车祸视频的记忆、图像、想法和感受，这与过去的研究结果相反，那些研究认为创伤后情绪体验与侵入性体验有关（Doron-LaMarca等人，引用2015；Holmes等人，引用2004；Marshall等人，引用2006）。这些模型无法预测目标侵入性指标变化的可能原因有几种。鉴于本研究是在非临床样本中进行的，并且只使用了一个简短的压力视频，可能参与者的感受不足以长时间引发侵入性体验（Rattel等人，引用2019），或者可能存在太多外部表型变量干扰，导致RFE无法消除。或者，这种数字表型方法可能不足以纵向预测侵入性体验。需要进一步的研究，在临床PTSD人群中使用这种数字表型分析方法，以确定PTSD侵入行为的编码是否可以通过创伤后情绪表达的变化来预测。

当前研究存在几个限制。首先是需要在参与者观看视频后三天内收集的侵入性测量数据中填补缺失数据。这意味着研究结果部分基于数学生成的数据，尽管这些填补是基于收集的数据并使用了经过充分验证的填补方法（Stekhoven & Bühlmann，引用2012）。另一个限制是本研究在非临床人群中考察了侵入行为的临床概念。这限制了这些发现可以推广到PTSD患者侵入体验的程度，可以通过在临床PTSD人群中测试这种方法来解决这一问题。这也影响了这些非临床参与者可能经历的侵入行为的强度，进而影响了模型预测侵入体验的能力。另一个限制是数据仅分析了参与者在暴露于模拟创伤后三天内在侵入性测量上的平均分数。轨迹分析是一种替代方法，可以更好地捕捉这类纵向数据的复杂性，将是未来研究的宝贵途径。由于研究的非临床样本特点，其结果在推广到临床侵入体验方面的普遍性也受到限制。

5. 结论与意义
本研究考察了使用数字表型变量构建的机器学习（随机森林回归）模型是否能够预测个体在经历模拟创伤（车祸视频）后三天内是否会有侵入性体验的变化。这样的模型被认为能够预测一些对视频触发因素的反应变化以及他们是否对视频有生动记忆的变化。虽然立即自我报告的记忆生动程度是预测三天内记忆生动程度的最重要变量，但声学和语言变量对于预测对触发因素的反应变化最为重要，这表明检查多种情绪反应渠道以识别最有助于预测特定侵入性体验的因素的价值。这些发现表明，数字表型化创伤后情绪体验可能有助于预测对模拟创伤提醒的反应性。通过对临床人群进一步评估这种方法，可以开发出一种数字表型谱型，用于识别那些对最近经历的创伤事件触发因素和提醒更可能产生反应的人（例如，在急诊室接受评估的个体）。最终，由于这种方法可以快速高效地部署和使用，它可以帮助这些个体及时获得关于他们经历的详细信息并提供治疗资源，从而提高对那些对创伤提醒更敏感的人的治疗分配效率。在临床环境和人群中进一步评估这种方法对于确定其在预测PTSD患者侵入性体验方面的效用是必要的下一步。

开放学术
本文已获得开放科学中心的开放数据和开放材料徽章，通过开放实践披露获得认证。数据和材料可公开访问：https://openwillis.brooklyn.health/15883a8fe04780739400c1d8ad94bb39?v=15883a8fe047806aa291000cb85dceae 和 https://osf.io/szdwn/overview?view_only=1e02516672e745b38d61cc05156af380。

补充材料
补充材料 anonymous.docx（26.3 KB）

数据可用性声明
本研究中分析的去标识化变量数据集可在OSF仓库中获取：https://osf.io/szdwn/overview?view_only=1e02516672e745b38d61cc05156af380。由于隐私问题和伦理要求，本研究分析的原始视频录制数据不公开。

本文的补充数据可在线获取：https://doi.org/10.1080/20008066.2026.2646126

热点排行