结合数据增强技术的半监督主题引导对比学习方法，用于利用智能手机传感器预测日常压力

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Pattern Recognition》：Semi-Supervised Topic-Guided Contrastive Learning with Data Augmentation for Daily Stress Prediction Using Smartphone Sensors

【字体：大中小】 时间：2026年03月15日 来源：Pattern Recognition 7.6

编辑推荐：

　　压力预测的半监督对比学习框架利用手机传感器数据，通过主题模型生成伪标签并采用随机双视图数据增强提升鲁棒性，在CrossCheck和GLOBEM数据集上F1分数达65.3%和61.4%，优于基线模型。

刘毅|徐泽珠|李志军|梁振|张志国|王长虹

深圳大学生物医学工程学院，中国广东省深圳市光明区公长路66号

摘要

压力是现代社会中的一个重要问题，个人在日常生活中面临着越来越大的压力。在压力预测领域，从各种来源（如智能手机传感器，例如加速度计、GPS、通话/短信记录）收集的行为数据为了解个人的压力水平提供了宝贵的见解。然而，获取带有标签的数据需要专家的注释或个人长时间的自我报告，这既昂贵又耗时。相比之下，虽然无标签数据缺乏人工标记，但它包含了丰富多样的行为信息，反映了个人在不同情境下的活动模式、移动轨迹和社交互动。因此，如何利用这些丰富但无标签的数据进行压力预测已成为一个关键的研究挑战。为了解决这个问题，我们提出了一个针对日常压力预测的半监督对比学习框架，该框架利用移动传感数据。该框架包含了一个神经主题建模组件，通过识别潜在的行为结构来生成语义伪标签，从而指导正负样本对的形成。它还包括一个随机双视图数据增强模块，模拟真实的传感器噪声和数据丢失，以提高模型的鲁棒性。在公开可用的压力数据集CrossCheck和GLOBEM上，我们提出的方法分别取得了65.3%和61.4%的F1分数，优于其他最先进的模型。这些结果突显了该框架在利用无标签行为数据进行实际压力预测方面的有效性。

引言

长期的高压力已成为一个关键的公共卫生问题，因为它对身心健康都有广泛而有害的影响[1]。最近的报告估计，全球有数亿人受到严重压力的影响，而且这一数字每年都在上升[2]。持续暴露在高压环境下可能导致免疫功能障碍、心血管疾病、代谢紊乱，以及更容易患上焦虑和抑郁等心理疾病[3]。此外，处于严重压力下的个体自杀的风险比没有这些压力源的个体更高[4]。这些统计数据强调了分析和预测日常压力的有效方法的迫切需求，以便及时进行自我调节和干预，防止心理健康问题的恶化，并提高个人幸福感[5]。

随着数字时代的到来，配备了内置传感器（如加速度计、GPS和通信记录）的智能手机不断捕获丰富的行为数据，如体力活动强度、移动轨迹、睡眠-觉醒周期和社交互动模式——这些因素与用户的压力水平密切相关[6]。因此，基于智能手机的压力预测已成为个性化压力监测的一个有前景的方向[7]。然而，人们在日常生活中很难长时间重复地标记收集到的数据，导致注释稀缺且分布不均。这主要是由于自我报告涉及的认知负担和时间需求较大，同时可能干扰和侵入个人的日常活动[8]。这种标签短缺成为训练强大压力预测模型的主要障碍，因此有必要设计策略，利用有限的标记数据和丰富的无标签记录。

近年来，半监督学习方法（如伪标记、一致性正则化、基于图的方法和生成模型）越来越多地被用于解决压力预测任务中标签稀缺的问题[9]。然而，这些方法在面对长期、高噪声和多模态行为数据时往往表现出局限性。此类数据通常来自异构传感器（如GPS、加速度计和通信记录），这些传感器在采样频率、数据结构和噪声特性方面存在显著差异。这种异构性使得传统方法难以准确定义跨模态的语义相似性，从而导致语义不一致性，并削弱了模型的表示能力[10]。此外，在现实世界场景中，传感器数据往往不完整或有噪声，进一步降低了预测的准确性和稳定性[11]。在这种情况下，对比学习作为一种有前景的行为数据建模方法应运而生[12]。对比学习通过构建正负样本对来最大化语义差异。这不仅有效地捕捉了不同模态之间的潜在语义关联，提高了跨模态数据的表示能力，而且还增强了模型对传感器数据不完整性和噪声等常见问题的鲁棒性。因此，它有潜力提高现实世界环境中压力预测的准确性和鲁棒性。

在本文中，我们提出了一个基于主题的伪标签生成和随机双视图数据增强框架，用于半监督对比学习（TPRACL）。我们的主要贡献总结如下：

•

我们提出了一个针对压力预测的半监督对比学习框架，旨在有效利用大规模无标签的多模态行为数据。通过结合对比学习和主题指导及增强策略，我们的框架在解决标签稀缺问题的同时，通过发现潜在的行为模式来增强表示学习。

•

为了提高模型学习区分性表示的能力，我们提出了一种针对日常行为数据的伪标签生成策略。通过利用神经主题模型，我们提取反映个人随时间变化的行为分布模式的主题概率向量。这些向量被聚类以生成伪标签，使模型能够根据潜在的行为相似性组织无标签数据。这种策略将无标签数据转化为结构化的监督信号，有助于形成具有语义意义的样本对，从而进行对比学习。

•

为了提高模型在现实世界噪声和变化性下的鲁棒性和适应性，我们引入了一种双视图随机增强策略，其中三种增强技术中的两种随机应用于同一样本的不同特征。这种技术生成了丰富的视图用于比较学习，模拟了传感器数据丢失和噪声等真实挑战。通过引入受控的变化性，该策略增强了模型在现实世界环境中学习强大、可泛化表示的能力。

部分摘录

用于压力预测的行为建模

在心理健康评估领域，越来越多的研究探索了基于行为数据的压力预测。早期的研究主要依赖于监督学习方法，包括传统的机器学习和深度学习，这些方法需要完全标记的数据集进行训练。机器学习方法通常从智能手机传感器（如加速度计、GPS和通信记录）中提取手工创建的特征，并应用传统的分类器，如随机森林

方法

所提出的TPRACL框架整合了两个关键组件：主题引导的伪标签生成和随机双视图数据增强，如图1所示。对于输入数据中的无标签部分，TPRACL使用神经主题建模技术通过推断潜在的主题分布来生成伪标签，这些主题分布反映了语义层面的行为模式。然后使用这些主题引导的伪标签来构建具有语义意义的正负样本对

实验数据集

我们在公开可用的压力数据集CrossCheck [39]和GLOBEM [40]上进行了实验，以评估我们模型的性能。

CrossCheck：该数据集来源于一项利用智能手机传感技术监测精神分裂症患者日常压力水平变化的研究。该研究招募了21名参与者，并进行了一年的纵向实验。主要数据来源是智能手机传感器。传感数据包括活动水平、噪声

比较实验结果

表1展示了所提出的TPRACL框架与几个基线模型在CrossCheck和GLOBEM数据集上的性能比较。半监督学习框架如SelfTraining、CoTraining和BYOL以及无监督学习框架AutoEncoder和VAE在两个数据集上的性能都优于标准Transformer模型（不使用任何半监督策略）。

在CrossCheck数据集上，与半监督学习框架相比

模型性能比较

为了评估我们提出的TPRACL模型的有效性，我们将其性能与各种基线和最先进的方法进行了比较。虽然传统的半监督框架如SelfTraining和CoTraining以及无监督方法如AutoEncoder在利用无标签数据方面显示出明显的改进，但它们在捕捉行为信号的细微语义结构方面仍然存在局限性[31]，[32]。更现代的方法正在探索

结论与未来工作

在本文中，我们提出了一个半监督对比学习框架，以解决压力预测中标记数据有限的挑战。该框架结合了主题引导的伪标签生成来从无标签数据中提取潜在的行为结构，以及随机双视图增强策略来模拟现实世界的变异性。这些组件共同作用，提高了模型学习强大和区分性表示的能力。

CRediT作者贡献声明

刘毅：撰写——原始草稿、可视化、验证、软件、方法论、调查、形式分析、数据整理、概念化。徐泽珠：验证、软件、方法论、形式分析、概念化。李志军：调查。梁振：撰写——审阅与编辑。张志国：撰写——审阅与编辑。王长虹：撰写——审阅与编辑、监督、资源、概念化。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系，这些关系可能会影响本文报告的工作。

资助

本工作部分得到了深圳市医学研究基金（资助编号D250403003）、国家自然科学基金（资助编号62303496、62573441）和广东省基础与应用基础研究基金（资助编号2025A1515011729）的支持。内容仅代表作者的观点，不一定代表资助方的官方立场。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号