一种无监督的开集识别方法，用于实现与用户无关的人类活动识别

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Neurocomputing》：An unsupervised open-set recognition method for user-independent human activity recognition

【字体：大中小】 时间：2026年03月01日 来源：Neurocomputing 6.5

编辑推荐：

　　针对穿戴式传感器的人体活动识别中的跨主体适应和开放集识别双重挑战，本文提出无监督域适应方法UCOHAR。该方法通过预训练源域模型生成特征和概率标签，利用时间索引选择邻近样本进行协方差矩阵聚类，结合熵阈值区分已知和未知类别。实验表明，UCOHAR在四个公开数据集上显著优于现有方法，有效解决了实际应用中的用户适应和未知活动识别问题。

　　
在可穿戴传感器技术快速发展的背景下，人体活动识别（HAR）作为智能健康监测和智能家居系统的核心技术，近年来在医疗康复、老年人监护等领域展现出重要价值。然而，实际应用中面临两大核心挑战：跨主体适应性不足和开放集识别能力薄弱。这两大问题往往同时存在，当模型应用于新用户时，不仅需要适应个体运动模式差异，还需具备识别训练集中未包含的新活动类别的能力。本文针对这一复合型难题，提出了一种名为UCOHAR的联合自适应与开放集识别框架，通过融合时空关联建模与信息熵阈值机制，实现了跨主体场景下的开放集识别突破。

在技术实现层面，该方案构建了双阶段协同优化机制。第一阶段通过预训练源域模型对目标域进行特征映射，利用预训练模型对未标注样本生成概率标签。这一过程巧妙借鉴了图像识别中的跨域迁移思想，将人体运动特征与已知活动类别建立关联。第二阶段引入时间连续性约束，通过分析传感器数据的时间序列特性，构建动态邻域选择机制。具体而言，算法为每个样本标注时间索引，利用滑动窗口原理筛选时序邻近样本，结合协方差矩阵的迹值计算，实现特征空间中的自适应聚类。这种时空关联建模不仅有效捕捉人体运动的生理规律，还能显著降低计算复杂度。

在开放集识别策略上，该方法创新性地将信息熵理论引入分类边界构建。通过计算每个样本的概率标签分布熵值，结合预设的熵阈值建立动态分类机制。当样本的熵值低于阈值时，判定其属于已知类别；反之则识别为未知类别。这种基于信息不确定性的分类方法，相比传统阈值分割具有更强的鲁棒性，能够有效应对不同用户个体差异导致的特征分布偏移。

该方法的技术突破体现在三个关键维度：首先，构建了跨主体迁移的时空特征表示体系，通过时间邻域选择机制，将目标域数据与源域知识进行动态关联，解决了传统方法在跨主体场景中特征漂移的问题；其次，创新性地将信息熵阈值机制与聚类算法结合，在未标注数据条件下，通过分析概率分布的不确定性实现已知类与未知类的有效区分；最后，采用双域协同训练策略，在目标域未标注数据训练的同时，持续优化源域模型，既避免灾难性遗忘，又增强了对未知类别的泛化能力。

实验验证部分采用四组公开数据集进行对比测试，覆盖日常生活、医疗康复等多个场景。评估指标包含已知类别识别准确率、未知类别检测率、模型泛化能力等维度。实验结果显示，UCOHAR在跨主体适应精度上平均提升18.7%，在开放集识别率方面达到89.3%，较现有最优方法提升约12个百分点。特别是在老年跌倒检测场景中，模型对未知运动类别的识别率提升至91.5%，显示出显著的应用价值。

该研究的重要启示在于，开放集识别与跨主体适应并非互斥挑战。通过建立统一的特征空间映射机制，既能缓解个体差异带来的模型退化，又能构建具备扩展性的分类边界。其提出的熵阈值动态调整策略，有效解决了传统方法依赖固定阈值导致的适应性不足问题。未来研究方向可着重于如何优化时间邻域的粒度选择机制，以及如何将该方法扩展至多模态传感器融合场景。

在应用层面，该框架为智能健康监护系统提供了可靠的技术支撑。以居家养老监护为例，系统可自适应学习新用户的运动模式，同时通过开放集识别及时预警异常行为（如跌倒、癫痫发作等未知活动）。在医疗康复领域，系统不仅能准确识别预设训练动作，还能主动发现康复过程中出现的非预期运动模式，为个性化治疗提供数据支持。其双域协同训练机制特别适合在数据标注成本高昂的老年健康监护场景中部署。

从技术演进角度分析，该研究标志着HAR领域从单一分类任务向动态适应系统的转变。传统方法往往将跨主体适应和开放集识别作为独立问题处理，而UCOHAR框架通过时空关联建模和概率熵分析，实现了两大挑战的协同解决。这种系统化思维为后续研究提供了重要范式，特别是在多用户、多场景的智能设备应用中，具有显著的扩展价值。

实验设计部分采用四重交叉验证策略，确保结果的可靠性。数据集覆盖了 elderly activity recognition、daily activity classification等典型场景，包含超过50万条传感器数据记录。评估过程特别模拟了真实部署中的动态环境，通过随机交叉验证（ROCV）和留一交叉验证（LOOCV）相结合的方式，既保证模型对新用户的适应能力，又验证了其在未知活动发现方面的性能。消融实验进一步证实，时空邻域选择机制和熵阈值算法分别贡献了约32%和28%的性能提升。

在工程实现方面，系统设计了轻量化推理模块。通过预训练模型生成基础特征向量，再利用时间索引快速匹配邻近样本，形成紧凑的特征表示。这种设计在保持高识别精度的同时，将计算资源消耗降低约40%，特别适合移动端设备部署。模型更新机制采用增量学习策略，仅对新样本进行局部参数调整，既防止灾难性遗忘，又确保模型持续适应新用户的行为模式。

该研究的局限性在于对传感器数据类型的普适性仍需验证。当前实验主要基于IMU和肌电信号，对于新增的柔性电子传感器或生物电信号，可能需要调整时空邻域的构建算法。另一个改进方向是熵阈值自适应调节机制，目前阈值设定依赖经验公式，未来可探索在线学习调整阈值的方法。

总体而言，UCOHAR框架通过时空关联建模与概率熵分析，有效解决了跨主体适应与开放集识别的双重挑战。其技术路径不仅为HAR领域提供了创新解决方案，更为智能可穿戴设备在真实场景中的应用奠定了方法论基础。随着人口老龄化加剧和智慧健康城市的发展，这种能够自适应新用户并持续发现未知活动模式的系统，将显著提升健康监护的准确性和实时性，具有广阔的产业化前景。后续研究可进一步探索多模态传感器融合、跨文化运动模式适应等方向，推动HAR技术向更广泛的应用场景延伸。

联系信箱：

粤ICP备09063491号

热点排行