人体活动识别(HAR)[1] [2] [3] [4] 是一个不断发展的领域,旨在通过各种传感器收集的数据来解释人类的身体行为。HAR系统在现实世界应用中发挥着重要作用,能够使系统适应并快速响应用户活动。这些系统可以识别和分类从简单的手势到复杂的动作(如行走和跑步),甚至包括进行体育运动或驾驶等复杂行为。这些活动是通过加速度计、陀螺仪以及WiFi或摄像头系统等环境传感器检测到的。HAR系统利用先进的模式识别和机器学习技术处理和分类大量传感器数据,将其归类为有意义的人体活动类别。这种能力在医疗保健[5] [6] [7] [8] [9]等领域尤为重要,因为实时监测患者可以显著提高诊断精度和预防护理策略。例如,HAR系统可以检测到异常行为或健康恶化的早期迹象,从而及时采取干预措施。
在各种HAR系统中,来自WiFi设备的信道状态信息(CSI)数据[10] 成为一种有前景的工具[11] [12] [13] [14]。与传统基于传感器的系统不同,CSI利用人类运动引起的WiFi信号干扰来检测活动。因此,CSI不受光照条件的影响,并且保护了隐私,解决了基于视觉的系统所面临的主要问题。此外,它保持了非侵入式的感知特性,适合在不干扰日常作息的情况下进行连续监测。
利用WiFi CSI数据的HAR方法的效率至关重要,尤其是在计算资源有限的实时处理应用中。高效的基于WiFi CSI的HAR方法能够确保数据采集和活动识别之间的延迟最小化。传统的机器学习分类器(如支持向量机(SVM)[15] 通过将时间序列数据视为静态向量来提供有效的解决方案。然而,它们未能考虑CSI数据中的时间相关性和依赖性,导致分类准确性不佳。相比之下,循环神经网络(RNN)[16] 和长短期记忆(LSTM)[17] 模型能够有效捕捉这些时间特征。然而,它们通常需要大量的训练数据和多次反向传播迭代才能接近最优解,这在计算资源有限的场景中可能不可行。
相反,水库计算(RC)[18] [19] 是RNN的一种高效变体。RC模型继承了RNN序列的结构,具有类似的隐藏状态方程,使其能够捕捉CSI数据中的时间信息。与传统RNN不同,RC模型在输入和水库状态之间具有随机连接,这些连接在训练期间保持不变,从而确保模型稳定性并降低计算开销。这些模型采用封闭形式解决方案来拟合时间序列数据,提高了处理效率。通过利用丰富的动态水库状态,RC模型从时间序列数据中提取出具有表现力的特征,从而有效促进下游任务。尽管RC模型的训练效率很高,但由于提取的特征维度较大或时间序列中的变量数量众多,不可避免地会导致过拟合[20] [21]。
基于WiFi CSI的HAR中传统核方法的一个核心局限性在于它们使用了对称核,这种核本质上假设双向相似性并存储冗余的成对值。这种设计导致效率低下,并限制了模型捕捉现实世界活动模式中常见的细微、非对称关系的能力。
为了解决这个问题,我们提出了“水库增强非对称(RAA)核”,通过放宽对称性约束来显式去除这些冗余。由此产生的核更具表现力,能够建模时间序列之间的细粒度方向依赖性。在利用WiFi CSI的HAR任务中,这种表现力尤其有价值,因为数据通常稀缺且维度较高,使得系统容易过拟合。通过在不增加计算复杂性的情况下实现更丰富的表示,非对称核提高了泛化性能,并支持在动态环境中的更稳健的活动识别。
具体来说,我们利用RC模型为每个时间序列生成表征特征。由于CSI信号的噪声特性,加入高斯噪声使模型能够处理更多的数据变化和多样性,从而减轻过拟合并增强鲁棒性。此外,观察到在潜在特征表示中注入高斯噪声可以提高模型对小扰动的鲁棒性[22] [23]。因此,我们在核函数中单方面加入高斯噪声来增强RC特征,从而得到一个非对称核。这种非对称性使得相同大小的核能够包含比对称核更多的信息。与优化对称核不同,在对称核中只有未增强的空间映射到目标,而在非对称核中,增强和未增强的空间都映射到相同的目标,从而缓解了过拟合问题。核的大小保持不变,以防止计算复杂性的增加。
我们进一步推导出了
非对称
K核
岭回归(Asym-KRR)学习方法,该方法消除了传统核岭回归(KRR)[24] 中常见的对称和正半定(PSD)核要求,后者确保核函数以数学上保证学习算法稳定性和可解性的方式衡量相似性。生成的非对称核被用于Asym-KRR中以训练分类器。因此,所提出的分类框架不仅捕捉了CSI数据中的动态特征,还提高了对过拟合的鲁棒性,表现出比基线方法显著的改进。我们工作的新颖性和主要贡献在于引入了一种针对WiFi CSI信号的新型非对称核,这在基于WiFi CSI的HAR领域尚未被探索过,具有以下特性:
•我们利用RC模型提取CSI数据的高质量表征特征。从岭回归的角度来看,我们增强了特征提取过程的可解释性。
•为了减轻过拟合,我们在核函数中单方面向特征中添加高斯噪声以构建非对称核。通过对这种非对称核进行优化,原始特征和带噪声的特征都被映射到目标标签上,实现了特征增强,同时保持了原始的核大小,确保了效率。
•为了克服传统KRR对对称和PSD核的要求,我们为Asym-KRR提供了封闭形式解决方案及其数学证明。
•我们在几个代表性的基于WiFi CSI的HAR数据集上实证验证了所提出的RAA核和Asym-KRR分类器的有效性。
本文的结构如下:第2节回顾了应用于基于WiFi CSI的HAR的各种机器学习和深度学习技术。第3节详细介绍了我们提出的框架,首先阐述了RAA核的原理,然后推导了Asym-KRR学习方法。第4节介绍了几个基准数据集,进行了消融研究以评估我们方法中每个组件的影响,并对其分类性能和效率进行了比较分析。我们在第5节总结了我们的研究。
符号说明:在本文中,向量用粗体小写字母表示(例如:),矩阵用粗体大写字母表示(例如:),所有向量都表示为列向量。数据集定义为,相应的活动标签集定义为。每个CSI数据实例表示为一个多变量时间序列(MTS),形式为一个矩阵,其中表示时间步数,表示通道数。这里,每个元素对应于时间步长的所有通道上的观测值。表示活动的独热标签矩阵。