一种基于变分自编码器和线性注意力机制的方法,用于高效地从高密度表面肌电图(HD-sEMG)信号中连续估计手部运动学数据
《Biomedical Signal Processing and Control》:A method based on variation autoencoder and linear attention for efficient continuous estimation of hand kinematics from HD-sEMG signals
【字体:
大
中
小
】
时间:2026年05月11日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
赵春晓|林创中国大连海事大学信息科学与技术学院,大连116026摘要手部运动学可以通过表面肌电图(sEMG)信号来估计。然而,这种方法通常需要大量的计算资源。为了解决这个问题,我们提出了一种基于线性注意力(Linear Attention)和变分自编码器(VAE)的新方法AE-L
赵春晓|林创
中国大连海事大学信息科学与技术学院,大连116026
摘要
手部运动学可以通过表面肌电图(sEMG)信号来估计。然而,这种方法通常需要大量的计算资源。为了解决这个问题,我们提出了一种基于线性注意力(Linear Attention)和变分自编码器(VAE)的新方法AE-LiT(Auto Encoder-Linear Transformer)。该方法利用sEMG信号的均方根(RMS)特征来预测手部运动学。与传统方法(包括循环神经网络(RNNs)、卷积神经网络(CNNs)和Transformer系列模型)进行了对比分析。评估指标包括相关系数(CC)、归一化均方根误差(NRMSE)、曲率(k)和时间成本。分析使用了SEEDS和FMHD数据集中所有受试者的HD-sEMG(高密度sEMG)记录。所提出的AE-LiT模型平均相关系数为0.93,NRMSE为0.08,在准确性上比基线模型高出8.0%。此外,模型大小减少了62%,推理时间平均降低了58%。在CPU、GPU和ARM架构的Raspberry Pi 4B上进行推理时间测试表明,我们的方法具有较好的推理效率。总之,所提出的方法在效率和准确性之间取得了良好的平衡,这对于实际应用非常有前景。
引言
肌电图(EMG)信号是肌肉内活跃运动单元释放的动作电位的总和。EMG信号在康复、辅助技术、人体工程学、临床诊断和运动科学中有很多应用[1]。随着虚拟现实和机器人技术的发展,利用EMG实现人与智能设备之间的交互成为了一个显著的未来趋势。同时,EMG信号越来越多地被用来控制智能设备和灵巧的机器手[2]、[3]、[4]、[5]。
人机协作是一个跨多个领域的研究领域,涉及制造操作、远程传输应用、智能车辆和飞机、娱乐和教育、辅助和康复技术以及机器人辅助手术等方面。这些协作系统已经显示出提高生产力和任务质量以及减轻人类工作负担的能力。深度学习方法在从sEMG信号中连续运动估计[6]、[7]、[8](尤其是手部运动学)方面取得了显著进展[9]、[10]、[11]。例如,Wang等人使用了长短期记忆(LSTM)网络[12]、[13];Guo等人引入了长曝光卷积记忆网络(LE-ConvMN)[14]、[15]和多注意力特征融合网络(MAFN)[16];Chen等人提出了基于Transformer的双向编码器表示(BERT)-在线硬样本挖掘(OHEM)[17]和跨受试者终身学习[18]用于跨受试者连续估计。然而,LSTM和LE-ConvMN是RNN结构,无法执行并行计算。MAFN、BERT-OHEM和跨受试者终身学习[18]的发展主要集中在提高模型准确性上,而忽视了提高效率的挑战。在这里,我们提出了新的方法,主要关注效率。为此,我们将受[19]启发的线性注意力集成到Transformer解码器架构和VAE的编码器[20]、[21]中,以提高模型效率。我们的方法在SEEDS数据集的25名受试者和FMHD数据集的20名受试者上进行了测试,并与传统模型进行了比较。SEEDS数据集包含来自25名健康受试者执行三种类型动作(普通、快速和慢速)的HD-sEMG记录和关节角度。FMHD数据集提供了来自20名受试者的HD-sEMG信号和相应的关节角度,包括快速和慢速动作试验。这两个数据集都包括同步的sEMG和基于CyberGlove的关节角度测量,从而能够准确建模肌肉-运动学关系。我们的方法在模型效率和准确性方面树立了基准。本文的主要贡献包括:
- ●
将线性注意力集成到Transformer解码器中以压缩模型。
- ●
使用VAE压缩输入数据以加快训练和推理时间。
章节摘录
相关工作
在本节中,将介绍一些在先前研究中表现出良好性能的方法,这些方法激发了我们开发更强大连续估计方法的灵感。
A. Transformer与注意力
Transformer[22]是一个大型语言模型,它采用了注意力机制。该模型依赖于编码器和解码器结构以及多头注意力机制,在自然语言处理中表现出色。注意力层在生成
方法
A. 模型结构
模型由两部分组成:VAE层和线性Transformer解码器。VAE层用于压缩输入数据的维度并提取特征。Transformer解码器使用线性注意力来加速模型。模型结构如图1所示,并将在下面详细说明。
1) 线性注意力:Transformer算法的时间复杂度为O(n^2)[25],这对应于低效率。因此,我们提出
实验
我们使用了HD-sEMG数据集SEEDS[28]和FMHD[27]来评估我们的方法。
A. 数据集
SEEDS[28]数据集是一个包含HD-sEMG的手部运动学数据集。SEEDS使用126通道的HD-sEMG电极阵列和一组直径为4毫米的单极圆形sEMG电极,放置在前臂的后部。SEEDS提供了由CyberGlove III数据手套记录的关节角度。SEEDS包括来自25名健康受试者的数据,这些受试者没有已知的
讨论
所提出的AE-LiT模型在计算效率方面在SEED和FMHD HD-sEMG数据集上都表现出了优越的性能。与ViT、TCN、LSTM、BERT和Transformer等基线模型相比,AE-LiT实现了更高的PCC值和更低的NRMSE,同时保持了显著更快的训练和推理速度。这些结果表明,AE-LiT通过其轻量级架构有效地捕捉了HD-sEMG信号中的时间和空间依赖性。
与
结论
在本文中,我们提出了AE-LiT,这是一种基于Transformer的轻量级架构,用于从HD-sEMG解码手部运动学信号。AE-LiT用线性注意力机制替换了多头自注意力(MSA)层,以降低计算复杂性,同时保持表示能力。此外,还整合了变分自编码器(VAE)的编码器,以进一步压缩输入特征并增强泛化能力。
在SEED和FMHD HD-sEMG数据集上的实验结果
CRediT作者贡献声明
赵春晓:写作——审稿和编辑,写作——原始草稿,可视化,验证,软件,方法论。林创:写作——审稿和编辑,验证,监督,软件,资源,项目管理,方法论,调查,形式分析,概念化。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号