《Frontiers in Bioengineering and Biotechnology》:Machine learning-based estimation of structure-specific load around the ankle and knee joint during running using IMU data
1 引言
跑步是一项广受欢迎的体育活动,具有降低过早死亡风险、预防慢性疾病和改善心理健康等多种益处。然而,跑步会对肌肉骨骼系统施加巨大的重复性负荷,导致微观结构损伤。当累积损伤超过临界阈值时,就可能发生跑步相关过劳性损伤(RROIs)。累积损伤与负荷循环次数和负荷幅度的结构特异性幂次方(例如,跟腱为9次方)成正比,这使得RROI风险对负荷幅度的增加高度敏感。跑步相关过劳性损伤十分常见,主要影响膝关节和小腿,典型病症包括跟腱病、胫骨内侧应力综合征、髌股疼痛综合征、髂胫束综合征和足底筋膜炎。由于负荷是RROI发生发展的驱动因素,有效的负荷管理是其预防和康复的关键。
有效的负荷管理依赖于准确评估跑步过程中肌肉骨骼系统所承受的负荷。传统的负荷监测方法通常依赖于训练量指标(如距离或时长),只能提供粗略的负荷估计,且无法解释个体间和不同训练课程间结构特异性负荷的变异性。本研究中的结构特异性负荷(SSL)特指作用于特定肌肉骨骼结构的力,即跟腱力、髌腱力、膝关节接触力和踝关节接触力。该术语具有解剖学范围,表明每个负荷估计值对应特定的肌腱或关节。诸如跑步速度、地形、疲劳和步频等因素都会影响SSL,这凸显了进行连续SSL测量以增进对损伤机制理解和优化负荷管理策略的必要性。
估计SSL通常依赖于实验室运动捕捉系统、测力跑台和肌肉骨骼建模。尽管这些方法能提供高精度测量,但它们昂贵、耗时、计算密集且受限于实验室环境。这为在自然跑步环境中进行连续SSL评估设置了障碍。因此,机器学习(ML)已成为在真实世界环境中估计SSL的一种有前景的工具。
机器学习越来越多地能够从更简单的输入中估计复杂的生物力学信号。先前的研究表明,机器学习模型可以从惯性测量单元(IMU)数据中估计运动学和地面反作用力。此外,已有研究显示,机器学习可以通过从运动学数据、地面反作用力、肌电图或动力学数据中准确估计SSL,从而替代计算昂贵的肌肉骨骼建模。尽管取得了这些进展,但这些方法仍然依赖于实验室收集的数据,限制了其在真实世界的适用性。
可穿戴传感器,如惯性测量单元(IMUs),通过实现在自然跑步环境中收集数据,为基于实验室的测量设备提供了一种实用的替代方案。虽然机器学习方法在利用IMU数据估计跑步期间的SSL方面显示出巨大潜力,但当前的研究存在局限性。例如,最近的两项研究基于模拟的IMU数据估计跑步期间的SSL,但尚不清楚这些发现对真实IMU数据的适用性如何。一项研究使用最多两个模拟IMU训练弹性网络或XGBoost模型,实现了对髌腱力的高精度估计(相关性0.96),但对跟腱力的估计精度较低(相关性0.72)。后续一项研究将模拟IMU数量增加到四个,改善了对跟腱力的估计(R2为0.93),并保持了对髌腱力的相似性能(R2为0.92)。此外,使用Kohonen自组织映射图对膝关节和踝关节接触力也进行了良好估计(平均R2为0.90)。尽管这些结果令人鼓舞,但它们依赖于模拟IMU数据,可能无法捕捉真实世界信号的变异性、噪声和复杂性。这一差距限制了这些发现在真实跑步场景中的适用性。
另一项研究证明了使用物理IMU估计SSL的可行性。他们使用三个物理IMU的数据训练了一个全连接神经网络来估计膝关节接触力,达到了0.79的相关性。然而,该研究仅包括十名男性参与者,因此尚不清楚其模型在更广泛和多样化人群中的泛化能力。此外,该研究估计的是步态中的SSL。事实上,现有文献中估计SSL的研究主要集中在跑步以外的活动上。尽管这些非跑步活动中的SSL估计在各自背景下具有重要意义,但估计跑步期间的SSL对于预防RROI最为相关,这也是本研究的根本动机。
虽然基于机器学习的IMU数据SSL估计已被研究,但尚未有研究证明能够使用物理IMU估计跑步期间多个易发RROI的下肢结构的SSL,并能同时捕捉连续的支撑相负荷曲线和离散的SSL特征。因此,本研究旨在利用跑步期间收集的物理IMU数据估计跟腱力、髌腱力以及膝关节和踝关节接触力。本研究追求三个目标:首先,探究机器学习模型是否能够估计跑步期间的SSL,具体关注于跑步步态支撑相的SSL以及三个SSL特征(峰值负荷、冲量和平均加载率)的估计能力;其次,评估不同类型特征对模型性能的影响;第三,评估单IMU模型是否能达到双IMU模型的性能,旨在确定最实用的真实世界IMU配置方案。
2 方法
2.1 参与者
43名志愿者(36名男性,7名女性)参与了本研究,他们的运动参与程度各异。参与者年龄在18至60岁之间。排除标准包括:体重指数超过30、当前存在影响跑步的下肢损伤,或影响正常行走模式的神经系统疾病。本研究获得了鲁汶大学社会与社会伦理委员会的批准,所有参与者均签署了书面知情同意书。
2.2 数据收集
每位参与者在跑台上完成11分钟的热身,包括行走和跑步。随后,参与者穿着自己的跑鞋(以反映真实世界条件)以随机顺序在以下速度下跑步:2.22 m/s, 2.50 m/s, 2.78 m/s, 3.33 m/s, 他们自我报告的5000米跑偏好速度,以及偏好速度加减0.14 m/s。在每个速度下,一旦跑台达到目标速度,参与者持续跑150秒。为同步目的,剔除了每次试验开始时的初始片段。选取该片段后的120秒窗口进行分析。试验的最后部分被省略以避免可能的减速影响。最终数据集包含43名参与者的242次试验。
同时使用三个测量系统收集数据。首先,Xsens Link系统使用IMU以240 Hz频率记录3D加速度和4D四元数数据。这些IMU由研究人员用绑带、胶带、合身T恤和腰带固定在L3-L5脊柱段(骨盆处IMU)等位置。尽管系统包含17个IMU,但本研究仅使用了右脚和骨盆处的IMU。选择这两个IMU是因为足部安装的传感器捕捉远端节段的局部运动学,而骨盆安装的传感器提供全身运动信息,作为质心运动的代理。其次,一台测力跑台以1200 Hz频率测量地面反作用力。第三,一个3D运动捕捉系统以120 Hz频率追踪40个标记点和四个由三个标记点组成的簇的位置。标记点根据扩展的全身插件步态模型放置。
测力台和3D运动捕捉系统通过Vicon Nexus同步收集数据。为了将这些数据集与IMU收集的数据同步,通过最大化骨盆处IMU和该IMU上标记点的加速度信号之间的相关性来实现同步。
2.3 肌肉骨骼建模
使用肌肉骨骼建模计算SSL。Gait2392模型作为通用肌肉骨骼模型。对所有肌肉的最大等长肌力施加了10倍的因子,以防止比目鱼肌、内侧腓肠肌和外侧腓肠肌的激活曲线达到上限1(即最大激活)。使用OpenSim的缩放工具,基于每个受试者的静态试验对通用模型进行缩放。
接着,通过逆运动学计算关节角度,将受试者模型拟合到标记点数据。随后进行逆动力学分析,结合经过截止频率为15 Hz的低通巴特沃斯滤波器滤波后的运动学数据和地面反作用力。然后,分别通过静态优化和关节反作用分析估计个体肌肉力和关节接触力。有20次试验因肌肉平衡失败导致静态优化失败,因此这些试验被排除在后续研究之外。
2.4 数据处理
2.4.1 IMU收集的数据
对IMU收集的原始加速度和四元数信号进行进一步处理,未对IMU方向进行任何事后校正。根据四元数q计算了IMU在时间t的角速度ω(t) = (2/Δt) * q(t)^{-1} * q(t+Δt),其中q(t)^{-1}是四元数q(t)的共轭。加速度信号使用截止频率为40 Hz的五阶巴特沃斯滤波器进行滤波。类似于Bogaert等人的研究,基于垂直加速度信号穿越0.18 g(其中g = 9.81 m/s2)和-0.25 g的阈值来识别初始触地(IC)和脚尖离地(TO)事件。附加约束确保了IC和TO之前加速度下降,以及IC之后加速度上升。如果未检测到TO事件,则逐步提高-0.25 g的阈值。
2.4.2 结构特异性负荷与数据选择
使用肌肉骨骼建模计算跟腱、髌腱以及膝关节和踝关节的SSL。
- •
跟腱力计算为比目鱼肌、内侧腓肠肌和外侧腓肠肌力的总和。
- •
髌腱力计算为股直肌、股内侧肌、股中间肌和股外侧肌力的总和。
- •
膝关节接触力根据关节反作用分析输出,计算为作用于胫骨的膝关节反作用力分量的三维合力。
- •
踝关节接触力根据关节反作用分析输出,计算为作用于距骨的踝关节反作用力分量的三维合力。
由于SSL输出源自使用静态优化的肌肉骨骼建模(该建模独立计算每个时间点的力),因此应用了低通滤波器。计算出的SSL使用截止频率为20 Hz的五阶巴特沃斯滤波器进行滤波,并归一化到参与者的体重(BW)。根据vGRF与50 N阈值相交,将一次跑步试验的SSL划分为单个步态周期。这与IMU数据的步态事件识别形成对比,后者从加速度信号估计得出,以反映只有IMU可用的实际部署条件。无法匹配到相应加速度检测步态的GRF检测步态被排除。此外,剔除了支撑相时长超过0.5秒或短于0.15秒、总步态周期时长超过0.6秒或低于0.21秒,或显示数据损坏迹象(例如信号丢失)的步态。对于每个步态,计算了四个肌肉骨骼结构SSL的峰值、冲量和平均加载率:
- •
峰值:计算为支撑相期间SSL的最大值,以BW为单位。
- •
冲量:计算为从初始触地到脚尖离地的SSL积分。积分得到的冲量以BW·帧为单位。通过除以支撑相的有效采样率(计算为时间归一化SSL-时间曲线中的帧数(即100帧)除以支撑相时长),将其转换为BW·s单位。
- •
平均加载率:计算为SSL-时间曲线在定义区间内的平均斜率。具体而言,平均加载率 = (SSL_p_upper - SSL_p_lower) / (t_p_upper - t_p_lower),其中SSL_p是感兴趣区间p%处的力,t_p是对应的时间点。对于跟腱力、髌腱力和踝关节接触力,p_lower = 20%,p_upper = 80%(初始触地到峰值力的区间)。对于膝关节接触力,p_lower = 10%,p_upper = 40%(初始触地到脚尖离地的区间)。时间差(t_p_upper - t_p_lower)从帧数差值得出,并除以时间归一化曲线的有效采样率,得到以秒为单位的时长。因此,加载率以BW/s表示。
根据左右脚第一跖骨上标记点的相对位置确定每个步态的支撑侧。为避免在单一模型中学习两种不同运动模式的复杂性,后续分析仅包含右侧步态。这最终得到43名受试者总共30,010个步态。所有处理步骤均在Python 3.10中完成。
2.5 机器学习模型
训练了一个机器学习模型来估计跑步步态支撑相期间时间归一化(100个时间点)的SSL。模型可以访问两种类型的数据:
- 1.
原始时间序列测量值:接收每个时间步每个加速度和角速度的单独测量值。因此,这产生一个形状为12×100的多变量时间序列:每个传感器提供3个加速度信号和3个角速度信号。所有信号时间归一化为100个值。
- 2.
表格特征:包括:
- •
受试者特异性特征:考虑了个人的四个特征(体重、性别、年龄和身高)和两个鞋子特征(鞋长和鞋底厚度)。
- •
生物力学特征:计算了支撑相时长和步态周期时长;计算了六个加速度信号中每个信号的支撑相加速度冲量;计算了每个加速度信号的最大值、均值、均方根、样本熵和偏度;计算了每个角速度信号的最大值和均值。后两类特征使用TSFresh提取。这总共产生50个生物力学特征。
时间序列测量值首先通过两个双向长短期记忆(LSTM)层,每层20个单元,捕捉前向和后向时间依赖性。这些层的输出与受试者特异性和生物力学特征连接,随后进行批量归一化以提高训练稳定性。在将数据传递到具有20个神经元和线性整流函数(ReLU)激活函数的全连接密集层之前,应用了丢弃率为0.2的Dropout层。第二个丢弃率为0.2的Dropout层位于最终的具有线性激活函数的密集层之前,该层估计每个时间步的SSL。该模型将表示为混合LSTM模型,因为它同时接受时间序列和表格特征作为输入。从估计的支撑相SSL中计算峰值、冲量和平均加载率。
为了评估不同类型特征的相对价值,训练了两个额外的模型。首先,TS-LSTM模型仅考虑原始时间序列测量值。即,神经网络负责从时间序列中学习SSL的正确表示。该模型使用与混合LSTM模型相同的架构,只是它在双向LSTM层之后不执行连接步骤,因为它不使用受试者特异性或生物力学特征。其次,F-NN模型仅使用受试者特异性和生物力学特征。该模型始于一个包含20个神经元和ReLU激活函数的全连接层。随后是一个丢弃率为0.2的Dropout层,以防止过拟合。然后应用第二个具有20个神经元和ReLU激活函数的密集层,之后是另一个丢弃率为0.2的Dropout层。最终层是一个具有100个神经元和线性激活函数的全连接密集层。
为了研究每个IMU单独提供的信息量,训练了混合LSTM模型的两个变体:(1)仅使用右脚IMU的数据;(2)仅使用骨盆IMU的数据。对于这两个变体,时间序列和生物力学特征仅限于从各自IMU信号中提取的特征,产生维度为6×100的时间序列(三个加速度计和三个陀螺仪通道)和26个生物力学特征(即支撑相和步态周期时长,每个加速度通道六个特征,每个角速度通道两个特征)。
模型训练和评估采用受试者级别的五折交叉验证方法。这确保了单个受试者的所有数据出现在同一折中,以避免信息泄露。在每一折内,训练数据进一步使用受试者级别划分进行细分,其中六分之五用于训练,六分之一作为验证集。标准化按折进行,缩放器在训练数据上拟合。模型使用Adam优化器进行训练,初始学习率为0.0001,每10,000步以0.90的因子指数衰减。训练采用均方误差损失函数和基于验证损失的早停准则,耐心值为30个周期。最大周期数设置为500,批量大小为64。为每个肌肉骨骼结构(跟腱、髌腱、膝、踝)分别训练模型。
为了提供模型性能的参考,实现了两个基线模型:(1)带有L1正则化的线性回归器(正则化强度根据验证损失在0.0001到100之间调整),使用表格特征;(2)均值回归器,计算训练集的平均时间归一化SSL(即进行恒定预测)。两个模型均采用上述受试者级别五折交叉验证方法进行训练。线性回归器模型使用Adam优化器训练,早停根据验证损失确定。均值回归器在没有单独验证集的情况下训练。
使用均方误差(MSE)、平均绝对百分比误差(MAPE)和决定系数(R2)评估模型在支撑相SSL估计方面的性能。从估计的支撑相SSL中计算峰值、冲量和加载率,并使用MSE和MAPE进行评估。模型训练和评估在Python 3.9中使用TensorFlow和scikit-learn进行。
2.6 模型分析
使用混合效应模型评估不同模型在支撑相SSL估计性能上的差异。对于每个组织,分别拟合一个混合效应模型,以步态的MSE作为因变量,ML模型类型作为分类固定效应(水平:双IMU混合LSTM、双IMU TS-LSTM、双IMU F-NN、骨盆IMU混合LSTM、足部IMU混合LSTM),受试者和步态识别号作为随机效应。每个混合效应模型的样本量为150,050。应用Bonferroni校正来校正四个组织间的多重比较。
使用蒙特卡洛Dropout量化TS-LSTM模型产生的估计SSL值的不确定性。在测试数据上,保留Dropout层并对每个跑步步态执行100次前向传播,得到每个时间点的值分布。支撑相期间SSL的时间分辨不确定性量化为每个时间戳100次估计的标准差。为了量化峰值SSL、冲量和平均加载率的不确定性,从每个跑步步态的100次前向传播中计算这些衍生特征,并报告它们各自值的标准差。
统计分析在R 4.2.2中使用lmerTest进行,蒙特卡洛Dropout在Python 3.9中使用TensorFlow和scikit-learn进行。
3 结果
3.1 参与者
参与者的描述性特征总结见表格。年龄范围从18岁到49岁,跑步经验从无到每周超过100公里不等。
3.2 SSL估计性能
图1显示了使用双IMU的混合LSTM模型估计的平均SSL(带有相应的标准差)与所有四个肌肉骨骼结构在支撑相期间的平均真实值进行比较。混合LSTM模型在所有结构上表现良好,跟腱力估计达到最高R2(0.93),膝关节接触力估计达到最低MAPE(12.37%)。混合LSTM模型在跟腱、髌腱和踝关节SSL估计上的准确性与线性回归模型相似(R2增加0.02或更少),但在膝关节SSL估计上表现出更优的性能(R2增加0.06)。在所有结构上,混合LSTM模型 consistently 优于均值回归器。
SSL特征(峰值、冲量、平均加载率)的真实平均值在补充材料中报告。表3总结了使用双IMU的混合LSTM模型、线性回归模型和均值回归器在估计SSL特征方面的性能。总体而言,使用双IMU的混合LSTM模型在所有肌肉骨骼结构和SSL特征上产生的MAPE和MSE值均低于均值回归器,这与其优越的支撑相估计性能一致。图2显示了混合LSTM模型和均值回归器对跟腱、髌腱、踝关节和膝关节接触力SSL特征的估计值与真实值的散点图,证明了混合LSTM模型的优越准确性。
线性回归模型在估计大多数肌肉骨骼结构和SSL特征的MSE和MAPE方面通常比使用双IMU的混合LSTM模型差。一个例外是,线性回归在估计跟腱和踝关节SSL冲量方面优于双IMU混合LSTM模型。
3.3 不同特征集对SSL估计的影响
表4总结了使用双IMU的混合LSTM、TS-LSTM和F-NN模型在估计支撑相SSL方面的性能。混合LSTM模型和TS-LSTM模型产生了可比(R2下降0.01或更少)且强大的SSL估计性能,R2值范围从髌腱力的0.83到跟腱力估计的0.93(混合LSTM)和0.92(TS-LSTM)。仅依赖表格特征的F-NN模型实现了0.81到0.92的R2值,表明其性能与混合和TS-LSTM模型大体相当(R2下降0.02或更少)。
表5展示了使用双IMU的混合LSTM、TS-LSTM和F-NN模型在估计SSL峰值、冲量和平均加载率方面的性能。TS-LSTM模型在SSL特征估计方面产生了与混合LSTM模型总体可比的性能(MAPE增加0.52或更少,除了跟腱SSL加载率MAPE增加2.01)。F-NN模型显示出比混合LSTM模型略低的准确性(MAPE增加最多3.41),但在所有肌肉骨骼结构和SSL特征上仍然优于线性和均值回归器,除了跟腱和踝关节SSL的冲量。
3.4 使用单IMU进行SSL估计的效果
表6总结了双IMU混合LSTM、骨盆IMU混合LSTM和足部IMU混合LSTM模型在估计支撑相SSL方面的性能。骨盆IMU混合LSTM模型达到了与双IMU配置可比的R2分数(R2下降0.02或更