基于步行表面肌电信号机器学习分析的肌肉质量分层与可解释性特征识别研究

《Scientific Reports》:Discovery of key surface electromyography features during walking for discerning high and low muscle mass using machine learning analysis

【字体: 时间:2026年03月25日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对传统肌肉质量评估依赖专用设备及机器学习模型“黑箱”难解释的问题,采用表面肌电图(sEMG)信号结合机器学习,对20–59岁社区成人肌肉质量分层。结果显示极端梯度提升(XGBoost)正常步行准确率95%,随机森林(RF)快走94%,并识别股二头肌零点交叉率等关键特征,为基层肌肉质量筛查提供可行可解释方案。

  
在健康体检中心或社区服务站,想测一测自己的肌肉量是否达标,往往需要躺到一台庞大的生物电阻抗分析仪上,周围还得留出足够的空间摆放设备——这种场景对不少年轻人和中年人来说既陌生又麻烦。更让人头疼的是,即便用上了机器学习算法来分析生理信号,很多模型就像个“黑箱子”,医生看不懂它为什么做出这样的判断,自然也难以放心用于临床。而低肌肉量(low muscle mass)并非老年人的“专利”,它在年轻和中年群体中同样与多种不良健康结局相关,这让寻找一种便捷、可解释、适合社区推广的肌肉质量评估方法变得迫在眉睫。
为此,一项发表在《Scientific Reports》的研究尝试用“走路时的肌肉电信号”解决这个难题。研究团队招募了133名20–59岁的社区居住成年人(71名男性,占53.4%;62名女性,占46.6%),通过生物电阻抗分析(bioelectrical impedance analysis, BIA;设备为InBody 970)测量四肢骨骼肌质量,并用无监督k均值聚类(unsupervised k-means clustering)将参与者分为低肌肉量组和高肌肉量组。随后,他们在正常步行和快速步行两种状态下采集表面肌电图(surface electromyography, sEMG)信号,训练了五种分类器——逻辑回归(logistic regression)、支持向量机(support vector machine, SVM)、k近邻(k-nearest neighbors, KNN)、随机森林(random forest, RF)和极端梯度提升(extreme gradient boosting, XGBoost)——并通过Shapley加性解释(Shapley additive explanations, SHAP)解析模型决策的关键特征。结果显示,XGBoost在正常步行时分类准确率最高(95%),RF在快速步行时表现最佳(94%);快速步行时,股二头肌(biceps femoris)较高的零交叉率(zero crossing rate)对高肌肉量的分类贡献最大,而正常步行时,胫骨前肌(tibialis anterior)较低的最大功率(maximum power)最具影响力。这些发现证明了利用步态sEMG实现肌肉质量分层的可行性,并为模型提供了可解释的生物学依据,为未来在社区和基层医疗场景中应用奠定了基础。
研究的主要关键技术方法包括:基于InBody 970设备的BIA测量四肢骨骼肌质量;通过无监督k-means聚类划分低、高肌肉量组;在正常与快速步行条件下采集下肢肌肉sEMG信号;训练五种机器学习分类器并比较性能;应用SHAP方法进行模型可解释性分析。样本来自133名20–59岁社区居住成年人。

Abstract

研究纳入133名20–59岁社区成人(低肌肉量组平均年龄36.12岁,高肌肉量组39.84岁,p=0.086)。XGBoost在正常步行时分类准确率达95%,RF在快速步行时达94%。SHAP分析显示,快速步行时股二头肌较高的零交叉率是区分高肌肉量的关键特征;正常步行时胫骨前肌较低的最大功率影响最大。结果表明,基于步态sEMG的机器学习方法可有效分层肌肉质量,且具有可解释性。

研究结果

  1. 1.
    参与者特征:低肌肉量组与高肌肉量组年龄差异无统计学意义(p=0.086),性别分布为男性53.4%、女性46.6%。
  2. 2.
    分类器性能:五种分类器中,XGBoost在正常步行时准确率最高(95%),RF在快速步行时最优(94%)。
  3. 3.
    关键特征识别:快速步行状态下,股二头肌的零交叉率是区分高肌肉量的最重要特征(值越高越倾向高肌肉量);正常步行状态下,胫骨前肌的最大功率是最具影响力的特征(值越低越倾向高肌肉量)。

结论与讨论

该研究首次将步行时的sEMG信号与可解释机器学习结合,实现了年轻及中年人群肌肉质量的准确分层,解决了传统评估依赖大型设备和模型不可解释的两大瓶颈。关键特征的发现(如股二头肌零交叉率、胫骨前肌最大功率)不仅揭示了步态肌电活动与肌肉质量的关联,也为后续开发便携式社区筛查工具提供了生物学靶点。尽管样本量和多样性仍需扩大以提升普适性,但这项研究为在基层医疗和社区环境中推广无创、便捷的肌肉质量评估开辟了新路径,尤其对早期识别低肌肉量及相关健康风险具有重要意义。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号