You are on page 1of 67

硕 士 学 位 论 


题目 :

|于 月 几 电 ft 号的 D N N j口

步 态 识 别 方 法研 究


CNN LS TM

研 宄 生 
m± 

专业 
控 制 工程 

指 导 教师 
高 发荣 副教授 

完成 日 期 2 0 2 2 年 5 


杭州电子科技大学硕士学位论文

基于肌电信号的 DNN 和 CNN-LSTM


步态识别方法研究

研 究 生: 姚 婷
指导教师: 高发荣 副教授

2022 年 5 月
Dissertation Submitted to Hangzhou Dianzi University
for the Degree of Master

Research on EMG-based gait


recognition methods of DNN and
CNN-LSTM

Candidate: Yao Ting


Supervisor: Associate Professor. Gao Farong

May, 2022
杭 州 电子 科技 大 学

学 位 论 文 原 创 性 声 明 和 使用 授权 说 明

原创 性 声 明

本 人郑重 声 明 :
所 呈 交 的 学 位论 文 ,
是本 人 在 导师 的 指 导 下 ,
独 立 进 行研 究

工 作 所取 得 的 成 果 。
除 文 中 己经 注 明 引 用 的 内 容外 ,
本论 文不 含 任 何其 他 个 人或

集 体 己 经 发表 或撰写 过 的 作 品 或 成 果 。
对 本 文 的 研 究 做 出 重 要 贡献 的个 人 和 集

体 , 均 己 在 文 中 以 明 确 方式 标 明 

申 请 学 位 论 文 与 资 料 若 有 不 实 之处 本人承担 切相关责任




论 文 作 者 签 名 曰 期
: :
丸}年 3: 月 一日

学位 论 文 使 用 授权 说 明

本 人 完 全 了 解 杭 州 电 子 科技 大 学 关 于 保 留 和 使 用 学 位 论 文 的 规 定 ,
5卩 :
研宄

生 在 校 攻读 学 位 期 间 论 文 工 作 的 知 识 产 权 单 位 属 杭 州 电 子 科 技 大 学 。 本 人 保证 毕

业离校后 ,
发 表 论 文 或 使 用 论 文 工 作 成 果 时 署 名 单 位 仍 然 为 杭 州 电 子 科 技 大学 

学 校 有权 保 留 送 交 论 文 的 复 印 件 ,
允 许 查 阅 和 借 阅 论文 ; 学 校可 以 公 布论 文 的 全

部或 部 分 内 容 , 可 以 允许 采 用 影 印 、 缩 印 或其 它 复 制 手 段 保 存 论 文 。 (
保 密 论文

在 解 密 后 遵守 此 规定 

卿> 月 7


论 文作者签 名 :
日 期 :

指 导 教 师签 名 :

43 、
日 期 :
年 r月 

_
杭州电子科技大学硕士学位论文

摘要

步态是人行走时的一种姿态,也是下肢最基本的运动特征。由于表面肌电信
号(sEMG)中蕴涵着丰富的运动信息,可用来区分人下肢运动时动作的各个阶段,
因此利用 sEMG 信号对不同的动作进行分类识别得到了广泛的研究。本文主要从
五个方面进行研究,即在表面肌电数据采集、信号消噪处理和特征提取的基础上,
分别采用 DNN 算法和 CNN-LSTM 算法,进行步态优化算法识别。以下是本文
的主要研究工作和创新点:
(1) sEMG 信号数据的采集、去噪和特征提取。本文通过对下肢步态的分析
确定了信号类型,并选择下肢的八股肌肉通道作为信号来源。对比小波包、小波
包阈值以及小波模极大值三种消噪方式,根据它们的均方根和信噪比等指标选择
消噪效果最好的小波模极大值进行消噪处理。接着对消噪后的信号分别提取时
域、频域等特征,并对其进行特征分析。
(2) 提出了采用多特征的深度神经网络(DNN)步态识别方法。针对算法在不
同特征下的识别结果问题,本文在传统的超限学习机(ELM)、支持向量机(SVM)
算法基础上引入了深度神经网络(DNN)算法,通过对比不同算法在单一特征下的
识别结果,对比发现 DNN 算法的识别结果并不是最好的,因此为了提高算法的
识别率,本文采用特征组合方法扩大了特征维数,其最终识别结果表明特征组合
下的 DNN 算法的平均识别率最高。
(3) 实现了基于 CNN-LSTM 的步态识别算法优化。为了提高算法的高效性
和稳定性,本文引入长短期记忆网络(LSTM),并用卷积神经网络(CNN)对 LSTM
算法进行优化。然后分别对 DNN、LSTM、CNN-LSTM 进行不同特征下的识别
结果分析,结果表明特征组合后的 CNN-LSTM 无论是在识别率上,还是稳定性
上都优于前面两种算法。
本文研究了深度学习构架下的步态识别方法,其优化算法模型在识别率和稳
定性上都有明显的提升。上述工作对于人体运动科学以及医疗康复等领域具有重
要的积极意义。

关键词:步态识别,肌电信号,信号采集与去噪,特征提取,DNN,CNN-LSTM

I
杭州电子科技大学硕士学位论文

ABSTRACT

Gait is a posture of human walking, and it is also the basic feature of lower limb
movement. Because the surface electromyography (sEMG) contains abundant
movement information, it can be used to distinguish the different stages of human
lower limb movement, so it has been widely studied to classify different movements
by sEMG signal. Based on the sEMG data acquisition, signal de-noising and feature
extraction, two algorithms, DNN algorithm and CNN-LSTM algorithm, are applied to
gait recognition. The following are the main research work and innovation:
(1) sEMG signal data acquisition, de-noising and feature extraction. In this
dissertation, the signal type is determined by the analysis of the lower limb gait, and
the eight-leg muscle channel is selected as the signal source. Compared with wavelet
packet, wavelet packet threshold and wavelet modulus maxima, the best wavelet
modulus maxima is selected according to their root mean square and signal-to-noise
ratio. Then, the time-domain and frequency-domain features of the de-noised signal
are extracted and analyzed.
(2) A multi-feature based deep neural network (DNN) gait recognition method is
proposed. Aiming at the problem of the recognition result under different features, this
dissertation introduces the deep neural network (DNN) algorithm based on the
traditional extreme learning machine (ELM) and support vector machine algorithm,
by comparing the recognition results of different algorithms under a single feature, it
is found that the recognition result of DNN algorithm is not the best. Therefore, in
order to improve the recognition rate of the algorithm, this dissertation adopts the
method of feature combination to enlarge the feature dimension, the result shows that
the average recognition rate of DNN algorithm based on feature combination is the
highest.
(3) The optimization of gait recognition algorithm based on CNN-LSTM is
realized. In order to improve the efficiency and stability of the algorithm, this
dissertation introduces the long-term and short-term memory network (LSTM) , and
optimizes the LSTM algorithm with the convolutional neural network. Then the
recognition results of DNN, LSTM and CNN-LSTM under different features are
analyzed. The results show that the combined CNN-LSTM is better than the previous

II
杭州电子科技大学硕士学位论文

two algorithms in recognition rate and stability.


In this dissertation, the gait recognition method based on deep learning
framework is studied, and its optimization algorithm model has obvious improvement
in recognition rate and stability. The above work is of great significance in the fields
of human motion science and medical rehabilitation.

Keywords: gait recognition, sEMG signal, signal acquisition and de-noising, feature
extraction, DNN, CNN-LSTM

III
杭州电子科技大学硕士学位论文

目录

摘要.................................................................................................................................I
ABSTRACT.................................................................................................................. II
目 录............................................................................................................................ IV
第 1 章 绪论.................................................................................................................. 1
1.1 引言................................................................................................................. 1
1.2 课题研究背景及意义..................................................................................... 1
1.3 国内外研究现状............................................................................................. 2
1.3.1 步态信息获取研究现状...................................................................... 2
1.3.2 肌电信号消噪和特征处理研究.......................................................... 2
1.3.3 传统算法的肌电信号步态识别.......................................................... 3
1.3.4 深度学习算法的肌电信号步态识别.................................................. 4
1.4 课题存在的问题分析..................................................................................... 5
1.5 本课题研究内容............................................................................................. 5
第 2 章 人体下肢步态运动的数据获取...................................................................... 7
2.1 人体步态运动结构......................................................................................... 7
2.1.1 下肢肌电信号产生机理...................................................................... 7
2.1.2 表面肌电信号的特点.......................................................................... 7
2.1.3 人体下肢结构...................................................................................... 8
2.2 步态模式与选取............................................................................................. 9
2.2.1 步态划分.............................................................................................. 9
2.2.2 步态参数............................................................................................ 10
2.2.3 步态信息选取.................................................................................... 11
2.3 步态信号的数据采集................................................................................... 11
2.3.1 实验仪器............................................................................................ 11
2.3.2 下肢步态信号采集............................................................................ 11
2.3.3 实验采集结果分析............................................................................ 13
2.4 本章小结....................................................................................................... 14
第 3 章 肌电信号消噪与特征提取............................................................................ 15
3.1 肌电信号的消噪方法................................................................................... 15
3.1.1 小波阈值消噪法................................................................................ 15

IV
杭州电子科技大学硕士学位论文

3.1.2 小波包阈值消噪法............................................................................ 17
3.1.3 小波模极大值消噪法........................................................................ 17
3.1.4 消噪性能指标.................................................................................... 18
3.2 肌电信号消噪结果分析............................................................................... 18
3.3 肌电信号特征提取....................................................................................... 19
3.3.1 时域特征............................................................................................ 20
3.3.2 频域特征............................................................................................ 20
3.4 特征提取结果分析....................................................................................... 21
3.4.1 时域特征提取结果分析.................................................................... 21
3.4.2 频域特征提取结果分析.................................................................... 22
3.5 本章小结....................................................................................................... 22
第 4 章 基于特征组合的 DNN 算法步态识别 ......................................................... 24
4.1 基于超限学习机的步态识别....................................................................... 24
4.2 基于支持向量机的步态识别....................................................................... 25
4.3 基于深度神经网络的步态识别................................................................... 27
4.3.1 深度神经网络结构参数的选择........................................................ 28
4.4 不同模型下识别结果与分析....................................................................... 29
4.4.1 单特征下的识别结果分析................................................................ 30
4.4.2 多特征下的识别结果分析................................................................ 31
4.5 本章小结....................................................................................................... 39
第 5 章 基于 CNN-LSTM 优化算法的步态识别 ..................................................... 40
5.1 优化算法描述............................................................................................... 40
5.2 优化算法模型............................................................................................... 40
5.2.1 长短期记忆网络模型........................................................................ 40
5.2.2 卷积神经网络.................................................................................... 41
5.2.3 CNN-LSTM 模型 ............................................................................... 42
5.2.4 网络结构参数的选择........................................................................ 42
5.3 识别结果与分析........................................................................................... 42
5.3.1 特征类型对识别结果的影响............................................................ 42
5.3.2 方差和标准差分析............................................................................ 46
5.4 本章小结....................................................................................................... 47
第 6 章 总结与展望.................................................................................................... 48
6.1 研究总结....................................................................................................... 48
6.2 研究展望....................................................................................................... 48

V
杭州电子科技大学硕士学位论文

致谢.............................................................................................................................. 50
参考文献...................................................................................................................... 51
附录.............................................................................................................................. 57

VI
杭州电子科技大学硕士学位论文

第 1 章 绪论

1.1 引言
作为新的生物特征识别技术,步态识别是根据人运动时的姿态行为进行身份
认证的一种新型技术。与人脸、指纹识别等技术相比,步态识别具有作用范围广、
接触性低、准确度高、隐蔽性强等特点,目前而言,这是最有潜力的一种识别技
术。作为人类活动的基本机制之一,步态是时间和空间及其周期性与复杂性的连
续体。步态是许多神经、肌肉和运动系统等复杂结构相互作用的结果。如今利用
sEMG 来标记步态信号已受到了广泛的关注。
步态也是一种行为生物特征,步态是健康的重要指标之一。疾病、受伤或其
他一些身体原因可能会导致人走路姿态的改变,但它仍然是一种强大的识别指
标,并且广泛应用于医学工作、医学实验室等领域。步态分析有时会有助于识别
人当前的精神状态,这反映了改善生物系统的生理治疗。作为一种生物识别技术,
步态识别是通过人走路的姿势来识别人物的身份特征,由于该技术可以做到远距
离识别,并且具有侵犯性低与隐藏性强等特点。因此可以广泛地应用于刑侦、智
能服务和数字监控等领域。

1.2 课题研究背景及意义
随着 21 世纪的到来,我国经济发展快速,人们的生活和身体条件都有了显
著的改善,人们不再满足于以前的温饱状态了,而是越来越追求物质和精神上的
满足。因此人们也越来越重视我国医疗安全等方面的提升。然而伴随着中国人口老
龄化和残疾人数量加剧等问题的产生,根据最新国家卫计委发布的新闻表示,截
止到 2020 年底,我国 60 岁以上老年人口将达到 2.45 亿左右,大概是我国总人
口数的 17.7%。人口老龄化的增加导致受老龄化影响的人数增加。届时老龄化的
问题将严重影响我国社会发展,导致人们的生活水平下降。同时根据我国残联发
布的最新数据来看,我国的残疾人大概有 0.86 亿。其主要是以肢体的残疾为主,
这不仅使得病人本身生活不便,也会给社会造成一定的负担。因此,国家非常重
视老龄化和残疾问题,并对此采取了各方面的措施。但由于我国庞大的人口数量
中老龄化和残疾人数所占比例太大,目前,如何解决这两项问题是至关重要的。
生物识别方法是针对身份识别的一项技术。对于生物特征来说主要分为两大
类:生理特征,例如虹膜、语音、人脸等行为特征,主要是指步态识别。生理特
征是先天性产生的,而步态识别特征是后天性的,是通过人的日常行为所产生的。
现如今生物识别技术已经逐渐成为了国内外学者的重点研究对象,有学者称,生

1
杭州电子科技大学硕士学位论文

物识别技术在未来的发展中将具有较高的影响力[1]。人体步态是指人行走时的状
态行为,相比于传统的生物特征如指纹、人脸等,它具有获取容易,无风险性等
优势。在行动不便的老年人和身体残疾的患者中,主要是需要增强运动功能并改
善其生活质量。因此获取人体下肢运动信息、步态识别等技术就显得尤为重要。
通常人们将行走时下肢的周期性动作称为步态,而这一动作主要依赖于神经中枢
系统通过控制关节-肢体-骨骼-肌肉运动来实现。
一般来说,肌肉收缩-舒张[2]会产生肌电信号,而肌电信号的不同也代表着
不一样的运动状态,因此借助肌电信号实现步态研究是有理论依据的。关于
sEMG 的步态研究方法主要包括:去噪、特征提取与分类识别。由于采集到的
sEMG 存在噪声,在识别分析之前需要进行一定的去噪处理。作为一种生物信号,
肌电信号本身较为微弱,基于 sEMG 步态识别算法的研究可以在较大程度上提
高分类器的识别率。
1.3 国内外研究现状
1.3.1 步态信息获取研究现状
步态,代表人行走时的基本运动方式[3]。人体行走时的一个完整步态可以划
分为支撑期和摆动期[4, 5],目前获取步态运动的方式有很多,主要包括:视频图
像、生物力学和运动学信号[6, 7]。视频是通过高清摄像头来获得人体运动时的行
为动作[8]。但是视频获取的图像也存在一些缺点,例如占据较大的内存空间以及
处理复杂等。生物力学采集则是通过脚底、带有压力的鞋垫以及测力板等三个互
相作用产生的压力信号[9]完成的,由于该方法成本较高,在实际操作中往往会受
到限制[10]。三维运动捕捉系统虽然具有可行性,但是存在着被实验室环境所限
制的问题[11]。目前大多数实验者采用传感器的方法来获取肌电信号,该方法主
要分为表面电极和把针电极插入肌肉这两种方法 [12]。由于表面电极采集是将电
极贴贴在要采集的肌肉部位,该方法方便且无危险性所以而被广泛使用[13]。而
针电极是插入到肌肉中进行采集,采集到的信号虽然受噪声影响较小,但会对肌
肉部位造成一定的影响[14]。
徐超立等人[15]对步态进行识别研究通过机器人协同的方法,该方法具有较
好的应用前景。薛召军等人[16] 通过对步态特征进行提取从而进行了身份识别的
研究。Wei 等人[17]采用基于 sEMG 的步态识别是对脑瘫患者进行了研究。郭忠
武等人[18]采用运动学和动力学的参数进行步态识别研究。Ryu 等人[19]采用步态
子阶段的方法来进行划分,最终实验结果表明了采用步态划分具有一定的高效
性。
1.3.2 肌电信号消噪和特征处理研究
通过 sEMG 信号进行步态识别的过程主要分为:数据消噪和特征提取。由

2
杭州电子科技大学硕士学位论文

于 sEMG 信号微弱,且容易受到皮肤、体毛等人体因素以及实验环境的影响。
所以在对 sEMG 进行步态分析前,需要先进行噪声处理。最常用的消噪方法是
时域、频域、时频等方法[20]。杨基海等人[21]采用小波变换法进行肌电信号的消
噪,而小波模极大值消噪[22]的方法具有计算复杂度低、易实现等特点。Donoho
等人[23]采用小波阈值法进行去噪处理,这一方法已被广泛应用。娄智等人[24]采
用自适应阈值来对获取的 sEMG 信号进行去噪处理,结果表明该方法具有较高
的信噪比。罗志增等人[25]通过对小波模极大值分解小波和重构小波系数来进行
消噪处理,最终结果表明其具有较好的消噪效果。
对于 sEMG 信号如何进行特征提取,一般有时域、频域、小波变换等方法[26]。
时域特征主要包含绝对值均值、均方根、过零点数等[27-29]。时域特征操作虽然简
单,但是由于 sEMG 信号会受到人体疲劳等外因的扰乱,易导致其特征突变严
重,稳定性相对较差[30],而频域特征则相对稳定[31],近年来通过提取频域特征
对 sEMG 进行分析应用较为广泛。宋方禹等人[32]融合傅里叶方法进行特征的提
取,最终的实验结果表明该方法具有较好的效果。魏鹏娜等人 [33]提取时域、频
域、熵值等特征对脑瘫患者进行分析,相对于其它特征结果,熵值产生了更好的
效果。Sbriccoli 等人[34]利用频域特征,用来研究手臂运动时 sEMG 信号产生的频
谱特性。Pancholi 等人[35]首先通过提取 sEMG 信号的时域和频域等特征,最终结
果发现对于不同的肌肉采用不同的分类器进行分类识别取得了良好的效果。

1.3.3 传统算法的肌电信号步态识别
对人体步态动作产生的 sEMG 信号识别算法的研究有助于提高步态识别的
精度。随着测量技术和识别算法的进步,主要用于识别的算法有 SVM、LDA 以
及 ELM 等[36, ,Dhindsa 等人[38]提出了通过肌电信号预测膝关节角度的各种分
37]

类器的性能评估。Xi 等人[39]提出了基于 sEMG 的活动监测和跌倒检测的特征提


取并且进行识别评估。席旭刚等人[40]把 sEMG 与加速度融合用来识别下肢步态,
提出了改进的 SVM,其结果表明改进后的 SVM 的识别率高于未改进的 SVM。
Athavale 等人[41]采用 CNN-SVM 模型进行人体动作识别,其结果表明采用 CNN
优化后的 SVM 具有较高的识别结果。Castllini 等人[42]在对肌电信号进行分类时,
分别采用高斯核支持向量机、神经网络等方法。实验表明,支持向量机的分类算
法识别结果最好。马玉良等人[43]提出的 GA-BP 优化算法提高了步态识别的准确
性,优化后的平均识别率达到了 98%以上。Gao 等人[44]提出的多特征组合和参
数优化算法的人体步态识别,采用 ABC-SVM 与 SVM 进行对比实验,结果表明
优化后的支持向量机的识别率高出了 3.18%,不仅提高了识别率还增加了步态的
稳定性。高发荣等人[45]提出的 PSO-SVM 用于下肢步态的识别,其结果表明优化
后的算法的识别率高于 SVM 未优化时所得的结果。Kuang 等人[46]采集 sEMG 信

3
杭州电子科技大学硕士学位论文

号并提取时域特征,利用 ELM 算法进行分类识别。Deng 等人[47]提出了一种基


于 PCA 降维下的 RELM 的连续运动估计算法,但是对于如何提高步态识别的精
度仍然是一个须继续探讨的问题。

1.3.4 深度学习算法的肌电信号步态识别
近年来随着深度学习的广泛应用和快速发展[48], 步态识别在识别率和稳定
性上都有了巨大的提升。Christian 等人[49]提出了一种基于 EMG 的深度学习方
法对平地行走期间的步态阶段进行分类。Chen 等人[50]通过使用深度置信网络提
出了基于表面肌电图的人体下肢关节角度的连续估计。Suris[51]采用不同的肌电
信号时域特征,通过 DNN 完成了分类识别。Anand 等人[52]利用 DNN 对上肢手
势信号进行分类,结果表明,DNN 在对手势信号进行分类的过程中,表现出了
良好的性能,分类精度为 98.88%。Kim 等人[53]提出了基于深度学习的手势识别
方法,分别采用深度卷积和递归神经网络,通过与人类活动识别方法相对比,其
实验结果提高了手势分类的准确性。Yao 等人[54]采用 DNN 进行多特征步态识
别,其结果发现组合特征下的深度学习算法的识别结果要普遍优于传统算法,平
均识别率达到了 96.79%,但是由于深度学习算法需要大量的迭代次数,因此,
DNN 识别结果的计算时间远大于传统的两个算法。Khushaba 等人[55]利用时域特
征来分析 DNN 用于 sEMG 分类的性能,深度时间增长神经网络(DTGNN)将增加
分类器的复杂性,而 DNN 不需要复杂的特征提取过程[56]。Li 等人[57]提出基于
PCA 和深度学习的肌电掌握假肢的控制,采用 PCA 降维后,利用 DNN 分类器
进行分类识别,提高了分类的准确性。Arash 等人[58]提出一种深度神经网络的深
度机器学习方法,主要通过对所获得的生物信号里面的时间序列进行分类,用于
学习随机时间序列的循环内容的新方法:DTGNN,DTGNN 在不同的学习水平
上结合了有监督和无监督的方法,以提高性能。统计验证的结果表明,DTGNN
显著提高了分类的性能。Duan 等[59]引入卷积神经网络,通过提取的频域特征先
进行分类,然后采用 CNN 算法对分类好的手势进行识别,CNN 表现出良好的平
移不变性,具有较好的识别结果。Ulysse 等人[60]使用转移学习对肌电手势手势信
号进行深度学习,展现出很好的性能。Ma 等人[61] 提出了使用长时记忆神经网
络和时间提前特征的表面肌电进行膝关节的角度估算,实验最终结果表明,使用
LSTM 网络的识别结果高于采用 BP 神经网络的识别结果,在估计膝关节运动方
面具有更好的性能。Wang 等人[62] 提出长期记忆网络基于 sEMG 的抓取运动的
连续估计,结果表明使用 LSTM 的平均均方根误差明显高于 RBF。Bao 等人[63]
提出了使用表面肌电图估算腕部运动学的 CNN-LSTM 混合框架。结果表明,
CNN-LSTM 的识别效果明显高于 CNN,其也有缺点,深度学习网络需要大量的
训练次数以达到模型的收敛,所以其最终训练的总的时间要远远超过传统的算法

4
杭州电子科技大学硕士学位论文

的时间。但是,随着样本数据量的增加,其模型的识别率也逐渐增加,这也是以
后研究的重点方向,尤其是在针对大数据的处理方面。

1.4 课题存在的问题分析
基于肌电信号的步态识别研究在预防老年人跌倒以及在医疗康复领域具有
重要的意义。21 世纪,随着大数据和人工智能的技术的高速发展,基于肌电信
号、识别率、稳定性分析的步态识别领域涌现出了许许多多的方法。尽管肌电信
号的相关研究发展迅速,但仍有一些问题需要解决。
在本文中,对信号进行消噪、特征提取及分类识别研究等方面都存在着一些
需要解决的问题,内容如下:
(1) 深度算法的研究。传统算法和深度学习的识别算法在样本维数增大时,
存在识别率效果不同的问题,并且深度学习算法在进行训练迭代时需要的时间远
远大于传统的算法。因此,本文引入了深度学习的方面进行探讨研究。
(2) 优化算法的研究。本文针对 LSTM 的算法存在不足的问题,提出了
CNN-LSTM 模型,并在识别率和稳定性等方面探究了不同特征样本下的分类效
果。

1.5 本课题研究内容
本文主要基于肌电信号的 DNN 和 CNN-LSTM 步态识别方法进行研究,主
要分为:数据采集与消噪、特征提取、步态识别。主要工作流程如图 1.1 所示:

小波模极大
值消噪方法
sEMG信号

特征提取 信号消噪预处理 数据采集与处理

SVM/ELM分类器
时域特征
MAV 1、支撑前期
VAR 步态识别 2、支撑中期
特征组合 ZC DNN/LSTM分类器 3、支撑后期
4、摆动前期
MPF
5、摆动后期
MF
频域特征
CNN-LSTM分类器

图 1.1 本文内容研究框图
本文对采集到的下肢 sEMG 信号,采用支持向量机、超限学习机、深度神
经网络、长短期记忆网络以及卷积神经网络等理论和方法,分别从消噪处理、特

5
杭州电子科技大学硕士学位论文

征提取和特征组合、步态识别等方面进行讨论分析研究,分为以下六章:
第一章 绪论。主要阐述了本课题的研究背景和研究意义,然后对基于 sEMG
信号的步态识别方向进行了国内外文献综述分析,并对此进行了归类和总结,提
出了本文的研究框架。
第二章 基于肌电信号的获取。本章根据下肢的肢体结构和下肢不同肌肉位
置的分布,通过肌电信号仪进行肌电数据的采集。
第三章 肌电信号消噪与特征处理。采用三种不同的消噪方法,并根据结果
分析选择效果最好的小波模极大值进行消噪处理。接着提取时域和频域等特征用
于后续的研究。
第四章 基于特征组合的 DNN 算法步态识别。首先探讨了同类特征对不同
分类器的识别率研究,接着探讨组合后的特征用于不同分类器下的步态识别。
第五章 基于 CNN-LSTM 优化算法的步态识别。在第四章的基础上引入了
卷 积 神 经 网 络 (CNN) 和 长 短 期 记 忆 网 络 (LSTM) , 并 对 此 进 行 算 法 优 化
(CNN-LSTM),然后进行识别率和稳定性等分析。
第六章 总结与展望。对本文的识别算法进行了总结,在此基础上提出了一
些问题并进行了工作展望。

6
杭州电子科技大学硕士学位论文

第 2 章 人体下肢步态运动的数据获取

步态是人体行走时的基本方式,人体行走时主要通过肌肉-骨骼-关节肌肉-
中枢神经系统共同参与完成步态模式识别。由于步态具有一个完整的周期性,因
此在人体行走时一个完整的步态周期可以划分为多个阶段[64]。通过获取步态的
数据进行划分和识别是进行步态分析的基础,这在以后的康复和假肢控制研究中
都有着重要的参考意义。
本章主要内容是介绍如何进行下肢表面肌电信号的数据采集以及整个实验
方案的设置,为下一章数据消噪和特征提取奠定了基础。

2.1 人体步态运动结构
2.1.1 下肢肌电信号产生机理
人行走时的步态是需要多个功能结构结合的一个过程,主要通过神经中枢系
统来进行控制[65]。人所能做出的动作是基于神经系统的指令。人体运动过程中,
主要是运动神经控制发出电信号,然后通过大脑皮层发出的指令把信息传递给骨
骼肌,用以指导相应的肌肉动作来进行下肢关节的运动。在人体下肢肌肉运动过
程中肌肉会出现伸缩现象和相应的脉冲现象,进而形成动作电位。sEMG 信号就
是在这一系列过程中产生的。肌电信号生成及下肢运动机理如图 2.1 所示:

运动神经单元 中枢神经系统

脊髓神经 周围神经
sEMG

轴突 腿部肌肉

电流脉冲
骨骼 关节
肌纤维

图 2.1 肌电信号生成及下肢运动机理

2.1.2 表面肌电信号的特点
在不同阶段,肌肉动作所对应的信号具有唯一性,因此可用于定量描述下肢
运动。虽然针对不同个体,肌点信号存在一定的差异,但仍然满足一定规律,具

7
杭州电子科技大学硕士学位论文

体如下:
sEMG 信号的激活特点。当肌肉有一定的收缩动作时,这时肌肉细胞周围就
会产生电位。但是当肌肉处于放松状态时,则没有电位产生。当 sEMG 信号趋
于 0 时,这时的电压位于静息状态处于基线水平,因此就不会产生动作电位了。
在对 sEMG 信号进行采集时会产生一定的误差是因为遭受到了噪声的干扰,但
是肌电信号并不会处于 0 电压附近。
sEMG 信号的幅值特点。肌电信号的幅值、波形等特征都有其特点。对于正
常人而言,肌电幅值的峰值大小一般为 1~4mV,最高值不会超过 5mV。而对于
非正常人而言,肌电值得大小一般小于 350uV,有些甚至达不到 1uV,其与正常
人相比相差巨大。对于采集到的 sEMG 信号,必须经过一定的处理后,用于步
态识别研究中才具有一定的准确性。

2.1.3 人体下肢结构
人行走时主要通过下肢的支撑摆动来完成,下肢是人体运动时的关键支撑,
一个人的下肢主要包括:臀、大腿、膝关节、小腿、脚底等这些部位组成[66]。,
而大小腿这两个部位分布了不同种的肌肉通道,每个都有自己的作用,人体下肢
肌肉分布图来自于文献[67],其腿部肌肉分布如图 2.2 所示:

阔筋膜张肌

长收肌
股直肌 股二头肌
股外侧肌 半腱肌
股内侧肌

胫骨长肌
外腓肠肌
胫骨前肌 内腓肠肌
比目鱼肌

前观图 后观图

图 2.2 下肢肌肉分布示意图[66]
人体下肢由以上所有肌肉构成,但每部分肌肉的参与程度不同,具体如表
2.1 所示:

8
杭州电子科技大学硕士学位论文

表 2.1 下肢主要肌肉及位置分布

肌肉名称 位置和功能

股直肌 存在于大腿前侧,负责髋关节弯曲和膝关节伸展

股内侧肌 存在于大腿内侧,控制膝关节伸展

长收肌 存在于大腿上前侧,负责大腿内收、外旋产生肌肉活动

阔筋膜张肌 存在于大腿上方的外侧,负责髋关节弯屈动作

半腱肌 存在于大腿外侧上部,负责髋关节伸展

胫骨前肌 存在于小腿正前部,负责踝关节翻转和背屈

内腓肠肌 存在于小腿内侧,负责足部支撑和摆动

比目鱼肌 存在于小腿下侧,负责抬足

2.2 步态模式与选取
2.2.1 步态划分
下肢步态运动是人体运动分析中非常重要的一部分。步态是人体行走时的状
态。而行走又是人类生存的最基本的条件之一。人体正常行走时可以分为三个基
本过程:先是双腿站地支撑、然后一个腿抬起单腿支撑以及最后单腿摆动。一般
来说,走路是从一只脚后跟到脚后跟的另一侧,然后落地,这个动作是一次完整
的周期。支撑时期的状态是脚踩在地面上,摆动期则是相反,这两种时期各占一
个周期的 60%和 40%。如图 2.3 所示。一个完整的步态周期可以分为两大类:支
撑期和摆动期[68],支撑期又可再划分为支撑前中后期 3 个阶段[69],摆动期分为
摆动前后两个时期。

支撑前期 支持中期 支撑后期 摆动前期 摆动后期

支撑相 (60%) 摆动相 (40%)

一个完整的周期

图 2.3 一个完整的步态周期

9
杭州电子科技大学硕士学位论文

1、支撑期人体运动时脚碰触到地面,大约占一个完整运动周期的 60%左右。
可以分为:
(1) 支撑前期:脚跟接地到脚平放,在正常步速下,大约占一个完整步态周
期的 12%~15%。
(2) 支撑中期:当脚趾开始落地,脚跟出现再到离开地面时,承受人体全部
重量的时刻,大约是一个完整运动周期的 21%~30%。
(3) 支撑后期:这一阶段脚跟开始离地,同时脚底减小跟地面的接触面积。
一直到脚趾离开地面进入摆动期,约占一个完整运动周期的 16%~25%。
2、摆动期:下肢一侧脚趾脱离地面后,约占一个完整运动周期的 40%,可
以分为:
(1) 摆动前期:脚趾即将脱离地面,同时下肢运动开始加快。大约占一个完
整步态周期的 13%~15%。
(2) 摆动后期:脚趾开始离开地面,这一时期下肢运动开始减少,大约占一
个完整步态周期的 15%。

2.2.2 步态参数
步态的量化分析主要从时间、关节角度以及空间这三个参数上进行分析。如
图 2.4 为步态时空参数。
左步长 右步长

运动前进方向
左脚

右脚 右脚

步幅

图 2.4 步态参数示意图

步态周期:步幅时间,从某一边脚跟着地到该边脚跟再次着地的所花费的时
间的总和。一般而言,成年人步态周期约为 1.5s。
步长:从某一个脚开始离地行走接触到地面到另一脚跟接触到地面形成的一
段距离。
步幅:某一边脚跟着地到该边脚跟再次着地的线形长度。
跨步时间:表示某一个脚开始离地行走接触到地面然后再到另一脚跟接触到
地面经过的时间。
步速:行走时位移除以时间也就是步长与步态周期的比值。

10
杭州电子科技大学硕士学位论文

2.2.3 步态信息选取
进行步态识别研究前,最基本的是步态信息的获取,步态信息主要包括生物
特征和行为特征。生物特征又分为生理和行为两种特征。而生理特征常见的有指
纹识别、人脸识别以及音色识别等。行为特征则有视频图像信息、肌电信息以及
加速度信息等。
图像信息是人体的一系列实时运动图像,通常通过高分辨率相机采集,常用
于公共安全领域。但这些却存在实验价格昂贵且成本高等缺点。在智能视频监控
等领域中,步态识别发挥了重要的效果,该技术能够在远距离和视频分辨率较低
的情况下根据人物的步态实现身份识别。
本文选取的是下肢的 sEMG 信号,其采集装置包括电极片和针电极,针电
极需要直接插入肌肉中从而进行信息采集,对肌肉有一定的损伤,所以很少使用。
而电极片板具有无害、接触面积广等优点因而被广泛适用于进行肌电数据的采
集。

2.3 步态信号的数据采集
2.3.1 实验仪器
表面肌电仪作为在步态分析、运动医学等领域重要的研究工具,具有体积小
携带方便等优点,并且通道数和频率可以人为设置,适用于多种场合。
本文实验采集设备选用 Delsys 公司的 Trigno 无线传感器,Trigno 无线传感
器由于体积小、测量结果准确并且装卸方便等优点,因此,被广泛的用于步态
sEMG 信号的采集中。本实验中,设置 1000 Hz 作为采样频率,并选取人体下肢
的八通道肌肉来测量肌电信号。如图 2.5 所示。

(a) Trigno 无线传感器 (b) 数据采集 (c) Delsys 的运营系统

图 2.5 sEMG 收集设备

2.3.2 下肢步态信号采集
本实验选取六位 22-26 岁的健康的男性来进行实验,具体信息如表 2.2 所示:

11
杭州电子科技大学硕士学位论文

表 2.2 受试者信息

编号 年龄 身高(cm) 体重(kg) 膝盖宽度(mm) 脚踝宽度(mm)


1 23 178 53.5 95.68 69.88
2 25 178 61.1 102 68.5
3 25 171 69.1 105.08 64.96
4 24 157 60.5 95.71 66.22
5 25 181 72.7 103.93 67.43
6 23 172 64.0 102.54 70.45

本次实验选取了人体下肢运动时的八块肌肉,如图 2.6 和表 2.3 所示为选取


的下肢八股肌肉通道。

阔筋膜张肌

长收肌
股直肌 半腱肌
股内侧肌

内腓肠肌

胫骨前肌
比目鱼肌

图 2.6 肌肉位置图

表 2.3 下肢肌肉通道

通道号 肌肉中文名称 英文名称

1 股内侧肌 Vastus Medialis (VM)

2 半腱肌 Semitendinosus (ST)


3 长收肌 Adductor Longus (AL)
4 阔筋膜张肌 Tnsor Fasciae Latae (TF)
5 股直肌 Rectus Femoris (RF)

6 胫骨前肌 Tibialis Anterior (TA)


7 内腓肠肌 Gastrocnemius Medialis (GM)
8 比目鱼肌 Soleus (SO)

如图 2.5(b)所示,为了避免随机干扰,每次实验中匀速行走 70 步,步速
1.3m/s。此外,在进行采集之前,需要做好实验准备,具体如下:

12
杭州电子科技大学硕士学位论文

(1) 准备所需的实验器材。记录受试者的身体数据包括身高、体重等,然后
提前设置好通道的个数、频率及采集事件。
(2) 对需要进行实验的下肢皮肤位置进行酒精消毒,清洁皮肤上的杂质,增
加电极贴的粘性,并保证受试者处于一个平稳的状态。
(3) 开始实验。实验过程为实验者通过正常速度(1.3m/s)在平地上进行行走。
由于肌肉刚开始运作时需要时间缓冲,因此为了激活肌肉,实验开始 20s 左右再
进行数据的记录,同时为了防止疲劳所产生的误差,受试者每采集一组数据需休
息 5 分钟左右。
(4) 整理并记录数据。进行模板设置,同步信号的所采集的数据,记录实验
信息并进行保存,当采集实验完成后应该整理好所用的实验器材并关闭实验室所
有电源后再离开。

2.3.3 实验采集结果分析
基于以上内容,本次实验选取 6 位受试者的八块肌肉的肌电信号信息,采集
到的信号图如图 2.7 所示:

支撑前期 支撑中期 支撑后期 摆动前期 摆动后期

支撑相 (60%) 摆动相 (40%)

一个完整的步态周期

图 2.7 提取八块肌肉的数据图
图 2.7 中横坐标表示时间,纵坐标轴表示八路肌肉的电压值,并且从图 2.7

13
杭州电子科技大学硕士学位论文

可以看出,肌电信号呈周期性状态且每路肌肉的电压值各不相同,同时采集到的
信号伴有一定的噪声。从图 2.7 中可以看出,VM、ST、TF 以及 RF 在支撑前期
比较活跃。在支撑后期,RF 和 GM 的活跃度逐渐降低,SO 开始变得活跃起来。
当到达摆动期时,ST 再次被激活,VL,TF 以及 RF 也有较小的活跃度。总的来
说,不同肌肉下的 sEMG 信号在不同时期时的活跃程度不同,通过多块肌肉的
对比,就可以完成 sEMG 信号的步态划分。
2.4 本章小结
本章主要内容是获取步态 sEMG 信号并完成了实验数据的采集。首先对人
体下肢产生机理、关节参数、生理结构等方面进行了说明,选取了下肢不同部位
的八块肌肉通道进行 sEMG 信号的采集。其次,结合步态参数,并从步态完整
周期的角度出发,阐述了步态的划分方法。接着,讲解了肌电信号的采集方法和
特点,并完成了数据的采集从而为后续肌电信号的特征提取研究打下了基础。

14
杭州电子科技大学硕士学位论文

第 3 章 肌电信号消噪与特征提取

sEMG 信号在采集的过程中会受到人为和环境的影响导致混有些许噪声,为
了避免噪声导致信号失效的问题[70],如何对噪声进行有效的去除,并提取合适
的肌电特征,对接下来的研究起着至关重要的依据。本章主要通过对比三种去噪
方法的均方根误差和信噪比来选择一种最好的消噪方法进行消噪处理。同时分别
提取消噪后的时域、频域等特征进行特征提取并进行下一步的分析。

3.1 肌电信号的消噪方法
在对肌电信号进行采集时影响的噪声的主要因素来源于三部分:
(1) 在设备穿戴过程中产生的身体晃动造成的噪声。相比与针电极,在进行
电极导体的传递时,运动点位容易受到自身条件的影响,使得采集到的信号比较
微弱。
(2) 在实验过程中传感器与皮肤发生形变而产生的噪声。进行实验时,电极
片可以通过双面胶粘贴在相应的位置通道上。然后伴随着肢体运动,表面电极会
产生偏移,从而会对 sEMG 信号造成些许偏差。
(3) 实验设备引入的环境噪声和电磁干扰。通常设备自身干扰有所需的自身
硬件模块,比如采集仪里的电源等。除此之外,实验室环境中的电脑、WiFi 等
带来的电磁辐射等都会对 sEMG 信号产生不同程度的影响。
对于这三种噪声分别可通过以下方法解决:1. 穿戴过程中需小心谨慎,同
时增加身体的平衡度。2. 实验中尽量保持电极片与皮肤之间处于一个相对稳定
的状态。3. 防止电磁干扰实验时最好不要带电子产品。
因而,怎样解决信号噪声所带来的干扰问题,对后续的研究来说至关重要。
本文通过三种不同的消噪方法进行各自的指标分析,并选择一种最好的消噪方
法,对采集到的肌电信号进行消噪处理。
3.1.1 小波阈值消噪法
小波阈值消噪方法主要是利用小波变换把原始 sEMG 信号小波系数分解成
高频和低频两个部分。在小波系数的高频部分,原始的 sEMG 信号含有大量的
噪声,所以只需对低频部分的信号进行二级分解即可,高频部分不需要。接着继
续对低频部分进行多层次的分解直至达到目标要求。本文中以三级小波系数分解
为例,如图 3.1 所示。 Ai Bi 分别代表低频、高频部分。

15
杭州电子科技大学硕士学位论文

B1

S B2

A1
B3

A2

A3

图 3.1 小波三级分解图
小波阈值消噪具体步骤主要如下:
(1) 将原始 sEMG 信号进行小波分解主要取决于原始 sEMG 信号的特点。
根据图 3.1 可以看出分解后的小波系数关系如下:
S = A3 + B3 + B2 + B1 (3.1)
对于分解后的小波系数来说,如何选取合适的阈值很重要。本文完成消噪的
最终目标是保存其真实信号的小波系数并进行重构。
f (t )=S (t ) + k (t ) t = 0, 2, , N −1 (3.2)
其中, f (t ) 代表含有噪声的 sEMG 信号, S (t ) 表示真实的 sEMG 信号, k (t )
表示噪声。
(2) 对高频部分 sEMG 信号进行小波系数阈值化处理。高频部分主要存在噪
声,因此对于如何去除消噪来说选择合适的阈值函数并对其进行量化处理至关重
要。主要选取阈值函数里的软硬阈值。
其中硬阈值和软阈值函数分别为:
 wi wi  
wˆ i =  (3.3)
0 wi  
 sign( wi )  wi −  wi  
wˆ i =  (3.4)
0 wi  
其中, wi 为分阈值解后的小波系数, wˆ i 是处理后的小波系数。  是选取好
的阈值。
去噪的最终结果几乎完全由阈值的选取所决定。当阈值过小时,一些噪声分
量无法被完全去除;而阈值过大,则会影响到真实信号。

16
杭州电子科技大学硕士学位论文

3.1.2 小波包阈值消噪法
小波包阈值消噪法不同于小波阈值之处是小波包是将信号分解成高频和低
频系数后,并对其进行再次分解[71]。小波包去噪的关键是将分解后选取的阈值
进行阈值处理,其阈值处理和小波消噪中的阈值处理方法一样,小波包阈值消噪
的分解示意图如图 3.2 所示。
S

A B

AA AB AB BB

AAA AAB ABA ABB AAB BAB BBA BBB

图 3.2 小波包三级分解图
根据图 3.2 可以看出分解后的小波系数关系为:
S =AAA + AAB + ABA + ABB + AAB + BAB + BBA + BBB (3.5)
3.1.3 小波模极大值消噪法
三个消噪的方法都是基于小波变换进行的。但是主要区别在于,sEMG 信号
的小波模极大值消噪在利用有用信号和噪声在不同小波尺度上 [72],不仅去掉了
噪声而且还保留了可用的信号。分为以下几步:
第一步:原始 sEMG 信号的离散小波变换。然后提取合适的小波基并进行 c 层
小波分解[73],最终得到离散小波变换 Wf (v, x ) ,其中 v 代表尺度, x 表示位置。
第二步:对含有噪声且具有信息突变的奇异点进行利普希茨指数计算。
设 n  0 ,n    n + 1 ,如果存在 n 次多项式 kn (h) 以及 A 和 l0  0 ,对于 l  l0 ,
均满足:
f ( x0 + l ) − l0 (l )  A l
N
(3.6)
其中, f ( x0 ) 为 Lipschitz 指数 L 。L 与去曲线下该点位置的光滑度成正比,L
越大,光滑度越高,反之。
Wf (v, x)
第三步:剔除噪声的极大值点,保留下其真实的点。若 在 x = x0 成
x
立,则点 (v0 , x0 ) 为局部极值点。对于 x0 范围下的 ( x0 −  , x0 +  ) 都满足以下:
| Wf (v, x) | Wf (v, x0 ) (3.7)
此时模极大值点 (v0 , x0 ) 为局部模极大值,则小波尺度 d 和 Lipschitz 指数 L 之
间的关系为:
log 2 | W (2d , x) | log 2 k + Ld ( k  R n ) (3.8)

17
杭州电子科技大学硕士学位论文

式(3.8)呈现了 Lipschitz 指数 L 与小波变换尺度 d 之间的关系。当 L  0 时,是


正比关系,当 L  0 时,是反比关系。
第四步:重构 sEMG 信号。将噪声的模极大值去掉后,将余下的小波系数
作为重构 sEMG 信号。
综上所述,采用小波模极大值的消噪方法,可以有效地消除噪声。
3.1.4 消噪性能指标
本文针对三种消噪方法,主要通过均方根误差(MSE)、信噪比(SNR)这
两个当作指标来选取效果最好的一个消噪方法。均方根误差指的是采集到的原始
sEMG 信号与进行消噪后的 sEMG 信号之间的方差均方根,信噪比则是代表着未
去噪前的原始 sEMG 信号和噪声之间的比值,计算式如下:
D

 [ f (n) − fˆ (n)]
n =1
2

MSE = (3.9)
D
 N

  f ( n) 2 
SNR =10log  N n =1  (3.10)
 [ f (n) − fˆ (n)]2 
 
 n =1
式(3.9)和(3.10)中, f (n) 为原始 sEMG 信号, fˆ (n) 为去噪后的 sEMG 信号,
D 表示信号的长度。对于这两个消噪性能评价指标来说,当 MSE 越小时,SNR
越大,其效果越好。
3.2 肌电信号消噪结果分析
我们对三种小波分解的指标进行分析:均方根误差(MSE)和信噪比(SNR)
表 3.1 三种不同方法的 MSE 和 SNR 大小

肌肉通道和指标 小波模极大值法 小波包阈值法 小波阈值法

SNR 93.4126 84.1461 83.0478


1 (VM)
MSE 0.0023 0.0026 0.0032

SNR 114.4681 92.4105 93.7652


2 (ST)
MSE 0.0028 0.0030 0.0035

SNR 102.4321 83.8780 96.4236


3 (AL)
MSE 0.0006 0.0005 0.0009

SNR 94.7807 94.7366 90.2526


4 (TF)
MSE 0.0015 0.0015 0.0020

18
杭州电子科技大学硕士学位论文

表3.1(续表)

肌肉通道和指标 小波模极大值法 小波包阈值法 小波阈值法

SNR 86.2346 82.1096 85.7098


5 (RF)
MSE 0.0014 0.0013 0.0021

SNR 84.9807 88.8765 87.0125


6 (TA)
MSE 0.0089 0.0091 0.0220

SNR 90.1038 92.7213 76.6079


7 (GM)
MSE 0.0180 0.0175 0.0206

SNR 84.5567 91.4769 72.8971


8 (SO)
MSE 0.0069 0.0080 0.0078

平均信噪比 93.8712 88.7944 85.7146

平均误差 0.0053 0.0054 0.0078

从表 3.1 我们可以看出,MSE 越小,SNR 越大,sEMG 信号的消噪结果越


好。单从信噪比这一指标看,小波模极大值的信噪比最高达到 93.8712,其中小
波包阈值法的 SNR 小波阈值法高 8.1566。对于 MSE 这个指标而言,小波模极大
值消噪法的值最低为 0.0053。小波模极大值的消噪法要高于其它两种方法。
我们对提取到的半腱肌信号为例用小波模极大值方法进行消躁处理。

图 3.3 小波模极大值消噪图

由图 3.3 可知,对于采集到的原始 sEMG 信号,其信号中含有一些毛刺和干


扰,但是采用小波模极大值对其进行消噪处理后,信号曲线变得相对光滑。
3.3 肌电信号特征提取
通过对原始信号根据其时域内简单的线性规律计算可以可以得到 sEMG 信

19
杭州电子科技大学硕士学位论文

号的时域特征量,因为其计算简单,而且不需要其它方法再次进行转变,因此在
很多领域都得到了较多的使用。sEMG 信号是一种不稳定且随机变化的信号,因
此其特性会根据时间的变化而变化。虽然这种变化不仅包含着动作本身的动态信
息,但是这种不稳定的状态也会为下一步的数据的处理带来一些负面影响。为了
解决这种情况造成的弊端,在对采集到的信号进行时域特征提取时,通常需要计
算信号的特征量,这样情况下其计算结果才是有用的。另外,由于采集时造成的
噪声等一系列干扰都是可以通过人为去解决的,因此时域特征的提取在步态识别
中被广泛应用。而频域特征相比于时域而言要更加稳定。特征的提取对后续的步
态识别研究中起着重要的作用,因此本文的重点是特征的提取,主要从时域、频
域等对特征进行分析。主要分为:
绝对值均值

时域分析 方差

过零点数
sEMG信号特征
提取方法
平均
功率频率

频域分析

中值频率

图 3.4 特征提取方法图

3.3.1 时域特征
根据 sEMG 的时域特性,在本文中,选择了三个代表性的时域特征分别为:
绝对值均值(MAV),方差(VAR),过零点数(ZC)等特征[28, 29]。MAV 包含平均值的
信息强度和 sEMG 信号的浓度。时域具有计算简单的特点。上面所述可以根据
以下式计算:
1 N
MAV =  xk
N k =1
(3.11)

1 N 2
VAR =  xi
N − 1 i =1
(3.12)
N −1
ZC =  sgn ( − xi xi +1 ) (3.13)
i =1

其中, xk (k = 1, 2,L , N ) 是一个为 N 的窗口长度的肌电信号时间序列。

3.3.2 频域特征
频域特征主要有平均功率频率(MPF)和中值频率(MF)等特征[34]。
+
 fP ( f ) df
MPF = 0
+
(3.14)
 P ( f ) df
0

20
杭州电子科技大学硕士学位论文

MF + 1 +

0
P( f )df = 
MF
P( f ) =
2 0
P( f )df (3.15)

其中,P ( f ) 是 sEMG 信号的功率谱密度, f 是频率。MF 为所求的中值频率。

3.4 特征提取结果分析
3.4.1 时域特征提取结果分析
提取 8 个肌肉通道下 sEMG 信号的 MAV,VAR,ZC 组成的时域特征。表
3.2 是 5 个步态时期下时域特征的平均值。
表 3.2 不同时期下时域特征的平均值

通道 特征 支撑前期 支撑中期 支撑后期 摆动前期 摆动后期

MAV 64.78 18.64 14.61 16.34 17.01

1 (VM) VAR 7632.13 826.14 369.42 489.31 502.39

ZC 5 0 0 0 0

MAV 17.02 16.34 15.28 24.35 32.01

2 (ST) VAR 3962.36 463.29 389.13 1789.34 1320.01

ZC 0 0 0 0 2

MAV 15.98 32.48 16.89 25.37 23.14

3 (AL) VAR 598.34 1864.70 548.75 1368.25 1120.14

ZC 0 1 0 0 2

MAV 5210.36 1358.26 1102.32 1451.07 1354.21

4 (TF) VAR 4521.36 1420.61 1089.34 1125.49 1085.89

ZC 5 0 0 0 0
MAV 61.49 19.34 16.32 17.28 21.49

5 (RF) VAR 7532.01 1123.68 589.36 785.24 894.21

ZC 6 1 0 2 0

MAV 24.39 29.31 55.27 16.34 16.79

6 (TA) VAR 1865.23 920.36 6012.37 789.39 674.13

ZC 0 1 4 2 0

MAV 8.97 16.23 58.31 10.49 9.21

7 (GM) VAR 146.39 436.72 9621.03 131.65 140.29

ZC 0 2 3 0 0
MAV 19.48 21.23 34.71 17.62 18.34

8 (SO) VAR 846.13 726.34 2816.36 402.38 413.76

ZC 0 0 4 0 0

21
杭州电子科技大学硕士学位论文

其中,股内侧肌用 VM 表示,依次其余七个肌肉分别为:半腱肌,长收肌,
阔筋膜张肌,股直肌,胫骨前肌,内腓肠肌,比目鱼肌。
从表 3.2 中可以发现,在五个步态周期中,八个不同肌肉通道下的时域特征
均值各不相同,并且他们之间的差距相差较大,不稳定。
3.4.2 频域特征提取结果分析
提取 8 个肌肉通道下 sEMG 信号的 MPF,MF 等组成的时域特征。表 3.3 是
5 个步态时期下的频域特征的平均值。
表 3.3 不同时期下频域特征平均值

通道 特征 支撑前期 支撑中期 支撑后期 摆动前期 摆动后期

MPF 1.94 1.75 1.68 1.81 1.90


1 (VM)
MF 184.33 160.07 70.58 74.98 68.75

MPF 1.91 1.76 1.51 1.83 1.92


2 (ST)
MF 156.33 154.91 71.71 78.83 79.01

MPF 1.83 1.90 1.67 1.76 1.80


3 (AL)
MF 156.34 171.46 72.39 76.48 74.39

MPF 1.92 1.79 1.54 1.61 1.73


4 (TF)
MF 181.63 168.44 76.22 79.35 73.46

MPF 1.93 1.86 1.64 1.76 1.79


5 (RF)
MF 184.17 162.54 71.46 74.86 75.03

MPF 1.89 1.87 1.93 1.83 1.81


6 (TA)
MF 164.46 157.38 84.16 73.17 69.23

MPF 1.76 1.80 1.92 1.78 1.74


7 (GM)
MF 145.36 149.35 84.97 85.42 63.16

MPF 1.83 1.81 1.93 1.80 1.76


8 (SO)
MF 161.75 160.19 81.86 81.96 66.34

从表 3.3 中可以发现,对于八个不同的肌肉通道,在五个不同的步态周期中,
频域特征下的特征均值变化不大,相对稳定。而时域特征下的特征均值变化则较
大。因此这些特征值下的特征差异刚好是后续态特征识别的基础。
3.5 本章小结
本章主要针对采集到的原始 sEMG 信号进行消噪处理和特征提取分析等内
容展开讨论。首先通过计算均方根误差和信噪比这两个性能指标,引入小波阈值、

22
杭州电子科技大学硕士学位论文

小波包阈值、小波模极大值等三种消噪方法,通过对比它们三个的性能指标,结
果表明小波模极大值的消噪性能最好,因此采用小波模极大值进行去噪处理,并
提取时域里的绝对值均值(MAV),方差(VAR),过零点数(VAR)、频域里的平均
功率频率(MPF)和中值频率(MF)等特征并进行特征均值分析,通过在五个不同的
步态周期下的分析,频域特征下的特征均值变化不大较稳定,而时域特征下的特
征均值相对于频域变化较大。因此这些特征值下的特征差异刚好是后续态特征识
别的基础。

23
杭州电子科技大学硕士学位论文

第 4 章 基于特征组合的 DNN 算法步态识别

不同的样本特征会对模型的识别结果产生不一样的效果,模型也会受到样本
特征量大小的影响,但是对于深度学习来说,可以通过适当的增加一定的网络层
数来提高其识别结果,但是在特征样本数据量不足的情况下,可能会出现过拟合
的现象从而导致识别下降。因此特征样本的数量大小和网络层数的选择会对步态
分类的准确率产生影响。因此,本章针对时域、频域单一特征以及其组合特征和
网络层数进行步态识别研究,通过对比这三种不同特征下的分类器不同的识别精
度。
4.1 基于超限学习机的步态识别
传统的 BP 神经网络具有训练速度慢、无法达到全局最小等缺点,而超限学
习机(ELM)作为一种前馈神经网络的学习算法,相比于传统的神经网络,具有较
快的计算速度并且性能好[74]。ELM 已广泛应用于回归和分类问题、特征映射函
数(sigmoid、hard-limit、Gaussian、多二次、小波、傅立叶级数)等方面中。并且
ELM 的结构组成很单一,其结构分为输入、隐含和输出层三部分。ELM 的隐藏
节点参数可以独立于训练数据随机分配并且不需要调整,并且输出权重根据应用
程序进行调整约束,得到最后相应的输出权重[75]。其结构如图 4.1 所示。
o1 jk
wij
x1 y1
o2

x2
y2

xn ol
ym
输入层 输出层

隐含层

图 4.1 ELM 结构图


ELM 的学习算法主要分为以下三步骤:
(1) 根据样本数据集,随机设置输入层和隐含层的权值向量 w 和阈值 b 。

24
杭州电子科技大学硕士学位论文

根据已知的训练样本集 ( xi , yi ) ,其中,xi = ( xi1 , xi 2 ,L , xin )  R n 为 n 维输入,


K

yi = ( yi1 , yi 2 , , yim )  R m 为 m 维输出。可以得到:


K


i i ( i  x j + bi ) = o j , j = 1, 2, , N
N

 f K ( x ) = 
 i =1



 wi =  i1 , i 2 ,L , in 
T (4.1)


  = (  ,  ,L ,  )T
 i i1 i2 im


其中, wi 代表第 i 个隐含层节点输入的权值,  i 表示输出的权值, bi 代表阈
值,  ( x) 是激活函数, N 是样本的总数据量。
(2) 计算隐含层输出矩阵 H 。
将式(4.1)可以写成如(4.2)的形式:
H =T (4.2)
 h ( x1 )    (1  x1 + b1 ) L  (L  x1 + bL ) 
   
其中, H =  M  =  M L M  代表隐含层的输
 h ( xS )   (1  xS + b1 ) L  (L  xS + bL )  N K
出。

(3) 计算输出层权值  。

其中,连接权值  可以通过(4.3)的式获得:
min E = min H  − T (4.3)

其解为:

 =H +T (4.4)
其中,式(4.4)中的 H + 表示矩阵 H 的 Moore-Penrose 广义逆。
4.2 基于支持向量机的步态识别
支持向量机(SVM)是一种机器学习算法,其主要用于模式分类和非线性回归
等,通过在训练数据中找到一个最优的超平面,从而对样本数据进行有效分类
[76]
。通过在 SVM 中引入核,可以最大化等价于特征空间边距原始空间非线性
决策边界。对于最简单的二元分类任务,SVM 在特征空间中使用线性分离超平
面来创建具有最大边距的分类器。考虑到数据集的二元分类问题,SVM 分类器
搜索最佳分离超平面泛化能力比较强。

25
杭州电子科技大学硕士学位论文

x2 2
D=
 x +b =1
T 

0
b=
T

x+
x+

T
b=
−1

x1

图 4.2 SVM 结构图


设置训练样本数据集为 ( xi , ti ) i = 1, 2,L , N ,其中 xi 为输入的第 i 个特征。
其式(4.5)的方程主要表示如下:
T  x + b = 0 (4.5)
式(4.5)中, ω 为超平面的法向量, b 是偏置。则应满足条件为:
 T x + b  +1, xi = +1
 T (4.6)
 x + b  −1, xi = −1
其中,  T  x 是权值向量与特征样本的内积运算。并且式(4.6)中的支持向量
的训练样本的数据是线性可分的。
对于如何寻找最优的超平面问题以及让异类支持向量间距最大也就是计算

2
2
的最大值, 的最小值:
 2
2

min
 ,b 2 (4.7)
s.t. ti ( x + b )  1, i = 1, 2, , K
T

对(4.7)可以建立拉格朗日(Lagrange)函数,表示为:
N
1
Lq =  T −   i [ yi (bgxi + b) − 1] (4.8)
2 i =1

令式(4.8)中的  ,b 为零并求其偏导,可得:
 L S

 

=  − 
i =1
 i xi ti =0
 (4.9)
 L =  t = 0
S

 b i =1
i i

根据式(4.6) (4.7) (4.8)可以求出对偶问题:

26
杭州电子科技大学硕士学位论文

M
1 M M
max =   i − i j tit j xi x j (4.10)
i =1 2 i =1 j =1
根据式(4.10)可以得到最优解为:
M
i  =   i xi yi (4.11)
i =1

由式(4.11)可以看出,i  可以表示为训练样本的线性组合。关于二次函数的
极值问题,假设存在一个唯一解,根据 KKT 条件,当 Lagrange 乘子和 KKT 条
件的乘积为零时就达到最优解。当  i 不为 0 时,对应的训练样本就是支持向量,
计算如下:
 i ( yi ( T  xi ) + b) -1 = 0, i = 1, 2,L , N (4.12)
N
f ( x) = sgn{(   x) + b} = sgn{  i yi ( xi   x) + b} (4.13)
i =1

根据核函数 K ( x, xi ) 替换超平面的点积从而生生新的一个特征空间,可以通
过式(4.10)和(4.12)可以将上述问题转化表示为:
M
1 M M
max =   i −   i j ti t j K ( xi , x j ) (4.14)
i =1 2 i =1 j =1
M
f ( x ) = sgn   i ti t j K ( x, xi ) +b (4.15)
i =1

其中,0   i  C ,C 代表惩罚函数,能够协调模型的复杂度从而可以使 SVM


具有更好的泛化性能。

4.3 基于深度神经网络的步态识别
标准的一个 ANN 由输入、隐藏、和输出这三层组成。神经网络也可以表示
为函数的从输入层到输出层的传播。由于 DNN 含有多层隐含层,因此它也被称
为多层感知机。DNN 主要是由输入层、隐含层和输出层组成,其网络结构示意
图如图 4.3 所示[77]。
x1
w1 w1 y1
x2

x3 y2
wi wi

xi
+1 +1 ym
+1

输入层 隐藏层 输出层

图 4.3 DNN 结构图


DNN 的基本结构是由感知机通过输入 x 和输出 y 之间的逻辑关系组成,其

27
杭州电子科技大学硕士学位论文

最终的输出为:
n
y =  ( wi xi + b) (4.16)
i =1
其中, b 为神经元的激活阈值,  为激活函数, wi 为神经元之间的连接权重, xi
是输入的数据。
在对 DNN 模型进行训练时,其算法可以根据网络实际输出与期望输出之差
来反向调整网络的参数,从而使其达到最优,参数更新方法为:
L
W  = w − (4.17)
w
L
b = b −  (4.18)
b
其中, W  为更新后的神经元连接权重, b  为更新后的神经元偏置, w 是神经元
的权值,  为学习率, L 为损失函数。
4.3.1 深度神经网络结构参数的选择
在目前的研究中,DNN 用于对步态进行分类,这是一种具有多个隐藏层的
ANN。与传统的人工神经网络相比(有一个隐藏的层),DNN 可以表示复杂的非
线性模型。本文采用 DNN 进行对比实验,DNN 网络中层与层之间采用 RELU
激活函数,同时设置 Dropout 层避免过拟合,设置训练次数为 1000 次,一次训
练 10 个数据,输入层神经元为提取的特征值(时域和频域的 5 个特征)、隐含层
神经元设置为 128、输出层是 5(5 个不同的步态阶段),输出层采用 Softmax
函数,同时用交叉熵作为损失函数,训练集和测试集中的数据量分别占数据集的
70%和 30%。
由于 DNN 中的多层隐含层可以减少每层神经元因为个数不同所引起的性能
差异[78],所以本文首先建立的 DNN 模型是针对不同网络层数的。隐含层个数将
从 1-4 层中选取[78],每个隐含层的神经元的个数为 128。
如果网络层数设置过高时,其识别的结果并不是最好的,因此选择一个合适
的层数至关重要。因此,接下来讨论网络层数不同时,DNN 的评价指标,以支
撑前期为例。
表 4.1 不同隐含层对应的评价指标
层次 识别率(%) 时间(分钟)
1层 92.39 1.23
2层 95.52 1.96
3层 96.79 2.34
4层 95.77 3.87

根据表 4.1 可知,当隐含层数量在 1-3 层时,其识别结果逐步增加,但当隐


含层设置为 4 层时,识别率反而在下降,而在对于训练时间而言,其随着层数的

28
杭州电子科技大学硕士学位论文

增加而增加,但是增加的幅度基本变动不大,因此为了保证模型的准确性,本文
选择隐含层的层数为 3。
4.4 不同模型下识别结果与分析
本章研究 SVM 和 ELM 分类器的参数设置为:SVM 的惩罚参数和核函数参
数均设置为 0.5,ELM 的隐含层个数为 400,转换函数为正弦函数。
(1) 各特征输入 SVM 中
首先,两个单一的特征,时域(T)和频域(F)输入到支持向量机(SVM)分类器
中。表 4.2 是识别后的结果。
表 4.2 不同特征下 SVM 的识别结果 (%)
分类器 支撑前期 支撑中期 支撑后期 摆动前期 摆动后期 平均识别率
T 94.38 93.89 94.76 95.81 95.38 94.84
F 94.39 94.16 95.03 95.82 95.60 95.00

表 4.2 显示了对两类特征进行 SVM 分类时的良好识别结果。同时,频域特


征识别效果最好,平均识别率达到了 95.00%,其次是时域特征,平均识别率为
94.84%。此外,摆动期中频域和时域特征的识别率明显高于其他支撑期中时域和
频域的识别率,分别为 95.81%和 95.82%。
(2) 各特征输入 ELM 中
两个单一的特征,时域时域(T)和频域(F)输入到超限学习机(ELM)分类器中。
表 4.3 是识别后的结果。
表 4.3 不同特征下 ELM 的识别结果 (%)
分类器 支撑前期 支撑中期 支撑后期 摆动前期 摆动后期 平均识别率
T 95.46 95.31 94.78 96.21 95.03 95.36
F 94.06 95.67 94.87 95.69 95.71 95.20

表 4.3 显示,ELM 中的时域特征的平均识别率最高(95.36%)。频域特征样


本的平均识别率为 95.20%。此外,对比不同时期,时域特征在摆动前期的识别
率最高为 96.21%,而频域特征在步态摆动后期到的识别率明显高于其它时期,
达到了 95.71%。
(3) 各特征输入 DNN 中
两个单一的特征,时域时域(T)和频域(F)输入到深度学习网络(DNN)中。表
4.4 是识别后的结果。
表 4.4 不同特征下 DNN 的识别结果 (%)

分类器 支撑前期 支撑中期 支撑后期 摆动前期 摆动后期 平均识别率


T 95.69 96.68 92.85 97.37 95.01 95.72

29
杭州电子科技大学硕士学位论文

F 94.91 96.50 94.62 94.66 94.54 95.08

从表 4.4 可以看出,输入到 DNN 后,对各类特征的识别结果是不同的。时域和


频域特征的平均识别率分别为 95.72 和 95.08%。而在支撑中期,时域特征的识别率
最高为 96.68%,对于频域而言,在支撑中期的识别率为 96.50%。
表 4.2-4.4 中可以看出,当两种特征通过各种分类模型进行步态模式识别时,每
种特征在每个步态阶段的分类结果是不同的。这一发现表明,每种类型的特征在运
动过程中都会发生变化。从不同的角度分析了 sEMG 信号信息。
4.4.1 单特征下的识别结果分析
将两类特征时域特征(T)、频域特征(F)、分别输入 DNN、ELM、SVM 模型
中进行分类识别,识别结果如下表 4.2 所示:
表 4.5 时域特征输入分类器 (%)
分类器 支撑前期 支撑中期 支撑后期 摆动前期 摆动后期 平均识别率
DNN 95.69 96.68 93.85 97.37 95.01 95.72
ELM 95.46 95.31 94.78 96.21 95.03 95.36
SVM 94.38 93.89 94.76 95.81 95.38 94.84

图 4.4 时域特征识别率
由图 4.4 的数据分析可知,在时域特征下,通过 DNN 进行分类的识别结
果最好,平均识别率为 95.72%,其摆动前期的识别率最高为 97.37%,支撑后
期的识别率最低为 93.83%。ELM 和 SVM 不相上下,ELM 平均识别率为
95.36%,其中是摆动前期的识别率最高达到了 96.21%,支撑后期的识别率最
低为 94.78%。SVM 平均识别率为 94.84%,其中摆动前期的识别率最高达到了
95.81%,支撑中期的识别率最低为 93.89%。另外 DNN 分类器下支撑中期的识
别率也明显高于其他两个分类器的识别率,为 96.68%。且其他四个阶段内的

30
杭州电子科技大学硕士学位论文

分类结果相近。

表 4.6 频域特征输入分类器 (%)


分类器 支撑前期 支撑中期 支撑后期 摆动前期 摆动后期 平均识别率
DNN 94.91 96.50 94.62 94.66 94.54 95.08
ELM 94.06 95.67 94.87 95.69 95.71 95.20
SVM 94.39 94.16 95.03 95.82 95.60 95.00

图 4.5 频域特征识别率
由图 4.5 的数据分析可知,在频域特征下,通过 ELM 进行分类的识别结果
最好,平均识别率为 95.20%,其摆动后期的识别率最高为 95.71%,支撑前期的
识别率最低为 94.06%。DNN 和 SVM 不相上下,DNN 平均识别率为 95.08%,
其中支持中期的识别率最高达到了 96.50%,摆动后期的识别率最低为 94.54%。
SVM 平均识别率为 95.00%,其中摆动前期的识别率最高达到了 95.82%,支撑中
期的识别率最低为 94.16%。另外 ELM 分类器下支撑前期和支撑中期的识别率也
明显高于其他两个分类器的识别率,分别为 94.91%和 96.50%。且其他四个阶段
内的分类结果相差不大。
由图 4.5 的数据分析可知,在频域特征下,由于提取的特征数据量不是太大,
因此 DNN 的识别结果并不是最好的,并且五个阶段的识别率都相差不大,但是
与其它两个分类器相比稍微差了一点点,因此接下来将两个特征进行融合形成最
大的特征,其结果也将有所不同。
4.4.2 多特征下的识别结果分析
本文中对时域和频域特征(T+F)进行特征组合,扩大了数据样本量的维数形

31
杭州电子科技大学硕士学位论文

成最大特征,增大了特征样本的数据量,迭代后的识别效果更好,其融合特征的
识别效果表 4.7 所示。
表 4.7 时域加频域特征输入分类器 (%)
分类器 支撑前期 支撑中期 支撑后期 摆动前期 摆动后期 平均识别率
DNN 97.68 95.01 95.12 97.38 95.89 96.20
ELM 95.36 96.85 94.35 98.23 95.63 96.09
SVM 95.12 96.37 94.89 97.79 96.01 96.03

图 4.6 组合特征识别率
由图 4.6 的数据可知,融合特征形成最大特征后,DNN 的识别结果是最高
的,平均识别率达到了 96.20%,ELM 和 SVM 不相上下,ELM 平均识别率为
96.09%,其中是摆动前期的识别率最高达到了 98.23%,支撑后期的识别率最低
为 94.35%。SVM 平均识别率为 96.03%,其中摆动前期的识别率最高达到了
97.79%,支撑后期的识别率最低为 94.89%。并且 DNN 分类器下支撑前期的识别
率也高于其它两个分类器的识别率,达到了 97.68%。而支撑前期和支撑中期两
个阶段的识别率相差不大。
由图 4.5-4.7 可知三类分类器对每种特征样本的识别率各不相同,总体而言
DNN 的分类性能要比 ELM 和 SVM 的分类性能较好。

32
杭州电子科技大学硕士学位论文

图 4.7 三种不同特征的识别率
从图 4.7 可以得出,想比于 SVM 和 ELM 算法,DNN 算法的平均识别率呈
现了不同的趋势。对比 DNN 分类器的三个特征:时域、频域以及时域频域融合
特征,融合特征增加了样本维数,其训练不断迭代,识别效果也在增加,最终的
测试识别结果发现,融合后的特征的识别率最好。
接下来后续研究针对融合特征下 DNN 分类器进行讨论和分析,以 DNN 作
为分类器从以下五点进行讨论和分析:(1) 不同步态时期的损失以及识别率 (2)
不同时期 DNN 模型不同的损失 (3) 分析不同步态时期的精确率、召回率以及调
和参数 (4) 分析不同步态时期的标准差和方差的值 (5) 分析不同步态时期的交
叉验证法等不同的指标做深度的分析。
(1) 不同步态时期的损失以及识别率的对比。
1

0.9 T
F
T+F
0.8

0.7
Accuracy

0.6

0.5

0.4

0.3

0.2
0 100 200 300 400 500 600 700 800 900 1000
Epochs

图 4.8 DNN 分类器支撑前期的损失和识别率


图 4.8 可以看出,DNN 分类器下的支撑前期的损失和识别率,初始时融合
特征的损失值是最大的,时域和频域的损失基本一致,随着训练次数逐渐上升,
三个特征的损失都会趋于一个稳定的状态且融合后的损失最小。再对比三者的识

33
杭州电子科技大学硕士学位论文

别率,随着迭代次数的不断增加,其识别率也在逐渐上升直到趋于一个平稳的状
态,最终融合后特征的识别率最高达到了 97.68%。

图 4.9 DNN 分类器支撑中期的损失和识别率


图 4.9 可以看出,DNN 分类器下的支撑中期的损失和识别率,初始时三个
特征的损失值不相上下,随着训练次数的增加三个特征的损失都会趋于一个稳定
的状态且融合后的特征的损失最小,两个单一特征的损失基本一样。再对比三者
的识别率,随着迭代次数的不断增加,其识别率也在逐渐上升直到趋于一个平稳
的状态,最终融合后特征的识别率最高达到了 95.01%。

图 4.10 DNN 分类器支撑后期的损失和识别率


图 4.10 可以看出,DNN 分类器下的支撑后期的损失和识别率,初始时融合
特征的损失值是最大的,时域和频域下的损失基本一样大,随着训练次数的增加
三个特征的损失都会趋于一个稳定的状态且融合后的特征的损失最小,时域和频
域的损失也基本是一样。再对比三者的识别率,随着迭代次数的不断增加,其识
别率也在逐渐上升直到趋于一个平稳的状态,最终融合后特征的识别率最高达到
了 95.12%。

34
杭州电子科技大学硕士学位论文

图 4.11 DNN 分类器摆动前期的损失和识别率


图 4.11 可以看出,DNN 分类器下的摆动前期的损失和识别率,初始时融合
特征的损失值是最大的,时域和频域下的损失基本一样大,随着训练次数的增加
三个特征的损失都会趋于一个稳定的状态且融合后的特征的损失最小,时域和频
域的损失也基本是一样。再对比三者的识别率,随着迭代次数的不断增加,其识
别率也在逐渐上升直到趋于一个平稳的状态,最终融合后特征的识别率最高达到
了 97.38%。

图 4.12 DNN 分类器摆动后期的损失和识别率


图 4.12 可以看出,DNN 分类器下的摆动前期的损失和识别率,初始时融合
特征的损失值是最大的,时域和频域下的损失基本一样大,随着训练次数的增加
三个特征的损失都会趋于一个稳定的状态且融合后的特征的损失最小,时域和频
域的损失也基本是一样。再对比三者的识别率,随着迭代次数的不断增加,其识
别率也在逐渐上升直到趋于一个平稳的状态,最终融合后特征的识别率达到了最
高为 95.89%。
由图 4.9-4.12 可以看出,相同的迭代次数下,不同时期的损失和识别性能各
不相同,支撑前期的损失最小,且识别效果更好,但是不论哪个时期时,融合特
征下的最大特征量损失最小,识别率最好。所以增加数据量可以缓解模型过拟合
问题。DNN 也有不足,当训练迭代次数过少时会导致模型无法收敛从而会产生

35
杭州电子科技大学硕士学位论文

过拟合现象,因此需要大量的迭代次数去保证模型的准确性,所以最终的训练时
间也远超过其他两种传统的算法 [79]。但是最终结果发现随着训练样本维数的扩
大,DNN 模型所训练出的识别率也在提升。
(2) 不同时期 DNN 模型不同的损失
在本实验中,我们计算了 DNN 分类器不同模型的验证损失和识别率。一个
完全连接的前馈架构,包括三个隐含层。输入层中的单位数等于提取的样本特
征,并且输出层的大小等于类数(即 5 个不同的步态周期)。我们使用了 Relu 激活
函数,因为 Relu 中的非线性能更好优化的深度网络,学习速度更快。为了防止
过度拟合,我们采用了 dropout 层,以摆动后期为例,如图 4.13 所示。

图 4.13 DNN 模型不同的损失和识别率


Dropout 为了防止过拟合而加入,通过在训练的过程中随机去丢掉一些神经
元,这样可以让模型更稳定。根据图 4.13 可知,在前 400 迭代时,有 dropout 层
和没有 dropout 层的识别率基本一样,但随着迭代次数的增加,模型容易产生过
拟合,随着训练的进行,其拟合能力逐渐增强,变差逐渐减小,因此当达到一定
的迭代次数时加入 dropout 层能更好的避免过拟合,使其识别率提升。从图 4.13
中可以看出,如果不加入 dropout 层,训练样本过少时则会出现过拟合,其识别
率只有 94.76%。当加入 dropout 层之后,其识别率达到了 96.59%,因此表明 dropout
层能够缓解一定的过拟合问题。而对于损失而言,前 200 次迭代时损失跨度较
大,200-1000 次迭代损失趋于一个平稳的状态。含有 dropout 层的最终损失小于
没有 dropout 层的。
(3) 分析不同步态时期的调和平均数。
表 4.8 比较了 5 种不同步态时期的精确率、召回率、以及调和平均数。精确
率和召回率这是两个之间互相影响的指标,一般情况下两者的值都很高,但是通
常情况下两者成反比,也就是精确率高,召回率就低,相反精确率低,召回率就
高,在本实验中,精确率就是计算的识别率。调和平均数对于正确分类每个类别
都同样重要,并且我们同时考虑了精度和召回的重要性。因此,它可以用作性能

36
杭州电子科技大学硕士学位论文

指标的标准化度量。
表 4.8 特征组合下 DNN 的结果分析 (%)

步态阶段 精确率 召回率 调和平均数

支撑前期 0.9768 0.9846 0.9807


支撑中期 0.9501 0.9324 0.9414
支撑后期 0.9512 0.9486 0.9499
摆动前期 0.9738 0.9802 0.9770
摆动后期 0.9589 0.9536 0.9562

平均值 0.9620 0.9598 0.9610

图 4.14 DNN 分类器下三种结果


图 4.14 比较了五种不同的步态时期测试结果的精度,对召回率和调和平均
数得分提出的 DNN 算法进行对比。从表 4.7 中可以看出,对于 DNN 来说支撑前
期的调和平均数最高达到了 0.9807,比总体平均值高了 0.0209 个点,支撑中期
的调和平均数最低是 0.9324。调和平均数的大小取决于精确率和召回率的大小,
它们成正比比例。这对于正确分类每个类别同样重要,并且我们同时考虑精度和
召回的重要性。因此,它可以用作性能指标的标准化度量。
(4) 分析不同步态时期的标准差和方差的值。

37
杭州电子科技大学硕士学位论文

表 4.9 融合特征 DNN 分类器下的标准差(%)


步态阶段 标准差 方差
支撑前期 0.71 0.50
支撑中期 0.91 0.83
支撑后期 0.89 0.79
摆动前期 0.60 0.36
摆动后期 0.55 0.30
平均值 0.73 0.55

从表 4.9 的数据结果分析中可以看出,摆动后期的标准差是最小的,为 0.30,


而支撑中期的标准差最大,达到了 0.91,标准差越小,越稳定,所以摆动后期的
识别率是最稳定的,而支撑中期的浮动相比于其它四个时期是最大的。在本实验
中,从统计结果来看标准偏差,受试者之间的差异范围为 0.55%-0.91%,也证明
了所提出方法的鲁棒性和稳定性。
(5) 分析不同步态时期的交叉验证法。
交叉验证(Cross Validation)有效地避免过度学习,k 折交叉用于确定有效性和
结果的可靠性。因此 k 折交叉验证被广泛使用。在这个实验中,我们使用了 k 折
交叉验证,这是一种将所有样本随机分成大约 k 个的特殊原理。选择 k-1 个子
组进行训练,其余的用于测试,一个子组用于测试。继续接收副本作为新的测试
样本,剩余的 k-1 个副本将用作新的训练样本。重复这个过程,直到所有 k 个
样本都被用作实验样本,然后取所有认可结果的平均值作为分类整体性能[80]。k
的取值范围一般是大于等于 2,但通常是从 3 开始取。根据肌电信号的特征,我
们采用 3 折,4 折,5 折以及 10 折分别计算。比如对于采用 10 折交叉验证法,
我们一般将数据集随机分成 10 份,其中用 9 份进行训练剩下的 1 份用于测试,
然后随机使用不同的划分方法进行十次计算。交叉验证的识别率如图 4.15 所示。
100
3-fold
4-fold
98 5-fold
10-fold

96
识别率( %)

94

92

90

88
支撑前期 支撑中期 支撑后期 摆动前期 摆动后期

图 4.15 不同时期的交叉验证

38
杭州电子科技大学硕士学位论文

由图 4.15 可知,我们可以发现对于所有 k 折交叉,五个步态相位的准确性


验证显示出明显的区别。我们可以发现在这五个时期中,支撑前期最高,支撑中
期和支撑后期最低。另外,在末期期间,3 折、4 折和 5 折交叉验证在支撑前期
到支撑中期过渡中有很大的跳动,而对于 5 折则是在支撑后期到摆动前期中也有
很大的跳动。从识别结果来看,4 折交叉验证的识别结果是最差的且最不稳定,
10 折交叉验证的识别率相对于其它三个来说最好,因此从总体上来看 10 折交叉
验证的方法更稳定和可靠。因此,10 折交叉验证法更适合于本文提出的鉴定方
法。
综上所述,我们得出以下结论:
(1) 在计算时间方面。ELM 和 SVM 这两个传统的算法计算时间相差不大,
ELM 的计算时间相对快于 SVM 几秒左右,但是 DNN 的计算时间就相差太大,
因为 DNN 需要大量的迭代次数以达到模型的收敛,所以其计算时间较高。
(2) 在分类器性能方面,与 SVM 和 ELM 传统的算法相比,DNN 算法的识
别率在一定程度上会随着样本数量的增加而增加。但是,也出现了几个缺点。首
先,当特征样本维数较小时,DNN 方法的识别率低于 ELM。
(3) 在 DNN 指标性能方面,不同的模型影响 DNN 识别结果。因此,必须开
发一个好的模型,才能达到优良的识别效果。为了防止过拟合,我们使用了
dropout 层。与没有 dropout 层的模型相比,识别效率有了很大的提高。交叉验
证方法也可以避免过拟合。对于所提出的方法,10 折交叉验证的效果稳定可靠。
从标准差的计算结果来看,DNN 分类器具有一定的鲁棒性和稳定性。
4.5 本章小结
本章分别将时域、频域特征和时频域形成的组合特征输入到 SVM、ELM、
DNN 中进行分类识别,对比于两个时域、频域单特征,组合后的特征识别结果
要比单一特征下的时域、频域等特征的识别性能好,识别率更高。但是对于频域
特征下的识别结果进行分析时,由于样本数据量过小,DNN 分类器下的识别率
并不是最好的,但是当组成最大特征时,发现随着训练数据量的增加,DNN 分
类器下所获得的识别结果也随之提高并达到了最高,其最终结果比传统的 ELM
和 SVM 要好。但是 DNN 也有不足之处,第一:如果网络层数设置过高,其识
别的结果并不是最好的,因此选择一个合适的层数至关重要。第二:由于 DNN
算法需要大量的迭代训练,所以 DNN 算法的总的计算时间要远远超过 SVM 和
ELM 这两个传统算法的计算时间。

39
杭州电子科技大学硕士学位论文

第 5 章 基于 CNN-LSTM 优化算法的步态识别

对采集到的人体下肢 sEMG 信号进行步态识别研究时,在进行消噪和特征


提取后获得的特征的基础上,怎样去提高不同算法下的识别率至关重要。本章采
用 DNN、LSTM 及 CNN-LSTM 等方法作为特征分类器,在不同的特征样本下对
比这三种分类器下的不同步态时期的分类识别效果及稳定性能。
5.1 优化算法描述
所谓优化算法主要针对算法的识别性、稳定性、时间复杂度等分类性能进行
优化,本章需要优化的算法是长短期记忆网络(LSTM),通过在长短期记忆网络
的基础上增加了一维卷积层,采用 CNN 层替代全连接层,参数更少,提取到的
特征包含的信息更丰富,同时保持了数据的时序性不被破坏,再经过 LSTM 层
进行训练,使识别效果更好,在提高识别精度的同时,还能改善识别性能的稳定
性。
5.2 优化算法模型
5.2.1 长短期记忆网络模型
LSTM 是 RNN 的一种变体,但其存在递归反馈的问题,为了克服此现象[81],
提出了一种先进的 LSTM 结构,LSTM 是在 RNN 的基础上由霍克里特尔和斯密
德胡贝尔发明的[82]。LSTM 是指通过引入门机制来有效的管理信号的流动过程。
和单纯的 RNN 神经元网络一样,LSTM 神经元拥有复杂的门控制系统,并使用
受输入门、遗忘门和输出门所限制的记忆细胞储存并传递最多的信号。LSTM 中
的隐藏层包含一系列多重链接的障碍,称为记忆障碍。每个存储块中都存在输
入、输出和遗忘门以及一个或多个连接的重复元素。如图 5.1 所示。
ht

ct −1 ct

tanh
ft
it ct
  tanh ot 
wf wi wc wo

ht −1 ht

xt

图 5.1 一个存储单元的 LSTM 存储块的完整结构

40
杭州电子科技大学硕士学位论文

LSTM 的每个模块具有保存 t 时刻 ct 的记忆单元.模块的输出 ht 如式(5.1)所示:


ht = ot tanh(ct ) (5.1)
其中 ot 是当前输入 xt 和神经元信息 ht −1 的输出门。
ot = ( wo xt + uo ht −1 + bo ) (5.2)
其中   (0,1) 是 sigmoid 函数, wo 代表输入权重, u o 是循环权重, bo 是偏差。
记忆单元 ct 的状态信息通过遗忘部分记忆单元和添加新的记忆单元 c°t 来进行更
新:
ct = f t ct −1 + it c°t (5.3)
c°t = tanh( wc xt + uc ht −1 + bc ) (5.4)
f t 是时间 t 内的遗忘门单元,it 是输入门单元。wc 代表输入权重,u c 是循环权重,
bc 是偏差。记忆单元的内容由遗忘门 f t 进行调整,并且新的记忆单元的内容被添
加到记忆单元的程度由输入门 it 进行调整,其计算式为:
 ft = ( w f xt + u f ht −1 + b f )
 (5.5)
it = ( wi xt + ui ht −1 + bi )
其中, xt 为肌电信号的特征值, w f ,wi 代表输入权重,u f ,ui 是循环权重,b f bi
是偏差。
5.2.2 卷积神经网络
卷积神经网络(CNN)是多层前馈神经网络(或称为多层感知器(MLP)的变
体,其在语言处理、图像共享等方面有很好的应用,是当今热门的深度学习的一
个方法,在语音处理、图像共享等应用领域中有广泛的应用。CNN[83]模块主要
由输入、隐含和输出层这三部分组成。隐含层主要由卷积计算层和池化层构成。
卷积计算层的主要功能是自动地从输入数据中去除特性,并把新获得的特性作为
下一级的输入,而卷积计算层和池化层则通常是在网络中交替排列,直到获得可
以对其进行细分的更高级特性。通过自定义设计的数据处理层,卷积层和池化层
过滤输入数据并提取有用的特征,池化层的作用是过滤特征,选择最有代表性的
特征。池化层可以减少模型的计算量,从而加快整个模型的训练速度,进一步提
高所采取的特征。网络模型可以直接改变肌电信号这个特征作为输入,简化了第
一阶段的预处理过程,卷积神经网络的结构如图 5.2 所示。

sEMG singal

输出

一维卷积
池化处理

图 5.2 卷积神经结构图

41
杭州电子科技大学硕士学位论文

5.2.3 CNN-LSTM 模型
CNN 模型能够在卷积层通过卷积核自动去除特征,不需要人工进行特征处
理,然后 CNN 自动去除特征后再在池化层里边对特征进行细化,从而保留 sEMG
信号中的重要数据信息。但是,由于 CNN 内核卷积的存在限制了其在处理串行
信号数据时的“长期依赖问题”。LSTM 不同于传统的 RNN 输入门系统,细胞
单元能够捕获时间信号前后的相关通信。本研究使用的 sEMG 号是一种一维的
时序信号。因此,在本文中,我们采用 CNN-LSTM 网络来训练下肢步态的模型,
如图 5.3 所示。
图 5.3 的 CNN-LSTM 网络结构中,输入层是对采集到的下肢 sEMG 信号,
提取的时域、频域等特征,根据实验中数据维度和数据量的大小,隐含层设置三
层 CNN,包含卷积层和池化层,卷积层中卷积函数中的参数 SAME 是为了让卷
积后的数据维度保持不变。全连接层采用 CNN 层替代,具有参数更少,提取到
的特征包含的信息更丰富等优点,同时保持了数据的时序性不被破坏,再经过
LSTM 层进行训练,最后通过一层全连接层得到输出,同时设置 Dropout 层避免
过拟合,并采用 Softmax 函数,最终输出得到五个不同时取下的识别结果。

支撑前期

支撑中期
Softmax层
全连接层
Droupout层

卷 池 卷 池 卷 池 LSTM层
积 化 积 化 积 化
层 层 层 层 层 层

sEMG singal
摆动后期

图 5.3 CNN-LSTM 结构模型


5.2.4 网络结构参数的选择
本次试验共采用输入层和 3 层卷积、3 层池化、1层 LSTM 和 1 层全连接
层组成,输入 LSTM 层里面有 5 个节点,它们分别是提取到的 sEMG 信号的时
域和频域特征,同时在卷积层里设置卷积核,第一层是 32,第二层是第一层的
二倍是 64,第三层是第二层的二倍是 128,卷积大小都是 1*3,池化层大小都是
1*2,池化层主要是降低模型的复杂度,最后加入一个全连接层,主要是用来完
成最后的 5 个不同步态时期下的分类,设置训练次数为 1000 次,一次训练 100
个数据,batchsize 的大小设置 50。训练集和测试集中的数据量分别占数据集的
70%和 30%。
5.3 识别结果与分析
5.3.1 特征类型对识别结果的影响
将时域特征(T),分别输入到 DNN、LSTM 和 CNN-LSTM 模型中进行分类

42
杭州电子科技大学硕士学位论文

识别,识别结果如下表 5.1 所示:


表 5.1 时域特征下不同的分类结果 (%)
分类器 支撑前期 支撑中期 支撑后期 摆动前期 摆动后期 平均识别率
DNN 95.69 96.68 93.85 97.37 95.01 95.72
LSTM 95.27 93.78 92.00 94.55 95.31 94.19
CNN-LSTM 99.02 97.17 96.55 97.31 97.10 96.70

图 5.4 时域特征下不同分类器的识别率
由表 5.1 可知,与 DNN 和 LSTM 相比,CNN-LSTM 的分类性能更好,平均
识别率最高为 96.70%,其中支撑前期的识别率最高达到了 99.02%,支撑后期的
识别率最低为 96.55%。并且 CNN-LSTM 与 LSTM 的识别率相比提高了 2.51%。
对于 DNN 而言,在摆动前期的识别率最高达到了 97.37%,支撑后期的识别率最
低为 93.85%。而 LSTM 中摆动后期的识别率最高为 95.31%,支撑后期的识别率
最低为 92.00%。CNN-LSTM 中后四个时期的识别率基本相差不大,但是摆动前
期达到了 99.02%。
将频域特征(F),分别输入到 DNN、LSTM 和 CNN-LSTM 模型中进行分类
识别,识别结果如下表 5.2 所示:
表 5.2 频域特征下不同的分类结果 (%)
分类器 支撑前期 支撑中期 支撑后期 摆动前期 摆动后期 平均识别率
DNN 94.91 96.50 94.62 94.66 94.54 95.08
LSTM 94.91 93.71 92.01 92.66 95.87 93.83
CNN-LSTM 96.18 96.39 95.65 96.25 96.00 96.10

43
杭州电子科技大学硕士学位论文

图 5.5 频域特征下不同分类器的识别率
由表 5.2 可知,与 DNN 和 LSTM 相比,CNN-LSTM 的分类性能更好,平均
识别率最高为 96.10%,其中支撑中期的识别率最高达到了 96.39%,支撑后期的
识别率最低为 95.65%。并且 CNN-LSTM 与 LSTM 的识别率相比提高了 2.27%。
对于 DNN 而言,在支撑中期的识别率最高为 96.50%,支撑后期的识别率最低为
94.54%。而 LSTM 摆动后期的识别率最高为 95.87%,支撑后期的识别率最低为
92.01%。且 CNN-LSTM 中五个时期的识别率基本相差不大。
从时域和频域这两个单一的特征来看,CNN-LSTM 的识别率相差不是太
大。但是时域特征下的识别率高于频域特征,是因为时域里面的特征数量较多,
随着特征类型的不断增多,各个时期下的步态模式识别精度也不断提高。因此,
接下来针对将本次研究所有特征进行组合,形成最大组合特征来进行讨论分析。
将时域、频域组合特征(T+F),输入到 DNN、LSTM 和 CNN-LSTM 模型中
进行分类识别,识别结果如下表 5.3 所示:
表 5.3 组合特征下不同的分类结果 (%)
分类器 支撑前期 支撑中期 支撑后期 摆动前期 摆动后期 平均识别率
DNN 97.68 95.01 95.12 97.38 95.89 96.20
LSTM 98.72 94.85 94.05 95.79 96.80 96.04
CNN-LSTM 99.25 95.88 95.70 97.75 97.86 97.29

44
杭州电子科技大学硕士学位论文

图 5.6 组合特征下不同分类器的识别率
由表 5.3 可知,与 DNN 和 LSTM 相比,CNN-LSTM 的分类性能更好,平均
识别率最高为 97.29%,其中支撑前期的识别率最高达到了 99.25%,支撑后期的
识别率最低为 95.70%。并且 CNN-LSTM 与 LSTM 的识别率相比提高了 1.25%。
对于 DNN 而言,在支撑前期的识别率最高为 97.68%,支撑中期的识别率最低
为 95.01%。而 LSTM 支撑前期的识别率最高为 98.72%,支撑后期的识别率最低
为 94.05%。并且组合特征下的 DNN、LSTM、CNN-LSTM 的平均识别率都分别
比单一特征下的识别率高。表明了特征组合形成的最大样本特征提高了算法的识
别精度。

图 5.7 三种特征下 CNN-LSTM 不同时期的识别率

从表 5.3 和图 5.7 中,我们发现组合特征下的 CNN-LSTM 识别率是最高的,

45
杭州电子科技大学硕士学位论文

DNN 和 LSTM 基本相当。


5.3.2 方差和标准差分析
图 5.7 表明特征组合下的识别率达到了最高,因此针对特征组合下这三种方
法的稳定性问题[61],引入了标准差和方差等指标,通过对比这三种算法的两个
指标来判断稳定性,接下来围绕特征组合下 DNN、LSTM、CNN-LSTM 讨论方
差和标准差。

表 5.4 组合特征下 DNN 分类器下的标准差 (%)


步态阶段 标准差 方差
支撑前期 0.71 0.50
支撑中期 0.91 0.83
支撑后期 0.89 0.79
摆动前期 0.60 0.36
摆动后期 0.55 0.30
平均值 0.73 0.55

表 5.5 组合特征下 LSTM 分类器下的标准差 (%)

步态阶段 标准差 方差
支撑前期 0.73 0.53
支撑中期 0.92 0.84
支撑后期 0.98 0.96
摆动前期 0.69 0.47
摆动后期 0.53 0.28
平均值 0.77 0.61

表 5.6 组合特征下 CNN-LSTM 分类器下的标准差 (%)

步态阶段 标准差 方差

支撑前期 0.61 0.37


支撑中期 0.84 0.71
支撑后期 0.86 0.74
摆动前期 0.50 0.25
摆动后期 0.48 0.23
平均值 0.66 0.46

对比了 DNN、LSTM、CNN-LSTM 这三种算法的标准差和方差,结合表


5.4-5.6 的数据,我们可以看出,这三个算法中 CNN-LSTM 的方差和标准差最小,
LSTM 的方差和标准差最大,说明 CNN-LSTM 最稳定。DNN 中摆动后期的标准
差是最小的,为 0.55;而支撑中期的标准差最大,达到了 0.91。标准差越小,越

46
杭州电子科技大学硕士学位论文

稳定,所以摆动后期的识别率是最稳定的,而支撑中期的浮动相比于其它四个时
期是最大的。LSTM 摆动后期的标准差是最小的,为 0.53;支撑中期的标准差最
大,达到了 0.98;而 CNN-LSTM 摆动后期的标准差是最小的,为 0.23;而支撑
后期的标准差最大,达到了 0.74。所以摆动后期的识别率是最稳定的,而支撑中
期的浮动相比于其它四个时期是最大的。相比于 DNN 和 LSTM,CNN-LSTM 无
论是标准差还是方差都比 LSTM 小,标准差越小,越稳定。而在本实验中,从
统计结果来看标准偏差,采用 CNN-LSTM 模型的受试者之间的差异范围为
0.48%-0.86%,总体来说还是相对稳定的这也证明了所提出方法的鲁棒性和稳定
性。
(1)在计算时间上,DNN、LSTM 与 CNN-LSTM 差别不大,但在识别率
上,CNN-LSTM 的识别率更高。当形成最大组合特征时,CNN-LSTM 的平均识
别率为 97.29%,比 LSTM 高了 1.25%。
(2) 在标准差和方差上, CNN-LSTM 模型稳定性比 DNN 和 LSTM 的模
型高。这也表明了 CNN-LSTM 模型的优势。
(3)无论是 DNN、LSTM 还是 CNN-LSTM 方法,其识别率都呈现了不同
的结果对比。但是也存在一些不足,本文中存在数据样本量较少的问题,因此不
太适合进行深层网络训练[48]。DNN 和 LSTM 相比于传统的 SVM 和 ELM,其也
有缺点,深度学习网络需要大量的训练次数以达到模型的收敛,所以其最终训练
的总的时间要远远超过传统的算法的时间。但是,随着样本数据量的增加,DNN
和 LSTM 的识别率也逐渐增加,这也是以后研究的重点方向,尤其是在针对大
数据的处理方面。
根据以上不同的特征下的识别结果,相较于单一特征下的时域、频域等方
法,通过多特征融合下并与 CNN-LSTM 分类器结合的分类模型,在提高了识别
率的同时,也保持了一定的稳定性。
5.4 本章小结
本章首先在特征样本的选择上,通过单一特征方法下得到信号的时域特征,
以及频域特征,将两类特征进行组合并处理,其识别结果优于其它两个单类特征
样本。其次,在分类器的选择上,采用深度学习里的 DNN 和 LSTM 与 CNN-LSTM
算法进行比较,通过在长短期记忆网络的基础上增加了一维卷积层,采用 CNN
层替代全连接层,参数更少,提取到的特征包含的信息更丰富,同时保持了数据
的时序性不被破坏,从而再经过 LSTM 层进行训练,实验结果表明优化后的
CNN-LSTM 用于 sEMG 信号的步态识别无论是识别率还是标准差都比 DNN 和
LSTM 好,在提高识别精度的同时,还能改善识别性能的稳定性。

47
杭州电子科技大学硕士学位论文

第 6 章 总结与展望

6.1 研究总结
步态是生理上的一种运动状态,主要通过下肢的肌肉-关节-骨骼等共同作用运作,
步态运动中的 sEMG 信号可以通过多种方法采集到,尤其利用传感器最为方便,从而
可以通过采集到的 sEMG 信号进行步态划分和识别等相关的研究。本文在对下肢步态
识别的研究中,主要分为了四个步骤:步态下 sEMG 信号的获取、信号消噪及特征提
取、不同分类器的步态识别以及优化算法的识别研究。本文的主要研究成果有:
(1)sEMG 信号的采集和特征提取。根据人体步态运动时的行为特征,并依据
步态运动特点设计了实验方案,完成实验的数据采集,根据步态模式进行步态划分,
然后通过三种消噪对比方法,对采集到的信号进行消噪,最后对消噪后的信号进行时
域(MAV、VAR、ZC),频域(MPF、MF)等特征提取,并对提取到的特征进行分析,结
果表明不同的特征具有不同的差异性。
(2)基于特征组合的 DNN 算法步态识别。在传统 ELM 和 SVM 这两个算法的
基础上引入了深度学习算法:DNN,通过对比 SVM、ELM、DNN 三种模型下五个步
态时期的时域和频域特征下的识别率,发现在频域特征下,由于提取的特征数据量不
是太大,因此 DNN 的识别结果并不是最好的,接下来将两个单一特征进行融合形成
最大的特征,然后对组合特征下三种模型进行了分析,结果表明,组合特征下 DNN
模型的识别效果最好。
(3)基于 CNN-LSTM 优化算法的步态识别。引入了 LSTM 算法,为了提高算法
的识别率,对 LSTM 算法采用 CNN 进行了优化,对于 DNN、CNN、CNN-LSTM 的
识别率分析,对比了各单类特征和组合特征下的优化前后的结果,结果表明优化后的
CNN-LSTM 的识别结果高于 LSTM 和 DNN 的识别结果,。接着针对组合特征下三种
模型的稳定性,对标准差和方差指标进行了分析,最终结果表明无论在识别率还是稳
定性上 CNN-LSTM 都具有较好的效果。
6.2 研究展望
本文通过采集人体下行走运动时的 sEMG 信号,分析下肢运动过程中的步态的识
别率和稳定性。目前虽然已经有了一定的研究进展,但是由于实验设备和时间的限制,
对后续工作也进行了一定的拓展。
(1) 研究对象的多样性。本文对实验者人群只分析了正常人的步态,为了达到广
泛性,应该增加实验中人群的多样性,如下肢残疾以及中风患者等。信息来源的多类
性。目前下肢步态识别的信息研究都来自于传感器计采集到的下肢 sEMG 信号,并不

48
杭州电子科技大学硕士学位论文

能直观地描述步态。可结合视频、sEMG 信号、加速度等多种信息,来探究多源信息
下的步态识别。
(2) 基于大数据的分析研究。作为探索性研究,本文的实验数据量有限,后续若
条件具备时,可对通过社区、医院等获取的大数据进行分析,以更好地发挥深度学习
方法的性能和优势。

49
杭州电子科技大学硕士学位论文

致谢

故事的开头始于 2019 年秋,止于 2022 年夏,三年研究生生涯,说长不长说短也


不短。回首过往,得良师、觅益友、寻知己,目光所及,皆是回忆,在这个充满青春
活力的校园里,有欢笑、快乐、伤心、遗憾,回顾我的三年研究生学习生涯,不论对
于各类学科竞赛的积极参加,还是在科研方面发表高水平的论文,这些经历都让我懂
得,对待学习要怀有敬畏之心,对待生活要充满自信,竭尽全力去做好每一件事情,
成功的背后离不开辛勤的劳作。虽然即将离开这个充满回忆的地方,纵然心里万分不
舍,但还是要说再见。故事即将结束,但也是另一个全新的开始。
首先在这里感谢我的导师,高老师工作非常认真,从第一篇论文开始,就认真细
心的指导我怎么修改,从定稿到投稿,高老师每一步都很认真的指导我,给我们出去
开会的机会,进行学术交流,虽然这三年中,我也犯过一些错误,但是高老师都耐心
及时的帮我更正,正是在高老师这种严谨、认真的工作态度下,我才之所以能取得这
么多的成果,而且无论是在科研方面、竞赛上还是生活上,高老师都时刻关心着我们,
因此,在这里真诚的感谢高老师这三年来对我的教诲和帮助。
平生觅知己、芳草寸悠悠,感谢我人生中的知已,我们一起走过懵懂的高中岁月,
一起走过枯燥乏味的周补生涯,我本是一个内向的人,不喜欢交流,是你们带给了自
信和快乐,是你们陪伴我,鼓励我,帮助我走过了那段岁月,我们一起走过了第一个
十年,我相信接下来的第二个、第三个十年我们依旧会一起走过,感谢你们一路的陪
伴,让我感到温暖,感谢你们这么多年来对我的照顾。感谢我的本科舍友。感谢你们
四年来对我的照顾、理解和帮助,让我四年的本科生涯充实而有趣。感谢陪我共同走
过研究生三年的舍友,感谢你们这三年来的风雨陪伴。感谢我的同门和师兄师姐们师
弟等对我科研上的帮助。
感谢我的父母这么多年来对我的默默支持和理解,他们把最好的都给了我,感谢
你们在我想要放弃的时候,支持我,二十六载求学之路,父母之恩,无以为报,虽然
他们只是普普通通的父母,但是在我心里,他们就是我的一束光照亮我回家的,他们
永远是我的避风港,而我唯有不断努力,成为他们的骄傲。
最后,感谢国家,感谢党!

50
杭州电子科技大学硕士学位论文

参考文献

[1] 柴艳妹, 夏天, 韩文英, 等. 步态识别研究进展[J]. 计算机科学, 2012, 39(6):


10-15.
[2] Ryu J, Lee B H, Kim D H. sEMG signal-based lower limb human motion detection
using a top and slope feature extraction algorithm[J]. IEEE Signal Processing Letters,
2017, 24(7): 929-932.
[3] Lam T H W, Lee R S T, Zhang D. Human gait recognition by the fusion of motion and
static spatio-temporal templates[J]. Pattern Recognition, 2007, 40(9): 2563-2573.
[4] Mickelborough J, Linden M, Richards J, et al. Validity and reliability of a kinematic
protocol for determining foot contact events[J]. Gait & Posture, 2000, 11(1): 32-37.
[5] Alaqtash M, Yu H, Brower R, et al. Application of wearable sensors for human gait
analysis using fuzzy computational algorithm[J]. Engineering Applications of
Artificial Intelligence, 2011, 24(6): 1018-1025.
[6] 韦启航, 卢世壁. 人体步态分析系统:足底压力测量系统的研制[J]. 中国生物医学
工程学报, 2000, 19(1): 32-40.
[7] 郭忠武, 王广志, 刘永斌, 等. 基于数字视频和数字图像处理的步态分析系统[J].
航天医学与医学工程, 2002, 15(2): 122-126.
[8] Choudhury S D, Tjahjadi T. Robust view-invariant multiscale gait recognition[J].
Pattern Recognition, 2015, 48(3): 798-811.
[9] Caderby T, Yiou E, Peyrot N, et al. Detection of swing heel-off event in gait initiation
using force-plate data[J]. Gait & Posture, 2013, 37(3): 463-466.
[10] Taborri J, Palermo E, Rossi S, et al. Gait partitioning methods: A Systematic
Review[J]. Sensors, 2016, 16(1): 1-20.
[11] O'connor C M, Thorpe S K, O'malley M J, et al. Automatic detection of gait events
using kinematic data[J]. Gait & Posture, 2007, 25(3): 469-474.
[12] 张珊珊, 吴文, 李婷婷, 等. 表面电极与单极针电极采集胫前肌电信号的相关性
研究[J]. 中国运动医学杂志, 2019, 38(5): 358-363.
[13] 吴志文, 李晓欧. 基于无线表面肌电信号采集的上肢动作识别[J]. 北京生物医学
工程, 2016(6): 593-598.
[14] 杨基海, 周平, 章劲松, 等. 利用小波变换去除针电极肌电信号噪声的实验研究
[J]. 生物医学工程学杂志, 2000, 17(1): 44-46.
[15] 徐超立, 林科, 杨晨, 等. 基于小腿表面肌电的智能机器人协同控制方法[J]. 中国

51
杭州电子科技大学硕士学位论文

生物医学工程学报, 2016, 35(4): 385-393.


[16] 薛召军, 靳静娜, 明东, 等. 步态识别研究现状与进展[J]. 生物医学工程学杂志,
2008, 25(5): 1217-1221.
[17] Wei P-N, Xie R, Tang R, et al. sEMG based gait phase recognition for children with
spastic cerebral palsy[J]. Annals of Biomedical Engineering: The Journal of the
Biomedical Engineering Society, 2019, 47(1): 223-230.
[18] 郭忠武, 丁海曙, 王广志, 等. 基于运动学和动力学参数的步态识别研究[J]. 生物
医学工程学杂志, 2005(1): 1-4.
[19] Ryu J, Kim D H. Real-Time gait subphase detection using an EMG signal graph
matching (ESGM) algorithm based on EMG signals[J]. Expert Systems with
Applications, 2017, 85(1): 357-365.
[20] Xi X G, Zhu H G, Luo Z Z. De-noising method of the sEMG based on EEMD and
second generation wavelet transform[J]. Chinese Journal of Sensors and Actuators,
2012, 25(11): 1488-1493.
[21] 杨基海, 周平, 章劲松, 等. 利用小波变换去除针电极肌电信号噪声的实验研究
[J]. 生物医学工程学杂志, 2000, 17(1): 44-46.
[22] Chan F H Y, Wu B M, Lam E K, et al. Multiscale characterization of chronobiological
signals based on the discrete wavelet transform[J]. Biomedical Engineering IEEE
Transactions on, 2000, 47(1): 88-95.
[23] Donoho D L. De-noising by soft-thresholding[J]. IEEE Transactions on Information
Theory, 2002, 41(3): 613-627.
[24] 娄智, 邓浩, 陈香, 等. 基于自适应阈值处理的表面肌电信号小波去噪研究[J]. 生
物医学工程学杂志, 2014, 31(4): 723-728.
[25] 罗志增, 沈寒霄. 基于 Hermite 插值的小波模极大值重构滤波的肌电信号消噪方
法[J]. 电子与信息学报, 2009, 31(4): 857-860.
[26] Richman J S, Randall M J. Physiological time-series analysis using approximate
entropy and sample entropy[J]. American Journal of Physiology Heart & Circulatory
Physiology, 2000, 278(6): 2039-2049.
[27] Tkach D, Huang H, Kuiken T A. Study of stability of time-domain features for
electromyographic pattern recognition[J]. Journal of NeuroEngineering and Rehab
ilitation, 2010, 7(1): 21-34.
[28] Boostani R, Moradi M H. Evaluation of the forearm EMG signal features for the
control of a prosthetic hand[J]. Physiological Measurement, 2003, 24(2): 309-319.
[29] Zardoshti-Kermani M, Wheeler B C, Badie K, et al. EMG feature evaluation for
movement control of upper extremity prostheses[J]. IEEE Transaction Rehabilitation
52
杭州电子科技大学硕士学位论文

Engineering, 1995, 3(4): 324-333.


[30] Phinyomark A, Quaine F, Charbonnier S. EMG feature evaluation for improving
myoelectric pattern recognition robustness[J]. Expert Systems with Applications, 2013,
40(12): 4832-4840.
[31] 罗志增, 王人成. 基于表面肌电信号的前臂手部多运动模式识别[J]. 仪器仪表学
报, 2006, 27(9): 996-999.
[32] 宋方禹, 刘烨辉, 朱立华, 等. 基于小波变换的肌肉疲劳表面肌电信号特征提取
的研究[J]. 生物医学工程研究, 2019, 38(1): 86-89.
[33] 魏鹏娜, 李创, 唐荣年. 用于脑瘫儿下肢康复装置的表面肌电信号特征提取方法
研究[J]. 生物医学工程研究, 2017, 36(3): 229-233.
[34] Sbriccoli P, Bazzucchi I, Rosponi A, et al. Amplitude and spectral characteristics of
biceps brachii sEMG depend upon speed of isometric force generation[J]. Journal of
Electromyography & Kinesiology, 2003, 13(2): 139-147 .
[35] Pancholi S, Joshi A M. Portable EMG data acquisition module for upper limb
prosthesis application[J]. IEEE Sensors Journal, 2018, 18(8): 3436-3443.
[36] Cortes C, Vapnik V N. Support-vector networks[J]. Machine Learning, 1995, 20(3):
273-297.
[37] Huang G B, Siew C K. Extreme learning machine: RBF network case[M]. 2004 8th
International Conference on Control, Automation, Robotics and Vision (ICARCV),
Kunming, China. 2004: 1029-1036.
[38] Dhindsa I S, Agarwal R, Ryait H S. Performance evaluation of various classifiers for
predicting knee angle from electromyography signals[J]. Expert Systems, 2019, 36(3):
1-14.
[39] Xi X G, Tang M Y, Miran S M, et al. Evaluation of feature extraction and recognition
for activity monitoring and fall detection based on wearable sEMG sensors[J]. Sensors,
2017, 17(6): 1229-1249
[40] 席旭刚, 汤敏彦, 张自豪, 等. 融合表面肌电和加速度信号的下肢运动模式识别
研究[J]. 电子学报, 2017, 45(11): 2735-2741.
[41] Athavale V A, Gupta S C, Kumar D, et al. Human action recognition using CNN-SVM
model[J]. Advances in Science and Technology, 2021, 105: 282-290.
[42] Castellini C, Smagt P V D. Surface EMG in advanced hand prosthetics[J]. Biological
Cybernetics, 2009, 100(1): 35-47.
[43] 马玉良, 马云鹏, 张启忠, 等. GA-BP 神经网络在下肢运动步态识别中的应用研
究[J]. 传感技术学报, 2013, 26(9): 1183-1187.
[44] Gao F R, Tian T X, Yao T, et al. Human gait recognition based on multiple feature
53
杭州电子科技大学硕士学位论文

combination and parameter optimization algorithms[J]. Computational Intelligence


and Neuroscience, 2021, 2021: 6693206.
[45] 高发荣, 王佳佳, 席旭刚, 等. 基于粒子群优化-支持向量机方法的下肢肌电信号
步态识别[J]. 电子与信息学报, 2015, 37(5): 1154-1159.
[46] Kuang Y X, Wu Q, Shao J K, et al. Extreme learning machine classification method
for lower limb movement recognition[J]. Cluster Computing-the Journal of Networks
Software Tools and Applications, 2017, 20(4): 3051-3059.
[47] Deng Y X, Gao F R, Chen H H. Angle estimation for knee joint movement based on
PCA-RELM algorithm[J]. Symmetry-Basel, 2020, 12(1): 130-151.
[48] Lecun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553): 436-444.
[49] Morbidoni C, Cucchiarelli A, Fioretti S, et al. A deep learning approach to EMG-based
classification of gait phases during level ground walking[J]. Electronics, 2019, 8(8):
894-912.
[50] Chen J, Zhang X, Cheng Y, et al. Surface EMG based continuous estimation of human
lower limb joint angles by using deep belief networks[J]. Biomedical Signal
Processing and Control, 2018, 40: 335-342.
[51] Suri K, Gupta R. Transfer learning for sEMG-based hand gesture classification using
deep learning in a master-slave architecture[C]. Delhi, India: 3rd International
Conference on Contemporary Computing and Informatics (IC3I), 2018: 178-183.
[52] Anand A, Samui B. An experimental study on upper limb position invariant EMG
signal classification based on deep neural network[J]. Biomedical Signal Processing
and Control, 2020, 55(1): 101669-101683.
[53] Kim J H, Hong G S, Kim B G, et al. deepGesture: Deep learning-based gesture
recognition scheme using motion Sensors[J]. Displays, 2018, 55(12): 38-45.
[54] Yao T, Gao F, Zhang Q, et al. Multi-feature gait recognition with DNN based on
sEMG signals[J]. Mathematical Biosciences and Engineering, 2021, 18(4): 3521-3542.
[55] Khushaba R N, Al-Ani A, Al-Timemy A, et al. A fusion of time-domain descriptors for
improved myoelectric hand control[C]. Athens, Greece: 2016 IEEE Symposium Series
on Computational Intelligence (SSCI), 2016: 1-6.
[56] Li T , Yang Y . Nuclear magnetic resonance spectrum aided diagnosis based on DNN
neural network[J]. Journal of Intelligent and Fuzzy Systems, 2021(1):1-11.
[57] Chuanjiang L, Jian R, Huaiqi H, et al. PCA and deep learning based myoelectric
grasping control of a prosthetic hand[J]. Biomedical Engineering Online, 2018, 17(1):
107-123.
[58] Gharehbaghi A, Linden M. A deep machine learning method for classifying cyclic
54
杭州电子科技大学硕士学位论文

time series of biological signals using time-growing neural network[J]. IEEE


Transactions on Neural Networks and Learning Systems, 2018, 29(9): 4102-4151.
[59] Duan N, Liu L-Z, Yu X-J, et al. Classification of multichannel surface-electrom
yography signals based on convolutional neural networks[J]. Journal of Industria
l Information Integration, 2019, 15: 201-206.
[60] Cté-Allard U, Fall C L, Drouin A, et al. Deep learning for electromyographic hand
gesture signal classification using transfer learning[J]. IEEE Transactions on Neural
Systems and Rehabilitation Engineering, 2019, 27(4): 760-771.
[61] Ma X, Liu Y, Song Q, et al. Continuous estimation of knee joint angle based on
surface electromyography using a long short-term memory neural network and
time-advanced feature[J]. Sensors, 2020, 20(17): 4966-4982.
[62] Wang C, Guo W, Zhang H, et al. sEMG-based continuous estimation of grasp
movements by long-short term memory network[J]. Biomedical Signal Processing and
Control, 2020, 59: 1017-1034.
[63] Bao T, Zaidi S, Xie S, et al. A CNN-LSTM hybrid model for wrist kinematics
estimation using surface electromyography[J]. IEEE Transactions on Instrumentation
and Measurement, 2020, 70: 1-9.
[64] Vaughan C L, Davis B L, O'connor J C. Dynamics of human gait[J]. Human Kinetics
Publishers, 1999, 1(1): 2-20.
[65] Hudgins B , Parker P, Scott R N. A new strategy for multifunction myoelectric
control[J]. IEEE Transactions on Biomedical Engineering, 1993, 40(1): 82-94.
[66] Trappe T A , Burd N A , Louis E S , et al. Influence of concurrent exercise or nutrition
countermeasures on thigh and calf muscle size and function during 60 days of bed rest
in women[J]. Acta Physiologica, 2007, 191(2): 147-159.
[67] 张瑞红, 王人成, 金德闻, 等. 人体下肢表面肌电信号的检测与分析[J]. 清华大学
学报(自然科学版), 2000, 40(8): 73-76.
[68] 苏海龙, 张峻霞. 步态周期关键节点描述方法研究[J]. 信息系统工程, 2011(9):
122-124.
[69] Zhang X F, Sun S Q, Li C, et al. Impact of load variation on the accuracy of gait
recognition from surface EMG signals[J]. Applied Sciences-Basel, 2018, 8(9):
1462-1476.
[70] Phinyomark A, Phukpattaranont P, Limsakul C. Feature reduction and selection for
EMG signal classification[J]. Expert Systems with Applications, 2012, 39(8):
7420-7431.
[71] Shi Y, Zhang J, Jiao J, et al. Calibration analysis of high-g mems accelerometer sensor
55
杭州电子科技大学硕士学位论文

based onwavelet and wavelet packet denoising[J]. Sensors, 2021, 21(4): 1-15.
[72] Xu H, Sun S Z, Gui Z, et al. Detection of sub-seismic fault footprint from
signal-to-noise ratio based on wavelet modulus maximum in the tight reservoir[J].
Journal of Applied Geophysics, 2015, 114: 259-262.
[73] 李影. 基于 sEMG 的步态运动模式细分及其识别方法[D]. 杭州: 杭州电子科技大
学, 2018.
[74] Lekamalage C L , Yang Y , Huang G B, et al. Dimension reduction with extreme
learning machine[J]. IEEE Transactions on Image Processing, 2016, 25(8): 3906-3918.
[75] Shi J , Cai Y , Zhu J , et al. sEMG-based hand motion recognition using cumulative
residual entropy and extreme learning machine[J]. Medical and Biological
Engineering and Computing, 2013, 51(4): 417-427.
[76] Quitadamo L R , Cavrini F, Sbernini L, et al. Support vector machines to detect
physiological patterns for EEG and EMG-based human–computer interaction: a
review[J]. Journal of Neural Engineering, 2017, 14(1): 1741-2552.
[77] Hinton G E. Reducing the dimensionality of data with neural networks[J]. Science
(New York, NY), 2006, 5786(313): 504-507.
[78] Hinton G E, Osindero S, Teh Y W. A fast learning algorithm for deep belief nets[J].
Neural Computation, 2006, 18: 1527-1554.
[79] Szegedy C, Liu W, Jia Y, et al. Going deeper with convolutions[C]. Boston, MA, USA:
2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2015:
1-9.
[80] Kohavi R. A study of cross-validation and bootstrap for accuracy estimation and
model selection[C]. Quebec, Canada: Proceedings of the 14th international joint
conference on Artificial intelligence Montreal, 1995: 1137–1143.
[81] Bengio Y, Simard, P., Frasconi P. Learning long-term dependencies with gradient
descent is difficult[J]. Neural Networks IEEE Transactions on, 1994, 5(2): 157-166.
[82] Hochreiter S, Schmidhuber J. Long short-term memory[J]. Neural Computation, 1997,
9(8): 1735-1780.
[83] Asif A R, Waris A, Gilani S O, et al. Performance evaluation of convolutional neural
network for hand gesture recognition using EMG[J]. Sensors, 2020, 20(6): 1642-1655.

56
杭州电子科技大学硕士学位论文

附录

作者在读期间发表的学术论文及参加的科研项目
一、发表的学术论文
[1] Yao, Ting & Zhang, Qizhong & Qiuxuan, wu & Gao, Farong. Gait recognition based on
feature selection of sEMG signals using PCA-RELM method. 2020. 338-343.
[2] Yao T , Gao F , Zhang Q , et al. Multi-feature gait recognition with DNN based on
sEMG signals[J]. Mathematical biosciences and engineering: MBE, 2021,
18(4):3521-3542.
[3] Gao Farong et al. Human gait recognition based on multiple feature combination and
parameter optimization algorithms[J]. Computational Intelligence and Neuroscience,
2021, 6693206.
[4] 黎毅达, 高发荣, 姚婷,等. 基于 Fisher 判别和 GKF-RELM 算法的多特征步态模式
识别[J]. 电子学报, 2021, 49(10):9.

二、参加的科研项目
[1] 基于深度-迁移学习的人体行为建模与运动功能评价,浙江省自然科学基金
(LY20E050011).

三、获得的竞赛项目
[1] “兆易杯”第十五届中国研究生电子设计竞赛,华东赛区三等奖

57

You might also like