You are on page 1of 8

第36卷第 10期 计算机应用与软件 Vo

l36 No
.10
2019年 10月 Co
mput
erApp
lic
ati
onsa
ndSo
ft
war
e Oc
t.2019

Te
nso
rFl
ow中深度前馈网络优化研究及其轴承故障诊断应用
梁 昱1 李彬彬1 陈志高2 焦 斌1

(上海电机学院电气学院 上海 2
013
06)

(中核检修有限公司海盐分公司 浙江 嘉兴 3
143
00)

摘 要 目前在复杂系统的故障诊断中,故障特征与故障类型之间存在较强的非线性关系,且数据量较大,信
号处理复杂,诊断效率不高,而深度学习在特征提取与模式识别方面显示出巨大潜力。针对此问题提出基于深度
前馈网络的故障诊断模型,将其应用于复杂的轴承故障诊断。该方法直接将原始信号作为模型的输入特征量,然
后利用谷歌开源深度学习框架 Te
nso
rFl
ow建模,通过相关参数设置、梯度算法优化、正则化处理对网络进行优化
设计。构建上万的 9种轴承故障类型样本,确保样本多样性,提高网络鲁棒性,最终优化后的模型诊断准确率为
98.
96%。将该方法与多种传统的机器学习诊断方法进行比较,结果表明该方法能更有效地进行轴承故障诊断,
验证了模型的合理性和优越性。

关键词 深度前馈网络 参数选取 优化算法 Te


nso
rFl
ow 轴承故障诊断

中图分类号 TP183 文献标识码 A DOI


:10.
3969/
j.i
ssn.
1000
386x
.2019.
10.
031

OPTI
MIZATI
ONOFDEEPFEEDFORWARDNETWORK

NTENSORFLOW ANDITSAPPLI
CATI
ONOFBEARI
NG FAULTDI
AGNOSI

Li
angYu1 LiBi
nbn1
i Che
nZhi
ga2
o J
ia n1
oBi

(S
cho
olo
fEl
ect
ri
calEn
gin
eer
ing,S
han
gha
iDi
anj
iUn
ive
rsi
ty,S
han
gha
i20
130
6,Ch
ina)

(Ch
inaNu
cle
arI
ndu
str
yMa
int
ena
nceCo
.,L
td.Ha
iya
nBr
anc
h,J
iax
ing3
143
00,Zh
eji
ang,Ch
ina)

Abs
tra
ct Atpr
ese
nt,i
nth
efa
ultdi
agno
siso
fco
mpl
exs
yst
ems
,the
rei
sas
tr
ongno
nli
nea
rre
lat
io
nshi
pbe
twe
ent
he

aul
tch
ara
cte
ris
ti
csa
ndt
hef
aul
tty
pe.Du
etot
hebi
gamo
unto
fda
taa
ndt
hec
ompl
exs
igna
lpr
oce
ssi
ng,t
hee
ff
ic
ienc
yof
di
agno
sisi
sno
thi
gh,whi
let
hede
epl
ear
ningh
ass
howng
rea
tpo
tent
ia
linf
eat
uree
xtr
act
io
nandpa
tt
ernr
eco
gni
ti
on.We
pr
opo
sedaf
aul
tdi
agno
sismo
delb
ase
dond
eepf
eed
for
war
dne
two
rkf
ort
hispr
obl
em,whi
chwa
sappl
ie
dtoc
ompl
ex
be
ari
ngf
aul
tdi
agno
sis
.Wed
ire
ctl
yre
gar
dedt
heo
rig
ina
lsi
gna
last
hei
nputf
eat
ureo
fthemo
del
,andt
henus
edt
he
Go
ogl
eope
nso
urc
ede
epl
ear
nin
gfr
ame
wor
kTe
nso
rFl
owt
omo
dela
ndo
pti
miz
ethene
two
rkt
hro
ughr
ele
vantpa
rame
ter


ett
ing
,gr
adi
ento
pti
miz
ati
ona
lgo
rit
hma
ndr
egul
ari
zat
io
npr
oce
ssi
ng.Ni
neki
ndso
fbe
ari
ngf
aul
tsa
mpl
esbe
yond
10000,we
rebui
ltt
oens
ures
amp
ledi
ver
si
ty,i
mpr
ovene
two
rkr
obus
tne
ss.Thef
ina
lopt
imi
zedmo
deldi
agno
sisa
ccur
acy

s98.
96%.Thi
sme
tho
disc
omp
are
dwi
thma
nyt
radi
ti
ona
lma
chi
nel
ear
ningme
tho
ds,a
ndt
her
esul
tss
howt
hati
tca

di
agno
sebe
ari
ngf
aul
tmo
ree
ff
ect
iv
elya
ndv
eri
fyt
her
ati
ona
li
tya
nds
upe
rio
rit
yoft
hemo
del

Ke
ywor
ds De
epf
eedf
orwa
rdn
etwo
rk Pa
rame
ters
ele
cti
on Opt
imi
zat
io
nal
gor
it
hm Te
nso
rFl
ow Be
ari
ngf
aul

di
agno
sis

常运行极其重要,其中轴承作为其关键部件,一旦发生
0 引 言 故障,将对公司生产效益和人身安全产生很大的影响,
所以滚动轴承的运维和故障诊断技术极为重要 [1]。
在工业生产中,大型旋转机械设备安全可靠地正 深度学习是指一类机器学习技术,其深层体系结

收稿日期:
201
9-0
1-0
8。梁昱,硕士生,主研领域:电机故障诊断。李彬彬,讲师。陈志高,工程师。焦斌,教授。
176 计算机应用与软件 2019年

构中的多层信息非线性处理机制被用于模式分类以及
其他学习任务 [2],它强调多层和非线性。实际上,深度 1 深度前馈网络理论
学习起源于 Ar
ti
fi
ci
alNe
ura
lNe
two
rk的概念,所以深度
学习基本上就是指深层神经网络。 深度前馈网络应用在故障诊断方面,可以将其看
作是分类器,定义了一个映射集 y=f
(x,θ),输入 x通
谷歌公司的深度学习框架 Te
nso
rFl
ow是一个灵活
过相关参数 θ映射到一个输出类别 y

便利、功能强大的机器学习库,许多深度学习算法封装
于其中,用户只要将 Te
nso
rFl
ow导入到 Py
tho
n中调用
1.
1 参数初始化
就可以搭 建 各 种 网 络 模 型,极 大 方 便 了 深 度 学 习 的 深度前馈网络模型中参数 θ的学习算法是迭代
的,所以初始值(即迭代起点)对于迭代过程是否达到
研究 [3-4]。
局部最小、是否能够收敛到一个代价高或低的点以及
基于深度前馈网络,近年来,深度学习在机器学习
训练时间的大小关系密切,不合适的参数初始化方法
领域备受关注,在分类、预测、故障诊断等多领域取得
会降低梯度的学习优化效率和网络泛化能力 [12]。通
突破的成果。文献[5]中提出了 C
RF模型,把卷积神
常来说,需要初始化每个单元使其具有不同的初始参
经网络(CNN)提取到的特征输入随机森林(RF)中进
数,防止学习算法以相同的方式更新某两个单元,因此
行分类,实验结果表明该模型的分类效果和泛化能力
促使了参数的随机初始化。
比单独使用 RF有了很大的提高。文献[6]中提出构 通常情况下,可以为每个神经元除权值以外的参
建多层感知器(MLP)神经网络模型用于股票预测,并 数(如偏置值等)设置启发式挑选的常数,设置为 0或
将 Te
nso
rFl
ow与传统 BP神经网络进行性能对比,实验 0附近小的常数。而所有的权值则初始化为小的随机
结果说明 Te
nso
rFl
ow具有更好的预测准确度和更快的 数,可以在高斯分布中随机抽取。一般而言总是希望
收敛速度。文献[7-9]分别提出了基于短时傅里叶 神经元的输出值接近于零,尽可能保证参数 θ都能够
变换(S
TFT)、CNN、SDAE的电机故障诊断方法,并与 在其激活函数偏导数最大之处进行调整。因此在 Te
n
传统的故障诊断方法进行比较,实验结果表明,所提出 s
orFl
ow中权值初始化可以从截断正态分布中随机抽
方法能更好地实现感应电机故障诊断。文献[10]提 取,生成的值 w~N(μ,σ2),其中,μ=0,σ2 =1,如果 w
出了一种新的基于 Le
Net
5卷积网络的数据驱动故障 的取值在区间(μ-2σ,μ+2σ)之外则重新进行选择。
诊断方法,
1D信号转换成 2
D图像信号,提高了模型 由正态分布的“3σ”原则可知,区间(μ-2σ,μ+2σ)内
的特征提取能力,并应用于电机轴承、水泵、液压泵的 的面积为 95.
45%,这样保证权值 w都在均值 0附近。
故障诊断中,模型预测准确率都在 99%以上。 1.
2 非线性激活函数
深度学习取得重大成果的原因一方面在于计算机 非激活函数通常用于隐含层,完成信号的前向传
运算能力的提高和大数据的支持,另一方面是网络本 播。传统 Si
gmo
id和 Ta
nh函数 [13]大部分定义域内都
身结构和参数的合理设置与选择。合适的训练优化算 饱和,仅接近 0时它们才对输入强烈敏感,这种广泛饱
法、合理的参数设置和模型结构直接影响网络模型的 和性会造成梯度消失,并且不具有稀疏性。只有当合
泛化能力和准确性,有助于加快收敛速度防止过拟合。 适的代价函数来抵消饱和性时,它们作为输出单元可
因此,参数设置、优化算法和网络结构一直是深度学习 以与基于梯度的学习相兼容。
研究中的重点和难点 [1
1]
。 神经学家发现生物神经元的激活方式具有单侧抑
本文基于现代深度前馈神经网络的基本理论,对 制、兴奋边界宽阔以及输出具有稀疏性的特性。Re
LU

深层神经网络中的参数设置、优化算法、结构选择进行 函数 f
(x)=ma
x(x
,0),曲线如图 1所示。

深入研究,在 Te
nso
rFl
ow中建立最优深度前馈神经网
络模型。本文提出直接将原始振动信号作为模型的输
入,无需进行复杂的信号处理和故障特征提取。最后
结合美国西储大学滚动轴承方面的实验数据,将优化
的模型在电机轴承故障诊断领域中进行了验证,完成
9种不同工况下轴承的故障诊断,并和其他常用的机
器学习算法比较。 图 1 Re
LU激活函数曲线
第10期 梁昱等:Te
nso
rFl
ow中深度前馈网络优化研究及其轴承故障诊断应用 177

可以看出,Re
LU函数几乎是线性的,这使得只要 一个概率分布,将输出结果变成概率分布常用的方法
是处于激活状态,其导数都能保持较大,小于 0则没有 是用于 Mul
ti
noul
li输出分布的 So
ft
max单元。假设原
输出,因此它保留了许多使得线性模型易于使用基于 始的神经网络输出为 y
,那么经过 So
ft
max回归处理之
梯度的方法进行优化的属性,同时也符合生物神经元 后的输出为 [19]:
yi
单侧抑制和兴奋边界宽阔的特性,并且 Re
LU函数还 e
So
ftma
x )i =
(y n (3)
具有稀疏表达能力。因此,目前深度前馈网络、CNN、 yi


=1

RNN、LS
TM等主流深度学习模型的激活函数大多采
LU函数 [14-15]。文献[1
用 Re 6]表明 Re
LU函数在训 1.
5 结构设计
练正确率和网络收敛速度上均优于其他激活函数。 深度前馈网络的整体结构主要包括网络的深度和

1.
3 交叉熵损失函数 宽度。神经网络的万能近似定理表明 [20],即使网络只
有一个隐含层,但只要节点数足够多(网络足够宽)也
深度前馈网络模型效果及优化的目标是通过损失
能够在训练集上近似任何函数,而更深的网络则意味
函数来定义的,损失函数是模型对数据拟合程度的反
着每一层会使用较少的节点数,但缺点是网络过于复
映,拟合得越好,则值越小。常用的损失函数为:均方
杂难以优化,大大增加了参数训练的时间,所以模型性
差损 失 函 数 和 交 叉 熵 损 失 函 数。均 方 差 损 失 函 数
(MSE)直观意义是模型预测值和真值的欧氏距离,而 能提高优先考虑增加隐含层中的神经元数,其训练效

交叉熵损失函数(Cr
osse
ntr
opy
)如下: 果会比增加层数更容易观察和调整。结构设计可采用
如下方法:先设较少的节点数,然后逐渐增加节点数,
H(p
,q) =-∑ p
(x)l
ogq
(x) (1)
x 每次对网络进行训练并记录在验证集上表现的误差,
给定两个概率分布 p和 q
,交叉熵刻画了两个概率 直到满足要求即可。因此最优的深度前馈网络结构必
分布之间的距离,值越小则说明两者越接近。在决策 须通过大量实验来找到。
分类问题中使用比较广泛 [17]。在故障诊断中概率分
布p
i是真正的标签,给定分布 q
i是预测值。 2 深度前馈网络优化设计
基于统计学理论,现代深度前馈网络大多数都使
用最大似然原理来优化学习,即损失函数就是负的对
2.
1 梯度优化算法
数似然,它与交叉熵等价。损失函数表示为:
在参数的更新过程中,某些优化算法能根据模型
L(θ
)=-Ex,y~p
^da
ta
lo
gpmo
de(y|
l x) (2)
的参数和损失来优化模型。梯度下降法是最普遍的优

式中:p
daa为数据生成分布,
t 在统计学理论中,可以把训
化算法,它会沿逆梯度方向让超参数不断更新,使总损
练集和测试集样本看成是相互独立的,二者数据集是
失不断下降。优化损失函数 L(θ
)过程可以抽象为寻
同分布 的;E是 期 望。损 失 函 数 的 具 体 形 式 取 决 于
找一个参数 θ
,使得 L(θ
)最小,通过迭代的方法来不断

ogp
mode
l。
逼近最优解。一般来说,参数更新包含两种思路:更新
使用最大似然来导出损失函数的方法,一方面减
的方向和调整学习率。Te
nso
rFl
ow中常用的优化方法
轻了每个模型设计损失函数的负担,这样不用预测 y
有 [21-24]:更新方向算法,包括梯度下降法(GD)和动量
的完整概率分布,而是仅仅预测在 x条件下 y的某种
法(Mo
ment
um);自适应学习率调整(Ada
pti
vel
ear
nin

统计量,例如参数的点估计、偏差、方差,对于刻画泛

ate
)算法,包括 Ada
Gra
d算法、RMSPr
op算法、Ada
m算
化、过拟合等非常有帮助;另一方面负的对数似然在很
法。优化算法之间联系如图 2所示。
多模型中避免了激活函数梯度饱和(梯度消失)的问
题,损失函数取对数后可以消除某些输出单元中的指
数效果。这也是交叉熵损失函数比均方差损失函数更
受欢迎的原因之一 [18]。
1.
4 输出单元
神经网络的输出不一定是一个概率分布,但是在
电机故障诊断中可以把“一个样例属于某一个类别”
看成一个概率事件,那么训练数据的正确答案就符合 图 2 Te
nso
rFl
ow中各种优化算法关系图
178 计算机应用与软件 201
9年

由图 2可以看出,梯度下降对于神经网络而言,几 在机器学习中,过拟合现象被称为过度训练,本质是过
乎所有深度模型的迭代总是基于梯度来使得损失函数 于复杂的模型在学习中不知不觉中提取了一些残余变
下降,梯度下降可谓是训练的全部,最多也只是不断地 化(即随机干扰噪声),产生与特定数据集过于紧密或
研究出各式各样的梯度下降法的变体而已。 完全对应的分析,从而忽视了通用的趋势和整体的规
[2
5]
梯度下降法的缺点 :不能保证被优化的函数达 律,无法拟合其他数据或可靠地预测未来的观测结果。
到全局最优解,容易陷入局部极小值;计算时间长、收 而正则化是降低泛化误差,减小过拟合的一个有效手
敛速度慢,学习率无法自适应调整,在海量数据下,要 段,包括 L1、L2正则化以及最常用的 Dr
opo
ut。
计算所有训练数据的损失函数是非常消耗时间的。而 Dr
opo
ut的优点是计算方便,训练过程中会产生 n
[2
4]
Ada
m 算法是利用梯度一阶矩估计和二阶矩估计动 个随机二进制数与某些神经元相乘,从而依概率去掉
态调整每个参数的学习率,算法描述如表 1所示。 对应层的某些神经元,使得每次迭代中训练的都是一
表 1 Ada
m算法 个小的神经网络,如图 3所示 [26]。

全局学习率 η,默认 0. 00
1,初始参数
θ,用于数值稳定的小常数 δ ,矩估计
Re
qui
re 的指数衰减率 ρ 1和 ρ
2,默认分别为
0.9和 0.9
99,初始化一阶和二阶变
量以及时间 s=G=t=0

1 (i
) (i

m θ∑
计算梯度 g←  L(f
(x ;θ
),y )

图 3 Dr
opo
ut示意图
更新有偏一阶矩估计 s
←ρ1s+(1-ρ
1)g 文献[2
7]中显示,Dr
opo
ut比其他标准的计算开销

更新有偏二阶矩估计 G←ρ
2G+(1-ρ
2)g⊙g 小的正则化方法(如 L1,L2正则化)更有效,经过交叉
验证,k
eepp
rob率等于 0.5的时候效果最好,因为此
^ s
修正一阶估计偏差 s
← t 时 dr
opo
ut随机生成的网络结构最多。
1-ρ

Dr
opo
ut的另一个显著优点是降低了模型的计算
^ G
修正二阶估计偏差 G← t 复杂度,它一般不限制适用的模型或训练过程,基本在
1-ρ

所有使用分布式表示且用 SGD法训练的模型上都表
G 现良好,包括 RBM、CNN、RNN等网络模型。
计算参数更新 Δθ=η
δ+槡^
G 另一方面 Dr
opo
ut减少了模型的有效容量,为了弥

应用更新 补这种影响,必须扩大模型规模,所以当只有极少的训
←θ-Δθ
θ
练样本时,Dr
opo
ut不会很有效。文献[2
7]中还提到在
可以看出,Ada
m优化算法在于计算历史梯度衰减 少于 500
0的测试样本的 Al
te
rna
ti
veS
pli
ci
ngDa
ta上,
方式上,使用了类似动量的衰减方法,实质上就是带有 Ba
yes神经网络比 Dr
opo
ut表现得更好。所以至少要
动量项的 RMSPr
op。Ad
am将动量应用于缩放后的梯 在上万数据集上使用 Dr
opo
ut会比 L1和 L2的正则化
同时结合了 Ad
度, aGr
ad善于处理稀疏梯度和 RMS
Pro
p 方法更有效,最佳验证集的泛化误差会比较小。
善于处理非 平 稳 目 标 的 优 点,在 自 适 应 学 习 率 方 面
表现较好,适用于大多非凸优化,也适用于海量数据 3 实 验
和高维空间。因此 Ada
m算法是应用最广泛的、效果
最好的算法,它 高 效、稳 定,适 用 于 绝 大 多 数 的 应 用 深度前馈网络是在 Py
tho
n3.
6开发环境 S
pyde
r中
场景。 通过编程并调用开源的 Te
nso
rFl
ow库建立的。计算机
2.
2 正则化 I
处理器:nt
el(R)Co
re(TM)i
57
400CPU@ 3.
00GHz

深度学习中数学模型的设计要求不仅在训练集上 内存(RAM)为 8GB,操作系统 64位 Wi


ndo
ws。

表现好,而且能在新输入上泛化良好,许多策略被显示 3.
1 实验数据及预处理
地设计来减少测试误差,这些策略被统称为正则化。 本实验所运用的数据来自美国 Ca
seWe
ste
rnRe
ser
ve
第10期 梁昱等:Te
nso
rFl
ow中深度前馈网络优化研究及其轴承故障诊断应用 179

大学正常和故障滚动承故障测试数据。使用电火花加 动点,因此网络的输入样本为 412维的原始数据。为


工(EDM)对电机轴承的滚球、内滚道和外滚道引入不 了获得足够的训练样本和测试样本,并保证不重复抽
同直径的点蚀故障。故障规格如表 2所示。 样,采用连续抽样的截取方法来获取样本,并设定一定
表 2 轴承故障规格 的抽样步长。本实验设置抽样步长为 412,标签 0~9
故障位置 故障直径 /
inc
h 相关说明 分别代表正常信号和 9种故障信号,从每种信号中随
0.
007 机抽样获得 50
00个样本,加上标签最终得到 5
000
0×
Ba
ll 0.
014 (412+1)的矩阵作为网络的输入,将 此 矩 阵 保 存 至

0.
021 .c
sv文件,以便于导入到深度前馈网络中进行故障诊

0.
007 断,在模型训练时再按 7∶3比例随机分为 35000个样
电机 转 速 17
50r
/mi
n,载

nne
rRa
cewa
y 0.
014 荷 2h
p,采样率 1
2kHz
,驱 本训练集和 15000个样本测试集。
动端轴承 型 号 6
205
2RS 3.
2 参数设置
0.
021

EM S
FK
0.
007 表 3为在故障诊断中,深度前馈神经网络模型在
Ou
terRa
cewa
y 0.
014 Te
nso
rFl
ow中的关键参数设置。
0.
021 表 3 Te
nso
rFl
ow中核心参数的设置

将 No
rma
l信号和表 2中的 9种振动故障信号导 功能 Te
nso
rFl
ow程序

入 Py
tho
n中,得到 10种对应的振动原始信号图如图 4 激活函数 t
f.n
n.r
elu(t
f.ma
tmu
l ,w)+b)
(x

所示。 权值初始化 t
f.Va
ria
ble
(tf
.tr
unc
ate
d_n
orma
l())

偏置值初始化 t
f.Va
ria
ble
(tf
.ze
ros 1)
([])+0.

Dr
opo
ut t
f.n
n.d
rop
ou()

输出层激活函数 t
f.n
n.s
oft
ma()


f.red
uce_mean(t
f.n
n.sof
tmax_c
ros
s_e
ntr
o
交叉熵损失函数

y _wi
th_l
ogi
ts
_v2(la
bel
s,log
it
s))

Ad
am优化 t
f.t
rai
n.Ad
amOp
timi
zer
().mi
nimi
ze(l
os)

模型预测求准 t
f.r
educ
e_mean(t
f.c
ast
(tf
.equ
al(t
f.a
rgma

确率 (),t
f.a
rgma
x()),tf
.fl
oat
32))

运行模型 t
f.S
ess
ion().r
un(f
eed_d
ict={x
,y})

3.
3 结果分析
图 5为不同网络结构在训练 1000次后对诊断准
确率的影响,横轴表示学习参数的数量。

图4 1
0种不同工况下振动原始信号图
电机转速为 1750r
/mi
n,采样频率为 1
2kHz
,则
一个周期一转采集到约 412(6
0×1200
0÷17
50)个振 图 5 网络结构对故障诊断准确率的影响
180 计算机应用与软件 2019年

从图 5中可以看出,随着参数不断增加,准确率渐 学习曲线图,图 9为测试集对应的混淆矩阵,表 5为其


渐提高,当增加到 100万以上时,由于模型复杂参数过 对应的故障诊断报告。
多出现过拟合现象,准确率有所下降,而四层和五层网
络的泛化能力较强,在 30~1
00万的参数区间内有较
高准确率。三层、四层、五层、六层网络结构准确率普
遍都在 98%以上,且四层、五层整体效果要优于三层、
六层,说明对应本实验轴承故障数据集,适当调整网络
的宽度或深度都可以达到较好的泛化能力。
进一步比较分析,表 4为不同网络结构下的深度
前馈网络模型故障诊断评估表,选取四层和五层网络
为比较对象,选取 30~100万的学习参数区间,测试集
样本数是 15000,训练次数为 10
00次。评估指标中,
上升时间指准确率从 10%上升到 9
0%所需时间。
表 4 不同网络结构下的网络模型故障诊断评估

训练 上升 误诊
网络结构 参数数量 准确率
时长 时间 样本


12-40
0-

288
00 0.
9893 10
58s 7
4s 1
60 图 6 Te
nso
rFl
ow中 De
epf
eed
for
war
dne
two
rk的
40
0-10
故障诊断模型

12-50
0-

100
00 0.
9891 12
01s 8
5s 1
63
40
0-10


12-60
0-

522
00 0.
9896 14
95s 7
8s 1
56
50
0-10


12-70
0-

144
00 0.
9888 17
80s 1
02s 1
65
60
0-10


12-80
0-

371
00 0.
9891 21
92s 1
13s 1
63
75
0-10


12-3
00-3
00-

066
00 0.
9893 10
56s 8
8s 1
59
30
0-10


12-4
00-4
00-

888
00 0.
9892 15
40s 1
55s 1
60
40
0-10


12-5
00-5
00- 图 7 准确率和训练次数的关系曲线图

110
00 0.
9890 19
24s 1
18s 1
64
50
0-10

从表 4中可以看出,
所有网络准确率达到了 9
8.9%
左右,结构为 412-600-50
0-10的四层网络模型效
果最优,准确率达到最高 9
8.9
6%,误诊数也是 最 低
的,且优化速度较快,只用 7
8s模型诊断准确率就从
10%上升到 90%。尽管其训练时间较长,但是训练网
络是线下进行,为了更好地诊断轴承故障,花时间训练
一个最优网络是值得的。
综上所述,选取 412-60
0-50
0-10四层网络结
构为最优的深度前馈网络模型,对应的详细模型如图
6所示,图 7、图 8为其诊断准确率、损失与训练次数的 图 8 损失和训练次数的关系曲线图
第10期 梁昱等:Te
nso
rFl
ow中深度前馈网络优化研究及其轴承故障诊断应用 181

为了和机器学习算法作比较,利用和 3.1节同样
的50000组数据作为输入数据,15000组为测试集。
不同方法的诊断结果如表 6所示。
表 6 不同方法的诊断结果比较

识别 相关核心参数 训练分 测试分


误诊数 时间 /

模型 设置 /
% /

普通
K=2 9
7.0
6 8
8.7
1 16
94 14
16
k
近邻
带权
K=2,we
igh
t 1
00 9
1.2
6 13
11 14
17
k
近邻
penal
ty=L2
逻辑回归 4
5.2
6 3
9.3
8 90
84 2


olv
er= lb
fgs
cr
it
erion=entr
opy
图 9 混淆矩阵 s
plit
ter=bes

决策树 max_dept
h=5 0 99.
89 5
3.8
6 6
921 7

表 5 故障诊断报告
min_impu
rit

故障类别 Pr
eci
si
on Re
cal
l F1
sco
re S
upp
ort _dec
rease=1e-6

No
rma
l 1.
00 1.
00 1.
00 14
98 n_e
sti
mat
ors=100
随机森林 1
00 9
3.2
1 1
018 1
03
max_f
eat
ures=2

Ba
llf
aul
t
007 0.
99 1.
00 1.
00 15
19
支持 C=1

9.5
2 9
3.5
5 9
67 15
45
Ba
llf
aul
t
014 1.
00 1.
00 1.
00 15
08 向量机 γ =0.

Ba
llf
aul
t
021 1.
00 1.
00 1.
00 15
12 朴素
Ga
uss
ian
NB 6
1.9
6 6
0.7
0 58
94 4.
32
贝叶斯

nne
rra
ce
007 0.
92 1.
00 0.
96 15
21


nne
rra
ce
014 1.
00 1.
00 1.
00 14
64 由表 6可得,逻辑回归和朴素贝叶斯方法效果较


nne
rra
ce
021 1.
00 1.
00 1.
00 15
10 差,说明模型无法很好地拟合训练集和预测测试集;决
策树模型虽然对样本拟合情况极佳,但是模型测试分
Ou
terr
ace
00
7 1.
00 0.
90 0.
95 14
85
只有 53.
86%,对新数据诊断误差很大,说明改模型容
Ou
terr
ace
01
4 1.
00 1.
00 1.
00 14
56
易造成过拟合;相比而言 k
近邻、随机森林和支持向量
Ou
terr
ace
02
1 1.
00 1.
00 1.
00 15
27
机的训练集分数几乎达到 100%,对训练样本的拟合
Av
g/t
ot
al 0.
99 0.
99 0.
99 1
500

情况较好,对测试样本的预测诊断率也在 90%以上,
从图 7和图 8中可以看出,对于轴承故障数据诊 训练速度也比较快,说明模型的准确性和泛化能力良
断准确率为 98.96%,损失仅为 1.4
72;从图 9和表 5 好。但还是远低于本文实验的结果 98.96%,可见机
中可以看 出 针 对 每 个 故 障 类 别 的 预 测 准 确 性,除 了 器学习和深度前馈网络相比,虽然训练速度上有优势,
Out
err
ace
007类故障诊断出现了 0.1的误诊率,即 但是算法的鲁棒性模型诊断结果相对较差。经过大量
1485个样本中有大约 150个误诊成 I
nne
rra
ce
007故 数据测试经验发现,上述传统的机器学习算法一般在
障,其他情况基本诊断正确,而且,每种故障的查准率 数据集较小的情况下,往往分类效果比会比深度前馈
(Pr
eci
si
on)、召回率(Re
cal
l)、F1分数(F1
sco
re)平均 神经网络要好,在上万数据的情况下效果普遍低于深
值都为 0.
99,结果充分说明最优深度前馈网络模型能 度前馈网络。
够较好地实现轴承故障诊断。
3.
4 与其他方法的比较分析 4 结 语
模式识别是轴承故障诊断中的重要一步,实质是
分类算法,传统常用于分类的机器学习算法有 k
近邻 本文提出基于现代深度前馈神经网络的轴承故障
算法、支持向量机(SVM)、逻辑回归算法(Lo
gis
ti
cRe
 诊断模型,并通过梯度优化算法、正则化方式以及不同

res
sio
n)、决策树(De
cis
ionTr
ee)、随机森林算法(Ra
n 网络结构的研究,旨在向最优模型的建立不断靠近。
do
mFo
res
t)、朴素贝叶斯(Na
iveBa
yer
s)等。 实验在 Py
tho
n语言开发环境中编写程序并调用开源
182 计算机应用与软件 2019年

的 Te
nso
rFl
ow库函数完成。利用深度前馈网络强大的 d
eepf
eed
for
war
dne
ura
lne
two
rks[J
].J
our
nalo
fMa
chi
ne

非线性学习能力,无需人工处理数据提取复杂的特征 Le
arn
ingRe
sea
rch,2
010,9:
249-2
56.
[14] J
arr
ettK,Ka
vuk
cuo
gluK,Ra
nza
toM,e
tal
.Wh
ati
sth

即可实现高精度的滚动轴承故障诊断,实验结果最终

estmu
lti
st
agea
rch
ite
ctu
ref
oro
bje
ctr
eco
gni
ti
on?[C]//
达到了 98.
96%的诊断准确率。通过和传统机器学习

009I
EEE1
2thI
nte
rna
ti
ona
lCo
nfe
ren
ceo
nCo
mpu
terVi

方法比较说明该方法存在的优势,从而表明了深度前

ion,2
009:2
146-2
153.
馈神经网络模型有更强的分类决策能力。 [15] Da
hlGE,S
ain
athTN,Hi
nto
nGE.I
mpr
ovi
ngd
eepn
eur
al

etwo
rksf
orLVCS
Rus
ingr
ect
if
ie
dli
nea
run
itsa
ndd
rop
out
参 考 文 献
[C]//
201
3IEEE I
nte
rna
ti
ona
lCo
nfe
ren
ceo
nAc
ous
ti
cs,
[1] 吕维宗,王海瑞,舒捷.量子粒子群算法优化相关向量机 S
pee
cha
ndS
ign
alPr
oce
ssi
ng,2
013:8
609-8
613.
的轴承故障诊断[J
].计算机应用与软件,
201
9,3
6(1):
6 [16] Gl
oro
tX,Bo
rde
sA,Be
ngi
oY.De
eps
par
ser
ect
if
ie
rne
ura

-1
1,1
6. n
etwo
rks
[C]//
Pro
cee
din
gso
fth
e14t
hIn
ter
nat
io
nalCo
nfe
r
[2] Le
iY.I
nte
ll
ig
entf
aul
tdi
agn
osi
san
dre
mai
nin
gus
efu
lli
fe e
nceo
nAr
ti
fi
ci
alI
nte
ll
ig
enc
ean
dSt
at
is
ti
cs(AI
STATS).

red
ict
io
nofr
ota
ti
ngma
chi
ner
y[M].Xi
’anJ
iao
ton
gun
ive
r 2
010.

it
ypr
ess
,20
17:
146. [17] 郑泽宇,梁博文,顾思宇.Te
nso
rfl
ow实战 g
oog
le深度学
[3] Wo
ngs
uph
asa
watK,S
mil
kovD,We
xle
rJ,e
tal
.Vi
sua
li
 习框架[M].电子工业出版社,2
018:7
5.

ingd
ata
fl
owg
rap
hso
fde
epl
ear
nin
gmo
del
sinTe
nso
rFl
ow [18] I
anG,Yo
shu
aB,Aa
ronC.De
epl
ear
nin
g[M].Po
sts&
[J]. I
EEE Tr
ans
act
io
nso
n Vi
sua
li
zat
io
nan
d Co
mpu
ter Te
lec
omPr
ess
,20
17.
Gr
aph
ics
,20
18,
24(1):
1-1
2. [19]何宇健.Py
tho
n与机器学习实战:决策树、集成学习、支持
[4] 靳涛,张永爱.Te
nso
rFl
ow平台下基于深度学习的数字识 向量机与神经网络算法详解及编程实现[M].电子工业
别[J
].信息技术与网络安全,2
018,3
7(4):7
4-7
8. 出版社,
201
7:2
03-2
04.
[5] 侯艳路,丁世飞,孙统风.混合深度学习模型 C
RF及其 [20] Ho
rni
kK,S
tin
chc
omb
eM,Wh
iteH.Mu
lti
la
yerf
eed
for
war

在手写数字识别中的应用[J
].数据采集与处理,2
018, n
etwo
rksa
reu
niv
ers
ala
ppr
oxi
mat
ors
[J].Ne
ura
lNe
two
rks


3(2):3
43-3
50. 1
989,2(5):
359-3
66.
[6] 韩山杰,谈世哲.基于 Te
nso
rFl
ow进行股票预测的深度 [21] S
uts
kev
erI
,Ma
rte
nsJ
,Da
hlG,e
tal
.Ont
hei
mpo
rta
nceo

学习模型的设计与实现[J
].计算机应用与软件,2
018, i
nit
ia
li
zat
io
nan
dmo
men
tumi
nde
epl
ear
nin
g[C]//
Pro
cee
d

5(6):2
67-2
71,
291. i
ngso
fth
e30t
hIn
ter
nat
io
nalCo
nfe
ren
ceo
nIn
ter
nat
io
nal
[7]王丽华,谢阳阳,周子贤,等.基于卷积神经网络的异步 Co
nfe
ren
ceo
nMa
chi
neLe
arn
ing
—Vo
lume2
8.2
013.
电机故 障 诊 断 [J
].振 动 测 试 与 诊 断,2
017,3
7(6): [22] Du
chiJ
,Ha
zanE,S
ing
erY.Ad
apt
iv
esu
bgr
adi
entme
tho
ds

208-1
215,
128
3. f
oro
nli
nel
ear
nin
gan
dst
och
ast
ico
pti
miz
ati
on[J
].J
our
nalo

[8]王丽华,谢阳阳,张永宏,等.采用深度学习的异步电机 Ma
chi
neLe
arn
ingRe
sea
rch,2
011,1
2(7):
257-2
69.
故障诊断方法[J
].西安交通大学学报,2
017,5
1(1
0): [23] Ti
el
ema
nT,Hi
nto
nG.RMS
Pro
p:Di
vi
det
heg
rad
ien
tbya

28-1
34. r
unn
inga
ver
ageo
fit
sre
cen
tma
gni
tud
e[R].COURS
ERA:
[9] 孙文臖,邵思羽,严如强.基于稀疏自动编码深度神经 Ne
ura
lNe
two
rksf
orMa
chi
neLe
arn
ing
.20
12.
网络的感应电动机故障诊断[J
].机械工程学报,2
016, [24] Ki
ngmaDP,BaJ
.Ad
am:Ame
tho
dfo
rst
och
ast
ico
pti
miz
a

2(9):6
5-7
1. t
io
n[EB].a
rXi
v:1
412.
698
0.2
014.
[10] We
nL,LiX,Ga
oL,e
tal
.An
ewc
onv
olu
tio
naln
eur
aln
et [25] LeQV,Ng
iamJ
,Co
ate
sA,e
tal
.Ono
pti
miz
ati
onme
tho
ds
wo
rkb
ase
dda
ta
dri
venf
aul
tdi
agn
osi
sme
tho
d[J].I
EEE f
ord
eepl
ear
nin
g[C]//
Pro
cee
din
gso
fth
e28t
hIn
ter
nat
io
nal
Tr
ans
act
io
nso
nIn
dus
tr
ialEl
ect
ron
ics
,20
18,6
5(7):5
990 Co
nfe
ren
ceo
nMa
chi
neLe
arn
ing
,ICML2
011,Be
ll
evu
e,
-5
998. Wa
shi
ngt
on,US
A,J
une2
8—J
uly2,2
011.DBLP,2
011.
[11] 仝卫国,李敏霞,张一可.深度学习优化算法研究[J
]. [26]周安众,罗可.一种卷积神经网络的稀疏性 Dr
opo
ut正则
计算机科学,2
018,4
5(S
2):1
55-1
59. 化方法[J
].小型微型计算机系统,2
018,3
9(8):1
674
[12] Na
irV,Hi
nto
nGE.Re
cti
fi
edl
ine
aru
nit
simp
rov
ere
str
ict
 -1
679.

dbo
lt
zma
nnma
chi
nes
[C]//
Pro
cee
din
gso
fth
e27t
hIn
ter
 [27] S
riv
ast
avaN,Hi
nto
nG,Kr
iz
hev
skyA,e
tal
.Dr
opo
ut:A

ati
ona
lCo
nfe
ren
ceo
nIn
ter
nat
io
nalCo
nfe
ren
ceo
nMa
chi
ne s
imp
lewa
ytop
rev
entn
eur
aln
etwo
rksf
romo
ver
fi
tt
ing[J
].
Le
arn
ing
.Omn
ipr
ess
,20
10:8
07-8
14. J
our
nalo
fMa
chi
neLe
arn
ingRe
sea
rch,2
014,1
5(1):1
929
[13] Gl
oro
tX,Be
ngi
oY.Un
der
st
and
ingt
hed
iff
ic
ult
yoft
rai
nin
g -1
958.

You might also like