Professional Documents
Culture Documents
SSN1000-1239
?CN11-1777 ?TP
J
our
nalo
fCompu
terRe
sea
rchandDe
vel
opmen
t 50(9):1799-1804,2013
深度学习的昨天 、今天和明天
余 凯 贾 磊 陈雨强 徐 伟
(百度 北京 100085)
(
yuka
i@ba
idu.
com)
De
epLe
arn
ing:Ye
ste
rday,Today,andTomo
rrow
i,J
Yu Ka i i,Chen Yuq
aLe iang,andXu We
i
(
Baidu,Be
ijng100085)
i
Abst
ract Machi
nelea
rningi
sanimport
anta
r e
ao fa
rti
fic
iali
nte
lli
gence.Si
nce1980s,hugesucc
ess
ha
sbe en a
chi
evedi
nt erms o
fal
gor
ithms,theoy,and app
r l
ica
tions.From 2006,a new mach
ine
l
earn
ing pa
rad
igm,named de
ep l
earn
ing,ha
s be
en popu
lari
nthe r
ese
arch commun
ity,and ha
s
becomea huge wave o
ft echnol
ogy t
rend f
orb i
g dat
a and ar
tif
ici
ali
nte
lli
gence.Deep lea
rn i
ng
simul
atst
e hehie
rarch
icals
tructureo
fhumanbr a
in,proces
singda
taf r
omlowerleve
ltoh
i ghe
rl evel,
r
andgadua
lly compos
ing mor
eand mo
res emant
icconc
epts.I
nr ec
entyears,Goog
le, Micr
osoft,
IBM,andBaiduhaveinve
stedal
otofresour
cesint
othe R&D ofdeepl
earn
ing,makingsi
gnif
icant
prog
resseson spee
ch re
cogni
tion,image underst
anding,natura
llanguage proc
ess
ing,and on
line
adve
rti
sing.I
nt ermsofthecontr
ibu
tiont
or eal-worl
dappl
ica
ti ,
ons de
epl ea
rningisperhapst
hemost
suc
ces
s f
ulpr
ogressmadebythe machi
nelea
rningcommuni
tyinthel
ast10yea
rs.Inthi
sa r
tic
le,we
wil
lgiveahigh-l
eve
lover
view aboutthepastandcur
ren
ts t
ageofdeeple
arn
ing,di
scussthe ma
in
cha
ll s,andsha
enge reourv
iewsont
hef
utur
edeve
lopmen
tofde
epl
earn
ing.
Keyword
s machinele
arning;de
epl
earn
ing;spe
echr
ecogn
iton;
i imager
ecogn
iton;na
i tur
all
anguage
pr
oce
ssi ;
ng onl
ineadvert
ising
关键词 机器学习;深度学习;语音识别;图像识别;自然语言处理;在线广告
中图法分类号 TP18
收稿日期:
2013-08-16;修回日期:
2013-08-19
1800 计算机研究与发展 2013,50(
9)
用 16000 个 CPU Co
re的并行计算平台训练一种称 对未知事件做预测 .这 种 基 于 统 计 的 机 器 学 习 方 法
为“深度 神 经 网 络 ”(
deep neur
alne rks,DNN)
two 比起过去基于人工 规 则 的 系 统,在 很 多 方 面 显 示 出
的机器学习模型,在 语 音 识 别 和 图 像 识 别 等 领 域 获 优越性 .这个时候的人工神经网络,虽然也被称作多
得了巨大的成功 .
2012 年 11 月,微 软 在 中 国 天 津 的 层感 知 机 (mu
lti
-laye
rpe
rcep
tron),由 于 多 层 网 络
一次活动 上 公 开 演 示 了 一 个 全 自 动 的 同 声 传 译 系 训练的困难,实际使 用 的 多 数 是 只 含 有 一 层 隐 层 节
统,讲演者用英文演讲,后台的计算机一气呵成自动 点的浅层模型 .
完成语音识别、英中机器翻译和中文语音合成,效果 20 世 纪 90 年 代 ,各 种 各 样 的 浅 层 机 器 学 习
非常流畅 .据报道,后面支撑的关键技术也是 DNN, 模 型 相 继 被 提 出 ,比 如 支 撑 向 量 机 (
suppo
rtve
cto
r
或者深度 学 习 (
deepl
earn
i
[]
ng,DL)2 .2013 年 的 1 machi s,SVM ),Boos
ne t
ing,最 大 熵 方 法 (比 如
月,在中国最大的互 联 网 搜 索 引 擎 公 司 百 度 的 年 会 l
ogis
ticreg
res
sion,LR)等 .这些模型的结构基本上
上,创始人兼 CEO 李彦宏高调宣布要成立百度研究 可以 看 成 带 有 一 层 隐 层 节 点 (如 SVM,Boos
ting),
院,其中第一个重点方向的就是深度学习,并为此而 或没有隐层节点(如 LR).这些模型在无论是理论分
成 立I
nst
itu
teo
fDe
epLe
arn
i IDL).这是百度成
ng ( 析还是应用都获得了巨大的成功 .相比较之下,由于
立 10 多年以来第一次 成 立 研 究 院 [3].
2013 年 4 月, 理论分析的难度,而 且 训 练 方 法 需 要 很 多 经 验 和 技
《麻省理工学院技术评论》(MIT T
echno
logy Re
view) 巧,这个时期多层人工神经网络反而相对较为沉寂 .
杂志 将 深 度 学 习 列 为 2013 年 十 大 突 破 性 技 术 2000 年以来互联网的高 速 发 展,对 大 数 据 的 智
(
bre
akt
hrought
echno
logy)之首 .
[
4] 能化分析和预测提 出 了 巨 大 需 求,浅 层 学 习 模 型 在
为什么深度学习受到学术届和工业界如此广泛 互联网应用上获得 了 巨 大 的 成 功 .最 成 功 的 应 用 包
的重视?深度学习技术研发面临什么样的科学和工 括搜索广 告 系 统 (比 如 谷 歌 的 Adwo
rds、百 度 的 凤
程问题?深度学习带来的科技进步将怎样改变人们 巢系统)的 广 告 点 击 率 CTR 预 估、网 页 搜 索 排 序
的生活?本文将简 要 回 顾 机 器 学 习 在 过 去 20 多 年 (比如雅虎和微软的搜索引擎)、垃圾邮件过滤系统、
的发展,介绍深度学习的昨天、今天和明天 . 基于内容的推荐系统,等等 .
2 第二次浪潮:深度学习
1.
1 机器学习的两次浪潮 :从浅层学习到 深 度 2006 年,加 拿 大 多 伦 多 大 学 教 授,机 器 学 习 领
学习 域的泰 斗 Hi
nton 和 他 的 学 生 Sa
lakhu
t d
inov 在 顶
尖学术刊物《科 学》上 发 表 了 一 篇 文 章 ,开 启 了 深
[
6]
更高的准确率 .因此,发展适合深度模型的更高速的 [
10] La
rge Sc
ale Vi
sua
l Re
cogn
iti
on Cha
llenge 2012
(
ILSVRC2012)[
OL]. [
2013-08-01].h
ttp:?www.
image-
硬件也将是提高深度模型的识别率的重要方向 . ?
ne
t.o
rgcha
? llenge
s?LSVRC
?2012
?
[
11] Xu W, Rudn
icky A.Can a
rti
fic
ial neur
al ne
two
rk l
ear
n
5 总 结
l
anguage mode
ls [
C] ?
?Pr
oco
fIn
t Con
f on S
tat
ist
ica
l
LanguagePr
oce
ssng.2000:1-13
i
深度 学 习 带 来 了 机 器 学 习 的 一 个 新 浪 潮,受 到 [
12] Beng
io Y, Ducha
rme R, Vi
nc t P, e
en tal. A neur
al
从学术届到工业界的广泛重视,也导致了“大数据 + r
pobab
ili
sti
cl l [
anguage mode J]. J
our
nal o
f Ma
chi
ne
深度模型”时代的 来 临 .在 应 用 方 面,深 度 学 习 使 得 Le
arn
ingRe
sea
rch,2003,3:1137-1155
语音图像的智能识 别 和 理 解 取 得 惊 人 进 展,从 而 推 [
13] Co
llobe
rtR,We
stonJ,Bo
ttou L,e
tal.Na
tur
all
anguage
r
poc
ess
ing (Almo
st)f
rom s
cra
tch [
J].J
our
nalo
f Ma
chi
ne
动人工智能和人 机 交 互 大 踏 步 前 进 .同 时 pCTR 这
Le
arn
ingRe
sea
rch,2011,12:2493-2537
样的复杂机器学习 任 务 也 得 到 显 著 提 升 .如 果 我 们
[
14] So rR,L
che inC,Ng A.Pa
rsi
ngna
tur
als
cene
sandna
tur
al
能在理论、建 模 和 工 程 方 面,突 破 深 度 学 习 技 术 面
anguage wi
l thr
ecur
siveneur
al Ne rks [
two C]?
?Pr
oco
fthe
临一系列难题,我们 将 大 大 加 速 推 进 人 工 智 能 向 前 28
thI
ntCon
fon Ma
chi
neLe
arn
i rmany:I
ng.Ga nte
rna
tiona
l
发展 . Ma
chi
neLe
arn
ingSo
cie
ty,2011
参 考 文 献 Yu Ka
i. Re
cei
ved h
is PhD f
rom t
he
Un
ive
rsi
tyo
f Mun
ichi
n2004.Pr
ofe
sso
r.
[
1] Ma
rko
ffJ.How manyc
ompu
ter
stoi
den
tif
yac
at?[
N]The Hi
s ma
in r
ese
arch i
nte
res
ts i
ncl
ude
New Yo s,2012-06-25
rk Time ma
chi
nel
ear
ning,imagep
roc
ess
ing,e
tc.
[
2] Ma
rko
ffJ.Sc
ien
tis
tss
e r
epomi
sei
nde
ep-l
ear
ni r
ngpog
rams
[
N].TheNew Yo s,2012-11-23
rk Time
[
3] L
iYanhong.To be
lievei
nthe powe
roft
echno
logy [
R].
J
iaLe
i.Re
cei
vedh
isPhDdeg
reei
nspe
ech
Be
ii
jng:Ba
idu,2013 (
inCh
ine
se)
(李彦宏 .2012 百度年会主题报告:相信技术的力量[
r
ecogn
iton f
i rom t
he I
nst
itu
te o
f
R].北
京:百度,2013) Au
toma
tion, Ch
ine
se Ac
ademy o
f
4] 10Br
[ eak
thr
ough Te
chno
log
ies2013 [
N].MIT Te
chno
logy Sc
ienc
es,i
n 2003. Hi
s ma
inr
ese
arch
Rev
iew,2013-04-23 i
nte
res
ts i
ncl
ude spe
ech r
ecogn
iton,
i
[
5] Rume
lha
rt D, Hi
nton G, Wi
ll
iams R. Le
arn
ing ma
chi
nel
ear
nnng, d
i i i
tals
i
g gna
lpr
oce
ssng and na
i tua
l
r
epr
esen
tat
ions by ba
ck-p
ropaga
ting e
rro
rs[
J]. Na
t e,
ur
l
anguagep
roc
ess
ing.
1986,323(
6088):533-536
[
6] Hi
nton G,Sa
lakhu
tdi
novR.Reduc
ingt
hed
imens
iona
lit
yof
Ch
enYuq
iang.Re
cei
vedh
is Ma
ste
rdeg
ree
da
ta wi
th neur
alne rks [
two J].Sc
i e,2006,313(
enc 504).
i:
Do
f
rom Shangha
i J
iao
tong Un
ive
rsi
ty.
10.
1126
?sc
ienc
e.1127647
[
7] Dah
lG,Yu Dong,Deng L
i,e
tal.Con
tex
t-dependen
tpr
e- Eng
ine
er. Hi
s ma
in r
ese
arch i
nte
res
ts
t
rai
ned de
ep neur
al ne
two
rks f
orl
arge vo
cabu
lar
y spe
ech i
ncl
udema
chi
ngl
ear
ning.
r
ecogn
iton [
i J]. IEEE Tr
ans on Aud
io, Spe
ech, and
LanguagePr
oce
ssng.2012,20(
i 1):30-42
[
8] J
ait
ly N, Nguyen P, Nguyen A,e
tal. App
lic
ati
on o
f
Xu We
i.Re
cei
vedh
is Ma
ste
rdeg
reef
rom
r
pet
rai
nedde
ep neur
alne
two
rkst
ola
rgevo
cabu
lar
yspe
ech
Ca
rneg
ie Me
llon Un
ive
rsi
tyi
n 2001.Hi
s
r
ecogn
iton [
i C]?
?Pr
oco
fIn
ter
spe
ech, Gr
enob
le,Fr e:
anc
ma
inr
ese
arch i
nte
res
tsi
ncl
ude c
ompu
ter
I
nte
rna
tiona
lSpe
echCommun
ica
tion As
soc
iat
ion,2012
[
9] LeCun Y,Bo
ser B, Denke
r J S,e
tal.Ba
ckp
ropaga
tion v
ison, da
i ta mi
ning, ma
chi
ng l
ear
ning
app
lied t
o handwr
itt
en z
ipc
ode r
ecogn
iton [
i J]. Neur
al e
spe
cia
llyde
epl
ear
ning.
Compu
tat
ion,1989,1:541-551