Professional Documents
Culture Documents
文章编号: (!""!)
#"")$!*’+ "%$"""%$"*
语音识别的研究与发展
何湘智
(国防科技大学机电工程与自动化学院,湖南 长沙 *#""’%)
摘要:综合阐述了语音识别技术的提出与发展历史,语音识别系统的分类,目前所面临的困难和采用的主要技术,以及
发展方向和应用前景。
关键词:语音识别;隐马尔可夫;矢量量化;动态时间规整
中图分类号:,-%&#.* 文献标识码:/
67%1’&(1:1LM:D5CB @8< A<4B:5B 45C C<H<;:ME<5@ 83B@:AK ,@8< MA:N;<EB =4?<C ,@8< O<K @<?85:;:63<B := BM<<?8 A<?:653@3:5,45C ?;4BB=3<B
@8< BKB@<EB := BM<<?8 A<?:653@3:5,;::OB 48<4C @8< C<H<;:ME<5@ := @8< =3<;CI
8#9:.’*:BM<<?8 A<?:653@3:5;0>>;PQ;J,R
文数字的语音识别系统———/DCAK 系统。
; 语音识别技术的提出及发展历史 )" 年代,计算机的应用推动了语音识别的发展。
随着现代科学和计算机技术的发展,人们在与机 这一时期的重要成果是提出了用动态规划( J-)方法
器的信息交流中,需要一种更加方便、自然的方式。 来解决语音识别中不等长的对正问题。
而人的直观感觉可以给人最直接的印象,获取信息速 ’" 年代,语音识别领域取得了突破。线性预测
度也就最快。虽然,嗅觉、触觉也是人类固有的感觉, 编码技术( W-9)的引入,使语音识别的特征提取产生
人们可以从中得到某些外界信息,但最重要、最精细 了一次飞跃。动态时间规整技术(J,R)基本成熟,提
的信息源只有图像和语言两种。而且,语言是人类最 出了矢量量化( PQ)和隐马尔可夫模型( 0>>)理论。
重要的、最有效的、最常用的和最方便的通信形式。 实现了基于线性预测倒谱和 J,R 技术的特定人孤立
这就很容易让人想到能否用自然语言代替传统的人 语音识别系统。
机交流方式如键盘、鼠标等。一般来讲,人与机器的 (" 年代,语音识别研究进一步走向深入,其显著
语言通信大致分为两种情况:第一种情况就是机器讲 特征是 0>> 模型和人工神经元网络(/FF)在语音识
话,
人听话。这就是“人工嘴巴”即语音的人工合成; 别中的成功应用。 0>> 模型的广泛应用应归功于
第二种情况就是人讲话,机器听话。这即是“人工耳 /,U , V<;; 实验室 T4N35<A 等科学家的努力,他们把
朵”,即语音的人工识别和理解。语音识别较语音合 原本艰涩的 0>> 纯数学模型工程化,从而为更多研
成而言,技术上要复杂,但应用却更加广泛。语音识 究者了解和认识。
别 /ST
(/D@:E4@3? SM<<?8 T<?:653@3:5)的最大优势在于 进入 &" 年代,随着多媒体时代的来临,迫切要求
使得人机用户界面更加自然和容易使用。 语音识别系统从实验室走向实用。许多发达国家如
语音识别的研究工作大约开始于 +" 年代,标志 美国、日本、韩国以及 XV>、/MM;<、/,U,、F,, 等著名
就是 /,U , V<;; 实验室实现了第一个可识别十个英 公司都为语音识别系统的实用化开发研究投以巨资。
收稿日期:!""#$##$#%
作者简介:何湘智(#&’($),男,湖南衡山人,国防科技大学机电工程与自动化学院硕士研究生,研究方向:信号处理与模式
识别。
万方数据
J 计 算 机 与 现 代 化 /00/ 年第 . 期
(0)语音识别基元的选择:如何根据存贮空间和 &<<<,
应用研究, &= :
[’] 聂敏 : 语 音 识 别 及 其 关 键 技 术[ ;]: 微 波 与 卫 星 通 信,
搜索速度的要求,选择合适的识别单元,如词、音节、
&<<<,
1:
音素。一般来讲,要识别的词汇量越多,所用的基元
[0] 江铭炎,李浩 : 语音识别的研究与进展[ ;]: 山东电子,
应越小越好。
&<<<,
’:
(1)端点监测:研究表明,即使在安静的环境下, [1] 陈方,等 : 语音识别技术发展[ ;]: 电信科学,
&<<>,
&= :
语音识别系统一半以上的识别错误来自端点监测器。 [2] 胡航 : 语音信号处理[ ?]: 哈尔滨:哈尔滨工业大学出版
提高端点检测技术的关键在于寻找稳定的语音参数。 社,
’=== :
(2)韵律信息的利用:韵律信息指的是说话之中 [>] 苏剑波,徐波 : 应用模式识别技术导论[?]: 上海:上海交
的重音、语调等超音段信息。实验表明,人可以从说 通大学出版社,
’==& :
话的韵律中获取很多重要信息。但目前的语音识别 [@] 江铭虎,朱小燕,袁保宗 : 语音识别与理解的研究进展