Professional Documents
Culture Documents
语音识别算法
语音识别算法
别和稳健性;介绍利用该技术实现的一种新型学习型遥控器,展现了语音识别技术在家电领域的广阔前景。
家用电器发展的一个重要方面是让用户界面更加人性化,更加方便自然,做到老年人和残疾人可以无障碍地使用。
利用语音识别技术实现语音控制是提高家电产品用户界面质量的一条重要途径。本文以语音控制遥控器为例,说明语音
识别技术如何应用在家电器领域。
适合家用电器应用的语音识别嵌入式系统结构如图 1 所示,它由四个部分组成。第一部分为模/数转换部分,其输
入端接收输入的语音信号,并将其转化成数字芯片可处理的数字采集信号;在输出端将解码后的语音数字信号转换为
音频模拟信号,通过扬声器放声。第二部分为语音识别部分,它的作用是对输入的数字语音词条信号进行分析,识别出
词条信号所代表的命令,一般由 DSP 完成。第三部分语音提示和语音回放部分,它一般也是在 DSP 中完成的,其核心是
对语音信号进行数字压缩编码和解码,目的是提示用户操作并对识别语音的响应,完成人机的语音交互。第四部分是系
统控制部分,它将语音识别结果转换成相应的控制信号,并将其输出转换成物理层操作,完成具体功能。语音识别与系
统控制的有机结合是完成声控交互的关键,下面将对语音识别算法及遥控系统控制部分作详细的讨论。
1 语音识别算法
1.1 端点检测方法
1.2 模拟匹配算法
当动态规划过程计算到固定结点(N,M)时,可以计算出该模板动态匹配的归一化距离,识别结果即该归一化距
离最小的模板词条:x=argmin{S(N,Mx)}。
表 2 DTW 不同模板数的识别率比较
2 语音控制遥控器设计
目前家用遥控器主要为按键式,并有两种类型:一种是固定码型,每个键对应一种或几种码型,都是生产厂家预
先设定好的,用户不能更改;另一种是学习型,具有自我学习遥控码的功能,可由用户定义遥控器的每个键对应的码
型,它能够将多种遥控器集于一身,用一个遥控器就可控制多个家电,又可以作为原配遥控器的备份。由于现代家电功
能不断增加,上述两种遥控器都有按键过多,用户不易记住每个键的含义等问题。将语音识别技术应用于学习型遥控
器,利用语音命令代替按者对命令的记忆和使用,同时省去了大量按键,缩小了遥控器的体积。
语音控制遥控器的硬件框图如图 2 所示,它由两个独立的模块组成:语音信号处理模块和系统控制模块。
系统控制模块由单片机、红外接收发送器、电源管理电路组成。单片机负责整个遥控器的系统控制。单片机作为主控
芯片,进行键盘扫描,根据用户通过键盘输入的指令,分别完成学习遥控码;控制 DSP 进行语音训练、回放、识别;将
识别结果转换成相应的遥控码,通过红外发光管发射出去。单片机与 DSP 之间通过标准的 RS232 串行协议通讯。
系统的控制软件流程图如图 3 所示。在使用前,按“学习键”进入学习状态,用户先对学习型遥控器训练语音
命令,并使其学习与各语音命令相对应的原理控码型。使用时按“识别键”,进入语音识别状态,等待语音处理模块返
回结果,若返回正确的识别结果,则把相应的遥控码发射出去。例如,原电视遥控器数字键“1”对应中央 1 台,用户
的训练命令为“中央 1 台”,学习了原遥控器的数字键“1”的遥控码,并使其与训练命令“中央 1 台”对应起来。于
是使用时只需对着学习型遥控器的麦克风说出“中央 1 台”,电视就会切换到中央 1 台。这样用户不需要记住每个电视
台与台号的对应关系,相对于枯燥的频道数字,用户自定义的命令更容易记住。