You are on page 1of 12
MMÔÔNN HHỌỌC:C: XXỬỬ LLÝÝ TITIẾẾNGNG NNÓÓII MMụụcc đđích:ích: –– CungCung ccấấpp
MMÔÔNN HHỌỌC:C: XXỬỬ LLÝÝ TITIẾẾNGNG NNÓÓII
MMụụcc đđích:ích:
–– CungCung ccấấpp chocho sinhsinh viênviên nhnhữữngng kikiếếnn ththứứcc ccơơ bbảảnn
vvềề llĩĩnnhh vvựựcc xxửử lýlý titiếếngng nnóiói
GiGiảảngng viên:viên: LêLê BáBá DDũũngng
ĐĐịịaa cchhỉỉ:: KhKhoaoa CôCôngng ngnghhệệ ThôThôngng titinn-- TTrrườườngng ĐĐạạii
hhọọcc HàngHàng HHảảii ViViệệtt NamNam-- ssốố 484484 LLạạchch Tray-Tray- NgôNgô
QuyQuyềềnn-- Tp.Tp. HHảảii PhòngPhòng
Email:Email: dungleba@gmail.comdungleba@gmail.com
WebsiteWebsite khóakhóa hhọọc:c:
–– http://wwwhttp://www fitfit vimaruvimaru eduedu vn/cntt/vn/cntt/~~dunglb/teaching/speedunglb/teaching/spee
chprocessing08chprocessing08
NNỘỘII DUNGDUNG CHCHÍÍNHNH GiGiớớii thithiệệuu vvềề xxửử lýlý titiếếngng nóinói CácCác
NNỘỘII DUNGDUNG CHCHÍÍNHNH
GiGiớớii thithiệệuu vvềề xxửử lýlý titiếếngng nóinói
CácCác kikiếếnn ththứứcc ccơơ bbảảnn vvềề xxửử lýlý tíntín hihiệệuu ssốố
CácCác mômô hìnhhình ssốố chocho tíntín hihiệệuu titiếếngng nóinói
CácCác mômô hìnhhình trongtrong mimiềềnn ththờờii giangian chocho xxửử lýlý titiếếngng
nnóiói
BiBiểểuu didiễễnn ssốố chocho ddạạngng sóngsóng titiếếngng nóinói
TTổổnngg hhợợpp titiếếnngg nóinói
NhNhậậnn ddạạngng titiếếngng nóinói
TTÀÀII LILIỆỆUU THAMTHAM KHKHẢẢOO XuedongXuedong Huang,Huang, AlexAlex Acero,Acero, HsiaoHsiao WuenWuen
TTÀÀII LILIỆỆUU THAMTHAM KHKHẢẢOO
XuedongXuedong Huang,Huang, AlexAlex Acero,Acero, HsiaoHsiao WuenWuen Hon,Hon,
SpokenSpoken LanguageLanguage ProcessingProcessing,, PrenticePrentice Hall,Hall, 20012001
LLawrenceawrence RR
RRaabibiner,ner,
RRonaonaldld WW
SScchhaaffer,er,
DiDiggititaall
ProcessingProcessing ofof SpeechSpeech SignalSignal,, PrenticePrentice Hall,Hall, 1978.1978.
BàiBài 1:1: GiGiớớii thithiệệuu TiTiếếngng nóinói làlà cáccác chuchuỗỗii âmâm thanhthanh
BàiBài 1:1:
GiGiớớii thithiệệuu
TiTiếếngng nóinói làlà cáccác chuchuỗỗii âmâm thanhthanh đượđượcc phátphát
rara ttừừ bbộộ máymáy phátphát âmâm ccủủaa concon ngngườườii
MMụụcc đđíchích ccủủaa titiếếngng nóinói làlà dùngdùng đểđể giaogiao titiếếpp
QuáQuá trìnhtrình giaogiao titiếếpp bbằằngng titiếếngng nóinói ThôngThông tintin mumuốốnn
QuáQuá trìnhtrình giaogiao titiếếpp bbằằngng titiếếngng nóinói
ThôngThông tintin mumuốốnn traotrao đổđổii đượđượcc chuychuyểểnn thànhthành
ttậậpp hhợợpp cáccác tíntín hihiệệuu nnơơronron đượđượcc dùngdùng đểđể
đđiiềềuu khikhiểểnn cáccác bbộộ phphậậnn trontrongg bbộộ máymáy phátphát
âmâm (l(lưỡưỡi,i, môi,môi, hhọọng,ng,
)
)
SSựự cchhuyuyểểnn độđộnngg ccủủaa ccáácc bbộộ pphhậậnn nnààyy ttạạoo rara
mmộộtt dãydãy cáccác ccửử chchỉỉ,, kkếếtt ququảả ccủủaa nónó làlà sóngsóng
ââmm ttươươngng ứứngng mangmang tthôhôngng tintin ccầầnn traotrao đổđổii
ThôngThông tintin đượđượcc giaogiao titiếếpp thôngthông quaqua titiếếngng nóinói cócó ththểể
ThôngThông tintin đượđượcc giaogiao titiếếpp thôngthông quaqua titiếếngng
nóinói cócó ththểể đượđượcc bibiểểuu didiễễnn bbằằngng ssựự ghépghép nnốốii
nhinhiềềuu thànhthành phphầầnn ttừừ mmộộtt ttậậpp hhợợpp hhữữuu hhạạnn
cáccác kýký hihiệệuu
KýKý hihiệệuu mmàà ddựựaa vvààoo đđóó mmỗỗii ââmm tthhananhh ccóó
ththểể mangmang ýý nghnghĩĩaa đượđượcc ggọọii làlà âmâm vvịị
MMỗỗii nngôgônn nnggữữ ccóó ttậậpp hhợợpp ccáácc ââmm vvịị ccủủaa
riêngriêng nó,nó, thôngthông ththườườngng ssốố llượượngng ttừừ 3030 đếđếnn
5050
QuáQuá trìnhtrình xxửử lýlý tíntín hihiệệuu
QuáQuá trìnhtrình xxửử lýlý tíntín hihiệệuu
QuáQuá trìnhtrình xxửử lýlý tíntín hihiệệuu titiếếngng nóinói NguNguồồnn thôngthông tin:tin:
QuáQuá trìnhtrình xxửử lýlý tíntín hihiệệuu titiếếngng nóinói
NguNguồồnn thôngthông tin:tin: ngngườườii nóinói
LLưượợnngg ggiá:iá: ddạạnngg sónsóngg ccủủaa âmâm thanhthanh
BiBiểểuu didiễễnn tíntín hihiệệu:u: bibiểểuu didiễễnn tíntín hihiệệuu ddướướii
ddạạngng ssốố
BiBiếếnn đổđổii tíntín hihiệệu:u: chuychuyểểnn tíntín hihiệệuu sangsang mmộộtt
ddạạngng thíchthích hhợợpp hhơơnn
TríchTrích xuxuấấtt vàvà ssửử ddụụngng thôngthông tin:tin: cócó ththểể
đượđượcc ththựựcc hihiệệnn bbởởii ngngườườii nghenghe hohoặặcc máymáy ttựự
độđộnngg
CácCác ứứngng ddụụngng xxửử lýlý titiếếngng nóinói
CácCác ứứngng ddụụngng xxửử lýlý titiếếngng nóinói
CácCác ứứngng ddụụngng xxửử lýlý titiếếngng nóinói TruyTruyềềnn vàvà llưưuu trtrữữ
CácCác ứứngng ddụụngng xxửử lýlý titiếếngng nóinói
TruyTruyềềnn vàvà llưưuu trtrữữ titiếếngng nói:nói: mãmã hóahóa titiếếngng
nóinói (voice(voice coder).coder). MMụụcc đđíchích ccủủaa mãmã hóahóa
titiếếnngg nóinói làlà làmlàm ggiiảảmm thithiểểuu bbăănngg thônthôngg ccầầnn
thithiếếtt đểđể truytruyềềnn titiếếngng nóinói
CáCácc hhệệ tthhốốnngg ttổổnngg hhợợpp ttiiếếnngg nnóiói:: ccáácc hhệệ
ththốốngng trtrảả llờờii ttựự độđộngng bbằằngng máymáy tínhtính làlà cáccác
hhệệ tthhốốngng cungcung ccấấpp tthôhôngng tintin ddạạngng ssốố ttựự
độđộngng chocho ngngườườii ssửử ddụụngng ddướướii ddạạngng titiếếngng
nóinói
HHệệ ththốốngng địđịnhnh danhdanh ngngườườii nói:nói: làlà cáccác hhệệ ththốốngng
HHệệ ththốốngng địđịnhnh danhdanh ngngườườii nói:nói: làlà cáccác hhệệ
ththốốngng cócó khkhảả nnăăngng xácxác địđịnhnh ngngườườii đđangang truytruy
ccậậpp hhệệ ththốốnngg cócó hhợợpp llệệ hayhay khônkhôngg thônthôngg
quaqua titiếếngng nóinói ccủủaa ngngườườii đđóó
CáCácc hhệệ tthhốốnngg nnhhậậnn ddạạnngg ttiiếếnngg nnóiói:: làlà ccáácc
ứứngng ddụụngng chuychuyểểnn đổđổii ddạạngng sóngsóng âmâm thanhthanh
sangsang tthôhôngng tintin ddạạngng viviếếtt ttươươngng đđươươngng
NângNâng caocao chchấấtt llượượngng tíntín hihiệệu:u: làlà cáccác ứứngng ddụụngng nhnhưư
NângNâng caocao chchấấtt llượượngng tíntín hihiệệu:u: làlà cáccác ứứngng
ddụụngng nhnhưư loloạạii bbỏỏ nhinhiễễu,u, loloạạii bbỏỏ titiếếngng vangvang
trontrongg titiếếnngg nóinói