0% found this document useful (0 votes)

93 views17 pages

Multilingual Automatic Speech Recognition

Automatic speech recognition is the task of getting a computer to understand spoken language by either reacting appropriately or converting speech to text. Humans do this through the ear and brain processing sound waves produced during articulation. Computers do it by digitizing the acoustic signal, analyzing it acoustically, matching it to a phoneme dictionary using a language model. Multilingual speech recognition systems use techniques like universal speech models, language identification classifiers, and monolingual speech recognizers with dynamic confidence scoring to recognize multiple languages. The end-to-end multilingual ASR system has client, frontend, and backend components including an LID backend, speech recognizer backend, web search backend, and voice synthesizer backend. HMM-

Uploaded by

Mayank Kulkarni

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

93 views17 pages

Multilingual Automatic Speech Recognition

Uploaded by

Mayank Kulkarni

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPT, PDF, TXT or read online on Scribd

Automatic Speech Recognition

What is the task?

Getting a computer to understand spoken

language
By understand we might mean

React appropriately
Convert the input speech into another medium,
e.g. text

How do humans do it?

Articulation produces
sound waves which
the ear conveys to the brain
for processing
3

How computers do it?

Acoustic waveform

Acoustic signal

Digitization
Acoustic analysis of the speech
signal
Phoneme dictionary
Language model

Speech recognition

Multilingual Architecture

Multilingual speakers already out-number

monolingual speakers.
The capacity to transparently recognize multiple
spoken languages is a desirable feature of ASR
systems.
eg. OK GOOGLE, SIRI

Multilingual Techniques

Universal Speech Model

Language Identification (LID) classifiers

Monolingual speech recognizers decode along

with LID (Confidence Score)
Dynamic confidence score and LID decision

ASR Multilingual Design

The end-to-end multilingual speech recognition system consists of the

following components:
1. Client
2. Frontend
-Recognize
-Recognize+Search+Synthesis
-Multi-recognize+Search+Synthesis
3. Backend
-LID Backend
-Speech Recognizer Backend
-Web Search Backend
-Voice Synthesizer Backend
9

Multirecognizer Module

Representation of Speech & Speech

Signal

Grammar & Syntax

-How the occurrence of words in sequence is governed

Lexicon or Dictionary

- How a word is supposed to be pronounced as a

sequence of unitary sounds

Acoustic-phonetics

-How a unitary sound and/or a sequence of unitary sounds

are supposed to be produced with the articulatory
apparatus
12

THE HIDDEN MAROV MODEL

The input audio waveform from a microphone is converted into a sequence of

fixed size acoustic vectors Y 1: T = y 1. . . y T in a process called feature
extraction[3]. The decoder then attempts to find the sequence of words w 1: L =
w 1. . . w L which is most likely to have generated Y, i.e. the decoder tries to
find,
w = arg max {P (w|Y)}.
However, since P (w|Y) is difficult to model directly, Bayes Rule is used
to transform above equation into the equivalent problem of finding:
w = arg max {p(Y |w) P (w)}

Arcgitecture of HMM Based

Recognizer

The overall recognition system of speech recognition using HMM includes :

Feature Analysis

Unit Matching System

Lexical Decoding

Syntactic analysis

Semantic Analysis

Phoneme and Topologies

Composite HMM for Vertibri Recogition (Pronunciation Dictionary)

Speechrecognitionfinalpresentation 141124072610 Conversion Gate01
No ratings yet
Speechrecognitionfinalpresentation 141124072610 Conversion Gate01
30 pages
Automatic Speech Recognition (ASR) : Omar Khalil Gómez - Università Di Pisa
100% (1)
Automatic Speech Recognition (ASR) : Omar Khalil Gómez - Università Di Pisa
65 pages
Understanding Speech Recognition Technology
100% (1)
Understanding Speech Recognition Technology
39 pages
Overview of Automatic Speech Recognition
No ratings yet
Overview of Automatic Speech Recognition
35 pages
Speech Recognition Fundamentals Explained
No ratings yet
Speech Recognition Fundamentals Explained
39 pages
A Review On Different Approaches For Speech - Recognition System
No ratings yet
A Review On Different Approaches For Speech - Recognition System
6 pages
Unit 5 UA
No ratings yet
Unit 5 UA
19 pages
Speech Recognition UTHM
No ratings yet
Speech Recognition UTHM
30 pages
Overview of Automatic Speech Recognition
No ratings yet
Overview of Automatic Speech Recognition
77 pages
Speech Recognition System Overview
No ratings yet
Speech Recognition System Overview
14 pages
Voice-Enabled Phone Directory System
No ratings yet
Voice-Enabled Phone Directory System
13 pages
(IJCST-V4I2P62) :Dr.V.Ajantha Devi, Ms.V.Suganya
No ratings yet
(IJCST-V4I2P62) :Dr.V.Ajantha Devi, Ms.V.Suganya
6 pages
Feature Extraction Using PCA
No ratings yet
Feature Extraction Using PCA
36 pages
AI for Speech Recognition Overview
No ratings yet
AI for Speech Recognition Overview
13 pages
Speech Recognition1
No ratings yet
Speech Recognition1
24 pages
Understanding Automatic Speech Recognition
No ratings yet
Understanding Automatic Speech Recognition
49 pages
Speech Recognition Technology Overview
No ratings yet
Speech Recognition Technology Overview
19 pages
Persian Speech Recognition via HMM
No ratings yet
Persian Speech Recognition via HMM
9 pages
Understanding Speech Recognition Technology
100% (1)
Understanding Speech Recognition Technology
20 pages
Challenges in Automatic Speech Recognition
No ratings yet
Challenges in Automatic Speech Recognition
34 pages
Speech Recognition Introduction
No ratings yet
Speech Recognition Introduction
8 pages
Understanding Automatic Speech Recognition
No ratings yet
Understanding Automatic Speech Recognition
14 pages
Speech Recognition and ASR Overview
No ratings yet
Speech Recognition and ASR Overview
11 pages
Speech Recognition System Overview
No ratings yet
Speech Recognition System Overview
18 pages
Speech Recognition Project Report 2019-20
No ratings yet
Speech Recognition Project Report 2019-20
40 pages
Speech Recognition System Proposal
No ratings yet
Speech Recognition System Proposal
11 pages
Artificial Intelligence-For Speech Recognition
100% (3)
Artificial Intelligence-For Speech Recognition
13 pages
A Speaker Independent Continuous Speech Recognizer For Amharic
No ratings yet
A Speaker Independent Continuous Speech Recognizer For Amharic
5 pages
Next-Gen Speech Recognition Systems
No ratings yet
Next-Gen Speech Recognition Systems
7 pages
Understanding Speech Recognition Systems
100% (2)
Understanding Speech Recognition Systems
26 pages
Indian Accent Speech Recognition Report
No ratings yet
Indian Accent Speech Recognition Report
14 pages
ASR Course for Informatics Students
No ratings yet
ASR Course for Informatics Students
43 pages
Overview of Speech Recognition Techniques
No ratings yet
Overview of Speech Recognition Techniques
65 pages
Speech Recognition
No ratings yet
Speech Recognition
4 pages
Speech Recognition Seminar Report
No ratings yet
Speech Recognition Seminar Report
32 pages
Comparative Analysis of Automatic Speech Recognition Techniques
No ratings yet
Comparative Analysis of Automatic Speech Recognition Techniques
8 pages
Overview of Automatic Speech Recognition
No ratings yet
Overview of Automatic Speech Recognition
28 pages
Understanding Speech Recognition Technology
100% (1)
Understanding Speech Recognition Technology
17 pages
Speech Recognition System Design Overview
No ratings yet
Speech Recognition System Design Overview
5 pages
Overview of Speech Recognition Systems
No ratings yet
Overview of Speech Recognition Systems
14 pages
Overview of Speech Recognition Systems
No ratings yet
Overview of Speech Recognition Systems
16 pages
Speech Recognition Architecture - Detailed View: 1. Acoustic Front-End (Feature Extraction)
No ratings yet
Speech Recognition Architecture - Detailed View: 1. Acoustic Front-End (Feature Extraction)
3 pages
Phases of Speech Recognition
No ratings yet
Phases of Speech Recognition
2 pages
Automatic Speech Recognition System Report
No ratings yet
Automatic Speech Recognition System Report
25 pages
Speech Recognition Seminar Report
87% (97)
Speech Recognition Seminar Report
32 pages
Speech Recognition with Neural Networks
No ratings yet
Speech Recognition with Neural Networks
23 pages
Speech Recognition Course Guide
No ratings yet
Speech Recognition Course Guide
74 pages
Overview of Speech Recognition Technology
No ratings yet
Overview of Speech Recognition Technology
23 pages
Understanding Speech Recognition Technology
No ratings yet
Understanding Speech Recognition Technology
26 pages
Speech Recognition As Emerging Revolutionary Technology
No ratings yet
Speech Recognition As Emerging Revolutionary Technology
4 pages
Automatic Speech Recognition Study
100% (1)
Automatic Speech Recognition Study
2 pages
NLP 1.3.1 - Speed Recogmnition
No ratings yet
NLP 1.3.1 - Speed Recogmnition
20 pages
Understanding Speech Recognition Technology
No ratings yet
Understanding Speech Recognition Technology
4 pages
Speech Technology
No ratings yet
Speech Technology
5 pages
Understanding Automatic Speech Recognition
No ratings yet
Understanding Automatic Speech Recognition
9 pages
Speech Technology Basics
No ratings yet
Speech Technology Basics
15 pages