Welcome to Scribd!

Speech Recogistion

Uploaded by

0% found this document useful (0 votes)

78 views15 pages

This document provides an overview of speech recognition systems. It discusses the challenges of speech recognition, the steps involved which include digitization, signal processing, phonetics, phonology, lexicology, syntax, and pragmatics. It also outlines some common use cases and packages required, such as SpeechRecognition and Pocketsphinx. The advantages include improved efficiency while the disadvantages include a lack of accuracy and issues with accents, background noise and initial training costs.

Original Description:

Copyright

Available Formats

PPT, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPT, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

78 views15 pages

Speech Recogistion

Uploaded by

Ashwani Singh

Copyright:

Available Formats

Download as PPT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 15

Search inside document

Speech Recognition

System
Contents
• Introduction
• Challenges of Speech Recognition
• Steps of Speech Recognition
• Required packages
• Use cases
• Advantages
• Disadvantages
• Conclusion

2
Introduction
What is the task?
• Getting a computer to understand spoken
language
• By “understand” we might mean
– React appropriately
– Convert the input speech into another
medium, e.g. text
• Several variables impinge on this (see later)

3
Introduction
How humans do it?

Articulation produces
sound waves which
the ear conveys to the brain
for processing
4
Introduction
How might computers do it?

Acoustic
Acoustic signal
waveform

• Digitization
• Acoustic analysis of the Speech
speech signal recognition
• Linguistic interpretation
5
Challenges

• Style of speaking
• Environment
• Speaker characteristics
• Task specifiers

6/34
Steps of Speech Recognition
• Digitization
– Converting analogue signal into digital representation
• Signal processing
– Separating speech from background noise
• Phonetics
– Variability in human speech
• Phonology
– Recognizing individual sound distinctions (similar phonemes)
• Lexicology and syntax
– Disambiguating homophones
– Features of continuous speech
• Syntax and pragmatics
– Interpreting prosodic features
• Pragmatics
– Filtering of performance errors (disfluencies)
7
Required Packages
• SpeechRecognition: The package has a Recognizer
class which is used to recognize the speech. Following
are seven methods which can read various audio
sources using different APIs.
• recognize_bing( )
• recognize_google( )
• recognize_google_cloud( )
• recognize_houndify( )
• recognize_ibm( )
• recognize_wit( )
• recognize_sphinx( )

8
Required Packages

• Pocketsphinx: recognize_sphinx API can be used to

run the speech recognition system offline as well. It
requires the installation of Pocketsphinx.
• PyAudio: To use the microphones, we will have to install
pyaudio module as well. We use the microphone class to
get the input speech from the microphone.

9
Sample Code
import speechrecognition as sr
r = sr.Recognizer() #instance of recognizer class
with sr.Microphone() as source:
audio = sr.listen(source) #listen to the voice
try:
get = r2.recognize_google(audio) #process the received audio
print(get) #print the received audio
except sr.UnknownValueError:
print('error’)

Output:
This program will show the input speech as a text output

10
Use Cases
• Search for documents on your computer.
• Print documents on request.
• Dictate the information you want to be
incorporated into a document.
• Set reminders with voice command.

11
Advantages
• Work processes become more efficient.
• Saves a great deal of labor.
• Improves efficiency, leads to more structured
work.
• Aiding the Visually- and Hearing-Impaired.
• Enabling Hands Free Technology.

12
Disadvantages
• Lack of Accuracy and Misinterpretation
• Accents and Speech Recognition
• Background Noise Interference
• Misused with pre-recorded verbal message
• Initial training cost high and poor productivity

13
Conclusion
At some point in future, speech recognition may become
speech understanding.
The statistical models that allow computers to decide what
a person just said may someday allow the to grasp the
meaning behind the words.
Although it is a huge leap in terms of computational power
and software sophistication, some researchers argue that
speech recognition development offers the most direct line
from the computers of today to true artificial intelligence.

14
Thank you

Meagan Hall-Interview 1
Document17 pages
Meagan Hall-Interview 1
FOX 17 News
100% (1)
Voice Technology Seminar
Document35 pages
Voice Technology Seminar
keerthi reddy
69% (16)
IMC Plan-Objectives & Budgeting
Document41 pages
IMC Plan-Objectives & Budgeting
MEDISHETTY MANICHANDANA
No ratings yet
Automatic Speech Recognition
Document9 pages
Automatic Speech Recognition
Ashwani Singh
No ratings yet
Seminar Group 5
Document28 pages
Seminar Group 5
Jaleta Jarso
No ratings yet
Voice Recognition
Document16 pages
Voice Recognition
Surya Karki
No ratings yet
Module 2 - Intelligent Systems
Document7 pages
Module 2 - Intelligent Systems
Paul Bokingkito
No ratings yet
Applications of Speech Processing: by Arun Baalaaji S
Document11 pages
Applications of Speech Processing: by Arun Baalaaji S
shruthi
No ratings yet
Artificial Intelligence For Speech Recognition
Document32 pages
Artificial Intelligence For Speech Recognition
ImranShareef
No ratings yet
SPEECH RECOGNITION SYSTEM Final
Document16 pages
SPEECH RECOGNITION SYSTEM Final
Mard Geer
No ratings yet
Journalsresaim Ijresm v3 I7 32
Document3 pages
Journalsresaim Ijresm v3 I7 32
srujan mahajan
No ratings yet
Speech To Text
Document4 pages
Speech To Text
Arun Nishad
No ratings yet
Module 1
Document117 pages
Module 1
Vasu V
No ratings yet
01 - Foundations of Information System Structure
Document16 pages
01 - Foundations of Information System Structure
விக்னேஸ்வரன் பா. ஆறுமுகம்
No ratings yet
Speech Recognition
Document27 pages
Speech Recognition
Lokendra Singh Shekhawat
0% (1)
Summary of Presentation
Document2 pages
Summary of Presentation
DineshPabbi
No ratings yet
How Speech Recognition Works: Hidden Markov Model
Document25 pages
How Speech Recognition Works: Hidden Markov Model
Bandi Yunus Parvez
No ratings yet
Via 1 Voice 05041
Document24 pages
Via 1 Voice 05041
Ankit Baranwal
No ratings yet
First Evaluation
Document37 pages
First Evaluation
Aditya Sawant
No ratings yet
006 Natural Language Processing
Document16 pages
006 Natural Language Processing
mohammed almehdhar
No ratings yet
Introduction To Artificial Intelligence
Document19 pages
Introduction To Artificial Intelligence
Mard Geer
No ratings yet
Synopsis
Document6 pages
Synopsis
17-Dhamdhere Atharva
No ratings yet
Preliminary Synopsis Report 2021-22
Document12 pages
Preliminary Synopsis Report 2021-22
NEWBIE HU
No ratings yet
Voice Recognition Using Python
Document24 pages
Voice Recognition Using Python
MA SHAIK SHOYEB
No ratings yet
CBCT2203 - Topic 6
Document13 pages
CBCT2203 - Topic 6
Faidz Fuad
No ratings yet
CN Assignment 1A
Document12 pages
CN Assignment 1A
Arya Singh
No ratings yet
Voice Assisstant
Document18 pages
Voice Assisstant
NAVEEN KUMAR S ECE
No ratings yet
Lecture 2 Two Research Arears
Document17 pages
Lecture 2 Two Research Arears
jhn75070
No ratings yet
Module1 Vtu Python Notes
Document114 pages
Module1 Vtu Python Notes
rakshitaj joshi
No ratings yet
Speech
Document18 pages
Speech
Soumya Abbathini
No ratings yet
05 eSCO-IoT-ch4-v4
Document51 pages
05 eSCO-IoT-ch4-v4
Yahya Hajali
No ratings yet
Vivek Kumar - 1613112052
Document7 pages
Vivek Kumar - 1613112052
LiNu
No ratings yet
JETIR1902381
Document4 pages
JETIR1902381
Vinay Singh
No ratings yet
Project Report
Document16 pages
Project Report
Beena Tyagi
No ratings yet
Alok Seminar Project
Document16 pages
Alok Seminar Project
Reem
No ratings yet
1 Topic One - Introduction
Document71 pages
1 Topic One - Introduction
amy qwizy
No ratings yet
4 Computer Programming
Document30 pages
4 Computer Programming
Jeff Hambre
No ratings yet
Personal Intelligent Assistance: Doniya Antony M.Tech Csis RET19CSCY07
Document43 pages
Personal Intelligent Assistance: Doniya Antony M.Tech Csis RET19CSCY07
doniya antony
No ratings yet
BCV of Cognegica Networks
Document21 pages
BCV of Cognegica Networks
pet tube
No ratings yet
Computer Programming I (Python) : Dr. Sami Al-Maqtari
Document170 pages
Computer Programming I (Python) : Dr. Sami Al-Maqtari
Ahmed
No ratings yet
Python & Anaconda
Document6 pages
Python & Anaconda
MANISH SIKHWAL
No ratings yet
Nlpslide
Document21 pages
Nlpslide
Melkamu Zinabu
No ratings yet
Tejaswini Group Report
Document18 pages
Tejaswini Group Report
Riya
No ratings yet
Computer Programming 1
Document27 pages
Computer Programming 1
Jizelle Ellero
No ratings yet
CASE STUDY - Speech Recognition
Document25 pages
CASE STUDY - Speech Recognition
naina nautiyal
No ratings yet
Principles of Programming Language: B.Tech
Document121 pages
Principles of Programming Language: B.Tech
Ro Han
No ratings yet
1.4. General Approaches For Building Intelligent Systems
Document21 pages
1.4. General Approaches For Building Intelligent Systems
yagoencuestas
No ratings yet
Virtual Personal Assistant For The Blind
Document3 pages
Virtual Personal Assistant For The Blind
Rushi
No ratings yet
Book Reading System For BlindPeople
Document60 pages
Book Reading System For BlindPeople
yashvant
No ratings yet
Research On Speech Recognition Technique While Building Speech Recognition Bot
Document13 pages
Research On Speech Recognition Technique While Building Speech Recognition Bot
Burhan Rajput
No ratings yet
Minor Project123
Document40 pages
Minor Project123
Sandeep Yadav
No ratings yet
25 The Comprehensive Analysis Speech Recognition System
Document5 pages
25 The Comprehensive Analysis Speech Recognition System
Ibrahim Lukman
No ratings yet
Digital Speech Recognition: Presented By:JYOTI Roll NO-56
Document13 pages
Digital Speech Recognition: Presented By:JYOTI Roll NO-56
Jyoti Manish Garg
No ratings yet
Speech APIs Fact Sheet
Document2 pages
Speech APIs Fact Sheet
scri
No ratings yet
Siri
Document25 pages
Siri
raashi005
No ratings yet
Speech Emotion Recognition and Classification Using Deep Learning
Document39 pages
Speech Emotion Recognition and Classification Using Deep Learning
John Cena
100% (1)
11 SDD Final Chapter Summaries
Document8 pages
11 SDD Final Chapter Summaries
ashleyblackbeak
No ratings yet
Natural Language Processing: All You Need To Know About
Document45 pages
Natural Language Processing: All You Need To Know About
Chaitanya Sai
No ratings yet
Daksh Negi Project File
Document20 pages
Daksh Negi Project File
Daksh Negi
No ratings yet
Bhawini NLP File
Document100 pages
Bhawini NLP File
Bhawini Raj
No ratings yet
Basic Guide to Programming Languages Python, JavaScript, and Ruby
From Everand
Basic Guide to Programming Languages Python, JavaScript, and Ruby
Kiet Huynh
No ratings yet
Trackpad Pro Ver. 5.0 Class 4
From Everand
Trackpad Pro Ver. 5.0 Class 4
Nidhi Arora
No ratings yet
MCQs On Listening
Document15 pages
MCQs On Listening
Shah Khan
No ratings yet
409-Article Text-1147-1-10-20190419 PDF
Document23 pages
409-Article Text-1147-1-10-20190419 PDF
Arianne Vocalan
100% (1)
"I Am Not Complaining"-Ambivalence Construct in Schizoid Personality Disorder
Document21 pages
"I Am Not Complaining"-Ambivalence Construct in Schizoid Personality Disorder
Sorku Virenze
No ratings yet
Essay Review
Document35 pages
Essay Review
Tika Virginiya
No ratings yet
CSUF Daily WL Lesson Plan: (Minutes)
Document4 pages
CSUF Daily WL Lesson Plan: (Minutes)
api-388348804
No ratings yet
Homosexuality
Document36 pages
Homosexuality
Zerlin Duran
100% (2)
Outline of Relevance Theory : Deirdre Wilson and Dan Sperber
Document22 pages
Outline of Relevance Theory : Deirdre Wilson and Dan Sperber
cuencantik
No ratings yet
Examen Awareness Notes
Document2 pages
Examen Awareness Notes
Alexandra Jagualing
No ratings yet
Developmental Stages of Erikson
Document20 pages
Developmental Stages of Erikson
Nirmal Raj
No ratings yet
Exam Practice Test 1
Document25 pages
Exam Practice Test 1
Patricia Bowe
No ratings yet
Pretest-Posttest Designs - Experimental Research
Document11 pages
Pretest-Posttest Designs - Experimental Research
Neseth Eleuterio Badato
No ratings yet
Team Nursing
Document4 pages
Team Nursing
Dawn Navarro
No ratings yet
St. Xavier's College, BMM 2013 Yearbook
Document141 pages
St. Xavier's College, BMM 2013 Yearbook
taabarshad
No ratings yet
Career Advice British English Student Ver2 BW
Document6 pages
Career Advice British English Student Ver2 BW
Radu Andreea
No ratings yet
Listening Cae Test
Document3 pages
Listening Cae Test
RejaneQuilleré
No ratings yet
Einas Mansour - Curriculum Vitae
Document3 pages
Einas Mansour - Curriculum Vitae
Einas Mansour
No ratings yet
(FAM) Family Communication (Communication Series)
Document505 pages
(FAM) Family Communication (Communication Series)
Meeru Mercury
100% (1)
Mixed Methods Research - Design and Procedures - by John W Creswell - zp37294
Document42 pages
Mixed Methods Research - Design and Procedures - by John W Creswell - zp37294
brianna rowe
No ratings yet
Mediation Skills
Document4 pages
Mediation Skills
Mirudhula a
No ratings yet
(1959) - Campbell, D. T., & Fiske, D. W. Convergent and Ant Validation by The Multitrait-Multimethod Matrix. Psychological Bulletin, 56
Document25 pages
(1959) - Campbell, D. T., & Fiske, D. W. Convergent and Ant Validation by The Multitrait-Multimethod Matrix. Psychological Bulletin, 56
Roby
No ratings yet
Frankenstein Grade 11 Lesson Take A Stand
Document3 pages
Frankenstein Grade 11 Lesson Take A Stand
megan_grandmont
No ratings yet
Catálogo Expo: Best - Ed: La Nube
Document37 pages
Catálogo Expo: Best - Ed: La Nube
MALO DE MOLINA DA SILVA
No ratings yet
Practice Based Research Literature Review June 2014
Document61 pages
Practice Based Research Literature Review June 2014
Anonymous uFZHfqpB
100% (1)
Harvey (2021) Reliability Analysis Guide Preprint
Document13 pages
Harvey (2021) Reliability Analysis Guide Preprint
jim alex
No ratings yet
Assignment Solutions Guide (2020-2021) : MPC 003: Personality: Theories and Assessment
Document22 pages
Assignment Solutions Guide (2020-2021) : MPC 003: Personality: Theories and Assessment
Swarnali Mitra
100% (1)
A Measure of Delight: The Pursuit of Quality at AT&T Universal Card Services
Document5 pages
A Measure of Delight: The Pursuit of Quality at AT&T Universal Card Services
TUSHAR TRIPATHI
No ratings yet
My Resume-Rolando
Document1 page
My Resume-Rolando
api-273071843
No ratings yet
The Tortoise & The Ducks
Document9 pages
The Tortoise & The Ducks
Donnette Davis
100% (2)