Speech Processing: Binit Mohanty

Uploaded by

Akshay Kagwade

0% found this document useful (0 votes)

12 views16 pages

Original Title

Speech Processing

Copyright

Available Formats

PPT, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPT, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

12 views16 pages

Speech Processing: Binit Mohanty

Uploaded by

Akshay Kagwade

Copyright:

Available Formats

Download as PPT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 16

Search inside document

SPEECH PROCESSING

BINIT MOHANTY
binit.mohanty@gmail.com
Why Speech?
• No visual contact required
• No special equipment required
• Can be done while doing other things

• Telephones – AT&T
• Mobile Phones (1G and 2G)
Speech Processing
• Speech Coding
• Speech Synthesis
• Speech Recognition
• Speaker Recognition/Verification
• Dyslexia and Auditory problems

• Audio Engineering
Speech Coding
• Compress a Speech File
• Why not use standard compression
techniques?

• MP3 Format
– Perceptual Coding
– Exploits sensory organ biases
Speech Synthesis
• Construct Speech waveform from words
• Speaker Quality and Accent
• Prosody?

• http://www.research.att.com/~ttsweb/tts/demo.php
Speech Recognition
• Convert a sound waveform to words
• The most relevant and important task in
the industry
• 90% in lab conditions, much lower in
factory conditions

• Sphinx by CMU, ViaVoce by IBM & SDK

by Microsoft
Speaker Recognition
• Concerned with Biometrics
• Acceptable as a verification technique
• How would this be different from Speech
recognition?
– Speaker Quality
– Prosody
– Pitch, Accent etc.
Dyslexia & Auditory Problems
• Study Voice and Ear defects
• Detect and correct Speech Disfluencies –
CMU
• Development of better Ear substitutes –
Cochlear Implants
Audio Engineering
• Adding effects to sound
• Clarity of reproduction
• A Big industry with players like – Dolby,
Bose, Phillips etc

• Voice Morphing!

SOURCE TARGET CONV 1 CONV 2

Courtesy: Hui Ye & Steve Young, Cambridge

Automatic Speech Recognition
• Most Important Task
• Hardest Task
– Co-articulation: Two speakers speaking at the
same time
– Speaker Variation
– Spontaneity
– Language Modeling
– Noise Robustness
ASR: Problems

ASR: Method

ASR: Application

Automatic Speech Recognition

Speech Production

Speech Processing: Binit Mohanty
Document16 pages
Speech Processing: Binit Mohanty
Siddharth Wankhede
No ratings yet
Speech Processing
Document16 pages
Speech Processing
chayan_m_shah
No ratings yet
Speech Recognition
Document27 pages
Speech Recognition
Lokendra Singh Shekhawat
0% (1)
Mr. Sibananda Panda Mca 4 Semister
Document18 pages
Mr. Sibananda Panda Mca 4 Semister
Amber Agrawal
No ratings yet
Voice Search Using Python: B Pavan Kumar 16BD1A051R
Document11 pages
Voice Search Using Python: B Pavan Kumar 16BD1A051R
pavan kumar
No ratings yet
Digital Speech Processing
Document46 pages
Digital Speech Processing
prabha
No ratings yet
Artificial Intelligence For Speech Recognition
Document32 pages
Artificial Intelligence For Speech Recognition
ImranShareef
No ratings yet
Speech Recognition Technology
Document23 pages
Speech Recognition Technology
sambit subhasish sahu
No ratings yet
EEE 6211 Digital Speech Processing: Course Instructor Dr. Mohammad Ariful Haque Professor, Dept. of EEE, BUET
Document16 pages
EEE 6211 Digital Speech Processing: Course Instructor Dr. Mohammad Ariful Haque Professor, Dept. of EEE, BUET
Stevs Shamim
No ratings yet
Speech Recognition UTHM
Document30 pages
Speech Recognition UTHM
Dineshwaran Daniel Gunalan
No ratings yet
Design and Implementation
Document74 pages
Design and Implementation
Em
No ratings yet
Voice Recognition System: Third Year Electronics, Third Year Electronics
Document14 pages
Voice Recognition System: Third Year Electronics, Third Year Electronics
Nimesh Salunkhe
No ratings yet
Professional, Amateur and Machine Voice-Over
Document10 pages
Professional, Amateur and Machine Voice-Over
Sharan babu
No ratings yet
Automatic Speech Recognition
Document9 pages
Automatic Speech Recognition
Ashwani Singh
No ratings yet
Alok Seminar Project
Document16 pages
Alok Seminar Project
Reem
No ratings yet
Learning by Ear RDTBL Handout2
Document30 pages
Learning by Ear RDTBL Handout2
Mary Ellen Bornak
No ratings yet
Introductory Guide To Voiceover
From Everand
Introductory Guide To Voiceover
Dan Friedman
No ratings yet
A Brief Introduction To Automatic Speech Recognition
Document22 pages
A Brief Introduction To Automatic Speech Recognition
Pham Thanh Phu
No ratings yet
Summary of Presentation
Document2 pages
Summary of Presentation
DineshPabbi
No ratings yet
Speech Recognition (Dr. M. Sabarimalai Manikandan
Document2 pages
Speech Recognition (Dr. M. Sabarimalai Manikandan
asmmjan
No ratings yet
MTA 254 Sound: Theo Lipfert
Document18 pages
MTA 254 Sound: Theo Lipfert
tlipfert
No ratings yet
Speech Recogistion
Document15 pages
Speech Recogistion
Ashwani Singh
No ratings yet
Audio Visual Speech Recognition
Document16 pages
Audio Visual Speech Recognition
Amr
No ratings yet
Etman Paper1
Document13 pages
Etman Paper1
Sana Isam
No ratings yet
Artificial Intelligence-For Speech Recognition
Document13 pages
Artificial Intelligence-For Speech Recognition
maneesh manu
100% (3)
Artificial Intelligence For Speech Recognition
Document13 pages
Artificial Intelligence For Speech Recognition
Aditya Sahu
No ratings yet
Voice Technology Seminar
Document35 pages
Voice Technology Seminar
keerthi reddy
69% (16)
Speech Recognition For Mobile Systems: BY: Pratibha Channamsetty Shruthi Sambasivan
Document36 pages
Speech Recognition For Mobile Systems: BY: Pratibha Channamsetty Shruthi Sambasivan
Taweem Rouhi
No ratings yet
Audioppt
Document30 pages
Audioppt
jai prakash naidu
No ratings yet
Ug Speech Speech
Document39 pages
Ug Speech Speech
api-3731921
No ratings yet
Speech Recognition Presentation
Document36 pages
Speech Recognition Presentation
Prafull Agrawal
100% (1)
Computer Based Automatic Speech Processing: Pham Van Tuan
Document70 pages
Computer Based Automatic Speech Processing: Pham Van Tuan
hondaitodung
No ratings yet
CASE STUDY - Speech Recognition
Document25 pages
CASE STUDY - Speech Recognition
naina nautiyal
No ratings yet
Topic 5 - Format
Document26 pages
Topic 5 - Format
Celine Hautea Francisco
No ratings yet
A Framework For Deepfake V2
Document24 pages
A Framework For Deepfake V2
Abdullah fawaz altulahi
No ratings yet
Voice Controlled Robot With Wireless Video Transmission
Document57 pages
Voice Controlled Robot With Wireless Video Transmission
Shreya Shetty
No ratings yet
So, You Want To Be An Audio Engineer: A Complete Beginners Guide.: So, You Want to Be An Audio Engineer, #1
From Everand
So, You Want To Be An Audio Engineer: A Complete Beginners Guide.: So, You Want to Be An Audio Engineer, #1
Kevin Parker
No ratings yet
Mastering Voice Interfaces: Creating Great Voice Apps for Real Users
From Everand
Mastering Voice Interfaces: Creating Great Voice Apps for Real Users
Ann Thymé-Gobbel
No ratings yet
Audio Information and Media
Document26 pages
Audio Information and Media
Sophia Bernardo
No ratings yet
Professional Development Workshop: Jobs in The Industry
Document27 pages
Professional Development Workshop: Jobs in The Industry
umang
No ratings yet
Universal Design For Learning
Document56 pages
Universal Design For Learning
George_200
No ratings yet
Work Experience: Quality Control and Quality Assurance
Document2 pages
Work Experience: Quality Control and Quality Assurance
api-26407695
No ratings yet
Natural Language Processing: by Dr. Parminder Kaur
Document26 pages
Natural Language Processing: by Dr. Parminder Kaur
Riya jain
No ratings yet
SPEECH RECOGNITION SYSTEM Final
Document16 pages
SPEECH RECOGNITION SYSTEM Final
Mard Geer
No ratings yet
Speech Recognition and Its Clinical Applications
Document23 pages
Speech Recognition and Its Clinical Applications
Naga Venkata Kiran G
No ratings yet
Call Development 2013
Document17 pages
Call Development 2013
Hisyam Ahmad
No ratings yet
Silent Sound Technology: Seminar On
Document19 pages
Silent Sound Technology: Seminar On
Rashmitha Patel
No ratings yet
Voice Recognition
Document16 pages
Voice Recognition
Surya Karki
No ratings yet
Voice Assisstant
Document18 pages
Voice Assisstant
NAVEEN KUMAR S ECE
No ratings yet
Voice Biometrics Whitepaper
Document5 pages
Voice Biometrics Whitepaper
juanperez23
No ratings yet
Peech Ecognition: World OF Opportunities
Document12 pages
Peech Ecognition: World OF Opportunities
Doleanu Mihai-Gabriel
No ratings yet
Synthesizing Obama: Learning Lip Sync From Audio: Supasorn Suwajanakorn, Steven M. Seitz, and Ira Kemelmacher-Shlizerman
Document13 pages
Synthesizing Obama: Learning Lip Sync From Audio: Supasorn Suwajanakorn, Steven M. Seitz, and Ira Kemelmacher-Shlizerman
inaseaofirrelevance
No ratings yet
Module 2 - Intelligent Systems
Document7 pages
Module 2 - Intelligent Systems
Paul Bokingkito
No ratings yet
Lesson 4
Document12 pages
Lesson 4
Angela Garcia
No ratings yet
Automatic Subtitle Generator
Document25 pages
Automatic Subtitle Generator
ravi060791
0% (1)
Sound Advice: Voiceover from an Audio Engineer's Perspective
From Everand
Sound Advice: Voiceover from an Audio Engineer's Perspective
Dan Friedman
No ratings yet
Introduction To NLP: Natural Language Processing
Document21 pages
Introduction To NLP: Natural Language Processing
Rohit RBr
No ratings yet
Synopsis-2 and 3 Page
Document2 pages
Synopsis-2 and 3 Page
pratyush parmar
No ratings yet
Rev Script
Document2 pages
Rev Script
leah manuel
No ratings yet
Applications of Speech Processing: by Arun Baalaaji S
Document11 pages
Applications of Speech Processing: by Arun Baalaaji S
shruthi
No ratings yet
Keypoint Density-Based Region Proposal For Fine-Grained Object Detection Using Regions With Convolutional Neural Network Features
Document6 pages
Keypoint Density-Based Region Proposal For Fine-Grained Object Detection Using Regions With Convolutional Neural Network Features
Akshay Kagwade
No ratings yet
Region Proposing Network1
Document4 pages
Region Proposing Network1
Akshay Kagwade
No ratings yet
National University of Defense Technology, Changsha, Hunan, 410073, China
Document4 pages
National University of Defense Technology, Changsha, Hunan, 410073, China
Akshay Kagwade
No ratings yet
Final Project11
Document29 pages
Final Project11
Akshay Kagwade
No ratings yet
Sustainable Smart Cities: Snigdho Majumdar
Document17 pages
Sustainable Smart Cities: Snigdho Majumdar
Akshay Kagwade
No ratings yet