Welcome to Scribd!

Synopsis Format 2014 2015

Uploaded by

0% found this document useful (0 votes)

33 views5 pages

This document provides a synopsis for a student project that aims to develop a speech recognition system using both audio and visual cues. The project will recognize 10 English words with at least 90% accuracy in noisy environments. It will involve processing audio signals to extract features, processing video signals to analyze lip movements, and synchronizing audio and visual data for pattern recognition training. The project is scheduled to be carried out from January to May 2015, involving processing signals, extracting features, training recognition models, and performance analysis. It will be conducted under the guidance of designated guides from the institution.

Original Description:

synopsis project mit 8th sem

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

33 views5 pages

Synopsis Format 2014 2015

Uploaded by

Hacralo

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 5

Search inside document

A

Project

SYNOPSIS
on

PROJECT TITLE

Submitted by

Student Name
Reg. No:
Section:
Roll No.:

Under the guidance of

GUIDE NAME
(External if any)
Designation
Company Name

GUIDE NAME
(Internal)
Designation Department Name

DEPARTMENT OF ELECTRONICS AND COMMUNICATION ENGINEERING

MANIPAL INSTITUTE OF TECHNOLOGY

Manipal University
MANIPAL 576104, KARNATAKA, INDIA

Details of the organization

(with postal address):

Name of Guide with contact

details and email address:

Date of commencement of
the project:

Signature of Guide with

seal:

1. Introduction
Language is man's most important means of communication and speech its primary
medium. A speech signal is a complex combination of a variety of airborne pressure
waveforms. This complex pattern must be detected by the human auditory system and
decoded by the brain. This can be done by using a combination of audio and visual cues to
perceive speech more effectively. The project aims to emulate this mechanism in human
machine communication systems by exploiting the acoustic and visual properties of human
speech.

2. Need for the project

Current speech recognition engines employing only acoustic features are not 100%
robust. Visual cues can be used to undermine the ambiguity in the auditory modality. Hence a
flexible and reliable system for speech perception can be designed which finds a variety of
applications in:
Dictation systems
Voice Based Communications in tele-banking, voice mail, data-base query systems,
information retrieval systems, etc.
System Control in automobiles, robotics, airplanes, etc.
Security systems for speaker verification
3. Objective
Recognize 10 English words (speaker independent) with at least 90% accuracy in a noisy
environment.
4. Methodology
The project is carried out in into following parts
Processing of Audio Signals
o Detection of end points to demarcate word boundaries
o Analysis of various acoustic features such as pitch and formants, energy and time
difference of speech signals, etc.
o Extraction of selected features
Processing of Video Signals

o Demarcate frames from the video sequence

o Identify faces, and then lip regions
o Extract features from the lip profile
Recognition of Speech by synchronizing Audio and Visual Data
o Synchronize audio and video features for pattern recognition using standardized
algorithms
o Train the system to recognize the spoken word under adverse acoustic conditions.
5. Project Schedule

o Processing of audio signals

January 2015

o Feature extraction from the chosen training database

o Pattern recognition and signature extraction from the features
o Training the HMM with the training set
o Processing of video signals

February 2015

o Feature extraction from the chosen training database

o Pattern recognition and signature extraction from the features

March 2015

o Synchronize audio and video features for pattern recognition

o Extension of training data set to 10 words
o Up gradation of system for speaker independent applications

April 2015
o Performance analysis by comparing results of audio-only
approach with that of joint audio-visual approach
May 2015

o Documentation

6. References
1. Tsuhan Chen, "Audiovisual Speech Processing, Lip Reading and Lip synchronization",
IEEE Signal Processing Magazine, January 2001.
2. R.Chellapa, C.L. Wilson and S. Sirohoey, Human and Machine Recognition of Faces
: A survey, Proceedings of the IEEE, vol 83, no.5 May 1995

Student Details
Student Name
Register Number
Email Address
Student Name
Register Number
Email Address
Project Details
Project Title
Project Duration
Organization Details
Organization Name
Full postal address
with pin code
Website address

Section / Roll No
Phone No (M)
Section / Roll No
Phone No (M)

Date of reporting

Project Title: Synopsis
Document5 pages
Project Title: Synopsis
Eswar Rajesh
No ratings yet
Synopsis-2 and 3 Page
Document2 pages
Synopsis-2 and 3 Page
pratyush parmar
No ratings yet
Utterance Based Speaker Identification
Document14 pages
Utterance Based Speaker Identification
Billy Bryan
No ratings yet
Voice Recognition System: Speech-To-Text: Journal of Applied and Fundamental Sciences November 2015
Document6 pages
Voice Recognition System: Speech-To-Text: Journal of Applied and Fundamental Sciences November 2015
Subramani V
No ratings yet
Voice Recognition System: Speech-To-Text: Journal of Applied and Fundamental Sciences November 2015
Document6 pages
Voice Recognition System: Speech-To-Text: Journal of Applied and Fundamental Sciences November 2015
Subramani V
No ratings yet
Specimen of Project Specification Proposal
Document2 pages
Specimen of Project Specification Proposal
Samantha Sou
No ratings yet
Progress - Report - of - Intership MD Shams Alam
Document4 pages
Progress - Report - of - Intership MD Shams Alam
m s Alam
No ratings yet
Speech To Text
Document6 pages
Speech To Text
Tint Swe Oo
No ratings yet
ENTERFACE 2010 Project Proposal: 1. Introduction and Project Objectives
Document7 pages
ENTERFACE 2010 Project Proposal: 1. Introduction and Project Objectives
hajra
No ratings yet
Speech Recognition PPT F
Document16 pages
Speech Recognition PPT F
Ramesh k
100% (2)
Voice Recognition System Speech To Text
Document5 pages
Voice Recognition System Speech To Text
Ibrahim Lukman
No ratings yet
Performance Improvement of Speaker Recognition System
Document6 pages
Performance Improvement of Speaker Recognition System
Shiv Ram Ch
No ratings yet
A Review On Automatic Speech Recognition Architect
Document13 pages
A Review On Automatic Speech Recognition Architect
harinin.cs21
No ratings yet
A Review On Feature Extraction and Noise Reduction Technique
Document6 pages
A Review On Feature Extraction and Noise Reduction Technique
Wasim Ashfaq
No ratings yet
Speech Recognition Using Neural Networks: A. Types of Speech Utterance
Document24 pages
Speech Recognition Using Neural Networks: A. Types of Speech Utterance
jwalith
No ratings yet
Speech Recognition Report
Document20 pages
Speech Recognition Report
Ramesh k
100% (1)
10.1007@s11042 019 08293 7
Document16 pages
10.1007@s11042 019 08293 7
vaseem akram
No ratings yet
Approved by AICTE, New Delhi Affiliated To Aryabhatta Knowledge University, Patna, BIHAR
Document5 pages
Approved by AICTE, New Delhi Affiliated To Aryabhatta Knowledge University, Patna, BIHAR
Shristi Singh
No ratings yet
An Overview of Text-Independent Speaker Recognitio PDF
Document31 pages
An Overview of Text-Independent Speaker Recognitio PDF
Firoz Alam
No ratings yet
Spasov Ski 2015
Document8 pages
Spasov Ski 2015
Abdelkbir Ws
No ratings yet
Research Papers On Speech Recognition 2013
Document6 pages
Research Papers On Speech Recognition 2013
gvw6y2hv
100% (1)
Speech Recognition Report
Document20 pages
Speech Recognition Report
Ramesh k
No ratings yet
Voice To Text Conversion Using Deep Learning
Document6 pages
Voice To Text Conversion Using Deep Learning
International Journal of Innovative Science and Research Technology
No ratings yet
Joy Sarkar - 20 CSE 012
Document30 pages
Joy Sarkar - 20 CSE 012
Joy Srkr
No ratings yet
EC463 Speech and Audio Signal Processing
Document2 pages
EC463 Speech and Audio Signal Processing
amruth lal.v.
No ratings yet
Sunila
Document6 pages
Sunila
Brijesh Kundu
No ratings yet
Performance Analysis of Combined Wavelet Transform and Artificial Neural Network For Isolated Marathi Digit Recognition
Document7 pages
Performance Analysis of Combined Wavelet Transform and Artificial Neural Network For Isolated Marathi Digit Recognition
atul narkhede
No ratings yet
Design and Implementation of Text To Speech Application For Vision Impaired Students
Document15 pages
Design and Implementation of Text To Speech Application For Vision Impaired Students
Nonny Valentine
100% (2)
An Appraisal On Speech and Emotion Recognition Technologies Based On Machine Learning
Document12 pages
An Appraisal On Speech and Emotion Recognition Technologies Based On Machine Learning
moodle teacher4
No ratings yet
A Review On Speech Recognition Methods: Ram Paul Rajender Kr. Beniwal Rinku Kumar Rohit Saini
Document7 pages
A Review On Speech Recognition Methods: Ram Paul Rajender Kr. Beniwal Rinku Kumar Rohit Saini
Rahul Sharma
No ratings yet
Ai Speech
Document17 pages
Ai Speech
Jishnu Rajendran
No ratings yet
Speaker Identification Using Neural Networks
Document6 pages
Speaker Identification Using Neural Networks
Alberto Sánchez Ruiz
No ratings yet
Singer Identification of Songs Using Pitch Tracking, Cross-Correlation, MFCC Features and Neural Network Classifier
Document19 pages
Singer Identification of Songs Using Pitch Tracking, Cross-Correlation, MFCC Features and Neural Network Classifier
Prashant Raj Singh
No ratings yet
A Review On Feature Extraction and Noise Reduction Technique
Document5 pages
A Review On Feature Extraction and Noise Reduction Technique
Vikas Kumar
No ratings yet
Voice Assistant
Document14 pages
Voice Assistant
JAYESH TALREJA (RA2011033010021)
No ratings yet
A Study On Automatic Speech Recognition
Document2 pages
A Study On Automatic Speech Recognition
International Journal of Innovative Science and Research Technology
100% (1)
Experiment No.07: A.1 Aim
Document16 pages
Experiment No.07: A.1 Aim
NATASHA DOSHI
No ratings yet
A Survey On Speech Recognition With Language Specification
Document5 pages
A Survey On Speech Recognition With Language Specification
Editor IJTSRD
No ratings yet
Jasmeet Seminar Report
Document24 pages
Jasmeet Seminar Report
Navpreet singh
No ratings yet
Towards Neurocomputational Speech and So
Document279 pages
Towards Neurocomputational Speech and So
Devkant Sharma
No ratings yet
Application and Development Prospect of AI Speech Recognition Technology
Document5 pages
Application and Development Prospect of AI Speech Recognition Technology
mounteverest276
No ratings yet
Research Paper On Speech Emotion Recogtion System
Document9 pages
Research Paper On Speech Emotion Recogtion System
Gayathri Shiva
No ratings yet
Spoken Language Understanding: Systems for Extracting Semantic Information from Speech
From Everand
Spoken Language Understanding: Systems for Extracting Semantic Information from Speech
Gokhan Tur
No ratings yet
S.Jairam Krishna (Name) 18311A04AV (REG - NO.) : Silent Sound Technology (Title)
Document23 pages
S.Jairam Krishna (Name) 18311A04AV (REG - NO.) : Silent Sound Technology (Title)
Vishith Reddy Marpadga
No ratings yet
JAWS (Screen Reader)
Document18 pages
JAWS (Screen Reader)
yiho
No ratings yet
Speech Recognition System - A Review: April 2016
Document10 pages
Speech Recognition System - A Review: April 2016
Joyce Joyce
No ratings yet
Artificial Neural Network Based Amharic Language Speaker Recognition
Document12 pages
Artificial Neural Network Based Amharic Language Speaker Recognition
Belete Belay
No ratings yet
Sujets de Projets 2008 2009 Centre MICA
Document47 pages
Sujets de Projets 2008 2009 Centre MICA
bocapxamac
100% (3)
Question
Document17 pages
Question
Joy Srkr
No ratings yet
Nataraj K S: Ducation
Document3 pages
Nataraj K S: Ducation
Sathvick Batchu
No ratings yet
Robust Automatic Speech Recognition: A Bridge to Practical Applications
From Everand
Robust Automatic Speech Recognition: A Bridge to Practical Applications
Jinyu Li
No ratings yet
Signals Final Project Report
Document15 pages
Signals Final Project Report
Akhil Gannamraju
No ratings yet
Speaker Recognition Using MATLAB
Document75 pages
Speaker Recognition Using MATLAB
Pravin Gareta
95% (64)
Final Ser Report
Document46 pages
Final Ser Report
Sujithra Jones
No ratings yet
An Executive Guide Biometrics
From Everand
An Executive Guide Biometrics
alasdair gilchrist
No ratings yet
From Words to Insights: A Deep Dive into Natural Language Processing
From Everand
From Words to Insights: A Deep Dive into Natural Language Processing
Sheldon Morgan David
No ratings yet
Voice Application Development for Android
From Everand
Voice Application Development for Android
Michael F. McTear
Rating: 1 out of 5 stars
1/5 (1)
MPEG-V: Bridging the Virtual and Real World
From Everand
MPEG-V: Bridging the Virtual and Real World
Kyoungro Yoon
No ratings yet
Introduction to EEG- and Speech-Based Emotion Recognition
From Everand
Introduction to EEG- and Speech-Based Emotion Recognition
Priyanka A. Abhang
No ratings yet
Speech Enhancement: A Signal Subspace Perspective
From Everand
Speech Enhancement: A Signal Subspace Perspective
Jacob Benesty
No ratings yet
Photo-Optional: (Can Include Professional Certifications Staring From The Most Recent Ones)
Document1 page
Photo-Optional: (Can Include Professional Certifications Staring From The Most Recent Ones)
Hacralo
No ratings yet
Handout STD Cell Design
Document25 pages
Handout STD Cell Design
Hacralo
No ratings yet
Manipal Institute of Technology: Course Plan
Document3 pages
Manipal Institute of Technology: Course Plan
Hacralo
No ratings yet
Kohavi
Document31 pages
Kohavi
Hacralo
No ratings yet
Manipal Institute of Technology Digital Processing of Speech Signal VI Sem ECE. Assignment No:2
Document1 page
Manipal Institute of Technology Digital Processing of Speech Signal VI Sem ECE. Assignment No:2
Hacralo
No ratings yet
Communication Lab Manual: V Semester B.E (E & C)
Document43 pages
Communication Lab Manual: V Semester B.E (E & C)
Hacralo
No ratings yet
Modulation and Multiplexing: How To Send Data Fast and Far?
Document16 pages
Modulation and Multiplexing: How To Send Data Fast and Far?
Hacralo
100% (1)
VLSI Design
Document4 pages
VLSI Design
Hacralo
No ratings yet
Give Some Name To The Project and Save It To The Folder You Wish To Save It
Document6 pages
Give Some Name To The Project and Save It To The Folder You Wish To Save It
Hacralo
No ratings yet
CN Assignment 1
Document1 page
CN Assignment 1
Hacralo
No ratings yet
Course Plan VLSI Design July 2013
Document4 pages
Course Plan VLSI Design July 2013
Hacralo
No ratings yet
Automatic Test Data Generation For Programs With Integer and Float Variables
Document16 pages
Automatic Test Data Generation For Programs With Integer and Float Variables
Hacralo
No ratings yet
Ec IV Second Tutorial 2013 Maths
Document2 pages
Ec IV Second Tutorial 2013 Maths
Hacralo
No ratings yet
D13A540, EU4SCR - Eng - 01 - 1499912
Document2 pages
D13A540, EU4SCR - Eng - 01 - 1499912
javed samaa
No ratings yet
Natures Candy
Document19 pages
Natures Candy
Fanejeg
No ratings yet
Engineer Noor Ahmad CV
Document5 pages
Engineer Noor Ahmad CV
Sayed Wafi
No ratings yet
Resume 202309040934
Document5 pages
Resume 202309040934
dubai eye
No ratings yet
CRM (Coca Cola)
Document42 pages
CRM (Coca Cola)
Utkarsh Sinha
67% (12)
2018 Master Piping Products Price List
Document84 pages
2018 Master Piping Products Price List
Suman Dey
No ratings yet
SS 671
Document9 pages
SS 671
Ow
No ratings yet
Addendum No.1: Indianapolis Metropolitan Airport T-Hangar Taxilane Rehabilitation IAA Project No. M-12-032
Document22 pages
Addendum No.1: Indianapolis Metropolitan Airport T-Hangar Taxilane Rehabilitation IAA Project No. M-12-032
stretch317
No ratings yet
Exit Exam Plan (New)
Document2 pages
Exit Exam Plan (New)
Eleni Semenhi
100% (1)
Module 8 - Simple Interest and Compound Interest
Document11 pages
Module 8 - Simple Interest and Compound Interest
Dawn Juliana Aran
No ratings yet
Moeller Vol07 - Tab02 Signal Tower PDF
Document46 pages
Moeller Vol07 - Tab02 Signal Tower PDF
Arga Wahyumianto
No ratings yet
Position Paper
Document9 pages
Position Paper
Roel Palmaira
No ratings yet
Rules and Regulations of Asian Parliamentary Debating Format
Document2 pages
Rules and Regulations of Asian Parliamentary Debating Format
mahmud
No ratings yet
Comparison of BD 37 01 and AASHTO LRFD 2
Document59 pages
Comparison of BD 37 01 and AASHTO LRFD 2
Jan Gerona Apostadero
No ratings yet
Address All Ifrs 17 Calculations Across The Organization W Ith A Unified Platform
Document4 pages
Address All Ifrs 17 Calculations Across The Organization W Ith A Unified Platform
the sulistyo
No ratings yet
Marc-André Ter Stegen PES 2021 Stats
Document1 page
Marc-André Ter Stegen PES 2021 Stats
Som Vasna
No ratings yet
Solution Problem 1 Problems Handouts Micro
Document25 pages
Solution Problem 1 Problems Handouts Micro
kokoko
No ratings yet
Define Constitution. What Is The Importance of Constitution in A State?
Document2 pages
Define Constitution. What Is The Importance of Constitution in A State?
Carmela Alfonso
No ratings yet
Research On The Marketing Communication Strategy of Tesla Motors in China Under The Background of New Media
Document5 pages
Research On The Marketing Communication Strategy of Tesla Motors in China Under The Background of New Media
Siddharth Chaudhary
No ratings yet
HOVAL Dati Tecnici Caldaie Inglese
Document57 pages
HOVAL Dati Tecnici Caldaie Inglese
osama alabsi
No ratings yet
Broucher
Document2 pages
Broucher
Vishal Poul
No ratings yet
Response LTR 13 330 Vielmetti
Document2 pages
Response LTR 13 330 Vielmetti
Ann Arbor Government Documents
No ratings yet
Book Shop Inventory
Document21 pages
Book Shop Inventory
Ali Ansari
No ratings yet
WHS Hazard Identification and Incident Reporting Procedure
Document6 pages
WHS Hazard Identification and Incident Reporting Procedure
Jessica Sims
No ratings yet
Ar 2011
Document36 pages
Ar 2011
Micheal J Jacson
No ratings yet
E-Booklet Tacompact Board 2021
Document6 pages
E-Booklet Tacompact Board 2021
emben
No ratings yet
Taxonomy of Parallel Computing Paradigms
Document9 pages
Taxonomy of Parallel Computing Paradigms
sushma
No ratings yet
Np2 Answer
Document13 pages
Np2 Answer
Marie Jhoana
100% (1)
Ferrovial / BAA - A Transforming Acquisition: 3rd July 2006
Document38 pages
Ferrovial / BAA - A Transforming Acquisition: 3rd July 2006
Andrew Yang
No ratings yet
Cassava Starch Granule Structure-Function Properties - Influence of Time and Conditions at Harvest On Four Cultivars of Cassava Starch
Document10 pages
Cassava Starch Granule Structure-Function Properties - Influence of Time and Conditions at Harvest On Four Cultivars of Cassava Starch
wahyuthp43
No ratings yet