BAB I PENDAHULUAN 1.

1 Latar Belakang Berbicara adalah cara berkomunikasi yang paling utama dan merupakan bentuk yang paling alami dan efisien untuk pertukaran informasi antar manusia. Jadi, sangatlah masuk akal bahwa pengembangan future techonology saat ini mengarah pada pengembangan speech recognition bahasa manusia untuk Human Computer Interface. Speech recognition dapat didefinisikan sebagai proses pengubahan sinyal suara menjadi serangkaian kata dengan menggunakan algoritma yang telah diimplementasikan pada program komputer. Speech Recognition atau pengenalan suara adalah bidang ilmu komputer yang berhubungan dengan perancangan sistem komputer yang mampu mengenali kata yang diucapkan, teknologi ini memungkinkan komputer untuk

mengidentifikasi kata – kata yang diucapkan oleh pembicara. Proses Speech Recognition merupakan salah satu fungsi dari

identifikasi suara. Identifikasi suara dapat menjadi nilai tambah dalam sebuah perintah di komputer, identifikasi suara merupakan cara komunikasi natural

antara manusia dan dapat menghasilkan antarmuka yang baik untuk mengontrol suatu sistem atau aplikasi, bahkan suatu mesin dapat memiliki kemampuan atau tingkah laku yang sama seperti manusia salah satunya adalah dapat mengenali suara seseorang secara langsung dan mengerti kata apa yang diucapkan oleh pembicaranya. Salah satu penerapannya adalah pada pengidentifikasian kata dimana pembicara melakukan sebuah perintah dengan ucapan pada program

1

dimana MFCC merupakan salah satu metode analisis sinyal suara yang menyatakan ciri-ciri penting dari sinyal suara dalam bentuk koefisien . Dua hal yang menjadi pertimbangan-pertimbangan dalam mengidentifikasi suara yaitu.koefisien FCC. Inter Speaker Distance (ISD) dan Intra Speaker Variability (ISV).2 komputer. Sedangkan pengenalan polanya menggunakan metode Hidden Markov Model (HMM). efek keletihan. dimana kata yang diucapkan sesuai dan terdapat pada daftar kata didalam database yang berisi record karakter seseorang yang telah tersedia. . ISV disebabkan oleh ketergantungan random lafal pembicara. ISD adalah karakteristik antara pembicara yang dibedakan oleh faktor-faktor distribusi populasi dari kestabilan panjang ucapan pembicara dalam ruang parameter yang relevan. maka pada laporan penelitian tugas akhir ini mengambil topik “Speech Recognition dengan Metode Mel Frequency Cepstrum Coefficients dan Hidden Markov Model berbasis Java “. kondisi badan yang sakit dalam pengucapan vokal dan kondisi lingkungan Dalam proses pengenalan suara untuk pengidentifikasian kata ini menggunakan suatu algoritma ekstraksi ciri yang disebut Mel Frequency Cepstral Coefficients (MFCC) . Berdasarkan uraian permasalahan diatas maka perlu adanya analisis untuk membuat sebuah program speech recognition dari sebuah suara yang diucapkan yang dapat dikenali oleh suatu mesin. dimana metode HMM ini suara dapat diasumsikan sebagai parameter acak dan dicari nilai probabilitas yang maksimum sehingga suara tersebut dapat dikenali dalam pemodelan HMM.

3 Batasan Masalah Berdasarkan latar belakang yang telah diuraikan sebelumnya. komputer. Bagaimana merancang dan membangun sistem yang dapat memproses sinyal suara yang diinputkan dan melakukan proses pengenalan suara menggunakan algoritma ekstrasi ciri Mel Frequency Cepstral Coefficient yang kemudian dikenali dengan menggunakan pemodelan Hidden Markov Model? 3. yaitu : aplikasi.2 Rumusan Masalah Berdasarkan latar belakang masalah yang telah dijelaskan di atas. 3. maka dibuat batasan masalah agar ruang lingkup laporan penelitian ini jelas batasannya. Pengucapan dilakukan sebanyak 10 kali oleh tiap pembicara. 4. Setiap pengucapan dilakukan dengan kecepatan dan kekerasan yang berbeda. dan formasi. kualitas. 2. . Bagaimana merancang dan membangun sistem yang dapat menangkap sinyal suara dan mengubahnya menjadi sinyal digital? 2. maka rumusan masalah dari penelitian ini adalah bagaimana membangun sebuah sistem pengenalan suara yang mampu menangkap sinyal suara dan melakukan proses pengenalan suara yang kemudian dirinci sebagai berikut : 1. termasuk jarak pembicara dengan microphone . Bagaimana sistem yang dibuat dapat mengenali suara yang dimasukkan? 1. teknologi.3 1. Pengucapan dilakukan di tempat yang hening untuk mengurangi noise. Ada 5 kata yang akan diteliti dan menjadi sample dalam pengenalan kata ini. Adapun batasan masalah yang dibuat adalah sebagai berikut : 1.

3. Pembicara yang memasukkan suara dianggap dalam kondisi sehat.4 Tujuan Secara umum tujuan dari pembuatan laporan tugas akhir ini adalah studi tentang konsep dan implementasi dari pengenalan suara. Pengembangan perangkat lunak menggunakan metode Unified Process. Secara spesifik tujuan penelitian tugas akhir ini adalah : 1. terdiri dari 5 orang pria dan 5 orang wanita sehingga jumlah keseluruhan dari sample data dalam penelitian ini sebanyak 500 sample data. 9. 6. Usia pembicara dibatasi antara 20 – 25 tahun. Bahasa pemrograman yang digunakan adalah Java. Output yang dihasilkan adalah kata dikenali atau tidak dikenali. Jumlah pembicara sebanyak 10 orang. Metode yang digunakan adalah Mel Frequency Cepstral Coefficients dan Hidden Markov Model (HMM). . 7. Membangun sistem yang dapat menangkap sinyal suara dan mengubahnya menjadi sinyal digital. 1.4 5. Menguji kemampuan sistem pengenalan suara yang telah dibuat. 8. Membangun sistem yang dapat memproses sinyal suara dan melakukan proses pengenalan suara dengan menerapkan metode Mel Frequency Cepstral Coefficient (MFCC) dan HiddenMarkov Model (HMM). 2. 11. 10.

5 1. baik cetak maupun elektronik.5 Manfaat Adapun manfaat dari penelitian ini adalah menghasilkan sebuah speech recognition system yang mampu mengenali suara yang dimasukkan pembicara. batasan masalah.6 Sistematika Penulisan Tugas akhir ini nantinya disusun dengan sistematika penulisan sebagai berikut : BAB I PENDAHULUAN Bab ini berisi uraian latar belakang. Hasil penelitian ini juga diharapkan dapat menjadi kerangka dalam membangun sistem keamanan berbasis suara maupun sistem perintah suara (command voice) di masa yang akan datang. metode penelitian. tujuan penelitian. Pengembangan perangkat lunak menggunakan metode Unified Process. . BAB II LANDASAN TEORI Pada bab ini membahas tentang teori-teori yang menjadi acuan dalam pembuatan analisa dan pemecahan dari permasalahan yang dibahas. 1. BAB III METODOLOGI PENELITIAN Bab ini berisi metode – metode peneitian yang digunakan. perumusan masalah. sehingga memudahkan penulis dalam menyelesaikan masalah. sistematika penulisan dan tinjaun pustaka. sedangkan penyusuna laporan menggunakan studi literatur dengan mencasri informasi melalui berbagai media. manfaat penelitian.

perancangan proses. BAB VI PENUTUP Bab ini berisi kesimpulan Tugas Akhir dan saran-saran sebagai bahan pertimbangan untuk pengembangan penelitian selanjutnya. Anna Dara Andriana (2011). 1. dengan tingkat keberhasilan 59. Madhav Pandey dan Manoj Shresta (2011) yang membahas mengenai speech recognition. Penelitian tersebut antara lain dilakukan oleh Badri Munawar (2010). Serta desain database dan interface.2 %. Salah satu penelitian sebelumnya yang mendasari penelitian ini adalah penelitian yang dilakukan oleh Badri Munawar yang berjudul “Pengidentifikasian kata dengan menggunakan Metode Hidden Markov Model (HMM) melalui ekstraksi ciri Linear Predictive Coding (LPC)”. MCFF maupun HMM.6 BAB IV ANALISIS DAN PERANCANGAN SISTEM Bab ini berisi gambaran umum dari sistem. .7 Tinjauan Pustaka Penelitian ini didasarkan pada penelitian sebelumnya mengenai speech recognition maupun penelitian yang menggunakan metode MFCC maupun HMM. Penelitian tersebut bertujuan mengimplementasikan metode LPC dan HMM dalam proses pengidentifikasian kata. Nurul Akromah (2013) serta Ganesh Tiwari. pemodelan sistem menggunakan Unified Modelling Process. BAB V IMPLEMENTASI DAN PENGUJIAN SISTEM Bab ini berisi pembahasan mengenai implementasi analisis dan desain ke dalam bahasa pemrograman java dan pengujian aplikasi.

Penelitian ini bertujuan untuk memberikan kemudahan kepada pengguna android dalam mengakses aplikasi doa harian. VQ dan HMM. MFCC. Penelitian lainnya adalah penelitian yang berjudul “Text-prompted remote speaker authentication” yang dilakukan oleh Ganesh Tiwari. Penelitian ini menggunakan metode. Dasar penelitian lainnya adalah penelitian yang dilakukan oleh Nurul Akromah yang berjudul “Membangun sistem perintah suara pada aplikasi doa sehari – hari berbasis Android”. Penelitian ini bertujuan membuat aplikasi login dengan menggunakan perintah suara.7 Penelitian lain dilakukan oleh Anna Dara Andriana yang berjudul “Perangkat lunak untuk membuka aplikasi pada komputer dengan perintah suara menggunakan metode Mel Frequency Cepstral Coefficients (MFCC)”. Penelitian tersebut bertujuan membuat aplikasi perintah suara dengan metode MFCC yang diimplementasikan ke dalam sistem pembuka aplikasi komputer. 5%. Madhav Pandey dan Manoj Shresta. Penelitian ini menghasilkan tingkat keberhasilan 70. .

Sign up to vote on this title
UsefulNot useful