You are on page 1of 4

Nama : Rizky Izatul L.

R NIM : 10650028

Kelas : D

Aplikasi Pengenalan Suara Dalam Pengaksesan Sistem Informasi Akademik


Kemajuan teknologi dalam bidang Pengolahan Sinyal Digital (Digital Signal Processing) telah membawa dampak positif dalam kehidupan manusia. Salah satu disiplin ilmu dalam pengolahan sinyal digital yang memberikan dampak yang cukup besar ialah bidang pengolahan suara digital. Pengolahan suara digital dapat dikembangkan menjadi berbagai aplikasi yang dapat mempermudah kehidupan manusia. Salah satu aplikasi yang dapat dibuat ialah aplikasi untuk pengaksesan informasi. Banyak metode yang dapat digunakan untuk melakukan proses pengenalan suara. Dua kombinasi yang telah banyak terbukti keandalanya ialah LPC (Linear Predictive Coding) sebagai pengekstraksi ciri dan HMM (Hidden Markov Model) sebagai pengenal pola. Pada proses sintesis ucapan digunakan bantuan MBROLA speech engine. Penggunaan tiga metode tersebut dapat digunakan untuk mengakses informasi dengan menggunakan ucapan, sehingga diperoleh informasi dalam bentuk suara. Untuk memaksimalkan kinerja sistem yang telah dibuat, maka dilakukan hal-hal sebagai berikut : 1. Data masukan berupa suara yang merupakan sebuah kata password dari masing-masing pengguna. 2. Dalam proses pengujian, derau (noise) dengan amplitudo melebihi amplitudo ambang yang turut terekam tidak dianggap sebagai masukan yang falid. 3. Format kata password yang di ucapkan hanya berupa sebuah kata. 4. Basisdata informasi dibuat menggunakan Microsoft Office Access 2003 yang berisi nama, IP, dan IPK pengguna. 5. Pembuatan program dilakukan dengan menggunakan bantuan dua bahasa pemograman, yaitu Visual Basic 6 yang digunakan untuk tampilan program dan Matlab 6.5 yang digunakan untuk proses pengenalan ucapan dan membuat parameter suara pengguna. 6. Digunakan LPC dan HMM dalam proses pengenalan suara. 7. Digunakan IndoTTS dalam sistem tulis-ucap.

Dalam perancangan sistem digunakan dua bahasa pemrograman yaitu Matlab 6.5 dan Visual Basic 6. Kedua bahasa pemrograman tersebut berturut-turut berperan dalam proses pengenalan ucapan dan proses pensintesis ucapan. Secara garis besar, jalannya program dapat dilihat pada Gambar 1.

Gambar 1. Diagram alir jalanya program.

Proses diawali dengan Automation yang berfungsi untuk menghubungkan sistem yang telah dibuat pada Matlab 6.5 dengan sistem yang dibuat pada Visual Basic 6. Proses berikutnya yaitu melakukan pengenalan ucapan dan dilanjutkan dengan pengaksesan basisdata yang diikuti dengan proses tulis-ucap. Automation merupakan protokol COM(Component Object Model) yang

memungkinkan suatu aplikasi yang bertindak sebagai client untuk mengatur jalannya aplikasi lain yang bertindak sebagai server. Visual Basic 6 bertindak sebagai client sedangkan Matlab 6.5 bertindak sebagai server. Setelah hubungan terbentuk, maka dapat dijalankan rutinrutin perhitungan selanjutnya. Bertindak sebagai client, Visual Basic 6 harus mengenali aplikasi Matlab sebagai sebuah objek. Kedua, dengan mengunakan proses pengekstraksian ciri yang mana merupakan proses untuk mendapatkan parameterparameter sinyal suara. Salah satu metode yang digunakan untuk proses ekstraksi ciri adalah Linear Predictive Coding (LPC). Prosedur untuk mendapatkan koefisien LPC diperlihatkan pada Gambar 2.

Sinyal ucapan yang masuk akan dilakukan pencuplikan dan dikalikan dengan hamming window untuk menghitung faktor kesalahan, kemudian dengan metode autokorelasi untuk mendapatkan parameter keluaran yang berupa koefisien LPC. Ketiga, dengann parameter HMM yang didapatkan melalui lima tahap, yaitu memasukkan runtun observasi hasil dari proses ekstraksi ciri, memilih state, inisialisasi parameter HMM, pelatihan HMM, pelatihan HMM digunakan untuk mendapatkan parameter yang lebih baik, dan penyimpanan parameter. State untuk pemodelan parameter HMM dipilih state 15. Gambar 3 menunjukkan diagram alir pemodelan parameter HMM.

Keempat, pengolahan basisdata informasi akademik dibuat dengan menggunakan Microsoft Office Access 2003. Basisdata ini berisi informasi tentang NIM, password, nama, IP, dan IPK pengguna. Pada rancangan basisdata field name NIM dijadikan primary key, ini bertujuan agar tidak terjadi duplikasi data. Proses pengenalan ucapan memberikan hasil akhir berupa variabel dengan nama maksim. Variabel maksim merupakan sebuah cell array (matrik cell). Cell array diubah menjadi char array (matrik karakter) dengan tujuan agar dapat dibandingkan dengan matrik inisialisasi. Proses yang terakhir yaitu pembentukan keluaran berupa berkas dengan ekstensi

.txt, yang nantinya digunakan sebagai masukan bagi sistem pensintesis ucapan. Diagram alir pendeteksi keberadaan berkas ditunjukkan oleh Gambar 4.

Jika berkas pengguna.txt terdeteksi maka akan dilanjutkan dengan pengambilan kata yang ada di dalam berkas pengguna.txt tersebut. Bila kata yang ada sesuai dengan kata password yang diinginkan maka informasi yang telah tersimpan dalam basisdata akan dibacakan oleh MBROLA. Pengujian dalam kondisi ideal dilakukan pada kondisi ruangan yang memiliki derau rendah. Pengujian dilakukan dengan mengucapkan password suara dan password ketik sebagai data uji. Suara masukan diucapkan oleh sepuluh responden yang terdiri dari lima orang yang telah memasukkan suara sebagai basisdata dan lima orang yang belum memasukkan suara sebagai basisdata. Masing-masing responden diberi kesempatan sepuluh kali mengetik NIM dan mengucapkan password. Masing-masing responden juga diberi kesempatan sepuluh kali mengetik NIM dan password. Jika pada pengujian ditemukan kecocokan antara NIM dan password, maka informasi yang tersimpan dalam basisdata akan dibacakan. Sebaliknya, jika tidak terjadi kecocokan, maka informasi yang tersimpan tidak akan dibacakan.

You might also like