Professional Documents
Culture Documents
Proposal ResearchGrant UUL
Proposal ResearchGrant UUL
2. PENDAHULUAN
Sistem pengenalan ucapan pada dasarnya merupakan sistem yang mendengarkan ucapan
seseorang dan membandingkan ucapan tersebut dengan data kata-kata atau frase yang telah
disiapkan sebelumnya agar diperoleh data kata yang paling mendekati tepat dengan ucapan
yang diterima. Kedengarannya memang mudah, namun banyak hal yang perlu disesuaikan
dengan budaya bahasa manusia, sehingga muncul banyak tantangan yang dihadapi agar
sistem pengenalan ucapan memberikan kinerja yang baik, terutama pengolahan data yang
cepat dan akurat. Kecepatan dan keakuratan sistem pengenalan ucapan seharusnya mampu
menyesuaikan diri dan membentuk interaksi manusia dan komputer seperti layaknya
percakapan alamiah sesama manusia [1].
Didalam dunia bahasa, banyak terdapat kasus-kasus ambiguitas yang masih sulit diproses
oleh komputer. Ambiguitas tersebut muncul pada tingkat yang berbeda-beda, mulai dari
simbol (misalnya simbol titik), kata, frasa, bahkan kalimat. Beberapa penelitian telah
berusaha memecahkan masalah bahasa ini. Penelitian tersebut mencoba dari berbagai sudut
pandang atau gabungannya.
Sementara itu, bahasa Indonesia sampai saat ini belum diimplementasikan ke dalam sistem
pengenalan ucapan, tidak seperti bahasa negara maju. Ketertinggalan ini dapat dimengerti
karena memang tingkat kesulitannya tinggi, baik dalam pengembangan sistem pengenalan
ucapan maupun ketersediaan data dan struktur bahasa itu sendiri. Walaupun demikian,
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 1 dari 17
Proposal Research Grant – TPSDP Tahun Ke-4 – Dirjen DIKTI Depdiknas Republik Indonesia
tidaklah perlu berpangku tangan, berbagai langkah untuk pengembangan sekecil apapun
dalam upaya meningkatkan kualitas bahasa akan berdampak positif secara luas pada bidang
lain.
Oleh karena itu, peneliti mulai menerapkan wacana penelitian di bidang sistem pengenalan
ucapan bahasa Indonesia dimulai dari titik awal dengan melihat aspek pemetaan fonem
seperti yang dilakukan oleh Kumar dengan memodifikasi pendekatan bootstrapping.
Disamping itu, hal ini sangat sesuai dengan kondisi bahasa Indonesia yang belum
menyiapkan data fonem dan data pelatihan khusus untuk sistem pengenalan ucapan bahasa
Indonesia.
Penelitian ini termasuk pada Kelompok Penelitian Intelijensi Buatan dan Sistem Pakar.
Bidang ilmu yang erat terkait pada penelitian ini diantaranya adalah Pengolahan Sinyal
Digital, Sistem Kendali, Statistika dan Linguistik.
Penelitian ini dibatasi pada beberapa spesifikasi yang dijekaskan berikut ini.
1. Sistem pengenalan ucapan Bahasa Inggris yang diadaptasikan berupa paket program
berbasiskan open source.
2. Pengembangan sistem pengenalan ucapan Bahasa Indonesia mengacu pada kaidah
Bahasa Indonesia baku.
3. Fonem Bahasa Indonesia mengacu pada kamus Bahasa Indonesia dan kamus
terjemahan Bahasa Indonesia – Inggris.
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 2 dari 17
Proposal Research Grant – TPSDP Tahun Ke-4 – Dirjen DIKTI Depdiknas Republik Indonesia
3. TINJAUAN PUSTAKA
Bagian ini menjelaskan tentang konsep sistem pengenalan ucapan, beberapa masalah
penting pada pengenalan ucapan dan penelitian pengembangan sistem pengenalan ucapan
yang dijadikan sebagai acuan untuk penelitian ini.
Pengenalan Ucapan yang dimaksudkan disini dalam istilah bahasa Inggris adalah Speech
Recognition. Pengenalan Ucapan merupakan suatu proses dimana suatu komputer atau suatu
jenis mesin mampu mengidentifikasi kata yang diucapkan seseorang. Gambaran mudahnya,
seperti layaknya seseorang berbicara dengan komputer dan komputer mampu mengenali
apa yang sedang dikatakannya.
Pada umumnya, Sistem Pengenalan dan Sintesis Ucapan dibentuk dengan proses
seperti tampak pada Gambar 1 berikut ini [11].
Gambar 1 menjelaskan adanya hubungan antara dua entitas yaitu manusia dan komputer.
Manusia mengucapkan suatu kata, kemudian dilakukan proses Recognition. Proses
Recognition mengubah ucapan manusia, dalam hal ini Speech, menjadi bentuk yang
dimengerti oleh komputer dan menghasilkan suatu data berupa Text. Text ini belum
memberikan pengertian sehingga diperlukan proses berikutnya yaitu Understanding. Proses
inilah yang menganalisis Text menjadi sesuatu yang memiliki arti secara simantik.
Proses Synthesis membangkitkan suara sintetik hasil dari pengolahan komputer. Proses ini
memerlukan bahan Text yang biasanya hasil pengembangan dari pengetahuan, dalam hal ini
Meaning, yang telah disiapkan sebelumnya oleh manusia. Proses Synthesis pada umumnya
lebih mudah dibanding proses Recognition. Seperti yang diungkapkan [1,12].
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 3 dari 17
Proposal Research Grant – TPSDP Tahun Ke-4 – Dirjen DIKTI Depdiknas Republik Indonesia
Lebih mendalam, proses Pengenalan Ucapan diselesaikan melalui beberapa tahap seperti
tampak pada Gambar 2 berikut ini [11].
Pada Gambar 2, Speech Signal direkam oleh komputer. Hasil rekaman sinyal ini dianalisis
oleh proses Representation. Analisis representasi disesuaikan dengan data referensi yang
telah disiapkan sebelumnya pada Training Data. Penyesuaian ini dilakukan dengan
berbagai metode normalisasi dan filter agar dapat diperoleh hasil yang mempunyai format
yang sama dengan Training Data. Hasil Representasi kemudian dibandingkan pada proses
Search dengan data dari Training Data dengan menerapkan beberapa model, baik hanya
satu model atau gabungan beberapa model dari Acustic, Lexical atau Language Model.
Proses perbandingan ini ditujukan untuk memilih “Kata” yang paling mendekati tepat
(Recognized Words). Keseluruhan proses pada Gambar 2 tersebut akan diulang untuk
mengolah ucapan berikutnya.
Khusus pada bagian Training Data, data perlu disiapkan sebelum adanya implementasi dari
Sistem Pengenalan Ucapan. Proses yang digunakan untuk menyediakan data dilakukan
dengan pengumpulan data. Tidak sekedar dikumpulkan saja, namun juga dilakukan proses
pelatihan agar didapat pengolahan data yang cepat dalam pencariannya. Pelatihan
dilakukan dengan menerapkan Jaringan Syaraf Tiruan.
Secara teknis, Sistem Pengenalan Ucapan dapat dijabarkan menggunakan contoh seperti
pada Gambar 3 berikut [11].
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 4 dari 17
Proposal Research Grant – TPSDP Tahun Ke-4 – Dirjen DIKTI Depdiknas Republik Indonesia
Sumber sinyal yang berasal dari ucapan seseorang, dinyatakan sebagai Speech Waveform
pada Gambar 3. Sumber sinyal ini kemudian dicari ciri pentingnya yang dapat membedakan
antara satu sinyal dengan sinyal lain. Pengungkapan ciri dilakukan dengan pengolahan
sinyal.
Terdapat banyak cara dalam melakukan pengolahan sinyal untuk pengungkapan ciri,
diantara yang terkenal adalah :
Mel Frequency Cepstral Coefficients (MFCC). Analisis Transformasi Fourier
menghasilkan frekuensi diskrit terhadap waktu dan dapat ditampilkan gambarnya.
Biasanya nilai frekuensi dinyatakan menggunakan skala Mel, dimana skala skala ini
linier untuk rentang dibagian yang rendah dan berbentuk logaritmik pada rentang
bagian tinggi. Hal ini sesuai dengan karakteristik pendengaran manusia. Koefisien
Sepstral frekuensi-Mel inilah yang dijadikan ciri.
Linear Predictive Coding (LPC). Cara ini menghasilkan koefisien dari persamaan linier
yang memperkirakan nilai data ucapan beberapa saat terakhir. Vektor koefisien inilah
yang dijadikan ciri.
Hasil dari pengolahan dan analisis sinyal adalah deretan vektor ciri ucapan, dinyatakan
sebagai spectral feature vector pada Gambar 3. Vektor-vektor ini dilatih menggunakan
Jaringan Syaraf Tiruan. Pelatihan dimaksudkan agar pemrosesan vektor dapat dilakukan
dengan cepat. Hasil dari pelatihan berupa deretan fonem-fonem yang membentuk data
ucapan. Pemodelan fonem ini menggunakan model akustik Hidden Markov Model (HMM).
Proses pencarian kesamaan data fonem dilakukan dengan menggunakan Grammar N-Gram
dan dikodekan kembali menggunakan algoritma Viterbi. Proses ini melihat nilai total
penjajaran terbaik. Dari penjajaran ini diperoleh deretan kata yang terpilih dan diasumsikan
yang paling benar, tampak hasil “I need a” pada Gambar 3.
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 5 dari 17
Proposal Research Grant – TPSDP Tahun Ke-4 – Dirjen DIKTI Depdiknas Republik Indonesia
Pada kenyataannya, Sistem Pengenalan Ucapan sampai saat ini masih perlu meningkatkan
beberapa hal guna memperbaiki kinerjanya, terutama masalah akurasi. Dalam thesis [13]
disebutkan beberapa masalah mengapa sulit menigkatkan akurasi. Masalah tersebut
dijelaskan sebagai berikut.
Bahkan [19] menyebutkan kelemahan Sistem Pengenalan Ucapan yang mendasar, yaitu
bahasa pembicaraan akan lebih efektif bila digunakan antar manusia dan akan mempunyai
banyak kekurangan bila diterapkan pada interaksi antara manusia dengan komputer. Hal ini
diakibatkan oleh lambatnya komputer merepresentasikan informasi dan sulitnya melakukan
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 6 dari 17
Proposal Research Grant – TPSDP Tahun Ke-4 – Dirjen DIKTI Depdiknas Republik Indonesia
review dan edit. Sehingga perancangan Sistem Pengenalan Ucapan harus mengerti tentang
acustic memory dan prosody.
Penelitian yang akan dilakukan penulis mengacu pada metode pengembangan sistem
pengenalan ucapan standar yang secara umum banyak digunakan pada berbagai penelitian
sebelumnya, seperti telah dijelaskan pada Subbab 3.1. Tahap pertama adalah penyediaan
Data Terlatih yang dijadikan referensi untuk proses perbandingan sesuai dengan Model Data
yang digunakan. Tahap kedua adalah penentuan Model Akustik, Model Bahasa dan Model
Lainnya yang digunakan dalam persyaratan bahasa. Tahap ketiga adalah proses
perbandingan antara ucapan yang diolah terhadap Data referensi menggunakan ciri-ciri
Model yang diterapkan. Hasil yang diharapkan adalah kata yang diucapkan seseorang dapat
dikenali dengan benar berdasarkan Data referensi yang ada.
Penelitian yang akan penulis lakukan menggunakan teknik-teknik yang dilakukan pada
penelitian Kumar. Kumar bersama dua rekannya meneliti tentang pengembangan Large
Vocabulary Continuous Speech Recognition System (LVCSR) untuk bahasa India [9]. Para
peneliti ini mempunyai kerangka penelitian sebagai berikut :
Pemodelan Akustik dilakukan dengan mengadopsi data Phone Set bahasa Inggris
yang terdapat di International Phonetic Alphabet (IPA) untuk pemodelan Phone Set
bahasa India menggunakan pendekatan Bootstrapping.
o Bootstrapping dilakukan dengan penjajaran data ucapan bahasa tujuan.
Ide baru yang dimunculkan berbentuk modifikasi Bootstrapping, yaitu
dilakukan dengan menambahkan lexeme context comparator dengan tujuan
supaya data ucapan bahasa tujuan yang mempunyai fonem yang mirip dan
mempunyai arti berbeda dapat diketahui bedanya dengan jelas. Konsep ini
tampak pada Gambar 4.
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 7 dari 17
Proposal Research Grant – TPSDP Tahun Ke-4 – Dirjen DIKTI Depdiknas Republik Indonesia
untuk kondisi beberapa fonem bahasa tujuan mempunyai suara berasal dari
beberapa fonem bahasa sumber. Kategori ketiga, Aproksimasi untuk kondisi
beberapa fonem bahasa tujuan sama sekali tidak terdapat didalam fonem
bahasa sumber.
Peningkatan kinerja pemetaan dilakukan dengan metode pengukuran
kesamaan fonetik. Hal ini dilakukan dengan mengukur jarak diantara fonem-
fonem yang terdapat didalam domain MFCC dengan rumus sebagai berikut.
Salah satu kelebihan utama yang dihasilkannya sesuai dengan arah penelitian ini adalah
peningkatan kecepatan dalam penyediaan model fonem, yang dilakukan dengan modifikasi
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 8 dari 17
Proposal Research Grant – TPSDP Tahun Ke-4 – Dirjen DIKTI Depdiknas Republik Indonesia
pendekatan Bootstrapping. Hal ini sangat sesuai untuk bahasa-bahasa baru yang belum
mempunyai Training Data dan data Fonem khusus untuk sistem pengenalan ucapan,
termasuk bahasa Indonesia.
Melihat kenyataan bahwa hasil penelitian tersebut memberikan peningkatan kinerja sistem
pengenalan ucapan, maka penulis mengadopsi teknik-teknik yang digunakan sesuai dengan
Batasan Penelitian yang dijelaskan pada Subbab 2.3.
4. METODE PENELITIAN
Pada bab ini akan dijelaskan tentang kerangka penelitian, modifikasi bootstrapping yang
diajukan, metodologi penelitian dan penurunan topik penelitian strata satu yang akan
digunakan.
Kerangka penelitian yang akan penulis gunakan disesuaikan dengan metode penelitian
acuan. Perbedaan yang ada tampak pada Gambar 5 berikut.
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 9 dari 17
Proposal Research Grant – TPSDP Tahun Ke-4 – Dirjen DIKTI Depdiknas Republik Indonesia
Pada Gambar 5, kolom kiri merupakan rangkuman dari kerangka penelitian Kumar yang
dijadikan sebagai acuan untuk penelitian penulis. Kolom tengah merepresentasikan kembali
metodologi pengenalan ucapan yang umum banyak digunakan oleh para peneliti. Kolom
kanan merupakan kerangka rencana penelitian yang akan penulis lakukan.
Gambar 5 menjelaskan bahwa perbedaan kerangka penelitian terjadi pada bagian Ucapan,
Data Pelatihan dan Bootstrapping. Ketiga bagian ini menerapkan obyek bahasa yang
berbeda. Penelitian acuan menerapkan bahasa India, sedangkan penelitian yang diajukan
penulis menggunakan obyek bahasa Indonesia. Disamping itu, penulis menyederhanakan
kerangka penelitian yang akan dilakukan, dengan menghilangkan tahap Model Bahasa,
dengan asumsi bahwa sistem pengenalan ucapan berbahasa Indonesia relatif belum ada,
sehingga berbagai data pendukung pengenalan ucapan sangatlah terbatas. Hal ini dapat
diperkirakan bahwa pengadaan data pendukung menjadikan perjalanan penelitian ini
sangat panjang waktunya jika dilakukan semua tahapan yang ada.
Kontribusi yang dijadikan ide baru untuk penelitian ini, yang akan penulis ajukan,
mengarah pada modifikasi pendekatan bootstrapping dengan penjajaran notasi fonem Bahasa
Indonesia. Bentuk modifikasi ini tampak pada Gambar 6 berikut.
Gambar 6 menjelaskan bahwa kosakata Bahasa Indonesia yang perlu disiapkan sebelumnya
akan dilakukan pemetaan. Pemetaan didasarkan pada unit bunyi pengucapan terkecil yaitu
fonem. Pemetaan ini dilakukan dengan melihat hubungan fonem satu-satu dan satu-banyak
antara fonem Bahasa Indonesia ke Bahasa Inggris. Hasil pemetaan digunakan sistem
pengenalan ucapan untuk diolah menggunakan produk pengenal ucapan Bahasa Inggris
yang sudah ada di pasaran global berbasiskan open source.
Selanjutnya, Ucapan Bahasa Indonesia yang dikeluarkan oleh mulut manusia akan diolah
bersama data pemetaan oleh Sistem Pengenal Ucapan Bahasa Inggris. Hasil dari Sistem
Pengenal Ucapan Bahasa Inggris berupa data notasi fonem terjajar Bahasa Indonesia. Jika
terdapat data terjajar yang mempunyai keraguan, baik pengucapan sama tetapi label
berbeda maupun pengucapan berbeda tetapi label sama, maka diolah oleh bagian
Klasifikasi. Bagian ini mengidentifikasi perlu tidaknya label dipilih sesuai dengan konteks
kata yang diucapkan. Proses klasifikasi dilakukan dengan pendekatan statistik. Peluang
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 10 dari 17
Proposal Research Grant – TPSDP Tahun Ke-4 – Dirjen DIKTI Depdiknas Republik Indonesia
terbesar kemunculan data terjajar yang terpilih, akan memperoleh prioritas utama. Informasi
peluang diambil dari Data Klasifikasi. Data klasifikasi diperlukan untuk menampung secara
historis data terjajar yang terpilih.
Secara khusus, metodologi penelitian yang diterapkan pada penelitian ini ditampilkan pada
Gambar 7 berikut ini.
Tahap Klasifikasi digunakan untuk menentukan “kelas” fonem Bahasa Indonesia dengan
pendekatan statistik. Kelas fonem ini akan digunakan untuk mengelompokkan jenis-jenis
fonem berdasarkan artikulasinya, yaitu konsonan, vokal, harakat dan gaya pengucapan
(narasi). Pengelompokan ini juga dilakukan untuk fonem Bahasa Inggris berdasarkan jenis
kelompok dari pemetaan. Tahap ini juga digunakan untuk merancang Data Klasifikasi awal
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 11 dari 17
Proposal Research Grant – TPSDP Tahun Ke-4 – Dirjen DIKTI Depdiknas Republik Indonesia
yang digunakan pada modifikasi Bootstrapping proses penjajaran bagian Klasifikasi dari
Gambar 7.
Tahap Pemetaan Fonem melakukan pembuatan peta fonem bahasa Indonesia ke fonem
bahasa Inggris. Pada tahap ini, akan dicari keterhubungan setiap fonem yang ada, baik
hubungan satu-satu dan satu-banyak. Metode yang digunakan untuk melakukan pemetaan
mengacu pada metode pemetaan penelitian acuan, yaitu Pemetaan Tepat, Penggabungan
dan Aproksimasi. Pemetaan Tepat diterapkan bila terdapat fonem yang sama persis dari
kedua bahasa Inggris dan Indonesia. Penggabungan diterapkan bila fonem Bahasa Indonesia
berasal dari gabungan beberapa fonem Bahasa Inggris. Aproksimasi diterapkan bila fonem
Bahasa Indonesia tidak terdapat pada fonem Bahasa Inggris.
Tahap Penyesuaian diperlukan untuk melihat kembali apakah hasil Pemetaan Fonem sudah
memenuhi kriteria yang diharapkan. Jika ditemukan kekurangan, maka perlu diubah
kembali dan disesuaikan dengan klasifikasi yang ditentukan pada tahap sebelumnya dari
proses Klasifikasi kemudian dipetakan kembali pada proses Pemetaan Fonem.
Tahap Klasifikasi, Pemetaan Fonem dan Penyesuaian akan memerlukan bantuan tenaga ahli
bidang Ilmu Linguistik yang mempunyai kompetensi bidang Bahasa Indonesia skala
nasional. Keterlibatan tenaga ahli ini sangat diperlukan terutama pada kegiatan perancangan
fonem Bahasa Indonesia. Sampai saat ini belum ditemukan tenaga ahli yang bersedia secara
intensif membantu penelitian ini.
Hasil pengujian menentukan apakah perlu atau tidak melakukan perbaikan terhadap
rancangan pemetaan yang telah dilakukan. Jika tidak terdapat peningkatan kinerja, maka
akan dicari dimana letak kekurangannya, sehingga perlu melihat kembali Tahap Klasifikasi,
Pemetaan Fonem dan Penyesuaian untuk dilakukan perbaikan.
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 12 dari 17
Proposal Research Grant – TPSDP Tahun Ke-4 – Dirjen DIKTI Depdiknas Republik Indonesia
Bersumber pada metodologi penelitian yang akan dilakukan, dapat diturunkan beberapa
topik penelitian untuk memberikan peluang bagi mahasiswa Strata Satu Jurusan Sistem
Komputer yang dapat digunakan sebagai topik skripsi. Hasil penurunan topik ini tercantum
pada tabel berikut.
5. INDIKATOR KINERJA
Indikator keberhasilan dari penelitian ini dilihat dari dua hal sebagai berikut :
1. Seberapa dekatnya jarak akustik fonem yang dipetakan dari fonem Bahasa Indonesia
ke fonem Bahasa Inggris. Rumus jarak yang digunakan sama dengan rumus yang
dijelaskan pada Subbab 3.3.
2. Seberapa tingginya peningkatan kecepatan relatif proses pemetaan, baik
menggunakan tambahan proses hasil modifikasi yang diajukan (proses Klasifikasi
pada Gambar 6) maupun tidak.
6. KONSIDERAN PERCOBAAN
Konsideran percobaan yang akan digunakan untuk penelitian ini adalah sebagai berikut.
1. Data ucapan diperoleh dari 20 orang dengan variasi umur antara 20 sampai 55 Tahun
dan variasi jenis kelamin, pria dan wanita.
2. Ciri fonem diungkapkan dengan mengambil besaran MFCC 24-dimensi.
3. Pelatihan data menerapkan Jaringan Syaraf Tiruan.
4. Kemiripan dan Perbedaan antar fonem dilihat menggunakan Rumus Jarak pada
domain frekuensi.
5. Sistem Pengenalan Ucapan bahasa Inggris yang akan digunakan adalah CMU Sphinx
Versi 3.5 dari Carnegie Mellon University dengan tingkat akurasi diatas 90%.
6. Perancangan fonem Bahasa Indonesia dan pemetaannya ke Bahasa Inggris
melibatkan tenaga ahli bidang Linguistik yang memiliki kompetensi skala nasional.
7. Pengembangan data klasifikasi berdasarkan domain sistem pengenal ucapan.
Domain yang akan digunakan adalah Teknologi Informasi.
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 13 dari 17
Proposal Research Grant – TPSDP Tahun Ke-4 – Dirjen DIKTI Depdiknas Republik Indonesia
7. JADUAL KEGIATAN
Waktu pelaksanaan penelitian disesuaikan dengan persyaratan yang ditetapkan oleh TPSDP.
Tahap pelaksanaan kegiatan penelitian dirinci pada diagram berikut.
8. TIM PENGUSUL
Ketua Peneliti
Nama : Lintang Yuniar Banowosari, Skom., MSc.
Tanggal Lahir : 3 Juni 1968
Jabatan Struktural : Staf Pengajar
Jabatan Fungsional : Lektor
Jurusan : Sistem Komputer
Fakultas : Ilmu Komputer
Alamat Kantor : Jl. Margonda Raya No.100 Depok 16424
Telp Kantor : 021-78881112 ext 309/477
Email : lintang@staff.gunadarma.ac.id
Alamat Rumah : Perumahan Taman Puspa Kav.72 Pasir Gunung Selatan
Cimanggis Depok 16951
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 14 dari 17
Proposal Research Grant – TPSDP Tahun Ke-4 – Dirjen DIKTI Depdiknas Republik Indonesia
Anggota Peneliti 1
Nama : Nurul Huda, Skom., MT.
Tanggal Lahir : 21 Februari 1969
Jabatan Struktural : Kepala Laboratorium Menengah
Jabatan Fungsional : Asisten Ahli
Jurusan : Sistem Komputer
Fakultas : Ilmu Komputer
Alamat Kantor : Jl. Margonda Raya No.100 Depok 16424
Telp Kantor : 021-78881112 ext 477
Email : huda@staff.gunadarma.ac.id
Alamat Rumah : Jl. Pancoran Barat VII No.34 Rt 8 Rw 6 Durentiga Jakarta Selatan
Anggota Peneliti 2
Nama : Wahyu Kusuma Raharja, ST., MT.
Tanggal Lahir : 12 April 1973
Jabatan Struktural : Wakil Kepala Laboratorium Menengah
Jabatan Fungsional : Asisten Ahli
Jurusan : Sistem Informasi
Fakultas : Ilmu Komputer
Alamat Kantor : Jl. Akses UI Kelapa Dua Depok
Telp Kantor : 021-8727541 ext 505
Email : wahyukr@staff.gunadarma.ac.id
Alamat Rumah : Puri Bojong Lestari Blok CR 12 Bojong Gede Bogor 16921
9. RANCANGAN BIAYA
Penelitian ini memerlukan dana sebesar Rp. 29.700.000,- dengan jumlah biaya setiap
komponen sebagai berikut :
1. Honor Peneliti Rp. 8.700.000,- 29.29 %
2. Peralatan dan Bahan Rp. 14.870.000,- 50.00 %
3. Survei dan Studi Pustaka Rp. 1.840.000,- 6.19 %
4. Laporan Rp. 2.030.000,- 6.84 %
5. Seminar Rp. 2.260.000,- 7.61 %
Rincian biaya secara lengkap dijelaskan pada tabel berikut.
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 15 dari 17
Proposal Research Grant – TPSDP Tahun Ke-4 – Dirjen DIKTI Depdiknas Republik Indonesia
[1] Blade Kotelly, The Art and Business of Speech Recognition: Creating the Noble Voice,
Addison Wesley, 2003.
[2] Asela Gunawardana, Alex Acero, Adapting Acoustic Models to New Domains and
Conditions Using Untranscribed Data, [Ref. 2002].
[3] Diego Giuliani, Marcello Federico, Unsupervised Language and Acoustic Model Adaptation
for Cross Domain Portability, [Ref. 2001].
[4] T. Schultz, A. Waibel, Experiments on Cross-Language Acoustic Modeling, [Ref. 2000].
[5] Tanja Schultz, Alex Waibel, Language Independent and Language Adaptive Acoustic
Modeling for Speech Recognition, [Ref. 2000].
[6] J. Kohler, Multi-Lingual Phoneme Recognition Exploiting Acoustic–Phonetic Similarities of
Sounds, Proceedings of the International Conference on Spoken Language Processing,
Atlanta, 1996, pp. 2195–2198.
[7] Klaus Ruggenmann and Iryna Gurevych, Assigning Domains to Speech Recognition
Hypotheses, 2004.
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 16 dari 17
Proposal Research Grant – TPSDP Tahun Ke-4 – Dirjen DIKTI Depdiknas Republik Indonesia
Tim Pengusul : Lintang Yuniar Banowosari, Nurul Huda, Wahyu Kusuma Raharja Hal 17 dari 17