You are on page 1of 9

NATURAL LANGUAGE PROCESSING DALAM MEMPEROLEH

INFORMASI AKADEMIK MAHASISWA


UNIVERSITAS ATMA JAYA MAKASSAR

Erick Alfons Lisangan


Fakultas Teknologi Informasi, Universitas Atma Jaya Makassar
erick_lisangan@lecturer.uajm.ac.id

ABSTRACT
The information has become one of the most important parts for an institution today,
including Universitas Atma Jaya Makassar. One of the information is academic, so it needs fast
processing to get that information. The problems that arise are difference of language between
the user who need information and database language which storage data of academic. So we
need an interpreter to bridge the difference of language. In this research, the writer uses
Natural Language Processing as the solution from that problem and use Parser Noise-Disposal.
The application is designed by PHP as programming language and MySQL as database.

Keywords: natural language processing, parser noise-disposal, information

1. PENDAHULUAN Salah satu solusi yang dapat


digunakan untuk memperoleh informasi
Informasi telah menjadi salah satu
adalah dengan
bagian yang penting dari suatu institusi,
melakukan proses query secara langsung.
termasuk dalam hal ini institusi yang
Tetapi hal tersebut sulit untuk
bergerak di bidang pendidikan. Universitas
diimplementasikan karena adanya
Atma Jaya Makassar (UAJM) sebagai salah
perbedaan bahasa antara pengguna
satu institusi dalam bidang pendidikan tentu
informasi dan bahasa Structure Query
membutuhkan sejumlah informasi, seperti
Language (SQL) sebagai bahasa yang
informasi akademik, keuangan, dan lainnya.
dikenal oleh database. Bagi pengguna yang
Informasi tersebut yang akan digunakan
mengerti SQL bukanlah menjadi suatu
sebagai pegangan dalam pengambilan
hambatan tetapi perlu mengetahui secara
keputusan oleh top level management.
detail struktur database. Sedangkan bagi
Informasi akademik dapat berhubungan
penggunan awam yang tidak mengerti SQL
dengan mahasiswa, dosen, hingga mata
akan menjadi hambatan dalam memperoleh
kuliah. Pemakai umum terhadap informasi
informasi.
akademik adalah Ketua Program Studi,
Sehingga dapat diperoleh suatu
Dekan Fakultas, Biro Akademik, Wakil
permasalahan, “Bagaimana
Rektor, hingga Rektor.
mengakomodasi perbedaan bahasa dari
Informasi akademik di UAJM dapat
pengguna informasi dan komputer dalam
diperoleh secara langsung dari Sistem
memperoleh informasi akademik?”.
Informasi Akademik (SIAMIK) yang telah
Berdasarkan permasalahan tersebut dapat
diimplementasikan sejak tahun 2004.
diperoleh tujuan dari penelitian, yaitu
Informasi yang dihasilkan dari SIAMIK
dengan merancang natural language
saat ini dapat dikatakan telah dapat
processing (NPL) sehingga pengguna
digunakan untuk pengambilan keputusan
informasi dapat melakukan memperoleh
tetapi sifatnya tidak fleksibel. Hal ini
informasi akademik tanpa terkendala
disebabkan karena informasi yang
adanya perbedaan bahasa.
dihasilkan telah memiliki format yang tetap
sehingga untuk penambahan atau
pengurangan informasi perlu dilakukan
perubahan pada SIAMIK.

Lisangan, Natural Language Processing Dalam Memperoleh Informasi Akademik Mahasiswa UAJM 1
2. TINJAUAN PUSTAKA oleh manusia dalam percakapan sehari-hari.
Untuk proses komputasi, bahasa harus
2.1. Natural Language
direpresentasikan sebagai rangkaian simbol
Natural Language atau bahasa alami yang memenuhi aturan tertentu. Secara
adalah bahasa yang dapat dimengerti dan sederhana, NLP adalah mencoba untuk
dipahami oleh seseorang pada lokasi membuat komputer dapat mengerti
tertentu, sebagai contoh bahasa alami dari perintah-perintah yang ditulis dalam standar
orang Indonesia adalah bahasa Indonesia. bahasa manusia.
Bahasa alami biasa diajarkan orangtia pada Terdapat beberapa alasan yang
anaknya ketika masih bayi. Seiring menyulitkan NLP (Arman, 2004), yaitu
bertambahnya usia anak, maka pemahaman masalah ambiguity atau makna ganda dan
terhadap bahasa tersebut semakin jumlah kosa kata (vocabulary) yang besar
meningkat. Untuk dapat mengetahui bahasa dan berkembang dari waktu ke waktu.
alami, perlu mengetahui susunan dari Berdasarkan alasan tersebut, NLP tidak
bahasa alami tersebut, sebagai contoh untuk mempedulikan bagaimana suatu kalimat
Bahasa Inggris, seseorang perlu dimasukkan ke dalam komputer tetapi
mempelajari kosa kata Inggris, tata bahasa meng-copy informasi dari kalimat tersebut.
Inggris, dan sebagainya.
2.3. Sistem Pemahaman Natural
2.2. Natural Language Processing Language
Natural Language Processing (NLP) Pada Gambar 1, dapat dilihat 5 (lima)
dapat didefinisikan sebagai kemampuan elemen utama dalam program NLP, yaitu
suatu komputer untuk memproses bahasa, parser, lexicon, understander, knowledge
baik lisan maupun tulisan yang digunakan base, dan generator.

INPUT
TEXT PARSER UNDERSTANDER GENERATOR OUTPUT
STRING

KNOWLEDGE
LEXICON
BASE

Gambar 1. Elemen Utama Sistem Pemahaman Natural Language

2.4. Parser sesungguhnya dari kalimat untuk


Elemen yang paling menentukan memprediksi tipe apa dari kata yang
dalam NPL adalah parser. Parser berlaku. Parser Context-Free Recursive-
merupakan bagian dari program yang Descent menggunakan production rule
menganalisa input secara sintaksistik. untuk menganalisa sebuah kalimat.
Setiap kata dan bagian-bagian ujarannya Parser Noise-Disposal merupakan
diidentifikasikan. Parser terdapat 3 (tiga) jenis parser yang sangat umum digunakan
jenis, yaitu Parser State-Machine, Parser dalam aplikasi yang berbasis pada
Context-Free Recursive-Descent, dan database. Contoh dari jenis parser ini
Parser Noise-Disposal. Parser State misalkan terdapat query dalam bahasa
Machine menggunakan keadaan yang alami sebagai berikut, “lihatkan saya semua
perusahaan dengan persediaan > 100” maka

2 JURNAL TEMATIKA VOL. 1, NO. 1, MARET 2013, ISSN: 2303 3878


ke dalam bahasa SQL akan menjadi “select 2.8. Database Language
perusahaan from table_perusahaan where Database Management Systems
persediaan > 100”. (DBMS) merupakan perantara bagi
pengguna dengan database yang tersimpan
2.5. Lexicon disk. Cara berinteraksi atau berkomunikasi
Untuk menganalisis sintaksis, parser antara pemakai dengan database tersebut
bekerja sama dengan lexicon. Lexicon berisi diatur dalam suatu bahasa khusus yang
ditetapkan oleh perusahaan pembuat
seluruh kata yang dikenali oleh program.
DBMS.
Lexicon dapat berisi pula ejaan setiap kata
Bahasa khusus tersebut yang disebut
yang benar dan merancang bagian dengan database language yang terdiri atas
ujarannya. Dalam implementasinya, parser sejumlah perintah yang diberikan oleh
merupakan alat untuk mencocokkan pola. pengguna dan dikenali oleh DBMS untuk
Setelah salah satu kata diidentifikasikan, memproses suatu aksi tertentu. Database
parser melacak lexicon untuk language yang banyak dipakai adalah
membandingkan setiap input kata dengan Structured Query Language (SQL).
semua kata yang disimpan dalam database.
2.9. Structured Query Language
2.6. Understander dan Knowledge Base SQL merupakan standar bahasa basis
Understander bekerja sama dengan data relasional karena hamper semua
basis pengetahuan untuk menentukan DBMS telah mendukung penggunaan dari
makna sebuah kalimat. Tugas understander SQL.
SQL terbagi menjadi 2 (dua) bagian,
adalah menyusun struktur data yang berisi
yaitu Data Definition Language (DDL) dan
makna, memahami kalimat input yang Data Manipulation Language (DML).
dimasukkan, dan menyimpannya ke dalam DDL menyediakan perintah untuk
memori. mendefinisikan hubungan skema database,
Dalam rangka menentukan apa yang menghapus hubungan, dan memodifikasi
dimaksudkan oleh input kalimat, sistem skema relasi.
harus mengetahui kata-kata dan cara DML menyediakan kemampuan
penyimpannya agar menjadi statemen untuk permintaan informasi dari database,
bermakna. Tujuan dari understander adalah memasukkan record, menghapus record,
memanfaatkan output dari parser agar dan memodifikasi isi record.
mengacu dari knowledge base. Apabila
input kalimat berupa statemen, maka 3. METODOLOGI PENELITIAN
understander menentukan maknanya 3.1. Rancangan Penelitian
dengan melihat kata-kata atau frasa-frasa
Rancangan penelitian yang akan
yang ada dalam basis pengetahuan. dilakukan dalam melaksanakan proses
penelitian ini adalah analisa kebutuhan,
2.7. Generator studi kelayakan, pendekatan terstruktur, dan
Generator adalah input yang telah uji kesahihan.
dimengerti untuk membuat output yang
berguna. Struktur data yang dihasilkan oleh 3.1.1. Analisa Kebutuhan
understander kemudian mengawali Analisa kebutuhan berperan dalam
tindakan atau langkah berikutnya. Dalam mengidentifikasi masalah atau kendala
bentuk paling sederhana, generator natural yang terdapat dalam proses ekstraksi
language memasukkan output jawaban informasi akademik di Universitas Atma
standar yang telah dimasukkan terlebih Jaya Makassar. Tujuan dari analisa
dahulu kepada user didasarkan pada makna kebutuhan untuk mendapatkan fakta
yang sudah diringkas dari input. permasalahan yang ada dan sejalan dengan
yang dikemukakan pada latar belakang dan

Lisangan, Natural Language Processing Dalam Memperoleh Informasi Akademik Mahasiswa UAJM 3
juga lebih memperkuat tujuan diadakannya dan langkah-langkah yang ditempuh dalam
penelitian dan perancangan. menyelesaikan perancangan ini dapat
dilihat pada Gambar 2.
3.1.2. Metode Perancangan
Metode perancangan yang akan
digunakan adalah perancangan terstruktur

Gambar 2. Metode Perancangan Terstruktur

3.1.3. Uji Kesahihan menjadi landasan pengetahuan dalam


penelitian ini.
Tahap uji kesahihan ini dilakukan
Observasi bertujuan untuk melihat
dengan melakukan pengujian pada aplikasi
secara langsung kendala yang terjadi di
NPL untuk mengetahui apakah input yang
lapangan, dalam hal ini pada lingkungan
dimasukkan telah memperoleh output yang
akademik UAJM. Dari kendala yang
sesuai dengan yang diharapkan. Tahap ini
diperoleh tersebut akan dijadikan sebagai
dilakukan untuk mengetahui tujuan awal
landasan untuk memperoleh solusi yang
yang merupakan target dari penelitian telah
tepat dan sesuai. Selain itu, dilakukan pula
tercapai atau belum.
analisa terhadap struktur database dari
SIAMIK untuk mengetahui tabel dan
3.2. Ruang Lingkup Penelitian atribut apa saja yang berhubungan dengan
Ruang lingkup dari penelitian ini penelitian ini. Observasi juga dilakukan
adalah informasi akademik yang pada struktur SQL dan kemungkinan
dikhususkan pada informasi akademik yang persamaan antara perintah SQL dan natural
berhubungan dengan mahasiswa UAJM. language.

3.3. Metode Pengumpulan Data 3.4. Analisis Data


Untuk menganalisis permasalahan Metode analisa data yang dilakukan
dan kebutuhan yang akan dipenuhi oleh adalah analisa kualitatif. Analisa kuantitatif
aplikasi yang akan dirancang, penulis dilakukan dengan metode pengumpulan
mengumpulkan data dan informasi yang data melalui observasi. Dari hasil observasi,
berasal dari berbagai sumber dengan diharapkan dapat diperoleh permasalahan
menggunakan beberapa metode, seperti yang terjadi serta solusi yang tepat dari
studi literatur dan observasi. permasalahan yang dihadapi.
Studi literatur bertujuan untuk
memperoleh informasi dari buku maupun
dari internet yang berhubungan dengan
permasalahan yang dihadapi. Studi litetarur

4 JURNAL TEMATIKA VOL. 1, NO. 1, MARET 2013, ISSN: 2303 3878


4. HASIL DAN PEMBAHASAN dan kata lainnya yang memiliki makna
yang sama.
4.1. Hasil Pengumpulan Data Berdasarkan hasil pengumpulan kata
Berdasarkan hasil observasi terhadap maka untuk mengatasi permasalahan yang
kebutuhan akan informasi akademik dihadapi dalam memperoleh informasi
mahasiswa UAJM, dapat diperoleh bahwa akademik mahasiswa maka dapat
informasi akademik mahasiswa dibutuhkan digunakan NPL sebagai perantara antara
oleh beberapa pengambil keputusan, seperti natural language yang digunakan oleh
Rektor, Wakil Rektor, Dekan, Wakil pengambil keputusan dengan database
Dekan, dan Biro Akademik UAJM. language yang dikenali oleh DBMS
SIAMIK yang ada saat ini secara umum sebagai penyimpan database SIAMIK
telah mampu untuk memberikan informasi UAJM.
akademik yang dibutuhkan oleh para
pengambil keputusan, tetapi terkadang 4.2. Hasil Penelitian
masih membutuhkan informasi akademik
NLP dapat didefinisikan sebagai
yang belum dapat disediakan secara
kemampuan suatu komputer untuk
langsung oleh SIAMIK, seperti daftar
memproses bahasa, baik lisan maupun
mahasiswa yang memiliki Indeks Prestasi
tulisan yang digunakan oleh manusia dalam
(IP) tertinggi dalam semester tertentu,
percakapan sehari-hari. Terdapat 5 (lima)
daftar mahasiswa yang memiliki IP
elemen utama dalam program NLP, yaitu
Kumulatif di bawah 2,75, dan sebagainya.
parser, lexicon, understander, knowledge
Informasi yang khusus seperti ini tidak
base, dan generator.
secara langsung dapat ditangani oleh
SIAMIK tetapi pengolahan secara manual
4.2.1. Parser
untuk memperoleh informasi tersebut.
Untuk memenuhi kebutuhan informasi Parser berfungsi untuk menganalisa
akademik tersebut secara langsung, maka setiap kata yang diinput dari pengguna
perlu dilakukan query secara langsung dalam natural language kemudian
untuk memperoleh informasi yang memanfaatkan lexicon untuk mengecek
diinginkan. Proses query tersebut apakah kata tersebut dikenali oleh database
membutuhkan pemahaman terhadap SQL language atau tidak. Dalam penelitian ini,
dan mengetahui struktur database dari jenis parser yang digunakan adalah Parser
SIAMIK yang dalam hal ini ditangani oleh Noise-Disposal.
Biro Administrasi Perencanaan dan Sistem Algoritma parser yang dirancang
Informasi (BAPSI). dalam penelitian ini adalah sebagai berikut:
Hasil observasi terhadap database 1. Scan satu per satu kata yang berasal
SIAMIK UAJM dapat diperoleh bahwa dari input teks yang dikirim oleh
untuk memperoleh informasi akademik pengguna dalam natural language,
yang berhubungan dengan mahasiswa, 2. Lakukan pengecekan dalam lexicon,
maka beberapa tabel yang berkaitan adalah apakah kata yang di-scan terdapat
tabel data_mahasiswa, data_krs, dalam tabel relasi yang berisi seluruh
data_nilai_mahasiswa, dan beberapa tabel terjemahan dari natural language ke
pendukung lainnya. dalam database language. Jika terdapat
Penggunaan struktur query yang dalam lexicon, maka dilakukan
sederhana dalam memperoleh informasi pengecekan status dari arti masing-
dari database adalah SELECT atribut masing kata. Jika tidak maka lanjutkan
FROM tabel WHERE kondisi. Jika ditinjau scan ke kata berikutnya.
dari natural language, maka penggunaan
perintah SELECT dapat digantikan dengan 4.2.2. Lexicon dan Knowledge Base
kata “tampilkan”, “lihat”, dan kata lain
Lexicon berfungsi sebagai
yang memiliki arti kata yang sama.
penyimpan kata-kata yang dikenali oleh
Sedangkan perintah WHERE dapat
database language. Dalam penelitian ini,
digantikan dengan kata “yang”, “dimana”,

Lisangan, Natural Language Processing Dalam Memperoleh Informasi Akademik Mahasiswa UAJM 5
lexicon disimpan dalam sebuah tabel yang Algoritma understander yang
memiliki struktur seperti pada Gambar 3. dirancang dalam penelitian ini adalah
sebagai berikut:
1. Melakukan pengecekan status dari
output yang dihasilkan oleh parser,
2. Pengecekan status dilakukan untuk
mengetahui letak atau posisi dari arti
kata tersebut. Setiap arti kata memiliki
status masing-masing yang terdiri dari
Gambar 3. Struktur Tabel setara 3 (tiga) kemungkinan, yaitu 0, 1, dan 2.
Apabila status 0 (nol) berarti
Atribut nama_natural akan merupakan suatu sintaks, jika status 1
menyimpan daftar keseluruhan dari (satu) berarti merupakan suatu atribut,
penggunaan natural language yang dan status 2 (dua) sebagai penanda
memiliki penyetaraan dengan nama_sql tabel,
atau database language yang telah diinput 3. Apabila ditemukan arti kata yang
sebelumnya. berupa sintaks “where” dan ditemukan
Knowledge base bertugas untuk arti kata berikutnya adalah atribut,
membantu understander dengan maka selanjutnya pasti berupa operator
menyimpan makna dari arti kalimat yang dan nilai,
telah melalui proses parser. Atribut status 4. Apabila ditemukan arti kata yang
merupakan flag (penanda) dari arti kata berupa sintaks “and”, “or”, atau “not”
dalam database language, yang memiliki maka kembali ke langkah nomor 3
kemungkinan nilai 0 (nol) sebagai sintaks, 1 (tiga),
(satu) sebagai atribut, dan 2 (dua) sebagai 5. Apabila ditemukan arti kata yang
tabel. berupa sintaks “order by” atau “group
Dalam penelitian ini, knowledge base by” maka arti kata yang berikutnya
juga bertugas untuk menyimpan hubungan berupa atribut dan dapat diikuti dengan
relasi antar tabel yang berhubungan. operator pengurutan,
Hubungan relasi antar tersebut disimpan 6. Simpan setiap arti kata ke dalam sebuah
dalam sebuah tabel yang memiliki struktur array sesuai dengan statusnya masing-
seperti pada Gambar 4. masing, apakah status sintaks, atribut,
tabel, kondisi, atau pengurutan,
7. Lakukan pengecekan relasi antar tabel
dengan membandingkan antar isi array
yang menyimpan nama tabel yang
digunakan. Apabila memiliki relasi,
maka tambahkan isi array yang
Gambar 4. Struktur Tabel relasi menyimpan kondisi dengan statemen
yang menandakan adanya relasi antar
Atribut tabel dan tabel1 menyimpan tabel.
nama tabel yang saling berelasi dengan
kunci yang menghubungkan tabel tersebut 4.2.4. Generator
disimpan dalam atribut kunci.
Generator adalah input yang telah
4.2.3. Understander dimengerti untuk membuat output yang
berguna atau dalam penelitian ini, output
Tujuan dari understander adalah yang akan dihasilkan oleh generator adalah
memanfaatkan output dari parser agar SQL yang diperoleh berdasarkan hasil
mengacu dari knowledge base. Apabila proses parser dan understander. Generator
input kalimat berupa statemen, maka untuk menghasilkan SQL adalah dengan
understander menentukan maknanya berlandaskan pada struktur perintah SQL
dengan melihat kata-kata atau frasa-frasa dan membuat pemanggilan secara berurut
yang ada dalam basis pengetahuan.

6 JURNAL TEMATIKA VOL. 1, NO. 1, MARET 2013, ISSN: 2303 3878


dari isi array mulai dari statemen, atribut, 4.2.5. Hasil Perancangan Aplikasi NPL
tabel, kondisi, dan pengurutan.
Aplikasi NPL yang dirancang
SQL yang telah dihasilkan kemudian
menggunakan bahasa pemrograman PHP
dieksekusi ke dalam database SIAMIK
dan database MySQL. Input yang
UAJM untuk memperoleh informasi
diharapkan dari aplikasi adalah berupa
akademik mahasiswa sesuai dengan yang
natural language dari pengguna dan akan
diinginkan.
memperoleh output berupa hasil
pemrosesan dalam perintah SQL dan
informasi akademik yang diharapkan.

Gambar 5. Tampilan Output dari Aplikasi NPL

4.3. Uji Kesahihan telah sesuai dengan yang diharapkan atau


tidak.
Uji kesahihan dilakukan untuk
Uji kesahihan yang pertama adalah
melakukan pengecekan terhadap input yang
dengan mencoba memberikan input untuk
dimasukkan dalam natural language
menampilkan daftar mahasiswa yang
pengguna, kemudian melakukan
terdaftar di program studi Teknik
pengecekan apakah output yang dihasilkan
Informatika dan berstatus aktif.

Gambar 6. Tampilan Hasil Informasi dari Mahasiswa TI dan Status Aktif

Lisangan, Natural Language Processing Dalam Memperoleh Informasi Akademik Mahasiswa UAJM 7
Uji kesahihan yang kedua adalah Informatika dan berstatus aktif dan
dengan mencoba memberikan input untuk memiliki IPK lebih besar dari 2,75 dan
menampilkan daftar mahasiswa yang diurutkan berdasarkan IPK tertinggi.
terdaftar di program studi Teknik

Gambar 7. Tampilan Hasil Informasi IPK Mahasiswa

Berdasarkan hasil output dari kedua [2] Fathansyah. 1999. Basis Data.
input (Gambar 6 dan Gambar 7) dapat Bandung: Penerbit Informatika.
dikatakan bahwa output yang dihasilkan
telah sesuai dengan input yang dimasukkan [3] Jogiyanto. 2008. Analisis & Desain
oleh pengguna. Sistem Informasi: Pendekatan
Terstruktur Teori Dan Praktek
5. KESIMPULAN Aplikasi Bisnis. Yogyakarta: Penerbit
Kesimpulan yang dapat diperoleh Andi.
dari penelitian ini adalah sebagai berikut:
 NPL dapat digunakan untuk membantu [4] Silberschatz, Abraham., Korth, Henry
pengguna awam dalam memperoleh F., Sudarshan, S. 2009. Database
informasi tanpa perlu mempelajari System Concepts Sixth Edition. New
database language dan struktur York: McGraw Hill.
database SIAMIK UAJM.
 NPL sangat bergantung pada lexicon
[5] Siswanto. 2010. Kecerdasan Tiruan
dan knowledge base yang dimilikinya,
Edisi 2. Jakarta: Graha Ilmu.
sehingga diperlukan adanya pendataan
kosakata yang digunakan oleh pengguna
sebelum menggunakan aplikasi NPL. [6] Suparman dan Marlan. 2005.
Komputer Masa Depan: Pengenalan
6. DAFTAR PUSTAKA Artificial Intelligence. Bandung:
Penerbit Andi.
[1] Desiani, Anita, dan Arhani,
Muhammad. 2006. Konsep
Kecerdasan Buatan. Palembang: [7] Suyoto. 2004. Intelegensi Buatan:
Penerbit Andi. Teori dan Pemrograman. Yogyakarta:
Penerbit Gava Media.

8 JURNAL TEMATIKA VOL. 1, NO. 1, MARET 2013, ISSN: 2303 3878


Lisangan, Natural Language Processing Dalam Memperoleh Informasi Akademik Mahasiswa UAJM 9

You might also like