You are on page 1of 7

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/309872191

PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN TINGGI KABUPATEN


MAJALENGKA BERBASIS KNOWLEDGE BASED SYSTEM

Conference Paper · May 2016

CITATIONS READS

0 1,731

3 authors:

Tri Ferga Dony Susandi


Universitas Malikussaleh Universitas Majalengka
1 PUBLICATION   0 CITATIONS    8 PUBLICATIONS   1 CITATION   

SEE PROFILE SEE PROFILE

Ida Siti Widianingrum

1 PUBLICATION   0 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

dissertation task View project

All content following this page was uploaded by Dony Susandi on 11 November 2016.

The user has requested enhancement of the downloaded file.


Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) ISSN : 2503-2844
Bandung, 28 Mei 2016

PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN


TINGGI KABUPATEN MAJALENGKA BERBASIS
KNOWLEDGE BASED SYSTEM
Tri Ferga Prasetyo, Dony Susandi, Ida Siti Widianingrum
Teknik Informatika, Teknik Industri, Teknik Informatika
Fakultas Teknik - Universitas Majalengka
Jl. K.H Abdul Halim No. 103 Majalengka 45418
Telp. (0233) 8187177
triferga.prasetyo@gmail.com, ds_777@ymail.com, widyaforia@gmail.com

Abstrak on the specified time. Classification of data mining


technique are used to predict the the future of a
Salah satu faktor untuk menentukan kualitas student's study is using back propagation neural
pendidikan tinggi adalah kemampuan siswa untuk network algorithm and k-nearest neighbor.
menyelesaikan studi tepat waktu. Perguruan tinggi Evaluation results of the classification process are
perlu mendeteksi perilaku dari mahasiswa aktif using k-fold cross validation and confusion matrix.
sehingga dapat dilihat faktor kegagalan siswa yang Tests with the confusion matrix using k-nearest
lulus tidak berdasarkan waktu yang ditentukan. neighbor algorithm produces the highest accuracy
Teknik klasifikasi data mining yang digunakan untuk values obtained with the value of the distance (k-100)
memprediksi lama studi mahasiswa yaitu to the new data by 97.90%. In predicting graduation,
menggunakan algoritma back propagation neural the student data is used as knowledge based system to
network dan k-nearest neighbor. Evaluasi hasil determine the pattern of data mining. Analysis of
proses klasifikasi menggunakan k-fold cross students who passed the graduation on time is 98%.
validation dan confusion matrix. Pengujian dengan Meanwhile, 2% of students do not graduate on time,
confusion matrix menggunakan algoritma k-nearest because the GPA is low and when the register has
neighbor menghasilkan nilai akurasi tertinggi yang exceeded the age limit.
diperoleh dengan nilai jarak (k-100) terhadap data
baru sebesar 97,90 %. Dalam memprediksi kelulusan, Keywords: Prediction, Classification Data Mining,
data mahasiswa digunakan sebagai knowledge based K-Nearest Neighbor, Knowledge Based Systems,
system dengan menentukan pola data mining. Confusion Matrix.
Analisis kelulusan mahasiswa yang dinyatakan lulus
tepat waktu adalah 98 %. Sementara itu, 2 %
mahasiswa tidak lulus tepat waktu, karena IPK I. PENDAHULUAN
rendah dan ketika mendaftar telah melebihi batas Perguruan tinggi merupakan satuan
usia. penyelenggara pendidikan akademik bagi mahasiswa.
Kata Kunci: Prediksi, Klasifikasi Data Mining, K- Data yang diperoleh dari Dirjen DIKTI (Direktorat
Nearest Neighbor, Knowledge Based System, Jendral Pendidikan Tinggi) Republik Indonesia
Confusion Matrix. menyebutkan bahwa jumlah lembaga penyelenggara
perguruan tinggi sampai dengan tahun 2014 tercatat
4.256 perguruan tinggi diselenggarakan di Indonesia,
yang terdiri dari akademik, sekolah tinggi, politeknik,
Abstract institut dan universitas. Semakin bertambah jumlah
One important factor to determine the quality perguruan tinggi maka semakin meningkat pula
of higher education is the ability of the students to jumlah sumber daya manusia berkualitas yang
complete studies on time. Universities need to detect dihasilkan perguruan tinggi. Salah satu faktor yang
the behavior of active students in order to see the menentukan kualitas perguruan tinggi adalah
failure factors of graduating students are not based

32
Tri Ferga Prasetyo, Dony Susandi, Ida Siti Widianingrum
Seminar Nasional Telekomunikasi dan Informatika 2016
Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) ISSN : 2503-2844
Bandung, 28 Mei 2016

persentasi kemampuan mahasiswa untuk 1. Penelitian yang pernah dilakukan mengenai


menyelesaikan studi tepat waktu (Khafiizh, 2012). prediksi kelulusan masa studi sarjana yang
dilakukan oleh Muhammad Hanief Meinanda
Data dari DIKTI (Direktorat Jendral Pendidikan
dkk. (2009) yang melakukan penelitian pada
Tinggi) Republik Indonesia menyebutkan bahwa
mahasiswa Gemastik dengan menggunakan
jumlah mahasiswa S1 adalah sebanyak 3.647.515
algoritma Artificial Neural Network & multiple
mahasiswa aktif yang tercatat hingga tahun 2014.
regressions, yang tujuan menentukan kebijakan
Oleh karena itu, Perguruan tinggi perlu mendeteksi
terhadap mahasiswa yang diprediksi memiliki
perilaku mahasiswa yang memiliki status mahasiswa
masa studi melebihi batas;
aktif sehingga dapat diketahui faktor-faktor
penyebab kegagalan mahasiswa yang tidak lulus 2. Penelitian terdahulu tentang perbandingan
seuai dengan lama masa studi mahasiswa. Beberapa performansi algoritma untuk prediksi kinerja
penyebab kegagalan mahasiswa yakni rendahnya akademik mahasiswa baru yang dilakukan oleh
kemampuan akademik, faktor pembiayaan, domisili Arief Jananto (2010) dengan menggunakan data
saat menempuh studi dan faktor lainnya (Hastuti, K., dari data akademik mahasiswa fakultas
2012). Teknologi Informasi di UNISBANK dengan
membandingkan algoritma Nearest Neighbor
Database perguruan tinggi menyimpan data
dan SLIQ, tujuan penelitian ini adalah
akademik, administrasi dan biodata mahasiswa. Data
membangun sebuah aplikasi data mining
tersebut apabila dieksplorasi dengan tepat maka
sederhana, mengimplementasikan algoritma
dapat diketahui pola atau pengetahuan untuk
Nearest Neighbor dan membandingkan
mengambil keputusan (El-Halees, A., 2009).
performansi dari aplikasi yang dibangun;
Serangkaian proses mendapatkan pengetahuan atau
pola dari kumpulan data disebut dengan data mining 3. Khafiizh Hastusti (2012) melakukan analisis
(Hall, M., Witten, I., & Frank, E., 2011). komparasi algoritma data mining untuk
memprediksi mahasiswa nonaktif. Algoritma
Data mining berfungsi untuk menemukan
yang dibandingkan adalah algoritma logistic
hubungan yang berarti, pola, dan kecenderungan
regression, Decision Tree dan Neural Network
dengan memeriksa dalam sekumpulan besar data
sedangkan objek yang diteliti adalah mahasiswa
yang tersimpan dalam penyimpanan dengan
program studi teknik informatika, sistem
menggunakan teknik pengenalan pola seperti teknik
informasi dan komunikasi di Universitas Dian
statistik dan matematika (Larose, D. T., 2005).
Nuswantoro Semarang dengan tujuan untuk
Perguruan tinggi perlu melakukan prediksi perilaku
mengetahui algoritma yang paling akurat untuk
mahasiswa untuk mencegah secara dini kegagalan
memprediksi kelulusan mahasiswa;
akademik mahasiswa.
4. Penelitian yang dilakukan oleh Muhammad
Penelitian ini dimaksudkan untuk memprediksi
Syukri Mustafa dan I Wayan Simpen (2014)
kelulusan mahasiswa diambil dari basis pengetahuan
mengenai perancangan aplikasi kelulusan tepat
data mahasiswa. Basis pengetahuan tersebut adalah
waktu bagi mahasiswa baru di STMIK
pola algoritma yang di hasilkan dari proses
Dipanegara Makasar dengan menggunkan
perbandingan algoritma backpropagation neural
algoritma k-Nearest Neighbor dengan tujun
network dan algoritma k-nearest neighbor.
untuk merancang suatu sistem yang dapat
Perbandingan akurasi dari kedua algoritma dilakukan
melakukan prediksi terhadap mahasiswa baru
dengan dibantu tool penunjang data mining, dan
apakah berpeluang untuk menyelesaikan studi
dapat memberikan rekomendasi dari penggunanaan
tepat waktu atau tidak.
kedua algoritma berdasarkan pendekatan kuantitatif.

II. KAJIAN LITERATUR


Kajian literatur ini dijadikan sebagai bahan acuan
membuat penelitian dari beberapa penelitian
sebelumnya yang merupakan satu acuan tema yang
sama.

33
Tri Ferga Prasetyo, Dony Susandi, Ida Siti Widianingrum
Seminar Nasional Telekomunikasi dan Informatika 2016
Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) ISSN : 2503-2844
Bandung, 28 Mei 2016

III. METODE PENELITIAN memakan waktu lama. Data mahasiswa yang akan
dicari hubungannya meliputi jenis kelamin, usia
saat mendaftar, kota asal mahasiswa, jurusan asal
sekolah, agama, IPK dan fakultas. Adapun yang
akan diproses mining meliputi :
1. Hubungan tingkat kelulusan dengan jenis
kelamin;
2. Hubungan tingkat kelulusan dengan jurusan asal
sekolah;
3. Hubungan tingkat kelulusan dengan usia saat
mendaftar;
4. Hubungan tingkat kelulusan dengan IPK;
5. Hubungan tingkat kelulusan dengan agama;
6. Hubungan tingkat kelulusan dengan kota asal
mahasiswa;
7. Hubungan tingkat kelulusan dengan fakultas;
III.3 Data Yang Digunakan
Pada penulisan penelitian i n i mencari
hubungan beberapa atribut dari data induk
mahasiswa dengan tingkat kelulusan. Karena
tidak semua tabel digunakan maka perlu
dilakukan pembersihan data agar data yang akan
diolah benar-benar relevan dengan yang dibutuhkan.
Pembersihan ini penting guna meningkatkan
performa dalam proses mining.
Setelah melalukan proses pembersihan data,
didapatkan data lulusan dan data mahasiswa dengan
tidak menampilkan data NPM (Nomor Pokok
Mahasiswa) dan nama dari mahasiswa dengan
Gambar 1. Kerangka Pemikiran alasan merupakan data pribadi
Dari jumlah sampel sebanyak 382 data yang
III.1 Tujuan Penelitian
terbagi atas data training dan data testing, dengan
Tujuan pelaksanaan penelitian ini adalah: pembagian 75% sebagai data training dan 25% data
1. Mencari dan menemukan pola algoritma yang testing. Jumlah data training sebanyak 286 data
yang terbaik dengan objek data mahasiswa lulusan dan jumlah data testing sebanyak 96 data
berdasarkan beberapa variabel yang mahasiswa.
ditentukan dalam menentukan kelulusan tepat
waktu;
2. Membandingkan hasil dari tingkat akurasi IV. ANALISIS DAN PERANCANGAN
dan teknik atau model data mining yang IV. 1 Pengujian Model Algoritma Data Mining
terpilih dari dua algoritma;
3. Mendapatkan hasil prediksi kelulusan Dalam menyelesaikan penelitian tentang
mahasiswa dengan basis pengetahuan dari prediksi kelulusan mahasiswa perguruan tinggi
data mahasiswa yang telah diolah dengan. kabupaten majalengka, model yang digunakan
menggunakan k-nearest neighbor dan back
III.2 Analisis Data Mining propagation nueral network dengan 8 parameter
yaitu 7 atribut dan 1 label yang terdiri dari jenis
Pada penelitian ini data mahasiswa dalam
kelamin, kota asal, agama, IPK, Fakultas, jurusan
kondisi acak dan tidak semua data mahasiswa akan
asal sekolah dan label tepat wkatu dan tidak tepat
dicari hubungannya dengan data kelulusan, hanya
waktu. Pengujian metode dilakukan dengan cara
beberapa atribut yang kira-kira berguna. Karena data
yang terlalu acak akan membuat proses mining confusion matrix dan k-fold cross validation, untuk

34
Tri Ferga Prasetyo, Dony Susandi, Ida Siti Widianingrum
Seminar Nasional Telekomunikasi dan Informatika 2016
Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) ISSN : 2503-2844
Bandung, 28 Mei 2016

menguji metode yang diuji menggunakan tools menghasilkan tingkat presisi yang sangat baik dengan
RapidMiner 5.3. nilai precision sebesar 100,00% dan hasil recall k-nn
IV. 2 Pengujian Model Algoritma k-Nearest yang diperoleh melalui proses validasi sebesar 25,00
Neighbor % nilai ini meunjukkan bahwa hasil yang diperoleh
1. Proses Pengujian Model adalah baik.
Pengujian model k-nearest neighbor dengan
IV. 3 Pengujian Model Algoritma Backpropagation
menggunakan rapid miner akan menguji akurasi
Neural Network
metode k-nearest neighbor, seberapa besar akurasi
1. Proses Pengujian Model
yang akan dihasilkan nantinya hasil pengujian
Pengujian model backpropagation neural
akurasi akan dibandingkan dengan metode lainnya.
network dengan menggunakan rapid miner akan
Adapun langkah-langkah yang akan dilakukan dalam
menguji akurasi metode backpropagation neural
pengujian ini menggunakan performa untuk
network, seberapa besar akurasi yang akan dihasilkan
menghasilkan tingkat akurasi dan dari metode yang
yang nantinya hasil pengujian akurasi akan
digunakan. Pengujian model k-nearest neighbor
dibandingkan dengan metode lainnya. Adapun
dengan menggunakan data training dan data testing
langkah-langkah yang akan dilakukan dalam
seperti ditunjukan pada gambar 2.
pengujian ini menggunakan k-fold cross validation
untuk menghasilkan tingkat akurasi dan dari metode
yang digunakan. Pengujian model backpropagation
neural network dengan menggunakan data training
seperti ditunjukan pada gambar 4.

Gambar 2. Proses Pengujian Algoritma K-Nearest


Neighbor
2. Hasil Running Pengujian Model
Setelah proses pengujian running, menghasilkan Gambar 4 Proses Pengujian Algoritma Backpropagation
output accuracy dengan waktu yang ditempuh selama Neural Network
2 detik. 2. Hasil Running Pengujian Model
Setelah proses pengujian running, menghasilkan
output accuracy dengan waktu yang ditempuh selama
2 menit 12 detik.

Gambar 3. Accuracy K-Nearest Neighbor


Gambar 3 memberikan informasi bahwa hasil
accuracy dari metode klasifikasi k-nearest neighbor Gambar 5 Gambar Accuracy Backpropagation Neural
adalah sebesar 97,90% ini menunjukan bahwa hasil Network
akurasi yang diperoleh masuk dalam kategori sangat Gambar 5 memberikan informasi bahwa hasil
baik. accuracy dari metode klasifikasi backpropagation
Ketelitian yang dihasilkan dari metode k-nearest neural network adalah sebesar 97,22% ini
neighbor yang diproses dengan rapidminer menunjukan bahwa hasil akurasi yang diperoleh
masuk dalam kategori sangat baik.

35
Tri Ferga Prasetyo, Dony Susandi, Ida Siti Widianingrum
Seminar Nasional Telekomunikasi dan Informatika 2016
Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) ISSN : 2503-2844
Bandung, 28 Mei 2016

Precision yang dihasilkan dari metode Tabel 2. Contoh Tabel Aturan Produksi Kelulusan
backpropagation neural network yang diproses “Tidak Tepat Waktu”
dengan rapidminer menghasilkan presisi yang sangat
baik dengan nilai precision sebesar 99,64% dan hasil
recall k-nn yang diperoleh melalui proses validasi
sebesar 12,50 % nilai ini meunjukkan bahwa hasil
yang diperoleh adalah baik.
IV. 4 Hasil Pengujian Model Algoritma
Setelah melakukan proses pengujian pada
masing-masing metode algoritma data mining,
diketahui bahwa algoritma k-nearest neighbor lebih
akurat atau lebih tinggi akurasinya dibandingkan
dengan algoritma backpropagation neural network.
Secara keseluruhan nilai hasil performance IV. 6 Implementasi Program Knowledge Based
menggunakan kinerja model confusion matrix dengan System
nilai jarak (k-2) serta menggunakan 7 variabel nilai Program mengambil keputusan berdasarkan
akurasinya adalah accuracy = 97,90%, precision = aturan-aturan yang dibangkitkan dari setiap
100,00%, dan recall = 25,00%, Hasil pengujian pertanyaan yang diajukan pada mahasiswa. Proses
algoritma k-nearest neighbor dengan menggunakan running tampilan antar muka komputer dan user
akurasi seperti pada tabel 1 terlihat seperti pada gambar 7 untuk prediksi “tepat
Tabel 1 Hasil Akurasi K-Nearest Neighbor waktu” dan gambar 8 untuk prediksi “tidak tepat
waktu”. Setiap mahasiswa dihadapkan pada
k-nearest neighbor pertanyaan yang mengharuskan untuk menjawab
Accuracy 97,90 % dengan menuliskan “y” atau “t”.
Precision 100,00 %
Recall 25,00 %

Dengan demikian, berdasarkan evaluasi model


algoritma data mining dengan bantuan rapidminer
model algoritma k-nearest neighbor terpilih
sebagai algoritma yang lebih akurat dibandingkan
dengan backpropagation neural network didalam
memprediksi kelulusan mahasiswa. Selanjutnya
untuk menentukan knowledge base system data
kelulusan mahasiswa adalah dengan menggunakan
eksperimen perhitungan algoritma k-nearest Gambar 8 Running “Prediksi Tepat Waktu”
neighbor.
Program akan berjalan ke pertanyaan berikutnya
IV. 5 Pola Hasil Klasifikasi Algoritma sesuai dari algoritma pengumpulan data. Pertanyaan
berikutnya akan muncul sesuai dari algoritma yang
Setelah melakukan perhitungan dari data
sudah dibuat dipengumpulan data, terus memproses
algoritma, perlu adanya pola hasil klasifikai untuk
sampai memenuhi kondisi yang ada pada
menemulan pengetahuan dari data mahasiswa.
algoritmanya.
Identifikasi pola-pola algoritma k-nearest neighbor
ke dalam bentuk aturan produksi. Hal ini berguna Sehingga apabila data seorang mahasiswa di
untuk penentuan apakah mahasiswa dengan data inputkan seperti yang terjadi pada gambar 8
tertentu sesuai dengan pola atau tidak, kemudian di menjelaskan bahwa pada saat mahasiswa berjenis
munculkan hasil mahasiswa tersebut memiliki kelamin perempuan, mendaftar pada usia yang
predikat “lulus tepat waktu” atau “tidak tepat waktu”. kurang dari 26 tahun dan memilki jumlah IPK yang
lebih dari 2,01 maka mahasiswa tersebut diprediksi
lulus “TEPAT WAKTU”. Rule diatas sesuai dengan

36
Tri Ferga Prasetyo, Dony Susandi, Ida Siti Widianingrum
Seminar Nasional Telekomunikasi dan Informatika 2016
Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) ISSN : 2503-2844
Bandung, 28 Mei 2016

rule-rule pada aturan produksi tepat waktu. Dari proses pengujian dengan confusion matrix
diketahui bahwa metode algoritma k-nearest
neighbor menghasilkan nilai akurasi tertinggi yang
diperoleh dengan nilai jarak (k-100) serta
menggunakan 7 variabel terhadap data baru yaitu
sebesar 97,90 %. Penerapan rule dari algoritma k-
nearest neighbor yang digunakan dalam klasifikasi
kelulusan mahasiswa kedalam aplikasi knowledge
based system menggunakan CLIPS, dapat membantu
dalam proses prediksi kelulusan mahasiswa.

REFERENSI
Gambar 8. Running Prediksi “Tidak Tepat Waktu” Dikti, 2015. Grafik Mahasiswa Berdasarkan Jenjang.
Diperoleh dari Website Kemenristekdikti :
Pada gambar 8 dapat dilihat program running
http://forlap.dikti.go.id/mahasiswa/homegra
untuk prediksi “tidak tepat waktu”. Analisa dari
phjenjang. Diakses tanggal 17 Mei 2015.
proses prediksi yang tergambar pada aturan produksi
menjelaskan bahwa ketika program menanyakan Hastuti, K. (2012). Analisis komparasi algoritma
“apakah Anda seorang laki-laki ? (y/t)” maka jenis klasifikasi data mining untuk prediksi
saat mahasiswa menjawab “y”, program akan mahasiswa Non aktif. Semantik, 2(1).
berjalan ke pertanyaan berikutnya sesuai dari
El-Halees, A. (2009). Mining students data to analyze
algoritma pengumpulan data. Pertanyaan berikutnya
e-Learning behavior: A Case Study.
akan muncul sesuai dari algoritma yang sudah dibuat
Department of Computer Science, Islamic
dipengumpulan data, terus memproses sampai
University of Gaza PO Box, 108.
memenuhi kondisi yang ada pada algoritmanya.
Hall, M., Witten, I., & Frank, E. (2011). Data mining:
Sehingga pada saat data seorang mahasiswa di
Practical machine learning tools and
inputkan sebagai mahasiswa berjenis kelamin laki-
techniques. Kaufmann, Burlington.
laki, mendaftar pada usia yang lebih dari 26 tahun,
berasal dari kota majalengka, beragama islam, Larose, D. T. (2005). Discovering Knowledge in
sekolah asalnya SMK dan memilki jumlah IPK yang Databases. New Jersey: John Willey & Sons
kurang dari 2,01 maka mahasiswa tersebut diprediksi Inc.
lulus “TIDAK TEPAT WAKTU”. Rule diatas sesuai
Meinanda, M. H., Annisa, M., Muhandri, N., &
dengan rule-rule yang sudah dikemukakan pada
Suryadi, K. (2009). Prediksi masa studi
aturan produksi.
sarjana dengan artificial neural network.
Internetworking Indonesia Journal, 1(2), 31-
35.
V. KESIMPULAN
Jananto, A. (2010). Perbandingan Performansi
Proses penentuan pola lama studi mahasiswa dapat
Algoritma Nearest Neighbor dan SLIQ
dilakukan dengan menerapkan algoritma data mining
untuk Prediksi Kinerja Akademik
dengan metode algoritma k-nearest neighbor.
Mahasiswa Baru. Dinamik-Jurnal Teknologi
Dengan metode tersebut, ketepatan masa studi
Informasi, 15(2).
mahasiswa dapat diprediksi berdasarkan hasil
klasifikasi data mining dan menghasilkan prediksi Mustafa, M. S., & Simpen, I. W. (2014).
sesuai dengan data akademik dan latar belakang Perancangan Aplikasi Prediksi Kelulusan
sekolah sebelumnya. Pengujian dengan bantuan Tepat Waktu Bagi Mahasiswa Baru Dengan
Rapidminer dapat digunakan untuk membandingkan Teknik Data Mining (Studi Kasus: Data
antara algoritma k-nearest neighbor dengan agoritma Akademik Mahasiswa STMIK Dipanegara
backpropagation neural network. Makassar). Creative Information Technology
Journal, 1(4), 270-281.

37
Tri Ferga Prasetyo, Dony Susandi, Ida Siti Widianingrum
Seminar Nasional Telekomunikasi dan Informatika 2016

View publication stats

You might also like