You are on page 1of 10

Jurnal EKSPONENSIAL Volume 4, Nomor 1, Mei 2013 ISSN 2085-7829

Perbandingan Metode Klasifikasi Regresi Logistik Dengan Jaringan Saraf Tiruan


(Studi Kasus: Pemilihan Jurusan Bahasa dan IPS pada SMAN 2 Samarinda Tahun Ajaran
2011/2012)

Comparison of Classification Methods Between Logistic Regression and Artificial Neural


Network
(Case Study: Selection of Language and Social Studies Depertement at SMAN 2
Samarinda academic year 2011/2012)

Ramli1, Desi Yuniarti2 dan Rito Goejantoro3


1
Mahasiswa Program Studi Statistika FMIPA Universitas Mulawarman
2,3
Dosen Program Studi Statistika FMIPA Universitas Mulawarman
Email: ramliribut@yahoo.com1; desy_yunt@yahoo.com2; ritogoejantoro@yahoo.com3

Abstract
Classification problems can be solved by using logistic regression and classification method of artificial
neural network or artificial neural network (ANN). Classification with logistic regression method performed
by transforming the dependent variable into a logit variable is the natural log of the odds ratio. In the ANN
classification done by accepting a vector of input and then calculates a response or output by processing
through the process elements are interrelated. The elements are arranged in several layers (layer) and the
input data flow from one layer to the next in sequence. Output values can be scalar values or vectors,
calculated at the output layer. The purpose of this study was to determine the results of the classification by
using logistic regression and neural network analysis then compared with the classification accuracy. The
data used in this study is the data the average value of report cards in the 1st half and the 2nd half of the
class X for English and social studies subjects at SMAN 2 Samarinda academic year 2011/2012. The amount
of data is 314 students with 2 to 4 response variables explanatory variables. Based on these results, the
obtained results for the logistic regression classification accuracy of 78.34% and 80.89% for ANN analysis.
From the comparison of artificial neural network classification method is a better classification method in
solving the classification of English and social studies majors elections in SMAN 2 Samarinda academic year
2011/2012.

Keywords: Logistic Regression, Neural Networks, Classification, Classification Accuracy.

Pendahuluan dari 2 kategori. Regresi logistik tidak


Pengklasifikasian merupakan salah satu memodelkan secara langsung variabel respon (Y)
metode untuk mengelompokkan atau dengan variabel penjelas (X), melainkan melalui
mengklasifikasikan suatu data yang disusun transformasi variabel respon ke variabel logit
secara sistematis. Masalah klasifikasi sering yang merupakan natural log dari odds rasio
dijumpai dalam kehidupan sehari-hari. Baik itu (Fractal, 2003).
pengklasifikasian data pada bidang akademik, Jaringan Saraf Tiruan (JST) adalah suatu
sosial, pemerintah, maupun pada bidang lainnya. sistem pemrosesan informasi yang mencoba
Masalah klasifikasi ini muncul ketika terdapat meniru otak manusia. Kelebihan dari JST adalah
sejumlah ukuran yang terdiri dari satu atau mampu mengakuisisi pengetahuan walau tidak
beberapa kategori yang tidak dapat ada kepastian, mampu melakukan generalisasi
diidentifikasikan secara langsung tetapi harus dan ekstraksi dari suatu pola data tertentu dan
menggunakan suatu ukuran. dapat menciptakan suatu pola pengetahuan
Regresi logistik merupakan salah satu metode melalui pengaturan diri kemampuan belajar. Dan
klasifikasi yang sering digunakan, regresi logistik kelemahan pada JST kurang mampu melakukan
merupakan suatu teknik analisis data dalam operasi numerik dengan presisi tinggi, kurang
statistika yang bertujuan untuk mengetahui mampu melakukan operasi algoritma aritmatik
hubungan antara beberapa variabel dimana dan lamanya proses training yang mungkin terjadi
variabel responnya adalah bersifat kategorik, baik dalam waktu yang sangat lama untuk jumlah data
nominal maupun ordinal dengan variabel yang besar.
penjelasnya dapat bersifat kategorik atau kontinu. Pada berbagai permasalahan, dibutuhkan
Regresi logistik biner digunakan saat variabel analisis yang melibatkan proses klasifikasi.
respon merupakan variabel dikotomus (kategorik Tujuan klasifikasi adalah mengelompokkan objek
dengan 2 macam kategori), sedangkan regresi pengamatan berdasarkan serangkaian variabel-
logistik multinomial digunakan saat variabel variabel yang disebut sebagai variabel penjelas.
respon adalah variabel kategorik dengan lebih Dua metode klasifikasi yang diterapkan dan akan

Program Studi Statistika FMIPA Universitas 1


Jurnal EKSPONENSIAL Volume 4, Nomor 1, Mei ISSN 2085-

dievaluasi dalam penelitian ini adalah klasifikasi 𝛽0+


𝑝
𝛽𝑗 𝑥𝑗 𝛽0
𝑝
𝛽𝑗 𝑥𝑗

melalui Regresi Logistik dan Jaringan Saraf 1+𝑒 𝑗 =1 −𝑒


𝑗 =1
1−𝜋 𝑥 = 𝑝
Tiruan. 𝛽0 𝛽𝑗 𝑥𝑗
Dari beberapa penelitian sebelumnya telah 1+𝑒 𝑗

dilakukan penelitian membandingkan metode 1


= 𝛽0 𝑝 𝛽𝑗 𝑥𝑗
pengklasifikasian, yaitu Perbandingan Analisis 1+𝑒 𝑗 =1
Diskriminan Mahalanobis dan Analisis Jaringan 𝜋(𝑥)
Sehingga sebagai berikut:
Saraf Tiruan oleh Firmansyah (2010), 1−𝜋(𝑥)
perbandingan Metode Klasifikasi Analisis 𝜋(𝑥) 𝛽
𝑝
𝛽 𝑥
Diskriminan, Regresi Logistik dan Jaringan Saraf = 𝑒 0 𝑗=1 𝑗 𝑗
1 − 𝜋(𝑥)
Tiruan pada kasus pengelompokan bunga oleh
Suhermin (2002). Jadi, persamaan logistiknya adalah:
Pada penelitian ini dibahas perbandingan 𝜋 𝑥
𝑔 𝑥 = 𝑙𝑛
metode klasifikasi regresi logistik dengan 1−𝜋 𝑥
jaringan saraf tiruan pada studi kasus: pemilihan 𝑝

jurusan Bahasa dan IPS pada SMAN 2 Samarinda = 𝑙𝑛 𝑒 𝛽0 𝛽𝑗 𝑥𝑗


𝑗 =1

tahun ajaran 2011/2012. 𝑝


=𝛽
0 + 𝑗 𝛽𝑗 𝑥𝑗 (2)
Tujuan yang ingin dicapai dari penelitian ini =1
adalah untuk mengetahui model pengklasifikasian
yang terbaik antara regresi logistik dan jaringan Estimasi Parameter Regresi Logistik
saraf tiruan. Pengujian parameter pada regresi logistik
sangat penting untuk dilakukan. Hal ini
Regresi Logistik dikarenakan pengujian tersebut digunakan untuk
Regresi logistik merupakan suatu teknik menentukan apakah variabel bebas dalam model
analisis data dalam statistika yang bertujuan untuk signifikan terhadap variebel terikat. Pengujian
mengetahui hubungan antara beberapa variabel dapat dilakukan secara:
dimana variabel responnya adalah bersifat
kategorik, baik nominal maupun ordinal dengan 1. Uji Goodness Of Fit
variabel penjelasnya dapat bersifat kategorik atau Dalam mencocokkan sebuah model logistik,
kontinu. Regresi logistik biner merupakan salah perlu dipilih sebuah model dengan fungsi
satu pendekatan model matematis yang digunakan penghubung dan variabel penjelas yang hasilnya
untuk menganalisis hubungan beberapa faktor paling cocok. Untuk itu digunakan uji statistik
dengan sebuah variabel yang bersifat biner. Pada Goodness Of Fit untuk membandingkan
regresi logistik jika variabel responnya terdiri dari kecocokan dalam model-model yang berbeda.
dua kategori misalnya Y=1 menyatakan hasil yang Untuk pengujian ini dapat digunakan uji Hosmer
diperoleh ”sukses” dan Y=0 menyatakan hasil dan Lemeshow.
yang diperoleh “gagal” maka regresi logistik 𝐶 = (𝑂
)2
𝑘 −𝑛′𝑘 𝜋 𝑘 (3)
𝑔
tersebut menggunakan regresi logistik biner 𝑘=1 𝑛 ′ 𝑘 𝜋 𝑘 (1−𝜋 𝑘 )

(Fractal, 2003).
Metode regresi logistik memiliki teknik dan 2. Uji Serentak (simultan)
prosedur yang tidak jauh berbeda dengan metode Bertujuan untuk mengetahui pengaruh
regresi linear. Jika prosedur linear dalam variabel bebas secara serentak terhadap variabel
mengestimasi nilai parameter sering terikat.
menggunakan metode Ordinary Least Squares
3. Uji Parsial
(OLS), maka untuk mengestimasi nilai parameter
Dalam uji parsial ini, pengujian dilakukan
dalam regresi logistik adalah dengan
dengan menguji setiap βj secara individual. Hasil
menggunakan metode Maximum Likelihood
pengujian secara individual akan menunjukkan
Estimation (MLE). Untuk mencari persamaan
apakah suatu variabel prediktor layak untuk
logistiknya maka model yang dipakai adalah:
𝑝
𝛽 + 𝑗 =1 𝛽 𝑥
masuk dalam model atau tidak.
𝑒 0 Pada model regresi logistik, β1 menunjukkan
𝜋 𝑥 = 𝑝 (1) besar perbedaan antara nilai variabel terikat ketika
𝛽 + 𝛽𝑗𝑥𝑗
1+𝑒 0 𝑗 variabel bebas (x+1) dan nilai variabel terikat
Dari persamaan (1) diperoleh 1 – π(x) sebagai ketika variabel bebas x untuk setiap nilai x. Untuk
berikut: variabel bebas yang bersifat dikotomi,
𝛽0+
𝑝
𝛽𝑗 𝑥𝑗 diasumsikan nilai x adalah 0 dan 1, Selanjutnya
𝑒 𝑗 dibentuk suatu Tabel klasifikasi 2x2 sebagai mana
1−𝜋 𝑥 = 1− 𝑝
𝛽0+ 𝑗 =1 𝛽𝑗 𝑥𝑗 dinyatakan pada Tabel 1.
1+𝑒

2 Program Studi Statistika FMIPA Universitas


Jurnal EKSPONENSIAL Volume 4, Nomor 1, Mei 2013 ISSN 2085-7829

Tabel 1. Nilai Model Regresi Logistik untuk Variabel


mengambil ide dari cara kerja jaringan saraf
Bebas Bersifat Biner (0,1)
biologis.
Varibel Penjelas (x)
Salah satu contoh pengambilan ide dari
x=1 x=0 jaringan saraf biologis adalah adanya elemen-
𝜋 1 elemen pemrosesan pada JST yang saling
y =1 𝜋 0 = 𝑒𝛽0
Variabel = 𝑒𝛽0+𝛽1 terhubung dari beroperasi secara paralel. Ini
1 + 𝑒𝛽0
Respon 1 + 𝑒𝛽0+𝛽1 meniru jaringan saraf biologis yang tersusun dari
(y) 1−𝜋 1 1−𝜋 0 sel-sel saraf (neuron). Cara kerja dari elemen-
y =0 = 1 1
𝛽 +𝛽
= elemen pemrosesan JST juga sama seperti cara
1+𝑒 0 1 1 + 𝑒𝛽0
neuron meng-encode informasi yang
Sumber : Hosmer dan Lemeshow (2000)
diterimanya,seperti Gambar 1 (Puspitaningrum,
Nilai odds untuk terjadinya variabel respon di 2006).
antara variabel penjelas yang mempunyai x=1
adalah:
𝑃(𝑦=1 𝑥=1) 𝜋 (1)
= (4)
𝑃(𝑦=0 𝑥=1) 1−𝜋 (1)

Sedangkan nilai odds untuk terjadinya variabel


respon di antara variabel penjelas yang
mempunyai x = 0 adalah:
𝑃(𝑦=1 𝑥=0) 𝜋 (0)
= (5) Gambar 1. Contoh sel saraf biologis
𝑃(𝑦=0 𝑥=0) 1−𝜋 (0)

Bila nilai odds tersebut ditransformasikan ke Jaringan saraf biologis merupakan kumpulan
dalam bentuk log dengan bilangan dasar akan dari sel-sel saraf (neuron). Neuron mempunyai
diperoleh: tugas mengolah informasi. Komponen-komponen
𝜋(𝑥)
𝑙𝑛 𝑜𝑑𝑑𝑠 = 𝑔 𝑥 = 𝑙𝑛 (6) utama dari sebuah neuron dapat dikelompokkan
1−𝜋(1)
menjadi 3 bagian yaitu:
Sehingga untuk x=1, maka: 1. Dendrite bertugas untuk menerima informasi.
𝜋(1)
𝑔 1 = 𝑙𝑛 (7) 2. Badan sel (soma) berfungsi sebagai tempat
1−𝜋(1) pengolahan informasi.
dan untuk x =0, maka: 3. Akson (neurit) mengirimkan implus-implus ke
𝜋(0) sel saraf lainnya.
𝑔 0 = 𝑙𝑛 (8)
1−𝜋(0)
Fungsi Sigmoid Biner
Log odds ratio merupakan perbedaan atau Fungsi ini digunakan untuk jaringan saraf
selisih nilai logit. Dengan mensubstitusikan yang dilatih dengan menggunakan metode
model logistik pada Tabel 1. Nilai Model Regresi backpropagation. Fungsi sigmoid biner memiliki
Logistik untuk variabel penjelas, maka nilai pada range 0 sampai 1. Oleh karena itu,
didapatkan: fungsi ini sering digunakan untuk jaringan saraf
𝜋(1)/ 1 − 𝜋(1) yang membutuhkan nilai output yang terletak
𝜓=
𝜋(0)/ 1 − 𝜋(0) pada interval 0 sampai 1. Namun, fungsi ini bisa
juga digunakan oleh jaringan saraf yang nilai
𝜓 = 𝑒𝛽1 (9) outputnya 0 sampai 1 atau yang bukan 0 sampai 1
sesuai dengan keperluan. Persamaan fungsi
Sehingga log odds ratio menjadi : ln(ψ) = β1 sigmoid biner ditunjukkan pada persamaan (10)
dan grafiknya ditunjukkan pada Gambar 2.

Jaringan Saraf Tiruan


1
Jaringan Saraf Tiruan (JST) bisa dibayangkan 𝑓 𝑥 = 1+𝑒 −𝑥 (10)
seperti otak buatan didalam cerita-cerita fiksi 1
ilmiah. Otak buatan ini dapat berpikir seperti
manusia dan juga sepandai manusia dalam
menyimpulkan sesuatu potongan-potongan 0 x
informasi yang diterima. Komputer diusahakan -1
agar bisa berpikir sama seperti cara berpikir
manusia, caranya adalah dengan melakukan
Gambar 2. Grafik Keanggotaan Fungsi Aktivasi
peniruan terhadap aktivitas-aktivitas yang terjadi Sigmoid Biner
di dalam sebuah jaringan saraf biologi. Itulah
sebabnya mengapa JST dikatakan hanya

Program Studi Statistika FMIPA Universitas 3


Jurnal EKSPONENSIAL Volume 4, Nomor 1, Mei ISSN 2085-

Arsitektur Backpropagation
 net.trainParam.lr : dipakai untuk
Backpropagation memiliki beberapa unit yang
menentukan laju pemahaman (  = learning
ada dalam satu atau lebih layar tersembunyi.
rate). Semakin besar nilai  , semakin cepat
Gambar 3 adalah arsitektur backpropagation
dengan n buah masukan (ditambah sebuah bias), pula proses pelatihan. Akan tetapi jika 
sebuah layer tersembunyi yang terdiri dari p unit terlalu besar, maka algoritma menjadi tidak
(ditambah sebuah bias), serta m buah unit stabil dan mencapai titik minimum lokal
keluaran. 𝑣𝑗𝑖 merupakan bobot garis dari unit (biasanya α=0.5) ( Jong, 2005).
masukan 𝑥𝑖 ke unit layer tersembunyi 𝑧𝑖 (𝑣𝑗0
Metodologi Penelitian
merupakan bobot garis yang menghubungkan bias
Metode pengklasifikasian yang digunakan
di unit masukan ke unit layer tersembunyi 𝑧𝑗
dalam penelitian ini adalah analisis regresi
)
logistik dan analisis jaringan saraf tiruan. Hasil
𝑤𝑘𝑗 merupakan bobot dari unit layer tersembunyi analisis regresi logistik dengan bantuan software
𝑧𝑗 ke unit keluaran 𝑦𝑘 (𝑤𝑘0 merupakan bobot dari SPSS 16.0 dan hasil analisis jaringan saraf tiruan
bias di layer tersembunyi ke unit keluaran 𝑧𝑘) dengan bantuan software Matlab 7.1. Adapun
(Jong, 2005). langkah-langkah yang dilakukan dalam analisis
regresi logistik adalah:
1. Estimasi parameter model regresi logistik.
2. Pemlihan model yang cocok/uji goodness of
fit.
3. Pengujian parameter.
4. Interprestasi model koefisien regresi logistik.
5. Perhitungan persentase ketepatan klasifikasi.
Langkah-langkah yang dilakukan dalam
analisis jaringan saraf tiruan adalah:
1. Inisialisasi jaringan saraf.
2. Membangun jaringan saraf tiruan.
Gambar 3. Arsitektur Backpropagation 3. Pelatihan jaringan.
4. Evaluasi output jaringan (MAPE).
Pelatihan Backpropagation 5. Perhitungan persentase ketetapan klasifikasi.
Pelatihan backpropagation menggunakan Dan membandingkan hasil klasifikasi regresi
metode pencarian titik minimum untuk mencari logistik dengan jaringan saraf tiruan.
bobot dengan error minimum. Untuk melatih
jaringan digunakan perintah train pada matlab. Hasil dan Pembahasan
Pelatihan dilakukan untuk meminimumkan Data yang digunakan adalah nilai rata-rata
kuadrat kesalahan rata – rata (MSE). Metode raport siswa/siswi SMAN 2 Samarinda kelas X
paling sederhana untuk merubah bobot adalah semester 1 dan semester 2 tahun ajaran
metode penurunan gradien (gradient descent). 2011/2012. Menggunakan regresi logistik dan
Bobot dan bias diubah pada arah dimana unjuk jaringan saraf tiruan.
kerja fungsi menurun paling cepat.
Perangkat Matlab menyediakan beberapa 1. Analisis Regresi Logistik
metode pencarian titik minimumnya. Pencarian Metode pengklasifikasian yang digunakan
titik minimum dengan metode penurunan gradien dalam penelitian ini adalah Analisis Regresi
dilakukan dengan memberikan parameter Logistik. Hasil Analisis Regresi Logistik
’traingd’ dalam parameter pelatihan setelah fungsi diperoleh dengan bantuan software SPSS 16.0.
aktivasi pada perintah newff.
 net.trainParam.show : dipakai untuk Uji Likelihood Ratio atau Uji Simultan
menampilkan frekuensi perubahan MSE Pengujian ini dilakukan untuk mengetahui
(biasanya setiap 25 epoch) apakah variabel respon mempunyai pengaruh
 net.trainParam.epochs : dipakai untuk yang signifikan terhadap variabel penjelas. Pada
menentukan jumlah epoch (iterasi) maksimum pengklasifikasian jurusan Bahasa dan IPS dengan
(biasanya 500 epoch) menggunakan Analisis Regresi Logistik.
 net.trainParam.goal : dipakai untuk Tabel 2. Log-Likelihood Regresi Logistik
menentukan batas nilai MSE agar iterasi Step -2 Log likelihood
1 287,997
dihentikan. Iterasi akan berhenti jika MSE <
batas yang ditentukan dalam Pada Tabel 2. nilai G adalah 287,997 dimana
net.trainParam.goal atau jumlah nilai G > χ2(0.05,4) yaitu 287,997 > 9,49 maka H0
epoch mencapai batas yang ditentukan dalam ditolak, dan dapat disimpulkan bahwa minimal
net.trainParam.epochs (biasanya 0.1) ada satu variabel penjelas yang berpengaruh
terhadap variabel respon.

4 Program Studi Statistika FMIPA Universitas


Jurnal EKSPONENSIAL Volume 4, Nomor 1, Mei 2013 ISSN 2085-7829

Uji Parsial Menggunakan Uji Wald dengan kategori lain pada variabel penjelas yang
Pengujian ini dilakukan untuk mengetahui kualitatif dinyatakan dengan Odds Ratio. Rasio
pengaruh dari masing-masing variabel X1, X2, X3 kecenderungan dapat dilihat, kolom Exp (β) dan
dan X4 terhadap Jurusan. Pada Tabel 3 diperoleh dapat disederhanakan seperti Tabel 6.
keempat variabel penjelas mempunyai pengaruh
terhadap variabel respon Tabel 6. Nilai Odds Ratio

Tabel 3. Uji Parsial Estimasi Parameter Odds Ratio  


Variabel Wald p-value X1 1,488
𝑋1 50,788 0,000 X2 0,724
X3 1,437
𝑋2 39,756 0,000
X4 0,684
𝑋3 8,708 0,003
Pada Tabel 6. dapat disimpulkan sebagai berikut:
𝑋4 53,434 0,000 1. Odds Ratio nilai rata-rata pelajaran Bahasa
Indonesia pada rapot semester 1 dan 2 kelas X
Berdasarkan Tabel 3 dengan α (0,05) dapat (X1)
diambil kesimpulan bahwa semua variabel Diperoleh nilai odds ratio sebesar 1,488, ini
penjelas berpengaruh terhadap variabel respon. berarti bahwa peluang pengklasifikasian
variabel X1 cenderung berada pada pemilihan
Model Persamaan Regresi Logistik jurusan Bahasa 1,488 kalinya terhadap
Berdasarkan nilai koefisien β diketahui bahwa pemilihan jurusan IPS.
Keempat variabel penjelas mempunyai pengaruh 2. Odds Ratio nilai rata-rata pelajaran Bahasa
yang signifikan terhadap variabel respon sehingga Inggris pada rapot semester 1 dan 2 kelas X
empat variabel ini dimasukkan dalam regresi (X2)
logistik, seperti pada Tabel 4. Diperoleh nilai odds ratio sebesar 0,724, ini
Tabel 4. Nilai β Model Regresi Logistik berarti bahwa peluang pengklasifikasian
Parameter Estimasi p-value variabel X2 cenderung berada pada pemilihan
0,678 jurusan Bahasa 0,724 kalinya terhadap
𝛽0 -4,089
pemilihan jurusan IPS.
𝛽1 0,398 0,000
3. Odds Ratio nilai rata-rata pelajaran Ekonomi
𝛽2 -0,324 0,000 pada rapot semester 1 dan 2 kelas X (X3)
𝛽3 0,362 0,003 Diperoleh nilai odds ratio sebesar 1,437, ini
-0,380 0,000 berarti bahwa peluang pengklasifikasian
𝛽4
variabel X3 cenderung berada pada pemilihan
Pada Tabel 4. didapatkan model regresi logistik jurusan Bahasa 1,437 kalinya terhadap
yang diperoleh dengan variabel respon Y = π(x) pemilihan jurusan IPS.
adalah Jurusan dengan variabel penjelas X1, X2, X3 4. Odds Ratio nilai rata-rata pelajaran Geografi
dan X4. Sehingga di dapat model regresi logistik pada rapot semester 1 dan 2 kelas X (X4)
yaitu: Diperoleh nilai odds ratio sebesar 0,684, ini
𝑔 𝑥 = −4,089 + 0,398𝑋1 − 0,324𝑋2 + 0,362𝑋3 − berarti bahwa peluang pengklasifikasian
0,380𝑋4 variabel X4 cenderung berada pada pemilihan
jurusan Bahasa 0,684 kalinya terhadap
Uji Kesesuaian Model pemilihan jurusan IPS.
Pengujian ini dilakukan untuk menilai
kesesuaian model regresi logistik dengan cara Pengklasifikasi dengan Menggunakan Regresi
membandingkan hasil pengamatan dengan nilai Logistik
dugaan. Persentase ketepatan klasifikasi adalah rasio
antara jumlah observasi-observasi yang
Tabel 5. Hosmer dan Lemeshow Test diklasifikasikan secara tepat oleh model (sesuai
Step Chi-square Df p-value
1 9,222 8 0,324 dengan kelompok yang sebenarnya) dengan
jumlah seluruh observasi. Evaluasi klasifikasi
Pada Tabel 5. diketahui bahwa nilai p-value dilakukan dengan cara membuat tabulasi
Hosmer and Lemeshow Test adalah sebesar
perhitungan masing-masing |εi|. Dikatakan tepat
0,324 > α (0,05) atau 𝐶 = 9,222 < 𝑋2 klasifikasi jika ; 0 ≤ |εi| < 0,5.
(0,05;8) =
15,51 maka H0 diterima. Sehingga dapat Tabel 7. Prediksi Keanggotaan Suatu Observasi
disimpulkan bahwa tidak ada perbedaan antara Berdasarkan Suatu Model
hasil pengamatan dengan nilai dugaan atau model
regresi logistik tersebut layak untuk digunakan.

Interprestasi Model Koefisien Regresi Logistik


Nilai kecenderungan antara satu kategori

Program Studi Statistika FMIPA Universitas 5


Jurnal EKSPONENSIAL Volume 4, Nomor 1, Mei ISSN 2085-

Jurusan yang diprediksi oleh


model
Bahasa IPS
Bahasa 115 35
Jurusan
IPS 33 131

6 Program Studi Statistika FMIPA Universitas


Jurnal EKSPONENSIAL Volume 4, Nomor 1, Mei 2013 ISSN 2085-7829

115+131
Persentase ketepatan klasifikasi = x100%
3,3610 3,2177 −0,6925 3,0385
314
= 78,34% 4. Bobot awal bias pada lapisan tersembunyi ke
lapisan output
2. Analisis Jaringan Saraf Tiruan −4,4622
Analisis jaringan saraf tiruan yang digunakan
untuk masalah pengelompokkan adalah jaringan Bobot awal lapisan input berfungsi untuk
saraf tiruan metode backpropagation. Untuk memperkuat sinyal dari neuron-neuron pada
perhitungan dan pemprograman jaringan saraf lapisan input. Bobot awal lapisan tersembunyi
tiruan backpropagation, digunakan bantuan berfungsi untuk memperkuat sinyal pada lapisan
program Matlab 7.01. tersembunyi. Demikian juga halnya dengan bobot
awal bias pada lapisan input dan lapisan
Inisialisasi Jaringan Saraf Tiruan
tersembunyi. Dari output program matlab
Backpropagation
diperoleh bahwa jaringan melakukan pelatihan
a. Menentukan Variabel
sebanyak 100000 epochs, jaringan belum mampu
Berdasarkan data penelitian ini, maka
untuk mencapai nilai error minimum yang telah
variabel, X 1, X 2 , X 2 dan X 4, adalah input
ditetapkan yaitu 0,05. Tetapi, dari grafik nilai
penelitian ini serta pemilihan jurusan adalah
MSE seperti pada Gambar 4, terlihat bahw selama
target pada penelitian ini. Output yang dihasilkan
proses pelatihan nilai MSE terus turun untuk
akan dinotasikan dengan 𝑌 seperti pada Tabel 8.
mencapai nilai minimum yang ditetapkan yaitu
Tabel 8. Deskripsi Variabel 0,05.
Variabel Ukuran Sampel
𝑋1 314
𝑋2 314
Input
𝑋3 314
𝑋4 314
Output 𝑌 314

b. Menentukan parameter dalam pelatihan


(learning)
Sebelum jaringan yang telah dibentuk
melakukan pelatihan terhadap data input Gambar 4. Grafik nilai MSE
dinotasikan P dan matriks target dinotasikan T,
maka akan ditentukan parameter pelatihan. Setelah jaringan melakukan pelatihan
Adapun nilai parameter tersebut adalah sebagai sebanyak 100000 epochs, diperoleh nilai bobot
berikut: akhir jaringan untuk setiap lapisan. Bobot-bobot
1. Banyaknya Epochs (iterasi) 100000 inilah yang merupakan bobot terbaik dalam
2. Error minimum : 0,05 fungsinya memperkuat input sehingga dihasilkan
3. Learning rate ( ) : 0,05 nilai output jaringan untuk mencapai target yang
4. Iterasi untuk update grafik error : 1000 ditetapkan.
1. Bobot akhir lapisan input ke lapisan
tersembunyi
c. Inisialisasi bobot awal penghubung tiap lapisan 0,7027 0,3310 0,1622 0,5621
Pada penelitian ini, jaringan yang dibentuk 0,4357 −0,5197 0,1116 −0,9096
terdiri dari 4 lapisan input, 4 lapisan tersembunyi 0,1132 0,1205 0,0313 −0,6814
dan 1 lapisan output, maka bobot penghubung 0,6735 −1,5186 0,6828 −2,0956
tiap lapisan dalam bentuk matriks dapat 2.Bobot akhir bias pada lapisan input ke lapisan
ditentukan sebagai berikut: tersembunyi
1. Bobot awal lapisan input ke lapisan −5,4019
tersembunyi 0,9121
0,7862 0,6581 0,2987 0,7930 2,5947
−0,8364 0,7852 −0,0195 0,7976 −2,1025
−0,1612 0,2361 −1,3397 3.Bobot akhir lapisan tersembunyi ke lapisan
0,4108
−0.0342 −1,1317 0,3791 −0,2477 output
2. Bobot awal bias pada lapisan input ke 3,3115 2,8944 −0,3268 3,8487
lapisan tersembunyi 4. Bobot akhir bias pada lapisan tersembunyi ke
−5,2691 lapisan output
0,8555 −4,6727
2,1646
−3,3568 Berdasarkan hasil output matlab untuk
3. Bobot awal lapisan tersembunyi ke lapisan program jaringan saraf tiruan, diperoleh hasil
output output. Dari output jaringan, terlihat bahwa semua
output memiliki nilai di bawah nilai error yang

Program Studi Statistika FMIPA Universitas 7


Jurnal EKSPONENSIAL Volume 4, Nomor 1, Mei ISSN 2085-

ditetapkan yaitu 0,05. Nilai error yang ditetapkan, Tabel 9. Prediksi Keanggotaan Jaringan Saraf Tiruan
merupakan batasan dalam menentukan hasil Jurusan yang diprediksi oleh
pengelompokkan. Sehingga dapat disimpulkan model
bahwa hasil output jaringan yang dihasilkan BahasaIPS
sesuai dengan target (kelompok) yang ditetapkan. Bahasa 115 35
Jurusan IPS 139
Hal ini juga terlihat dari hasil grafik pemetaan
output dan target seperti terlihat pada Gambar 5
berikut ini : Perbandingan Hasil Pengelompokkan Dengan
Teknik Analisis Regresi Logistik Dan Teknik
Analisis Jaringan Saraf Tiruan
Dari hasil pengelompokkan dengan metode
analisis regresi logistik dan analisis jaringan saraf
tiruan akan dibandingkan dengan melihat
ketepatan klasifikasi.
Tabel 10. Hasil pengelompokkan dengan metode
analisis regresi logistik dan analisis
jaringan saraf tiruan
Gambar 5. Grafik Pemetaan Output dan Target
Regresi Logistik Jaringan Saraf Tiruan
Jurusan Bahasa IPS Bahasa IPS
Dari Gambar 5 terlihat bahwa output jaringan
menyebar mendekati target yang ditetapkan Bahasa 115 35 115 35
(kelompok). Karena jaringan saraf tiruan hanya IPS 33 131 25 139
dapat mendekati atau mengestimasi target, maka Berdasarkan Tabel 10, diketahui dengan
output yang dihasilkan tidak bisa sesuai dengan menggunakan teknik analisis regresi logistik,
nilai target (kelompok). diperoleh :
 Dari 150 siswa yang diklasifikasikan ke
Menghitung nilai MAPE Jaringan Saraf Jurusan Bahasa, 115 siswa tepat
Tiruan diklasifikasikan ke jurusan Bahasa dan sisanya
Untuk menilai kinerja jaringan saraf tiruan 35 siswa tidak tepat diklasifikasikan ke
backpropagation yang telah dibangun, diperlukan Jurusan Bahasa.
perhitungan nilai Mean Absolute Percentage
 Dari 164 siswa yang diklasifikasikan ke
Error (MAPE). Jika output jaringan dinotasikan
Jurusan IPS, 131 siswa tepat diklasifikasikan
dengan 𝑌 dan target jaringan dinotasikan ke jurusan IPS dan sisanya 33 siswa tidak
dengan tepat diklasifikasikan ke Jurusan IPS.
𝑌 maka nilai MAPE dapat dihitung.
𝑛 𝑌 𝑖−𝑌 𝑖 Sedangkan untuk analisis jaringan saraf tiruan,
𝑖=1 𝑌
𝑀𝐴𝑃𝐸 = 𝑖 𝑥100% diperoleh :
𝑛  Dari 150 siswa yang diklasifikasikan ke
𝑌 𝑖+𝑌 𝑖 𝑌𝑖
= 314 Jurusan Bahasa, 115 siswa tepat
𝑥100%
𝑖=1 314 diklasifikasikan ke jurusan Bahasa dan sisanya
342
= 23,70% = 80,89%
Dari perhitungan MAPE diatas, diperoleh nilai
MAPE jaringan saraf tiruan backpropagation
sebesar 23,70%. Dari nilai yang diperoleh ini,
dapat dinilai kinerja jaringan saraf tiruan
backpropagation dalam mendekati atau
mengestimasi hasil pengelompokkan adalah baik,
karena memberikan nilai rata-rata persen error
yang kecil yaitu 23,70%.

Pengklasifikasi dengan Jaringan Saraf Tiruan


Evaluasi klasifikasi dilakukan dengan cara
membuat tabulasi perhitungan masing-masing
𝑌𝑖 − 𝑌 𝑖 = absolute error. Diharapkan
absolute error tersebut bisa sekecil mungkin
sehingga pengamatan tepat diklasifikasikan.
Dikatakan tepat klasifikasi jika : 0 ≤ 𝑌𝑖 − 𝑌 𝑖 ≤
0,05.
Berdasarkan Tabel 9, dapat ditentukan
ketepatan klasifikasi Jaringan Syaraf Tiruan.
115+139
Persentase ketepatan klasifikasi = × 100%

8 Program Studi Statistika FMIPA Universitas


Jurnal EKSPONENSIAL Volume 4, Nomor 1, Mei 2013 ISSN 2085-7829

33 siswa tidak tepat diklasifikasikan ke


Jurusan Bahasa.
 Dari 164 siswa yang diklasifikasikan ke
Jurusan IPS, 139 siswa tepat
diklasifikasikan ke jurusan IPS dan sisanya
25 siswa tidak tepat diklasifikasikan ke
Jurusan IPS.
Dari perhitungan persentase ketepatan
klasifikasi, diperoleh nilai persentase ketepatan
klasifikasi analisis regresi logistik sebesar
78,34% dan nilai persentase ketepatan
klasifikasi analisis jaringan saraf tiruan sebesar
80,89%.

Kesimpulan
Berdasarkan hasil dan pembahasan tersebut,
maka dapat disimpulkan bahwa dalam
penyelesaian pengklasifikasian pemilihan
jurusan Bahasa dan IPS pada SMAN 2
Samarinda tahun ajaran 2011/2012 lebih tepat
menggunakan jaringan saraf tiruan karena
ketepatan klasifikasi yaitu sebesar 80,89%.

Program Studi Statistika FMIPA Universitas 9


Jurnal EKSPONENSIAL Volume 4, Nomor 1, Mei ISSN 2085-

Daftar Pustaka
Hosmer, D. W. and Lemeshow, S. (2000).
Applied Logistic Regression. John Wiley and
Sons, Inc. USA.
Firmansyah, Yudhi. 2010. Perbandingan Analisis
Diskriminan Mahalanobis dan Analisis
Jaringan Saraf Tiruan Dalam
MenyelesaikanMasalah Pengelompokkan.
Jurusan S1 Statistika Fakultas FMIPA
Universitas Mulawarman: Samarinda.
Fractal (2003), Comparative Analysis of
Classification Techniques, A Fractal White
Paper.
Puspitaningrum, Diyah. 2006. Pengantar
Jaringan Saraf Tiruan. Yogyakarta: Andi.
Siang, J. Jek. 2005. Jaringan Saraf Tiruan dan
Pemogramannya menggunakan Matlab.
Yogyakarta : Andi.
Suhermin Ari Pujianti. 2002. Perbandingan
Metode Klasifikasi Analisis Deskrriminan,
Regresi Logistik dan Jaringan Saraf Tiruan
Pada Kasus Pengelompokan Bunga. Pasca
Sarjana Jurusan

1 Program Studi Statistika FMIPA Universitas

You might also like