Professional Documents
Culture Documents
Abstract
Classification problems can be solved by using logistic regression and classification method of artificial
neural network or artificial neural network (ANN). Classification with logistic regression method performed
by transforming the dependent variable into a logit variable is the natural log of the odds ratio. In the ANN
classification done by accepting a vector of input and then calculates a response or output by processing
through the process elements are interrelated. The elements are arranged in several layers (layer) and the
input data flow from one layer to the next in sequence. Output values can be scalar values or vectors,
calculated at the output layer. The purpose of this study was to determine the results of the classification by
using logistic regression and neural network analysis then compared with the classification accuracy. The
data used in this study is the data the average value of report cards in the 1st half and the 2nd half of the
class X for English and social studies subjects at SMAN 2 Samarinda academic year 2011/2012. The amount
of data is 314 students with 2 to 4 response variables explanatory variables. Based on these results, the
obtained results for the logistic regression classification accuracy of 78.34% and 80.89% for ANN analysis.
From the comparison of artificial neural network classification method is a better classification method in
solving the classification of English and social studies majors elections in SMAN 2 Samarinda academic year
2011/2012.
(Fractal, 2003).
Metode regresi logistik memiliki teknik dan 2. Uji Serentak (simultan)
prosedur yang tidak jauh berbeda dengan metode Bertujuan untuk mengetahui pengaruh
regresi linear. Jika prosedur linear dalam variabel bebas secara serentak terhadap variabel
mengestimasi nilai parameter sering terikat.
menggunakan metode Ordinary Least Squares
3. Uji Parsial
(OLS), maka untuk mengestimasi nilai parameter
Dalam uji parsial ini, pengujian dilakukan
dalam regresi logistik adalah dengan
dengan menguji setiap βj secara individual. Hasil
menggunakan metode Maximum Likelihood
pengujian secara individual akan menunjukkan
Estimation (MLE). Untuk mencari persamaan
apakah suatu variabel prediktor layak untuk
logistiknya maka model yang dipakai adalah:
𝑝
𝛽 + 𝑗 =1 𝛽 𝑥
masuk dalam model atau tidak.
𝑒 0 Pada model regresi logistik, β1 menunjukkan
𝜋 𝑥 = 𝑝 (1) besar perbedaan antara nilai variabel terikat ketika
𝛽 + 𝛽𝑗𝑥𝑗
1+𝑒 0 𝑗 variabel bebas (x+1) dan nilai variabel terikat
Dari persamaan (1) diperoleh 1 – π(x) sebagai ketika variabel bebas x untuk setiap nilai x. Untuk
berikut: variabel bebas yang bersifat dikotomi,
𝛽0+
𝑝
𝛽𝑗 𝑥𝑗 diasumsikan nilai x adalah 0 dan 1, Selanjutnya
𝑒 𝑗 dibentuk suatu Tabel klasifikasi 2x2 sebagai mana
1−𝜋 𝑥 = 1− 𝑝
𝛽0+ 𝑗 =1 𝛽𝑗 𝑥𝑗 dinyatakan pada Tabel 1.
1+𝑒
Bila nilai odds tersebut ditransformasikan ke Jaringan saraf biologis merupakan kumpulan
dalam bentuk log dengan bilangan dasar akan dari sel-sel saraf (neuron). Neuron mempunyai
diperoleh: tugas mengolah informasi. Komponen-komponen
𝜋(𝑥)
𝑙𝑛 𝑜𝑑𝑑𝑠 = 𝑔 𝑥 = 𝑙𝑛 (6) utama dari sebuah neuron dapat dikelompokkan
1−𝜋(1)
menjadi 3 bagian yaitu:
Sehingga untuk x=1, maka: 1. Dendrite bertugas untuk menerima informasi.
𝜋(1)
𝑔 1 = 𝑙𝑛 (7) 2. Badan sel (soma) berfungsi sebagai tempat
1−𝜋(1) pengolahan informasi.
dan untuk x =0, maka: 3. Akson (neurit) mengirimkan implus-implus ke
𝜋(0) sel saraf lainnya.
𝑔 0 = 𝑙𝑛 (8)
1−𝜋(0)
Fungsi Sigmoid Biner
Log odds ratio merupakan perbedaan atau Fungsi ini digunakan untuk jaringan saraf
selisih nilai logit. Dengan mensubstitusikan yang dilatih dengan menggunakan metode
model logistik pada Tabel 1. Nilai Model Regresi backpropagation. Fungsi sigmoid biner memiliki
Logistik untuk variabel penjelas, maka nilai pada range 0 sampai 1. Oleh karena itu,
didapatkan: fungsi ini sering digunakan untuk jaringan saraf
𝜋(1)/ 1 − 𝜋(1) yang membutuhkan nilai output yang terletak
𝜓=
𝜋(0)/ 1 − 𝜋(0) pada interval 0 sampai 1. Namun, fungsi ini bisa
juga digunakan oleh jaringan saraf yang nilai
𝜓 = 𝑒𝛽1 (9) outputnya 0 sampai 1 atau yang bukan 0 sampai 1
sesuai dengan keperluan. Persamaan fungsi
Sehingga log odds ratio menjadi : ln(ψ) = β1 sigmoid biner ditunjukkan pada persamaan (10)
dan grafiknya ditunjukkan pada Gambar 2.
Arsitektur Backpropagation
net.trainParam.lr : dipakai untuk
Backpropagation memiliki beberapa unit yang
menentukan laju pemahaman ( = learning
ada dalam satu atau lebih layar tersembunyi.
rate). Semakin besar nilai , semakin cepat
Gambar 3 adalah arsitektur backpropagation
dengan n buah masukan (ditambah sebuah bias), pula proses pelatihan. Akan tetapi jika
sebuah layer tersembunyi yang terdiri dari p unit terlalu besar, maka algoritma menjadi tidak
(ditambah sebuah bias), serta m buah unit stabil dan mencapai titik minimum lokal
keluaran. 𝑣𝑗𝑖 merupakan bobot garis dari unit (biasanya α=0.5) ( Jong, 2005).
masukan 𝑥𝑖 ke unit layer tersembunyi 𝑧𝑖 (𝑣𝑗0
Metodologi Penelitian
merupakan bobot garis yang menghubungkan bias
Metode pengklasifikasian yang digunakan
di unit masukan ke unit layer tersembunyi 𝑧𝑗
dalam penelitian ini adalah analisis regresi
)
logistik dan analisis jaringan saraf tiruan. Hasil
𝑤𝑘𝑗 merupakan bobot dari unit layer tersembunyi analisis regresi logistik dengan bantuan software
𝑧𝑗 ke unit keluaran 𝑦𝑘 (𝑤𝑘0 merupakan bobot dari SPSS 16.0 dan hasil analisis jaringan saraf tiruan
bias di layer tersembunyi ke unit keluaran 𝑧𝑘) dengan bantuan software Matlab 7.1. Adapun
(Jong, 2005). langkah-langkah yang dilakukan dalam analisis
regresi logistik adalah:
1. Estimasi parameter model regresi logistik.
2. Pemlihan model yang cocok/uji goodness of
fit.
3. Pengujian parameter.
4. Interprestasi model koefisien regresi logistik.
5. Perhitungan persentase ketepatan klasifikasi.
Langkah-langkah yang dilakukan dalam
analisis jaringan saraf tiruan adalah:
1. Inisialisasi jaringan saraf.
2. Membangun jaringan saraf tiruan.
Gambar 3. Arsitektur Backpropagation 3. Pelatihan jaringan.
4. Evaluasi output jaringan (MAPE).
Pelatihan Backpropagation 5. Perhitungan persentase ketetapan klasifikasi.
Pelatihan backpropagation menggunakan Dan membandingkan hasil klasifikasi regresi
metode pencarian titik minimum untuk mencari logistik dengan jaringan saraf tiruan.
bobot dengan error minimum. Untuk melatih
jaringan digunakan perintah train pada matlab. Hasil dan Pembahasan
Pelatihan dilakukan untuk meminimumkan Data yang digunakan adalah nilai rata-rata
kuadrat kesalahan rata – rata (MSE). Metode raport siswa/siswi SMAN 2 Samarinda kelas X
paling sederhana untuk merubah bobot adalah semester 1 dan semester 2 tahun ajaran
metode penurunan gradien (gradient descent). 2011/2012. Menggunakan regresi logistik dan
Bobot dan bias diubah pada arah dimana unjuk jaringan saraf tiruan.
kerja fungsi menurun paling cepat.
Perangkat Matlab menyediakan beberapa 1. Analisis Regresi Logistik
metode pencarian titik minimumnya. Pencarian Metode pengklasifikasian yang digunakan
titik minimum dengan metode penurunan gradien dalam penelitian ini adalah Analisis Regresi
dilakukan dengan memberikan parameter Logistik. Hasil Analisis Regresi Logistik
’traingd’ dalam parameter pelatihan setelah fungsi diperoleh dengan bantuan software SPSS 16.0.
aktivasi pada perintah newff.
net.trainParam.show : dipakai untuk Uji Likelihood Ratio atau Uji Simultan
menampilkan frekuensi perubahan MSE Pengujian ini dilakukan untuk mengetahui
(biasanya setiap 25 epoch) apakah variabel respon mempunyai pengaruh
net.trainParam.epochs : dipakai untuk yang signifikan terhadap variabel penjelas. Pada
menentukan jumlah epoch (iterasi) maksimum pengklasifikasian jurusan Bahasa dan IPS dengan
(biasanya 500 epoch) menggunakan Analisis Regresi Logistik.
net.trainParam.goal : dipakai untuk Tabel 2. Log-Likelihood Regresi Logistik
menentukan batas nilai MSE agar iterasi Step -2 Log likelihood
1 287,997
dihentikan. Iterasi akan berhenti jika MSE <
batas yang ditentukan dalam Pada Tabel 2. nilai G adalah 287,997 dimana
net.trainParam.goal atau jumlah nilai G > χ2(0.05,4) yaitu 287,997 > 9,49 maka H0
epoch mencapai batas yang ditentukan dalam ditolak, dan dapat disimpulkan bahwa minimal
net.trainParam.epochs (biasanya 0.1) ada satu variabel penjelas yang berpengaruh
terhadap variabel respon.
Uji Parsial Menggunakan Uji Wald dengan kategori lain pada variabel penjelas yang
Pengujian ini dilakukan untuk mengetahui kualitatif dinyatakan dengan Odds Ratio. Rasio
pengaruh dari masing-masing variabel X1, X2, X3 kecenderungan dapat dilihat, kolom Exp (β) dan
dan X4 terhadap Jurusan. Pada Tabel 3 diperoleh dapat disederhanakan seperti Tabel 6.
keempat variabel penjelas mempunyai pengaruh
terhadap variabel respon Tabel 6. Nilai Odds Ratio
115+131
Persentase ketepatan klasifikasi = x100%
3,3610 3,2177 −0,6925 3,0385
314
= 78,34% 4. Bobot awal bias pada lapisan tersembunyi ke
lapisan output
2. Analisis Jaringan Saraf Tiruan −4,4622
Analisis jaringan saraf tiruan yang digunakan
untuk masalah pengelompokkan adalah jaringan Bobot awal lapisan input berfungsi untuk
saraf tiruan metode backpropagation. Untuk memperkuat sinyal dari neuron-neuron pada
perhitungan dan pemprograman jaringan saraf lapisan input. Bobot awal lapisan tersembunyi
tiruan backpropagation, digunakan bantuan berfungsi untuk memperkuat sinyal pada lapisan
program Matlab 7.01. tersembunyi. Demikian juga halnya dengan bobot
awal bias pada lapisan input dan lapisan
Inisialisasi Jaringan Saraf Tiruan
tersembunyi. Dari output program matlab
Backpropagation
diperoleh bahwa jaringan melakukan pelatihan
a. Menentukan Variabel
sebanyak 100000 epochs, jaringan belum mampu
Berdasarkan data penelitian ini, maka
untuk mencapai nilai error minimum yang telah
variabel, X 1, X 2 , X 2 dan X 4, adalah input
ditetapkan yaitu 0,05. Tetapi, dari grafik nilai
penelitian ini serta pemilihan jurusan adalah
MSE seperti pada Gambar 4, terlihat bahw selama
target pada penelitian ini. Output yang dihasilkan
proses pelatihan nilai MSE terus turun untuk
akan dinotasikan dengan 𝑌 seperti pada Tabel 8.
mencapai nilai minimum yang ditetapkan yaitu
Tabel 8. Deskripsi Variabel 0,05.
Variabel Ukuran Sampel
𝑋1 314
𝑋2 314
Input
𝑋3 314
𝑋4 314
Output 𝑌 314
ditetapkan yaitu 0,05. Nilai error yang ditetapkan, Tabel 9. Prediksi Keanggotaan Jaringan Saraf Tiruan
merupakan batasan dalam menentukan hasil Jurusan yang diprediksi oleh
pengelompokkan. Sehingga dapat disimpulkan model
bahwa hasil output jaringan yang dihasilkan BahasaIPS
sesuai dengan target (kelompok) yang ditetapkan. Bahasa 115 35
Jurusan IPS 139
Hal ini juga terlihat dari hasil grafik pemetaan
output dan target seperti terlihat pada Gambar 5
berikut ini : Perbandingan Hasil Pengelompokkan Dengan
Teknik Analisis Regresi Logistik Dan Teknik
Analisis Jaringan Saraf Tiruan
Dari hasil pengelompokkan dengan metode
analisis regresi logistik dan analisis jaringan saraf
tiruan akan dibandingkan dengan melihat
ketepatan klasifikasi.
Tabel 10. Hasil pengelompokkan dengan metode
analisis regresi logistik dan analisis
jaringan saraf tiruan
Gambar 5. Grafik Pemetaan Output dan Target
Regresi Logistik Jaringan Saraf Tiruan
Jurusan Bahasa IPS Bahasa IPS
Dari Gambar 5 terlihat bahwa output jaringan
menyebar mendekati target yang ditetapkan Bahasa 115 35 115 35
(kelompok). Karena jaringan saraf tiruan hanya IPS 33 131 25 139
dapat mendekati atau mengestimasi target, maka Berdasarkan Tabel 10, diketahui dengan
output yang dihasilkan tidak bisa sesuai dengan menggunakan teknik analisis regresi logistik,
nilai target (kelompok). diperoleh :
Dari 150 siswa yang diklasifikasikan ke
Menghitung nilai MAPE Jaringan Saraf Jurusan Bahasa, 115 siswa tepat
Tiruan diklasifikasikan ke jurusan Bahasa dan sisanya
Untuk menilai kinerja jaringan saraf tiruan 35 siswa tidak tepat diklasifikasikan ke
backpropagation yang telah dibangun, diperlukan Jurusan Bahasa.
perhitungan nilai Mean Absolute Percentage
Dari 164 siswa yang diklasifikasikan ke
Error (MAPE). Jika output jaringan dinotasikan
Jurusan IPS, 131 siswa tepat diklasifikasikan
dengan 𝑌 dan target jaringan dinotasikan ke jurusan IPS dan sisanya 33 siswa tidak
dengan tepat diklasifikasikan ke Jurusan IPS.
𝑌 maka nilai MAPE dapat dihitung.
𝑛 𝑌 𝑖−𝑌 𝑖 Sedangkan untuk analisis jaringan saraf tiruan,
𝑖=1 𝑌
𝑀𝐴𝑃𝐸 = 𝑖 𝑥100% diperoleh :
𝑛 Dari 150 siswa yang diklasifikasikan ke
𝑌 𝑖+𝑌 𝑖 𝑌𝑖
= 314 Jurusan Bahasa, 115 siswa tepat
𝑥100%
𝑖=1 314 diklasifikasikan ke jurusan Bahasa dan sisanya
342
= 23,70% = 80,89%
Dari perhitungan MAPE diatas, diperoleh nilai
MAPE jaringan saraf tiruan backpropagation
sebesar 23,70%. Dari nilai yang diperoleh ini,
dapat dinilai kinerja jaringan saraf tiruan
backpropagation dalam mendekati atau
mengestimasi hasil pengelompokkan adalah baik,
karena memberikan nilai rata-rata persen error
yang kecil yaitu 23,70%.
Kesimpulan
Berdasarkan hasil dan pembahasan tersebut,
maka dapat disimpulkan bahwa dalam
penyelesaian pengklasifikasian pemilihan
jurusan Bahasa dan IPS pada SMAN 2
Samarinda tahun ajaran 2011/2012 lebih tepat
menggunakan jaringan saraf tiruan karena
ketepatan klasifikasi yaitu sebesar 80,89%.
Daftar Pustaka
Hosmer, D. W. and Lemeshow, S. (2000).
Applied Logistic Regression. John Wiley and
Sons, Inc. USA.
Firmansyah, Yudhi. 2010. Perbandingan Analisis
Diskriminan Mahalanobis dan Analisis
Jaringan Saraf Tiruan Dalam
MenyelesaikanMasalah Pengelompokkan.
Jurusan S1 Statistika Fakultas FMIPA
Universitas Mulawarman: Samarinda.
Fractal (2003), Comparative Analysis of
Classification Techniques, A Fractal White
Paper.
Puspitaningrum, Diyah. 2006. Pengantar
Jaringan Saraf Tiruan. Yogyakarta: Andi.
Siang, J. Jek. 2005. Jaringan Saraf Tiruan dan
Pemogramannya menggunakan Matlab.
Yogyakarta : Andi.
Suhermin Ari Pujianti. 2002. Perbandingan
Metode Klasifikasi Analisis Deskrriminan,
Regresi Logistik dan Jaringan Saraf Tiruan
Pada Kasus Pengelompokan Bunga. Pasca
Sarjana Jurusan