Professional Documents
Culture Documents
Comparison of Classification Results by Using Logistic Regression and Quadratic Discriminant Analysis in Classifying Programs at SMA Negeri 8 Samarinda Academic Year 2014/2015
Comparison of Classification Results by Using Logistic Regression and Quadratic Discriminant Analysis in Classifying Programs at SMA Negeri 8 Samarinda Academic Year 2014/2015
Abstract
Logistic Regression Analysis and Discriminant Analysis represent the statistical method for the
classification of a number of object. In the case of classification especially if there's only two response
categories, logistic regression is used more precisely if the assumption of multivariate normality in data
cannot be fullfiled. The assumption of normality multivariate distribution and equality of variance
covariance matrices represent the important matter in discriminant analysis for getting of high accuracy of
classification. Discriminant analysis method that is used in inequality of variance covariance matrices is
called quadratic discriminant analysis. The purpose of this study was to determine the classification results
by using Logistic Regression and Quadratic Discriminant Analysis and compares the classification accuracy.
The data that is used in the study is the average raport of the first and second semester of the class X at SMA
Negeri 8 Samarinda academic year 2014/2015. Data consists of 190 students with two independent variables
and four dependent variables. Based on research results, obtained results for the value of class accuracy is
Logistic Regression 83.16% and Quadratic Discriminant Analysis 84,21%.
setiap kelompok. Sedangkan analisis diskriminan yang diperoleh “gagal” maka regresi logistik
nonparametrik digunakan jika data tidak tersebut menggunakan regresi logistik biner
berdistribusi normal multivariat dan matriks (Fractal, 2003).
varians kovariansnya tidak sama setiap Metode regresi logistik memiliki teknik dan
kelompoknya. prosedur yang tidak jauh berbeda dengan metode
Selama ini penjurusan siswa SMA Negeri 8 regresi linear. Jika prosedur linear dalam
Samarinda berdasarkan nilai akademik yang mengestimasi nilai parameter sering
diperoleh pada semester 1 dan semester 2 kelas X menggunakan metode Ordinary Least Squares
secara tuntas atau sama dengan Kriteria (OLS), maka untuk mengestimasi nilai parameter
Ketuntasan Minimal (KKM) untuk semua mata dalam regresi logistik adalah dengan
pelajaran yang menjadi ciri khas jurusannya serta menggunakan metode Maximum Likelihood
minat siswa terhadap jurusan yang ada. Penetapan Estimation (MLE).Untuk mencari persamaan
jurusan SMA merupakan suatu sarana untuk logistiknya maka model yang digunakan adalah:
p
memberikan kesempatan pada siswa dalam 0 jx j
mengembangkan kompetensi sikap, kompetensi e j 1
= p
analisis diskriminan kuadratik. 0+ ∑ jxj
Dari beberapa penelitian sebelumnya telah 1+e j=1
( x)
untuk membandingkan metode klasifikasi e j 1
menggunakan regresi logistik dan analisis 1 ( x)
diskriminan kuadratik. Jadi, persamaan logistiknya adalah:
( x)
g ( x) ln
Regresi Logistik 1 ( x)
Regresi logistik merupakan salah satu metode p
Tabel 5. Uji Parsial Variabel X dengan Tabel 7. Hasil Klasifikasi dengan Regresi
Variabel Y Logistik
Variabel
Prediktor
β Wald
P-
Value
Keputusan No Nilai ˆ(x) Jurusan
Awal
Hasil
Klasifikasi
X1 0,271 6,489 0,011 H0 ditolak 1 0,04988 IPA IPA
X2 -0,767 22,495 0,000 H0 ditolak 2 0,05121 IPA IPA
X3 0,224 4,389 0,036 H0 ditolak 3 0,01162 IPA IPA
X4 -0,246 5,819 0,016 H0 ditolak 4 0,00609 IPA IPA
Konstan 40,409 9,788 0,002 5 0,06413 IPA IPA
6 0,01093 IPA IPA
Berdasarkan Tabel 5 menunjukkan bahwa 7 0,20821 IPA IPA
semua variabel prediktor memiliki nilai 8 0,02554 IPA IPA
probabilitas (p-value) lebih kecil dari α, maka 9 0,02883 IPA IPA
variabel prediktor berpengaruh terhadap variabel 10 0,00682 IPA IPA
respon. Sehingga model regresi logistik terbaik
untuk memprediksi pengklasifikasian jurusan Analisis Diskriminan
dengan menggunakan analisis regresi logistik Uji Asumsi
adalah Sebelum dilakukan analisis diskriminan data
harus memenuhi asumsi distribusi normal
e 40, 4090, 271 X1 0,767 X 2 0, 224 X 3 0, 246 X 4
(X ) multivariat dan homogenitas matriks kovarians
1 e 40, 4090, 271 X1 0,767 X 2 0, 224 X 3 0, 246 X 4 (15) sebagai berikut:
1. Uji Normal Multivariat
Uji Kecocokan Model Uji normal multivariat digunakan untuk
Uji ini berfungsi untuk menilai kesesuaian
mengetahui apakah data keempat variabel
model regresi logistik dengan membandingkan
prediktor berdistribusi normal multivariat atau
hasil pengamatan dengan nilai dugaan.Statistik uji
tidak.
yang digunakan untuk menentukan kecocokan
model disebut juga sebagai statistik kecocokan
model (Goodness of Fit).
Tabel 6. Uji Kecocokan Model
Chi-square Df p-value
14,191 8 0,077
Berdasarkan Tabel 6dapat diketahui bahwa
nilai Cˆ 14,191 (20 , 05 ,8 ) 15,507 dan nilai
p-value sebesar 0,077 >α (0,05) maka diputuskan Gambar 1.Plot uji multinormal data
H0 gagal ditolak. Sehingga dapat disimpulkan
bahwa tidak ada perbedaan antara hasil Hasil uji normal multivariat dengan
pengamatan dengan nilai dugaan atau model menggunakan software Minitab 16 diperoleh
regresi logistik tersebut layak untuk digunakan. bahwa ada lebih dari 50%, yaitu 59,4737%
dengan nilai (20 , 5 , 4 ) 3,36 yang berarti bahwa
Proses Klasifikasi
Setelah diperoleh model regresi logistik pada data telah memenuhi asumsi kenormalan
Persamaan (15) maka dapat dilakukan proses (multinormal). Selain itu, dapat pula dilihat
klasifikasi. Misalkan untuk siswa pertama dengan berdasarkan Q-Q plot pada Gambar 1, terlihat
nilai yaituX1=77,25, X2=81,25, X3=81,25, dan X4=82. bahwa plot cenderung membentuk garis lurus,
Selanjutnya nilai tersebut disubtitusikan ke dalam sehingga dapat disimpulkan bahwa data
model regresi logistik, apabila nilai regresi logistik berdistribusi multinormal.
lebih besar dari nilai cut-off 0,5 atau ˆ (x) 0,5 ,
maka siswa tersebut masuk ke dalam kelompok IPS 2. Uji Kesamaan Matriks Varians Kovarian
sedangkan apabila nilai regresi logistik lebih kecil Uji Kesamaan matriks varians kovarians
dari nilai cut-off 0,5 atau ˆ ( x) 0,5 , maka siswa antara kelompok 1 dan kelompok 2 dilakukan
tersebut masuk ke dalam kelompok IPA.Pada Tabel 7 menggunakan SPSS yaitu dengan menggunakan
diberikan contoh 10 siswa pertama yang statistic Box-M.
diklasifikasikan untuk masing-masing kelompok.
Tabel 8. Uji Kesamaan Matriks Varians Kovarian
Box’s M p-value
19,972 0,035
Tabel 11 Klasifikasi Analisis Diskriminan jurusan IPS dan sisanya 18 siswa tidak tepat
Kuadratik diklasifikasikan ke Jurusan IPS.
Jurusan yang 3. Dengan menggunakan regresi logistik dan
diprediksi oleh analisis diskriminan kuadratik diperoleh
model Total ketepatan klasifikasi masing-masing teknik
IPA IPS analisis sebesar 83,16% dan 84,21%.
120 Berdasarkan ketepatan klasifikasi kedua
IPA 108 12*
Jurusan teknik analisis, dapat disimpulkan bahwa
IPS 18* 52 70
analisis diskriminan kuadratik lebih baik
Total 126 64 190
daripada regresi logistik dalam
menyelesaikan masalah pengklasifikasian
jurusan di SMA Negeri 8 Samarinda.
Perbandingan Hasil Klasifikasi
Berdasarkan analisis data yang telah
Daftar Pustaka
dilakukan maka perbandingan ketepatan
Firmansyah, Yudhi. 2010. Perbandingan Analisis
klasifikasi antara analisis regresi logistik dan
Diskriminan Mahalanobis dan Analisis
analisis diskriminan kuadratik diberikan pada
Jaringan Syaraf Tiruan Dalam
Tabel 12.
Menyelesaikan Masalah Pengelompokkan.
Tabel 12. Ketepatan Klasifikasi Kedua Metode Skripsi tidak diterbitkan. Samarinda: Jurusan
Analisis Regresi Analisis Statistika Fakultas MIPA Universitas
Logistik Diskriminan Mulawarman.
Kuadratik Fractal. 2003. Comparative Analysis of
APER 16,84 % 15,79 % Classification Techniques, A Fractal White
Ketepatan 83,16 % 84,21 % Paper.
Berdasarkan nilai ketepatan klasifikasi, pada Hair, Jr. F. J., W. C Black, B. J Barry, dan R. E
analisis diskriminan kuadratik mempunyai Anderson. 2010. Multivariate Data Analysis,
ketepatan yang lebih tinggi. Dengan demikian 7th edn. New York: Pearson.
metode analisis diskriminan kuadratik merupakan Hosmer D.W, dan S. Lemeshow.2000.Applied
metode terbaik dalam pengklasifikasian jurusan di Logistic Regression. New York: John Wiley
SMA Negeri 8 Samarinda. & Sons, Inc.
Johnson, R. A., dan D. W Winchern. 2002.
Kesimpulan Applied Multivariate Statistical Analysis.
Berdasarkan hasil penelitian yang diperoleh, New Jersey: Prentice Hall.
maka penulis dapat menarik kesimpulan sebagai Kurt, I., M. Ture, dan A. T Kurum. 2006.
berikut : Comparing Performances of Logistic
1. Hasil pengklasifikasian jurusan SMA Negeri Regression Classification and Regression
8 Samarinda tahun ajaran 2014/2015 dengan Tree, and Neural Network for Predicting
menggunakan regresi logistik diperoleh hasil Coronary Artery Disease, Expert Systems
yaitu, untuk pengklasifikasian IPA dari 120 with Applications Vol 34, No. 1.
siswa yang diklasifikasikanke Jurusan IPA, Rachmatin, D dan K. Sawitri. 2010. Penerapan
107 siswa tepat diklasifikasikan ke jurusan Prosedur Lachenbruch Pada Kasus Quadratic
IPA dan sisanya 13 siswa tidak tepat Discriminant Analysis, Bandung.
diklasifikasikan ke Jurusan IPA.Sedangkan Satriya, Andi M. Ade. 2011. Perbandingan Hasil
untuk pengklasifikasian IPS dari 70 siswa Klasifikasi Regresi Logistik dengan Analisis
yang diklasifikasikanke Jurusan IPS, 51 Jaringan Syaraf Tiruan Pada Kasus
siswa tepat diklasifikasikan ke jurusan IPS Pengklasifikasian Jurusan Di SMA Negeri 5
dan sisanya 19 siswa tidak tepat Samarinda Tahun Ajaran 2010/2011. Skripsi
diklasifikasikan ke Jurusan IPS. tidak diterbitkan. Samarinda: Jurusan
2. Hasil pengklasifikasian jurusan SMA Negeri Statistika Fakultas MIPA Universitas
8 Samarinda tahun ajaran 2014/2015 dengan Mulawarman.
menggunakananalisis diskriminan kuadratik Sharma, S. 1996. Applied Multivariate
diperoleh hasil yaitu, untuk pengklasifikasian Techniques. New York:John Wiley & Sons,
IPA dari 120 siswa yang diklasifikasikan ke Inc.
Jurusan IPA, 108 siswa tepat diklasifikasikan Supranto, J. 2004. Analisis Multivariat Arti dan
ke jurusan IPA dan sisanya 12 siswa tidak Interprestasi. Jakarta : PT. Rineka Cipta.
tepat diklasifikasikan ke Jurusan
IPA.Sedangkan untuk pengklasifikasian IPS
dari 70 siswa yang diklasifikasikanke Jurusan
IPS, 52 siswa tepat diklasifikasikan ke