Analisis Diskriminan

MODUL 3
ANALISIS DISKRIMINAN
Analisis diskriminan bertujuan untuk membentuk sejumlah fungsi melalui kombinasi
linear variabel-variabel
asal, yang
dapat
digunakan
sebagai
cara terbaik
untuk
membedakan kelompok-kelompok individu. Fungsi yang terbentuk melalui analisis ini

kemudian disebut sebagi fungsi diskriminan. Manfaat lain dari fungsi diskriminan ini
disamping dapat digunakan untuk menjelaskan perbedaan antar kelompok juga dapat
digunakan dalam masalah pengelompokkan suatu individu atau observasi baru.
Pengelompokkan pada analisis diskriminan bersifat mutually exclusive, yaitu jika
suatu objek telah masuk pada salah satu kelompok maka tidak dapat menjadi anggota
dari kelompok yang lain. Analisis diskriminan tidak hanya memecahkan masalah yang
menyangkut dua kelompok saja tetapi juga memecahkan masalah yang menyangkut
lebih dari dua kelompok. Pada makalah ini akan dijelaskan mengenai prosedur analisis
diskriminan untuk dua kelompok.
Ada dua asumsi utama yang harus dipenuhi pada analisis diskriminan ini, yaitu:
1. Sejumlah p variabel penjelas harus berdistribusi normal multivariat.
2. Matriks varians-covarians variabel penjelas berdimensi pxp pada kedua kelompok
harus sama (homogen).
KASUS 1:
Tabel berikut menunjukkan data yang berupa hasil penelitian untuk mengetahui
pengaruh perubahan lingkungan terhadap tekanan darah. Obyek penelitian adalah 35
pria berusia di atas 21 tahun di Peru yang telah migrasi dari pegunungan Andes ke kota
besar. Ada 10 variabel yang diukur, yaitu (lihat file data diskriminan.sav) :
Usia (tahun)
Lama migrasi (tahun)
Berat badan (Kg)
Tinggi badan (mm)
Lekukan kulit pada dagu
Lekukan kulit pada lengan bawah
Lekukan kulit pada betis
Detak nadi per menit
Tekanan darah sistolik
Tekanan darah diastolik
Pelatihan Analisis Multivariat | Analisis Diskriminan
23
Uji Normal Multivariat

Sebelum melakukan analisis diskriminan, terlebih dahulu melakukan uji asumsi
normal multivariat menggunakan software MINITAB. Macro MINITAB untuk menguji

kemultinormalan data melalui multivariate skewness dan multivariate kurtosis dapat
dilihat pada Lampiran 1.
Langkah Pengujian :
1. Buka file data diskriminan.MTW
2. Aktifkan windows Session dengan cara klik windows Session terlebih dahulu,
kemudian pilih menu Editor lalu pilih Enable Commands
3. Perhatikan bahwa secara otomatis akan muncul MTB >
pada windows Session
4. Selanjutnya ketikkan perintah untuk menjalankan Macro MINITAB untuk uji normal
multivariat, seperti berikut :
MTB > %diskriminan.txt c1-c10

24
Output :
Multivariate skewness
Data Display
b1
z1
pvalue
38.6030
248.247
0.0926808
Multivariate kurtosis
Data Display
b2
z2
pvalue
116.429
-0.681760
0.495391
Berdasarkan output MINITAB di atas, p-value untuk statistik uji multivariate
skewness (0,0926808) dan multivariate kurtosis (0,495391) lebih besar dari
=5%, sehingga data berdistribusi normal. Dengan demikian asumsi normal multivariat
pada analisis diskriminan telah terpenuhi.
Uji Homoskedastisitas
Selanjutnya dilakukan uji asumsi yang kedua, yaitu uji kesamaan matriks varianscovarians (homoskedastisitas) menggunakan uji Boxs M dengan hipotesis :
Ho:
1 2
H 1:
1 2
diharapkan dari uji ini hipotesis nol tidak ditolak, sehingga asumsi homoskedastisitas
terpenuhi dan bisa dilanjutkan ke analisis diskriminan.
Langkah Pengujian :
1. Buka file data diskriminan.sav
2. Pilih menu Analyze, pilih submenu Classify, lalu pilih Discriminant
25
- Pada kotak Grouping Variable masukkan variabel respon, yaitu kelompok.

Kemudian klik Define Range untuk mendefinisikan kode kategori kelompok yang
dianalisis. Bagian Minimum diisi dengan kode terkecil dan Maximum diisi dengan
kode terbesar dari variabel respon.
- Pada kotak Independents masukkan variabel penjelas yaitu usia, umur

migrasi, berat badan, tinggi badan, dagu, lengan bawah, betis, nadi,
sistolik dan diastolik.
- Metode yang sering dipakai adalah metode stepwise. Sehingga pilih Use
stepwise method.
3. Klik tombol Statistics sehingga muncul kotak dialog berikut :
Pada bagian Descriptives pilih Boxs M untuk menguji asumsi homoskedastisitas.

Kemudian Klik Continue untuk kembali ke menu utama.
4. Abaikan bagian yang lain, kemudian klik OK.
Output :
Test Results
Box's M
F
Approx.
df1
df2
Sig.
20,983
1,165
15
4091,153
,292
Tests null hypothesis of equal population covariance matrices.
Berdasarkan Tabel di atas terlihat bahwa
p-value (0,292) lebih besar dari 0,05
sehingga tidak menolak H0. Hal ini berarti matriks varians-covarians kedua kelompok
adalah sama. Dengan demikian asumsi homoskedastisitas pada analisis diskriminan telah
terpenuhi.
26
ANALISIS DISKRIMINAN
Setelah dilakukan uji asumsi yang harus terpenuhi pada analisis diskriminan, maka
selanjutnya dapat dilakukan analisis diskriminan.
Langkah Pengujian :
1. Buka file data diskriminan.sav
2. Pilih menu Analyze, pilih submenu Classify, lalu pilih Discriminant
- Pada kotak Grouping Variable masukkan variabel kelompok. Kemudian klik

Define Range. Bagian Minimum diisi dengan 1 dan Maximum diisi dengan 2.
- Pada kotak Independents masukkan variabel penjelas yaitu usia, umur
migrasi, berat badan, tinggi badan, dagu, lengan bawah, betis, nadi,
sistolik dan diastolik.
- Metode yang sering dipakai adalah metode stepwise. Sehingga pilih Use
stepwise method. Secara otomatis tombol Method akan diaktifkan.
3. Klik tombol Method tersebut, maka akan keluar kotak dialog seperti berikut :
- Pada bagian Method pilih Wilks lambda. Sedangkan pada bagian Criteria pilih
Use probability of F. Kemudian Klik Continue.
27
4. Klik tombol Statistics sehingga muncul kotak dialog berikut :
- Pada
bagian
Descriptives
pilih
Boxs
untuk
menguji
asumsi
homoskedastisitas. Sedangkan pada bagian Function Coefficients pilih Fishers

dan Unstandardized. Kemudian Klik Continue.
5. Klik tombol Classify sehingga muncul kotak dialog berikut :
- Pada bagian Display pilih Casewise results untuk membandingkan hasil kasus
awal dengan model diskriminan. Pilih Summary table untuk menampilkan nilai
hit ratio. Pilih Leave-one-out classification untuk menampilkan data yang
cocok dengan hasil proses diskriminan dan data yang tidak cocok.
-
Abaikan bagian yang lain, kemudian Klik Continue.
6. Klik tombol Save untuk menampilkan nilai-nilai posterior probability, nilai-nilai

discriminant score, dan pengklasifikasian observasi oleh model. Kemudian klik
Continue.
28
Output :
Pembentukan fungsi linear

Pada output SPSS, koefisien untuk setiap variabel yang masuk dalam model
dapat dilihat pada tabel Canonical Discriminant Function Coefficient. Tabel ini
akan dihasilkan pada output apabila pilihan Function Coefficient pada bagian
Unstandardized diaktifkan.
Canonical Discriminant Function Coefficients
usia
umur_migrasi
tinggi_badan
sistolik
diastolik
(Constant)
Function
1
-,136
,195
,021
,037
,071
-41,318
Unstandardized coefficients
Dari tabel di atas, dapat dibentuk fungsi diskrikiman linearnya sebagai berikut:
Z score = - 41,318 - 0,136 usia + 0,195 umur migrasi + 0,021 tinggi
badan + 0,037 sistolik + 0,071 diastolik
o
Perhitungan discriminant score

Setelah dibentuk fungsi linearnya, maka dapat dihitung skor diskriminan untuk
setiap observasi dengan memasukkan nilai-nilai variabel penjelasnya. Misalnya
untuk observasi pertama, dengan memasukkan nilai usia = 21, umur migrasi = 1 ,
tinggi badan = 1629, sistolik = 170 dan diastolik = 76, maka diperoleh
discriminant score nya sebesar 1,916.
Perhitungan cutting score

Cutting score (m) dapat dihitung dengan rumus sebagai berikut :
n12Y n2 1Y
n1 n2
Kemudian nilai-nilai discriminant score tiap observasi akan dibandingkan dengan
29
cutting score, sehingga dapat diklasifikasikan suatu observasi akan termasuk ke

dalam kelompok yang mana. Suatu observasi akan diklasifikasikan sebagai anggota
kelompok 1 jika discriminant score > cutting score, selain itu dimasukkan ke
dalam kelompok 2.
Functions at Group Centroids
kelompok
1
2
Function
1
1,537
-1,294
Unstandardized canonical discriminant

functions evaluated at group means
Berdasarkan Tabel di atas, dapat dihitung cutting score nya, yaitu
n12Y n2 1Y
16( 1, 294) 19(1,537)
0, 242829
=
n1 n2
35
Untuk observasi pertama, karena discriminant score nya (1,916) lebih besar dari
cutting
score
(0,242829),
maka
dimasukkan
ke
dalam
kelompok
(pengklasifkasian sudah benar karena sebenarnya observasi pertama sebelumnya

memang termasuk ke dalam anggota kelompok 1).
o
Perhitungan Hit Ratio

Setelah semua observasi diprediksi keanggotaannya, dapat dihitung hit ratio,
yaitu rasio antara observasi yang tepat pengklasifikasiannya dengan total seluruh
observasi.
Classification Resultsb,c
Original
Count
%
Cross-validated a
Count
%
kelompok
1
2
1
2
1
2
1
2
Predicted Group
Membership
1
2
15
1
2
17
93,8
6,3
10,5
89,5
13
3
2
17
81,3
18,8
10,5
89,5
Total
16
19
100,0
100,0
16
19
100,0
100,0
a. Cross validation is done only for those cases in the analysis. In cross
validation, each case is classified by the functions derived from all
cases other than that case.
b. 91,4% of original grouped cases correctly classified.
c. 85,7% of cross-validated grouped cases correctly classified.
Berdasarkan Tabel di atas, angka hit ratio adalah
15 17
0,9143
35
30
Dengan demikian ketepatan prediksi dari model adalah sebesar 91,4%. Sehingga
ketepatan model dapat dikatakan tinggi dan model tersebut bisa digunakan untuk
mengklasifikasikan observasi baru.
o
Pengklasifikasian observasi baru

Jika ada observasi atau responden baru, maka dapat diprediksi akan termasuk dalam
kelompok mana berdasarkan karakteristik yang dimilikinya dengan fungsi linear yang
sudah terbentuk. Inilah yang menjadi tujuan pembentukan fungsi diskriminan.
31

Analisis Diskriminan

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Analisis Diskriminan

Uploaded by

Copyright:

Available Formats

MODUL 3

membedakan kelompok-kelompok individu. Fungsi yang terbentuk melalui analisis ini

Lama migrasi (tahun)

Berat badan (Kg)

Tinggi badan (mm)

Lekukan kulit pada dagu

Lekukan kulit pada lengan bawah

Lekukan kulit pada betis

Detak nadi per menit

Tekanan darah sistolik

Tekanan darah diastolik

Pelatihan Analisis Multivariat | Analisis Diskriminan

Uji Normal Multivariat

normal multivariat menggunakan software MINITAB. Macro MINITAB untuk menguji

3. Perhatikan bahwa secara otomatis akan muncul MTB >

pada windows Session

MTB > %diskriminan.txt c1-c10

Berdasarkan output MINITAB di atas, p-value untuk statistik uji multivariate

skewness (0,0926808) dan multivariate kurtosis (0,495391) lebih besar dari

Pelatihan Analisis Multivariat | Analisis Diskriminan

- Pada kotak Grouping Variable masukkan variabel respon, yaitu kelompok.

- Pada kotak Independents masukkan variabel penjelas yaitu usia, umur

Pada bagian Descriptives pilih Boxs M untuk menguji asumsi homoskedastisitas.

Tests null hypothesis of equal population covariance matrices.

Berdasarkan Tabel di atas terlihat bahwa

p-value (0,292) lebih besar dari 0,05

Pelatihan Analisis Multivariat | Analisis Diskriminan

selanjutnya dapat dilakukan analisis diskriminan.

- Pada kotak Grouping Variable masukkan variabel kelompok. Kemudian klik

Pelatihan Analisis Multivariat | Analisis Diskriminan

4. Klik tombol Statistics sehingga muncul kotak dialog berikut :

homoskedastisitas. Sedangkan pada bagian Function Coefficients pilih Fishers

Abaikan bagian yang lain, kemudian Klik Continue.

6. Klik tombol Save untuk menampilkan nilai-nilai posterior probability, nilai-nilai

Pelatihan Analisis Multivariat | Analisis Diskriminan

Pembentukan fungsi linear

Perhitungan discriminant score

Perhitungan cutting score

Kemudian nilai-nilai discriminant score tiap observasi akan dibandingkan dengan

Pelatihan Analisis Multivariat | Analisis Diskriminan

cutting score, sehingga dapat diklasifikasikan suatu observasi akan termasuk ke

Unstandardized canonical discriminant

Berdasarkan Tabel di atas, dapat dihitung cutting score nya, yaitu

(pengklasifkasian sudah benar karena sebenarnya observasi pertama sebelumnya

Perhitungan Hit Ratio

Berdasarkan Tabel di atas, angka hit ratio adalah

Pelatihan Analisis Multivariat | Analisis Diskriminan

Pengklasifikasian observasi baru

Pelatihan Analisis Multivariat | Analisis Diskriminan

You might also like