Analisis Diskiminan Teori

Analisis Diskiminan
Setelah dilaksanakannya Analisis Gerombol, kemudian dilanjutkan
dengan Analisis Diskriminan. Menurut Johnson dan Wichern (1992), tujuan
dari Analisis Diskriminan adalah untuk menggambarkan ciri-ciri suatu
pengamatan dari bermacam-macam populasi yang diketahui, baik secara
grafis maupun aljabar dengan membentuk fungsi diskriminan. Dengan kata
lain Analisis Diskriminan digunakan untuk mengklasifikasikan individu ke
dalam salah satu dari dua kelompok atau lebih.
Suatu fungsi diskriminan layak untuk dibentuk bila terdapat
perbedaan nilai rataan di antara kelompok-kelompok yang ada. Oleh karena
itu sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap
perbedaan vektor nilai rataan dari kelompok-kelompok tersebut.
Dalam pengujian vektor nilai rataan antar kelompok, asumsi yang
harus dipenuhi adalah:
 Peubah-pubah yang diamati menyebar secara normal ganda
(multivariate normality)
 Semua kelompok populasi mempunyai matrik ragam-peragam
yang sama
3.2.4.1 Uji Kenormalan Peubah Ganda

Menurut Karson (1982: 80), untuk menguji kenormalan peubah ganda
digunakan prosedur yang dikembangkan oleh Mardia dalam Susiyanto
(2003) dengan cara menghitung dua macam ukuran statistik yaitu ukuran
skewness (b1,p) dan kurtosis (b2,p), yaitu:

3
′
(b ) = (1 n )∑∑ ( X − X ) S −1 ( X u ' − X )
n n
2
1, p
 u =1 u '=1
u 
2
′
(b ) = (1 n) ∑ ( X − X ) S −1 ( X u − X ) 
n
2, p
u =1 
u 
Hipotesa yang digunakan adalah:
H0 : peubah ganda mengikuti sebaran normal
H1 : peubah ganda tidak mengikuti sebaran normal
Bila:
nb1,p /6 ≤ χp ( p +1)( p +2) / 6 , dan

2
[b2,p – p(p + 2)] / 8 p ( p +2) / n ≤ Zα (tabel normal), maka tidak ada
alasan untuk menolak H0, berarti peubah ganda mengikuti sebaran normal.
Menurut Johnson dan Wichern (1992), untuk menguji kenormalan
ganda adalah dengan mencari nilai jarak kuadrat untuk setiap pengamatan
yaitu: d 2j = ( X j − X )' S −1 ( X j − X ) , di mana Xj adalah pengamatan yang ke-j
dan S-1 adalah kebalikan (inverse) matriks ragam-peragam S

Kemudian d 2j diurutkan dari yang paling kecil ke yang paling besar,
2  j −1 2 
selanjutnya dibuat plot d 2j dengan nilai Chi-Kuadrat χ p  n  dimana: j
 
= urutan = 1, 2, ..., n dan p = banyaknya peubah. Bila hasil plot dapat
didekati dengan garis lurus, maka dapat disimpulkan bahwa peubah ganda
menyebar normal.
Menurut Nourosis dalam Susiyanto (2003), berdasar teori Wahl dan
Kronmal (1977), dikatakan bahwa seringkali kenormalan ganda sulit
diperoleh terutama bila sampel yang diambil relatif kecil. Bila hal ini terjadi,
uji vektor nilai rataan tetap bisa dilakukan selama asumsi kedua (kesamaan
ragam-peragam) dipenuhi.
3.2.4.2 Uji Kesamaan Matrik Ragam Peragam
Untuk menguji kesamaan matrik ragam-peragam (Σ ) antar kelompok
digunakan hipotesa:
H0 : Σ 0 = Σ 1 = Σ 2 = ....Σ k = Σ .
H1 : Sedikitnya ada dua kelompok yang berbeda.
Statistik uji yang digunakan adalah statistik Box’s M, yaitu:
(n − k ) − ∑( n j − 1) ln S j
k
-2lnλ = ( n − k ) ln W
*
j =1
k
( n j −1) / 2
∏S j
λ *= j =1
( n −k ) / 2
W /( n − k )
dimana:
k = banyaknya kelompok.
W / (n-k) = matrik ragam-peragam dalam kelompok gabungan.
Sj = matrik ragam-peragam kelompok ke-j.
Bila hipotesa nol (H0) benar, maka (-2lnλ *) / b akan mengikuti
sebaran F dengan derajat bebas v1 dan v2 pada taraf signifikansi α , dimana:
v1 = (1/2)(k –1)p(p + 1)
v2 = (v1+ 2) / (a2 – a12)
b = v1 / (1 – a1 - v1/ v2)
2 p 3 + 3 p −1  k 1 1 
a1 = ∑ − 
6(k −1)( p + 1)  j =1 ( n j −1) ( n − k ) 
( p − 1)( p + 2)  k 1 1 
a2 = ∑ − 2 
6(k + 1)  j =1 ( n j − 1)
2
(n − k ) 
p = jumlah peubah pembeda dalam fungsi diskriminan.
Sehingga apabila (-2lnλ *) / b ≤ Fv1,v2,α maka tidak ada alasan untuk
menolak H0 dan dapat disimpulkan bahwa antar kelompok mempunyai
matrik ragam-peragam yang sama dan sebaliknya bila (-2lnλ *) / b >

Fv1,v2,α maka H0 ditolak, yang berarti bahwa antar kelompok tidak
mempunyai matrik ragam–peragam yang sama.
3.2.4.3 Uji Vektor Nilai Rataan
Pengujian terhadap vektor nilai rataan antar kelompok dilakukan
dengan hipotesa:
H0 : µ 0 = µ 1 = µ 2 = ...= µ k
H1 : Sedikitnya ada dua kelompok yang berbeda
Statistik uji yang digunakan dalam pengujian hipotesis tersebut adalah
statistik V-Bartlett yang menyebar mengikuti sebaran Chi-kuadrat (χ 2)
dengan derajat bebas p(k - 1), apabila H0 benar.
Statistik V-Bartlett diperoleh melalui:
V = −[( n −1) −( p + k ) 2] ln( ∆)
dimana:
n = banyaknya pengamatan
p = banyaknya peubah dalam fungsi diskriminan
k = banyaknya kelompok
W
∆=
W +B
= Wilk’s lambda
dalam hal ini:
W = matrik jumlah kuadrat dan hasil kali data dalam kelompok
k ni
= ∑∑( X
i =1 j =1
ij − X i )( X ij − X i )'
B = matrik jumlah kuadrat dan hasil kali data antar kelompok.

k
= ∑n ( X
i =1
i i − X )( X i − X )'
Xij = pengamatan ke-j kelompok ke-i
Xi = vektor rataan kelompok ke-i
ni = jumlah pengamatan pada kelompok ke-i,
X = vektor rataan total
Apabila V ≤ χp ( k −1), (1−α) maka, tidak ada alasan untuk menolak H0,
2
ini berarti bahwa terdapat perbedaan vektor nilai rataan antar kelompok.
Sebaliknya bila V > χp ( k −1), (1−α) maka H0 ditolak.

2
Bila dari hasil pengujian ada perbedaan vektor nilai rataan, maka
fungsi diskriminan layak disusun untuk mengkaji hubungan antar kelompok
serta berguna untuk mengelompokkan suatu obyek ke salah satu kelompok
tersebut.
Penentuan peubah bebas dalam pembentukan fungsi diskriminan
dengan prosedur stepwise
Menurut Nourosis dalam Susiyanto (2003), apabila dalam suatu
penelitian menggunakan banyak peubah maka untuk efisiensi dalam
menentukan peubah mana yang berperan dalam pembentukan fungsi
diskriminan dilakukan melalui analisis diskriminan bertatar (stepwise
disciminant). Prosedur ini digunakan untuk menghilangkan informasi dari
peubah bebas yang kurang berguna dalam membentuk fungsi diskriminan.
Prosedur diskriminan bertatar dimulai dengan pemilihan peubah bebas yang
paling berarti.
Kriteria untuk melihat variabel yang paling berarti (peubah yang dapat
diikutsertakan dalam pembentukan fungsi diskriminan), yaitu:
1. Peubah yang memiliki nilai F terbesar.
2. Peubah yang memiliki nilai Wilk’s Lambda terkecil.
Peubah yang sudah terpilih bisa dikeluarkan dari fungsi diskriminan
jika informasi yang dikandung tentang perbedaan kelompok ada di beberapa
kombinasi peubah-peubah terpilih lainnya.
Pembentukan Fungsi Diskriminan

Analisis Diskriminan merupakan teknik statistik yang menggunakan
peubah tak bebas Y berupa peubah kategorik dan peubah bebasnya adalah
interval atau rasio. Fungsi diskriminan merupakan fungsi atau kombinasi
linier peubah-peubah asal yang akan menghasilkan cara terbaik dalam
pemisahan kelompok-kelompok. Fungsi ini akan memberikan nilai-nilai
yang sedekat mungkin dalam kelompok dan sejauh mungkin antar kelompok
(Dillon dalam Solikhah, 2003)
Banyaknya fungsi diskriminan yang terbentuk secara umum tergantung
dari min(p,k-1), dengan p adalah banyaknya peubah pembeda dan k adalah
banyaknya kelompok yang telah ditetapkan. Fungsi diskriminan ini diartikan
sebagai keragaman peubah yang terpilih sebagai kekuatan pembeda. Apabila
fungsi diskriminan yang terbentuk sebanyak lebih dari 1, maka dapat
dikatakan bahwa fungsi diskriminan pertama akan menjadi kekuatan
pembeda yang paling besar, demikian berturut-turut untuk fungsi berikutnya.
Fungsi diskriminan yang terbentuk mempunyai bentuk umum berupa
persamaan linier (Fisher’s Sample Linear Discriminant Function) yaitu:
ˆ x +
y1 =  ˆ x + + 
ˆ x + + 
ˆ x
11 1 12 2 1j j 1p p
y 2 = ˆ 21 x1 + ˆ 22 x 2 + + ˆ 2 j x j + + ˆ 2 p x p
y 3 = ˆ31 x1 + ˆ32 x 2 +  + ˆ3 j x j + + ˆ3 p x p
…………………………………………….
y i = ˆi1 x1 + ˆi 2 x 2 + + ˆij x j + + ˆip x p
……………………………………………
y q = ˆ q1 x1 + ˆ q 2 x 2 + + ˆ qj x j + + ˆ qp x p
dengan i=1,2,…,q (min p,k-1)
j=1,2,…,p
atau dapat ditulis sebagai
y =̂' x
dimana:
̂ = koefisien vektor
y = skor diskriminan
Nilai ̂ dipilih sedemikian sehingga fungsi diskriminan berbeda
sebesar mungkin antara kelompok, atau sehingga rasio antara jumlah kuadrat
antar kelompok dengan jumlah kuadrat dalam kelompok maksimum.
Penilaian Kekuatan Fungsi Diskriminan
Untuk mengetahui kekuatan fungsi diskriminan dalam menilai tiap-
tiap observasi dan mengelompokkannya ke dalam kelompok yang
didefinisikan dapat dilakukan dengan melihat:

1. Korelasi Kanonik (Canonical correlation)
Canonical Correlation (R) merupakan ukuran hubungan antara
kelompok yang terbentuk oleh y dengan fungsi diskriminan yang ada.
Ketika R adalah nol, maka hal ini dapat diartikan bahwa tidak ada
hubungan di antara kelompok-kelompok yang ada dengan fungsi yang
terbentuk. Sebaliknya apabila R-nya besar (mendekati 1), maka
menunjukkan adanya korelasi yang tinggi antara fungsi diskriminan
dengan kelompok yang ada. R ini digunakan untuk menjelaskan seberapa
besar masing-masing fungsi berguna dalam menentukan perbedaan
kelompok.
2. Akar Ciri (Eigen Value)
Nilai eigen value menunjukkan ada atau tidaknya multikolinearitas atau
terjadinya korelasi antar peubah bebas di dalam fungsi diskriminan.
Multikolinearitas akan terjadi bila eigen value mendekati 0 (nol).
3. Group Centroid
Group centroid merupakan rata-rata nilai diskriminan dari tiap-tiap
observasi di dalam masing-masing kelompok. Semakin besar perbedaan
group centroid antar kelompok, maka fungsi diskriminan yang diperoleh
semakin dapat membedakan kelompok yang ada.

Ketepatan Pengelompokan
Tingkat akurasi pengelompokkan sangat menentukan baik atau
tidaknya suatu pengelompokkan. Persentase ketepatan pengelompokan dapat
dihitung dari matrik klasifikasi yang menunjukkan nilai sebenarnya (actual
members) dan nilai prediksi (prediction members) dari setiap kelompok.
Rumus persentase ketepatan pengelompokan oleh fungsi diskriminan (hit
ratio) adalah:
k
∑n ic
Hit ratio = × 100%

i =1
k
∑n
i =1
i
dimana : ni = jumlah observasi dari µ i yang tepat dikelompokkan pada
µ i
nij = jumlah observasi dari µ i yang salah dikelompokkan pada
µ ij
dengan i =1,2,…,k dan j =1,2,…,k
Dalam prakteknya, hasil dari hit ratio ini sering dibandingkan dengan suatu
standar persentase tertentu. Ada 2 (dua) standar persentase yang sering
digunakan yaitu kriteria peluang proporsional (the proportional chance
criterion) dan kriteria peluang maksimum (the maximum chance criterion).

Kriteria peluang proporsional digunakan jika ukuran masing-masing
kelompok tidak sama dan peneliti ingin mengidentifikasi dengan tepat tiap-
tiap observasi dari 2 (dua) kelompok atau lebih. Rumus yang digunakan
untuk kriteria peluang proporsional ini adalah:

k
Cproporsional = ∑ pi
2
i =1
dimana:
Cproporsional = kriteria peluang proporsional dari model peluang.
p = proporsi jumlah observasi dari kelompok.
Kriteria peluang maksimum ditentukan dengan menghitung persentase total
observasi yang ditunjukkan oleh persentase terbesar dari dua kelompok atau
lebih.
Hair et. Al dalam Solikhah (2003) menyarankan bahwa persentase
ketepatan pengklasifikasian yang diperoleh melalui analisis diskriminan
paling tidak 25 persen lebih besar dari persentase yang diperoleh melalui
model peluang.

Analisis Diskiminan Teori

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Analisis Diskiminan Teori

Uploaded by

Copyright:

Available Formats

Analisis Diskiminan

Setelah dilaksanakannya Analisis Gerombol, kemudian dilanjutkan

dengan Analisis Diskriminan. Menurut Johnson dan Wichern (1992), tujuan

dari Analisis Diskriminan adalah untuk menggambarkan ciri-ciri suatu

pengamatan dari bermacam-macam populasi yang diketahui, baik secara

grafis maupun aljabar dengan membentuk fungsi diskriminan. Dengan kata

lain Analisis Diskriminan digunakan untuk mengklasifikasikan individu ke

dalam salah satu dari dua kelompok atau lebih.

Suatu fungsi diskriminan layak untuk dibentuk bila terdapat

perbedaan nilai rataan di antara kelompok-kelompok yang ada. Oleh karena

itu sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap

perbedaan vektor nilai rataan dari kelompok-kelompok tersebut.

Dalam pengujian vektor nilai rataan antar kelompok, asumsi yang

harus dipenuhi adalah:

 Peubah-pubah yang diamati menyebar secara normal ganda

 Semua kelompok populasi mempunyai matrik ragam-peragam

3.2.4.1 Uji Kenormalan Peubah Ganda

digunakan prosedur yang dikembangkan oleh Mardia dalam Susiyanto

skewness (b1,p) dan kurtosis (b2,p), yaitu:

Hipotesa yang digunakan adalah:

H0 : peubah ganda mengikuti sebaran normal

H1 : peubah ganda tidak mengikuti sebaran normal

nb1,p /6 ≤ χp ( p +1)( p +2) / 6 , dan

[b2,p – p(p + 2)] / 8 p ( p +2) / n ≤ Zα (tabel normal), maka tidak ada

Menurut Johnson dan Wichern (1992), untuk menguji kenormalan

yaitu: d 2j = ( X j − X )' S −1 ( X j − X ) , di mana Xj adalah pengamatan yang ke-j

dan S-1 adalah kebalikan (inverse) matriks ragam-peragam S

= urutan = 1, 2, ..., n dan p = banyaknya peubah. Bila hasil plot dapat

Menurut Nourosis dalam Susiyanto (2003), berdasar teori Wahl dan

Kronmal (1977), dikatakan bahwa seringkali kenormalan ganda sulit

3.2.4.2 Uji Kesamaan Matrik Ragam Peragam

Untuk menguji kesamaan matrik ragam-peragam (Σ ) antar kelompok

H1 : Sedikitnya ada dua kelompok yang berbeda.

Statistik uji yang digunakan adalah statistik Box’s M, yaitu:

W / (n-k) = matrik ragam-peragam dalam kelompok gabungan.

Sj = matrik ragam-peragam kelompok ke-j.

Bila hipotesa nol (H0) benar, maka (-2lnλ *) / b akan mengikuti

sebaran F dengan derajat bebas v1 dan v2 pada taraf signifikansi α , dimana:

v2 = (v1+ 2) / (a2 – a12)

p = jumlah peubah pembeda dalam fungsi diskriminan.

Sehingga apabila (-2lnλ *) / b ≤ Fv1,v2,α maka tidak ada alasan untuk

menolak H0 dan dapat disimpulkan bahwa antar kelompok mempunyai

matrik ragam-peragam yang sama dan sebaliknya bila (-2lnλ *) / b >

mempunyai matrik ragam–peragam yang sama.

3.2.4.3 Uji Vektor Nilai Rataan

Pengujian terhadap vektor nilai rataan antar kelompok dilakukan

H1 : Sedikitnya ada dua kelompok yang berbeda

Statistik uji yang digunakan dalam pengujian hipotesis tersebut adalah

statistik V-Bartlett yang menyebar mengikuti sebaran Chi-kuadrat (χ 2)

dengan derajat bebas p(k - 1), apabila H0 benar.

Statistik V-Bartlett diperoleh melalui:

V = −[( n −1) −( p + k ) 2] ln( ∆)

p = banyaknya peubah dalam fungsi diskriminan

W = matrik jumlah kuadrat dan hasil kali data dalam kelompok

B = matrik jumlah kuadrat dan hasil kali data antar kelompok.

Xij = pengamatan ke-j kelompok ke-i

Xi = vektor rataan kelompok ke-i

ni = jumlah pengamatan pada kelompok ke-i,

X = vektor rataan total

Sebaliknya bila V > χp ( k −1), (1−α) maka H0 ditolak.

fungsi diskriminan layak disusun untuk mengkaji hubungan antar kelompok

serta berguna untuk mengelompokkan suatu obyek ke salah satu kelompok

dengan prosedur stepwise