Ukuran kedekatan yang digunakan adalah jarak
Euclidus
. Jarak ini digunakanapabila antar peubah-peubah individu tidak berkorelasi. Ukuran jarak Euclidus untuk dua buah unit X dan Y adalah:
d(X,Y) = ((X – Y)’ I (X – Y))
1/2
dimana I adalah matrik identitas berukuran p x p.Secara umum, analisis gerombol dibagi menjadi dua bagian utama yaitu metode berhierarkhi (
hierarchical clustering method
) dan metode tak berhierarki (
nonhierarchical clustering method
). Metode berhierarkhi digunakan apabila banyaknyagerombol yang akan dibentuk tidak diketahui dan metode tak berhierarkhi digunakanapabila banyaknya gerombol yang akan terbentuk dianggap telah diketahui sebelumnya.Analisis gerombol (
Cluster Analysis
) yang digunakan dalam penelitian ini adalahmetode tidak berhierarki (
K-means Clustering)
. Banyaknya gerombol yang ingindibentuk terlebih dahulu ditentukan. Di dalam metode ini diasumsikan bahwa analisisterdiri dari n individu dan p pengukuran.
X
(i,j) adalah nilai dari individu ke-i dalamvariabel ke-j; i = 1,2,…,n dan j = 1,2,…,p. Misal P (n,K) adalah pengelompokkan yangmerupakan hasil dari masing-masing individu yang dialokasikan ke dalam sebuahgerombol (cluster) 1,2,…,K. Rata-rata variabel ke-j dalam gerombol (cluster) ke-l akandinotasikan dengan
X
(l,j), dan jumlah individu-individu yang termasuk dalam gerombol(cluster) ke-l dinyatakan dengan n(l). Dalam notasi ini kita dapat menampilkan jarak antara individu ke-i dan gerombol ke-l sebagai berikut:
[ ]
∑
=
−=
p j
jl X ji X l i D
1212
)),(),((),(
dengan komponen kesalahan tiap-tiap kelompok dapat didefinisikan sebagai berikut:
[ ] [ ]
21
)(,),(
∑
=
=
ni
il i D K n P E
Leave a Comment