You are on page 1of 10

Jurnal ILMU DASAR, Vol.20 No.

2, Juli 2019 : 129-138 129

Analisis Diskriminan untuk Validasi Cluster pada Studi Kasus Pengelompokan


Kecamatan di Kabupaten Jember Berdasarkan Status Kemiskinan
Discriminant Analysis for Cluster Validation in A Case Study of District
Grouping in Jember Regency Based on Poverty

Fikriana Nur Istiqomah, I Made Tirta*), Dian Anggraeni


Jurusan Matematika FMIPA Universitas Jember
*
E-mail: itirta.fmipa@unej.ac.id

ABSTRACT
Cluster validation is a procedure to evaluate the results of cluster analysis quantitively and
objectively on a data. The validation process is very important to get the results of a good and
appropriate grouping. In the validation process, the author uses internal validation, stability, and
discriminant analysis test. This study aims to obtain validation results from the hierarchy and
kmeans method. This data grouping uses “iris” simulation data, which results from the grouping
method used can be applied to the original data to see which vaidation method is used for all data
and produce an optimal grouping. The result of the study show that in the “iris” data, a single
linkage link is an appropriate grouping method because the result of the grouping are optimal for
all validations and classification of group members whose groups are significant. In District
poverty data in Jember Regency with a single linkage link optimal grouping was obtained and
complete linkage links were also used as a method that resulted in optimal groupig for all
validation. Cluster validation discriminant analysis test is appropriate for various types of data in
general annd shows that single linkage methods are better than other methods for grouping and
validation methods for “iris” data and District data in Jember Regency based on variabels of
poverty status.
Keywords: Cluster Analysis, Diskriminant Analysis, Multivariate Analysis, Validation Cluster.
PENDAHULUAN kelompok yang rendah serta tidak adanya
outlier. Metode pengelompokan yang tepat
Analisis Multivariat merupakan salah satu jenis penggunaannya dalam pengelompokan data
analisis statistika yang dapat digunakan untuk dan memenuhi kriteria pengelompokan yang
menganalisis data dengan variabel independent baik, membutuhkan satu proses terakhir yaitu
dan/atau variabel dependent-nya lebih dari proses validasi cluster atau validasi
satu. Analisis cluster bertujuan untuk pengelompokan, sehingga nantinya dari pada
mengelompokkan objek ke dalam suatu pengelompokan data tersebut akan didapatkan
kelompok sehingga objek yang berada dalam hasil yang lebih baik. Menurut Brock, et.al
satu kelompok akan memiliki kesamaan yang (2018) validasi cluster ada 3 macam metode
tinggi daripada objek yang berada di kelompok validasi yang digunakan untuk menentukan
lain(Sharma, 1996). jumlah cluster optimal yaitu validasi internal,
Menurut Shidqon (2012) pada analisis validasi stabilitas, dan validasi biologis. Pada
cluster, tidak ada metode-metode penelitian ini digunakan validasi internal,
pengelompokan yang secara khusus dapat validasi stabilitas dan juga uji analisis
menjelaskan tentang ketepatan sebuah metode diskriminan sebagai salah satu metode untuk
digunakan dalam proses pengelompokan data. memvalidasi hasil solusi cluster.
Masing-masing metode pengelompokan Analisis diskriminan adalah teknik
memiliki kelebihan dan kelemahan, multivariate yang termasuk dependence
diantaranya adalah sensitif terhadap adanya method, yakni adanya variabel dependen dan
outlier, kesulitan menangani variasi bentuk dan variabel independen, sehingga ada variabel
ukuran, serta memisahkan kelompok yang yang hasilnya tergantung dari data variabel
besar. Pengelompokan yang baik yaitu independen (Santosa, 2002). Pada situasi ini,
memiliki kesamaan individu dalam satu solusi cluster menjadi variabel dependen yang
kelompok yang tinggi dan kesamaan antar digunakan untuk mendapatkan pengelompokan

Journal homepage: https://jurnal.unej.ac.id/index.php/JID


130 Analisis Diskriminan untuk Validasi … (Istiqomah, dkk)

yang optimal. Adapun pengolahan data peubah status kemiskinannya yang juga dapat
dilakukan dengan menggunakan akses web di kelompokkan ke dalam beberapa cluster
online Virtual Statistics Laboratory Fakultas kecamatan yang mempunyai sifat relatif sama
Matematika dan Ilmu Pengetahuan Alam atau kemiripan sifat berdasarkan peubah status
Universitas Jember dengan alamat kemiskinannya. Kemiskinan didefinisikan
http://statslab- sebagai konsekuensi dari suatu struktur
rshiny.fmipa.unej.ac.id/RProg/Multiv/. masyarakat dengan penduduk yang padat,
Penelitian analisis cluster telah dilakukan terbatasnya sumber daya, tingkat kesehatan
oleh beberapa peneliti diantaranya Sitepu yang rendah dan kesempatan pendidikan yang
(2011) yang menggunakan anaisis cluster tidak merata (Ernayati dan Ita, 1996).
terhadap tingkat pencemaran udara pada sektor Tujuan penelitian ini adalah mengetahui
industri, dengan hasil validasi diuji prosedur penentuan metode analisis Cluster
menggunakan parsial F yang akan menjadi terbaik dari metode hirarki dan kmeans;
variabel pembeda dalam peng-cluster-an, mengetahui hasil yang didapatkan dari validasi
Rachmatin (2014) yang menggunakan aplikasi analisis cluster dan hasil validasinya terhadap
metode-metode agglomerative dalam analisis pengelompokan data “iris” dan data
cluster pada data tingkat polusi udara untuk kemiskinan Kecamatan di Kabupaten Jember;
hasil validasi dengan plot RMSSTD (Root serta mengetahui bahwa ujian alisis
Mean Square Standart Deviation) dan CD diskriminan tepat digunakan sebagai salah satu
(Cluster Distance) sehingga hasil plot dari metode untuk memvalidasi hasil solusi dari
jumlah cluster yang digunakan menghasilkan analisis cluster untuk data secara umum.
jumlah cluster yang valid (dapat dipercaya) dan
METODE
dapat dipilih 5 sampai 6 cluster dan Shidqon
(2012) yang menggunakan metode validasi Data yang digunakan dalam penelitian ini adalah
internal untuk validasi cluster pada data simulasi yang ada di web Pusat Belajar dan
pengelompokan Kecamatan di Kabupaten Laboratorium Statistika Virtual yaitu data “iris”
Jember berdasarkan status kemiskinan. Akan (Data dapat dilihat pada lampira C) dan data
sekunder skripsi Muhda Shidqon (2012). Sumber
tetapi setiap data dan metode-metode yg data berasal dari hasil sensus Badan Pusat Statistik
digunakan pada hasil validasi memiliki (BPS) Kabupaten Jember tahun 2010.
karakteristik tersendiri sehingga Pengelompokan ini dilakukan berdasarkan faktor-
memungkinkan adanya pemilihan data dan faktor yang mempengaruhi kemiskinan pada suatu
penentuan metode hasil validasi yang berbeda. kecamatan. Dalam penelitian ini, peneliti memilih
Analisis diskriminan untuk validasi cluster objek pengamatan Kecamatan di Kabupaten Jember
dapat digunakan sebagai pengklasifikasian yang terdiri dari 31 kecamatan, yaitu :
suatu individu atau objek ke dalam suatu = Kepadatan Penduduk (Jiwa/km2).
kelompok yang telah ditentukan sebelumnya = Banyaknya sekolah (SD/MI (Negeri &
berdasarkan variabel-variabel bebasnya[2]. Swasta), SLTP/MTs (Negeri & Swasta),
Penelitian ini, menggunakan data simulasi yang SMA/MA (Negeri & Swasta).
ada di web Pusat Belajar dan Laboratorium = Banyaknya fasilitas kesehatan (Rumah sakit,
Puskesmas).
Statistika Virtual yaitu data “iris” dan data
= Banyaknya Rumah Tangga Pengguna PLN.
Kecamatan di Kabupaten Jember berdasarkan = Banyaknya Rumah Tangga yang Mempunyai
peubah status kemiskinannya. Data “iris” Telepon.
digunakan sebagai salah satu acuan = Banyaknya Industri berbadan hukum (Industri
pengelompokan dalam analisis data ini, karena Kecil, Industri Sedang, dan Industri Besar).
data “iris” mempunyai klasifikasi variabel = Produksi Pertanian (Ton).
kelompok yang asli sehingga dengan lebih Pengolahan data menggunakan akses web online
mudah dilihat ketepatan pengelompokan Virtual Statistics Laboratory Fakultas Matematika
analisis data yang dihasilkan dari beberapa dan Ilmu Pengetahuan Alam Universitas Jember.
metode yang digunakan dengan kelompok Adapun langkah-langkah dalam penelitian
yang telah terdefinisi sebelumnya. Berdasarkan menggunakan Analisis diskriminan untuk validasi
uraian tersebut, pengelompokan dengan cluster yaitu :
a. Input data pada web Pusat Belajar dan
metode analisis data yang tepat digunakan
Laboratorium Statistika Virtual bagian
dalam data “iris” sebelumnya dapat Analisis Multivariat secara online.
diaplikasikkan pada pengelompokan data b. Menentukan prosedur pengelompokan
Kecamatan di Kabupaten Jember berdasarkan Pada langkah menentukan prosedur
Jurnal ILMU DASAR, Vol.20 No. 2, Juli 2019 : 129-138 131

pengelompokan ini menggunakan metode kmeans digunakan sebagai variabel


hirarki dan metode kmeans. dependent dalam uji analisis
1. Metode hirarki diskriminan untuk validasi cluster.
Pengelompokan data dengan metode Hasil pengelompokan metode hirarki
hirarki ini menggunakan tautan single dan kmeans pada validasi
linkage, complete linkage dan average cluster menggunakan uji analisis
linkage, sehingga masing-masing diskriminan masing-masing adalah
objek dalam data akan membentuk tidak sama (berbeda).
kelompok dan jumlah kelompok. d. Interpretasi hasil dan mengambil kesimpulan.
2. Metode kmeans
Pengelompokan data dengan metode Skema dari langkah-langkah penelitian dapat dilihat
kmeans ini menggunakan algoritma pada Gambar 1.
Mac Queen.
c. Melakukan validasi kelompok
Pada langkah ini, akan dilakukan validasi
terhadap hasil pengelompokan untuk
mendapatkan hasil pengelompokan yang
optimal.
1. Validasi internal
Pada langkah sebelumya, dipilih
metode hirarki dengan tautan single
linkage, complete linkage dan average
linkage yang dilakukan dengan urut.
Namun, untuk setiap tautan yang dipilih
langsung dilanjutkan pada langkah
melakukan validasi kelompok dengan
validasi internal karena setiap tautan
yang dipilih dan dilakukan validasi
kemungkinan didapatkan nilai pada
validasi internal yaitu nilai connectivity,
silhouette, dan dunn index yang
berbeda-beda atau mungkin ada yang
sama. Begitu juga pada metode Kmeans
menggunakan algoritma Mac Queen.
2. Validasi Stabilitas Gambar 1. Diagram Alur Penelitian
Pada langkah sebelumya, dipilih HASIL DAN PEMBAHASAN
metode hirarki dengan tautan single
linkage, complete linkage dan average Data “iris” digunakan sebagai salah satu acuan
linkage yang dilakukan dengan urut. pengelompokan dalam analisis data ini, karena
Namun, untuk setiap tautan yang dipilih data “iris” mempunyai klasifikasi variabel
langsung dilanjutkan pada langkah kelompok yang asli sehingga dengan lebih
melakukan validasi kelompok dengan
mudah dilihat ketepatan pengelompokan
validasi stabilitas karena setiap tautan
yang dipilih dan dilakukan validasi analisis data yang dihasilkan dari beberapa
kemungkinan didapatkan nilai pada metode yang digunakan dengan kelompok
validasi stabilitas yaitu nilai APN, dan yang telah terdefinisi sebelumnya. Berdasarkan
FOM yang berbeda-beda atau mungkin pernyataan tersebut, pengelompokan dengan
ada yang sama. Begitu juga pada metode analisis data yang tepat digunakan
metode Kmeans menggunakan dalam data “iris” sebelumnya dapat
algoritma Mac Queen. diaplikasikkan pada pengelompokan data
3. Uji analisis diskriminan. Kecamatan di Kabupaten Jember berdasarkan
Pada tahapan validasi cluster dengan uji
peubah status kemiskinannya yang juga dapat
analisis diskriminan, ada beberapa
tahapan yang dilakukan; dimulai denga di kelompokkan ke dalam beberapa cluster
melakukan pengelompokan dengan kecamatan yang mempunyai sifat relatif sama
metode hirarki tautan single linkage, atau kemiripan sifat berdasarkan peubah status
complete linkage dan average linkage kemiskinannya.
secara berurutan. Selanjutnya,
dilanjutkan dengan pengelompokan
Validasi Cluster Data “iris”
metode kmeans. Hasil yang diperoleh Tabel 1 hasil pengelompokan data “iris”
dari pengelompokan metode hirarki dan menggunakan metode hirarki tautan single

Journal homepage: https://jurnal.unej.ac.id/index.php/JID


132 Analisis Diskriminan untuk Validasi … (Istiqomah, dkk)

linkage dan average linkage adalah


pengelompokan dengan hasil yang optimal = 0.4801072 + 1.6957809
untuk metode validasi internal karena terlihat − 1.6804854
dari nilai connectivity dan nilai dunn index-nya − 0.3374967
yang lebih kecil daripada nilai connectivity
= −0.0217617 − 2.5309705
untuk tautan metode hirarki yang lainnya dan
− 1.5715342
metode kmeans serta angka pada nilai
+ 2.8343891
silhouette yang mendekati 1. Validasi
.
stabilitas, metode hirarki tautan average
Tabel 2 menunjukkan banyaknya objek
linkage dan metode Kmeans menghasilkan
pada data “iris” yang terklasifikasikan secara
pengelompokan yang baik (stabil), karena nilai
tepat oleh model diskriminan linier variabel
daripada APN dan FOM-nya menghasilkan
species dengan pengelompokan menggunakan
nilai yang lebih kecil dari nilai APN dan FOM
tautan single linkage adalah 150 objek (hit
yang dihasilkan oleh metode hirarki tautan
ratio = 100%). Pada validasi menggunakan uji
yang lainnya. Secara umum, Jumlah kelompok
analsis diskriminan data “iris”, didapatkan
optimal yang didapatkan pada validasi internal
untuk semua tautan metode hirarki, kmeans dan
dan stabilitas adalah sebanyak 2 kelompok.
variabel species pengelompokannya adalah
Tabel 1, didapatkan hasil pengelompokan
optimal karena nilai pada hit ratio lebih besar
untuk data “iris” ini mempunyai 3 variabel
daripada nilai Cmax dan nilai Press’s Q yang
dependent yang dapat digunakan dalam uji
dihasilkan lebih besar dari nilai titik kritis Chi-
analisis diskriminan sebagai validasinya yaitu
Square tabel berderajat bebas 1, sehingga
variabel hirarki, kmeans, dan species. Variabel
prediksi dalam klasifikasinya dianggap
species adalah variabel yang dimiliki oleh data
signifikan secara statistik. Namun, pada
“iris” pada awalnya dengan pengelompokan
metode hirarki hanya tautan single linkage
keanggotaannya telah diketahui, memiliki 150
yang tidak terjadi kesalahan dalam klasifikasi
objek data dan memiliki 3 kelompok yaitu
(missclassification) dalam proses
setosa, versi color dan virginica. Berdasarkan
pengelompokannya. Tautan complete linkage,
hal tersebut, pada validasi internal dan
average linkage, metode kmeans dan variabel
stabilitas yang telah digunakan sebelumnya
species, pengelompokannya terjadi kesalahan
mendapatkan hasil jumlah kelompok
klasifikasi (ada beberapa data dari total jumlah
optimalnya sebanyak 2 kelompok, sehingga
data yang salah memasuki sebuah kelompok)
pada validasi cluster dengan menggunakan uji
yang terihat dari hasil uji analisis
analisis diskriminan pengelompokan yang
diskriminannya. Berdasarkan hal tersebut,
dilakukan harus membentuk kelompok optimal
pengelompokan metode hirarki dengan
sebanyak 3 kelompok sesuai dengan jumlah
menggunakan tautan single linkage adalah
kelompok pada variabel species.
pengelompokan yang optimal dan paling baik
Pengelompokan pada tautan single linkage
untuk seluruh metode validasi yang digunakan
digunakan untuk membuat model
pada data “iris” ini, serta untuk semua variabel
diskriminannya, karena merupakan metode
yang digunakan dalam pengelompokan ini
pengelompokan yang optimal untuk semua
tidak ada yang hasil pengelompokan
metode validasi. Analisis diskriminan linier
keanggotaannya sesuai atau sama dengan
membentuk 2 model persamaan untuk
pengelompokan keanggotaan yang asli pada
membedakan 3 kelompok berdasarkan
variabel species, tetapi hanya pada metode
banyaknya objek 150 dan banyaknya kelompok
hirarki tautan average linkage hasil
adalah 3 yaitu kelompok setosa, versicolor dan
pengelompokan keanggotaannya hampir sesuai
virginica. Nilai peluang awal (prior
dengan pengelompokan keanggotaan daripada
probabilities) pengklasifikasian objek ke dalam
variabel species yang asli.
3 kelompok tautan single linkage adalah sama
yaitu sebesar 0,33; 0,65; dan 0,013. Nilai Validasi Cluster Data Kemiskinan
peluang tersebut diperoleh dari perbandingan Kecamatan di Kabupaten Jember
jumlah sampel total dari ketiga kelompok. Tabel 3 menjelaskan hasil validasi cluster pada
Berdasarkan dugaan koefisien yang dapat data Kecamatan Kabupaten Jember
dilihat pada lampiran D.1, didapatkan 2 bentuk berdasarkan status kemiskinannya
model diskriminan yang dinotasikan sebagai menghasilkan jumlah kelompok optimal
D1 dan D2 adalah sebagai berikut: sebanyak 3 kelompok. Pengelompokan dengan
Jurnal ILMU DASAR, Vol.20 No. 2, Juli 2019 : 129-138 133

menggunakan metode hirarki tautan single mendekati 1. Pada validasi stabilitas, metode
linkage dan complete linkage merupakan hirarki dengan tautannya complete linkage dan
pengelompokan dengan hasil yang optimal average linkage menghasilkan pengelompokan
pada validasi internal karena terlihat dari nilai yang baik (stabil), karena nilai APN dan FOM
connectivity dan nilai dunn index-nya yang nya menghasilkan nilai yang lebih kecil dari
lebih kecil daripada nilai connectivity untuk yang lain.
tautan metode hiraki yang lainnya dan metode
kmeans serta angka pada nilai silhouette yang
Tabel 1. Perbandingan Hasil Validasi Keseluruhan Data “iris
Validasi
Internal Stabilitas Analisis Diskriminan
Metode Hit
Conne Dunn Silhou Cmax
APN FOM Ratio Press’s Q
ctivity Index ette (%)
(%)

Single 3,2 4,6


0 0,435 0,95 100*) 65,33*) 300*)
linkage 10 10

2 2 2 2 8 3 3 3
kelompok
Complete 3,2 4,15
0 0,435 0,95 97,33*) 45,33*) 276,48*)
linkage 10 10
Hirarki

2 2 2 2 7 3 3 3
kelompok
Average 4,16
0 0,435 0,95 0 91,33*) 34*) 227,07*)
linkage 10

2 2 2 2 8 3 3 3
kelompok
Mac- 1,3 3,13
6,15 0,14 0,68 98*) 40,67*) 282,27*)
Queen 10 10
Kmeans

2 4 2 2 8 3 3 3
kelompok
- - - - - 98*) 33,33*) 282,27*)
Species ∑
- - - - - 3 3 3
kelompok
Tabel 2. Kebaikan model Analisis Diskriminan Untuk Metode Analisis Diskriminan linier Data
“iris”

Klasifikasi model Banyak


Kelompok
Setosa Versicolor Virginica Objek

Setosa 50 0 0 50
Klasifikasi sebenarnya Versi
0 98 0 98
Color
Virginica 0 0 2 2
Banyak objek 50 98 2 150

Journal homepage: https://jurnal.unej.ac.id/index.php/JID


134 Analisis Diskriminan untuk Validasi … (Istiqomah, dkk)

Tabel 3. Perbandingan Hasil Validasi Keseluruhan Data Kemiskinan Kecamatan di


Kabupaten Jember
Validasi
Internal Stabilitas Analisis Diskriminan
Metode
Connect Dunn Silhouet Hit Ratio
APN FOM Cmax (%) Press’s Q
ivity Index te (%)
Single linkage9.67 0.12 0.85 7.57 10 2.97 10 100%*) 90.32%*) 62*)
Complete
Hirarki linkage 9.67 0.12 0.85 2.28 10 2.85 10 100%*) 51.61%*) 62*)
Average
11.38 0.03 0.81 4.32 10 2.92 10 100%*) 51.61%*) 62*)
linkage
Kmeans Mac-Queen 14.78 0.15 0.46 1.31 10 3. 10 90.32%*) 45.16%*) 45.3*)

Tabel 4. Ketepatan Klasifikasi Masing-masing kelompok Pada Metode Single Linkage Data
Kemiskinan Kecamatan Kabupaten Jember

Klasifikasi model
Kelompok Banyak Objek
I II III
I 28 0 0 28
Klasifikasi
sebenarnya II 0 1 0 1
III 0 0 2 2
Banyak objek 28 1 2 31

Tabel 5. Ketepatan Klasifikasi Masing-masing kelompok Pada Metode Complete Linkage Data
Kemiskinan Kecamatan Kabupaten Jember

Klasifikasi model
Kelompok Banyak Objek
I II III
I 16 0 0 16
Klasifikasi
sebenarnya II 0 12 0 12
III 0 0 3 3
Banyak objek 16 12 3 31

Tautan complete linkage dapat digunakan = 0.0016762628 – 0.0112894866


sebagai tautan yang memenuhi kriteria + 0.4273345188
pengelompokan yang optimal untuk semua − 0.0048378699
metode validasi yang digunakan pada + 0.0001456018
pembuatan model analisis diskriminannya. + 0.0010246224
+ 0.0001842413
Nilai peluang awal (prior probabilities)
pengklasifikasian objek kedalam kelompok = 1.486650 − 03 – 2.830492 − 02
tersebut yaitu sebesar 0,52; 0,38 dan 0,09. Nilai + 8.145533 − 01
peluang awal tersebut diperoleh dari + 9.294488 − 0
perbandingan jumlah sampel total dari ketiga − 3.343122 − 04
kelompok. Berdasarkan dugaan koefisien, + 1.303436 − 03
+ 8.107912 − 06
didapatkan 2 bentuk model diskriminan yang
dinotasikan sebagai D1 dan D2 adalah sebagai Berdasarkan penjelasan analisis
berikut: diskriminan sebelumnya pada data “iris”,
selanjutnya dapat kita aplikasikan pada data
Jurnal ILMU DASAR, Vol.20 No. 2, Juli 2019 : 129-138 135

Kecamatan Kabupaten Jember berdasarkan menggunakan tautan single linkage yang


peubah status kemiskinannya. Analisis digunakan dalam data “iris” sebelumnya yang
diskriminan linier merupakan analisis yang dijadikan acuan juga termasuk dalam metode
digunakan untuk mengklasifikasikan objek dari pengelompokan yang optimal dalam data
data kemiskinan kecamatan ini ke dalam Kemiskinan Kabupaten Jember, seperti halnya
kelompok kecamatan dengan status ekonomi dengan complete linkage yang merupakan
yang menengah ke bawah. Tautan single pengelompokan yang optimal dan paling baik
linkage dapat kita gunakan pada data untuk seluruh metode validasi yang digunakan
kemiskinan Kecamatan Kabupaten Jember pada data pengelompokan Kecamatan di
sebagai tautan yang digunakan pada data “iris” Kabupaten Jember berdasarkan peubah status
sebelumnya yang dijadikan acuan. Nilai kemiskinannya.Tautan single linkage dan
peluang awal (prior probabilities) complete linkage dalam data kemiskinan
pengklasifikasian objek kedalam kelompok kecamatan ini, dapat disimpulkan
tersebut yaitu sebesar 0,90; 0,03 dan 0,06. Nilai keoptimalannya dengan melihat hasil dari
peluang awal tersebut diperoleh dari proportion of trace yang dihasilkan oleh
perbandingan jumlah sampel total dari ketiga keduanya sehingga diketahui mana yang lebih
kelompok. Berdasarkan dugaan koefisien, optimal selain melihat dari pada nilai hit ratio
didapatkan 2 bentuk model diskriminan yang nya.
dinotasikan sebagai D1 dan D2 adalah sebagai
berikut: Proportion of trace:
= . − . + LD1 LD2
. − . + 0.9447 0.0553
. + . +
. . Berdasarkan proportion of trace yang
= 1.486650 − 03 − 2.830492 − 02 dihasilkan dari tautan single linkage untuk uji
+ 8.145533 − 01 analisis diskriminan sebagai validasi cluster
+ 9.294488 − 04 nya, menunjukkan bagian LD1 peluangnya
− 3.343122 − 04 sebanyak 94%. Namun, pada proportion of
+ 1.303436 − 03 trace yang dihasilkan dari tautan complete
+ 8.107912 − 06 linkage menunjukkan hasil bagian pada LD1
Kebaikan model diskriminan untuk metode peluangnya lebih banyak dari tautan single
analisis diskriminan linier dapat dilihat dari linkage yaitu sebesar 97%. Sehingga
ketepatan klasifikasi masing-masing kelompok didapatkan bahwa tautan complete linkage
pada metode single linkage dan complete adalah pengelompokan yang optimal.
linkage yang dapat dilihat pada tabel 4 dan
tabel 5. Banyaknya objek pada data Proportion of trace:
Kemiskinan Kecamatan Kabupaten Jember LD1 LD2
yang terklasifikasikan secara tepat oleh model 0.9769 0.0231
diskriminan linier dengan pengelompokan
menggunakan single linkage adalah 31 objek Hasil pengelompokan data kemiskinan
(hit ratio = 100%). Kecamatan di Kabupaten Jember dari metode
Banyaknya objek pada data Kemiskinan Kmeans menggunakan analisis diskriminan
Kecamatan Kabupaten Jember yang sebagai validasinya adalah adanya beberapa
terklasifikasikan secara tepat oleh model data yang terjadi missclassification dengan hit
diskriminan linier dengan pengelompokan ratio=90,32% seperti yang ditunjukkan pada
menggunakan single linkage adalah 31 objek Gambar 2 dan Gambar 3.
(hit ratio = 100%). Berdasarkan hal tersebut,
pengelompokan metode hirarki dengan

Journal homepage: https://jurnal.unej.ac.id/index.php/JID


136 Analisis Diskriminan untuk Validasi … (Istiqomah, dkk)

Gambar 2. Grafik Sebaran Kelompok Inisial Klaster

Gambar 3. Grafik Sebaran Kelompok Hasil LDA

KESIMPULAN (missclassification) dari nilai APER dan


persentase nilai akurasinya secara langsung
Penelitian ini mendapatkan bahwa Tautan
tanpa mempertimbangkan nilai lainnya seperti
Single Linkage metode hirarki menghasilkan
pada validasi internal dan validasi stabilitas
pengelompokan yang optimal untuk semua
sehingga diketahui kelompok yang dihasilkan
metode validasi yang digunakan pada data
tersebut adalah tepat pengklasifikasian
simulasi “iris” sebagai data acuan untuk
keanggotaan pengelompokannya.
melakukan pengelompokan data kemiskinan
Kecamatan di Kabupaten Jember. Uji analisis DAFTAR PUSTAKA
diskriminan sebagai salah satu metode untuk
Brock, G., Vasyl, P., Susmita, D., dan
memvalidasi hasil solusi dari analisis cluster
Somnath, D. 2008. clValid: An R Package
adalah tepat digunakan untuk analisis data
for Cluster Validation. Journal of Statistical
pengelompokan secara umum. Validasi cluster
Software, 25(4): 1-22.
menggunakan uji analisis diskriminan lebih
Ernayanti, dan Ita, N. 1996. Budaya
mudah dilakukan dalam proses perhitungannya
Kemiskinan di Desa Tertinggal di
dan lebih spesifik pada pengklasifikasian
Yogyakarta (Kasus Desa Karang Tengah,
anggota dalam setiap kelompoknya serta dapat
Kecamatan Imogiri Kabupaten Bantul).
juga melihat kesalahan klasifikasi
Jurnal ILMU DASAR, Vol.20 No. 2, Juli 2019 : 129-138 137

Direktorat Sejarah dan Nilai Tradisional Technique. Canada: John Wiley & Sons.
Bagian Proyek Pengkajian dan Pembinaan Shidqon, M. 2012. Validasi Metode Kelompok
Kebudayaan Masa Kini, Jakarta. Pada Pengelompokan Kecamatan Di
Rachmatin, D dan Sawitri, K. 2014. Kabupaten Jember Berdasarkan Peubah
Perbandigan Antara Metode Agglomeratif, Status Kemiskinan. Skripsi. Jember:
Metode Divisif, dan Metode K-Means Fakultas Matematika dan Ilmu Pengetahuan
dalam Analisis Klaster. Seminar Nasional Alam Universitas Jember.
Matematika UNPAR. Sitepu, R., Irmeilyana, danGultom, B. 2011.
Santosa, S. 2002. Buku Latihan SPSS Statistik Analisis Cluster terhadap Tingkat
Multivariat. Jakarta: PT Elex Media Pencemaran Udara Pada Sektor Industri di
Komptindo. Sumatera Selatan. Jurnal Penelitian Sains.
Sharma, S. (1996). Applied Multivariate 4(34): 12-17.

Journal homepage: https://jurnal.unej.ac.id/index.php/JID


138 Analisis Diskriminan untuk Validasi … (Istiqomah, dkk)

You might also like