Professional Documents
Culture Documents
4
4
=
n
i
m Ui
n
v
1
2
) (
1
1
(2.2)
c. Standar deviasi :
v = o
(2.3)
Klasifikasi dengan Metode
Nearest Cluster Classifier (NCC)
Algoritma NCC merupakan
algoritma untuk mengklasifikasikan
suatu objek berdasarkan jarak
terdekatnya dengan suatu pusat
cluster. Metode ini juga disebut
dengan minimum euclidean distance
classifier [3]. Pada metode NCC
proses learning dilakukan untuk
menemukan model prediksi yang
tepat. Pada awal fase pelatihan
(training), semua data training
dipartisi ke dalam beberapa cluster
yang telah ditentukan dan kemudian
dicari pusat cluster dari masing-
masing cluster yang terbentuk.
Untuk membentuk cluster dan
menemukan pusat cluster dari data
training, dihitung dengan
menggunakan salah satu metode
clustering yaitu metode Fuzzy C-
Means (F-CM). Setelah cluster
terbentuk dan pusat cluster
diketahui, selanjutnya akan
ditentukan tingkat probabilitas dari
setiap kelas terhadap suatu cluster,
dengan persamaan yaitu:
n(K)
n(JK)
(JK) P =
Dimana:
P(JK) = Probabilitas suatu kelas j
terhadap cluster k
n(JK) = Banyaknya anggota kelas j
yang masuk pada cluster k
n(K) = Ruang sampel yang
menunjukkan banyaknya anggota
dari cluster k.
Selanjutnya pada proses
pengenalan (testing), akan dihitung
jarak antara data testing dengan
setiap pusat cluster yang diperoleh.
Jarak dihitung dengan
menggunakan euclidean metric pada
persamaan 2.5:
Euclidean metric :
( )
=
=
N
i
i i Eucl
y x y x D
1
2
) , (
(2.5)
Menemukan Pusat Cluster dengan
metode Fuzzy C-Means
Untuk menemukan pusat
cluster dan anggota-anggota cluster
dengan menggunakan metode
Fuzzy C-Means (FCM), proses
diawali dengan menentukan jumlah
cluster yang akan dibentuk, batasan
error terkecil, fungsi objektif awal,
dan maksimum iterasi yang akan
dilakukan.
Pada iterasi pertama, pusat
cluster yang menandai lokasi rata-
rata untuk setiap cluster dan juga
derajat keanggotaan setiap data
training pada masing-masing cluster
ditentukan secara random / acak.
Derajat keanggotaan setiap data
pada masing-masing cluster
dijadikan sebagai elemen-elemen
matrik partisi. Pada awalnya, pusat
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : 2086 4981
VOL. 2 NO. 1 SEPTEMBER 2010
47
cluster yang terbentuk masih belum
akurat. Pusat cluster dan derajat
keanggotaan setiap titik data akan
diperbaiki secara berulang-ulang
sampai ditemukan pusat cluster
yang tepat. Perulangan akan terus
dilakukan selama selisih fungsi
objektif masih lebih besar dari batas
error terkecil yang telah ditetapkan
atau banyak iterasi masih kecil dari
maksimum iterasinya. Selisih fungsi
objektif diperoleh dari pengurangan
fungsi objektif terakhir dengan
fungsi objektif sebelumnya. Setelah
data menuju lokasi cluster yang
tepat maka proses pun berhenti.
Output yang diperoleh adalah
deretan pusat cluster dan derajat
keanggotaan untuk setiap data.
Berikut ini algoritma proses
clustering dengan metode FCM:
1. Diawal proses cluster tentukan
jumlah cluster, maksimum
iterasi, error terkecil, fungsi
objektif awal, iterasi awal.
2. Bangkitkan bilangan random
ik
, i
= 1,2,...,n; k=1,2,...,c; sebagai
elemen-elemen matrik partisi
awal U. Hitung jumlah setiap
kolom (atribut):
k
c
k
ij
1
ij
Q
=
=
dengan j = 1,2,...,m.
Hitung:
ij
ik
k
Q
=
i
new
3. Hitung pusat cluster ke-k : V
kj
,
dengan k= 1,2,...,c; dan j =
1,2,...,m
=
=
=
n
i
w
ik
n
i
ij
w
ik
kj
X
V
1
1
) (
) * ) ((
4. Hitung fungsi obyektif pada
iterasi ke-t, P
t
:
) ) ( * ] ) V X ( ([ P
i
2
1 1 1
t
w
k kj
n
i
c
k
m
j
ij
=
= = =
5. Hitung perubahan matriks partisi:
=
=
=
c
1 k
m
1 j
1 w
1
]
2
) V (X [
m
1 j
1 w
1
]
2
) V (X [
ik
kj ij
kj ij
Dengan i = 1,2,...,n; dan k =
1,2,...,c
6. Cek kondisi:
a. Jika ( | P
t
( P
t-1
)| < ) atau (
t > MaxIter ) maka proses
berhenti;
b. Jika tidak t = t +1, maka
ulangi langkah ke-4
Pengujian Tingkat Akurasi
Pengujian tingkat akurasi
yang dimaksud adalah untuk
menemukan persentase ketepatan
dalam proses pengklasifikasian
terhadap data testing yang diuji.
Tingkat akurasi dihitung dengan
menggunakan rumus:
% 100 *
tp
match
ac
=
Dimana:
ac = tingkat akurasi ( %)
E match = Jumlah klasifikasi yang
benar
E tp = Jumlah data testing
Pengujian Sistem Pembentuk
Kelas
Pengujian sistem pembentuk
kelas dilakukan untuk mengetahui
seberapa besar keberhasilan sistem
ini pada masing-masing metode.
Pengujian sistem pembentuk kelas,
dengan menggunakan data training
dan data testing. Tiap-tiap data
training akan diuji dengan setiap
data testing. Perlakuan sampel pada
sistem pembentuk kelas yang
digunakan pada fase training dan
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : 2086 4981
VOL. 2 NO. 1 SEPTEMBER 2010
48
fase testing untuk kelompok uji batik
tulis adalah seperti yang terlihat
pada Tabel 1:
Tabel 1. Sampel pada Kelompok Uji Batik Tulis
Kelompok
Uji
Indeks
training
ke-
Banyak
Sampel
Indeks
testing
ke-
Banyak
sampel
Kelompok
Batik Tulis
1 100 1 100
2 60 2 60
3 80 3 80
4 50
5 35
Dari ketiga sampel training
ini, masing-masing akan diujikan
pada kelima sampel testing.
Sehingga ada 15 kali perlakuan
yang akan diperkenalkan pada
sistem pembentuk kelas untuk
kelompok uji batik tulis. Adapun
output proses training dan testing
yang terbentuk dengan
menggunakan metode K-NN dapat
dilihat hasilnya pada Tabel 2:
Tabel 2. Hasil Pengujian Kualitas Batik Tulis dengan metode KNN
Percobaa
n ke-
Indeks
training
ke-
Indeks
Testing
ke-
K
terbaik
Jml
Sample
testing
Cocok Beda Akurasi
(%)
1 1 1 1 100 100 0 100
2 1 2 1 60 60 0 100
3 1 3 1 80 80 0 100
4 1 4 1 50 50 0 100
5 1 5 1 35 35 0 100
6 2 1 1 100 100 0 100
7 2 2 1 60 60 0 100
8 2 3 1 80 80 0 100
9 2 4 1 50 50 0 100
10 2 5 1 35 35 0 100
11 3 1 1 100 100 0 100
12 3 2 1 60 60 0 100
13 3 3 1 80 80 0 100
14 3 4 1 50 50 0 100
15 3 5 1 35 35 0 100
Dari tabel diatas terlihat
dengan menggunakan metode KNN,
tingkat akurasi yang diperoleh 100%.
Artinya, semua data testing yang
diujikan dapat diklasifikasikan
dengan benar. Sedangkan dengan
metode NCC tingkat akurasi yang
diperoleh rata-rata hanya sebesar
89% seperti yang terlihat dalam
Tabel 3. Dengan metode NCC,
ternyata tidak semua data dapat
diklasifikasikan secara tepat,
walaupun data testing yang
digunakan sama persis dengan data
trainingnya.
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : 2086 4981
VOL. 2 NO. 1 SEPTEMBER 2010
49
Tabel 3. Hasil Pengujian Kualitas Batik Tulis dengan metode NCC
Percobaan
ke
Indeks
training
Indeks
Testing
Banyak
cluster
Jml
Sample
testing
Cocok Beda Akurasi
(%)
1 1 1 3 100 92 8 92
2 1 2 3 60 54 6 90
Percobaan
ke
Indeks
training
Indeks
Testing
Banyak
cluster
Jml
Sample
testing
Cocok Beda Akurasi
(%)
3 1 3 3 80 64 16 80
4 1 4 3 50 46 4 92
5 1 5 3 35 30 5 85.7143
6 2 1 3 100 90 10 90
7 2 2 3 60 53 7 88.3333
8 2 3 3 80 59 21 73.75
9 2 4 3 50 44 6 88
10 2 5 3 35 30 5 85.7143
11 3 1 3 100 98 2 98
12 3 2 3 60 56 4 93.3333
13 3 3 3 80 73 7 91.25
14 3 4 3 50 48 2 96
15 3 5 3 35 32 3 91.4286
Pada ketiga kelompok uji
dengan 45 kali perlakuan, sistem
pembentuk kelas dengan metode
KNN berhasil membentuk kelas lebih
baik dibandingkan dengan metode
NCC. Rata-rata keberhasilan sistem
dalam mengklasifikasi dengan
metode KNN adalah 99.38%,
sedangkan dengan metode NCC
rata-ratanya sebesar 86.58%.
Pengujian Sistem Klasifikasi
Pengujian sistem klasifikasi
ini dilakukan untuk mengetahui
tingkat keberhasilan sistem dalam
melakukan identifikasi dan klasifikasi
terhadap objek query / data baru.
Pada pengujian sistem klasifikasi
jenis batik tulis ini digunakan 50
sampel data uji, dengan rincian
seperti yang terlihat pada Tabel 4.
Tabel 4. Data sampel jenis batik tulis yang akan diuji coba
Sampel
ke-
Jumlah
cecek
Tebal
canting
Kelas Data
1 8 0.1 Batik Tulis Halus
2 17 0.1 Batik Tulis Halus
3 15 0.2 Batik Tulis Halus
4 10 0.25 Batik Tulis Halus
5 20 0.25 Batik Tulis Halus
6 13 0.4 Batik Tulis Halus
7 15 0.7 Batik Tulis Halus
8 8 0.9 Batik Tulis Halus
9 20 0.9 Batik Tulis Halus
10 10 1 Batik Tulis Halus
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : 2086 4981
VOL. 2 NO. 1 SEPTEMBER 2010
50
11 13 1 Batik Tulis Halus
12 15 1.2 Batik Tulis Halus
13 10 1.3 Batik Tulis Halus
14 13 1.3 Batik Tulis Halus
15 1 1.3 Batik Tulis Kasar
16 20 1.35 Batik Tulis Halus
17 17 1.4 Batik Tulis Halus
Sampel
ke-
Jumlah
cecek
Tebal
canting
Hasil Klasifikasi
Sistem
18 5 1.4 Batik Tulis Sedang
19 1 1.4 Batik Tulis Kasar
20 4 1.4 Batik Tulis Kasar
21 12 1.5 Batik Tulis Halus
22 14 1.5 Batik Tulis Halus
23 17 1.5 Batik Tulis Halus
24 6 1.5 Batik Tulis Sedang
25 7 1.5 Batik Tulis Sedang
26 1 1.5 Batik Tulis Kasar
27 4 1.5 Batik Tulis Kasar
28 5 1.55 Batik Tulis Sedang
29 7 1.55 Batik Tulis Sedang
30 6 1.57 Batik Tulis Sedang
31 9 1.6 Batik Tulis Halus
32 18 1.6 Batik Tulis Halus
33 5 1.6 Batik Tulis Sedang
34 2 1.6 Batik Tulis Kasar
35 7 1.62 Batik Tulis Sedang
36 16 1.65 Batik Tulis Halus
37 12 1.7 Batik Tulis Halus
38 16 1.7 Batik Tulis Halus
39 2 1.7 Batik Tulis Kasar
40 3 1.7 Batik Tulis Kasar
41 4 1.7 Batik Tulis Kasar
42 1 1.8 Batik Tulis Kasar
43 2 1.8 Batik Tulis Kasar
44 3 1.8 Batik Tulis Kasar
45 4 1.8 Batik Tulis Kasar
46 2 1.85 Batik Tulis Kasar
47 3 1.85 Batik Tulis Kasar
48 1 2 Batik Tulis Kasar
49 2 2 Batik Tulis Kasar
50 3 2 Batik Tulis Kasar
Dari 50 sampel data uji yang
diujikan pada sistem klasifikasi
kualitas batik tulis dengan metode
KNN, semua sampel dapat
diklasifikasikan dengan baik dan
benar pada masing-masing
pengujian. Sedangkan dengan
metode NCC, dari 50 sampel data uji
yang diujikan ternyata tidak semua
data dapat diklasifikasikan dengan
benar. Pada pengujian ini diperoleh
sampel ke-1, 8, 13 dan 31
diklasifikasikan pada kelompok yang
berbeda, hal ini seperti yang terlihat
pada Tabel 5. Dari pengujian ini
tingkat akurasi yang diperoleh
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : 2086 4981
VOL. 2 NO. 1 SEPTEMBER 2010
51
dengan menggunakan metode NCC adalah sebesar 92%
.
Tabel 5. Hasil Klasifikasi yang salah dengan metode KNN
Sampel
ke-
Jumlah
cecek
Tebal
canting
Kelas Data
1 8 0.1 Batik Tulis Sedang
2 17 0.1 Batik Tulis Halus
3 15 0.2 Batik Tulis Halus
4 10 0.25 Batik Tulis Halus
5 20 0.25 Batik Tulis Halus
6 13 0.4 Batik Tulis Halus
7 15 0.7 Batik Tulis Halus
8 8 0.9 Batik Tulis Sedang
9 20 0.9 Batik Tulis Halus
10 10 1 Batik Tulis Halus
11 13 1 Batik Tulis Halus
12 15 1.2 Batik Tulis Halus
13 10 1.3 Batik Tulis Sedang
14 13 1.3 Batik Tulis Halus
15 1 1.3 Batik Tulis Kasar
16 20 1.35 Batik Tulis Halus
17 17 1.4 Batik Tulis Halus
18 5 1.4 Batik Tulis Sedang
19 1 1.4 Batik Tulis Kasar
20 4 1.4 Batik Tulis Kasar
21 12 1.5 Batik Tulis Halus
22 14 1.5 Batik Tulis Halus
23 17 1.5 Batik Tulis Halus
24 6 1.5 Batik Tulis Sedang
25 7 1.5 Batik Tulis Sedang
26 1 1.5 Batik Tulis Kasar
27 4 1.5 Batik Tulis Kasar
28 5 1.55 Batik Tulis Sedang
29 7 1.55 Batik Tulis Sedang
30 6 1.57 Batik Tulis Sedang
31 9 1.6 Batik Tulis Sedang
32 18 1.6 Batik Tulis Halus
33 5 1.6 Batik Tulis Sedang
34 2 1.6 Batik Tulis Kasar
35 7 1.62 Batik Tulis Sedang
36 16 1.65 Batik Tulis Halus
37 12 1.7 Batik Tulis Halus
38 16 1.7 Batik Tulis Halus
39 2 1.7 Batik Tulis Kasar
40 3 1.7 Batik Tulis Kasar
41 4 1.7 Batik Tulis Kasar
42 1 1.8 Batik Tulis Kasar
43 2 1.8 Batik Tulis Kasar
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : 2086 4981
VOL. 2 NO. 1 SEPTEMBER 2010
52
44 3 1.8 Batik Tulis Kasar
Sampel
ke-
Jumlah
cecek
Tebal
canting
Kelas Data
45 4 1.8 Batik Tulis Kasar
46 2 1.85 Batik Tulis Kasar
47 3 1.85 Batik Tulis Kasar
48 1 2 Batik Tulis Kasar
49 2 2 Batik Tulis Kasar
50 3 2 Batik Tulis Kasar
Pada ketiga kelompok uji
dengan 9 kali percobaan diatas,
sistem klasifikasi dengan metode
KNN berhasil mengklasifikasikan
sampel lebih baik dibandingkan
dengan metode NCC. Rata-rata
keberhasilan sistem dalam
mengklasifikasi dengan metode KNN
adalah 99.11%, sedangkan dengan
metode NCC rata-rata keberhasilan
sistem dalam mengklasifikasikan
adalah sebesar 86.44%.
KESIMPULAN
Berdasarkan pengujian yang
dilakukan, implementasi metode
KNN pada sistem pembentuk kelas
dan sistem klasifikasi memberikan
hasil yang lebih baik dibandingkan
dengan menggunakan metode NCC.
Pada sistem pembentuk kelas
menggunakan metode KNN, semua
data testing dapat dikembalikan
dengan benar, baik untuk data
testing yang sama persis dengan
data trainingnya maupun data
testing yang berbeda dengan data
testingnya. Tingkat akurasi yang
diperoleh dari 45 kali pengujian rata-
rata mencapai 99.38% .
Sedangkan pada sistem
pembentuk kelas menggunakan
metode NCC, baik untuk data testing
yang sama persis dengan data
training maupun data testing yang
berbeda dengan data training tingkat
akurasi yang diperoleh hanya
mencapai 87% untuk 45 kali
pengujian yang telah dilakukan.
Semakin banyak jumlah data
training yang diperkenalkan pada
sistem, maka kemampuan sistem
mengenali data testing semakin
baik. Hal ini dibuktikan pada
pengujian dengan kelompok uji kain
mori, dimana jumlah data training
yang diujikan mulai dari 350, 440
hingga 770 data. Rata-rata tingkat
akurasi hampir sama yaitu 99.98%
dengan menggunakan metode KNN
dan 99.97% dengan menggunakan
metode NCC.
Untuk sistem klasifikasi pada
ketiga kelompok uji dengan
menggunakan metode KNN, sistem
berhasil mengklasifikasikan 50
sampel dengan benar dibandingkan
dengan menggunakan metode NCC.
Rata-rata keberhasilan sistem
klasifikasi dengan menggunakan
metode KNN adalah 99.11%
sedangkan dengan metode NCC
keberhasilannya hanya mencapai
86.44%.
Dalam penelitian ini mungkin
masih ditemukan beberapa
kekurangan, dan masih dapat
dikembangkan lagi dengan metode
lainnya. Salah satunya penggunaan
metode distance metric yang lain
untuk mengukur kemiripan atau
kedekatan antara vektor fitur dapat
dicoba pada penelitian berikutnya.
Selain itu juga pada metode NCC,
untuk menemukan pusat cluster
dapat dipergunakan metode
clustering lainnya.
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : 2086 4981
VOL. 2 NO. 1 SEPTEMBER 2010
53
DAFTAR PUSTAKA
[1] Teknomo, K. K-Nearest
Neighbors Tutorial, Tersedia di
situs:
http://people.revoledu.com/kar
di/ tutorial/KNN .2006. [25 Juni
2008]
[2]. Kusumadewi, S. Aplikasi
Logika Fuzzy untuk
Pendukung Keputusan, Graha
Ilmu, Yogyakarta. 2002.
[3]. Schowengert, R.A.,
Multispectral Classification,
Arizona. 2003.