Welcome to Scribd, the world's digital library. Read, publish, and share books and documents. See more
Download
Standard view
Full view
of .
Save to My Library
Look up keyword
Like this
62Activity
0 of .
Results for:
No results containing your search query
P. 1
Metode Algoritma KNN

Metode Algoritma KNN

Ratings: (0)|Views: 3,951 |Likes:
Published by komank artha

More info:

Published by: komank artha on Jun 06, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

07/02/2014

pdf

text

original

 
DATA MININGMETODE
CLASIFIKATION 
K-NEARST NEIGHBOR (KNN)
Oleh :I.G.A Oka Widiarsana0804505009Wandana Narayana Putra 0804505010I Gede Putra Budiyasa 0804505034I Nyoman Agi Bismantara M 0804505035 Nyoman Sarasuartha Mahajaya 0804505036
JURUSAN TEKNIK ELEKTROPROGRAM STUDY TEKNOLOGI INFORMASIFAKULTAS TEKNIK UNIVERSITAS UDAYANA2011
 
Algoritma K-Nearst Neighbor
Algoritma
k-nearest neighbo
(KNN) adalah sebuah metode untumelakukanklasifikasiterhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. KNN termasuk algoritma
 supervised learning 
dimana hasil dari
query instance
yang baru diklasifikan berdasarkanmayoritas dari kategori pada KNN. Nanti kelas yang paling banyak muncullahyang akan menjadi kelas hasil klasifikasi.Tujuan dari algoritma ini adalah mengklasifikasikan obyek baru bedasarkan atribut dan
training sample
.
Classifier 
tidak menggunakan modelapapun untuk dicocokkan dan hanya berdasarkan pada memori. Diberikan titik 
query,
akan ditemukan sejumlah
obyek atau (titik 
training 
) yang paling dekatdengan titik 
query
. Klasifikasi menggunakan
voting 
terbanyak diantara klasifikasidari k obyek.. algoritma
k-nearest neighbor 
(KNN) menggunakan klasifikasiketetanggaan sebagai nilai prediksi dari
query instance
yang baru.Algoritma metode
k-nearest neighbor 
(KNN) sangatlah sederhana, bekerja berdasarkan jarak terpendek dari
query instance
ke
training sample
untuk menentukan KNN-nya.
Training sample
diproyeksikan ke ruang berdimensi banyak, dimana masing-masing dimensi merepresentasikan fitur dari data. Ruangini dibagi menjadi bagian-bagian berdasarkan klasifikasi
training sample
. Sebuahtitik pada ruang ini ditandai kelas
c
jika kelas
c
merupakan klasifikasi yang paling banyak ditemui pada
buah tetangga terdekat dari titik tersebut. Dekat atau jauhnya tetangga biasanya dihitung berdasarkan
 Euclidean Distance
.Jarak Euclidean paling sering digunakan menghitung jarak. Jaraeuclidean berfungsi menguji ukuran yang bisa digunakan sebagai interpretasikedekatan jarak antara dua obyek. yang direpresentasikan sebagai berikut :Da,b =k=1d(Xk-Yk)2X
1
=[X
1
, X
2
, .....X
 p
] dan Y
1
=[Y
1
, Y
2
, .....Y
 p
]AdalahD
2(x,y)
= (X
1
– Y
1
)
2
+ (X
2
– Y
2
)
2
+ ....... + (X
 p
– Y
 p
)
2
= (X – Y) (X – Y) = (Y – X) (Y – X)
 
dimana matriks
 D(a,b)
adalah jarak skalar dari kedua vektor 
a
dan
b
darimatriks dengan ukuran
dimensi.Semakin besar nilai D akan semakin jauh tingkat keserupaan antara keduaindividu dan sebaliknya jika nilai D semakin kecil maka akan semakin dekattingkat keserupaan antar individu tersebut. Nilai
yang terbaik untuk algoritma ini tergantung pada data. Secaraumum, nilai
yang tinggi akan mengurangi efek 
noise
pada klasifikasi, tetapimembuat batasan antara setiap klasifikasi menjadi semakin kabur. Nilai
yang bagus dapat dipilih dengan optimasi parameter, misalnya dengan menggunakan
cross-validation
. Kasus khusus dimana klasifikasi diprediksikan berdasarkan
training data
yang paling dekat (dengan kata lain,
k = 1
) disebut algoritma
nearest neighbor 
.Ketepatan algoritma KNN
 
sangat dipengaruhi oleh ada atau tidaknyafitur-fitur yang tidak relevan atau jika bobot fitur tersebut tidak setara denganrelevansinya terhadap klasifikasi. Riset terhadap algoritma ini sebagian besar membahas bagaimana memilih dan memberi bobot terhadap fitur agar performaklasifikasi menjadi lebih baik.Langkah-langkah untuk menghitung metode K-Nearest Neighbor :1.Menentukan parameter K (jumlah tetangga paling dekat).2.Menghitung kuadrat jarak euclid (query instance) masing–masin obyek terhadap data sampel yang diberikan.3.Kemudian mengurutkan objek–bjck tersebut kedalam kelompok yangmempunyai jarak euclid terkecil.4.Mengumpulkan kategori Y (Klasifikasi nearest neighbor)5.Dengan menggunakan kategori nearest neighbor yang paling mayoritasmaka dapat dipredisikan nilai query instance yang telah dihitung.
Contoh Data :

Activity (62)

You've already reviewed this. Edit your review.
BaihaQy KaYzan liked this
1 thousand reads
1 hundred reads
Aprie Ajach liked this
Black Donald liked this
Ody Nurdiawan liked this
M Nafi Uddin liked this
Dwi Rochma added this note
Ngebantu banget :D

You're Reading a Free Preview

Download
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->