Professional Documents
Culture Documents
Konsep Klasifikasi
• Klasifikasi merupakan suatu pekerjaan yang melakukan penilaian
terhadap suatu obyek data untuk masuk dalam suatu kelas tertentu
dari sejumlah kelas yang tersedia.
• Contoh aplikasi:
– Klasifikasi pengenalan jenis hewan spesies baru.
– Diagnosis penyakir pasien
– Pengenalan jenis bunga
– Pemeriksaan kualitas bunga kamboja (bahan teh)
– Absensi karyawan (dengan sidik jari, mata, wajah, tangan, dsb.)
2
Model
• Klasifikasi merupakan pekerjaan yang melakukan pelatihan/pembelajaran
terhadap fungsi target f yang memetakan setiap set atribut (fitur) x ke satu dari
sejumlah label kelas y yang tersedia.
– Akan menghasilkan suatu model yang kemudian disimpan sebagai memori.
Pembangunan
Model
Masukan Keluaran
Penerapan Model
Data Uji (x,?) Data Uji (x,y)
3
Algoritma Klasifikasi
• Dibagi menjadi dua macam: eager learner dan lazy learner.
• Eager learner
– Didesain untuk melakukan pembacaan/ pelatihan/ pembelajaran
pada data latih untuk dapat memetakan dengan benar setiap
vektor masukan ke label kelas keluarannya.
– Model (berupa bobot / sejumlah nilai kuantitas tertentu) disimpan
sebagai memori, sedangkan semua data latihnya dibuang.
– Prediksi dilakukan menggunakan model yang tersimpan, tidak
melibat data uji sama sekali
• Trade-off:
– Proses prediksi berjalan dengan cepat
– Proses pelatihan lama
• Contoh: Artificial Neural Network (ANN), Support Vector
Machine (SVM), Decision Tree, Bayesian, dan sebagainya.
4
Algoritma Klasifikasi
• Lazy learner
– Hanya sedikit melakukan pelatihan (bahkan tidak sama
sekali)
– Hanya menyimpan sebagian atau seluruh data latih,
kemudian menggunakan data latih tersebut ketika proses
prediksi.
• Trade-off
– Proses prediksi menjadi lama karena model harus
membaca kembali semua data latihnya untuk dapat
memberikan keluaran label kelas dengan benar pada data
uji yang diberikan.
– Proses pelatihan berjalan dengan cepat
• Contoh: K-Nearest Neighbor (K-NN), Fuzzy K-Nearest
Neighbor (FK-NN), Regresi Linear, dan sebagainya.
5
Pengukuran Kinerja Klasifikasi
• Kinerja prediksi suatu sistem tidak bisa bekerja 100% benar.
• Untuk sebuah sistem klasifikasi harus diukur kinerjanya.
– Menggunakan matrik confusion (confusion matrix).
• Matrik confusion: tabel yang mencatat hasil kerja klasifikasi
• Jumlah data dari masing-masing kelas yang diprediksi secara
benar adalah (f11 + f00), dan data yang diprediksi secara salah
adalah (f10 + f01)
• Pengukuran akhir: akurasi dan laju error
Kelas hasil prediksi (j)
fij C = confusionmat(group,grouphat)
Kelas = 1 Kelas = 0
Kelas Kelas = 1 f11 f10
asli (i) Kelas = 0 f01 f00
Jumlah data yang diprediksi secara benar f11 f 00
Akurasi
Jumlah prediksi yang dilakukan f11 f10 f 01 f 00
• Independensi yang kuat pada fitur adalah bahwa sebuah fitur pada
sebuah data tidak ada kaitannya dengan adanya atau tidak
adanya fitur yang lain dalam data yang sama.
7
Prosedur Keputusan Bayes
• Prosedur dan pengambilan keputusan
X --- semua data observasi menggunakan sensors dan instruments yang tersedia
x --- merupakan himpunan fitur yang dipilih dari komponen X, atau fungsi linier dari X.
w --- adalah inner belief/perception tentang subject dari kelas/group/kategori.
a --- adalah aksi/keputusan yang kita ambil untuk x.
Dari prosedur tersebut didapatkan definisi dari 3 ruang vektor sebagai berikut:
x d , w C , α α
selecting
control statistical risk/cost
Informative
sensors inference minimization
features
dan
Jika P(smurf | 2”) > P(troll | 2”) maka Height = 2” masuk kelas Smurf.
Dan sebaliknya.
Fase Data Training (Contoh 2)
• Jika fiturnya lebih dari satu, maka gunakan :
– Distribusi Normal multivariate (Data Kontinyu) :
Contoh :
Curvature Diameter Quality Control Result
2.95 6.63 Passed
2.53 7.79 Passed
3.57 5.65 Passed
3.57 5.45 Passed
3.16 4.46 Not passed
2.58 6.22 Not passed
2.16 3.52 Not passed
• Penyelesaian :
• Diketahui :
ω1 Kelas Salmon
ω2 Kelas Sea Bass
A1 Decide Input is Sea Bass
A2 Decide Input is Salmon
λ(A2 | ω2) = $2 dan λ(A1 | ω1) = $1
No Diameter Kelas
1 2.5 Pen
2 2.3 Pensil
3 2.7 Pen
4 1.6 Pen
5 1.1 Pensil
ω1 Kelas Pen
ω2 Kelas Pensil
A1 Decide Input is Pensil
A2 Decide Input is Pen
λ(A2 | ω2) = Rp 40000 dan λ(A1 | ω1) = Rp 15000