You are on page 1of 2

Materi II

Praktikum Data Mining
Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala
Dosen Pengasuh Dr. Taufik Fuadi Abidin, M.Tech Dr. Muhammad Subianto, M.Si
{tfa,subianto}@informatika.unsyiah.ac.id

PENDAHULUAN Praktikum ini berkaitan dengan penggunaan software data mining, Weka (http://www.cs.waikato.ac.nz/ml/weka/), penulisan data dalam format arff, dan pengklasifikasian menggunakan KNN. Tujuan dari praktikum ini adalah: a. Meningkatkan pemahaman mahasiswa terhadap software Weka. b. Mengetahui cara dan aturan pembentukan data dalam format arff. c. Melatih mahasiswa menyelesaikan menggunakan metode KNN. masalah-masalah klasifikasi sederhana

PRAKTIKUM 1. Pelajari training set dari data segmentation yang disimpan dalam file segmentchallenge.arff dalam direktori data dimana software Weka diinstal, sebagai contoh: /home/tfa/weka-3-6-8/data Buka file tersebut dengan menggunakan text editor (gedit, textpad atau vim) dan pelajari bagaimana data dalam format arff disusun. Perhatikan penjelasan di bagian atas file tersebut dan perhatikan pula bagian deklarasi seperti potongan pernyataan berikut: @relation segment @attribute region-centroid-col numeric @attribute region-centroid-row numeric @attribute region-pixel-count numeric @attribute short-line-density-5 numeric @attribute short-line-density-2 numeric : : @attribute hue-mean numeric @attribute class {brickface,sky,foliage,cement,window,path,grass} @data

Praktikum Data Mining © Dr. Taufik Fuadi Abidin, S.Si., M.Tech dan Dr. Muhammad Subianto, M.Si

1

Muhammad Subianto. untuk nilai k berapa metode KNN memberikan akurasi yang paling tinggi? Sebagai acuan. 2. Diskusi dengan asisten bila anda mengalami kesulitan dalam memahami praktikum tentang klasifikasi menggunakan KNN (lazy classifier) ini.- Praktikum Data Mining © Dr.. k=7. pelajari testing set data segmentation yang disimpan dalam file segment-test.. Taufik Fuadi Abidin. Lakukan proses klasifikasi menggunakan metode KNN untuk k=3. k=5..Perhatikan pula bagian @data dan bagaimana data disusun dibawahnya. . Lakukan analisa.arff dalam direktori yang sama. Diskusi dengan teman dan pahami maksudnya. Lakukan observasi dan lanjutkan proses klasifikasi (classify) menggunakan metode KNN (dalam software Weka disebut sebagai metode lazy). Setelah anda memahami bagaimana data dalam format arff disusun.arff dibuka. M.Happy Mining . k=9 dan k=11. berikut snapshot dari Weka setelah file segment-test. S..Si.Tech dan Dr. M.Si 2 .