You are on page 1of 2

TUGAS 1 Maksimum nilai: 100 Sifat: Kelompok (dengan anggota sama dengan untuk Studi Kasus).

Tujuan: untuk mempelajari lebih dalam tentang fungsi data mining dengan melakukan uji coba terhadap data mining tools. Deskripsi Tugas: Frequent Itemsets
1. Unduh implementasi algoritma apriori yang ada di: http://www.borgelt.net/apriori.html 2. Unduh implementasi algoritma eclat yang ada di: http://www.borgelt.net/eclat.html 3. Unduh implementasi algoritma fpgrowth yang ada di: http://www.borgelt.net/fpgrowth.html 4. Unduh implementasi algoritma IsTa yang ada di: http://www.borgelt.net/ista.html 5. Unduh implementasi algoritma RElim yang ada di: http://www.borgelt.net/relim.html 6. Unduh implementasi algoritma SaM yang ada di: http://www.borgelt.net/sam.html 7. Unduh data untuk ujicoba dari: http://fimi.cs.helsinki.fi/data/ Data yang termasuk kategori dense: connect, mushroom dan chess Data yang termasuk kategori sparse: T10I4D100K, T40I10D100K, dan retail 8. Untuk masing-masing dataset yang masuk dalam kategori dense, uji coba seluruh algoritma di atas untuk support level (dalam %) : 90, 80, 70, 60, 50 9. Untuk masing-masing dataset yang masuk dalam kategori sparse, uji coba seluruh algoritma di atas untuk support level (dalam %) : 0.5, 0.4, 0.3, 0.2, 0.1 10. Catat berapa frequent pattern/itemsets yang dihasilkan serta waktu pemrosesan untuk masingmasing parameter 11. Berikan analisis terhadap kinerja program terkait dengan level support dan karakteristik data. Association Rules 12. Dari ketiga algoritma di atas, yang dapat digunakan untuk menghasilkan association rules adalah apriori 13. Pada level support 75%, ujilah program dengan level confidence (dalam %): 80, 70, 60 untuk mushroom, chess dan connect. 14. Pada level support 0.4%, ujilah program dengan level confidence (dalam %): 40, 30, 20 untuk retail, T10I4D100K dan T40I10D100K l 15. Catat berapa association rules yang dihasilkan serta waktu pemrosesan untuk masing-masing parameter 16. Berikan analisis Anda terhadap kinerja program terkait dengan level support dan karakteristik data. Catatan: untuk mengerjakan tugas lab ini, akan lebih mudah jika Anda kembali ke masa lalu, yaitu masa menggunakan DOS. Untuk pencatatan waktu proses, pastikan bahwa Anda tidak menjalankan program/aplikasi lain selain algoritma data mining. Penalti akan diberikan untuk tindakan plagiarisme. Selamat Bekerja.

TUGAS 2 Maksimum nilai: 100 Sifat: Kelompok (dengan anggota sama dengan untuk Studi Kasus). Tujuan: untuk mempelajari lebih dalam tentang fungsi data mining dengan melakukan uji coba terhadap data mining tools. Deskripsi Tugas: Dataset
1. Unduh DataSetLab2.zip dari SCELE yang berisi data uji coba. Data tersebut merupakan sebagian koleksi dataset dari UCI Machine Learning Repository (http://archive.ics.uci.edu/ml/datasets.html). DataSetLab2.zip berisi 17 dataset untuk ujicoba algoritma klasifikasi. 2. Lihat heart.data dan heart.names. Jelaskan isi dari berkas dengan ekstension data dan names dengan menggunakan dataset heart sebagai contoh. Uraikan kelas dan atribut yang ada di dalam berkas.

Unduh Implementasi Algoritma Klasifikasi C5.0 3. Unduh implementasi algoritma C5.0 (Demo) di: http://www.rulequest.com/download.html 4. Install C5.0 di komputer Anda. Versi demo ini hanya bisa menangani data kecil (maksimal 400 kasus).
Unduh Data Mining Tool WEKA 5. Unduh Data Mining Tool WEKA yang ada di: http://www.cs.waikato.ac.nz/ml/weka/ 6. Install dan jalankan WEKA. Pilih Explorer. Pilih 10 dari 17 dataset di atas untuk mengujicoba algoritma klasifikasi C5.0, J48 (dari WEKA), NaiveBayes (dari WEKA), dan Multilayer Perceptron (dari WEKA). Bandingkan tingkat akurasi masing-masing algoritma. Algoritma mana yang lebih baik? Penalti akan diberikan untuk tindakan plagiarisme. Selamat Bekerja.

You might also like