You are on page 1of 6
wer FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM PROGRAM STUDI JLMU KOMPUTER UJIAN TENGAH SEMESTER II 2009/2010 Mata kuliah, : Data Warehousing dan Data Mining Sifat Ujian : Buku Tertutup Waktu 100 menit Penguji Edi Winarko, PhD Pelaksanaan Kamis,15 April2010 BAGIAN I Ly Baca soal di bawah ini sebaik-baiknya. Jawablah dengan jawaban-jawaban singkat. 1. Data warehouse sering kali menggunakan arsitektur three-tier architecture, Sebutkan ketiga tier (lapisan) tersebut. Sebutkan 3 jenis OLAP server. Sebutkan 4 operasi dalam OLAP. 4. Sebutkan 5 aktifitas dari proses penemuan pengetahuan (knowledge discovery process). Bagian I 1, Soal ini akan menggunakan tabel 1, yang memiliki 14 record dan 5 atribut (age, income, Sebutkan 3 ukuran (measure of impurity) yang digunakan dalam proses Klasifikasi. student, eredit rating, buys computer). Setiap record menyatakan data dati seorang pelanggan di suatu tok komputer. Atribut b's computer adalah atribut klas yang. memiliki 2 nilai, yaitu no dan yes. -PeG Ky Tabel 1. Data pelanggan toko elektronik [RD age | income | student | eredit rating | buys | i | | computer youth high no__| fair no ¢ ‘outh high no __| excellent noo | middle aged | high [no _| fair yes e senior | medium fair vyes~ senior low ye senior low “yes | excellent 3 7 Tmiddle_aged Tow jes excelent yes outh medium fa <.n00 __low fair. | Ges) 10 [senior medium, fair. Gey | i ‘outh medium cell yes) 12__| middle aged | medium excellent |X yes” (_13 | middle aged high fair Ges (44 _senior | _ medium no | excellent no * aT 8 ne we ey ch € Hitung Gini untuk atribut student dan income, jika ramus Gini seperti di bawah ini. Gini = Gini(p)- (Gini an 2, Tabel 2 berisi data yang terdiri dari 10 transaksi, dimana masing-masing transaksi berisi beberapa item. Menggunakan data dari tabel tersebut, jawab pertanyaan-pertanyaan berikut ini a. Jika diketahui minimum support 40%, tentukan semua frequent itemset menggunakan algoritma APRIORI. Tunjukkan dengan jelas tahap JOIN dan PRUNING ketika men- generate candidate. of b. Tentukan association rule yang dihasilkan oleh Fs (himpunan semua frequent 3-itemset) pada soal (a) jika nilai imum confidencenya 80%, earaueune Be Fee Le 3 FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM. PROGRAM STUDI ILMU KOMPUTER UJIAN TENGAH SEMESTER I 2011/2012 Mata kulish + Data Mining dan Business Intelligence Sifat Ujian Buku Terbuka Waktu 100 menit Penguij Edi Winarko, PhD Pelaksanaan 3 Senin, 31 Oktober 2011 1. Gambar | menggambarkan hubungan antara 5 tabel dalam basisdata pemesanan barang. Primary key dari setiap tabel ditandai dengan atribut yang dicetak tebal. ay. Gambar 1. Hubungan antar tabel dalam basisdata pemesanan barang a, Buat rancangan datawarchouse dengan skema star menggunakan database di atas sebagai sumber datanya, Tentukan atribut measure dan atribut dimensi yang anda gunakan dalam data warehouse. Rancangan datawarchouse anda minimal haus memuat 4 dimensi dan ‘minimal 2 diantaranya harus memiliki hirarki. '. Tunjukkan satu jenis laporan yang melibatkan 3 dimensi dimana salah satunya adalah dimensi yang memiliki hirarki, Jelaskan apa yang terjadi jika dilakukan operasi drill down tethadap laporan tersebut. 2, Soal ini menggunakan tabel 1 yang memuat data 8 orang pasien, dimana setiap data memiliki 4 atribut (usia, berat badan, jenis kelamin, dan hipertensi). Atribut Hipertensi adalah atribut klas yang memiliki 2 nilai, yaitu Ya dan Tidak. Tabel 1. Data 8 orang Pasien jama isla [Berat Badan [Tenis Kelamin _ [Mlipertensi Andi fuda_V [Overweight ¥~[Pria | Vv ‘a afar, iuda_W [Underweight [Pria (Tidak [Anni [Muda ——|Average —— —fridak Budi_[Twa Overweight Y[Pria_YfTidak. filman [Tua Overweight V [Pria Iya Didi [Muda [Underweight —[Pria [Tidak Rina Tua ~—=lOverweight—v— Wanita ya [Farhan [Tua [Average ria [Tidak a. Hitung nilai misclassification error atribut usia, berat badan dan jenis kelamin, jika rumus misclassification error seperti di bawah ini Y Marror(i b, Jika berdasarkan pethitungan nilai misclassification error diasumsikan urutan atribut yang terpili adalah berat badan, kemudian jenis kelamin, dan usia, tunjukkan decision tree yang dihasilkan, 3. Tabel 2 berisi 4 data pasien yang akan digunakan untuk melakukan Klasifikasi menggunakan algoritma k-NN (K-nearest neighbor). Dengan mengambil nilai k = 1, tentukan apakah pasien bernama Gayus yang usianya Tua, berat badan Average, dan tentu saja berjenis kelamin Pria diprediksi menderita hipertensi atau tidak. Untuk soal ini diasumsikan atribut usia dan jenis kelamin adalah atribut nominal bernilai biner, dan atribut berat badan adalah atribut nominal. Sebutkan dengan jelas similarity measure yang anda gunakan. abel 2. Data Pasien Nama isia___[Berat Badan _[Jenis Kelamin _[Hipertensi [Andi fuda. rerweight _[Pria a lafar iuda [Underweight [Pria fTidak [Anni fuda__ [Average Wanita [Tidak (Hitman [Tua [Overweight [Pria a Gaye Tuo Average, Pree 2 Gerat et ur A ° 1 V A P w FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM & UJIAN TENGAH SEMESTER II TAHUN AJARAN 2008/2009 UNIVERSITAS GADJAH MADA. Mata kuliah Data Warehousing dan Data Mining Sifat Ujian Buku Tertutup Waktu 100 menit Penguji Edi Winarko, PhD Pelaksanaan Senin, 20 April 2009 BAGIANI Baca soal di bawah ini sebaik-baiknya, Jawablah dengan jawaban-jawaban singkat. 1. Sebutkan sifat-sifat dari data warehouse menurut Inmon. 2. Data warehouse sering kali menggunakan arsitektur shree-tier architecture. Sebutkan ketiga tier (lapisan) tersebut. 3. Sebutkan jenis-jenis OLAP server. 4. Sebutkan 4 operasi dalam OLAP, 5. Sebutkan 4 jenis transformasi, = ¢ie\ ol fel/4eng elo! Sor 6. Sebutkan 5 aktifitas dari proses penemuan pengetahuan (knowledge discovery process). 7. Sebutkan jenis-jenis metode ekstraksi. Hale €5; 4 jy ap-cmorn 8. Sebutkan tipe-tipe atribut yang sering ditemukan dalam proses klasifikasi, 9. Sebutkan 3 ukuran (measure of impurity) yang digunakan dalam proses klasifikasi. 10, Sebutkan jenis-jenis tabel dalam data warehouse, Fact ¢ ener § 12% Bagian I 1, Soal ini akan menggunakan tabel 1, yang memiliki 14 record dan 5 atribut (age, income, student, credit rating, buys computer). Setiap record menyatakan data dari seorang pelanggan di suatu toko komputer. Atribut buys computer adalah atribut klas yang Tabel 1. Data pelanggan toko elektronik RD age income | student | credit rating | buys = computer i ‘youth Thigh no | fair no. 2 /outh high no | excellent no. 3_[middle aged [high no | fair yes 4 senior medium no | fair yes 5 senior low [yes | fair [yes 6 senior low yes no 7 middle aged low yes es 8 /outh ‘medium no no 9 youth low es yes 10 senior medium es yes: 1 outh medium | yes | excellent ~yes 12 | middle aged | medium ‘no | excellent “yes 13 | middie aged | high es | fair yes 14 senior medium. no excellent no Hitung Information Gain untuk atribut age dan income. Suatu data warehouse memuat 4 dimensi (date, spectator, location, game), dan 2 measure (count, charge). Charge adalah biaya tiket yang harus dibayar oleh penonton (spectator) ketika melihat suatu pertandingan (game) pada suatu waktu (date). Penonton (spectator) bisa anak-anak, orang dewasa, atau orang tua. Harga tiket untuk setiap jenis penonton berbeda-beda. Gambarkan diagram dari skema star dari data warehouse terscbut.

You might also like