wer
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
PROGRAM STUDI JLMU KOMPUTER
UJIAN TENGAH SEMESTER II 2009/2010
Mata kuliah,
: Data Warehousing dan Data Mining
Sifat Ujian : Buku Tertutup
Waktu 100 menit
Penguji Edi Winarko, PhD
Pelaksanaan Kamis,15 April2010
BAGIAN I Ly
Baca soal di bawah ini sebaik-baiknya. Jawablah dengan jawaban-jawaban singkat.
1. Data warehouse sering kali menggunakan arsitektur three-tier architecture, Sebutkan ketiga
tier (lapisan) tersebut.
Sebutkan 3 jenis OLAP server.
Sebutkan 4 operasi dalam OLAP.
4. Sebutkan 5 aktifitas dari proses penemuan pengetahuan (knowledge discovery process).
Bagian I
1, Soal ini akan menggunakan tabel 1, yang memiliki 14 record dan 5 atribut (age, income,
Sebutkan 3 ukuran (measure of impurity) yang digunakan dalam proses Klasifikasi.
student, eredit rating, buys computer). Setiap record menyatakan data dati seorang
pelanggan di suatu tok komputer. Atribut b's computer adalah atribut klas yang.
memiliki 2 nilai, yaitu no dan yes. -PeG Ky
Tabel 1. Data pelanggan toko elektronik
[RD age | income | student | eredit rating | buys
| i | | computer
youth high no__| fair no ¢
‘outh high no __| excellent noo |
middle aged | high [no _| fair yes e
senior | medium fair vyes~
senior low ye
senior low “yes | excellent 3 7
Tmiddle_aged Tow jes excelent yes
outh medium fa <.n00
__low fair. | Ges)
10 [senior medium, fair. Gey |
i ‘outh medium cell yes)
12__| middle aged | medium excellent |X yes”
(_13 | middle aged high fair Ges
(44 _senior | _ medium no | excellent no *aT 8 ne
we ey ch €
Hitung Gini untuk atribut student dan income, jika ramus Gini seperti di bawah ini.
Gini = Gini(p)- (Gini
an
2, Tabel 2 berisi data yang terdiri dari 10 transaksi, dimana masing-masing transaksi berisi
beberapa item. Menggunakan data dari tabel tersebut, jawab pertanyaan-pertanyaan berikut
ini
a. Jika diketahui minimum support 40%, tentukan semua frequent itemset menggunakan
algoritma APRIORI. Tunjukkan dengan jelas tahap JOIN dan PRUNING ketika men-
generate candidate.
of b. Tentukan association rule yang dihasilkan oleh Fs (himpunan semua frequent 3-itemset)
pada soal (a) jika nilai
imum confidencenya 80%,
earaueune
Be
Fee
Le
3FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM.
PROGRAM STUDI ILMU KOMPUTER
UJIAN TENGAH SEMESTER I 2011/2012
Mata kulish + Data Mining dan Business Intelligence
Sifat Ujian Buku Terbuka
Waktu 100 menit
Penguij Edi Winarko, PhD
Pelaksanaan 3 Senin, 31 Oktober 2011
1. Gambar | menggambarkan hubungan antara 5 tabel dalam basisdata pemesanan barang.
Primary key dari setiap tabel ditandai dengan atribut yang dicetak tebal.
ay.
Gambar 1. Hubungan antar tabel dalam basisdata pemesanan barang
a, Buat rancangan datawarchouse dengan skema star menggunakan database di atas sebagai
sumber datanya, Tentukan atribut measure dan atribut dimensi yang anda gunakan dalam
data warehouse. Rancangan datawarchouse anda minimal haus memuat 4 dimensi dan
‘minimal 2 diantaranya harus memiliki hirarki.
'. Tunjukkan satu jenis laporan yang melibatkan 3 dimensi dimana salah satunya adalah
dimensi yang memiliki hirarki, Jelaskan apa yang terjadi jika dilakukan operasi drill down
tethadap laporan tersebut.2, Soal ini menggunakan tabel 1 yang memuat data 8 orang pasien, dimana setiap data
memiliki 4 atribut (usia, berat badan, jenis kelamin, dan hipertensi). Atribut Hipertensi
adalah atribut klas yang memiliki 2 nilai, yaitu Ya dan Tidak.
Tabel 1. Data 8 orang Pasien
jama isla [Berat Badan [Tenis Kelamin _ [Mlipertensi
Andi fuda_V [Overweight ¥~[Pria | Vv ‘a
afar, iuda_W [Underweight [Pria (Tidak
[Anni [Muda ——|Average —— —fridak
Budi_[Twa Overweight Y[Pria_YfTidak.
filman [Tua Overweight V [Pria Iya
Didi [Muda [Underweight —[Pria [Tidak
Rina Tua ~—=lOverweight—v— Wanita ya
[Farhan [Tua [Average ria [Tidak
a. Hitung nilai misclassification error atribut usia, berat badan dan jenis kelamin, jika
rumus misclassification error seperti di bawah ini
Y Marror(i
b, Jika berdasarkan pethitungan nilai misclassification error diasumsikan urutan atribut yang
terpili adalah berat badan, kemudian jenis kelamin, dan usia, tunjukkan decision tree
yang dihasilkan,
3. Tabel 2 berisi 4 data pasien yang akan digunakan untuk melakukan Klasifikasi menggunakan
algoritma k-NN (K-nearest neighbor). Dengan mengambil nilai k = 1, tentukan apakah
pasien bernama Gayus yang usianya Tua, berat badan Average, dan tentu saja berjenis
kelamin Pria diprediksi menderita hipertensi atau tidak. Untuk soal ini diasumsikan atribut
usia dan jenis kelamin adalah atribut nominal bernilai biner, dan atribut berat badan adalah
atribut nominal. Sebutkan dengan jelas similarity measure yang anda gunakan.
abel 2. Data Pasien
Nama isia___[Berat Badan _[Jenis Kelamin _[Hipertensi
[Andi fuda. rerweight _[Pria a
lafar iuda [Underweight [Pria fTidak
[Anni fuda__ [Average Wanita [Tidak
(Hitman [Tua [Overweight [Pria a
Gaye Tuo Average, Pree 2
Gerat
et
ur A °
1 V A
P wFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
& UJIAN TENGAH SEMESTER II TAHUN AJARAN 2008/2009
UNIVERSITAS GADJAH MADA.
Mata kuliah Data Warehousing dan Data Mining
Sifat Ujian Buku Tertutup
Waktu 100 menit
Penguji Edi Winarko, PhD
Pelaksanaan Senin, 20 April 2009
BAGIANI
Baca soal di bawah ini sebaik-baiknya, Jawablah dengan jawaban-jawaban singkat.
1. Sebutkan sifat-sifat dari data warehouse menurut Inmon.
2. Data warehouse sering kali menggunakan arsitektur shree-tier architecture. Sebutkan ketiga
tier (lapisan) tersebut.
3. Sebutkan jenis-jenis OLAP server.
4. Sebutkan 4 operasi dalam OLAP,
5. Sebutkan 4 jenis transformasi, = ¢ie\ ol fel/4eng elo! Sor
6. Sebutkan 5 aktifitas dari proses penemuan pengetahuan (knowledge discovery process).
7. Sebutkan jenis-jenis metode ekstraksi. Hale €5; 4 jy ap-cmorn
8. Sebutkan tipe-tipe atribut yang sering ditemukan dalam proses klasifikasi,
9. Sebutkan 3 ukuran (measure of impurity) yang digunakan dalam proses klasifikasi.
10, Sebutkan jenis-jenis tabel dalam data warehouse, Fact ¢ ener § 12%
Bagian I
1, Soal ini akan menggunakan tabel 1, yang memiliki 14 record dan 5 atribut (age, income,
student, credit rating, buys computer). Setiap record menyatakan data dari seorang
pelanggan di suatu toko komputer. Atribut buys computer adalah atribut klas yang
Tabel 1. Data pelanggan toko elektronik
RD age income | student | credit rating | buys
= computer
i ‘youth Thigh no | fair no.
2 /outh high no | excellent no.
3_[middle aged [high no | fair yes4 senior medium no | fair yes
5 senior low [yes | fair [yes
6 senior low yes no
7 middle aged low yes es
8 /outh ‘medium no no
9 youth low es yes
10 senior medium es yes:
1 outh medium | yes | excellent ~yes
12 | middle aged | medium ‘no | excellent “yes
13 | middie aged | high es | fair yes
14 senior medium. no excellent no
Hitung Information Gain untuk atribut age dan income.
Suatu data warehouse memuat 4 dimensi (date, spectator, location, game), dan 2 measure
(count, charge). Charge adalah biaya tiket yang harus dibayar oleh penonton (spectator)
ketika melihat suatu pertandingan (game) pada suatu waktu (date). Penonton (spectator)
bisa anak-anak, orang dewasa, atau orang tua. Harga tiket untuk setiap jenis penonton
berbeda-beda.
Gambarkan diagram dari skema star dari data warehouse terscbut.