You are on page 1of 10

Tugas Personal ke – 4

Week 8 - Session 9

Answer these questions below and submit it before 4th personal assignment deadline.

1. Can we do ETL process manually?
2. Do we need special hardware or software in ETL process? Explain your answering,
please!
3. What do you know about star schema, snowflake schema and fact constellation schema,
explain each of them and figure out the example for each!
4. Snowflaking is normalized unnormalized star schema. Give explanation and
understanding for that term

5. Design TPS (Transactional Processing System) database design from figure star schema
above with UML class diagram or ERD (Entity Relationship Diagram)!
6. Change figure star schema above into snowflake schema!
7. Give explanation and example about multidimensional from figure star schema above!
8. Give explanation and example about roll up from figure star schema above!
9. Give explanation and example about drill down from figure star schema above!
10. Give explanation and example about slice and dice from figure star schema above!

ETL4ALL  IBM .Data Integrated Suite ETL  Talend . Kita bisa melakukan ETL secara manual tetapi akan membutuhkan waktu.SQL Server Integration Services  Oracle .Data Migrator  Pentaho . serat perangkat keras yang handal untuk menggabungkan data dari banyak sumber data ke dalam 1 tempat sementara.ANSWER: 1.Websphere DataStage(Formerly known as Ascential DataStage)  SAP .usaha. .Data Integration Studio  Oracle . Software khsusus yang biasa digunakan untuk ETL diantaranya :  Informatica .Warehouse Builder  AB Initio  Information Builders .Talend Open Studio  Expressor Software . 2.Expressor Semantic Data Integration System  Elixir .Cognos Data Manager (Formerly known as Cognos DecisionStream)  Microsoft .Transformation Manager  Group 1 Software (Sagent) .Power Center  IBM .Elixir Repertoire .DataFlow  Sybase . tetapi disarankan computer dengan kemampuan prosesor i5 keatas dengan ram yang mumpuni karena proses pengolahan data akan cukup memakan ram dan membutuhkan prosesor yang handal.DB2 Warehouse Edition  Pervasive . Kemudian kita hilangkan duplikasi data dan berbagai proses transform lainnya setelah itu kita masukkan kedalam data warehouse.Data Integrator  ETL Solutions Ltd. Namun saat ini sudah banyak aplikasi ETL secara otomatis bekerja di background process sehingga secara berkala akan melakukan ETL terhadap data warehouse.DT/Studio  IKAN .Data Integrator (Formerly known as Sunopsis Data Conductor)  SAS .Pentaho Data Integration  Embarcadero Technologies . Can we do ETL process manually? Bisa.BusinessObjects Data Integrator  IBM . Do we need special hardware or software in ETL process? Kita tidak memerlukan hardware khusus.

Fact Table Tabel fakta biasanya memiliki dua jenis kolom: Foreign key ke tabel dimensi dan mengukurnya yang berisi fakta numerik.  OpenSys – CloverETL  JEDOX  Apatar  Scriptella  Dan masih banyak lagi 3. namun paling umum digunakan saat ini dan direkomendasikan oleh Oracle. explain each of them and figure out the example for each! Gambar 1. . Bagian tengah bintang terdiri dari tabel fakta dan titik-titik bintang adalah tabel dimensi. Terlepas dari kenyataan bahwa skema bintang adalah arsitektur yang paling sederhana. Tabel fakta dapat berisi data fakta tentang detail atau tingkat gabungan. Biasanya tabel fakta dalam skema bintang berada dalam bentuk normal ketiga (3NF) sedangkan tabel dimensi dinormalisasi. snowflake schema and fact constellation schema. dengan titik-titik memancar dari sebuah pusat (Fact Table di tengah). Star Schema Arsitektur star schema adalah skema gudang data yang paling sederhana. Disebut Star Schema karena diagramnya menyerupai bintang. What do you know about star schema.

Tabel dimensi umumnya berukuran kecil maka tabel fakta.  Tidak seperti skema Star. Karakteristik utama dari Star Schema:  Struktur sederhana -> mudah untuk memahami skema  Great query effectives -> sejumlah kecil tabel untuk bergabung  Waktu loading yang relatif lama ke dalam tabel dimensi -> de-normalisasi. Mereka biasanya deskriptif. Jika dimensi tidak memiliki hierarki dan tingkat itu disebut flat dimension atau list. Gambar 2. data redundansi menyebabkan ukuran tabel bisa besar. Snowflake Schema Menurut Connolly dan Begg (2010:1229). nilai tekstual. snowflake adalah jenis dari star skema dimana tabel dimensinya tidak mengandung denormalisasi. tabel dimensi dalam skema snowflake dinormalisasi. Atribut dimensi membantu untuk menggambarkan nilai dimensi.  Beberapa tabel dimensi dalam skema Snowflake dinormalisasi. tabel dimensi item dalam skema bintang dinormalisasi dan dipecah menjadi dua tabel dimensi. yaitu tabel item dan pemasok. Misalnya.  Yang paling umum digunakan dalam implementasi data warehouse -> banyak didukung oleh sejumlah besar alat Business Intelligence.Tabel Dimensi Dimensi adalah struktur yang biasanya terdiri dari satu atau beberapa hierarki yang mengkategorikan data.  Normalisasi membagi data menjadi tabel tambahan. . Primary Key dari masing-masing tabel dimensi adalah bagian dari primary key komposit dari tabel fakta.

Arsitektur konstelasi fakta berisi banyak tabel fakta yang berbagi banyak tabel dimensi.000 records. Kelemahan utama dari skema konstelasi fakta adalah desain yang lebih rumit karena banyak varian untuk jenis agregasi tertentu harus dipertimbangkan dan dipilih. 4. Gambar 3. . Fact Constelation Schema Untuk setiap skema bintang memungkinkan kita untuk membangun skema konstelasi fakta (misalnya dengan membelah skema bintang asli menjadi lebih banyak skema bintang. Dalam dimensi produk realistis dengan 250. dan query sederhana ini harus mampu menampilkan hasilnya pada user interface dalam satu atau dua detik. Snowflaking is normalized unnormalized star schema. Give explanation and understanding for that term Menurut connolly dan Begg (2010:1229) snowflake merupakan variasi dari star skema dimana tabel dimensi diperbolehkan memiliki tabel dimensi. Kenapa dilakukan snowflaking yakni untuk dapat memahami lebih rinci dari fact table serta merincikan dari tabel dimensi menjadi tabel dimensi baru untuk merincikan tabel dibensi. Apalagi tabel dimensi masih besar. Snowflaking itu sendiri merupakan metode normalisasi. Jelas tabel kategori snowflaked akan tampil sangat baik jika user meminta hanya untuk nilai-nilai yang berbeda dari kategori tanpa tambahan. masing-masing menggambarkan fakta pada hierarki dimensi tingkat lain). Snowflaking juga membuat browsing antara dimensi atribut menjadi lambat. tetapi jika user membatasi pada jenis paket pada saat yang sama. query ini bisa berjalan selama beberapa menit pada sistem basis data relasional terkenal. maka query harus menggabungkan kembali tabel kategori snowflaked melalui dimensi produk dan mungkin keluar melalui link lain ke snowflake yang mungkin akan menimbulkan kendala.

Snowflake Schema .5. Change figure star schema above into snowflake schema! Gambar 5. Design TPS (Transactional Processing System) database design from figure star schema above with UML class diagram or ERD (Entity Relationship Diagram)! Gambar 4. ERD 6.

Give explanation and example about roll up from figure star schema above! Gambar 6. Sebagai contoh. atau (4) beberapa dimensi tambahan.7. Contoh multi dimensional . 8. Give explanation and example about multidimensional from figure star schema above! Multidimensional database atau sering disebut dengan cube adalah sebuah bentuk database dimana data disimpan dalam bentuk Cell. Jumlah Dimension ini secara teori bisa tidak terbatas."penjualan" bisa dilihat dengan dimensi (1) model produk. (3) waktu. tidak perlu terkuantifikasi untuk membentuk sebuah bangun 3 dimensi berupa cube. (2)geografi. dan posisi dari sel-sel tersebut ditentukan oleh beberapa variabel yang disebut dengan Dimension. Istilah Cube dan penggambaran dalam bentuk cube (3 dimensi) ini dimaksud untuk mempermudah visualisasi kita tentang sifat multi dimensionalnya.

Data Agregrated merupakan data praperhitungan (precalculated) dalam bentuk rangkuman data (data summarized) sehingga query pada kubus (cube) lebih cepat. . Sedangkan dicing memberikan kemampuan untuk melihat pemilihan data pada dua dimensi atau lebih. Jadi drill dwon menavigasikan dari data rinci yang sedikit hingga yang lebih detil. hal ini dapat dilakukan dengan menuruni hierarki untuk sebuah dimensi atau memperkenalkan dimensi tambahan. 10. Dengan slicing dan dicing pengguna dapat melihat data dari beberapa perspektif.9. 2006). misalnya untuk setiap propinsi dapat diberikan total penjualan. Yaitu dengan merotasi cube pada perspektif yang lain sehingga pengguna dapat melihat lebih spesifik terhadap data yang dianalisa. Give explanation and example about drill down from figure star schema above! Drill down sendiri memandu pengguna untuk memperoleh data yang lebih detail (Kamber. Give explanation and example about slice and dice from figure star schema above! Slicing dan dicing adalah operasi untuk melihat data sebagai visualisasi dari kubus. Slicing memotong kubus sehingga dapat memfokuskan pada perspektif yang spesifik (pada suatu dimensi). Penambahan sebuah dimensi baru berarti tabel fact pasti berisikan (atau ditambahkan) data di dalam dimensi tersebut. maka total penjualan tiap kota dapat di-drill down. Pengguna dapat mengekstrak bagian dari data agregrated dan dapat memeriksa dengan detail berdasarkan dimensi-dimensi yang diinginkan.

Slice .Gambar 7. Roll up. Drill Down.

Implementasi and Management. Thomas M.Begg. United States of America https://www. John Wiley & sons Inc.htm . Dicing. P. and Carolyn E. (2007).tutorialspoint. United States of America Wil M. van der Aalst (2013). Third Edition. Raphl and Margy Ross. (2005). Rolling Up and Drilling Down Event Data for Process Mining (Asia Pacific Business Process Management) Connolly. The Data Warehouse Toolkit. Process Cubes: Slicing. Database system A Practical Approach. Fourth Edition.com/dwh/dwh_schemas.Source: Kimbal. Addison – Wesley Publishing Company.