Data Warehouse, Data Mart, Raw Data dan Meta Data

1. Data Warehouse  Data warehouse adalah basis data yang menyimpan data sekarang dan data masa lalu yang berasal dari berbagai sistem operasional dan sumber yang lain (sumber eksternal) yang menjadi perhatian penting bagi manajemen dalam organisasi dan ditujukan untuk keperluan analisis dan pelaporan manajemen dalam rangka pengambilan keputusan  Data warehouse digunakan untuk mendukung pengambilan keputusan, bukan untuk melaksanakan pemrosesan transaksi  Data warehouse hanya berisi informasi-informasi yang relevan bagi kebutuhan pemakai yang dipakai untuk pengambilan keputusan Karakteristik data warehouse :  Lebih cenderung menangani data masa lalu  Data disimpan dalam satu platform  Data diorganisasikan menutut subjek seperti pelkanggan atau produk  Pemrosesan sewaktu-waktu, tak terstruktur, dan bersifat heuristik  Untuk mendukung keputusan yang strategis  Untuk mendukung pemakai manajerial yang berjumlah relatif sedikit  Berorientasi pada analisis. Sumber datawarehouse : 1. Data operasional dalam organisasi, misalnya basis data pelanggan dan produk, dan 2. Sumber eksternal yang diperoleh misalnya melalui Internet, basis data komersial, basis data pemasok atau pelanggan.   Berbagai data yang berasal dari sumber digabungkan dan diproses lebih lanjut oleh manajer data warehouse dan disimpan dalam basis data tersendiri. Selanjutnya, perangkat lunak seperti OLAP dan data mining dapat digunakan oleh pemakai untuk mengakses data warehouse

Prinsip Data Warehouse :
Sumber Data Internal

Sumber Data Operasional 1

Sumber Data Operasional 2

Manajer Data Warehouse

 Perangkat EIS  Perangkat pelaporan  Perangkat pengembangan aplikasi

OLAP Sumber Data Eksternal

Data Warehouse Data Mining

Sifat Data warehouse :  Multidimensional yang berarti bahwa terdapat banyak lapisan kolom dan baris (Ini berbeda dengan tabel pada model relasional yang hanya berdimensi dua)  Berdasarkan susunan data seperti itu, amatlah mudah untuk memperoleh jawaban atas pertanyaan seperti: “Berapakah jumlah produk 1 terjual di Jawa Tengah pada tahun n-3?”

Tahun n-4 Tahun n-3 Tahun n-2 Tahun n-1 Jawa Tengah Jawa Barat

Produk 3 Produk 2 Produk 1

 Mengingat sistem data warehouse memerlukan pemrosesan data dengan volume yang besar, sistem ini biasa diterapkan dengan menggunakan teknologi pemrosesan SMP (Symmetric Multiprocessing) dan MPP (Multiple Parallel Processing)  Data warehouse dapat dibangun sendiri dengan menggunakan perangkat pengembangan aplikasi ataupun dengan menggunakan perangkat lunak khusus yang ditujukan untuk menangani hal ini  Beberapa contoh perangkat lunak yang digunakan untuk administrasi dan manajemen data warehouse:  HP Intelligent Warehouse (Hewlett Packard)  FlowMark (IBM)  SourcePoint (Software AG)

Petunjuk Membangun Data warehouse :  Menentukan misi dan sasaran bisnis bagi pembentukan data warehouse  Mengidentifikasi data dari basis data operasional dan sumber lain yang diperlukan bagi data warehouse  Menentukan item-item data dalam perusahaan dengan melakukan standarisasi penamaan data dan maknanya

 Merancang basis data untuk data warehouse  Membangun kebijakan dalam mengarsipkan data lama sehingga ruang penyimpanan tak menjadi terlalu besar dan agar pengambilan keputusan tidak menjadi terlalu lamban.  Menarik data produksi (operasional) dan meletakkan ke basis data milik data warehouse 2. Data Mart Bagian dari data warehouse yang mendukung kebutuhan pada tingkat departemen atau fungsi bisnis tertentu dalam perusahaan. Karakteristik yang membedakan data mart dan data warehouse adalah sebagai berikut (Connolly, Begg, Strachan 1999).    Data mart memfokuskan hanya pada kebutuhan-kebutuhan pemakai yang terkait dalam sebuah departemen atau fungsi bisnis. Data mart biasanya tidak mengandung data operasional yang rinci seperti pada data warehouse. Data mart hanya mengandung sedikit informasi dibandingkan dengan data warehouse. Data mart lebih mudah dipahami dan dinavigasi.

Data yang terdapat dalam data warehouse dapat dibagi perbagian sesuai dengan kebutuhan dalam informasi. Inilah yang dsebut dengan data mart. Data mart memiliki karakteristik yang sama dengan data warehouse, perbedaannya hanya terdapat pada jumlah data yang dimiliki. Dalam data mart, data yang ada hanya berasal dari satu bagian atau satu departemen saja, sedangkan pada data warehouse, data yang ada berasal dari seluruh bagian dalam perusahaan tersebut.

Dalam pembangunan data mart, terdapat 2 arsitektur, yaitu : Dependent Data Mart dan Independent Data Mart (IDM). Perbedaan dari kedua arsitektur tersebut hanya terletak pada ketergantungannya terhadap data warehouse. Pada Dependent Data Mart, data yang diperoleh sangat tergantung pada data warehouse terpusat sedangkan pada IDM, data yang digunakan terpisah dari data warehouse terpusat dan bersifat independent (berdiri sendiri). Perbandingan antara data warehouse dan data mart dapat dilihat pada tabel berikut ini.

3. Raw Data Raw data adalah data yang belum diproses, data komputer. Informasi ini dapat disimpan dalam sebuah file, atau hanya mungkin kumpulan angka dan karakter disimpan pada suatu tempat di hard disk komputer. Sebagai contoh, informasi yang dimasukkan ke dalam database ini sering disebut data mentah. Data bisa dimasukkan oleh pengguna atau dihasilkan oleh komputer itu sendiri. Karena belum diproses oleh komputer dengan cara apapun, itu dianggap sebagai "data mentah." Untuk melanjutkan analogi kuliner, data yang telah diproses oleh komputer kadang-kadang disebut sebagai "data dimasak." Raw data adalah istilah untuk data yang dikumpulkan pada sumber yang belum mengalami pengolahan atau manipulasi lainnya. (Data primer), juga dikenal sebagai data primer. Raw data dapat menjadi masukan untuk sebuah program komputer atau digunakan dalam prosedur analisis manual, seperti mengumpulkan data statistik dari survei. Hal ini dapat mengacu pada data biner pada perangkat penyimpanan elektronik seperti hard disk drive (juga disebut sebagai data tingkat rendah).

Dalam komputasi memiliki atribut sebagai berikut: mungkin mengandung kesalahan, tidak divalidasi, dalam format yang berbeda. Sebagai contoh, sebuah lembar input data mungkin berisi tanggal sebagai data baku dalam berbagai bentuk: "31 Januari 1999", "31/01/1999", "31/1/99", "31 Jan", atau "hari ini". Setelah ditangkap, data mentah ini dapat diproses dan disimpan sebagai format tunggal, sehingga lebih mudah untuk komputer dan manusia untuk menginterpretasikan selama waktu pemrosesan. Data mentah (kadang-kadang disebut data sourcey atau data Eggy) adalah data yang belum diproses untuk digunakan. Kadang-kadang dibuat antara data dan informasi yang menyatakan bahwa informasi adalah produk akhir dari pengolahan data. Data mentah yang telah mengalami pengolahan data kadang-kadang disebut sebagai dimasak. Meskipun data mentah memiliki potensi untuk menjadi "informasi," data mentah perlu dianalisis lebih lanjut. Misalnya, point-of-sale terminal (POS terminal) di supermarket sibuk mengumpulkan volume besar data mentah setiap hari, namun data itu tidak menghasilkan banyak informasi sampai diproses. Setelah diproses, data dapat menunjukkan item-item tertentu : apa yang

dibeli pelanggan, kapan mereka membelinya, dan berapa harganya. Informasi tersebut dapat digunakan dalam teknologi forecasting untuk membantu pemilik rencana kampanye pemasaran mendatang. Sebagai hasil pengolahan, data mentah kadang-kadang berakhir di database, yang memungkinkan data menjadi diakses untuk diproses lebih lanjut dan analisis dalam berbagai cara yang berbeda. 4. Meta Data Metadata adalah istilah dari proses pengidentifikasian suatu atribut dan struktur dari sebuah data atau informasi. Metadata menjelaskan sebuah data itu sendiri. Definisi sederhana dari metadata adalah data mengenai data. Metadata ini mengandung informasi mengenai isi dari suatu data yang dipakai untuk keperluan manajemen file/data itu nantinya dalam suatu basis data. Jika data tersebut dalam bentuk teks, metadatanya biasanya berupa keterangan mengenai nama ruas (field), panjang field, dan tipe fieldnya: integer, character, date, dll. Untuk jenis data gambar (image), metadata mengandung informasi mengenai siapa pemotretnya, kapan pemotretannya, dan setting kamera pada saat dilakukan pemotretan. Satu lagi untuk jenis data berupa kumpulan file, metadatanya adalah nama-nama file, tipe file, dan nama pengelola (administrator) dari file-file tersebut.

Metadata menjelaskan data itu sendiri. Menyediakan informasi tentang konten barang tertentu. Sebagai contoh, sebuah gambar dapat mencakup metadata yang menggambarkan seberapa besar gambar, kedalaman warna, resolusi gambar, kapan gambar itu dibuat, dan data lainnya. metadata Sebuah dokumen teks mungkin berisi informasi tentang berapa jumlah kata/karakter dalam dokumen ini, penulis, kapan dokumen ini ditulis, dan ringkasan pendek dari dokumen. Halaman Web yang sering termasuk metadata dalam bentuk metatag. Keterangan dan kata kunci metatag biasa digunakan untuk menjelaskan konten halaman Web. Kebanyakan mesin pencari menggunakan data ini saat menambahkan halaman ke indeks pencarian mereka. Meta Tag adalah informasi yang dimasukkan kedalam area “head” dalam suatu halaman website, dimana informasi dalam area head ini tidak terlihat oleh browser pada saat kita melihat halaman website tersebut, tetapi area head ini menjadi sangat penting jika dihubungkan dengan mesin pencari / search engine, karena informasi Meta Tag ini akan ditampilkan dalam mesin pencari / search engine.
Contoh Meta Tag di website gembong.web.id ini pada halaman depan:
<HEAD> <TITLE>Gembong Website</TITLE> <META name=”description” content=”Belajar tentang SEO, internet marketing, cms (Joomla, Wordpress, Drupal, dll), Google, Adsense,

Semua yang berkaitan dengan komputer baik hardware maupun software”> <META name=”keywords” content=”seo, cms, joomla, wordpress, internet, marketing, adsense, google, yahoo, msn”> </HEAD>

Contoh diatas adalah area head pada halaman website dimana area ini diawali dengan tag <HEAD> dan diakhir dengan </HEAD>. Berikut ini adalah tampilan di halaman mesin pencari Google dari Meta Tag diatas:

Contoh Meta Tag di website www.kompas.com pada halaman depan
<meta name="Description" content="KOMPAS.com merupakan situs berita terpercaya di Indonesia." /> <meta name="Keywords" content="KOMPAS, berita KOMPAS, KOMPAS.com, KOMPAS TV, KOMPAS cetak, berita terkini, nasional, regional, internasional, megapolitan, metropolitan, hiburan, politik, kesehatan, binis, keuangan, olahraga, tekno, edukasi, bola, pasangiklan" />

Tampilan pada google :

Contoh metadata sebuah file gambar (image)

Contoh metadata sebuah file dokumen (text)

Referensi : 1. Data Warehouse, Data Mart, OLAP, dan Data Mining, Abdul Kadir 2. Analisis dan Implementasi Independent Data Mart Pada Customer Care Telkom Flexy Kandatel Bandung, Shinta Nureka Eva Miranda Lumban, ITT Telkom , 2009 3. http://www.techterms.com/definition/rawdata 4. www.techterms.com/definition/metadata 5. http://gembong.web.id/meta-tag-dan-search-engine-mesin-pencari/

Sign up to vote on this title
UsefulNot useful

Master Your Semester with Scribd & The New York Times

Special offer: Get 4 months of Scribd and The New York Times for just $1.87 per week!

Master Your Semester with a Special Offer from Scribd & The New York Times