You are on page 1of 11

LECTURE NOTES

Management Support System

Week 5 & 6
Data Mining for Business Intelligence

0154M - Management Support System

Menjelaskan konsep dasar dari sistem informasi strategis dan sistem informasi perusahaan. Mengklasifikasikan kegiatan pengelolaan sistem pendukung manajemen 3. karakteristik. Definisi. Menganalisis masalah dalam sistem pendukung manajemen 4.Management Support System . Konsep dan aplikasi data mining 3. Mendesain prototipe sistem informasi strategi untuk sistem pendukung keputusan dalam bisnis OUTLINE MATERI : 1. dan manfaat 4. Proses dalam Data Mining 0154M . 2.LEARNING OUTCOMES 1. Pengantar Data Mining 2.

Demikian pulan. mempelajari proses-proses standard dalam melaksanakan proyek-proyek data mining. Konsep dan aplikasi data mining Dalam suatu interview dengan majalah „Computerworld‟ pada Januari 1999. Capital One. Penzias menjawab: “Data mining”. Dalam menjawab pertanyaan klasik dari „Computerworld‟ mengenai “Apakah yang akan menjadi aplikasi killer bagi korporasi?” Dr.ISI MATERI Pengantar Data Mining Secara umum. Tingkat kesuksesan seperti ini akan bergantung pada 0154M . diorganisir. Dalam seri ini kita akan mempelajari data mining sebagai teknologi pendorong bagi business intelligence. dan membedah berbagai macam mitos dan jebakan dalam data mining.com. Arno Penzias (pemenang nobel dan mantan kepala peneliti di Bell Labs) mengatakan bahwa sebentar lagi data mining dari berbagai database perusahaan akan menjadi aplikasi yang menjadi andalan. “Data mining akan menjadi sesuatu yang sangat penting sehingga perusahaan-perusahaan tidak akan membuang (data) apapun mengenai para pelanggan mereka karena hal itu merupakan sesuatu yang sangat berharga.Management Support System . anda akan terdepak keluar dari bisnis”. dengan memberikan contoh-contohnya seperti Amazon. pengertian data mining untuk business intelligence adalah cara-cara untuk mengembangkan business intelligence dari data yang dikumpulkan. dan disimpan oleh suatu organisasi. dalam suatu artikel di „Harvard Business review‟ Thomas Davenport (2006) berpendapat bahwa senjata strategis terbaru bagi perusahaan-perusahaan adalah pembuatan keputusan berdasarkan analitik.Bila anda tidak melakukan hal ini (data mining). Teknik-teknik dalam data mining sangatlah luas sekali dan digunakan oleh berbagai organisasi untuk mendapatkan pemahaman yang lebih baik mengenai pelanggan dan cara kerja mereka dan untuk menyelesaikan berbagai masalah organisasi yang sangat kompleks. memahami dan membangun keahlian dalam menggunakan teknik-teknik data mining yang populer. Marriot International. Dr. Kemudian dia menambahkan. mengembangkan pengetahuan mengenai berbagai tool software yang ada. dan lain-lain yang telah menggunakan analitik untuk memahami mengenai para pelanggan mereka dengan lebih baik dan mengoptimasi supply chain mereka yang untuk memaksimalkan RoI (return on investment) mereka sembari memberikan customer service yang terbaik.

Meskipun istilah data mining relatif baru. yang memungkinkan suatu tampilan tunggal mengenai pelanggan. vendornya.  Konsolidasi dan integrasi baris-baris dalam database.  Kemajuan yang pesat dan eksponensial dalam pemrosesan data dan teknologi database. Pada seri ini. proses bisnisnya. dll. Istilah data mining awalnya digunakan untuk menjelaskan proses dimana berbagai pola di dalam data yang tak diketahui sebelumnya menjadi terungkap.  Sudah menjadi pengetahuan umum bahwa ada nilai tersembunyi yang belum dimanfaatkan di dalam sumber-sumber data yang besar. vendor. dan supply chainnya dengan baik. Dengan pembuatan database-database yang besar. Biaya yang digunakan untuk menyimpan dan memproses data dalam beberapa waktu terakhir telah menurun secara dramatis. Banyak sekali teknik dalam data minig yang berasal dari analisa statistik tradisional dan kecerdasan buatan yang dilakukan di awal 1980an.Management Support System . Mengapa kemudian secara tiba-tiba mendapat perhatian dari dunia bisnis? Berikut adalah beberapa alasan yang paling banyak disebut:  Kompetisi yang semakin intens di skala global yang didorong oleh kebutuhan dan keinginan pelanggan yang selalu berubah di pasar yang makin lama makin jenuh.  Konsolidasi database dan penyimpanan data yang lain ke dalam satu lokasi tunggal dalam bentuk data warehouse.  Penurunan harga yang signifikan dalam hardware dan software untuk penyimpanan dan pemrosesan data.perusahaan yang memahami pelanggannya. dan dampaknya. Komponen utama dari pemahaman ini bermula dengan cara menganalisa jumlah data yang sangat banyak yang dikumpulkan perusahaan. transaksi. jumlah data yang disimpan dalam bentuk elektronik menjadi tumbuh dalam jumlah yang eksplosif. 0154M . tetapi ide dibelakangnya sama sekali bukan sesuatu yang baru.  Gerakan menuju „de-massification‟ (konversi berbagai informasi kedalam bentuk yang non-fisik) dalam praktik-praktik bisnis. Definisi tersebut kemudian diperluas oleh beberapa vendor software untuk memasukkan sebagian besar bentuk analisa data untuk meningkatkan penjualan dengan popularitas label data mining. kita akan menggunakan definisi asli mengenai data mining. kemungkinan menganalisa data yang disimpan menjadi muncul/ada.

Menurut analogi. data mining telah menjadi pilihan bagi komunitas ilmu ini. „pattern analysis‟. dan „data dredging‟. Data mining sudah digunakan secara luas untuk menarget klien-klien secara lebih baik. orang mungkin berpikir bahwa istilah data mining adalah sesuatu yang tidak tepat. Pada bidang komersial. Definisi. barangkali penggunaan data mining yang paling umum ada dalam bidang finance. karakteristik.Management Support System . adalah istilah yang digunakan untuk menjelaskan proses pencarian atau penambangan knowledge dari data yang sangat besar. Meskipun ada ketidakcocokan antara makna dan istilah.Jumlah data yang sangat besar terus menerus dihasilkan dan diakumulasikan diseluruh dunia. Secara teknis. Jadi. dan dengan perkembangan e-commerce yang luas. dan untuk membantu untuk meningkatkan profitabilitas dengan menggunakan market-basket analysis. Data mining digunakan untuk mendeteksi dan mengurangi berbagai aktivitas penipuan. dan kecerdasan buatan untuk mengekstrak dan mengidentifikasi informasi dan knowledge selanjutnya (atau pola-pola) yang berasal dari sekumpulan data yang sangat besar. „information harvesting‟. „data archaeology‟. hal ini akan menjadi suatu yang lebih wajib seiring berjalannya waktu. terutama dalam klaim asuransi dan penggunaan kartu kredit. untuk mengetahui pola-pola pembelian oleh pelanggan. untuk mengetahui berbagai aturan perdangan berdasarkan data historis. Banyak namanama lain yang ter-asosiasi dengan data mining antara lain „knowledge extraction‟.Berbagai disiplin ilmu seperti astronomi dan fisika nuklir selalu menghasilkan kuantitas data yang besar secara regular. matematika. „pattern searching‟. untuk mengakuisisi kembali para pelanggan yang menguntungkan. dan healthcare. menambang emas dari bebatuan atau lumpur diacu sebagai „penambangan emas‟ dan bukannya penambangan „batu‟ atau „lumpur‟.Data yang dihasilkan oleh Internet meningkat dengan cepat baik dari sisi volume dan kompleksitas. dan manfaat Definisi data mining. retail. Pera peneliti di bidang farmasi dan kedokteran secara konstan menghasilkan dan menyimpan data yang bisa digunakan dalam aplikasi data mining untuk mengetahui cara-cara yang lebih baik untuk mendiagnosa secara akurat dan mengobati penyakit dan untuk menemukan obat-obat baru yang lebih baik. data minig adalah proses yang memanfaatkan teknik-teknik statistik. data mining barangkali lebih cocok diberi nama „knowledge mining‟ atau „knowledge discovery‟. 0154M . secara sederhana.

termasuk statistik.Management Support System . management science. information systems (sistem informasi). dan database. korelasi. Kebanyakan literatur mendefinisikan data mining sebagai “proses yang rumit untuk mengidentifikasi pola-pola yang valid. dan bisa dipahami. baru. dimana data diorganisir dalam baris-baris yang terstruktur menurut kategori. yang artinya bahwa. Data mining bukanlah disiplin ilmu baru. tetapi lebih pada definisi yang baru untuk pemanfaatan banyak disiplin ilmu. terhadap data yang disimpan di dalam database yang terstruktur”. ordinal/berurutan. Dalam definisi ini. artificial intelligence (kecerdasan buatan). mengapa saya tidak memikirkan hal itu” . dan variable-variabel yang berkesinambungan.Berbagai macam pola tersebut bisa dalam bentuk aturan bisnis. Lihat gambar di bawah ini: 0154M .Data mining diposisikan erat di irisan berbagai disiplin ilmu. memiliki potensi bermanfaat. itu bukanlah suatu hal yang mudah seperti komputasi terhadap suatu kuantitas yang sudah ditetapkan sebelumnya  Valid: artinya bahwa pola-pola yang ditemukan seharusnya tetap benar bila diterapkan pada data yang baru dengan tingkat kepastian yang tinggi  Baru: artinya bahwa pola-pola tidaklah diketahui sebelumnya oleh pengguna dalam konteks sistem yang sedang dianalisa  Berpotensi bermanfaat: artinya adalah bahwa pola-pola yang ditemukan harus membawa manfaat bagi pengguna atau pada pekerjaan  Dapat dipahami: artinya bahwa pola harus masuk akal secara bisnis yang membuat pengguna berkata “mmmm! Ini masuk akal. machine learning. kesamaan-kesamaan. atau model-model prediksi. beberapa arti dari kata-kata kunci di atas adalah seperti berikut:  Proses: artinya data mining terdiri dari banyak langkah perulangan  Rumit: artinya bahwa ada suatu dugaan/kesimpulan atau pencarian yang berbasis eksperimentasi yang dilibatkan. trend.

data mining berusaha membuat perkembangan dalam mengekstrak informasi dan knowledge dari database yang besar. yang didukung dengan „bor-bor data‟ dan berbagai tool query handal lainnya untuk menanyakan pertanyaan-pertanyaan dengan tujuan tertentu dan mendapatkan jawaban-jawaban dengan cepat.  Berbagai tool baru yang canggih. Ini adalah bidang ilmu yang muncul ke permukaan dan menarik banyak perhatian dalam waktu yang singkat. Untuk mendapatkannya akan melibatkan memoles dan mensinkronisasikan data untuk mendapatkan hasil-hasil yang tepat. data dibersihkan dan disatukan ke dalam data warehouse. file-file teks di internet. teks yang tak terstruktur yang disimpan dalam tempat-tempat seperti database Lotus Notes. Berikut adalah karakteristik utama dan tujuan dari data mining:  Data seringkali terkubur dalam database yang sangat besar. yang terkadang berisi data selama bertahun-tahun. atau intranet korporat). dengan sedikit atau bahkan tanpa skill pemrograman sekalipun. Data miners yang mutakhir juga memeriksa kemanfaatan data (misalnya. Dalam banyak kasus.  Environment data mining pada umumnya adalah arsitektur client-server atau arsitektur sistem informasi berbasis web. termasuk berbagai tool visualisasi yang canggih.Management Support System .  Si penambang seringkali adalah end-user. 0154M .Dengan menggunakan perkembangan di semua disiplin itu. membantu untuk mengangkat biji informasi yang terkubur dalam file-file korporat atau record-record arsip.

 Dalam menemukan pola seringkali menemukan hasil yang tak diharapkan dan meminta end-user untuk berpikir secara kreatif dalam menjalankan proses.  Karena jumlah data yang sangat besar dan usaha pencarian yang massif. beberapa diantaranya (yang paling popular) dibahas dalam bagian ini. yang merupakan enam tahap berurutan yang dimulai dengan pemahaman bisnis yang baik dan perlunya project DM dan berakhir dengan „deployment‟ solusi yang memuaskan kebutuhan bisnis tertentu. termasuk interpretasi terhadap temuan.  Banyak tool data mining siap dikombinasikan dengan berbagai spreadsheet dan tool development software lainnya. Perusahaan yang secara efektif memanfaatkan tool-tool dan teknologi data mining bisa mendapatkan dan mempertahankan keunggulan kompetitif strategis. Jadi. 2009). yaitu „Cross-Industry Standard Process for Data Mining‟ – atau CRISP-DM – telah diusulkan pada pertengahan 1990an oleh konsorsium perusahaan-perusahaan eropa untuk dijadikan methodology standard non-proprietary bagi DM (CRISP-DM. suatu proses yang umum berlaku biasanya diterapkan. 0154M . para praktisi dan peneliti DM mengusulkan beberapa proses (workflow atau pendekatan step-by-step yang sederhana) untuk memperbesar peluang keberhasilan dalam melaksanakan project-project DM. Proses dalam Data Mining Untuk melaksanakan project-project dalam Data Mining (DM) secara sistematis. Berdasarkan „best practice‟. Salah satu proses yang sudah dijadikan standard tersebut dan boleh dibilang sebagai yang paling populer. Gambar berikut di bawah ini menggambarkan proses yang diusulkan tersebut.Management Support System . kadangkadang perlu menggunakan pemrosesan parallel untuk data mining. data yang ditambang bisa dianalisa dan diterapkan dengan cepat dan mudah. Usaha-usaha itu akhirnya menghasilkan beberapa proses yang dijadikan sebagai standard. Data mining menawarkan perusahaan suatu environment yang sangat diperlukan untuk meningkatkan keputusan untuk memanfaatkan peluang-peluang baru dengan mentransformasikan data menjadi senjata yang strategis.

0154M . misalnya seseorang harus bergerak maju mundur dalam langkah-langkah di atas beberapa kali) dan memakan waktu. bergantung pada situasi problem saat itu dan pengetahuan/pengalaman dari si analis.Enam tahap proses CRISP-DM dalam data mining Meskipun langkah-langkah tersebut pada dasarnya berurutan. Karena langkah-langkah berikutnya dibuat berdasarkan hasil-hasil dari langkah-langkah sebelumnya.Management Support System . tetapi pada umumnya ada banyak sekali „backtracking‟ (pelacakan kembali ke belakang). maka kita harus menaruh perhatian lebih pada langkah-langkah awal supaya tidak menempatkan seluruh kajian pada jalur yang salah sejak awal. Karena DM didorong oleh pengalaman dan eksperimen. maka proses secara keseluruhan bisa sangat iterative (berulang-ulang.

Management Support System .SIMPULAN Kelebihan Data Mining sebagai alat analisis :  Data mining mampu menangani data dalam jumlah besar dan kompleks  Data mining dapat menangani data dengan berbagai macam tipe atribut.  Data mining mampu mencari dan mengolah data secara semi-otomatis. Disebut semiotomatis karena dalam beberapa teknik data mining. diperlukan parameter yang harus diinput oleh user secara manual  Data miningdapat menggunakan pengalaman ataupun kesalahan terdahulu untuk meningkatkan kualitas dan hasil analisa sehingga mendapat hasil yang terbaik 0154M .

oracle. Oracle Business Intelligence Tools and Technology.com/BusinessIntelligence 0154M . (2014). Efraim Turban. Ting Peng Liang.Aronson.Management Support System . 09. David King. ISBN: 013_245 323 2. Decision Support and Business Intelligence Systems. Dursun Delen. Ramesh Sharda. www. Jay E. Pearson Prentice Hall.DAFTAR PUSTAKA 1.