Professional Documents
Culture Documents
TUJUAN PEMBELAJARAN
Tujuan ini hanya bisa tercapai jika ada sarana untuk memudahkan
sharinginformasi antar berbagai instansi yang saat ini memelihara silo data
independen.Keamanan perbatasan sendiri melibatkan sebelas agensi. Untuk
keseluruhan proyek data warehouse,sekitar 80 persen arsitekturnya akan
tersedia dalam 18 bulan, sedangkanImplementasi lengkap akan berjalan lebih
dari tiga sampai lima tahun. Akhirnya datagudang akan menyebabkan
peningkatan keamanan bagi Amerika Serikat. Ini akan menjadi model
untukbagaimana semua negara dapat berinteraksi untuk melindungi perbatasan
mereka dan memastikan keamanan kewarganegaraan mereka.Proyek ambisius
ini bukan tanpa tantangan. Misalnya, data perluditambang dari catatan imigrasi,
catatan perbendaharaan (berurusan dengan pertukaransejumlah besar uang),
dan catatan FBI (kriminal). Data ada dalam format yang berbedadan tipe data;
Upaya besar sedang dilakukan untuk membangun sarana untuk
menghubungkan dan mencarimelalui data ini untuk mengidentifikasi potensi
ancaman dan kejahatan.
5. 2 T H E N A T U R E A N D S O U R C E S O F D A T A
The Vignette Pembukaan menggambarkan apa yang bisa salah dalam ekstrem
ketika Anda melakukannyatidak mengumpulkan data untuk melacak aktivitas
individu dan organisasi yang berdampak pada andaOrganisasi (dalam
lingkungan bisnis, ini adalah pelanggan, calon pelanggan dansebuah kompetisi).
Isu penting untuk Departemen Keamanan Dalam Negeri A.S.
adalahmengumpulkan dan menganalisis data dari sumber yang berbeda. Data
ini harus diintegrasikan dalam agudang data dan dianalisis secara otomatis
melalui alat data mining atau oleh analis yang menggunakanAlat OLAP Tentu
saja, penyalahgunaan bisa terjadi dalam proses pengumpulan dan
pemanfaatannyasejumlah besar data (lihat DSS di Focus 5.1).
Data MSS bisa meliputi dokumen, gambar, peta, suara, video, dan animasi.Data
ini dapat disimpan dan diatur dengan cara yang berbeda sebelum dan sesudah
digunakan. Merekajuga mencakup konsep, pemikiran, dan pendapat. Data bisa
mentah atau diringkas. BanyakAplikasi MSS menggunakan data ringkasan atau
ekstraksi yang berasal dari tiga primersumber: internal, eksternal, dan pribadi.
Experian Automotive telah mengembangkan bisnis via Web. Ada yang massif pasar untuk layanan ini,
baruPeluang dari alat data yang mengelola, terutama dari dealer mobil.Experian juga berfokus
mengekstrak, danmengintegrasikan. Experian telah pada komponen mobil com-_perusahaan untuk
mengembangkan sebuah sistem dengan besardatabase mengidentifikasi ingat dan mempertimbangkan
(10 terbesar di dunia) untuk melacak mobildata bagaimana menargetkanpenjualan suku cadang mobil
penjualan Data yang diperoleh bersifat eksternal dan
dating dari catatan publik penjualan mobil. Source: Adapted from Pimm Fox, "Extracting Dollars
Experianmengacu pada data ini untuk memberikan from
sejarah kepemilikansetiap kendaraan yang dibeli atau Data," ComputerWorld, April 15,2002, p. 42.
dijual di Amerika Serikat untuk abiaya murah per kueri
Data internal disimpan di satu tempat atau lebih. Data ini tentang orang, produk,
layanan, dan proses. Misalnya, data tentang karyawan dan gaji mereka
biasanyadisimpan dalam database perusahaan. Data tentang peralatan dan
mesin bisa disimpandi database departemen pemeliharaan. Data penjualan bisa
disimpan di beberapa tempat:data penjualan agregat di database perusahaan,
dan rincian di database masing-masing daerah.MSS dapat menggunakan data
mentah dan data yang diproses (mis., Laporan dan ringkasan).Data internal
tersedia melalui intranet organisasi atau jaringan internal lainnya.
DATA EKSTERNAL
Ada banyak sumber data eksternal. Mereka berkisar dari database komersial
sampaidata dikumpulkan oleh sensor dan satelit. Data tersedia di CD dan DVD,
diInternet, seperti film dan foto, dan sebagai musik atau suara. Laporan
pemerintah danFile adalah sumber utama data eksternal, yang sebagian besar
tersedia di Web saat ini(misalnya, lihat www.ftc.gov, Komisi Perdagangan
Federal A.S.). Data eksternal mungkin jugatersedia dengan menggunakan GIS
(sistem informasi geografis, lihat Bagian 5.13), dari federalBiro sensus, dan
sumber demografis lainnya yang mengumpulkan data secara langsungdari
pelanggan atau dari pemasok data. Kamar dagang, bank lokal,
penelitianinstitusi, dan sebagainya, membanjiri lingkungan dengan data dan
informasi, sehingga menghasilkaninformasi yang berlebihan bagi pengguna
MSS. Data bisa datang dari seluruh dunia. PalingData eksternal tidak relevan
dengan MSS tertentu. Namun banyak data eksternal yang harus dipantaudan
ditangkap untuk memastikan bahwa barang penting tidak
terlewatkan.Menggunakan agen scanning dan interpretasi cerdas dapat
meringankan masalah ini. Untuk tips bagaimana caranyamengelola data
eksternal, lihat Collett (2002).
Kebutuhan untuk mengekstrak data dari banyak sumber internal dan eksternal
mempersulit tugas tersebutgedung MSS Terkadang perlu mengumpulkan data
mentah di lapangan. Lainnyakasus, perlu untuk mendapatan data dari orang
atau menemukannya di Internet. ApapunDari cara pengumpulannya, data harus
divalidasi dan disaring. Ekspresi klasik itumeringkas situasinya adalah "Sampah
masuk, sampah keluar" (GIGO). Oleh karena itu, kualitas data(DQ) adalah isu
yang sangat penting.
Kebutuhan akan data yang andal dan akurat untuk MSS manapun diterima
secara universal. Namun,Dalam kehidupan nyata, pengembang dan pengguna
menghadapi masalah yang tidak terstruktur dalam "ribut" dan sulitlingkungan.
Ada berbagai macam perangkat keras dan perangkat lunak untuk penyimpanan
data, komunikasi,dan presentasi, tapi banyak "sedikit usaha telah beralih ke
metode pengembanganuntuk pengambilan data MSS di lingkungan pengambilan
keputusan yang kurang stabil. Metode yang tidak memadaiMengatasi masalah
ini mungkin membatasi keefektifan teknologi yang bahkan canggih
sekalipundalam pengembangan dan penggunaan MSS. Beberapa metode
melibatkan pengambilan fisikdata melalui kode bar atau dengan teknologi RFID
(radio-frequency identification tag). SebuahTombol elektronik RFID
mengirimkan sinyal identifikasi dengan beberapa data(beberapa kilobyte
DATA PROBLEMS
Semua sistem berbasis komputer bergantung pada data. Kualitas dan integritas
dataPenting jika MSS adalah untuk menghindari sindrom GIGO. MSS bergantung
pada data karena dikompilasidata yang membentuk informasi dan pengetahuan
adalah inti dari setiap pengambilan keputusansistem.
Masalah data DSS utama dirangkum dalam Tabel 5.1 bersama dengan beberapa
kemungkinansolusi. Data harus tersedia untuk sistem atau sistem harus,
termasuk data akuisisisubsistem Masalah-masalah data harus dipertimbangkan
dalam tahap perencanaan system pengembangan. Jika terlalu banyak masalah
diantisipasi, biaya pemecahannya bisaDiperkirakan. Jika berlebihan, proyek MSS
tidak boleh dilakukan atauharus ditunda sampai biaya dan masalah berkurang.
KUALITAS DATA
Kualitas data (DQ) adalah isu yang sangat penting karena kualitas menentukan
kegunaannyadata serta kualitas keputusan berdasarkan pada mereka. Data
dalam organisasidatabase sering ditemukan tidak akurat, tidak lengkap, atau
ambigu.kerusakan ekonomi dan sosial dari data berkualitas rendah berbiaya
miliaran dolar (Redman,1998).
The Data Warehousing Institute (TDWI) memperkirakan pada tahun 2001 yang
berkualitas burukdata pelanggan menyebabkan bisnis AS $ 611 miliar per tahun
dalam bentuk prangko, pencetakan, danoverhead staf untuk menangani massa
Yang menakutkan, biaya riil dari data berkualitas rendah adalahjauh lebih
tinggi. Organisasi dapat menggagalkan dan mengasingkan pelanggan setia
dengan salahmenangani surat atau gagal mengenali mereka ketika mereka
menelepon, atau mengunjungi took atau situs web Begitu perusahaan
kehilangan pelanggan setia, perusahaan kehilangan basis penjualannya
danrujukan, serta potensi pendapatan di masa depan. Lihat Eckerson (2002a).
Beberapa tipikalbiaya termasuk dari pengerjaan ulang, pelanggan yang hilang,
pelaporan terlambat, keputusan salah, terbuang sia-siakegiatan proyek, respon
lambat terhadap kebutuhan baru (peluang terjawab), dan penundaan
masukmengimplementasikan proyek-proyek besar yang bergantung pada
database yang ada (Olson, 2003a,2003b).
Kualitas data adalah salah satu topik yang semua orang tahu itu penting tetapi
cenderungmengabaikan. Kualitas data sering menghasilkan sedikit antusiasme
dan biasanya dilihat sebagaifungsi pemeliharaan Perusahaan jelas bersedia
menerima kualitas data yang buruk.Perusahaan bahkan bisa bertahan dan
berkembang dengan kualitas data yang buruk. Itu tidak dianggap
sebagaimasalah hidup dan mati, tapi kadang kala bisa. Ketidakakuratan data
bisa sangat mahal(lihat Olson, 2003a, 2003b). Bahkan SO, kbanyakan
perusahaan mengelola kualitas data secara kasual(Eckerson, 2002a). Menurut
Kualitas data yang dimiliki Departemen Montana penjara kepada "pelanggan" selama dua hingga
Korupsi tahanan selama bertahun-tahun. Seiring lima tahun ke depan.
sistem IT tua, data kesalahan masuk dalam
laporan dibangun. Formulir yang diperlukan Pada pertengahan 1999, upaya besar berfokus
diserahkan kepada otoritas negara bagian dan pada pembersihan sistem informasi penjara
federal tidak bisa lewat tes detektor melalui kualitas dan data akurat selesai. Pada
kebohongan. Meski jurusan IS 2001, departemen itu gatekeeper sistem
kelompok menghabiskan banyak waktu upaya informasi (semua orang yang data yang
manual dalam upaya untuk mempertahankan dimasukkan dan dipelihara) telah
beberapa tingkat integritas pelaporan, secara mengembangkan suatu budaya kualitas data
keseluruhan kepercayaan terhadap kualitas data Meskipun tidak biasa, itu penting untuk
rendah. Masalahnya muncul proporsi breakout perhatikan bahwa sekitar 15 hingga 20 persen
ketika, pada tahun 1997, departemen hilang operasi perusahaan pendapatan dapat
hibah federal $ 1 juta: Pihak yang bersalah dibelanjakan untuk penyelesaian atau perbaikan
adalah informasinya sistem, yang tidak memiliki masalah kualitas data. Dan beberapa organisasi,
aturan bisnis dan data kamus. Sistem tidak dapat seperti Montana Department of Corrections,
memperkirakan secara akurat bagaimana telah membuat waktu penuh posisi yang
caranya banyak dari jenis pelaku akan dipenjara. ditujukan untuk memastikan kualitas data.
Untungnya, tidak ada pelanggar yang tersesat
dalam data shuffle, tetapi tidak ada cara untuk Source: Adapted from Beth Stackpole. "Dirty Data
memprediksi permintaan akan "layanan" Is the Dirty Little Secret That Can Jeopardize Your
CRM Effort," CIO, February 15,2001, pp. 101-114.
Kualitas data penting, terutama untuk CRM, ERP, dan informasi perusahaan
lainnyasistem. Masalahnya adalah bahwa data pergudangan, e-bisnis, dan
proyek-proyek CRMsering mengekspos data berkualitas buruk karena mereka
mengharuskan perusahaan untuk mengekstrak dan mengintegrasikandata dari
berbagai sistem operasional yang sering dibumbui dengan kesalahan,
hilangnilai, dan masalah integritas. Masalah ini tidak muncul sampai seseorang
mencobauntuk meringkas atau mengagregasi data. Lihat Dyche (2001).
Kami menjelaskan beberapa praktik terbaik untuk kualitas data dalam DSS di
Fokus 5.6. Praktisitelah mengidentifikasi hal ini penting bagi sebuah organisasi
untuk mempertahankan data tingkat tinggikualitas dan integritas.Masalah
kualitas data, metode, dan solusi dibahas dengan sangat rinci oleh Berson et al.
(2000), Canter (2002), Dasu and Johnson (2003), Dravis (2002), Dyche (2001),
Eckerson (2002a), King (2002), Loshin (2001,2003), Qlson. (2003a, 2003b),
Staekpole (2001), Stodder (2002), and Theodoratos arid Bouzeghoug (2001).
Berikut ini beberapa praktik terbaik untuk Kenali data Anda. Pahami data anda apa
memastikan kualitas data miliki, dan untuk apa mereka digunakan.
dalam praktek. Tentukan Tingkat presisi yang tepat
Menggosok data saja tidak cukup. diperlukan untuk masing-masingitem data.
Perangkat lunak pembersihan data hanya
menangani beberapa masalah: angka yang Buatlah proses yang terus menerus.
tidak akurat, salah eja, bidang tidak Mengembangkan budayakualitas data.
lengkap. Luas Program data berkualitas Melembagakan metodologi danpraktik terbaik
mendekati standarisasi datasehingga untuk memasukkan dan memeriksa informasi.
informasi dapat mempertahankan
integritasnya. Ukur hasil. Secara teratur mengaudit
Mulai dari atas. Manajemen puncak harus hasilnyamemastikan bahwa standar ditegakkan
sadar masalah kualitas data dan bagaimana dan untukmemperkirakan dampak pada garis
pengaruhnya organisasi. Mereka harus dasar.
membeli setiap usaha perbaikan, karena
sumber daya akan dibutuhkan untuk Source: Adapted from Beth Staekpole, "Dirty Data Is
mengatasi lamamasalah. the Dirty Little Secret That Can Jeopardize Your CRM
Effort," CIO, February 15,2001, pp. 101-114.
INTEGRITAS DATA
Salah satu masalah utama DQ adalah integritas data. Sistem pengarsipan yang
lebih lama mungkin tidak memiliki integritas.Artinya, perubahan yang ilakukan
dalam file di satu tempat mungkin tidak dibuat dalam file di tempat laintempat
atau departemen. Ini menghasilkan data yang bertentangan. Masalah khusus
ualitas data danukuran tergantung pada aplikasi data. Ini adalah masalah yang
sangat penting dalamlingkungan komputasi kolaboratif (Bab 7), seperti yang
disediakan oleh LotusCatatan / Domino dan Groove. Di area gudang data,
misalnya, Gray danWatson (1998) membedakan lima masalah berikut:
Steve Cooper, asisten khusus untuk presiden dan tidak berlokasi di database relasional,dan
CIO dari Departemen Keamanan Dalam Negeri mereka tidak dapat dengan mudah dimanipulasi
AS(DHS), bertanggung jawab untuk menentukan dan dianalisis.Aplikasi komersial pasti akan
yang adaaplikasi dan jenis data dapat membantu digunakandalam integrasi besar ini. Mungkin
organisasimemenuhi tujuannya, memigrasikan sebagian besar usahaakan diselesaikan dengan
data menjadi aman, dapat digunakan,state-of- data warehouse dan datamartteknologi.
the-art framework, dan mengintegrasikan yang Informatica, di antara perangkat lunak
berbedajaringan dan standar data dari 22 lainnyavendor, telah mengembangkan solusi
lembaga federal,dengan 170.000 karyawan, yang integrasi data itumemungkinkan organisasi
bergabung untuk membentukDHS. Tugas ini untuk menggabungkan sistem yang
harus diselesaikan pada pertengahan tahun berbedamembuat informasi lebih mudah diakses
2005. Itu nyatamasalah adalah bahwa agen di seluruhsebuah organisasi. Perangkat lunak
federal secara historis beroperasiotonom, dan tersebut mungkin ideal untuk seperti ituproyek
sistem TI mereka tidakdirancang untuk saling berskala besar.
beroperasi satu sama lain. Pada dasarnya,DHS
perlu menghubungkan silo data bersama. Idenya adalah memutuskan dan menciptakan
perusahaanarsitektur (lihat Permohonan Kasus
DHS memiliki salah satu pengumpulan informasi 5.2) untuk federal danlembaga negara yang
yang paling kompleksdan proyek migrasi data terlibat dalam keamanan dalam negeri.
sedang berlangsung dipemerintah federal. Arsitekturakan membantu menentukan
Tantangan untuk memindahkan datadari sistem keberhasilan tanah airpertahanan. Langkah
warisan (lihat Aplikasi Perkara 5.2), dalamatau pertama dalam memigrasikan data adalah
lintas agensi, adalah sesuatu yang harus mengidentifikasi semuaaplikasi dan data yang
dilakukan oleh semua departemenalamat. Rumit digunakan. Setelah mengidentifikasi aplikasidan
masalah adalah kebanyakanaplikasi penuaan database, langkah selanjutnya adalah
cepat dan database di seluruhpemerintah. menentukanyang digunakan dan mana yang
Peningkatan integrasi data berada di bawahjalan dibuang. Setelah sebuah organisasimengetahui
di tingkat federal, lokal, dan negara bagian. data dan aplikasi apa yang ingin disimpan,proses
Pemerintahmenggunakan alat dari dunia usaha. yang sulit untuk memindahkan data dimulai.
Pertama, itu perluuntuk mengidentifikasi dan
Masalah besar terjadi karena masing- membangun sebuah thread umum didata.
masingagensi memiliki seperangkat aturan Tantangan utama lainnya dalam migrasi
bisnisnya sendiri yang menentukan bagaimana dataarena adalah keamanan, terutama ketika
caranyadata dijelaskan, dikumpulkan, dan berhadapan dengan data danaplikasi yang sudah
diakses. Beberapa daridata tidak terstruktur dan berumur puluhan tahun.
XML dengan cepat menjadi bahasa standar untuk integrasi database dan
datatransfer(Balen, 2000). Pada tahun 2004, sekitar 40 persen dari semua
transaksi e-commerceterjadi pada server XML Ini naik dari 16 persen pada 2002
(lihat Savage, 2001) TXML dapat merevolusi pertukaran data elektronik dengan
menjadi data universalpenerjemah (Savage, 2001). Pengembang sistem harus
sangat berhati-hati karena XMLtidak bisa mengatasi logika bisnis yang buruk
Jika proses bisnis buruk, tidak ada integrasi datametode akan
memperbaikinya.Meskipun XML adalah cara terbaik untuk bertukar data antar
aplikasi danorganisasi, masalah penting adalah apakah itu dapat berfungsi
dengan baik sebagai format database aslidalam praktek. XML adalah
ketidakcocokan dengan database relasional: ia bekerja, namun sulit untuk
dipelihara.Ada kesulitan dalam kinerja, khususnya dalam mencari database
besar.XML menggunakan banyak ruang. Meski begitu, ada mesin database XML
asli. Lihat DeJesus(2000) untuk lebih lanjut tentang ini.
Program Extract, Transform, dan Load (ETL) semua proses dan operasi run-time (misalnya,
secara berkala ekstrak data dari sistem sumber, penjadwalan, manajemen kesalahan, log audit,
ubah mereka ke dalam format umum, dan statistik). ETL sangat penting untuk integrasi
kemudian memuatnya ke target penyimpanan data dan data pergudangan.
data, biasanya gudang data atau data mart. Alat
ETL juga biasanya mengangkut data antar Sumber: Diadaptasi dari Wayne Erickson, "Evolusi dari
sumber dan target, mendokumentasikan ETL, "in What Works: Praktik Terbaik dalam Bisnis
bagaimana elemen data berubah menjadi Intelijen
mereka berpindah antara sumber dan target dan Data Warehousing, Vol. 15, Data Pergudangan
(mis., metadata), tukarkan metadata dengan Institute, Chatsworth, CA, Juni, 2003.
aplikasi lain sesuai kebutuhan, dan mengatur
1. Berpikir secara global dan bertindak secara 6. Gunakan prototipe sebagai generator
lokal. Rencanakan nterprisewide;Terapkan estimasi proyek.
secara bertahap. 7. Pikirkan integrasi pada berbagai tingkat
2. Tentukan komponen kerangka kerja abstraksi.
integrasi. 8. Berharap untuk membangun logika aplikasi
3. Fokus pada tujuan yang digerakkan oleh ke dalam perusahaan infrastruktur.
bisnis dengan biaya tinggi dankompleksitas 9. Tetapkan tanggung jawab proyek setinggi-
teknis rendah. tingginyatingkat perusahaan dan rnegosiasi,
4. Perlakukan sistem perusahaan sebagai bernegosiasi, bernegosiasi.
aplikasi strategis Anda. 10. Merencanakan pencatatan pesan dan gudang
5. Mengejar penggunaan ulang, pendekatan untuk dilacakaudit dan pemulihan.
berbasis templatepengembangan. 11. Beli lebih banyak dari yang Anda butuhkan
untuk fase tertentu.
Setiap organisasi memiliki data yang berlebihan, data yang salah,data yang hilang, dan data miscoded,
mungkin terkubur dalam system yang tidak banyak berkomunikasi. Ini lotengmasalah akrab bagi sebagian
besar pemilik rumah: Melemparkancukup kotak pakaian musiman, trim liburan, familyhistorydokumen,
dan barang penting lainnya, dan segerakekacauan itu terlalu besar untuk dikelola. Itu terjadi di perusahaan,
terlalu. Beberapa unit operasi, pabrik, danfasilitas lain mungkin semua menjalankan aplikasi vendor yang
berbedauntuk penjualan, sumber daya manusia, dan tugas lainnya. ItuCampuran data yang berbeda
membuat sebuah berkas dari unsorted daninformasi yang tidak didamaikan. Integrasi menjadi
utamaupaya.
MEMBERSIHKAN RUMAH:
Sebelum data apa pun dapat dibersihkan, departemen TI Andaharus membuat rencana untuk mencari dan
mengumpulkan semua data
dan kemudian memutuskan cara mengelolanya. Praktisitawarkan saran ini:
1. Tentukan jenis informasi apa yang harus diambil. Buat komite pemetaan data kecil
untukmelakukan hal ini.
2. Cari perangkat lunak pemetaan yang dapat memanen data dari banyak sumber, termasuk aplikasi
warisan, PC file, dokumen HTML, sumber tidak terstruktur, dan sistem perusahaan Beberapa
vendor telah berkembang perangkat lunak semacam itu
3. Mulailah dengan proyek bernilai tinggi. Integrasi pertama proyek harus dalam unit bisnis yang
menghasilkan pendapatan tinggi Ini membantu mendapatkan manajemen tingkat atas membeli di.
4. Buat dan pelembagaan proses untuk pemetaan, pembersihan, dan pengumpulan data. Perusahaan
harus terus menerusambil informasi dari yang berbeda
sumber.
Sumber: Diadaptasi dari Kim S. Nash, "Penggabungan
Penggunaan Ofthe Web telah memiliki dampak luas pada komputasi kolaboratif
di Indonesiabentuk groupware (Bab 7), sistem informasi perusahaan (Bab
8),sistem manajemen pengetahuan (Bab 9), sistem manajemen dokumen,
danseluruh area desain antarmuka, termasuk sistem informasi perusahaan
lainnya:
ERP / ERM, CRM, PLM, dan SCM.
Peran utama DBMS adalah mengelola data. Dengan mengelola, kami bermaksud
membuat, menghapus,mengubah, dan menampilkan data. DBMS memungkinkan
pengguna untuk melakukan query data dan juga untuk menghasilkanlaporan.
Untuk rinciannya, lihat Ramakrishnan dan Gehrke (2002). Pengelolaan database
yang efektifdan pengambilan dapat menghasilkan manfaat yang sangat besar
bagi organisasi, seperti yang terlihat dalamsituasi Aviall Inc., yang dijelaskan
dalam DSS dalam Action 5.11.
Source: Adapted from Marc L. Songini, "Distribution Deal Prods Tight IT Ties Between Aviall, Rolls-Royce," ComputerWorld,
January 14,2002.
RELATIONAL DATABASES
Bentuk relasional dari organisasi basis data DSS, digambarkan sebagai tabular
atau flat, memungkinkanpengguna untuk berpikir dalam bentuk tabel dua
dimensi, yang merupakan cara banyak orang melihatlaporan data DBMS
relasional memungkinkan beberapa permintaan akses. Dengan demikian, file
data terdirisejumlah kolom melanjutkan halaman. Setiap kolom dianggap
terpisahbidang. Baris pada halaman mewakili catatan individu yang terdiri dari
beberapa bidang, yaituDesain yang sama yang digunakan oleh spreadsheet.
Beberapa file data semacam itu dapat dihubungkan olehsarana bidang data
umum yang ditemukan dalam dua (atau lebih) file data. Nama-nama
umumbidang harus dieja persis sama, dan bidang harus berukuran sama
(samajumlah byte) dan jenis (mis., alfanumerik atau dolar). Misalnya, pada
Gambar 5.1
bidang data Nama Pelanggan ditemukan baik di pelanggan dan file penggunaan,
dan dengan demikianmereka terkait. Nomor data bidang Produk ditemukan
dalam file produk dan file penggunaan. Melalui hubungan umum inilah ketiga
file tersebut saling terkait dan masukkombinasi membentuk basis data
relasional.
Keuntungan dari jenis basis data ini adalah bahwa mudah bagi pengguna untuk
belajar, adalahmudah diperluas atau diubah, dan dapat diakses dalam sejumlah
format yang tidak diantisipasipada saat desain awal dan pengembangan
HIERARCHICAL DATABASES
Struktur basis data jaringan memungkinkan tautan yang lebih rumit, termasuk
koneksi lateralantar item terkait. Struktur ini juga disebut model CODASYL. Bisa
menghemat ruang penyimpanan melalui pembagian beberapa item. Misalnya,
pada Gambar 5.1,Green and Brown share S.l dan T.l.
OBJECT-ORIENTED DATABASES
Untuk aplikasi-aplikasi web dari basis data multimedia, lihat Maybury (1997),
dandemonstrasi multimedia di Web, termasuk produk Macromedia dan
Visual Intelligence Corporation. Lihat juga DSS dalam Tindakan 5.13. Dalam DSS
dalam Tindakan 5.14,kami menggambarkan bagaimana sebuah perusahaan
produksi film animasi memanfaatkan beberapa multimediadatabase untuk
mengembangkan film Jimmy Neutron: Boy Genius. Basis data dan
manajerialTeknik sejak itu menyebabkan biaya produksi keseluruhan lebih
rendah untuk tele animasi. 1 seri penglihatan.
Glenn Palmier, manajer pengolahan data untuk G. PierceWood Memorial Hospital (GPW), tidak
senang ituvendor sistem manajemen database-nya,InterSystems Corp., melakukan upgrade ke
sebuah object-orientedarsitektur dalam produk intinya, CACHE. Padawaktu, GPW memiliki 45
sistem yang berbeda yang dikembangkan lebih dari 15tahun di fasilitas kesehatan mental negara
di Arcadia,Florida. Pengoperasian yang lancar dan akses data yang cepatpenting untuk GPW.
Vendor bergerak cepat, mengurangirencana konversi lima tahun sampai delapan bulan. Pada
saat itu,GPW telah mengubah semua sistemnya menjadi berorientasi objekdan berbasis web.
GPW memusatkan perhatian pada kegunaan data diproses konversi Database telah
diperbaruibekerja lebih baik di lingkungan berorientasi objek baru.Setelah merekayasa ulang
basis data dan meningkatkan,Sistem baru berlari lebih cepat dari sebelumnya. Sebagai
contoh,sistem lama membutuhkan hampir dua jam untuk melakukanpermintaan tertentu Sistem
baru memakan waktu kurang dari satu menit.Personil telah dengan mudah dan cepat dilatih
disistem baru, dan penggunaan browser Web untuk mengakses datasangat cocok dengan
strategi Internet negara bagian.
Source: Adapted from Jon William Toigo, "Objects Are Good for Your Mental Health." Enterprise
Systems, June 2001, pp. 34-35.
DOCUMENT-BASED DATABASES
Source: Condensed and adapted from the Web sites and publicly
advertised information of various vendors.
Produser dan animator mengerjakan film JimmyNeutron: Boy Genius melacak ribuan
bingkaiempat database besar. Produksi DNA (Irving,Texas), perusahaan jasa animasi yang
bekerjadengan Nickelodeon dan penulis skenario dan sutradara SteveOedekerk untuk
memproduksi film tersebut, membahas masalah tersebutdari merakit 1800 tembakan yang
terdiri dari 82-menit dengan mencatat dan melacak mereka dalam empatDatabase FileMaker
Pro. Satu papan cerita awal yang dilacak,yang lain melacak bidikan yang diberikan kepada
individuseniman, yang ketiga melacak kemajuan setiap framesepanjang proses produksi, dan
Source: Adapted from Stephanie Overby, "Animation Animation," CIO, 2002, May 15,2002, pp.
22-24.
INTELLIGENT DATABASES
Teknologi kecerdasan buatan (Al), khususnya agen cerdas berbasis Web dan
jaringan saraf tiruan (JST), mempermudah akses dan manipulasi kompleks
database. Antara lain, mereka dapat meningkatkan sistem manajemen basis data
dengan menyediakannya dengan kemampuan inferensi, menghasilkan database
cerdas.
Agen cerdas dapat meningkatkan pencarian basis data, terutama di gudang data
besar. Mereka juga dapat mempertahankan preferensi pengguna (mis.,
Amazon.com) dan meningkatkan kemampuan pencarian dengan mengantisipasi
kebutuhan pengguna. Ini adalah konsep penting yang pada akhirnya mengarah
ke komputasi di mana-mana. Lihat DSS di Fokus 5.15 untuk rincian
perkembangan terkini di agen cerdas.
Ada banyak agen perangkat lunak yang digunakan saat ini. Merekaditemukan dalam sistem
bantuan, mesin pencari, dan perbandingan belanjaalat. Selama beberapa tahun ke depan, sebagai
teknologidewasa dan agen secara radikal meningkatkan merekanilai dengan berkomunikasi satu
sama lain, mereka akan secara signifikanmempengaruhi proses bisnis organisasi.Pelatihan,
dukungan keputusan, dan berbagi pengetahuan akanterpengaruh, tetapi para ahli melihat
pengadaan sebagai pembunuhpenerapan agen bisnis-ke-bisnis. Cerdasagen perangkat lunak
(bot) fitur pemicu yang memungkinkan merekauntuk mengeksekusi tanpa campur tangan
manusia. Kebanyakan agenjuga menampilkan pembelajaran adaptif dari kecenderungan
pengguna danpreferensi dan personalisasi tawaran berdasarkan apamereka belajar tentang
pengguna.
Salah satu tujuan pengembang perangkat lunak adalahmengembangkan mesin yang melakukan
tugas yang tidak dilakukan orangingin lakukan. Lainnya adalah mendelegasikan ke tugas-tugas
mesin diyang jauh lebih superior daripada manusia, seperti membandingkanharga, kualitas,
ketersediaan, dan biaya pengirimanitem
.
BotKnowledge.com Agen dapat secara otomatis melakukanpencarian cerdas, menjawab
pertanyaan, memberi tahu Andaketika suatu peristiwa terjadi, pengiriman berita individual,
tutor,dan toko perbandingan.Agen bermigrasi dari sistem ke sistem, berkomunikasidan
bernegosiasi satu sama lain. Mereka berkembangdari fasilitator menjadi pengambil keputusan.
5 . 7 DATA WAREHOUSING
Lihat Gambar 5.2 untuk kerangka kerja dan pandangan data warehouse.
Edelstein (1997) menyajikanpengenalan umum yang baik untuk data
pergudangan. Mannino (2001) membahas Data Warehouseteknologi dan
manajemen.
METADATA
Ada beberapa arsitektur dasar untuk data pergudangan. Dua tingkat dan tiga
tingkatarsitektur cukup umum, tetapi terkadang hanya ada satu tingkat.
McFadden,Hoffer, dan Prescott (2003) membedakan antara ini dengan membagi
gudang datamenjadi tiga bagian:
1. Data warehouse itu sendiri, yang berisi data dan perangkat lunak terkait
2. Perangkat lunak akuisisi data (back-end), yang mengekstrak data dari
sistem warisandan sumber eksternal, mengkonsolidasikan dan
meringkasnya, dan memasukkannya ke dalamgudang data
3. Perangkat lunak (front-end) klien, yang memungkinkan pengguna untuk
mengakses dan menganalisis data dalamgudang (misalnya, mesin DSS /
BI / BA)
Dalam arsitektur two-tier, mesin DSS berada di platform yang sama dengan
gudang.Oleh karena itu, lebih ekonomis daripada struktur three-tier. Lihat
Gambar 5.4. LihatMimno (1997) untuk lebih lanjut tentang arsitektur data
warehouse.
Struktur data warehouse yang khas ditunjukkan pada Gambar 5.2. Proses
migrasidata ke data warehouse melibatkan ekstraksi data dari semua sumber
yang relevan.Sumber data dapat terdiri dari file yang diambil dari basis data
OLTP, spreadsheet, pribadidatabase (mis., Microsoft Access), atau file eksternal.
Biasanya, semua masukanfile ditulis ke satu set tabel pementasan, yang
dirancang untuk memfasilitasi bebanproses. Sebuah gudang data berisi banyak
aturan bisnis yang mendefinisikan hal-hal semacam ituseperti bagaimana data
akan digunakan, aturan summarization, standarisasi attrib-utes yang dikodekan,
dan aturan perhitungan. Masalah kualitas data apa pun yang terkait dengan file
sumber perluharus dikoreksi sebelum data dimuat ke dalam gudang data. Salah
satu manfaatnyadari gudang data yang dirancang dengan baik adalah bahwa
aturan-aturan ini dapat disimpan dalam metadatarepositori dan diterapkan ke
gudang data secara terpusat. Ini berbeda dariPendekatan OLTP, yang biasanya
memiliki data dan aturan bisnis yang tersebar di seluruhsistem. Proses
pemuatan ke dalam gudang data dapat dilakukan melaluialat transformasi data
yang menyediakan antarmuka pengguna grafis untuk membantu dalam
pengembangandan pengembangan aturan bisnis pemeliharaan atau melalui
lebih tradisionalmetode dengan mengembangkan program atau utilitas untuk
memuat gudang data menggunakan pemrogramanbahasa seperti PL / SQL, C ++,
atau .Net. Keputusan ini tidak dating ringan untuk organisasi. Ada beberapa
masalah yang mempengaruhi apakah suatu organisasiakan membeli alat
transformasi data atau membangun proses transformasi itu sendiri.Ini
termasuk:
Berikut ini daftar praktik terbaik untuk menerapkan data gudang. Mereka telah ditunjukkan
dalam praktek dan merupakan seperangkat pedoman yang sangat baik untuk diikuti.
• Proyek harus sesuai dengan strategi perusahaan dan tujuan bisnis.
• Harus ada dukungan penuh untuk proyek tersebut (eksekutif, manajer, pengguna).
• Mengelola harapan.
• Gudang data harus dibangun secara bertahap.
• Bangun kemampuan beradaptasi.
• Proyek harus dikelola oleh IT dan bisnis profesional.
• Mengembangkan hubungan bisnis / pemasok.
• Hanya memuat data yang sudah dibersihkan dan a kualitas yang dipahami oleh organisasi.
• Jangan mengabaikan persyaratan pelatihan.
• Berhati-hatilah secara politis.
Source: Adapted from Robert Weir, "Best Practices for Implementing a Data Warehouse," Journal of Data Warehousing, Vol. 7,
No. 1, Winter, 2002, pp. 21-29.
Ada banyak risiko dalam proyek-proyek data warehouse. Palingdari mereka juga ditemukan di
proyek TI lainnya (lihat Bab6), tetapi mereka lebih serius di sini karena gudang dataadalah
proyek berskala besar dan mahal. Setiap risikoharus dinilai pada awal proyek. Lihat
sumber untuk informasi tentang detail dan cara mengurangiresikonya:
• Tidak ada misi atau tujuan
• Kualitas data sumber tidak diketahui
• Keterampilan tidak dilakukan
• Anggaran yang tidak memadai
• Kurangnya perangkat lunak pendukung
• Data sumber tidak dipahami
• Lemahnya sponsor.
• Pengguna tidak melek komputer
• Masalah politik, perang darat
Harapan pengguna yang tidak realistisRisiko arsitektur dan desainLingkup creep dan perubahan
persyaratanVendor di luar kendaliBeberapa platformOrang-orang kunci dapat meninggalkan
proyekHilangnya sponsorTerlalu banyak teknologi baruHarus memperbaiki sistem
operasionalLingkungan yang terdistribusi secara geografisGeografi tim, budaya bahasa
Source: Adapted from Sid Adelman and Larissa Moss, "Data Warehouse Risks," Journal of Data Warehousing, Vol. 6, No. 1,
Winter, 2001, pp. 9-15.
Ketika mengembangkan gudang data yang sukses, hati-hatiuntuk masalah ini (lihat penjelasan
tentang masing-masing):
1. Dimulai dengan rantai sponsor yang salah. Kamumembutuhkan sponsor eksekutif
dengan pengaruh atassumber daya yang diperlukan untuk mendukung dan berinvestasi
dalamgudang data. Anda juga membutuhkan seorang eksekutifdriver proyek, seseorang
yang telah mendapatkanmenghormati eksekutif lain, memiliki skeptisisme yang
sehattentang teknologi, dan bersifat menentukan tetapi fleksibel.Dan Anda
membutuhkan manajer SI / TI untuk mengepalaiproyek (Anda dalam proyek).
2. Menetapkan ekspektasi bahwa Anda tidak dapat bertemu dan membuat frustrasipara
eksekutif pada saat kebenaran. Adadua fase dalam setiap proyek pergudangan data:
Fase1 adalah fase penjualan, di mana Anda memasarkan secara internalproyek dengan
menjual manfaat bagi mereka yang memilikinyaakses ke sumber daya yang dibutuhkan.
Tahap 2 adalah perjuangan untukmemenuhi harapan yang dijelaskan dalam fase 1.
Untuk ahanya $ 1-7 juta, semoga Anda dapat mengirimkannya.
3. Terlibat dalam perilaku naif secara politis. Jangan begitu sajamenyatakan bahwa gudang
data akan membantu manajermembuat keputusan yang lebih baik Ini mungkin
Ini mungkin alami, tetapi tidak optimal atau bahkanpraktis. Manajer sibuk dan perlu waktu
untuk membacalaporan. Sistem lansiran lebih baik dan dapat membuat datamisi gudang kritis.
Sistem waspada memantaudata mengalir ke gudang dan menginformasikan semua orang kunci
dengan kebutuhan untuk mengetahui segera setelah peristiwa kritisterjadi. "
Source: Adapted from R. C. Barquin, A. Paller, and H. Edelstein, "Ten Mistakes to Avoid for Data Warehousing Managers,"
Chapter 7 in R. Barquin and H. Edelstein. (eds.). Building, Using, and Managing the Data Warehouse, Upper Saddle River, NJ:
Prentice Hall PTR, 1997.
1. Dukungan manajemen
2. Juara
3. Sumber Daya
4. Partisipasi pengguna
5. Keterampilan tim
6. Sistem sumber
7. Teknologi pengembangan
Di banyak organisasi, gudang data hanya akan berhasil jika ada yang
kuatdukungan manajemen senior untuk pengembangannya dan juara proyek
(lihat yang terbaikpraktik, risiko, dan kesalahan yang dijelaskan di atas).
Meskipun orang mungkin berpendapat bahwa iniakan benar untuk setiap
proyek teknologi informasi, itu sangat penting untuk sebuahgudang data.
Keberhasilan implementasi hasil data warehouse dipembentukan kerangka
kerja arsitektur yang memungkinkan untuk analisis keputusandi seluruh
organisasi dan dalam beberapa kasus juga menyediakan supplychain yang
komprehensifmanajemen dengan memberikan akses ke pelanggan dan pemasok
organisasi.Implementasi gudang data berbasis Web (Webhousing) telah
memfasilitasi kemudahanakses ke sejumlah besar data, tetapi sulit untuk
menentukan manfaat sulit yang terkait
dengan gudang data. Manfaat-manfaat sulit didefinisikan sebagai manfaat bagi
suatu organisasiyang dapat diekspresikan dalam istilah moneter. Banyak
organisasi yang memiliki teknologi informasi terbatassumber daya dan harus
memprioritaskan proyek mana yang akan dikerjakan terlebih dahulu.Dukungan
manajemen dan jawara proyek yang kuat dapat membantu memastikan bahwa
gudang dataproyek akan menerima sumber daya yang diperlukan untuk
implementasi yang sukses. Datasumber daya gudang dapat menjadi biaya yang
signifikan, dalam beberapa kasus membutuhkan prosesor high-enddan
peningkatan besar dalam perangkat penyimpanan akses langsung (DASD).
Gudang berbasis webmungkin juga memiliki persyaratan keamanan khusus
untuk memastikan bahwa hanya berwenangpengguna memiliki akses ke data.
Hicks (2002) menjelaskan basis data dan gudang data yang sangat besar. Pada
tahun 2002, Wal-Martgudang data diperkirakan memiliki kapasitas 200-
terabyte. Petabytecapacity pertamagudang data dibuat tersedia pada awal 2004.
Karena penyimpanandiperlukan untuk mengarsipkan rekaman berita, CNN
berencana untuk menjadi salah satu organisasi pertamamenginstal gudang data
berukuran petabyte (lihat Newman, 2002).
Allan (2001) memberikan contoh yang sangat baik dari sebuah gudang data. Dia
membahas masalahterkait dengan pemodelan data catatan siswa untuk
digunakan dalam data catatan siswabagian mart dari gudang data untuk
perguruan tinggi atau universitas. Ryder menggunakan gudang datanyauntuk
logistik. Lihat DSS dalam Tindakan 5.22.
Pada April 2002, Sears, Roebuck and Co. telah menggunakan 95 ee menggunakan gudang data
untuk tujuan analitis, terabyte kapasitas penyimpanan baru, tiga kali lipat kapasitasnya. Mereka
bisa mendapatkan informasi penjualan-produk harian, menganalisis Ini memungkinkan Sears
mengkonsolidasikan dua penyimpanan data utama - pembelian pelanggan individu, dan
berkorelasi rumah dan membangun jaringan area penyimpanan yang menangani mereka dengan
pembelian sebelumnya, gudang persediaan dan penjualan data dengan pelanggannya informasi.
Dengan sistem ini, Sears dapat melakukan pengiriman promosi yang ditargetkan secara efektif.
Sekitar 5.000 karyawan Sears menggunakan gudang data untuk tujuan analitis, Mereka dapat
memperoleh informasi penjualan produk setiap hari, menganalisisnya dengan pembelian
sebelumnya, pembelian pelanggan individu, dan berkorelasi
Dengan gudang data baru, Ryder Systems Inc. memilikidirubah strategi e-commerce untuk lebih
mencocokkan1000 pelanggan armada dan operator umum dengan pengirimanyang harus segera
dipindahkan. Upaya itu ditujukandalam memperluas rantai pasokan manajemen armada
Ryderbisnis. Sistem ini menggunakan analisis transportasipaket berdasarkan teknologi dari NCR
Corp'sDivisi data warehouse Teradata dan MicroStrategyInc., vendor perangkat lunak analisis
Salah satu contoh informasi yang tepat waktu menjadi sangat pentingWal-Mart terjadi setelah
serangan 11 September,2001. Wal-Mart dapat dengan cepat mengidentifikasi pembelianpola
pelanggannya pada hari serangan sebagaipermintaan senjata, air kemasan, dan perlengkapan
bertahan hidupmeningkat, dan kemudian beralih ke bendera Amerika harisetelah itu. Wal-Mart
bisa bertemu pelangganmenuntut dengan cepat dan dapat merencanakan dengan tepat. Itu
bisauntuk memproyeksikan bahwa pelanggan menunda pembelian normalselama beberapa hari,
dan diharapkan dan bertemu yang tidak biasapermintaan yang lebih tinggi sesudahnya.
5 . 8 DAT A MARTS
Data mart adalah bagian dari gudang data, biasanya terdiri dari satu area subjek
(mis., pemasaran, operasi). Sebuah data mart dapat bergantung atau
independen. SEBUAHdependent data mart adalah subset yang dibuat langsung
dari data warehouse. Memilikikeuntungan menggunakan model data yang
konsisten dan menyediakan data yang berkualitas. Tergantungdata mart
mendukung konsep model data perusahaan tunggal, tetapi gudang dataharus
dibangun terlebih dahulu. Mart data dependen memastikan bahwa pengguna
akhirmelihat versi yang sama dari data yang diakses oleh semua pengguna data
warehouse lainnya.
Menurut laporan IDC yang dikeluarkan pada musim gugur 2002, organisasi yang
telah berhasildiimplementasikan dan digunakan aplikasi analitik telah
menyadari pengembalian mulaidari 17 persen menjadi lebih dari 2000 persen,
dengan median ROI sebesar 122 persen ("TheDampak Keuangan dari Business
Analytics, "IDC, Oktober 2002; juga lihat Kaliebe, 2003).Meski begitu, lebih dari
setengah dari semua proyek intelijen bisnis gagal. Seperti halnya data
pergudangan,kegiatan intelijen bisnis harus dilihat, tidak hanya sebagai
perangkat lainproyek TI, tetapi sebagai strategi, visi, dan arsitektur yang terus
berkembang secara terus-menerusberusaha menyelaraskan operasi dan arahan
organisasi dengan strateginyatujuan bisnis. Kami membahas gagasan bahwa BI
/ DSS tidak pernah benar-benar lengkap dalam Bab6. Mereka terus berkembang.
Perusahaan mencapai sukses ketika mereka melakukan hal berikut(lihat Atre,
2003):
Buat keputusan yang lebih baik dengan kecepatan dan kepercayaan diri yang
lebih tinggi.
Merampingkan operasi.
Mempersingkat siklus pengembangan produk.Maksimalkan nilai dari lini
produk yang ada dan antisipasi peluang baru.
Ciptakan pemasaran yang lebih baik, lebih terfokus, serta hubungan yang lebih
baikpelanggan dan pemasok.
Alat intelijen bisnis (baik data mining dan OLAP) telah digunakan untuk
mengidentifikasipencurian kerah putih dalam organisasi. Mereka mampu
mengidentifikasi faktur yang meningkat,penggelapan, peniruan identitas
pelanggan, dan pelanggaran serupa. Perkiraan totalpenipuan di Inggris hampir $
30 miliar (AS). Penipuan yang dilakukan olehkaryawan menyebabkan kerugian
rata-rata sebesar $ 60.000, sementara penipuan dilakukan oleh manajer
ataueksekutif menyebabkan kerugian rata-rata $ 250.000. Ketika manajer dan
karyawan bersekongkol,kerugian median naik menjadi $ 500.000. Jika semua
sistem data internal terintegrasi dengan datagudang untuk analisis penipuan
sehingga mereka dapat dibandingkan dengan data terkait penipuan
eksternalPola dan anomali menjadi lebih mudah diidentifikasi. Kegiatan yang
mencurigakan bisa terjaditerisolasi, diukur, dan dilacak. Lihat Dorrington
(2003) untuk detailnya.
Lebih dari 570 eksekutif TI menanggapi CIO Studi Penelitian Intelijen Bisnis Insight. CIO
Wawasan menemukan beberapa fakta menarik tentang arus keadaan intelijen bisnis.
Source: Adapted from "The 2003 CIO Insight Business Intelligence Research Study: Are Your BI Systems Making You Smarter?"
CIO Insight, No. 26, May 23,2003.
Source: Adapted from Shaku Atre, "The Top 10 Critical Challenges for Business Intelligence Success." ComputerWorld, White
Paper/Special Advertising Supplement, Vol. 37, No. 26, June 30,2003.
Hudson's Bay Co. berubah 333 pada Mei 2003. Terlepas dari ituusia, Hudson's Bay
meningkatkan sistem informasinyamemberi para eksekutif, manajer toko, dan metode pemasok
utamauntuk menganalisis rim penjualan dan data pelanggan. ItuMenantang wajah perusahaan
adalah untuk menentukan bagaimana mengubahdata menjadi informasi yang berguna.
Perusahaan menggunakan duagudang data dan alat intelijen bisnis daridivisi Teradata NCR Corp
untuk melacak make aindkeputusan tentang inventaris dan penjualan produk.
Di Harry Rosen Inc., rantai 17 pakaian priatoko, eksekutif menggunakan alat analisis data Cognos
Inc.diintegrasikan ke dalam sistem merchandise. Masih ada lagidari selusin laporan penjualan
dan inventaris untuk dianalisispenjualan yang membantu perusahaan mengidentifikasi tren
penjualan, kelolapersediaan, dan meningkatkan margin laba kotor.
Menggunakan intelijen bisnis dan alat analisis dariBusinessObjects SA, TruServ Corp.
(perusahaan indukPerangkat Keras True Value dan Rental Taylor)mengurangi persediaan "zona
merah" nya (produk yang adatidak terjual dalam satu setengah tahun) dengan $ 50 juta selama
dua tahundengan menganalisis stok produk. Untuk satu tahun, ituSistem juga telah
mengidentifikasi produk yang berada di 14 distribusinyapusat yang mungkin menjual lebih baik
di bagian lainnegara.
Toko sedang belajar dari pengecer online tentang bagaimanauntuk melakukan penyelidikan
analitik terhadap kinerja pelanggan.Misalnya, J. Crew Group dan Nordstrom Inc.gunakan
DigiMine untuk menganalisis penjualan online. Nordstrom memiliki sebuahsituasi tempat
pembeli daring menelusuricincin pusar sama seperti yang dikenakan oleh modeliklan.
Nordstrom dapat dengan cepat memperolehnyacincin untuk toko dan pelanggan online, bahkan
meskipun belum membawa produk itu sebelumnya.
Penilaian intelijen bisnis adalah biaya rendah, dapat ditindaklanjutipemeriksaan ketiga bidang
penting untuk implementasidari setiap inisiatif intelijen bisnis:
• Analisis kebutuhan bisnis: Analisis yang mendasarinyasasaran dan tujuan bisnis strategis dan
taktisyang mendorong pengembangan solusi BI,
termasuk apakah sponsor eksekutif danpendanaan tersedia.
• Analisis organisasi: Analisis yang adastruktur organisasi bisnis dan teknis,termasuk tingkat
kemitraan TI / bisnis di Indonesiatempat, budaya dan kepemimpinan organisasigaya,
pemahamannya tentang konsep BI, apakahperan dan tanggung jawab telah ditetapkan,dan
apakah orang dengan jumlah yang sesuaiwaktu dan keterampilan dalam plau
Penilaian memaksa organisasi untuk memeriksakekuatan dan kelemahan dalam tiga area ini
danmembuat rekomendasi tentang cara memperbaiki potensiarea masalah. Idealnya lakukan
analisis seperti itu sebelumnyamengembangkan sistem yang mahal, termasuk gudang
data,OLAP, dan penambangan data. Penilaian itu sendirimembantu membangun kesadaran dan
dukungan untuk inisiatif.
Source: Adapted from T. Burzinski, "The Case for Business Intelligence Assessments," DM Review, July 2002.
Web telah memiliki dampak besar pada bagaimana alat-alat ini berfungsi dan
apa yang merekadigunakan untuk. Sifat visual dari kebanyakan perangkat
intelijen bisnis sering didasarkan padaAntarmuka browser web. Seiring
meningkatnya penggunaan Web dan e-commerce, ada lebih banyak
apermintaan untuk mengumpulkan dan menganalisis data dari clickstream,
untuk mengidentifikasi di mana pelanggan pergi di situs Web, dari mana mereka
berasal, ke mana mereka pergi sesudahnya, dan apamereka membeli atau tidak
membeli. (Sistem ini sering disebut kecerdasan Web / analisis Web;lihat Bagian
5.14.) Menggabungkan ini dengan data sensus dan informasi geografissistem,
perusahaan dapat mengidentifikasi apa yang menjadi target pasar untuk
pelanggan baru yang ada dan potensial.Kami menunjukkan basis data dan
teknologi intelijen bisnis dan Webdampak pada Tabel 5.5.
10 tahun pertama intelijen dan data bisnisinisiatif pergudangan telah menghasilkan banyak
keberhasilan,aplikasi teknologi informasi pengembalian tinggi.Berikut beberapa pelajaran
penting yang harus diikutidan diperiksa untuk membantu memastikan kesuksesan:
Jadikan kecerdasan bisnis bukan hanya analitislaporan, tetapi informasi seorang manajer atau
eksekutifperlu membuat keputusan.Gunakan beberapa teknologi intelijen bisnis yang berbeda
yang terintegrasi dengan baik. V
Source: Adapted from Richard Skriletz, "New Directions for Business Intelligence," DM Review, April 2002, p. 10.
Untuk lebih lanjut tentang intelijen bisnis, lihat Bolen (2003), Burzinski (2002),
Callaghan(2003a), Delic dan Dayal (2003), Dorrington (2003), Kaliebe (2003),
Kurtyka (2003),Leon (2003), Loshin (2003), Pallatto (2002a, b), Smith (2001),
Songini (2003), Ulfelder(2000a), Vitt, Luckevich, and Misner (2002), dan
Whiting (2003).
Akses terhadap data sering dibutuhkan oleh aplikasi OLTP dan MSS. Sayangnya,
mencoba untuk melayani kedua jenis permintaan mungkin bermasalah (Gray
danWatson, 1998). Oleh karena itu, beberapa perusahaan memilih untuk
memisahkan basis data ke OLTPjenis dan jenis OLAP. Jenis OLAP didasarkan
pada gudang data.Meski begitu, Gonzales dan Robinson (2003) menunjukkan
bahwa agar OLAP berfungsi dengan baik,sistem manajemen basis data
ING Antai Insurance Co. (Taiwan) menggunakan Server OLAP IBM untuk
menganalisis besarjumlah data untuk mendeteksi klaim curang dan
mempercepat pemrosesan klaim. Saya thanya butuh beberapa hari untuk
menganalisis data yang sebelumnya memakan waktu beberapa minggu.
Sebagaialat dan perangkat keras meningkat, klaim dapat dianalisis secara
instan. Biaya pemrosesanklaim sangat berkurang. Lihat Raden (1997). TCF Bank
memanfaatkan OLAP untuk menyediakaninformasi langsung kepada mereka
Bahasa query terstruktur (SQL) adalah bahasa data standar untuk akses data
danmanipulasi dalam sistem manajemen basis data relasional. Ini adalah bahasa
yang mirip bahasa Inggristerdiri dari beberapa lapis peningkatan kompleksitas
dan kemampuan. SQL digunakanuntuk akses online ke basis data, operasi DBMS
dari program, dan fungsi administrasi basis data. Ini juga digunakan untuk akses
data dan fungsi manipulasi beberapamemimpin produk perangkat lunak DBMS
(misalnya, Oracle, DB2, Ingres IBM).
Karena SQL tidak prosedural dan cukup user-friendly, banyak pengguna akhir
dapat menggunakannya untukkueri dan operasi basis data mereka sendiri. SQL
dapat digunakan untuk program yang ditulisdalam bahasa pemrograman
standar apa pun; dengan demikian, ini memfasilitasi integrasi perangkat lunak.
MendukungDSS / intelijen bisnis dilakukan di gudang dengan produk dari
vendorseperti Brio, BusinessObjects, Cognos, Pilot Software, dan SAS. SQL cukup
sederhanaAlat OLAP. Kekuatan nyata OLAP adalah kemampuan analitis
utamanya.
OLAP TOOLS
Menggunakan SQL dan akses data dan alat analisis konvensional lainnya sangat
membantu, tetapi tidakcukup, untuk OLAP. Di OLAP, kelas khusus alat
digunakan, yang dikenal sebagai dukungan keputusan / bisnisbagian depan
analitik / bisnis analitik, ujung depan akses data, basis dataujung depan, dan
sistem akses informasi visual. Metode-metode ini jauh melampauispreadsheet
dalam kekuasaan dan hasil. Alat-alat tersebut dimaksudkan untuk
memberdayakan pengguna.Alat OLAP memiliki karakteristik yang membedakan
mereka dari alat pelaporandirancang untuk mendukung aplikasi pelaporan
OLTP tradisional. Karakteristik dariAlat OLAP secara ringkas didefinisikan oleh
E. F. Codd dan rekan (1993); Codd dianggapmenjadi "penemu" model database
relasional. Dua belas aturan untuk
Alat OLAP dirangkum dalam Tabel 5.6 (lihat Raden, 1997). Mereka
mendefinisikan empat jenispemrosesan yang dilakukan oleh analis dalam suatu
organisasi:
1. Analisis kategori adalah analisis statis berdasarkan data historis. Itu
didasarkan ataspremis bahwa kinerja masa lalu adalah indikator masa
Ada ratusan alat OLAP yang tersedia saat ini. Mereka berbagi banyak fiturtetapi
juga memberikan beberapa perbedaan yang jelas (lihat DSS dalam Tindakan
5.30). Contoh dariOutput OLAP ditunjukkan pada Gambar 5.8, hasil dari Cognos
Impromptu Versi 7.0pertanyaan.
Kami menampilkan cuplikan layar dari Brio Performance Suite pada Gambar
5.11 dan Gambar5.12. Kemampuan drag dan drop berbasis Web, yang
menunjukkan bagaimana membangun sebuahlaporan dengan menyeret baris /
kolom untuk analisis, digambarkan pada Gambar 5.11. ItuPelaporan
Performance Suite dengan kemampuan OLAP digambarkan pada Gambar 5.12.
Catatancampuran grafik dan tabel.
Salah satu bank regional terbesar di Midwestern wilayah Amerika Serikat, TCF Bank memiliki
lebih dari390 cabang di enam negara bagian dan melayani pelanggan dari semuakelompok
pendapatan. TCF Bank memiliki aset dan $ 12,2 miliarmengoperasikan cabang perbankan
cabang terbesar keempatsistem di dalam negeri. TCF fokus pada kenyamananone-stop shop
untuk pelanggan; itu adalah salah satu dari sedikitbank di Amerika Serikat yang buka 12 jam per
hari,tujuh hari per minggu, termasuk hari libur.
Pengguna di grup utama bank (perbankan ritel,pinjaman konsumen, perbankan hipotek, broker)
ditemukanbahwa laporan TI tidak memenuhi kebutuhan mereka.Sebaliknya, mereka harus
mengembangkan proses kustom untuk mengunduhfile dari TI dan kemudian memuat data ke
dalam spreadsheetuntuk analisis lebih lanjut. Waktu yang diperlukan untuk membuat
laporan grafik standar hampir satu bulan. Itu mungkinluangkan enam minggu untuk
menghasilkan daftar pemasaran pelanggan.
Dengan sistem OLAP baru, yang mencakup aaplikasi cross-sell, TCF mampu mengidentifikasi
kelas-kelaspelanggan untuk mendekati layanan dan produk tertentu.Ini sangat penting dalam
Source: Adapted from Ted Ledman, "TCF Bank," What Works: Best Practices in Business Intelligence and Data Warehousing,
Vol. 15, The Data Warehousing Institute, Chatsworth, CA, June 2003, p. 10.
• Data sering terkubur jauh di dalam database yang sangat besar, yang kadang-
kadangmengandung data dari beberapa tahun. Dalam banyak kemudahan, data
dibersihkan dankonsolidasi dalam gudang data.
• Lingkungan penambangan data biasanya merupakan arsitektur client / server
atau a
Arsitektur berbasis web.
• Alat-alat baru yang canggih, termasuk alat visualisasi canggih,
membantubuang bijih informasi yang terkubur di file perusahaan atau arsip
public catatan Menemukannya melibatkan memijat dan synchiom / ing data llio
c untuk mendapatkanhasil yang benar. Pengolah data mutakhir juga
mengeksplorasi kegunaannyadata lunak (teks tidak terstruktur yang disimpan
di tempat-tempat seperti basis data Lotus Notes.file teks di Internet, atau
intranet perusahaan-lebar).
• Penambang sering menjadi pengguna akhir, diberdayakan oleh latihan data
dan kekuatan lainnyaalat kueri untuk mengajukan pertanyaan ad hoc dan
mendapatkan jawaban dengan cepat dengan sedikit atautidak ada keterampilan
pemrograman.
• Memerasnya kaya sering melibatkan menemukan hasil yang tidak diharapkan
dan membutuhkan pengguna akhiruntuk berpikir kreatif.
• Data mining loois mudah dikombinasikan dengan spreadsheet dan perangkat
lunak lainnyaalat pengembangan. Ilius, data yang ditambang dapat dianalisis
dandiproses dengan cepat dan mudah.
• Karena banyaknya data dan pencarian besar-besaran. Terkadangdiperlukan
untuk menggunakan pemrosesan paralel untuk penambangan data.Efektif
memanfaatkan alat dan teknologi penambangan data dapat menyebabkan
perolehandan mempertahankan keunggulan kompetitif strategis. Data mining
menawarkan organisasilingkungan pengambilan keputusan yang sangat
diperlukan untuk mengeksploitasi peluang baru denganmentransformasikan
Pola dan aturan ini dapat digunakan untuk memandu pengambilan keputusan
dan perkiraanefek keputusan. Penambangan data dapat mempercepat analisis
dengan memusatkan perhatian pada hal yang paling pentingvariabel penting.
Penurunan dramatis dalam rasio biaya / kinerja sistem computer telah
memungkinkan banyak organisasi untuk mulai menerapkan algoritma data yang
rumitteknik penambangan. Setiap kelas aplikasi penambangan data didukung
oleh satu set algoritmikpendekatan untuk mengekstrak hubungan yang relevan
dalam data. Pendekatan ini berbedadi kelas-kelas masalah yang dapat mereka
pecahkan (lihat Haskett, 2000b). Kelas-kelasadalah:
Pada Tabel 5.7, kami menunjukkan fungsi penambangan data ini bersama
dengan algoritme representative dan contoh aplikasi. Juga lihat Groth (1998).
Buck (2000) mengatur kelas alat dan teknik penambangan data sebagaimana
adanyaberhubungan dengan teknologi informasi dan intelijen bisnis.
Dalam penambangan data (dan OLAP), skalabilitas dari metode dan dari gudang
data(atau database) adalah masalah penting. Ini karena jumlah data
danpencarian diperlukan. Lihat Small and Edelstein (1997) dan Section 5.7
untuk lebih lanjut tentang inimasalah dan bagaimana mereka dapat ditangani.
Sebagai penerbit kartu kredit terbesar di Jepang, JCB Co., Ltd.telah memantapkan
dirinya sebagai merek internasional. Ituperusahaan, dengan 34 juta pemegang kartu,
menawarkan 200 layanandan 600 jenis kartu. Pada Juli 1999, penjualan JCBdepartemen
mulai mengembangkan proyek penambangan dataelacak kebutuhan pelanggan yang
semakin beragam dan kompleks.Sistem ini selesai dalam tiga bulan dengan
SASPenambang Perusahaan. (Enterprise Miner mengandung banyakmodel dan
algoritma terintegrasi, termasuk keputusanpohon, jaringan saraf, regresi, penalaran
berbasis memori,mengantongi dan meningkatkan ansambel, dua tingkatmodel,
pengelompokan, rangkaian waktu, dan asosiasi. Lihatwww.sas.com untuk detailnya.)
Sistem JCB mencakup pelangganprofil dan manajemen hubungan pelanggan.
Penambangan data menggunakan berbagai alat analisis data untuk ditemukanpola dan
hubungan dalam data yang mungkindigunakan untuk membuat prediksi yang akurat.
Penambangan data membantuorganisasi mengembangkan model yang paling akurat dari
merekapelanggan dan calon pelanggan. .
Source: Adapted from Herbert Edelstein, "Pan for Gold in the Clickstream," InformationWeek, March 12,2001, pp. 77-91.
Penambangan data adalah alat analitik yang kuat yang memungkinkaneksekutif bisnis untuk
maju dari menggambarkan sejarahperilaku pelanggan untuk memprediksi masa depan. Ia
menemukanpola yang membuka kunci misteri perilaku pelanggan.Hasil penambangan data
dapat digunakan untuk meningkatkanpendapatan, mengurangi biaya, mengidentifikasi
penipuan, dan mengidentifikasipeluang bisnis, menawarkan keunggulan kompetitif baru.
Ada sejumlah mitos tentang penambangan data,tercantum di bawah ini. Para visioner
pertambangan data telah menjadi sangat besarkeunggulan kompetitif dengan memahami itu
mitos-mitos ini hanya itu saja — mitos.
• Data mining memberikan prediksi bola kristal instan.Penambangan data adalah proses multi-
langkah itumembutuhkan desain dan penggunaan yang disengaja dan proaktif.
• Data mining belum layak untuk aplikasi bisnis.Keadaan terkini seni siap digunakanuntuk
hampir semua bisnis.
Penambangan data hanya untuk perusahaan besar dengan banyakdata pelanggan. Jika data
secara akurat mencerminkanbisnis atau pelanggannya, perusahaan dapat
memanfaatkanpenambangan data.
Source: Adapted partly from Arlene Zaima, "The Five Myths of Data Mining," What Works: Best Practices in Business
Intelligence and Data Warehousing, Vol. 15, The Data Warehousing Institute, Chatsworth, CA, June, 2003, pp. 42-43.
Berikut ini sepuluh kesalahan penambangan data yang sering dilakukandalam praktek. Cobalah
untuk menghindarinya:
Source: Adapted from David Skalak, "Data Mining Blunders Exposed!" DB2 Magazine, Quarter 2,2001, pp. 10-13.
• Agen cerdas. Salah satu pendekatan yang paling menjanjikan untuk mengambil
informasidari database, terutama yang eksternal, adalah penggunaan agen
cerdas. Denganketersediaan informasi yang luas dan terus bertambah
melaluiInternet, menemukan informasi yang tepat menjadi lebih sulit. Data
berbasis webaplikasi pertambangan biasanya diaktifkan oleh agen perangkat
lunak cerdas. Topik inidibahas dalam bab selanjutnya.
• Alat lainnya. Beberapa alat lain dapat digunakan. Ini termasuk aturan induksi
danvisualisasi data. Sumber terbaik pengembangan alat baru adalah vendor
Websitus.
Algoritma penambangan data penting (lihat Dasu dan Johnson, 2003). Saat
berhadapandengan data perilaku pelanggan, yang dapat mencakup seratus
dimensi ataulebih lanjut, algoritma harus mampu menangani secara efektif
dengan data berdimensi tinggi.Algoritme ini juga harus dapat bekerja dengan
TEXT MINING
Berikut ini daftar beberapa alat dan vendor penambangan teks populer:
• SAS Text Miner (www.sas.com)
• IBM Intelligent Miner for Text (wwwjbm.com)
• SPSSLexiquest (www.spss.com)
Pada akhir 2002, John Poindexter, mantan kepala Dewan Keamanan Nasional, menyebabkan
flap dengan proposalnya untuk Kantor Penyadaran Informasi baru di dalam Pentagon. Kritikus
mengecam rencana Poindexter untuk data menambang banyak kredit, perbankan, dan
pembelian eceran catatan warga AS, atas nama mendeteksi kemungkinan pola perilaku teroris.
Kenyataannya, agensi seperti National Reconnaissance Kantor dan Badan Keamanan Nasional
telah telah melakukan ini selama bertahun-tahun, dan pada pertengahan tahun 2003 Utara
Komando juga melakukannya. Padahal, alat penambangan data digunakan oleh badan-badan
intelijen nasional sudah digunakan oleh lembaga penegak hukum domestik di Amerika Serikat.
Alat-alat tersebut dipindahkan dari Space AS Perintah ke Komando Utara, dan dari sana ke
Departemen Keamanan Dalam Negeri, menunjukkan keduanya basis teknologi umum untuk
semua lingkungan danmungkin kekhawatiran kebebasan sipil yang melekat pada teknologi
semacam itu transfer. Semua lembaga prihatin tentang penghormatan kebebasan sipil.
Koordinasi intelijen yang lebih baik dengan negara dan pasukan polisi lokal adalah tujuan utama.
NRO dan NSA menggunakan komersial skala besar alat basis data dan pengenalan pola khusus
alat. Kontraktor pertahanan bertanggung jawab untuk mengintegrasikan alat bersama di suite
perangkat lunak yang akan terbukti berguna untuk badan intelijen. Banyak yang bekerja dengan
konstituen Departemen Keamanan Dalam Negeri lembaga sebelum DHS terbentuk pada akhir
tahun 2002. Mereka menyebarkan alat untuk penegakan narkoba domestik dan tugas
kontraterorisme melalui saluran-saluran Komando Utara dan DHS.
Kerjasama baru di antara Homeland Security para peneliti, khususnya dalam data
pertambangan, memproduksi terobosan besar dalam kasus-kasus nonterrorist, termasuk
kematian 19 orang asing ilegal ditemukan dimasukkan ke dalam trailer di Victoria, Texas, pada
14 Mei 2003. Terdeteksi melalui teknik penambangan data, transfer uang dan panggilan telepon
yang dibuat oleh korban dan lebih dari 50 saksi yang selamat dari insiden itu menyebabkan
pihak berwenang menjadi penduduk legal AS, yang mereka yakini memimpin penyelundupan
cincin yang membawa alien menyeberangi perbatasan Meksiko ke Kota-kota AS dengan biaya
substansial. Coconspirators sekitar Amerika Serikat juga diidentifikasi. Setelah tersangka
melarikan diri dari negaranya, dia terpikat oleh operasi penyerangan ke Honduras, di mana dia
ditangkap dan diekstradisi ke Amerika Serikat.
Istilah ekstraksi adalah bentuk paling dasar dari penambangan teks. Seperti semua teknik
penambangan teks, ini memetakan informasi dari data tidak terstruktur menjadi format
terstruktur. Itu struktur data paling sederhana dalam penambangan teks adalah vektor fitur,
atau daftar kata-kata berbobot. Kata-kata yang paling penting dalam sebuah teks terdaftar,
bersama dengan ukuran kerabat mereka pentingnya. Teks mengurangi ke daftar istilah dan
bobot. Seluruh semantik teks mungkin tidak ada, tetapi konsep-konsep kunci diidentifikasi.
Untuk melakukan ini, lakukan penambangan teks melakukan hal berikut:
Misalnya, perhatikan paragraf pertama ini DSS dalam kotak Fokus hingga ke titik dua. Ada
sekitar 20 istilah dengan 28 kejadian setelah kami mempertimbangkan umum kata-kata. Berikut
adalah daftar istilah yang muncul lebih banyak dari sekali, bersama dengan frekuensi relatif
mereka (faktor tf) dari total 28:
Saat Anda mempertimbangkan semua kata penting dalam paragraf, mereka terdiri dari setengah
dari total pentingnya dan dapat digunakan untuk mengidentifikasi semantiknya. Jelas paragraf
adalah tentang penambangan teks (berat = 0,1429) dan melibatkan teks dan data dengan
struktur dan berat.
Sumber: Diadaptasi sebagian dari Martin Ellingsworth dan DanSullivan, "Tambang Teks Meningkatkan Kecerdasan
Bisnis danPemodelan Prediktif dalam Asuransi, "Ulasan DM, Jilid 13, No. 7,
Juli 2003, hlm. 42 ^ 14.
Penambangan teks adalah pendekatan yang sangat efektif untuk secara otomatismelakukan
analisis pada dokumen standar dan Web.Misalnya, farmasi internasionalperusahaan
menggunakan penambangan teks untuk mengevaluasi 500 berbasis tekstanggapan dari pasien
yang berpartisipasi dalam studi klinisobat alergi baru. Perangkat lunak penambangan
teksmendeteksi sekelompok 50 pasien yang menggunakan spesifikkata-kata yang
menggambarkan efek samping negatif. Lebih lanjutpemeriksaan menunjukkan bahwa pasien ini
semuanya menerimadosis tinggi obat, dan wanita yang lebih tua dari 40sangat sensitif terhadap
dosis tinggi.Akibatnya, tingkat dosis disesuaikan, dan peringatanuntuk wanita di atas 40
termasuk dengan obat.
Source: Adapted from A. Bolen, "Data Mining for Text," SAS com, November/December 2001
perusahaan farmasi besar, menggunakan penambangan teks untuk mencari kesejajaran dalam
pengujian farmasi di database yang sangat besar yang National Institutes of Penggunaan
kesehatan untuk katalog penelitian medis. Penambangan teks target proyek dokumen biomedis
diekstraksi dari berbagai sumber eksternal, seperti MedLine, medis layanan literatur penelitian
yang disediakan oleh National Institut Kesehatan. Sistem Pfizer mencari database dokumen dan
ekstrak satu set dokumen yang ditandai oleh kriteria pencarian sederhana berdasarkan
kombinasi kata kunci. Selanjutnya, set dokumen selanjutnya disegmentasi ke dalam topik. Topik
dicirikan oleh daftar kata kunci diekstraksi dari teks format bebas yang terkandung dalam
dokumen. Para ilmuwan memilih topik yang diminati oleh memeriksa daftar kata kunci. Pfizer
telah menyadari beberapa hal manfaat. Pertama, perusahaan telah menemukan teks itu
penambangan tidak hanya teknologi untuk kategorisasi informasi. Hasil penambangan teks juga
memungkinkan membangun aplikasi baru untuk navigasi lebih lanjut data dan dukungan
keputusan. Aplikasi baru ini bisa ambil prototipe untuk menyelesaikan pengembangan lebih
cepat daripada sebelumnya. Sekarang mungkin untuk cepat berkumpul aplikasi analitis yang
kuat dan mudah digunakan mengatasi keseluruhan persyaratan.
Source: Adapted from Lawrence Bell, "For Pfizer, AlphaBlox Is Just What the Doctor Ordered." What Works: Best
Practices in Business Intelligence and Data Warehousing, Vol. 10, The Data Warehousing Institute, Chatsworth, CA, June,
2003, p. 31.
Penambangan data bisa sangat membantu, seperti yang ditunjukkan oleh contoh
perwakilan berikut.Perhatikan bahwa maksud dari sebagian besar contoh ini
adalah untuk mengidentifikasi peluang bisnismenciptakan keunggulan
kompetitif yang berkelanjutan.
• Pemasaran: memprediksi pelanggan mana yang akan merespons spanduk
Internet atau membeliproduk tertentu; mengelompokkan demografi pelanggan.
• Perbankan: meramalkan tingkat kredit macet dan penggunaan kartu kredit
palsu, kreditpengeluaran kartu oleh pelanggan baru, dan jenis pelanggan mana
Sebuah tim ahli biologi Norwegia telah mengembangkan metode cerdas untuk
mencari danmenambang Web untuk studi genetika yang berisi informasi yang
relevan dengan upaya mereka.Sejak setiap tiga tahun kami menggandakan
jumlah informasi yang kami hasilkan dan simpandi bumi (lihat Pallatto, 2002a),
metode seperti ini menjadi semakin penting untuk ilmiahpeneliti juga untuk
bisnis yang berjalan lancar. Lihat DSS dalam Tindakan 5.47dan Copeland (2001)
untuk bagaimana ini dilakukan. Metode lain, seperti agen cerdas, mungkinjuga
digunakan dalam penambangan cerdas. Lamont (2000) menjelaskan bagaimana
agen cerdas dapat digunakan untuk mengidentifikasi pengetahuan di Web. Boyd
(2001) menjelaskan bagaimana BizWorkspaket perangkat lunak menyediakan
agen cerdas untuk pencarian internal dan Web.
Perangkat lunak penambangan data memiliki algoritme yang lebih rumit untuk
jaringan saraf,pengelompokan, segmentasi, dan klasifikasi yang umumnya lebih
canggih ituMetode OLAP (lihat Finlay, 2001). Banyak vendor perangkat lunak
menyediakan alat penambangan data yang kuat. Ini termasuk Angoss
Knowledge Engineering (KnowledgeServer /KnowledgeSeeker), Cognos
(berbagai alat), Perangkat Lunak Statistik Cytel (XL Miner,melakukan
penambangan data di Excel), DataMind Corporation (DataMind), IBM
(DB2Intelligent Miner Scoring, IMS), Analis Poli (Megaputer Intelligence Inc.),
dan SAS(berbagai alat). Angoss KnowledgeSeeker bahkan menginduksi aturan
dari data. Iniaturan dapat digunakan dalam sistem pakar. IBM DB2 Intelligent
Miner Scoring (IMS)menyediakan analisis dan penilaian data relasional data
relasional real-time. Ini menggunakan PrediktifModel Markup Language
(PMML) dari grup penambangan data. Perangkat lunak ini membawaproses
VISUALISASI DATA
Visualisasi data lebih mudah untuk diterapkan ketika data yang diperlukan
berada dalam datagudang, atau lebih baik lagi di server multidimensi. Harrah's
melakukan persis inimengelola kasinonya. Lihat DSS dalam Tindakan 5,50.
Diskusi kami berfokus terutama padakonsep multidimensionalitas. Di bagian
selanjutnya, kami menyajikan informasi geografissistem, sebuah topik yang
terkait erat dengan visualisasi data.
• Perkembangan dalam realitas virtual (VR) memiliki dampak luas dalam bisnis
sepertiserta bidang lainnya. Lihat DSS dalam Tindakan 5.51 untuk beberapa
aplikasi dan perangkat lunak Websampler. Selain itu, perangkat pengembangan
usia ChoicePoint, bentuk prediksivisualisasi, membantu menemukan anak yang
hilang. Pada awal 2003, ChoicePoint punyamembantu memulihkan 782 anak
yang hilang. Lihat situs Web-nya untuk melihat hasilperangkat lunak progresif
usia.
MULTIDIMENSITAS
Tabel Spreadsheet memiliki dua dimensi. Informasi dengan tiga atau lebih
dimensidapat disajikan dengan menggunakan satu set tabel dua dimensi atau
tabel yang cukup rumit. Didukungan keputusan, upaya dilakukan untuk
menyederhanakan penyajian informasi dan memungkinkanpengguna dengan
mudah dan cepat mengubah struktur tabel untuk membuatnya lebih
bermakna(mis., dengan membalik kolom dan baris, menggabungkan beberapa
baris dan columnrollup,atau memisahkan satu set baris atau kolom — drill
down).
PRESENTASI MULTIDIMENSI
Data ringkasan dapat diatur dengan berbagai cara untuk analisis dan presentasi.
Efisiencara melakukan ini disebut multidimensional. Keuntungan utama dari
multidimensionalitasadalah bahwa data dapat diatur dengan cara manajer
daripada analis sistem sepertiuntuk melihat mereka. Presentasi yang berbeda
dari data yang sama dapat diatur dengan mudah dan cepat.
Mendasari setiap OLAP (dan data mining) sistem adalah model data konseptual
seringdisebut sebagai model data multidimensi atau pemodelan multidimensi
(MDM).Teknik ini membantu konsep model bisnis sebagai serangkaian tindakan
yang dijelaskan olehaspek-aspek bisnis biasa. Metode ini sangat berguna untuk
menyaring, meringkas,dan mengatur data untuk memudahkan analisis. Berbeda
dengan teknik untuk mendesain secara onlinesistem pemrosesan transaksi,
yang mengandalkan entitas, hubungan, fungsionaldekomposisi, dan analisis
transisi negara, MDM menggunakan konstruksi fakta, dimensi,hierarki, dan
REAL-TIME ANALYTICS
Data warehousing dan alat-alat intelijen bisnis secara tradisional berfokus pada
bantuanmanajer dalam membuat keputusan strategis dan taktis. Pada tahun
2003, dengan munculnya realtimedata pergudangan, ada awal pergeseran
menuju pemanfaatan teknologi iniuntuk keputusan operasional. Penggunaan
gudang data yang "aktif" ini baru saja dimulaiubah fokus alat-alat ini (lihat Kopi,
2003). Lihat DSS di Focus 5.53 untuk beberaparincian tentang bagaimana
konsep real-time berevolusi. Hewlett-Packard bergerak menuju sebuahStrategi
Adaptive Enterprise untuk menghasilkan komputasi sesuai permintaan (lihat
Follet, 2003).
Sistem analitik terus menjadi lebih cepat, dan banyak permintaan pelanggan
saat inidata. Semakin banyak manajer TI menghadapi pertanyaan mahal apakah
akan diambilsistem analitik real-time (lihat Baer, 2002). Semakin banyak data
pergudangan real-time /proyek analisis sedang dalam pengembangan dan
dikerahkan. Permintaan untuk realtimeaplikasi terus berkembang. Proliferasi
mesin aturan (aturan bisnismanajemen), misalnya, menciptakan tekanan untuk
mengimplementasikan bisnis yang lebih otomatisproses yang terbaik dapat
diimplementasikan dalam gudang data real-time. Ketika prosesyang
membutuhkan pembaruan seketika diperlukan untuk menjawab pertanyaan
analitis, arespon real-time diperlukan. Kueri, OLAP, dan waktu respons
penambangan data harusmendekati nol (lihat Raden, 2003a).
Di sisi lain, masalah penting dalam komputasi real-time adalah tidak semua data
harus diperbarui terus menerus. Ini tentu saja dapat menyebabkan masalah
ketika laporandihasilkan dalam waktu nyata, karena hasil satu orang mungkin
tidak cocok dengan orang lain. SEBUAHperusahaan menggunakan
BusinessObjects Weblntelligence memperhatikan masalah yang signifikan
dengankecerdasan real-time. Laporan real-time semuanya berbeda ketika
diproduksi dengan sedikit berbedakali (lihat Peterson, 2003). Juga, mungkin
tidak perlu memperbarui data tertentuterus menerus, seperti nilai kelas tiga
atau lebih tahun yang lalu.Persyaratan real-time mengubah cara kita melihat
desain database, datagudang, OLAP, dan alat penambangan data, karena mereka
secara harfiah diperbarui secara bersamaan saat kueri aktif. Di sisi lain, nilai
bisnis yang substansial dalam melakukannyatelah ditunjukkan, sehingga sangat
penting bahwa organisasi mengadopsi metode ini di merekaproses bisnis. Lihat
DSS di Fokus 5.54.
Data spasial menjadi sangat penting bagi banyak organisasi. Mereka barudasar
untuk mengelola infrastruktur. Sebagai alat GIS dan sumber data menjadi
semakin canggih dan terjangkau, mereka membantu lebih banyak perusahaan
dan pemerintah untuk memahami dengan tepat di mana truk, pekerja, dan
sumber daya mereka berada, di mana mereka harus pergi melayani pelanggan,
dan cara terbaik untuk pergi dari sini ke sana. Daerahpemasaran yang
ditargetkan tumbuh pesat. Organisasi dapat dengan mudah menyegmentasikan
populasi. Misalnya, Credit Union of Texas (Dallas, Texas) menggunakan SIG
untuk membantu putuskan di mana menempatkan billboard dan ATM, dan
untuk membantu mengidentifikasi area yang paling responsive untuk
mengarahkan pengiriman. Tingkat respons umum untuk serikat kredit adalah 5
hingga 10 persen, jauh lebih baik daripada rata-rata 1 hingga 2 persen.
Pelanggan juga menikmati menerima lebih sedikit surat dari credit union.
Mereka hanya menerima surat yang relevan. Lihat Franklin (2002) untuk
detailnya. Lihat DSS dalam Tindakan 5.55 untuk beberapa contoh penting.
Sebagian besar vendor perangkat lunak GIS menyediakan akses Web, seperti
browser yang disematkan, atau a Web / Internet / server intranet yang
menghubungkan langsung ke perangkat lunak mereka. Dengan demikian,
pengguna dapat mengakses peta dan data dinamis melalui Internet atau intranet
perusahaan. Layanan Web GIS adalah berkembang biak. Sistem geografis ini
membentuk infrastruktur global yang kaya informasi yang menambah dimensi
baru bagi industri GIS dengan mengintegrasikan berbagai layanan aplikasi.
Layanan Web GIS merevolusi cara perusahaan menggunakan dan berinteraksi
dengan informasi geospasial. Misalnya, GIS dapat membantu manajer ritel
operasi menentukan tempat membuka toko yang terletak di persimpangan kota
besar, dalam a 15 menit berkendara dari jalan keluar jalan bebas hambatan,
dikelilingi oleh lingkungan kelas menengah dengan keluarga profesional. Lihat
Gonzales (2003). Big Horn Computer Services (Buffalo, New York)
menggunakan GIS yang diadaptasi oleh Web untuk mengembangkan aplikasi
khusus untuk televisi nasional jaringan yang menginginkan stasiun afiliasinya
untuk dapat mengakses intranet yang berisi informasi demografis tentang
Beberapa perangkat lunak GIS yang penting adalah ArcView dan Arclnfo (ESRI),
AGISMap (AGIS), GeoMedia (Intergraph), dan Maplnfo Professional (Maplnfo).
Arclnfo (www.esri.com/arcinfo8/) memberi sebuah mode l menyediakan alat-
alat untuk memodelkan sistem spasial yang kompleks tanpa pemrograman.
Culpepper (2002) menjelaskan bagaimana CommunityViz
(www.communityviz.com) perangkat lunak mengintegrasikan simulasi dan
pemodelan perencanaan kota fungsionalitas ke perangkat lunak ESIS ArcView
GIS. Pengguna dapat mengatur dan menjalankan skenario yang berbeda,
berdasarkan variabies dan batasan yang ditentukan pengguna, untuk
menentukan hubungan di antara proyek kota dan indikator sosial, lingkungan,
atau ekonomi. Seluruh set kebijakan dapat diuji.
Tren saat ini untuk GIS sebagai alat pendukung keputusan / intelijen bisnis
melibatkan melanjutkan kombinasi atau integrasi GIS dengan yang lain,
terutama berbasis Web, pendukung keputusan / alat intelijen bisnis, seperti
gudang data, ERP, kolaborasi alat, dan aplikasi produktivitas pribadi. Data GIS
dapat diintegrasikan ke lainnya sistem melalui XML melalui Geografi Markup
Language (GML) (lihat Lais. 2000). Satu area penting yang telah berhasil
diintegrasikan GIS adalah CR M (lihat Dragoon, 2003a; Winslow dan Lea, 2002;
Sonnen, 1999; dan DSS dalam Tindakan 5.55). Untuk keterangan lebih lanjut
tentang GIS. GPS, dan Web, lihat Dragoon (2003a), Duff y (2002), Hapgood
(2001), Korte (2001), Kowal (2002), Lais (2000,2001), Leatham (2000), Harga
dan Schweitzer (2002), dan Winslow dan Lea (2002).
KECERDASAN BISNIS
Mart data terus menjadi jauh lebih populer di lingkungan Web. Untuk Sebagai
contoh, Bell Canad menggunakan intranetnya secara ekstensif untuk akses data
yang cepat ke multipelnya data mart (lebih dari 300 analis; lihat PCWeek, 28 Juli
1997), dan di Nabisco, yang besar perusahaan, analis keuangan melacak
keuntungan dan kerugian dari 8000 produk menggunakan Browser web,
menghemat jutaan dolar (InfoWorld, Sept. 28,1998).
Analisis Web dan kecerdasan Web adalah istilah yang digunakan untuk
mendeskripsikan aplikasi business analytics / business intelligence to We b
sites. Alat dan metode sangat tinggi bersifat visual (lihat Bagian 5.12). Schlegel
(2003) menjelaskan dasar-dasar analisis Web, dan bahkan menyediakan
arsitektur analisis clickstream yang diusulkan. Dengan meningkatnya operasi
clickstream, jumlah data yang akan diproses akan meningkat secara
eksponensial, dan skalabilitas masalah akan menjadi penting untuk kecerdasan
Web / analisis Web. Lihat DSS di Fokus 5.57 dan Bagian 5.7. Werner dan
Abramson (2001) menjelaskan suatu metode (berdasarkan penyortiran dan
agregasi) untuk memproses satu miliar catatan sehari untuk gudang data Web.
Lihat juga Hayes (2001) dan Ruber (2003) untuk informasi tentang analisis
clickstream Web. Langseth dan Vivatrat (2002) membahas mengapa proaktif,
kecerdasan bisnis berbasis web adalah ciri dari perusahaan real-time. Sodhi dan
Aichlmayr (2001) mendiskusikan bagaimana dan mengapa kita harus
menanamkan model analitik spesifik dalam alat penambangan data berbasis
Web. Lihat DSS dalam Tindakan 5.58 untuk informasi, dengan contoh, tentang
bagaimana Kami analytics digunakan dalam praktik.
Perangkat intelijen bisnis WebTrends Netl Q Corp berfokus pada analisis real-
time Kami lalu lintas dan transaksi online. WebTrends memungkinkan
organisasi untuk melacak tren pembelian konsumen, pendapatan, dan
keefektifan kampanye iklan atau promosi penjualan, melalui jutaan kunjungan
situs setiap hari. Site59.com Inc., situs perjalanan yang berspesialisasi di paket
liburan terakhir, ditemukan melalui analisis WebTrends Live bahwa pengunjung
tidak dapat dengan mudah menemukan semua paket perjalanan yang tersedia di
situs. Itu Analisis menunjukkan bagaimana merampingkan dan meningkatkan
desain. Sejak itu, Site59.com telah mengalami peningkatan jumlah pengunjung
dan proporsi mereka yang melakukan pembelian online (lihat Pallatto, 2002a,
2002b).