You are on page 1of 93

CHAPTER V

Business intelligence: Data pergudangan, akuisisi data, data


mining, business analytic, dan visualisasi

TUJUAN PEMBELAJARAN

 Jelaskan masalah dalam pengumpulan data, masalah, dan kualitas.


 Menjelaskan karakteristik dan organisasi sistem manajemen basis data
 Jelaskan pentingnya dan penggunaan data warehouse dan data mart
 Jelaskan analisis bisnis intelijen / bisnis dan pentingnya organisasi.
 Jelaskan bagaimana pengolahan analisis online (OLAP), data mining,
visualisasi data,multidimensionalitas, dan analisis real-time dapat
memperbaiki pengambilan keputusan.
 Jelaskan bagaimana dampak teknologi database dan metode Web, dan
sebaliknya.
 Jelaskan bagaimana teknologi dan metode database sebagai bagian dari
business intelligence / business analisis memperbaiki pengambilan
keputusan
 Jelaskan kecerdasan Web / analisis Web dan pentingnya organisasi.

Banyak organisasi telah mengumpulkan sejumlah besar data yang digunakan


karyawan untuk dibukarahasia berharga untuk memungkinkan organisasi
untuk bersaing dengan sukses. Beberapa organisasiLakukan ini dengan sangat
baik, tapi yang lain tidak efektif. Untuk menggunakan alat analisismemperbaiki
pengambilan keputusan organisasi, arsitektur data dasar dan
perusahaanArsitektur harus ada untuk memudahkan analisis keputusan yang
efektif. MengaktifkanAnalisis keputusan melalui akses terhadap semua
informasi yang relevan dikenal sebagai business intelligence.Bisnis intelijen
termasuk data pergudangan, pengolahan analisis online,data mining, dan
visualisasi dan multidimensionalitas. Garis besar bab ini adalah sebagaiberikut:

5.1 Membuka Vinyet: Informasi Membagi Komponen Utama dari


Strategi Nasional untuk Keamanan Dalam Negeri
5.2 Sifat dan Sumber Data
5.3 Pengumpulan Data, Masalah, dan Mutu
5.4 Layanan Database Web / Internet dan Komersial
5.5 Sistem Manajemen Basis Data dalam Sistem Pendukung Keputusan /
Bisnis

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Intelijen
5.6 Organisasi dan Struktur Database
5.7 Data Warehousing
5.8 Data Mart
5.9 Business Intelligence / Business Analytics
5.10 Pengolahan Analitik Online (OLAP)
5.11 Data Mining
5.12 Visualisasi Data, Multidimensionalitas, dan Analisis Real-Time
5.13 Sistem Informasi Geografis
5.14 Intelijen Bisnis dan Web: Web Intelligence / Web Analytics

5. 1 PEMBUKAAN VIGNETTE: INFORMASI BERBAGI KOMPONEN PRINSIP


STRATEGI NASIONAL UNTUK KEAMANAN HOMELAND 1

Gudang data menyediakan arsitektur data strategis untuk memungkinkan


pengambilan keputusananalisis. Data pergudangan memungkinkan data mining,
kemampuan untuk mensintesis secara otomatissejumlah besar informasi untuk
menemukan kebenaran tersembunyi di dalam data. Dataportal telah muncul
sebagai generasi berikutnya di gudang data yang mendukung Web. Satu
dariportal data yang paling signifikan telah dikembangkan dalam respon
langsung terhadap terorisserangan di Amerika Serikat pada 11 September 2001.

Strategi Nasional Keamanan Dalam Negeri Amerika Serikat meliputi: Visi


Nasional untuk sharing informasi yang berkaitan dengan pendeteksian
teroriskegiatan. Ini menyatakan,Kami akan membangun lingkungan
nasional yang memungkinkan pembagian esensialinformasi keamanan
dalam negeri Kita harus membangun sistem sistem yang bisaberikan
informasi yang benar kepada orang yang tepat setiap saat. Informasi
akandibagi "secara horisontal" di setiap tingkat pemerintahan dan "secara
vertikal"antara pemerintah federal, negara bagian dan lokal, industri swasta
dan warga negara.Dengan penggunaan yang tepat dari orang, proses, dan
teknologi, keamanan dalam negeripejabat di seluruh Amerika Serikat dapat
memiliki kesamaan dan kesamaankesadaran akan ancaman dan kerentanan
serta pengetahuan personildan sumber daya yang tersedia untuk mengatasi
ancaman ini. Pejabat akan menerimainformasi yang mereka butuhkan
sehingga bisa mengantisipasi ancaman dan merespon dengan cepat dan
efektif.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Tujuan dari proyek ini adalah untuk menciptakan model yang dapat diterapkan
untuk mengintegrasikan pengetahuanyang berada di banyak sumber data yang
berbeda, sambil memastikan privasi dan masyarakat sipilkebebasan dijaga
secukupnya. Lima inisiatif tama yang diidentifikasiDalam strategi tersebut
meliputi:

1. Untuk mengintegrasikan berbagi informasi di seluruh pemerintah


federal
2. Untuk memperluas integrasi berbagi informasi antar pemerintah negara
bagian dan lokal,industri swasta, dan warga Negara
3. Mengadopsi standar metadata umum informasi elektronik yang
relevankeamanan dalam negeri
4. Untuk memperbaiki komunikasi keselamatan public
5. Memastikan informasi kesehatan masyarakat yang terpercaya.

Tujuan ini hanya bisa tercapai jika ada sarana untuk memudahkan
sharinginformasi antar berbagai instansi yang saat ini memelihara silo data
independen.Keamanan perbatasan sendiri melibatkan sebelas agensi. Untuk
keseluruhan proyek data warehouse,sekitar 80 persen arsitekturnya akan
tersedia dalam 18 bulan, sedangkanImplementasi lengkap akan berjalan lebih
dari tiga sampai lima tahun. Akhirnya datagudang akan menyebabkan
peningkatan keamanan bagi Amerika Serikat. Ini akan menjadi model
untukbagaimana semua negara dapat berinteraksi untuk melindungi perbatasan
mereka dan memastikan keamanan kewarganegaraan mereka.Proyek ambisius
ini bukan tanpa tantangan. Misalnya, data perluditambang dari catatan imigrasi,
catatan perbendaharaan (berurusan dengan pertukaransejumlah besar uang),
dan catatan FBI (kriminal). Data ada dalam format yang berbedadan tipe data;
Upaya besar sedang dilakukan untuk membangun sarana untuk
menghubungkan dan mencarimelalui data ini untuk mengidentifikasi potensi
ancaman dan kejahatan.

• PERTANYAAN UNTUK VIGNETTE PEMBUKAAN

1. Identifikasi tantangan yang dihadapi oleh Kantor Keamanan Dalam Negeri


dalam mengintegrasikan database yang berbeda
2. Identifikasi sumber informasi yang akan dibutuhkan untuk membuat
informasidi portal data ini bermanfaat.
3. Apa manfaat yang diharapkan?
4. Identifikasi keputusan yang didukung oleh portal data ini.
5. Apa alat pendukung keputusan dan teknik yang bisa digunakan untuk
mengidentifikasi calon teroriskegiatan.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


6. Apa yang akan Anda rekomendasikan ke Kantor Keamanan Dalam Negeri
untuk memperbaikikemampuan dari portal data ini?

5. 2 T H E N A T U R E A N D S O U R C E S O F D A T A

Untuk memahami situasi, pembuat keputusan membutuhkan data, informasi,


danpengetahuan. Ini harus diintegrasikan dan diatur sedemikian rupa sehingga
bermanfaat bagi mereka.Maka pembuat keputusan harus bisa menerapkan alat
analisis (online analitispengolahan (OLAP), data mining, dll) sehingga data,
informasi, dan pengetahuanbisa dimanfaatkan untuk keuntungan penuh. Alat
analisis ini berada di bawah judul umumbusiness intelligence (BI) dan business
analytics (BA) (lihat Bab 3 dan 4). BaruAlat memungkinkan pengambil
keputusan dan analis untuk segera mengidentifikasi hubungan antar dataitem
yang memungkinkan pemahaman dan memberikan keunggulan kompetitif.
Misalnya, Sistem customer-relationship (resource) management (CRM)
memungkinkan manajer untuk lebih baikmengerti pelanggan mereka Mereka
kemudian bisa menentukan kandidat yang mungkin untuk tertentuproduk atau
layanan dengan harga tertentu (lihat Bab 8). Upaya pemasaran
adalahditingkatkan dan penjualan dimaksimalkan. Semua sistem informasi
perusahaan (mis., CRM,sistem informasi eksekutif, sistem manajemen konten,
manajemen pendapatansistem, perencanaan sumber daya perusahaan / sistem
manajemen sumber daya perusahaan, pasokansistem manajemen rantai, sistem
pengelolaan pengetahuan) memanfaatkan manajemen basis datasistem, gudang
data, OLAP, dan data mining sebagai fondasi mereka (lihatBab 8 dan 9). Ini
intelijen bisnis / analisis bisnis (dan intelijen Web/Web analytic)
memungkinkan perusahaan modern untuk bersaing dengan sukses.
DalamTangan kanan, alat ini memberi banyak pembuat keputusan dengan
kemampuan hebat. UntukContohnya, lihat Case Application 5.2, yang
menunjukkan bagaimana perusahaan berkembang dan kemudian
dimanfaatkandatabase dengan cara yang sangat kompetitif

The Vignette Pembukaan menggambarkan apa yang bisa salah dalam ekstrem
ketika Anda melakukannyatidak mengumpulkan data untuk melacak aktivitas
individu dan organisasi yang berdampak pada andaOrganisasi (dalam
lingkungan bisnis, ini adalah pelanggan, calon pelanggan dansebuah kompetisi).
Isu penting untuk Departemen Keamanan Dalam Negeri A.S.
adalahmengumpulkan dan menganalisis data dari sumber yang berbeda. Data
ini harus diintegrasikan dalam agudang data dan dianalisis secara otomatis
melalui alat data mining atau oleh analis yang menggunakanAlat OLAP Tentu
saja, penyalahgunaan bisa terjadi dalam proses pengumpulan dan
pemanfaatannyasejumlah besar data (lihat DSS di Focus 5.1).

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Dampak dari pelacakan data dan kemudian memanfaatkannya untuk
keunggulan kompetitifbisa sangat besar Seluruh industri, seperti travel,
banking, dan semua sukses e-commerceusaha, bergantung sepenuhnya pada
data dan konten informasi mereka untuk berkembang. ExperianOtomotif telah
mengembangkan peluang bisnis dari database modern, ekstraksidan alat
integrasi (lihat DSS dalam Tindakan 5.2).

Songini (2002) memberikan deskripsi database, data, informasi,metadata, OLAP,


repositori, dan data mining. Vendor database utama meliputi IBM,Oracle,
Informix, Microsoft, dan Sybase. Vendor database ditinjau minyak biasadasar
oleh pers perdagangan. Misalnya, lihat Whiting (2000) dan "Produk
TahunanTinjau kembali "edisi DM Review (www.dmreview.com) setiap bulan
Juli.

Semua sistem pendukung keputusan menggunakan data, informasi, dan / atau


pengetahuan. KetiganyaIstilah kadang-kadang digunakan secara bergantian dan
mungkin memiliki beberapa definisi. BiasaCara pandang mereka adalah sebagai
berikut:

 Data. Item tentang barang, kejadian, aktivitas, dan transaksi dicatat,


diklasifikasikan, dan disimpan namun tidak diatur untuk menyampaikan
makna tertentu. Item dataBisa numerik, alfanumerik, figur, suara, atau
gambar.
 Informasi. Data yang telah disusun dengan cara yang memberi
makna"surprise" dengan mengungkapkan sesuatu yang tidak diketahui.
Proses aplikasi MSSitem data sehingga hasilnya bermakna untuk tindakan
atau keputusan yang diinginkan.
 Pengetahuan. Pengetahuan terdiri dari item data dan / atau informasi yang
terorganisir dan diproses untuk menyampaikan pemahaman, pengalaman,
akumulasi pembelajaran, dan keahlian yang berlaku untuk masalah atau
aktivitas saat ini. Pengetahuan bisa jadipenerapan data dan informasi dalam
pengambilan keputusan. (Lihat Bab 9 dan 10.)

Data MSS bisa meliputi dokumen, gambar, peta, suara, video, dan animasi.Data
ini dapat disimpan dan diatur dengan cara yang berbeda sebelum dan sesudah
digunakan. Merekajuga mencakup konsep, pemikiran, dan pendapat. Data bisa
mentah atau diringkas. BanyakAplikasi MSS menggunakan data ringkasan atau
ekstraksi yang berasal dari tiga primersumber: internal, eksternal, dan pribadi.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


DSS DALAM FOKUS 5.1

H O M E L A N D PRIVASI KEAMANAN N D COST CONCERNS '


Pemerintah A.S. berencana menerapkan teknologi Union didenda $ 8 jutapada bulan Desember 2002
analitik dalam skala global dalam perang melawan karena tidak sesuai dengan benar.
terorisme, tapi akan mereka membuktikan senjata
yang efektif? Pada tahun pertama dan a setengah Masalah privasi berlimpah. Karena
setelah 11 September 2001, jaringan supermarket,toko pemerintahmemperoleh data pribadi untuk
perbaikan rumah, dan lainnya secara mendeteksi pola mencurigakanAktivitas, ada
sukarelamenyerahkan sejumlah besar catatan kemungkinan penyalahgunaan dan penggunaan illegal
pelanggan kepadaBadan penegak hukum federal, data. Mungkin ada biaya privasi yang signifikanterlibat.
hampir selalu melakukan pelanggarandari kebijakan Ada masalah besar dengan pelanggaran
privasi mereka yang disebutkan. Banyak orangkebebasan dan hak Ada kebutuhan untuk
lainnyamenanggapi perintah pengadilan atas pengawasanorganisasi untuk "mengawasi para
informasi, sesuai kebutuhanmenurut hukum. pengamat". DHStidak boleh tanpa henti memperoleh
Pemerintah memiliki hak untuk mengumpulkan data. Seharusnya hanya mendapatkandata dan
perusahaandata berdasarkan undang-undang yang informasi terkait yang bisa ditambangmengidentifikasi
disahkan setelah 11 September 2001. pola yang berpotensi bisa mengakibatkan
berhentiaktivitas teroris
FBI sekarang menambang sejumlah besar datamencari
aktivitas yang bisa menunjukkan plot teroris Sumber: Sebagian diadaptasi dari John Foley, "Data
ataukejahatan. Data transaksi adalah penegakan Debate."
hokum agensi berharap bisa menemukan hasilnya. Informasi Minggu, 19 Mei 2003, hal. 22-24; S: Grimes,
Bisnis Amerika adalahTerjebak di tengah-tengah. "Lihat
Beberapa harus menciptakan sistem khususuntuk Sebelum Anda Leap, "Intelligent Enterprise, Juni 2003;
menghasilkan data yang dibutuhkan oleh lembaga Ben
penegakan hukum.Perusahaan rata-rata akan Layak, "Apa yang Harus Dilakukan Saat Paman Sam
menghabiskan rata-rata$ 5 juta untuk sebuah sistem. Ingin Data Anda,"
Di sisi lain, tidak sesuaidapat biaya lebih. Western CIO, 15 April 2003, hlm. 56-66.

DSS IN ACTION 5.2


DATABASE TOOLS OPEN UP N EW REVENUE
O P P O R T U N I T I E S FOR E X P E R I A N A U T O M O T I V E

Experian Automotive telah mengembangkan bisnis via Web. Ada yang massif pasar untuk layanan ini,
baruPeluang dari alat data yang mengelola, terutama dari dealer mobil.Experian juga berfokus
mengekstrak, danmengintegrasikan. Experian telah pada komponen mobil com-_perusahaan untuk
mengembangkan sebuah sistem dengan besardatabase mengidentifikasi ingat dan mempertimbangkan
(10 terbesar di dunia) untuk melacak mobildata bagaimana menargetkanpenjualan suku cadang mobil
penjualan Data yang diperoleh bersifat eksternal dan
dating dari catatan publik penjualan mobil. Source: Adapted from Pimm Fox, "Extracting Dollars
Experianmengacu pada data ini untuk memberikan from
sejarah kepemilikansetiap kendaraan yang dibeli atau Data," ComputerWorld, April 15,2002, p. 42.
dijual di Amerika Serikat untuk abiaya murah per kueri

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


I N T E R N A L DATA

Data internal disimpan di satu tempat atau lebih. Data ini tentang orang, produk,
layanan, dan proses. Misalnya, data tentang karyawan dan gaji mereka
biasanyadisimpan dalam database perusahaan. Data tentang peralatan dan
mesin bisa disimpandi database departemen pemeliharaan. Data penjualan bisa
disimpan di beberapa tempat:data penjualan agregat di database perusahaan,
dan rincian di database masing-masing daerah.MSS dapat menggunakan data
mentah dan data yang diproses (mis., Laporan dan ringkasan).Data internal
tersedia melalui intranet organisasi atau jaringan internal lainnya.

DATA EKSTERNAL
Ada banyak sumber data eksternal. Mereka berkisar dari database komersial
sampaidata dikumpulkan oleh sensor dan satelit. Data tersedia di CD dan DVD,
diInternet, seperti film dan foto, dan sebagai musik atau suara. Laporan
pemerintah danFile adalah sumber utama data eksternal, yang sebagian besar
tersedia di Web saat ini(misalnya, lihat www.ftc.gov, Komisi Perdagangan
Federal A.S.). Data eksternal mungkin jugatersedia dengan menggunakan GIS
(sistem informasi geografis, lihat Bagian 5.13), dari federalBiro sensus, dan
sumber demografis lainnya yang mengumpulkan data secara langsungdari
pelanggan atau dari pemasok data. Kamar dagang, bank lokal,
penelitianinstitusi, dan sebagainya, membanjiri lingkungan dengan data dan
informasi, sehingga menghasilkaninformasi yang berlebihan bagi pengguna
MSS. Data bisa datang dari seluruh dunia. PalingData eksternal tidak relevan
dengan MSS tertentu. Namun banyak data eksternal yang harus dipantaudan
ditangkap untuk memastikan bahwa barang penting tidak
terlewatkan.Menggunakan agen scanning dan interpretasi cerdas dapat
meringankan masalah ini. Untuk tips bagaimana caranyamengelola data
eksternal, lihat Collett (2002).

DATA PRIBADI DAN PENGETAHUAN


Pengguna MSS dan karyawan perusahaan lainnya memiliki keahlian dan
pengetahuan yang bisadisimpan untuk penggunaan masa depan Ini termasuk
perkiraan subjektif penjualan, pendapat tentang apapesaing cenderung
melakukan, dan interpretasi artikel berita. Apa orang bangettahu dan
metodologi untuk menangkap, mengelola, dan mendistribusikannya menjadi
subyekmanajemen pengetahuan (Bab 9).

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


5.3DATACOLLECTION,PROBLEMS,ANDQUALITY

Kebutuhan untuk mengekstrak data dari banyak sumber internal dan eksternal
mempersulit tugas tersebutgedung MSS Terkadang perlu mengumpulkan data
mentah di lapangan. Lainnyakasus, perlu untuk mendapatan data dari orang
atau menemukannya di Internet. ApapunDari cara pengumpulannya, data harus
divalidasi dan disaring. Ekspresi klasik itumeringkas situasinya adalah "Sampah
masuk, sampah keluar" (GIGO). Oleh karena itu, kualitas data(DQ) adalah isu
yang sangat penting.

METODE UNTUK MENGUMPULKAN DATA RAW


Data mentah dapat dikumpulkan secara manual atau dengan instrumen dan
sensor. WakilMetode pengumpulan data adalah studi waktu, survei
(menggunakan kuesioner), observasi(misalnya, menggunakan kamera video;
lihat Latihan 9), dan meminta informasi dari para ahli(mis., menggunakan
wawancara; lihat Bab 11). Selain itu, sensor dan scanner semakin
banyakdigunakan dalam akuisisi data. Mungkin metode pengumpulan data yang
paling andaladalah dari kontrol persediaan point-of-purchase. Bila Anda
membeli sesuatu, daftarmencatat informasi penjualan dengan informasi pribadi
Anda yang dikumpulkan dari kredit Andakartu. Hal ini memungkinkan Wal-
Mart, Sears, dan peritel lainnya membangun lengkap, massif (petabyte-sized)
gudang data tempat mereka mengumpulkan dan menyimpan intelijen bisnisdata
tentang pelanggan mereka Informasi ini kemudian digunakan untuk
mengidentifikasi pembelian konsumenpola untuk mengelola inventaris toko
lokal dan mengidentifikasi peluang merchandising baru.Ini juga membantu
organisasi ritel mengelola pemasoknya.

Ewalt (2003) menjelaskan bagaimana PDA dimanfaatkan untuk mengumpulkan


dan memanfaatkan data di lapangan.Perusahaan logistik telah menggunakan
PDA untuk beberapa lama. Menlo Worldwide Forwarding,sebuah perusahaan
angkutan global, baru-baru ini melengkapi lebih dari 800 driver dengan PDA.
Link radio adalahdigunakan untuk mengirim driver untuk mengambil paket.
Driver memindai label kode batang pada kemasannyake PDA, yang kemudian
balok melacak data kembali ke home office.

Kebutuhan akan data yang andal dan akurat untuk MSS manapun diterima
secara universal. Namun,Dalam kehidupan nyata, pengembang dan pengguna
menghadapi masalah yang tidak terstruktur dalam "ribut" dan sulitlingkungan.
Ada berbagai macam perangkat keras dan perangkat lunak untuk penyimpanan
data, komunikasi,dan presentasi, tapi banyak "sedikit usaha telah beralih ke
metode pengembanganuntuk pengambilan data MSS di lingkungan pengambilan
keputusan yang kurang stabil. Metode yang tidak memadaiMengatasi masalah
ini mungkin membatasi keefektifan teknologi yang bahkan canggih
sekalipundalam pengembangan dan penggunaan MSS. Beberapa metode
melibatkan pengambilan fisikdata melalui kode bar atau dengan teknologi RFID
(radio-frequency identification tag). SebuahTombol elektronik RFID
mengirimkan sinyal identifikasi dengan beberapa data(beberapa kilobyte

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Saat perangkat ini baru) langsung ke penerima terdekat. Sebuah peti
pengepakan,Bahkan produk konsumen individual pun, mudah dikenali. Pada
awal tahun 2000an, produsen,maskapai penerbangan, dan pengecer sedang
bereksperimen dengan memanfaatkan perangkat RFIDkeamanan, mempercepat
proses penerimaan, dan checkout pelanggan. Toko Wal-MartInc mengumumkan
pada bulan Juni 2003 bahwa pada bulan Januari 2005, 100 pemasok utama
harus menggunakan RFIDuntuk melacak palet barang melalui rantai
pasokannya. Lihat DSS dalam Tindakan 5.3. Swatch disertakanperangkat
menjadi model menonton pilih sehingga lift ski dilewati di resor ski secara
otomatisdikodekan ke dalamnya Resor ini dapat dengan mudah
mengidentifikasi jenis lereng yang Anda sukaiski dan berbagi informasi dengan
sifat lainnya.

DSS IN ACTION 5.3


RFIDTAGSHELPAUTOMATE
DATACOLLECTIONANDUSE

2005 100 pemasok utamanya harus


menggunakan RFID untuk melacak paletbarang Pada tahun 2003, Delta Airlines memulai tes
melalui rantai pasokannya. Wal-Mart menggunakan RFIDuntuk mengidentifikasi
mempertimbangkanini lebih dari sekadar upaya bagasi saat tas dimuat dan dibongkardi landasan
khusus perusahaanmendesak semua pengecer bandara. Delta akan memuat data ke dalam tag
dan pemasok untuk merangkul RFID danstandar sebagaikode bar sudah dicetak Pengujian sangat
terkait Inisiatif Wal-Mart harus penting karenapotensi gangguan dari sistem
menghasilkanmenyebarkan sekitar 1 miliar tag wireless bandara lainnya.Delta diharapkan bisa
RFID untuk dilacak dan diidentifikasibarang di melihat tingkat keakuratan yang lebih
peti individu dan palet. Wal-Martpertama akan tinggidaripada dari sistem kode bar yang ada.
berkonsentrasi menggunakan teknologi untuk Meski begitu, Deltamemberikan 99 persen dari
memperbaikimanajemen persediaan dalam 100 juta tas yang di tanganinyasetiap tahun. Tapi
rantai pasokannya. Wal-MartKeputusan untuk masih perlu biaya sedikit demi sedikit pada
menerapkan teknologi harus Deltatemukan tas yang hilang.
melegitimasinyadan mendorongnya ke arus
utama. Batas akhir Wal-Martpasti akan
mempercepat adopsi oleh industri. Tag RFID telah digunakan untuk melacak
pergerakanobat-obatan melalui "abu-abu" Eropa
Harga satuan RFID harus 5 sen (UnitedAmerika) (yaitu,semi legal). Pada saat itu, obat-obatan
atau kurang untuk inisiatif Wal-Mart menjadi umumnyajauh lebih murah di Eropa selatan
biaya yang efektif.Pada pertengahan tahun 2003, daripada diEropa utara, pedagang grsir yang
tag RFID menghabiskan biaya antara 30 sampai tidak bermoral melakukan perjalananselatan
50 sen Berdasarkan 5 sen per biaya tag, untuk membelinya untuk dijual kembali di utara.
pengeluaran untukTag saja akan berjumlah $ 50 Tag RFIDdipasang di dalam label. Saat menjadi
juta. Pada tahun 2003, para pembacadijual perwakilan vendormengunjungi pedagang grosir
seharga $ 1000 atau lebih. yang tidak jujur, dia mampuuntuk
mengidentifikasi sumber stok mereka begitu dia
Wal-Mart bukan satu-satunya pengecer yang masuk dalam 3meter dari kontainer. Semua
bergerak majuRFID. Marks & Spencer PLC, salah kontrak dengan pedagang grosir inisegera
satu anggota Inggrispengecer terbesar, dibatalkan
memanfaatkan teknologi RFID dalam
makanannyaoperasi rantai pasokan Masing- Penggunaan RFID lainnya termasuk embedding
masing 3,5 juta plastic Baki yang digunakan mereka di lencana sehingga pintu secara
untuk mengirimkan produk memiliki tag RFID di otomatis akan terbukauntuk orang yang
atasnya.Procter & Gamble Co bereksperimen berwenang, dan menyediakan akses kefilm dan
dengan RFID untuklebih dari enam bulan di acara lainnya (melalui jam tangan-tertanam atau
tahun 2003, menjalankan tes dengan beberapa kartu RFID tertanam kartu). Mereka bisa
pengecer. tertanam di dalamnyamobil untuk biaya tol

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


otomatis (seperti di Kota YogyakartaLondon, mengandung tag RFID begituSaat Anda berjalan
lihat Latihan 9), digunakan dalam mobil untuk keluar dari toko, pembaca bisa mendeteksi
disimpanseluruh catatan pemeliharaan dan apaAnda telah memilih, dan akun Anda akan
perbaikan (ini saat inidilakukan untuk lift fork otomatisdikenakan biaya untuk apa yang Anda
industri), atau bahkan di bawahkulit untuk miliki, melalui tag RFIDbaik di bawah kulit Anda
identifikasi (oleh ATM, museum, sistem atau di kartu kredit.
transit,masuk ke fasilitas apapun, atau petugas
penegak hukum).Beberapa pemilik hewan Source: Partly adapted from Bob Brewin, "Delta to Test RFID
Tags on Luggage," ComputerWorld,Vol. 37, No. 25, June 23,
peliharaan memiliki tag ini dengan 2003, p. 7; Chris Murphy and Mary Hayes, "Tag Line,"
pembedahantertanam di bawah kulit hewan InformationWeek, June 15,2003, pp. 18-20; Jaikumar Vijayan
peliharaan mereka untuk identifikasi jika and Bob Brewin, "Wal-Mart Backs RFID Technology."
ComputerWorld, Vol 37, No. 24, June 16,2003, pp. 1,14.
hilangatau dicuri Akhirnya, paket produk
konsumen dankoper dapat dibuat untuk

Bahkan perangkat biometrik (pemindaian) digunakan untuk mengumpulkan


data dunia nyata. BiometrikSistem mendeteksi berbagai ciri fisik dan perilaku
individu dan menilai merekauntuk mengotentikasi identitas pengunjung dan
imigran yang memasuki Amerika Serikat.Metode database dan data mining juga
digunakan. Sekitar $ 400 juta dihabiskan untukbiometrik untuk kontrol
perbatasan A.S. pada tahun 2003. Lihat Verton (2003).

DATA PROBLEMS

Semua sistem berbasis komputer bergantung pada data. Kualitas dan integritas
dataPenting jika MSS adalah untuk menghindari sindrom GIGO. MSS bergantung
pada data karena dikompilasidata yang membentuk informasi dan pengetahuan
adalah inti dari setiap pengambilan keputusansistem.

Masalah data DSS utama dirangkum dalam Tabel 5.1 bersama dengan beberapa
kemungkinansolusi. Data harus tersedia untuk sistem atau sistem harus,
termasuk data akuisisisubsistem Masalah-masalah data harus dipertimbangkan
dalam tahap perencanaan system pengembangan. Jika terlalu banyak masalah
diantisipasi, biaya pemecahannya bisaDiperkirakan. Jika berlebihan, proyek MSS
tidak boleh dilakukan atauharus ditunda sampai biaya dan masalah berkurang.

KUALITAS DATA

Kualitas data (DQ) adalah isu yang sangat penting karena kualitas menentukan
kegunaannyadata serta kualitas keputusan berdasarkan pada mereka. Data
dalam organisasidatabase sering ditemukan tidak akurat, tidak lengkap, atau
ambigu.kerusakan ekonomi dan sosial dari data berkualitas rendah berbiaya
miliaran dolar (Redman,1998).

The Data Warehousing Institute (TDWI) memperkirakan pada tahun 2001 yang
berkualitas burukdata pelanggan menyebabkan bisnis AS $ 611 miliar per tahun
dalam bentuk prangko, pencetakan, danoverhead staf untuk menangani massa

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


komunikasi dan pemasaran yang salah(dari laporan TDWI: Wayne Erickson,
"Data Quality and the Bottom Linewww.dw-institute.com/dqreport/).

Yang menakutkan, biaya riil dari data berkualitas rendah adalahjauh lebih
tinggi. Organisasi dapat menggagalkan dan mengasingkan pelanggan setia
dengan salahmenangani surat atau gagal mengenali mereka ketika mereka
menelepon, atau mengunjungi took atau situs web Begitu perusahaan
kehilangan pelanggan setia, perusahaan kehilangan basis penjualannya
danrujukan, serta potensi pendapatan di masa depan. Lihat Eckerson (2002a).
Beberapa tipikalbiaya termasuk dari pengerjaan ulang, pelanggan yang hilang,
pelaporan terlambat, keputusan salah, terbuang sia-siakegiatan proyek, respon
lambat terhadap kebutuhan baru (peluang terjawab), dan penundaan
masukmengimplementasikan proyek-proyek besar yang bergantung pada
database yang ada (Olson, 2003a,2003b).

Kualitas data adalah salah satu topik yang semua orang tahu itu penting tetapi
cenderungmengabaikan. Kualitas data sering menghasilkan sedikit antusiasme
dan biasanya dilihat sebagaifungsi pemeliharaan Perusahaan jelas bersedia
menerima kualitas data yang buruk.Perusahaan bahkan bisa bertahan dan
berkembang dengan kualitas data yang buruk. Itu tidak dianggap
sebagaimasalah hidup dan mati, tapi kadang kala bisa. Ketidakakuratan data
bisa sangat mahal(lihat Olson, 2003a, 2003b). Bahkan SO, kbanyakan
perusahaan mengelola kualitas data secara kasual(Eckerson, 2002a). Menurut

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Hatcher (2003), kualitas data merupakan masalah utama di
Indonesiapengembangan gudang data dan intelijen bisnis / pemanfaatan
analitik bisnis.Kualitas data dapat menunda pelaksanaan gudang "atau data
mart enam bulanatau lebih. Data yang tidak akurat disimpan di gudang data dan
kemudian dilaporkan kepada seseorang akanlangsung membunuh kepercayaan
pengguna pada sistem yang baru.

Survei TDWI (The Data Warehouse Institute) baru-baru ini mengungkap


sumber-sumberdata kotor Ini ditunjukkan pada Tabel 5.2. Tidak mengherankan,
responden survei TDWImengutip kesalahan entri data oleh karyawan sebagai
penyebab utama data kotor.

Kualitas data sering dilupakan pada hari-hari awal pergudangan data.


Kebanyakankeputusan asli tentang kualitas data sekarang perlu ditinjau
kembali oleh gudang datapraktisi di yang lebih tua untuk mengimbangi tuntutan
pengambilan keputusan perusahaan(lihat Canter, 2002). Sebagai contoh sebuah
organisasi yang menderita karena datakualitas, lihat DSS dalam Tindakan 5.4.

Strong et al. (1997) melakukan penelitian ekstensif mengenai masalah kualitas


data danmembagi mereka ke dalam empat kategori dan dimensi berikut:

DSS DALAM TINDAKAN 5.4

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


DAT KUALITAS A SANG CULPRIT
DI MONTANA PRISONS

Kualitas data yang dimiliki Departemen Montana penjara kepada "pelanggan" selama dua hingga
Korupsi tahanan selama bertahun-tahun. Seiring lima tahun ke depan.
sistem IT tua, data kesalahan masuk dalam
laporan dibangun. Formulir yang diperlukan Pada pertengahan 1999, upaya besar berfokus
diserahkan kepada otoritas negara bagian dan pada pembersihan sistem informasi penjara
federal tidak bisa lewat tes detektor melalui kualitas dan data akurat selesai. Pada
kebohongan. Meski jurusan IS 2001, departemen itu gatekeeper sistem
kelompok menghabiskan banyak waktu upaya informasi (semua orang yang data yang
manual dalam upaya untuk mempertahankan dimasukkan dan dipelihara) telah
beberapa tingkat integritas pelaporan, secara mengembangkan suatu budaya kualitas data
keseluruhan kepercayaan terhadap kualitas data Meskipun tidak biasa, itu penting untuk
rendah. Masalahnya muncul proporsi breakout perhatikan bahwa sekitar 15 hingga 20 persen
ketika, pada tahun 1997, departemen hilang operasi perusahaan pendapatan dapat
hibah federal $ 1 juta: Pihak yang bersalah dibelanjakan untuk penyelesaian atau perbaikan
adalah informasinya sistem, yang tidak memiliki masalah kualitas data. Dan beberapa organisasi,
aturan bisnis dan data kamus. Sistem tidak dapat seperti Montana Department of Corrections,
memperkirakan secara akurat bagaimana telah membuat waktu penuh posisi yang
caranya banyak dari jenis pelaku akan dipenjara. ditujukan untuk memastikan kualitas data.
Untungnya, tidak ada pelanggar yang tersesat
dalam data shuffle, tetapi tidak ada cara untuk Source: Adapted from Beth Stackpole. "Dirty Data
memprediksi permintaan akan "layanan" Is the Dirty Little Secret That Can Jeopardize Your
CRM Effort," CIO, February 15,2001, pp. 101-114.

 DQ Kontekstual: Relevansi, nilai tambah, ketepatan waktu, kelengkapan,


jumlahdata
 DQ intrinsik: akurasi, objektivitas, kepercayaan, reputasi
 Aksesibilitas DQ: aksesibilitas, keamanan akses
 Representasi DQ: interpretability, kemudahan pemahaman, representasi
ringkas, representasi yang konsisten

Strong et al. (1997) mengembangkan kerangka kerja yang menyajikan isu-isu


utama dan hambatandi masing-masing kategori. Mereka menyarankan bahwa
sekali variabel dan hubungan utamadi setiap kategori diidentifikasi, upaya dapat
dilakukan untuk mencari tahu cara menjadi lebih baikmengelola data Beberapa
masalah adalah masalah teknis, seperti kapasitas, sementara yang
lainberhubungan dengan kemungkinan kejahatan komputer. Untuk diskusi yang
komprehensif, lihat Wang (1998).

Kualitas data penting, terutama untuk CRM, ERP, dan informasi perusahaan
lainnyasistem. Masalahnya adalah bahwa data pergudangan, e-bisnis, dan
proyek-proyek CRMsering mengekspos data berkualitas buruk karena mereka
mengharuskan perusahaan untuk mengekstrak dan mengintegrasikandata dari
berbagai sistem operasional yang sering dibumbui dengan kesalahan,
hilangnilai, dan masalah integritas. Masalah ini tidak muncul sampai seseorang
mencobauntuk meringkas atau mengagregasi data. Lihat Dyche (2001).

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Peningkatan kualitas data adalah hasil dari proses peningkatan bisnis yang
dirancang untukmengidentifikasi dan menghilangkan akar penyebab data
buruk. Aplikasi gudang datamembutuhkan pembersihan data setiap kali gudang
diisi atau diperbarui. Lihat raja(2002). Untuk meningkatkan kualitas data dan
mempertahankan keakuratan membutuhkan kualitas data aktifprogram
jaminan. Berg dan Heagele (1997) memberikan perspektif manajemen
danmodel untuk meningkatkan kualitas data. Kami menjelaskan rencana aksi
kualitas data mereka, yang menyediakankerangka kerja, dalam DSS di Focus 5.5.
Beberapa manfaat utama spesifik dari contoh-contohmeningkatkan kualitas
data termasuk mengintegrasikan sistem informasi dari dua bisnisyang
bergabung setelah akuisisi. Alih-alih upaya tiga tahun, itu diselesaikan dalam
satutahun. Contoh lain adalah mendapatkan sistem CRM selesai dan
melayaniorganisasi penjualan dan pemasaran dalam satu tahun alih-alih bekerja
selama tiga tahundan kemudian membatalkannya (lihat Olson, 2003a, 2003b).
Departemen Montana diSituasi koreksi yang dijelaskan dalam DSS dalam Action
5.4 pulih dari kualitas rendahnyamasalah data dengan mengembangkan budaya
kualitas melalui rencana jaminan kualitas data.

Kami menjelaskan beberapa praktik terbaik untuk kualitas data dalam DSS di
Fokus 5.6. Praktisitelah mengidentifikasi hal ini penting bagi sebuah organisasi
untuk mempertahankan data tingkat tinggikualitas dan integritas.Masalah
kualitas data, metode, dan solusi dibahas dengan sangat rinci oleh Berson et al.
(2000), Canter (2002), Dasu and Johnson (2003), Dravis (2002), Dyche (2001),
Eckerson (2002a), King (2002), Loshin (2001,2003), Qlson. (2003a, 2003b),
Staekpole (2001), Stodder (2002), and Theodoratos arid Bouzeghoug (2001).

DSS IN FOCUS 5.5


A DATA QUALITY ACTION PLAN

Rencana tindakan kualitas data adalah kerangka 7. Mengidentifikasi dan menerapkan


kerja yang direkomendasikan untuk memandu kualitas data yang cepat inisiatif
peningkatan kualitas data. Di sini adalah perbaikan
langkah-langkah yang harus diikuti: 8. Melaksanakan metode pengukuran
untuk mendapatkan a baseline
1. Tentukan fungsi bisnis yang penting berkualitas data.
dianggap. 9. Menilai pengukuran, masalah kualitas
2. Identifikasi kriteria untuk memilih elemen data, dan penyebab mereka
data penting. 10. Merencanakan dan menerapkan
3. Tentukan elemen data penting. inisiatif peningkatan tambahan
4. Identifikasi masalah kualitas data yang 11. Lanjutkan untuk mengukur tingkat
diketahui elemen data, dan penyebabnya. kualitas dan inisiatif lagu.
5. Tentukan standar kualitas yang akan 12. Perluas proses untuk memasukkan
diterapkan setiap elemen data penting elemen data tambahan
6. Rancang metode pengukuran untuk setiap
standar. Source: Adapted from Berg and Heagele (1997).

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


DSS IN FOCUS 5.6 BEST PRACTICES FOR DATA QUALITY

Berikut ini beberapa praktik terbaik untuk  Kenali data Anda. Pahami data anda apa
memastikan kualitas data miliki, dan untuk apa mereka digunakan.
dalam praktek. Tentukan Tingkat presisi yang tepat
 Menggosok data saja tidak cukup. diperlukan untuk masing-masingitem data.
Perangkat lunak pembersihan data hanya
menangani beberapa masalah: angka yang Buatlah proses yang terus menerus.
tidak akurat, salah eja, bidang tidak Mengembangkan budayakualitas data.
lengkap. Luas Program data berkualitas Melembagakan metodologi danpraktik terbaik
mendekati standarisasi datasehingga untuk memasukkan dan memeriksa informasi.
informasi dapat mempertahankan
integritasnya. Ukur hasil. Secara teratur mengaudit
 Mulai dari atas. Manajemen puncak harus hasilnyamemastikan bahwa standar ditegakkan
sadar masalah kualitas data dan bagaimana dan untukmemperkirakan dampak pada garis
pengaruhnya organisasi. Mereka harus dasar.
membeli setiap usaha perbaikan, karena
sumber daya akan dibutuhkan untuk Source: Adapted from Beth Staekpole, "Dirty Data Is
mengatasi lamamasalah. the Dirty Little Secret That Can Jeopardize Your CRM
Effort," CIO, February 15,2001, pp. 101-114.

INTEGRITAS DATA

Salah satu masalah utama DQ adalah integritas data. Sistem pengarsipan yang
lebih lama mungkin tidak memiliki integritas.Artinya, perubahan yang ilakukan
dalam file di satu tempat mungkin tidak dibuat dalam file di tempat laintempat
atau departemen. Ini menghasilkan data yang bertentangan. Masalah khusus
ualitas data danukuran tergantung pada aplikasi data. Ini adalah masalah yang
sangat penting dalamlingkungan komputasi kolaboratif (Bab 7), seperti yang
disediakan oleh LotusCatatan / Domino dan Groove. Di area gudang data,
misalnya, Gray danWatson (1998) membedakan lima masalah berikut:

 Keseragaman. Selama pengambilan data, pemeriksaan keseragaman


memastikan bahwa data tersebutdalam batas yang ditentukan.
 Versi. Pemeriksaan versi dilakukan saat data ditransformasikanpenggunaan
metadata untuk memastikan bahwa format data asli belumberubah.
 Pemeriksaan kelengkapan. Pemeriksaan kelengkapan memastikan bahwa
ringkasannya benardan bahwa semua nilai yang diperlukan untuk
membuat ringkasan disertakan.
 Pemeriksaan kesesuaian. Pemeriksaan kesesuaian memastikan bahwa data
yang diringkas adalah"di stadion baseball." Artinya, selama analisis dan
pelaporan data, korelasi dijalankanantara nilai yang dilaporkan dan nilai
sebelumnya untuk nomor yang sama. Tiba-tibaperubahan dapat
menunjukkan perubahan mendasar dalam bisnis, kesalahan analisis, atau
data buruk.
 Cek silsilah atau tiriskan. Pemeriksaan silsilah atau tiruan adalah jejak
kembalike sumber data melalui berbagai transformasi.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


DATA AKSES AND INTEGRATION

Seorang pengambil keputusan biasanya membutuhkan akses ke banyak sumber


data yang harus diintegrasikan(lihat Aplikasi Vignette dan Kasus Pembukaan 5.1
dan 5.2). Sebelum datagudang, mart data, dan perangkat lunak intelijen bisnis,
yang menyediakan akses ke datasumber adalah proses yang besar dan
melelahkan. Bahkan dengan manajemen data berbasis Web modernalat,
mengenali data apa yang bisa diakses dan diberikan kepada pengambil
keputusan adalah aTugas trivial yang membutuhkan spesialis basis data.
Sebagai gudang data tumbuh dalam ukuran, itumasalah Mengintegrasikan data
yang menjengkelkan. Ini sangat penting bagi DepartemenKeamanan Dalam
Negeri Lihat Chabrow (2002) dan DSS dalam Tindakan 5.7 untuk bagaimana
DHSmengerjakan proyek integrasi data dan aplikasi perusahaan secara besar-
besaran.

Kebutuhan analitik bisnis terus berkembang. Selain sejarah,bersih, konsolidasi,


dan data point-in-time, pengguna bisnis semakin menuntutakses ke data real-
time, tidak terstruktur, dan / atau remote. Selain itu, semuanya
harusterintegrasi dengan isi gudang data mereka yang ada. Lihat Devlin,
2003.Selain itu, akses melalui PDA dan melalui pengenalan dan sintesis suara
menjadilebih umum, masalah integrasi yang lebih rumit (lihat Edwards, 2003).

Fox (2003) mendeskripsikan model informasi aktif untuk transformasi data


dalam pengembangansistem perusahaan-lebar. Model-model ini
mempertimbangkan kebutuhantransformasi logika untuk aplikasi biaya tinggi
yang dikembangkan sendiri. Lebih jauh lagi, mereka harustermasuk perbedaan
semantik dan sintaksis antar skema. Ini terutamapenting ketika merger
perusahaan terjadi dan aplikasi paralel harus terintegrasi.Sumber data
perusahaan dapat mengambil berbagai bentuk: Relational Database (RDB)tabel,
dokumen XML, pesan Electronic Data Interchange (EDI), COBOLrekaman, dan
sebagainya. Aplikasi Independent Software Vendor (ISV),seperti perencanaan
sumber daya perusahaan, perangkat lunak manajemen hubungan pelanggan,
dan pengembangan di rumahperangkat lunak, tentukan skema input dan output
mereka sendiri. Seringkali, berbedaskema menyimpan informasi serupa yang
terstruktur secara berbeda. Model informasi adalah pusatdalam hal ini mewakili
pandangan semantik yang netral dari perusahaan. Lihat Fox (2003)
untukrincian. Case Application 5.2 menjelaskan bagaimana perusahaan
mengembangkan infrastruktur untuk pengintegrasiandata dari sumber yang
berbeda. DSS dalam Focus 5.8 menjelaskan proses dariekstrak, transformasi,
dan beban (ETL), yang menjadi dasar bagi semua upaya integrasi data.

Banyak proyek integrasi melibatkan sistem perusahaan-lebar. Di DSS di Focus


5.9, kitaberikan daftar periksa tentang apa yang berhasil dan apa yang tidak
bekerja saat mencoba proyek semacam itu.Lihat Orovic (2003) untuk detail dan
dampak. Juga lihat Bab 6 untuk rincian tentang DSSpelaksanaan.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Mengintegrasikan data dengan benar dari berbagai basis data dan sumber lain
yang berbedasulit. Tetapi ketika tidak dilakukan dengan benar, itu dapat
menyebabkan bencana di sistem perusahaan-lebarseperti proyek CRM, ERP, dan
supply chain (Nash, 2002). Lihat DSS di Fokus 5.10 untukmasalah yang
berkaitan dengan pembersihan data sebagai bagian dari integrasi data. Juga
lihat Dasu danJohnson (2003). Madsen (2003) menjelaskan bagaimana
infrastruktur pengiriman real-time (lihatBagian 5.12) memungkinkan
perusahaan mengintegrasikan aplikasi dengan mudah secara berulangnamun
tetap cukup fleksibel untuk mengakomodasi perubahan.

Penulis berikut membahas masalah integrasi data, model, metode, dan


solusi:Balen (2000), Calvanese et al. (2003), Devlin (2003), Erickson (2003), Fox
(2003),Holland (2000), McCright (2001), Meehan (2002), Nash (2002), Orovic
(2003),Vaughan (2003), Pelletier, Pierre, dan Hoang (2003), dan Whiting
(2002).

DSS IN ACTION 5.7 HOMELAND SECURITY DATA INTEGRATION

Steve Cooper, asisten khusus untuk presiden dan tidak berlokasi di database relasional,dan
CIO dari Departemen Keamanan Dalam Negeri mereka tidak dapat dengan mudah dimanipulasi
AS(DHS), bertanggung jawab untuk menentukan dan dianalisis.Aplikasi komersial pasti akan
yang adaaplikasi dan jenis data dapat membantu digunakandalam integrasi besar ini. Mungkin
organisasimemenuhi tujuannya, memigrasikan sebagian besar usahaakan diselesaikan dengan
data menjadi aman, dapat digunakan,state-of- data warehouse dan datamartteknologi.
the-art framework, dan mengintegrasikan yang Informatica, di antara perangkat lunak
berbedajaringan dan standar data dari 22 lainnyavendor, telah mengembangkan solusi
lembaga federal,dengan 170.000 karyawan, yang integrasi data itumemungkinkan organisasi
bergabung untuk membentukDHS. Tugas ini untuk menggabungkan sistem yang
harus diselesaikan pada pertengahan tahun berbedamembuat informasi lebih mudah diakses
2005. Itu nyatamasalah adalah bahwa agen di seluruhsebuah organisasi. Perangkat lunak
federal secara historis beroperasiotonom, dan tersebut mungkin ideal untuk seperti ituproyek
sistem TI mereka tidakdirancang untuk saling berskala besar.
beroperasi satu sama lain. Pada dasarnya,DHS
perlu menghubungkan silo data bersama. Idenya adalah memutuskan dan menciptakan
perusahaanarsitektur (lihat Permohonan Kasus
DHS memiliki salah satu pengumpulan informasi 5.2) untuk federal danlembaga negara yang
yang paling kompleksdan proyek migrasi data terlibat dalam keamanan dalam negeri.
sedang berlangsung dipemerintah federal. Arsitekturakan membantu menentukan
Tantangan untuk memindahkan datadari sistem keberhasilan tanah airpertahanan. Langkah
warisan (lihat Aplikasi Perkara 5.2), dalamatau pertama dalam memigrasikan data adalah
lintas agensi, adalah sesuatu yang harus mengidentifikasi semuaaplikasi dan data yang
dilakukan oleh semua departemenalamat. Rumit digunakan. Setelah mengidentifikasi aplikasidan
masalah adalah kebanyakanaplikasi penuaan database, langkah selanjutnya adalah
cepat dan database di seluruhpemerintah. menentukanyang digunakan dan mana yang
Peningkatan integrasi data berada di bawahjalan dibuang. Setelah sebuah organisasimengetahui
di tingkat federal, lokal, dan negara bagian. data dan aplikasi apa yang ingin disimpan,proses
Pemerintahmenggunakan alat dari dunia usaha. yang sulit untuk memindahkan data dimulai.
Pertama, itu perluuntuk mengidentifikasi dan
Masalah besar terjadi karena masing- membangun sebuah thread umum didata.
masingagensi memiliki seperangkat aturan Tantangan utama lainnya dalam migrasi
bisnisnya sendiri yang menentukan bagaimana dataarena adalah keamanan, terutama ketika
caranyadata dijelaskan, dikumpulkan, dan berhadapan dengan data danaplikasi yang sudah
diakses. Beberapa daridata tidak terstruktur dan berumur puluhan tahun.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Homeland Security pasti akan memiliki analisis DARPA, Proyek Penelitian Lanjutan Pertahanan
informasidan komponen perlindungan Agency, menghabiskan $ 240 juta untuk proyek
infrastruktur.Ini mungkin satu tantangan paling gabunganKesadaran Informasi Total, untuk
sulit bagiDHS. Bukan hanya Homeland Security mengembangkan cara mengobatidi seluruh
yang harus dibuatrasa gunung besar intelijen dunia, mendistribusikan database warisan
yang dikumpulkan darisumber yang berbeda, seolah-olah merekaadalah database terpusat
tetapi kemudian harus mendapatkan informasi tunggal.
itukepada orang-orang yang paling efektif
bertindak.Banyak dari mereka berada di luar Sources: Adapted from Eric Chabrow, "One Nation,
pemerintah federal. Under I.T." InformationWeek, No. 914, November
11,2002, pp. 47-50; Todd Datz, "Integrating America,"
CIO, December 2002, p. 44-51; John Foley, "Data
Bahkan pemerintah pusat pun mengakui data itu
Debate." InformationWeek, May 19, 2003, pp. 22-24;
kekurangan dapat mengganggu DHS. Amy Rogers Nazarov, "Informatica Seeks Partners to
Memindahkan informasike tempat yang Gain Traction in Fed Market." CRN, June 9,2003, p. 39;
diperlukan, dan melakukannya ketika Patrick Thibodeau, "DHS Sets Timeline for IT
dibutuhkan, adalahkritis dan sangat sulit. Sekitar Integration," ComputerWorld, June 16,2003, p. 7;
650.000 negaradan aparat penegak hukum Katherine Mclntire Peters, "5 Homeland Security
setempat "beroperasi secara virtualvakum Hurdles," Government Executive, Vol. 35, No. 2, pp. 18-
intelijen, tanpa akses ke jam tangan terorisdaftar 21, February 2003; Amy Rogers, "Data Sharing Key to
Homeland Security Efforts," CRN, No.1019, November
yang disediakan oleh Departemen Luar Negeri
4,2002, pp. 3'9-40; and Karen D. Schwartz, "The Data
untuk imigrasidan pejabat konsuler, "menurut: Migration Challenge," Governm
Oktober 2002Hart-Rudman melaporkan,
"America Still UnpreparedAmerica
Masih dalam Bahaya, "disponsori oleh Dewan
padaHubungan Luar Negeri. Gugus tugas
menyebutkan kurangnya kecerdasanberbagi
sebagai masalah penting yang layak
langsungperhatian. "Ketika datang untuk
memberantas terorisme,petugas polisi yang
sedang berdetak efektif beroperasituli, bisu dan
buta, "kata laporan itu.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


DATA INTEGRATION VIA XML

XML dengan cepat menjadi bahasa standar untuk integrasi database dan
datatransfer(Balen, 2000). Pada tahun 2004, sekitar 40 persen dari semua
transaksi e-commerceterjadi pada server XML Ini naik dari 16 persen pada 2002
(lihat Savage, 2001) TXML dapat merevolusi pertukaran data elektronik dengan
menjadi data universalpenerjemah (Savage, 2001). Pengembang sistem harus
sangat berhati-hati karena XMLtidak bisa mengatasi logika bisnis yang buruk
Jika proses bisnis buruk, tidak ada integrasi datametode akan
memperbaikinya.Meskipun XML adalah cara terbaik untuk bertukar data antar
aplikasi danorganisasi, masalah penting adalah apakah itu dapat berfungsi
dengan baik sebagai format database aslidalam praktek. XML adalah
ketidakcocokan dengan database relasional: ia bekerja, namun sulit untuk
dipelihara.Ada kesulitan dalam kinerja, khususnya dalam mencari database
besar.XML menggunakan banyak ruang. Meski begitu, ada mesin database XML
asli. Lihat DeJesus(2000) untuk lebih lanjut tentang ini.

DSS DALAM FOKUS 5.8


WHAT IS ETL?

Program Extract, Transform, dan Load (ETL) semua proses dan operasi run-time (misalnya,
secara berkala ekstrak data dari sistem sumber, penjadwalan, manajemen kesalahan, log audit,
ubah mereka ke dalam format umum, dan statistik). ETL sangat penting untuk integrasi
kemudian memuatnya ke target penyimpanan data dan data pergudangan.
data, biasanya gudang data atau data mart. Alat
ETL juga biasanya mengangkut data antar Sumber: Diadaptasi dari Wayne Erickson, "Evolusi dari
sumber dan target, mendokumentasikan ETL, "in What Works: Praktik Terbaik dalam Bisnis
bagaimana elemen data berubah menjadi Intelijen
mereka berpindah antara sumber dan target dan Data Warehousing, Vol. 15, Data Pergudangan
(mis., metadata), tukarkan metadata dengan Institute, Chatsworth, CA, Juni, 2003.
aplikasi lain sesuai kebutuhan, dan mengatur

DSS I N FOCUS 5.9


WHAT TO DO AND TIDAK ADA TTOOO
WHEN IMPLEMENTING AN ENTERPRISE -
WIDE INTEGRATION PROJECT
APA YANG HARUS DILAKUKAN:

1. Berpikir secara global dan bertindak secara 6. Gunakan prototipe sebagai generator
lokal. Rencanakan nterprisewide;Terapkan estimasi proyek.
secara bertahap. 7. Pikirkan integrasi pada berbagai tingkat
2. Tentukan komponen kerangka kerja abstraksi.
integrasi. 8. Berharap untuk membangun logika aplikasi
3. Fokus pada tujuan yang digerakkan oleh ke dalam perusahaan infrastruktur.
bisnis dengan biaya tinggi dankompleksitas 9. Tetapkan tanggung jawab proyek setinggi-
teknis rendah. tingginyatingkat perusahaan dan rnegosiasi,
4. Perlakukan sistem perusahaan sebagai bernegosiasi, bernegosiasi.
aplikasi strategis Anda. 10. Merencanakan pencatatan pesan dan gudang
5. Mengejar penggunaan ulang, pendekatan untuk dilacakaudit dan pemulihan.
berbasis templatepengembangan. 11. Beli lebih banyak dari yang Anda butuhkan
untuk fase tertentu.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


12. Mengganti arsitektur aplikasi 15. Asumsikan bahwa semua pengetahuan yang
enterpriseuntuk gudang data Pakar relevan ada di dalamnyatim proye
penggunaan integrasi berbasis pesan real- 16. Didorong oleh sentralisasi tingkat
timekecuali itu mutlak wajib. perusahaan apa punobyek bisnis sebagai
13. Asumsikan bahwa model proses yang ada bagian dari aplikasi perusahaanpelaksanaan.
akancukup untuk integrasi proses; mereka 17. Jadilah intrusif ke dalam aplikasi yang ada.
bukansama. 18. Gunakan proses ad hoc dan teknik
14. Rencanakan untuk mengubah proses bisnis pemodelan pesan.
Anda sebagai bagian daripenerapan aplikasi
perusahaan.

APA YANG TIDAK DILAKUKAN:

1. Kritik strategi bisnis melalui perusahaan


Arsitektur. Sebaliknya evaluasi dampak dari
strategi bisnis di bidang TI.

Sumber: Diadaptasi dari V. Orovic,

DATA INTEGRATION SOFTWARE.

Pengembang perangkat lunak pengarsipan dokumen dan data dan manajemen


semakin meningkatmemanfaatkan XML untuk mengangkut data dari sumber ke
tujuan. Misalnya, CaptivaSoftware Corp, RTSe USA Inc., Kofax Image Products
Inc., dan Tower Software semuamenggunakan XML untuk memindahkan dan
mengunggah dokumen ke Web, intranet, dan aplikasi nirkabel.RosettaNet XML
Solutions membuat protokol B2B standar yang meningkatkan pasokanefisiensi
rantai. BizTalk Server 2000 menggunakan XML untuk membantu perusahaan
mengelola bisnis merekadata, melakukan pertukaran data dengan mitra e-niaga
dengan lebih mudah, dan menurunkan biaya(Savage, 2001). Alat-alat
transformasi data ADT (dulu InfoPump) dariComputer Associates melacak
perubahan data dan aplikasi. Perangkat lunak ini memungkinkan
perusahaanekstrak dan ubah data dari hingga 30 sumber termasuk database
relasional,mainframe IMS dan file VSAM, dan aplikasi, dan memuatnya ke dalam
database atau.gudang data. Vaughan (2003) menyediakan daftar perangkat
lunak yang menggunakan XML untukekstrak dan ubah data.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


DSS DALAM FOKUS 5.10
ENTERPRISE DATA HOUSE CLEANING

Setiap organisasi memiliki data yang berlebihan, data yang salah,data yang hilang, dan data miscoded,
mungkin terkubur dalam system yang tidak banyak berkomunikasi. Ini lotengmasalah akrab bagi sebagian
besar pemilik rumah: Melemparkancukup kotak pakaian musiman, trim liburan, familyhistorydokumen,
dan barang penting lainnya, dan segerakekacauan itu terlalu besar untuk dikelola. Itu terjadi di perusahaan,
terlalu. Beberapa unit operasi, pabrik, danfasilitas lain mungkin semua menjalankan aplikasi vendor yang
berbedauntuk penjualan, sumber daya manusia, dan tugas lainnya. ItuCampuran data yang berbeda
membuat sebuah berkas dari unsorted daninformasi yang tidak didamaikan. Integrasi menjadi
utamaupaya.

MEMBERSIHKAN RUMAH:
Sebelum data apa pun dapat dibersihkan, departemen TI Andaharus membuat rencana untuk mencari dan
mengumpulkan semua data
dan kemudian memutuskan cara mengelolanya. Praktisitawarkan saran ini:
1. Tentukan jenis informasi apa yang harus diambil. Buat komite pemetaan data kecil
untukmelakukan hal ini.
2. Cari perangkat lunak pemetaan yang dapat memanen data dari banyak sumber, termasuk aplikasi
warisan, PC file, dokumen HTML, sumber tidak terstruktur, dan sistem perusahaan Beberapa
vendor telah berkembang perangkat lunak semacam itu
3. Mulailah dengan proyek bernilai tinggi. Integrasi pertama proyek harus dalam unit bisnis yang
menghasilkan pendapatan tinggi Ini membantu mendapatkan manajemen tingkat atas membeli di.
4. Buat dan pelembagaan proses untuk pemetaan, pembersihan, dan pengumpulan data. Perusahaan
harus terus menerusambil informasi dari yang berbeda

sumber.
Sumber: Diadaptasi dari Kim S. Nash, "Penggabungan

5 . 4 THE WEB/INTERNET AND COMMERCIAL DATABAS E SERVICE S

Data eksternal masuk ke berbagai organisasi dari berbagai sumber. Beberapa


data datang padasecara reguler dari mitra bisnis melalui kolaborasi (mis.,
kolaborasi supplychainpengelolaan; lihat Bab 7 dan 8). Internet adalah sumber
data utama.
 Web / Internet. Banyak ribuan database di seluruh dunia dapat diaksesmelalui
Web / Internet. Pembuat keputusan dapat mengakses halaman beranda
vendor,klien, dan pesaing, melihat dan mengunduh informasi, atau
perilakupenelitian. Internet adalah pemasok utama data eksternal untuk banyak
situasi keputusan.
 Data bank komersial. Layanan database online (komersial) menjual akses
kedatabase khusus Layanan semacam itu dapat menambahkan data eksternal ke
SPM secara tepat waktucara dan dengan biaya yang masuk akal. Sebagai contoh,
data GIS harus akurat; regular update tersedia Beberapa ribu layanan saat ini
tersedia, banyakyang dapat diakses melalui internet. Tabel 5.3 mencantumkan
beberapa layanan perwakilan.

Pengumpulan data dari beberapa sumber eksternal mungkin rumit.Produk dari


perusahaan terkemuka, seperti Oracle, IBM, dan Sybase, dapat mentransfer

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


informasidari sumber eksternal dan taruh di tempat yang diperlukan, ketika
diperlukan, di a
bentuk yang bisa digunakanKarena sebagian besar sumber data eksternal ada di
Web, masuk akal untuk menggunakan cerdasagen untuk mengumpulkan dan
mungkin menginterpretasikan data eksternal. Pelletier, Pierre, dan Hoang
(2003)menggambarkan sistem multi-agen yang dirancang untuk pencarian
informasi cerdas dari sumber terdistribusi heterogen. Sistem ini menggunakan
agen perangkat lunak dan sangat ideal untuk cerdasintegrasi. Untuk contoh lain
bagaimana hal ini dilakukan, lihat Liu dkk. (2000).

THE WEB AND CORPORATE DATABASES AND SYSTEMS

Perkembangan dalam sistem manajemen dokumen (DMS) dan manajemen


kontensistem (CMS) mencakup penggunaan browser Web oleh karyawan dan
pelanggan untuk mengaksesinformasi penting. Isu-isu kritis telah menjadi lebih
kritis dalam sistem berbasis Web (lihatGates, 2002; Rapoza, 2003). Penting
untuk mempertahankan versi yang akurat dan terbaru daridokumen, data, dan
konten lainnya, karena jika tidak, nilainya akan menjadi informasimengurangi.
Komputasi real-time, terutama yang berhubungan dengan DMS dan CMS, telah
menjadi arealitas. Para manajer mengharapkan DMS dan CMS mereka untuk
menghasilkan data yang akuratdokumen dan informasi tentang status

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


organisasi yang terkait dengan merekapekerjaan (lihat Gates, 2002; Raden,
2003a, 2003b). Akses real-time ke data ini diperkenalkanKomplikasi baru dalam
perancangan dan pengembangan gudang data dan alatnyayang mengaksesnya
Lihat Bagian 5.12 untuk rinciannya. Perkembangan Web lainnya termasuk
PilotSuite Dukungan Keputusan Perangkat Lunak (pilotsw.com) dikombinasikan
dengan Perangkat Lunak BluelsleInTouch (blueisle.com) dan sistem pendukung
grup yang digunakan melalui browser Web (mis.,Lotus Notes / Domino dan
Groove), dan sistem manajemen basis data yang disediakandata secara langsung
dalam format yang dapat ditampilkan oleh browser Web dengan pengiriman
melalui Internetatau intranet. Penerbit Internet Pilot adalah produk Web
mandiri, seperti jugaKeputusan Web dari Comshare (comshare.com).

Vendor "tiga besar" dari sistem manajemen basis data relasional -


Oracle,Microsoft, dan IBM-semuanya memiliki produk database inti untuk
mengakomodasi dunia arsitektur klien / server dan aplikasi Internet / intranet
yang menggabungkan nontradisional,atau kaya, tipe data multimedia. Begitu
juga perusahaan lain di daerah ini. Milik OracleDeveloper / 2000 mampu
menghasilkan aplikasi client / server grafis di PL / SQLkode, implementasi
Oracle dari bahasa query terstruktur (SQL), dan juga diCOBOL, C ++, dan HTML.
Alat-alat lain menyediakan kemampuan browser web, multimediaauthoring dan
content scripting, perpustakaan kelas objek, dan rutin OLAP. MicrosoftStrategi
.Net mendukung kecerdasan bisnis berbasis Web.

Di antara pemasok situs Web dan integrasi database adalah Spider


Technologies(spidertech.com), Hart Software (hart.com), Next Software Inc.
(next.com),NetObjects Inc. (netobjects.com), Oracle Corporation (oracle.com),
dan OneWaveInc. (onewave.com). Vendor ini menghubungkan teknologi Web ke
sumber basis data dan kesistem database warisan

Penggunaan Ofthe Web telah memiliki dampak luas pada komputasi kolaboratif
di Indonesiabentuk groupware (Bab 7), sistem informasi perusahaan (Bab
8),sistem manajemen pengetahuan (Bab 9), sistem manajemen dokumen,
danseluruh area desain antarmuka, termasuk sistem informasi perusahaan
lainnya:
ERP / ERM, CRM, PLM, dan SCM.

5.5 DATABASE MANAGEMENT SYSTEMS IN DECISION SUPPORT


SYSTEMS/BUSINESS INTELLIGENCE

Kompleksitas sebagian besar database perusahaan dan database MSS


independen berskala besarterkadang membuat sistem operasi komputer
standar tidak memadai untuk yang efektifdan antarmuka yang efisien antara
pengguna dan basis data. Basis data mengelola *sistem (DBMS) melengkapi
sistem operasi standar dengan memungkinkan lebih besarintegrasi data,
struktur file yang kompleks, pencarian cepat dan perubahan, dan data yang

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


lebih baikkeamanan. Secara khusus, DBMS adalah program perangkat lunak
untuk menambahkan informasi ke databasedan memperbarui, menghapus,
memanipulasi, menyimpan, dan mengambil informasi. SEBUAHDBMS
dikombinasikan dengan bahasa pemodelan adalah suatu bentuk pengembangan
sistem yang biasa digunakandalam membangun sistem pendukung keputusan
dan sistem pendukung manajemen lainnya.DBMS dirancang untuk menangani
sejumlah besar informasi. Seringkali, data dariDatabase diekstrak dan
dimasukkan ke dalam statistik, matematika, atau model keuangan untuk
selanjutnyamanipulasi atau analisis. DSS besar dan kompleks sering melakukan
hal ini.

Peran utama DBMS adalah mengelola data. Dengan mengelola, kami bermaksud
membuat, menghapus,mengubah, dan menampilkan data. DBMS memungkinkan
pengguna untuk melakukan query data dan juga untuk menghasilkanlaporan.
Untuk rinciannya, lihat Ramakrishnan dan Gehrke (2002). Pengelolaan database
yang efektifdan pengambilan dapat menghasilkan manfaat yang sangat besar
bagi organisasi, seperti yang terlihat dalamsituasi Aviall Inc., yang dijelaskan
dalam DSS dalam Action 5.11.

Sayangnya, ada beberapa kebingungan tentang peran DBMS yang tepat


danspreadsheet. Hal ini karena banyak kemampuan menawarkan DBMS yang
serupa dengan yang tersedia dispreadsheet terintegrasi seperti Excel, dan ini
memungkinkan pengguna DBMS melakukan DSSspreadsheet bekerja dengan
DBMS. Demikian pula, banyak program spreadsheet menawarkan yang belum
sempurnaset kemampuan DBMS. Meskipun kombinasi semacam itu bisa
berharga beberapa orangkasus, hal itu dapat mengakibatkan pemrosesan
informasi yang panjang dan hasil yang inferior. Add-inFasilitas tidak cukup kuat
dan seringkali sangat tidak praktis. Akhirnya, komputernyaRAM yang tersedia
mungkin membatasi ukuran spreadsheet pengguna. Untuk beberapa aplikasi,
DBMSBekerja dengan beberapa database dan menangani lebih banyak data
daripada spreadsheet

DSS IN ACTION 5.11


AVIALL LAND S $3 BILLION DEA L
Seberapa penting manajemen data yang efektif dan pengambilan kembali? Aviall Inc. mengaitkan suku
cadang senilai $ 3 miliar kontrak distribusi yang dimenangkannya ke infrastruktur TI-nya. Kontrak sepuluh
tahun mengharuskan perusahaan untuk mendistribusikan suku cadang untuk mesin pesawat Rolls-Royce.
Itu kemampuan untuk menawarkan layanan berbasis teknologi, seperti penjualan peramalan, hingga ke
level item baris disebut sebagai salah satu alasan mengapa Aviall berhasil. Saya tbaru-baru ini informasi
terkait dari ERP, rantai pasokan manajemen, manajemen hubungan pelanggan, dan Aplikasi e-business
untuk menyediakan akses ke kelautannya dan inventaris dan distribusi bagian penerbangan (dengan biaya
tertentu dari sekitar $ 30 sampai $ 40 juta). Sistem ini diharapkan
membayar sendiri dengan memotong biaya yang terkait dengan "hilang" inventaris. Akses informasi yang
tepat waktu terbukti sumber daya kompetitif yang menghasilkan hasil yang besar

Source: Adapted from Marc L. Songini, "Distribution Deal Prods Tight IT Ties Between Aviall, Rolls-Royce," ComputerWorld,
January 14,2002.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


For DSS applications, it is often necessary to work with both data and models.
Therefore, it is tempting to use only one integrated tool, such as Excel. However,
interfaces between DBMS and spreadsheets are fairly simple, facilitating the
exchange of data between more powerful independent programs. Web-based
modeling and database tools are designed to seamlessly interact (Fourer, 2001).
Small to medium DSS can be built either by enhanced DBMS or by integrated
spreadsheets. Alternatively, they can be built with a DBMS program and a
spreadsheet program. A third approach to the construction of DSS is to use a
fully integrated DSS generator (Chapter 6).

5 . 6 DATABASE ORGANIZATION A ND STRUCTURES

Hubungan antara banyak catatan individu yang disimpan dalam database


dapatdiungkapkan oleh beberapa struktur logis (lihat Kroenke, 2002; Mannino,
2001; McFaddenet al., 2002; Post, 2002; dan Riccardi, 2003). DBMS dirancang
untuk menggunakan struktur iniuntuk menjalankan fungsi mereka. Tiga
struktur konvensional-relasional, hierarkisdan busur jaringan yang ditunjukkan
pada Gambar 5.1.

RELATIONAL DATABASES

Bentuk relasional dari organisasi basis data DSS, digambarkan sebagai tabular
atau flat, memungkinkanpengguna untuk berpikir dalam bentuk tabel dua
dimensi, yang merupakan cara banyak orang melihatlaporan data DBMS
relasional memungkinkan beberapa permintaan akses. Dengan demikian, file
data terdirisejumlah kolom melanjutkan halaman. Setiap kolom dianggap
terpisahbidang. Baris pada halaman mewakili catatan individu yang terdiri dari
beberapa bidang, yaituDesain yang sama yang digunakan oleh spreadsheet.
Beberapa file data semacam itu dapat dihubungkan olehsarana bidang data
umum yang ditemukan dalam dua (atau lebih) file data. Nama-nama
umumbidang harus dieja persis sama, dan bidang harus berukuran sama
(samajumlah byte) dan jenis (mis., alfanumerik atau dolar). Misalnya, pada
Gambar 5.1

bidang data Nama Pelanggan ditemukan baik di pelanggan dan file penggunaan,
dan dengan demikianmereka terkait. Nomor data bidang Produk ditemukan
dalam file produk dan file penggunaan. Melalui hubungan umum inilah ketiga
file tersebut saling terkait dan masukkombinasi membentuk basis data
relasional.

Keuntungan dari jenis basis data ini adalah bahwa mudah bagi pengguna untuk
belajar, adalahmudah diperluas atau diubah, dan dapat diakses dalam sejumlah
format yang tidak diantisipasipada saat desain awal dan pengembangan

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


database. Ini dapat mendukung besarjumlah data dan akses yang efisien. Banyak
gudang data yang diatur dengan cara ini

HIERARCHICAL DATABASES

Model hierarki memerintahkan item data dengan cara top-down, menciptakan


tautan logisantara item data terkait. Terlihat seperti bagan pohon atau
organisasi. Ini digunakanterutama dalam proses transaksi, dimana efisiensi
proses merupakan elemen penting

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


NETWORK DATABASES

Struktur basis data jaringan memungkinkan tautan yang lebih rumit, termasuk
koneksi lateralantar item terkait. Struktur ini juga disebut model CODASYL. Bisa
menghemat ruang penyimpanan melalui pembagian beberapa item. Misalnya,
pada Gambar 5.1,Green and Brown share S.l dan T.l.

OBJECT-ORIENTED DATABASES

Aplikasi MSS yang komprehensif, seperti yang melibatkan manufaktur


terintegrasi computer (CIM), memerlukan aksesibilitas ke data kompleks, yang
mungkin termasuk gambar danhubungan yang rumit. Situasi semacam itu tidak
dapat ditangani secara efisien oleh hierarki,jaringan, atau bahkan arsitektur
basis data relasional, yang terutama menggunakan alfanumerikpendekatan.
Bahkan penggunaan SQL untuk membuat dan mengakses database relasional
mungkin tidakefektif. Untuk aplikasi semacam itu, representasi grafis, seperti
yang digunakan padasistem berorientasi objek, semoga bermanfaat.

Manajemen data berorientasi objek u berdasarkan pada prinsip berorientasi


objekpemrograman (lihat detail di Bab Web; juga lihat Moore dan Britt, 2001).
Berorientasi pada objeksistem basis data menggabungkan karakteristik dari
pemrograman berorientasi objekbahasa, seperti Veritos atau UML, dengan
mekanisme penyimpanan dan akses data.Alat berorientasi objek fokus langsung
pada database. Database berorientasi objekSistem manajemen (OODBMS)
memungkinkan seseorang untuk menganalisis data pada tingkat konseptual itu
menekankan hubungan alami antar objek. Abstraksi digunakan untuk
membangunhierarki warisan, dan enkapsulasi objek memungkinkan perancang
database untuk menyimpanbaik data konvensional maupun kode prosedural
dalam objek yang sama.

Sistem manajemen data berorientasi objek mendefinisikan data sebagai objek


dan merangkumdata beserta struktur dan perilaku mereka yang relevan. Sistem
ini menggunakan hirarkikelas dan subkelas objek. Struct ure, dalam hal
hubungan, dan perilaku, diistilah metode dan prosedur, yang terkandung dalam
suatu objek.Sistem manajemen basis data relasional dan objek-relasional di
seluruh duniapasar perangkat lunak diperkirakan akan tumbuh hampir $ 20
miliar pada 2006, menurut IDC(The Day Group, 2002). Manajer basis data
berorientasi objek-sangat berguna dalamdidistribusikan DSS untuk aplikasi
yang sangat kompleks. Sistem database berorientasi objek memilikikekuatan
untuk menangani data kompleks yang digunakan dalam aplikasi MSS. Untuk
yang deskriptifcontoh, lihat DSS dalam Tindakan 5.12. Trident Systems Group
Inc. (Fairfax, Virginia) memilikimengembangkan sistem database berorientasi
obyek berskala besar untuk Angkatan Laut A.S. (lihatSgarioto, 1999).

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


MULTIMEDIA-BASED DATABASES

Sistem manajemen basis data multimedia (MMDBMS) mengelola basis data


dalam berbagai bahasaformat, selain teks standar atau bidang numerik. Format
ini termasukgambar, seperti foto digital, dan bentuk grafik yang dipetakan
sedikit, seperti petaatau. file PIC, gambar hypertext, klip video, suara, dan
realitas virtual (multidimensionalgambar). Membuat katalog data seperti itu
sulit. Kata kunci yang akurat dan diketahui harus digunakan.Sangat penting
untuk mengembangkan cara yang efektif untuk mengelola data tersebut untuk
GIS dan banyak lainnyaAplikasi web Mengelola data multimedia terus menjadi
lebih penting untukintelijen bisnis (lihat D'Agostino, 2003).

Sebagian besar informasi perusahaan berada di luar komputer dalam dokumen,


peta,foto, gambar, dan videotapes. Bagi perusahaan untuk membangun aplikasi
yang bermanfaatjenis data kaya tersebut, sistem manajemen basis data khusus
dengan kemampuan untukmengelola dan memanipulasi berbagai tipe data
harus digunakan. Sistem semacam itu menyimpan jenis data multimedia kaya
sebagai objek besar biner (BLOBS). Sistem manajemen basis datasedang
berkembang untuk menyediakan kemampuan ini (McFadden et al., 2002).
Sangat penting untuk disainkemampuan manajemen dimuka, dengan
skalabilitas dalam pikiran. Untuk contoh keberuntungan darisituasi yang tidak
dikembangkan seperti itu, tetapi berhasil, Hurwicz (2002)
menjelaskanPengalaman NASA saat berusaha mendownload dan mengatalogkan
gambar dari luar angkasauntuk tujuan pendidikan, seperti yang dibayangkan
oleh astronot Sally Ride. Untungnya, adawaktu dan upaya sukarela cukup untuk
mendesain ulang mekanisme pembuatan katalog pada Webbased,sistem basis
data multimedia. Lihat Hurwicz (2002) untuk rincian
perkembangannyamasalah, dan situs Web EarthKAM (www.earthkam.ucsd.edu)
untuk akses langsungke sistem basis data online yang berjalan. Perhatikan
bahwa masalah serupa dapat terjadi dalam datadesain dan pengembangan
gudang

Untuk aplikasi-aplikasi web dari basis data multimedia, lihat Maybury (1997),
dandemonstrasi multimedia di Web, termasuk produk Macromedia dan
Visual Intelligence Corporation. Lihat juga DSS dalam Tindakan 5.13. Dalam DSS
dalam Tindakan 5.14,kami menggambarkan bagaimana sebuah perusahaan
produksi film animasi memanfaatkan beberapa multimediadatabase untuk
mengembangkan film Jimmy Neutron: Boy Genius. Basis data dan
manajerialTeknik sejak itu menyebabkan biaya produksi keseluruhan lebih
rendah untuk tele animasi. 1 seri penglihatan.

Beberapa perangkat keras komputer (termasuk sistem komunikasi dengan


database)mungkin tidak bisa diputar secara real-time. Penundaan dengan
beberapa kemungkinan bufferingdiperlukan (mis., coba pemutar audio atau
video apa pun di Windows). Intel CorporationChip prosesor Pentium
menggabungkan teknologi multimedia extension (MMX) untukmemproses data
multimedia untuk tampilan grafik real-time. Sejak itu, ini dan serupateknologi
telah tertanam di banyak CPU dan chip prosesor tambahan.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


DSS IN ACTION 5.12
G . PIERCE WOOD MEMORIAL HOSPITAL OBJECTS

Glenn Palmier, manajer pengolahan data untuk G. PierceWood Memorial Hospital (GPW), tidak
senang ituvendor sistem manajemen database-nya,InterSystems Corp., melakukan upgrade ke
sebuah object-orientedarsitektur dalam produk intinya, CACHE. Padawaktu, GPW memiliki 45
sistem yang berbeda yang dikembangkan lebih dari 15tahun di fasilitas kesehatan mental negara
di Arcadia,Florida. Pengoperasian yang lancar dan akses data yang cepatpenting untuk GPW.
Vendor bergerak cepat, mengurangirencana konversi lima tahun sampai delapan bulan. Pada
saat itu,GPW telah mengubah semua sistemnya menjadi berorientasi objekdan berbasis web.
GPW memusatkan perhatian pada kegunaan data diproses konversi Database telah
diperbaruibekerja lebih baik di lingkungan berorientasi objek baru.Setelah merekayasa ulang
basis data dan meningkatkan,Sistem baru berlari lebih cepat dari sebelumnya. Sebagai
contoh,sistem lama membutuhkan hampir dua jam untuk melakukanpermintaan tertentu Sistem
baru memakan waktu kurang dari satu menit.Personil telah dengan mudah dan cepat dilatih
disistem baru, dan penggunaan browser Web untuk mengakses datasangat cocok dengan
strategi Internet negara bagian.

Source: Adapted from Jon William Toigo, "Objects Are Good for Your Mental Health." Enterprise
Systems, June 2001, pp. 34-35.

DOCUMENT-BASED DATABASES

Database berbasis dokumen, juga dikenal sebagai electronic document


management (EDM) sistem (Swift, 2001), dikembangkan untuk mengurangi
penyimpanan kertas dan menyeret. Mereka digunakan untuk diseminasi
informasi, penyimpanan dan pengelolaan form, pelacakan pengiriman,
pemrosesan lisensi ahli, dan otomasi alur kerja. Banyak sistem manajemen
konten (CMS) didasarkan pada EDM. Dalam prakteknya, sebagian besar
diimplementasikan dalam sistem berbasis Web. Lihat Bolles (2003), Gates
(2002), dan Rapoza (2003). Karena EDM menggunakan keduanya database
berorientasi objek dan multimedia, database berbasis dokumen dimasukkan
di dua bagian sebelumnya. Apa yang unik untuk EDM adalah implementasi dan
aplikasi. McDonnell Douglas Corporation mendistribusikan buletin layanan
pesawat ke pelanggannya di seluruh dunia melalui internet. Perusahaan
digunakan untuk mendistribusikan volume buletin yang mengejutkan ke lebih
dari 200 maskapai penerbangan, menggunakan lebih dari 4 juta halaman
dokumentasi setiap tahun. Sekarang semuanya ada di Web, menghemat uang
dan waktu baik untuk perusahaan dan. untuk pelanggannya. Motorola
menggunakan DMS tidak hanya untuk penyimpanan dokumen dan pengambilan
tetapi juga untuk kolaborasi kelompok kecil dan berbagi pengetahuan di seluruh
perusahaan. Ini telah mengembangkan komunitas virtual di mana orang dapat
mendiskusikan dan mempublikasikan informasi, semua dengan DMS Web-
enabled.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Sistem manajemen dokumen web-enabled telah menjadi efisien dan biayasistem
pengiriman yang efektif. American Express kini menawarkan kepada para
pelanggannya pilihanmenerima laporan tagihan bulanan secara online,
termasuk kemampuan mengunduh pernyataandetail, ambil siklus penagihan
sebelumnya, dan lihat aktivitas yang telah diposting tetapi tidakbelum ditagih.
Karena opsi ini semakin populer, ini akan mengurangi produksi dan
pengirimanbiaya. Xerox Corporation mengembangkan sistem manajemen
pengetahuan pertamanyaPlatform EDM (lihat Bab 9)

DSS IN ACTION 5.13


MULTIMEDIA DATABASE MANAGEMENT SYSTEMS : A SAMPLER

IBM mengembangkan multimedia Perpustakaan DB2 Digitalarsitektur server untuk menyimpan,


mengelola, dan mengambilteks, video, dan gambar digital melalui jaringan. DigitalPerpustakaan
terdiri dari beberapa perangkat lunak IBM yang ada danproduk perangkat keras yang
dikombinasikan dengan konsultasi dan kepabeananpengembangan (lihat ibm.com).
Perpustakaan Digital akanbersaing head to head dengan penyimpanan multimedia
danmengambil paket dari vendor terkemuka lainnyaMediaWay Inc. (mediaway.com) mengklaim
bahwa itusistem manajemen basis data multimedia dapat menyimpan,indeks, dan mengambil
data multimedia (suara, video,grafik) semudah database relasional menangani tabulardata.
DBMS ditujukan untuk perusahaan yang menginginkannyaBuat apa yang MediaWay sebut
aplikasi katalogisasi multimediayang mengatur gambar, suara, dan videobeberapa platform
back-end. Agen periklanan, untukMisalnya, mungkin ingin menggunakan produk untuk
membangun sebuahaplikasi yang mengakses gambar iklan tahun laludisimpan di beberapa
server. Ini adalah klien / serverpelaksanaan. MediaWay bukan satu-satunya vendor untuktarget
ceruk ini, bagaimanapun. Vendor basis data relasional,seperti Oracle Corporation dan Sybase
Inc., telah tergabungfitur data multimedia dalam database merekaserver. Selain itu, beberapa
perusahaan perangkat lunak desktopmempromosikan basis data klien untuk menyimpan
pindaiangambar Di antara industri yang menggunakan teknologi iniadalah perawatan kesehatan,
real estat, ritel, dan asuransi.

Source: Condensed and adapted from the Web sites and publicly
advertised information of various vendors.

DSS IN ACTION 5.14


JIMMY NEUTRON : THE " I CAN FIX THAT " DATABASE

Produser dan animator mengerjakan film JimmyNeutron: Boy Genius melacak ribuan
bingkaiempat database besar. Produksi DNA (Irving,Texas), perusahaan jasa animasi yang
bekerjadengan Nickelodeon dan penulis skenario dan sutradara SteveOedekerk untuk
memproduksi film tersebut, membahas masalah tersebutdari merakit 1800 tembakan yang
terdiri dari 82-menit dengan mencatat dan melacak mereka dalam empatDatabase FileMaker
Pro. Satu papan cerita awal yang dilacak,yang lain melacak bidikan yang diberikan kepada
individuseniman, yang ketiga melacak kemajuan setiap framesepanjang proses produksi, dan

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


yang keempatretakes yang dilacak (perubahan pada bidikan selesai). Padaselesainya film, ada
20.000 entri. Setiapmerekam informasi yang dilacak tentang setiap tembakan yang diputar
ulangke awal proyek. Database diaktifkanfilm yang akan selesai dalam delapan belas
bulan.Bagian yang terbaik adalah bahwa setiap orang memiliki akses ke tembakanlangsung,
bukannya harus melacak seseorangatau berjalan ke besar 4 kali 8 kaki (1,3 kali 2,6 meter)board
dan mencarinya. Sejak membuat film, si JimmySeri Neutron TV terus memanfaatkan
databaseteknologi.

Source: Adapted from Stephanie Overby, "Animation Animation," CIO, 2002, May 15,2002, pp.
22-24.

INTELLIGENT DATABASES

Teknologi kecerdasan buatan (Al), khususnya agen cerdas berbasis Web dan
jaringan saraf tiruan (JST), mempermudah akses dan manipulasi kompleks
database. Antara lain, mereka dapat meningkatkan sistem manajemen basis data
dengan menyediakannya dengan kemampuan inferensi, menghasilkan database
cerdas.

Kesulitan dalam mengintegrasikan ES ke dalam database besar telah menjadi


masalah besar untuk perusahaan besar. Beberapa vendor, yang mengakui
pentingnya integrasi, telah mengembangkan produk perangkat lunak untuk
mendukungnya. Contoh dari produk semacam itu adalah Oracle relational
DBMS, yang menggabungkan beberapa fungsi ES dalam bentuk a
query optimizer yang memilih jalur paling efisien untuk query database untuk
melakukan perjalanan. Di sebuah database terdistribusi, misalnya, pengoptimal
kueri mengenali bahwa itu lebih efisien untuk mentransfer dua rekaman ke
mesin yang menyimpan 10.000 catatan daripada seba liknya. (Itu optimalisasi
penting bagi pengguna karena dengan kemampuan seperti itu mereka perlu
tahu hanya beberapa aturan dan perintah untuk menggunakan database.)
Produk lain adalah INGRES II Intelligent Database.

Agen cerdas dapat meningkatkan pencarian basis data, terutama di gudang data
besar. Mereka juga dapat mempertahankan preferensi pengguna (mis.,
Amazon.com) dan meningkatkan kemampuan pencarian dengan mengantisipasi
kebutuhan pengguna. Ini adalah konsep penting yang pada akhirnya mengarah
ke komputasi di mana-mana. Lihat DSS di Fokus 5.15 untuk rincian
perkembangan terkini di agen cerdas.

Salah satu inisiatif utama IBM dalam Al komersial menyediakan pemrosesan


pengetahuansubsistem yang bekerja dengan database, memungkinkan
pengguna untuk mengekstrak informasi daridatabase dan menyebarkannya ke
basis pengetahuan sistem pakar dalam beberapa pengetahuan yang
berbedastruktur representasi. Database sekarang menyimpan foto, grafik
canggih,audio, dan media lainnya. Akibatnya, akses ke dan pengelolaan basis
data adalahmenjadi lebih sulit, dan begitu juga aksesibilitas dan pengambilan
informasi. ItuPenggunaan sistem cerdas dalam akses basis data juga tercermin

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


dalam penggunaan bahasa alamiantarmuka yang dapat digunakan untuk
membantu nonprogrammers mengambil dan menganalisis data.
DSS DALAM FOKUS 5.15
THE BOT OF THE FUTURE

Ada banyak agen perangkat lunak yang digunakan saat ini. Merekaditemukan dalam sistem
bantuan, mesin pencari, dan perbandingan belanjaalat. Selama beberapa tahun ke depan, sebagai
teknologidewasa dan agen secara radikal meningkatkan merekanilai dengan berkomunikasi satu
sama lain, mereka akan secara signifikanmempengaruhi proses bisnis organisasi.Pelatihan,
dukungan keputusan, dan berbagi pengetahuan akanterpengaruh, tetapi para ahli melihat
pengadaan sebagai pembunuhpenerapan agen bisnis-ke-bisnis. Cerdasagen perangkat lunak
(bot) fitur pemicu yang memungkinkan merekauntuk mengeksekusi tanpa campur tangan
manusia. Kebanyakan agenjuga menampilkan pembelajaran adaptif dari kecenderungan
pengguna danpreferensi dan personalisasi tawaran berdasarkan apamereka belajar tentang
pengguna.

Salah satu tujuan pengembang perangkat lunak adalahmengembangkan mesin yang melakukan
tugas yang tidak dilakukan orangingin lakukan. Lainnya adalah mendelegasikan ke tugas-tugas
mesin diyang jauh lebih superior daripada manusia, seperti membandingkanharga, kualitas,
ketersediaan, dan biaya pengirimanitem
.
BotKnowledge.com Agen dapat secara otomatis melakukanpencarian cerdas, menjawab
pertanyaan, memberi tahu Andaketika suatu peristiwa terjadi, pengiriman berita individual,
tutor,dan toko perbandingan.Agen bermigrasi dari sistem ke sistem, berkomunikasidan
bernegosiasi satu sama lain. Mereka berkembangdari fasilitator menjadi pengambil keputusan.

Source: Adapted from S. Ulfelder, "Undercover Agents," ComputerWorld, June 5,2000.

5 . 7 DATA WAREHOUSING

Vinyet Pembukaan menunjukkan skenario di mana gudang data dapat


dimanfaatkanuntuk mendukung pengambilan keputusan, menganalisis sejumlah
besar data dari berbagai sumberuntuk memberikan hasil cepat untuk
mendukung proses kritis. Data yang diperlukan tersebardi banyak lembaga
pemerintah, dan menggabungkan data untuk membuatnya tersediabila
diperlukan akan memerlukan tantangan organisasi dan teknis yang serius.

Organisasi, pribadi dan publik, terus mengumpulkan data, informasi,


danpengetahuan pada tingkat yang semakin dipercepat dan menyimpannya
dalam sistem computer Memperbarui, mengambil, menggunakan, dan
menghapus informasi ini menjadi lebih rumitsebagai jumlah yang meningkat.
Pada saat yang sama, jumlah pengguna yang berinteraksi denganinformasi terus
meningkat sebagai hasil dari peningkatan keandalan dan ketersediaanakses
jaringan, terutama termasuk Internet. Bekerja dengan banyak basis datamenjadi
tugas yang sulit yang membutuhkan keahlian yang cukup besar (lihat DSS dalam
Tindakan 5.16).

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Data untuk gudang data dibawa dari berbagai eksternal dan internalsumber
daya dan dibersihkan dan diorganisir dengan cara yang konsisten dengan
organisasikebutuhan. Setelah data diisi di gudang data, data mart
mungkindimuat untuk area atau departemen tertentu. Seringkali, data mart
dilewati, dan bisnisperangkat intelijen pada PC klien cukup memuat dan
memanipulasi kubus data lokal. Datagudang dapat digambarkan sebagai subjek-
berorientasi, terintegrasi, waktu-varian, nonnormalizedkumpulan data tidak
stabil yang mendukung pengambilan keputusan analitis,

Lihat Gambar 5.2 untuk kerangka kerja dan pandangan data warehouse.
Edelstein (1997) menyajikanpengenalan umum yang baik untuk data
pergudangan. Mannino (2001) membahas Data Warehouseteknologi dan
manajemen.

Karena solusi manajemen informasi perusahaan agregat atau


konsolidasimelaporkan informasi dan dokumen elektronik yang dibuat oleh
aplikasi yang sedang berjalanplatform apa pun, solusi manajemen informasi
perusahaan memperluas akses keinformasi dan laporan diproses dari gudang
data (lihat Mullin, 2002). Sebuahgudang data perusahaan adalah database
komprehensif yang mendukung semua keputusananalisis yang diperlukan oleh
suatu organisasi dengan memberikan informasi yang diringkas dan
terperinci.Seperti yang tersirat dalam definisi ini, gudang data memiliki akses ke
semua informasirelevan untuk organisasi, yang mungkin berasal dari berbagai
sumber, baik internaldan eksternal. Lihat Gambar 5.2 untuk bagaimana data

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


bekerja dengan cara mereka ke gudang data(di sebelah kiri), untuk analisis lebih
lanjut dengan alat (ke kanan).

Sebuah gudang data dimulai dengan pemisahan fisik operasional


perusahaandan lingkungan pendukung keputusan. Di jantung banyak
perusahaan ada tempat penyimpanandata operasional, biasanya berasal dari
pemrosesan transaksi online berbasis mainframe kritis(OLTP) sistem, seperti
titik masuk pemesanan aplikasi penjualan. Banyak sistem OLTP warisan
dilaksanakan terutama di COBOL (terutama sistem perbankan),dan masih
beroperasi di lingkungan sistem informasi pelanggan kontrol (CICS).
OLTPsistem untuk manajemen dan kontrol keuangan dan inventaris, misalnya,
juga menghasilkandata operasional. (Banyak perusahaan yang menerapkan
ujung depan Web untuk warisan semacam itusistem. Ini bisa menjadi kesalahan
besar dan mahal. Lihat Aplikasi Kasus 5.2 danBab 6.) Di lingkungan operasional,
akses data, tugas logika aplikasi, danlogika penyajian data digabungkan
bersama-sama, biasanya dalam basis data non-relasional.Data OLTP biasanya
berupa data detail yang mengendalikan suatu kejadian tertentu,
sepertipencatatan transaksi penjualan, dan umumnya tidak dirangkum. Ini tidak
berhubunganpenyimpanan data tidak terlalu kondusif untuk pengambilan data
untuk keputusandukungan / intelijen bisnis / aplikasi analitik bisnis. Namun,
dukungan keputusaninformasi harus dapat diakses oleh manajemen. Ini penting
secara fisikmemisahkan gudang data dari sistem OLTP.

KARAKTERISTIKS DATA WAREHOUSING

Karakteristik utama dari data pergudangan adalah sebagai berikut:


 Berorientasi pada subjek. Data disusun menurut subjek rinci (misalnya,
oleh pelanggan, kebijakanjenis, dan klaim di perusahaan asuransi), hanya
berisi informasi yang relevanuntuk dukungan keputusan Orientasi subjek
memungkinkan pengguna untuk menentukan tidak hanya bagaimanabisnis
mereka sedang berkinerja, tapi mengapa. Gudang data berbeda dari
operasionaldatabase dalam database yang paling operasional memiliki
orientasi produk dandisetel untuk menangani transaksi yang memperbarui
database; orientasi subjekmemberikan pandangan yang lebih komprehensif
tentang organisasi.

 Terpadu. Data di lokasi sumber yang berbeda dapat dikodekan secara


berbeda. UntukMisalnya, data jenis kelamin dapat dikodekan sebagai 0 dan
1 di satu tempat dan "m" dan "f"di tempat lain Di gudang mereka digosok
(dibersihkan) ke dalam satu format jadibahwa mereka distandarkan dan
konsisten. Banyak organisasi menggunakan hal yang samaistilah untuk data
dari berbagai jenis. Misalnya, "penjualan bersih" dapat berarti neto
komisike departemen pemasaran, tetapi penjualan kotor kembali ke
akuntansidepartemen. Data yang terintegrasi menyelesaikan makna yang
tidak konsisten dan menyediakan seragamterminologi di seluruh
organisasi. Juga, format data dan waktu bervariasikeliling dunia.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


 Time-variant (time series). Data tidak memberikan status saat ini. Mereka
-tahan selama lima atau sepuluh tahun atau lebih dan digunakan untuk tren,
peramalan, dan
perbandingan. Ada kualitas temporal ke gudang data. Waktu adalah satu-
satunyadimensi penting yang harus didukung semua gudang data. Data
untuk analisisdari berbagai sumber berisi beberapa titik waktu (mis.,
harian, mingguan, bulananpandangan).
 Nonvolatile. Setelah masuk ke gudang, data bersifat hanya-baca, mereka
tidak bisaberubah atau diperbarui Data usang akan dibuang, dan perubahan
dicatat sebagaidata baru. Ini memungkinkan data warehouse disetel hampir
secara eksklusif untuk datamengakses. Misalnya, sejumlah besar ruang
kosong (untuk pertumbuhan data) biasanyatidak diperlukan, dan
reorganisasi database dapat dijadwalkan bersamaanoperasi beban dari
gudang data.
 Dirangkum Data operasional digabungkan, jika diperlukan, ke dalam
ringkasan.
 Data yang tidak dinormalisasi dalam data warehouse umumnya tidak
dinormalisasi dansangat berlebihan
 Sumber. Semua data tersedia; baik internal maupun eksternal.
 Metadata. Metadata (didefinisikan sebagai data tentang data) disertakan.

METADATA

Kami menyertakan diskusi tentang metadata di bagian data warehousing karena


merekamemiliki dampak besar pada bagaimana fungsi penyimpanan data.
Seperti yang disebutkan sebelumnya, istilah itumetadata mengacu pada data
tentang data. Metadata menggambarkan struktur dan beberapaartinya tentang
data, sehingga berkontribusi pada penggunaan efektif atau tidak efektif.

Marco (2001) menunjukkan bahwa metadata memegang kunci untuk


menyelesaikan tantanganmembuat pengguna merasa nyaman dengan teknologi.
Para eksekutif menyadari bahwa pengetahuan itu berbedaperusahaan di era
informasi. Metadata melibatkan pengetahuan, dan menangkapdan membuatnya
dapat diakses di seluruh organisasi telah menjadi pentingfaktor sukses. Dengan
metadata dan repositori metadata, organisasi dapat secara
dramatismeningkatkan penggunaannya atas informasi dan proses
pengembangan aplikasi.Membangun repositori metadata harus menjadi
kewajiban bagi banyak organisasi. Bisnismanfaat metadata termasuk
pengurangan masalah yang berhubungan dengan IT, peningkatan nilai system
untuk bisnis, dan meningkatkan pengambilan keputusan bisnis.

Menurut Kassam (2002), metadata bisnis terdiri dari informasi


itumeningkatkan pemahaman kita tentang data tradisional (yaitu, terstruktur)
yang dilaporkan. Yang utamatujuan metadata harus menyediakan konteks untuk
data; yaitu, memperkaya informasimenuju ke pengetahuan. Metadata bisnis,

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


meskipun sulit disediakan secara efisien,melepaskan lebih banyak potensi data
terstruktur. Konteksnya tidak perlu menjadisama untuk semua pengguna.
Dalam banyak hal, metadata membantu dalam konversi data dan
informasimenjadi pengetahuan (lihat Bab 9). Metadata membentuk fondasi
untukarsitektur metabisnis (lihat Bell, 2001). Tannenbaum (2002) menjelaskan
cara mengidentifikasipersyaratan metadata. Vaduva dan Vetterli (2001)
memberikan ikhtisar metadatamanajemen untuk data pergudangan.

Metadata semantik adalah metadata yang menggambarkan konteks yang


relevan atau domain tertentuinformasi tentang konten, dalam konteks yang
tepat, berdasarkan pada industri tertentuatau metadata khusus atau onkologi
model khusus perusahaan. Pada dasarnya, ini melibatkanmenempatkan tingkat
pemahaman ke dalam metadata. Penambangan teks (Bagian 5.11) mungkin
acara yang layak untuk menangkap metadata semantik. Lihat Sheth (2003)
untuk detailnya. ADT EnterpriseEdisi Metadata dari Computer Associates
memperluas kemampuan ADT(dijelaskan dalam Akses Data dan Subbagian
Integrasi Bagian 5.3) untuk disertakankemampuan manajemen metadata (lihat
Whiting, 2002).

DATA WAREHOUSING ARCHITECTURE AN D PROSES

Ada beberapa arsitektur dasar untuk data pergudangan. Dua tingkat dan tiga
tingkatarsitektur cukup umum, tetapi terkadang hanya ada satu tingkat.
McFadden,Hoffer, dan Prescott (2003) membedakan antara ini dengan membagi
gudang datamenjadi tiga bagian:

1. Data warehouse itu sendiri, yang berisi data dan perangkat lunak terkait
2. Perangkat lunak akuisisi data (back-end), yang mengekstrak data dari
sistem warisandan sumber eksternal, mengkonsolidasikan dan
meringkasnya, dan memasukkannya ke dalamgudang data
3. Perangkat lunak (front-end) klien, yang memungkinkan pengguna untuk
mengakses dan menganalisis data dalamgudang (misalnya, mesin DSS /
BI / BA)

Dalam arsitektur three-tier, sistem operasional mengandung data dan perangkat


lunakuntuk akuisisi data dalam satu tier (server), data warehouse adalah tier
lain, danlapis ketiga termasuk dukungan keputusan / intelijen bisnis / mesin
analisis bisnis(yaitu, server aplikasi) dan klien. Keuntungan dari arsitektur ini
adalah pemisahan fungsi dari gudang data, yang menghilangkan kendala sumber
dayadan memungkinkan untuk membuat data mart dengan mudah. Lihat
Gambar 5.3.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Vanguard Group pindah ke arsitektur three-tier berbasis Web untuk
perusahaannyaarsitektur untuk mengintegrasikan semua datanya dan
menyediakan pelanggan dengan pandangan yang samadata sebagai pengguna
internal (lihat Dragoon, 2003b). Demikian juga, Hilton bermigrasi semua
independensistem klien / server ke gudang data tiga-tier menggunakan
perusahaan desain Websistem. Perubahan ini melibatkan investasi sebesar $ 3,8
juta (tidak termasuk tenaga kerja) danterpengaruh 1.500 pengguna. Ini
meningkatkan efisiensi pemrosesan (kecepatan) dengan faktor 6.
Hiltonmengharapkan untuk menghemat $ 4,5 hingga $ 5 juta per tahun. Hilton
berencana bereksperimen dengan pengelompokan Dellteknologi berikutnya
(lihat Anthes, 2003.)

Dalam arsitektur two-tier, mesin DSS berada di platform yang sama dengan
gudang.Oleh karena itu, lebih ekonomis daripada struktur three-tier. Lihat
Gambar 5.4. LihatMimno (1997) untuk lebih lanjut tentang arsitektur data
warehouse.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Arsitektur web serupa dalam struktur, membutuhkan pilihan desain untuk
perumahangudang data Web dengan server transaksi atau sebagai server
terpisah. Halamankecepatan memuat merupakan pertimbangan penting dalam
merancang aplikasi berbasis Web;oleh karena itu kapasitas server harus
direncanakan dengan hati-hati untuk.

Ada beberapa masalah yang perlu dipertimbangkan ketika memutuskan


arsitektur mana yang akan digunakan.
Diantaranya adalah:
1. Sistem manajemen basis data mana yang akan digunakan? Sebagian besar
gudang data dibangunmenggunakan sistem manajemen basis data relasional.
Oracle (Oracle Corporation), SQL Server (Microsoft), dan DB2 (IBM) yang
paling umum digunakan. Masing-masingproduk mendukung server klien dan
arsitektur berbasis web.
2. Apakah pemrosesan dan / atau partisi paralel digunakan? Proses paralel
memungkinkan beberapa CPU untuk memproses permintaan permintaan
data warehouse secara bersamaandan menyediakan skalabilitas. Desainer
gudang data perlu memutuskan apakahtabel database akan dipartisi (dibagi
menjadi tabel yang lebih kecil) untuk efisiensi akses dan apa kriterianya. Ini
merupakan pertimbangan penting yang dituntutoleh sejumlah besar data

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


yang terdapat di gudang data yang khas. Teradata memiliki mengadopsi
pendekatan ini.
3. Apakah alat migrasi data akan digunakan untuk memuat data warehouse?
4. Alat apa yang akan digunakan untuk mendukung pengambilan data dan
analisis?

DATA WAREHOUSE DEVELOPMENT

Struktur data warehouse yang khas ditunjukkan pada Gambar 5.2. Proses
migrasidata ke data warehouse melibatkan ekstraksi data dari semua sumber
yang relevan.Sumber data dapat terdiri dari file yang diambil dari basis data
OLTP, spreadsheet, pribadidatabase (mis., Microsoft Access), atau file eksternal.
Biasanya, semua masukanfile ditulis ke satu set tabel pementasan, yang
dirancang untuk memfasilitasi bebanproses. Sebuah gudang data berisi banyak
aturan bisnis yang mendefinisikan hal-hal semacam ituseperti bagaimana data
akan digunakan, aturan summarization, standarisasi attrib-utes yang dikodekan,
dan aturan perhitungan. Masalah kualitas data apa pun yang terkait dengan file
sumber perluharus dikoreksi sebelum data dimuat ke dalam gudang data. Salah
satu manfaatnyadari gudang data yang dirancang dengan baik adalah bahwa
aturan-aturan ini dapat disimpan dalam metadatarepositori dan diterapkan ke
gudang data secara terpusat. Ini berbeda dariPendekatan OLTP, yang biasanya
memiliki data dan aturan bisnis yang tersebar di seluruhsistem. Proses
pemuatan ke dalam gudang data dapat dilakukan melaluialat transformasi data
yang menyediakan antarmuka pengguna grafis untuk membantu dalam
pengembangandan pengembangan aturan bisnis pemeliharaan atau melalui
lebih tradisionalmetode dengan mengembangkan program atau utilitas untuk
memuat gudang data menggunakan pemrogramanbahasa seperti PL / SQL, C ++,
atau .Net. Keputusan ini tidak dating ringan untuk organisasi. Ada beberapa
masalah yang mempengaruhi apakah suatu organisasiakan membeli alat
transformasi data atau membangun proses transformasi itu sendiri.Ini
termasuk:

1. Alat transformasi data mahal.


2. Mereka mungkin memiliki kurva belajar yang panjang.
3. Sulit mengukur bagaimana organisasi IT melakukan hal itu sampai ia
belajargunakan alatnya.

Dalam jangka panjang, pendekatan transformasi-alat harus menyederhanakan


pemeliharaangudang data organisasi. Alat transformasi juga bisa efektif
dalammendeteksi dan menggosok; menghapus semua anomali dalam data.
OLAP dan penambangan dataalat bergantung pada seberapa baik data
ditransformasikan.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


STAR SCHEMAS

Desain gudang data didasarkan pada konsep pemodelan dimensi.Pemodelan


dimensi adalah model berbasis pengambilan yang mendukung kueri volume
tinggimengakses. Skema bintang adalah sarana di mana pemodelan dimensi
diimplementasikan. SEBUAHskema bintang berisi tabel fakta sentral. Tabel fakta
berisi atribut yang dipasangkanmelakukan analisis keputusan, atribut deskriptif
yang digunakan untuk pelaporan kueri, dan asingkunci untuk menautkan ke
tabel dimensi. Atribut analisis keputusan terdiri dari kinerjapengukuran, metrik
operasional, pengukuran agregat, dan semua metrik lainnya
diperlukan untuk menganalisis kinerja organisasi. Dengan kata lain, tabel fakta
utamanyaalamat apa yang didukung gudang data untuk analisis keputusan.
Sekitarnyatabel fakta pusat (dan dihubungkan melalui kunci asing) adalah tabel
dimensi. Dimensitabel berisi atribut yang menggambarkan data yang terdapat
dalam tabel fakta.Tabel dimensi membahas bagaimana data akan dianalisis.
Beberapa contoh dimensiyang akan Mendukung meja fakta produk adalah
lokasi, waktu, dan ukuran. Contoh askema bintang disajikan pada Gambar 5.5.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Butiran data warehouse mendefinisikan tingkat detail tertinggi yang
didukung.Butir akan menunjukkan apakah gudang data sangat dirangkum
ataujuga termasuk data transaksi terperinci. Jika butir didefinisikan terlalu
tinggi, maka gudangmungkin tidak mendukung permintaan detail untuk
menelusuri data. Tajam analisisadalah proses probing di luar. nilai rangkuman
untuk menyelidiki masing-masingdetail transaksi yang terdiri dari ringkasan.
Tingkat granularitas rendah akan dihasilkandalam lebih banyak data yang
disimpan di gudang. Jumlah detail yang lebih besar dapat berdampak
padakinerja kueri dengan membuat waktu respons lebih lama. Oleh karena itu,
selamapelingkupan dari proyek gudang data, penting untuk mengidentifikasi
tingkat perincian yang tepatitu akan dibutuhkan. Lihat Tennant (2002) untuk
diskusi tentang masalah perinciandalam metadata.

IMPLEMENTING DATA WAREHOUSING

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Penelitian oleh McKinsey and Co. menunjukkan bahwa banyak uang yang
diinvestasikan dalam TIterbuang. IDC memperkirakan bahwa dunia
menginvestasikan $ 5,6 triliun pada IT selama tahun 1990-an($ 2,6 triliun di
Amerika Serikat). Investasi TI tidak berdampak pada produktivitas di 53dari 59
sektor ekonomi dari penelitian McKinsey. (Kami membahas keefektifan TI diBab
6.) Namun, McKinsey melaporkan bahwa investasi TI dapat memiliki efektif
laba atas investasi jika aplikasi terkait dengan proses bisnis tertentu dan
terkaituntuk indikator kinerja (lihat Blair, 2003). Ini sangat penting dalam
gudang data dan lainnyaimplementasi database skala besar. Mereka harus
berguna, bukan hanya repository tak ada habisnya, data tidak berguna. Mereka,
harus mendorong aplikasi bisnis di ERP / ERM, pendapatanmanajemen, SCM,
CRM, dan sebagainya.

Menerapkan data warehouse pada umumnya merupakan usaha besar yang


harus direncanakandan dieksekusi sesuai dengan metode yang telah ditetapkan.
Di Bab 6, kita membahas metode-metode inisecara terperinci. Di sini kita
membahas ide-ide dan isu-isu spesifik yang berkaitan dengan pergudangan
data.Eckerson (2002b, 2003) menjelaskan empat cara utama untuk
mengembangkan gudang data. Ini termasuk (1) top-down, (2) bottom-up, (3)
hibrida, dan (4) federasi. Kitarangkum ini di DSS di Fokus 5.17.

Pendekatan gabungan mungkin yang paling tidak dikenal. Federasi


seringdipandang sebagai bentuk integrasi informasi. Ini melengkapi ETL
tradisional danpendekatan replikasi dengan membuat dan mempertahankan
pandangan logis dari satu gudangatau mart, sedangkan data berada dalam
sistem yang terpisah. Lihat Devlin (2003) untukrincian. Salah satu pendekatan
yang saat ini sedang dikembangkan sesuai dengan gagasan itumendasari
jaringan peer-to-peer. Semantic Web digunakan untuk membungkus data ke
dalam container yang berada di repositori di ruang informasi. Pendekatan ini
mungkin solusi untukmasalah integrasi data besar-besaran yang dihadapi
Departemen Keamanan Dalam Negeri.Lihat King (2003) untuk detailnya.

Weir (2002) menjelaskan praktik terbaik untuk menerapkan data warehouse.


Kitarangkum ini dalam DSS di Fokus 5.18. Bencana dapat menyerang jika
seseorang tidak mengikutijalur implementasi yang sukses. Adelman dan Moss
(2001) menggambarkan risiko yang dihadapiproyek gudang data. Lihat DSS di
Fokus 5.19. Praktisi telah menemukanbanyak kesalahan yang telah dibuat
dalam pengembangan gudang data. Kitarangkum ini dalam DSS di Fokus 5.20.
Tiga DSS dalam kotak Focus, tentu saja,saling berhubungan. Watson dkk. (1999)
lebih lanjut membahas bagaimana kesalahan tersebut dapat menyebabkan data
kegagalan gudang.

Watson dan Haley (1998) mengidentifikasi proyek-proyek data warehouse


sebagai data-sentrisatau aplikasi-sentris. Gudang data-sentris didasarkan pada
model data yangindependen dari aplikasi apa pun. Ini dirancang untuk
mendukung berbagai kebutuhan pengguna danaplikasi. Pendekatan
metodologis untuk mendesain gudang data-sentrismelibatkan pemodelan data
dengan sekelompok pakar bisnis yang akrab dengan yang berbedapandangan

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


informasi yang diperlukan untuk mendukung bisnis. Ini terdiri dari top-
Downpendekatan dalam menghasilkan spesifikasi kebutuhan informasi
sehingga tidak meninggalkan datadibelakang. Ini luas dalam lingkup dan
membutuhkan pengetahuan tentang data saat ini dan diantisipasikebutuhan.
Suatu pendekatan pemetaan harus digunakan untuk memberikan pendekatan
terstruktur untuk klasifikasidata. Gudang data-sentris harus mendukung
fleksibilitas karena perusahaaninformasi terus-menerus perlu diubah
berdasarkan perubahan dalam bisnis yang mendasarinya.

Semakin dinamis bisnis, semakin besar kemungkinan kebutuhan data akan


berubahselama pengembangan gudang data. Gudang aplikasi-sentrisyang
awalnya dirancang untuk mendukung inisiatif tunggal atau sekumpulan inisiatif
kecil. Ini adalah sebuahpendekatan pilihan untuk pengembangan data mart
independen (lihat Bagian 5.8). Itukeuntungan dari pendekatan aplikasi-sentris
adalah bahwa ia menyediakan ruang lingkup yang lebih terfokus,dan karena itu
meningkatkan kemungkinan implementasi data warehouse yang
sukses.Kerugian terbesarnya, bagaimanapun, adalah bahwa kebutuhan data
penting dapat ditinggalkan selamapengembangan awal, dan karena itu beberapa
iterasi mungkin diperlukan.

DSS DALAM FOKUS 5.18


BES T PRAKTEKS UNTUK DATA
WAREHOUS E IMPLEMENTATION

Berikut ini daftar praktik terbaik untuk menerapkan data gudang. Mereka telah ditunjukkan
dalam praktek dan merupakan seperangkat pedoman yang sangat baik untuk diikuti.
• Proyek harus sesuai dengan strategi perusahaan dan tujuan bisnis.
• Harus ada dukungan penuh untuk proyek tersebut (eksekutif, manajer, pengguna).
• Mengelola harapan.
• Gudang data harus dibangun secara bertahap.
• Bangun kemampuan beradaptasi.
• Proyek harus dikelola oleh IT dan bisnis profesional.
• Mengembangkan hubungan bisnis / pemasok.
• Hanya memuat data yang sudah dibersihkan dan a kualitas yang dipahami oleh organisasi.
• Jangan mengabaikan persyaratan pelatihan.
• Berhati-hatilah secara politis.

Source: Adapted from Robert Weir, "Best Practices for Implementing a Data Warehouse," Journal of Data Warehousing, Vol. 7,
No. 1, Winter, 2002, pp. 21-29.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


DSS DALAM FOKUS 5.19
DATA WAREHOUSE RISKS

Ada banyak risiko dalam proyek-proyek data warehouse. Palingdari mereka juga ditemukan di
proyek TI lainnya (lihat Bab6), tetapi mereka lebih serius di sini karena gudang dataadalah
proyek berskala besar dan mahal. Setiap risikoharus dinilai pada awal proyek. Lihat
sumber untuk informasi tentang detail dan cara mengurangiresikonya:
• Tidak ada misi atau tujuan
• Kualitas data sumber tidak diketahui
• Keterampilan tidak dilakukan
• Anggaran yang tidak memadai
• Kurangnya perangkat lunak pendukung
• Data sumber tidak dipahami
• Lemahnya sponsor.
• Pengguna tidak melek komputer
• Masalah politik, perang darat

Harapan pengguna yang tidak realistisRisiko arsitektur dan desainLingkup creep dan perubahan
persyaratanVendor di luar kendaliBeberapa platformOrang-orang kunci dapat meninggalkan
proyekHilangnya sponsorTerlalu banyak teknologi baruHarus memperbaiki sistem
operasionalLingkungan yang terdistribusi secara geografisGeografi tim, budaya bahasa

Source: Adapted from Sid Adelman and Larissa Moss, "Data Warehouse Risks," Journal of Data Warehousing, Vol. 6, No. 1,
Winter, 2001, pp. 9-15.

DSS DALAM FOKUS 5.20


KESALAHAN UNTUK DIHINDARI DALAM MENGEMBANGKAN
GUDANG DATA YANG BERHASIL

Ketika mengembangkan gudang data yang sukses, hati-hatiuntuk masalah ini (lihat penjelasan
tentang masing-masing):
1. Dimulai dengan rantai sponsor yang salah. Kamumembutuhkan sponsor eksekutif
dengan pengaruh atassumber daya yang diperlukan untuk mendukung dan berinvestasi
dalamgudang data. Anda juga membutuhkan seorang eksekutifdriver proyek, seseorang
yang telah mendapatkanmenghormati eksekutif lain, memiliki skeptisisme yang
sehattentang teknologi, dan bersifat menentukan tetapi fleksibel.Dan Anda
membutuhkan manajer SI / TI untuk mengepalaiproyek (Anda dalam proyek).
2. Menetapkan ekspektasi bahwa Anda tidak dapat bertemu dan membuat frustrasipara
eksekutif pada saat kebenaran. Adadua fase dalam setiap proyek pergudangan data:
Fase1 adalah fase penjualan, di mana Anda memasarkan secara internalproyek dengan
menjual manfaat bagi mereka yang memilikinyaakses ke sumber daya yang dibutuhkan.
Tahap 2 adalah perjuangan untukmemenuhi harapan yang dijelaskan dalam fase 1.
Untuk ahanya $ 1-7 juta, semoga Anda dapat mengirimkannya.
3. Terlibat dalam perilaku naif secara politis. Jangan begitu sajamenyatakan bahwa gudang
data akan membantu manajermembuat keputusan yang lebih baik Ini mungkin

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


menyiratkan bahwa Andamerasa mereka telah membuat keputusan buruk
sampaisekarang. Jual gagasan bahwa mereka akan bisa mendapatkaninformasi yang
mereka butuhkan untuk membantu dalam pengambilan keputusan.
4. Memuat gudang hanya dengan informasI karena itu tersedia. Jangan biarkan gudang
datamenjadi tempat pembuangan data. Ini tidak perlumemperlambat penggunaan
sistem. Ada sebuahKecenderungan menuju komputasi dan analisis real-time.Gudang
data harus dimatikan untuk memuat datatepat waktu.
5. Percaya bahwa desain database penyimpanan data adalahsama dengan desain database
transaksional. Secara umum,bukan itu. Tujuan dari pergudangan data adalah
untukakses agregat daripada satu atau beberapacatatan, seperti dalam sistem
pemrosesan transaksi.Konten juga berbeda, seperti yang terlihat pada bagaimana
dataterorganisir. Sistem manajemen basis datacenderung tidak berlebihan, normal, dan
relasional,sedangkan gudang data redundan,tidak normal, dan multidimensional.
6. Memilih manajer data warehouse yang berorientasi pada teknologidaripada
berorientasi pada pengguna. Satu kunciuntuk keberhasilan gudang data adalah
memahami hal itupengguna harus mendapatkan apa yang mereka butuhkan, tidak
majuteknologi demi teknologi.
7. Berfokus pada orientasi internal tradisional berorientasidata dan mengabaikan nilai
data eksternal dan dariteks, gambar, dan, mungkin, suara dan video. Datatersedia dalam
banyak format dan harus dapat diakseskepada orang yang tepat pada waktu yang tepat
di kananformat. Mereka harus di katalog dengan benar.
8. Menyampaikan data dengan tumpang tindih dan membingungkandefinisi. Pembersihan
data adalah aspek penting daripergudangan data. Ini termasuk rekonsiliasi yang
bertentangandefinisi dan format data di seluruh organisasi.Secara politis, ini mungkin
sulit, karena itumelibatkan perubahan, biasanya di tingkat eksekutif.
9. Meyakinan janji-janji kinerja, kapasitas, danskalabilitas. Gudang data umumnya
membutuhkankapasitas dan kecepatan lebih dari yang semula dianggarkanuntuk.
Rencanakan ke depan untuk meningkatkan.
10. Percaya bahwa masalah Anda lebih dari sekali datagudang sudah mulai berjalan. DSS /
intelijen bisnisproyek cenderung terus berkembang (lihatBab 6). Setiap penyebaran
merupakan iterasi dariproses prototyping. Akan selalu ada kebutuhan untuk
itumenambahkan lebih banyak dan set data yang berbeda ke gudang data,serta alat
analitik tambahan untuk yang adadan kelompok tambahan pengambil keputusan.Energi
tinggi dan anggaran tahunan harus direncanakankarena sukses melahirkan sukses. Data
pergudangantidak pernah berakhir.
11. Berfokus pada penambangan data ad hoc dan berkalamelaporkan alih-alih peringatan.

Perkembangan alami informasi dalam suatu datagudang adalah


1. Ekstrak data dari sistem warisan, bersihkan,dan memberi mereka makan ke gudang;
2. Dukung pelaporan ad hoc sampai Anda mempelajari apaorang menginginkan; lalu
3. Konversi laporan ad hoc menjadi jadwal rutinlaporan.

Ini mungkin alami, tetapi tidak optimal atau bahkanpraktis. Manajer sibuk dan perlu waktu
untuk membacalaporan. Sistem lansiran lebih baik dan dapat membuat datamisi gudang kritis.
Sistem waspada memantaudata mengalir ke gudang dan menginformasikan semua orang kunci
dengan kebutuhan untuk mengetahui segera setelah peristiwa kritisterjadi. "

Source: Adapted from R. C. Barquin, A. Paller, and H. Edelstein, "Ten Mistakes to Avoid for Data Warehousing Managers,"
Chapter 7 in R. Barquin and H. Edelstein. (eds.). Building, Using, and Managing the Data Warehouse, Upper Saddle River, NJ:
Prentice Hall PTR, 1997.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Wixom dan Watson (2001) mendefinisikan model penelitian untuk keberhasilan
data warehouseyang mengidentifikasi tujuh faktor implementasi penting yang
dapat dikategorikan ke dalamtiga kriteria (masalah organisasi, masalah proyek,
dan masalah teknis). Faktor-faktornya adalah:

1. Dukungan manajemen
2. Juara
3. Sumber Daya
4. Partisipasi pengguna
5. Keterampilan tim
6. Sistem sumber
7. Teknologi pengembangan

Di banyak organisasi, gudang data hanya akan berhasil jika ada yang
kuatdukungan manajemen senior untuk pengembangannya dan juara proyek
(lihat yang terbaikpraktik, risiko, dan kesalahan yang dijelaskan di atas).
Meskipun orang mungkin berpendapat bahwa iniakan benar untuk setiap
proyek teknologi informasi, itu sangat penting untuk sebuahgudang data.
Keberhasilan implementasi hasil data warehouse dipembentukan kerangka
kerja arsitektur yang memungkinkan untuk analisis keputusandi seluruh
organisasi dan dalam beberapa kasus juga menyediakan supplychain yang
komprehensifmanajemen dengan memberikan akses ke pelanggan dan pemasok
organisasi.Implementasi gudang data berbasis Web (Webhousing) telah
memfasilitasi kemudahanakses ke sejumlah besar data, tetapi sulit untuk
menentukan manfaat sulit yang terkait
dengan gudang data. Manfaat-manfaat sulit didefinisikan sebagai manfaat bagi
suatu organisasiyang dapat diekspresikan dalam istilah moneter. Banyak
organisasi yang memiliki teknologi informasi terbatassumber daya dan harus
memprioritaskan proyek mana yang akan dikerjakan terlebih dahulu.Dukungan
manajemen dan jawara proyek yang kuat dapat membantu memastikan bahwa
gudang dataproyek akan menerima sumber daya yang diperlukan untuk
implementasi yang sukses. Datasumber daya gudang dapat menjadi biaya yang
signifikan, dalam beberapa kasus membutuhkan prosesor high-enddan
peningkatan besar dalam perangkat penyimpanan akses langsung (DASD).
Gudang berbasis webmungkin juga memiliki persyaratan keamanan khusus
untuk memastikan bahwa hanya berwenangpengguna memiliki akses ke data.

Partisipasi pengguna dalam pengembangan pemodelan data dan akses adalah


keberhasilan yang sangat pentingfaktor dalam pengembangan gudang data.
Selama pemodelan data, diperlukan keahlianuntuk menentukan data apa yang
diperlukan, mendefinisikan aturan bisnis yang terkait dengan data,
danmemutuskan agregasi dan perhitungan lain apa yang mungkin diperlukan.
Pemodelan akses adalahdiperlukan untuk menentukan bagaimana data akan
diambil dari gudang data, dan akan membantudalam definisi fisik gudang
dengan membantu menentukan data mana yang diperlukanpengindeksan Ini
juga dapat menunjukkan apakah mart data dependen diperlukan untuk
memfasilitasipencarian informasi Keterampilan tim diperlukan untuk
mengembangkan dan mengimplementasikan gudang datamemerlukan

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


pengetahuan mendalam tentang teknologi basis data dan alat
pengembangandimanfaatkan Sistem sumber dan teknologi pengembangan,
seperti yang disebutkan sebelumnya, referensibanyak input dan proses yang
digunakan untuk memuat dan memelihara gudang data.

MASSIVE DATA WAREHOUSE DAN TURUNANYA

Selain fleksibilitas, gudang data perlu mendukung skalabilitas. Isu


utamanyaBerkenaan dengan skalabilitas adalah jumlah data di gudang, seberapa
cepatgudang diharapkan tumbuh, jumlah pengguna bersamaan, dan
kompleksitaspermintaan pengguna Sebuah gudang data harus berskala baik
secara horizontal maupun vertikal. Gudangakan tumbuh sebagai fungsi dari
pertumbuhan data dan kebutuhan untuk memperluas gudang kemendukung
fungsi bisnis baru. Pertumbuhan data dapat disebabkan oleh penambahan
arusdata siklus (misalnya, hasil bulan ini) dan / atau data historis.

Hicks (2002) menjelaskan basis data dan gudang data yang sangat besar. Pada
tahun 2002, Wal-Martgudang data diperkirakan memiliki kapasitas 200-
terabyte. Petabytecapacity pertamagudang data dibuat tersedia pada awal 2004.
Karena penyimpanandiperlukan untuk mengarsipkan rekaman berita, CNN
berencana untuk menjadi salah satu organisasi pertamamenginstal gudang data
berukuran petabyte (lihat Newman, 2002).

Mengingat bahwa ukuran gudang data berkembang pada tingkat eksponensial,


skalabilitas merupakan masalah penting. Skalabilitas yang baik berarti
pertanyaan dan akses data lainnyafungsi akan tumbuh (idealnya) secara linear
dengan ukuran gudang. Dalam praktek,metode khusus telah dikembangkan
untuk membuat gudang data terukur. Nance(2001) menjelaskan masalah
skalabilitas dalam situasi gudang data. Skalabilitas sulit dilakukanmengelola
ratusan terabyte atau lebih. Terabyte data memiliki inersia yang cukup
besar,menempati banyak ruang fisik, dan membutuhkan komputer yang kuat.
Beberapa perusahaan menggunakan parallel memproses, yang lain
menggunakan pengindeksan cerdas dan skema pencarian untuk mengelola data
mereka. Beberapamenyebarkan data mereka di berbagai toko data fisik yang
berbeda. Sebagai gudang data mendekatiukuran petabyte, solusi yang lebih baik
dan lebih baik untuk skalabilitas terus dikembangkan.

Deng (2003) menjelaskan pentingnya pengindeksan yang efektif untuk gudang


data.Pengindeksan yang benar pasti dapat menghasilkan pencarian yang efisien
melalui jumlah besardata. Sebagai gudang data dirancang, penting untuk
mempertimbangkan pengindeksan yang benarmembantu memecahkan masalah
skalabilitas. Hall (2002) juga membahas masalah skalabilitas. Sears adalah
sebuahpemimpin industri dal
am menyebarkan dan memanfaatkan gudang data maSif. Lihat DSS dalam
Aksi5.21 untuk detailnya.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


PENGGUNA, KEMAMPUAN, DAN MANFAAT

Analis, manajer, eksekutif, asisten administrasi, dan profesional adalahpengguna


akhir data warehouse utama. Solusi pergudangan data harus disediakanAkses
siap ke data kritis, mengisolasi database operasi dari proses ad hoc itudapat
memperlambat sistem TPS, dan memberikan informasi ringkasan tingkat tinggi
serta datakemampuan drill-down Sifat ini bisa meningkatkan pengetahuan
bisniskeunggulan kompetitif, meningkatkan layanan dan kepuasan pelanggan,
memfasilitasi pengambilan keputusan,meningkatkan produktivitas pekerja, dan
membantu merampingkan proses bisnis.

APLIKASI DATA WAREHOUSING

Allan (2001) memberikan contoh yang sangat baik dari sebuah gudang data. Dia
membahas masalahterkait dengan pemodelan data catatan siswa untuk
digunakan dalam data catatan siswabagian mart dari gudang data untuk
perguruan tinggi atau universitas. Ryder menggunakan gudang datanyauntuk
logistik. Lihat DSS dalam Tindakan 5.22.

DSS BERAKSI 5.21


DATA SEARS DATA TUMBUH

Pada April 2002, Sears, Roebuck and Co. telah menggunakan 95 ee menggunakan gudang data
untuk tujuan analitis, terabyte kapasitas penyimpanan baru, tiga kali lipat kapasitasnya. Mereka
bisa mendapatkan informasi penjualan-produk harian, menganalisis Ini memungkinkan Sears
mengkonsolidasikan dua penyimpanan data utama - pembelian pelanggan individu, dan
berkorelasi rumah dan membangun jaringan area penyimpanan yang menangani mereka dengan
pembelian sebelumnya, gudang persediaan dan penjualan data dengan pelanggannya informasi.

Dengan sistem ini, Sears dapat melakukan pengiriman promosi yang ditargetkan secara efektif.
Sekitar 5.000 karyawan Sears menggunakan gudang data untuk tujuan analitis, Mereka dapat
memperoleh informasi penjualan produk setiap hari, menganalisisnya dengan pembelian
sebelumnya, pembelian pelanggan individu, dan berkorelasi

Sumber: Diadaptasi dari Lucas Mearian, "Sears Triples Its

DSS BERLAKU 5.22 &


RYDE R BERJALAN KE E-LOGISTIK

Dengan gudang data baru, Ryder Systems Inc. memilikidirubah strategi e-commerce untuk lebih
mencocokkan1000 pelanggan armada dan operator umum dengan pengirimanyang harus segera
dipindahkan. Upaya itu ditujukandalam memperluas rantai pasokan manajemen armada
Ryderbisnis. Sistem ini menggunakan analisis transportasipaket berdasarkan teknologi dari NCR
Corp'sDivisi data warehouse Teradata dan MicroStrategyInc., vendor perangkat lunak analisis

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


bisnis. Sistem baruakan membiarkan pengirim memesan secara online dan membiarkan
operatormemesan buku secara real-time. Lebih banyak direncanakan untuk masa depan.

Sumber: Diadaptasi dari Steve Konicki, "Ryder Trucks into New


Strategi E-logistik, "InformationWeek, 11 Juni 2001, hlm. 40.

DSS DALAM ACTIO N 5.23


IDENTIFIK DAN IDENTIFIKASI WAL-MART TIDAK TERDUGA
PERMINTAAN PELANGGAN MELALUI DATA WAREHOUSE

Salah satu contoh informasi yang tepat waktu menjadi sangat pentingWal-Mart terjadi setelah
serangan 11 September,2001. Wal-Mart dapat dengan cepat mengidentifikasi pembelianpola
pelanggannya pada hari serangan sebagaipermintaan senjata, air kemasan, dan perlengkapan
bertahan hidupmeningkat, dan kemudian beralih ke bendera Amerika harisetelah itu. Wal-Mart
bisa bertemu pelangganmenuntut dengan cepat dan dapat merencanakan dengan tepat. Itu
bisauntuk memproyeksikan bahwa pelanggan menunda pembelian normalselama beberapa hari,
dan diharapkan dan bertemu yang tidak biasapermintaan yang lebih tinggi sesudahnya.

Sumber: Diadaptasi dari C. Newman, "Teradata: Your Next Best


Bertindak bersama Pelanggan Anda, "Teradata Magazine, Quarter 3,
2002.)

Wal-Mart adalah pemimpin yang tak terbantahkan di area gudang data.


Westerman (2000)menggambarkan model Wal-Mart yang efektif. DSS in Action
5.23 adalah contoh kecil daripenggunaan gudang data Wal-Mart yang
efektif.Vendor data warehouse utama adalah Carleton, IBM, Informix, Microsoft,
NCR,Oracle, Red Brick, dan Sybase. Untuk lebih lanjut tentang data pergudangan,
lihat Adelman dan Moss(2001), Allasi (2001), Barquin dan Edelstein (1997a,
1997b), Barquin, Paller, danEdelstein (1997), Deng (2003), Eckerson (2002b,
2003), Edelstein (4997), Hall (2002),Konicki (2001), Mannino (2001), Mearian
(2002), Mimno (1997), Mullin (2002), Nance(2001), Newman (2002), Watson
dan Haley (1998), Watson et al. (1999), Weir (2002),Westerman (2000), dan
Wixom and Watson (2001).

5 . 8 DAT A MARTS

Data mart adalah bagian dari gudang data, biasanya terdiri dari satu area subjek
(mis., pemasaran, operasi). Sebuah data mart dapat bergantung atau
independen. SEBUAHdependent data mart adalah subset yang dibuat langsung
dari data warehouse. Memilikikeuntungan menggunakan model data yang
konsisten dan menyediakan data yang berkualitas. Tergantungdata mart
mendukung konsep model data perusahaan tunggal, tetapi gudang dataharus
dibangun terlebih dahulu. Mart data dependen memastikan bahwa pengguna
akhirmelihat versi yang sama dari data yang diakses oleh semua pengguna data
warehouse lainnya.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Tingginya biaya gudang data membatasi penggunaannya bagi perusahaan besar.
Sebagai alternatif,banyak perusahaan menggunakan versi yang lebih murah dan
lebih kecil dari gudang data yang dirujuksebagai mart data independen. Data
mart independen adalah gudang kecildirancang untuk unit bisnis strategis
(SBU) atau departemen, tetapi sumbernya bukangudang data perusahaan
Keuntungan dari data mart termasuk yang berikut:

 Biaya rendah dibandingkan dengan gudang data perusahaan (di bawah $


100.000vs $ 1 juta atau lebih).
 Waktu tunggu untuk implementasi secara signifikan lebih pendek,
seringkali kurang dari 90 hari.
 Mereka dikendalikan secara lokal daripada terpusat, memberi kuasa pada
pengguna.
 Mereka mengandung lebih sedikit informasi daripada gudang data dan
karenanya memiliki lebih banyak
respon cepat dan lebih mudah dipahami dan dinavigasi daripada
enterprisewide
gudang data.
 Mereka mengizinkan unit bisnis untuk membangun sistem pendukung
keputusannya sendiri tanpa bergantungpada departemen IS terpusat.
 Mart data independen dapat berfungsi sebagai bukti konsep sebelum
berinvestasisumber daya yang dibutuhkan untuk mengembangkan gudang
data perusahaan yang komprehensif. Iniakan menghasilkan pengembalian
investasi yang lebih cepat dengan menyadari manfaat lebih cepat.

Ada beberapa jenis data mart:

1. Martent data yang direformasi (dependen). Terkadang lebih mudah bekerja


dengan lebih kecilbagian gudang. Dalam kasus seperti itu seseorang dapat
mereplikasi himpunan bagian fungsional dari jgudang data dalam database
yang lebih kecil, yang masing-masing didedikasikan untuk daerah-daerah
tertentu, sepertiditunjukkan pada Gambar 5.2. Dalam hal ini data mart
adalah tambahan untuk gudang data.
2. Mart data independen. Perusahaan dapat memiliki satu atau lebih data
independenmart tanpa memiliki gudang data. Dalam kasus seperti itu ada
kebutuhan untuk berintegrasimart data. Ini hanya mungkin jika setiap data
mart diberi set spesifiK informasi yang bertanggung jawab. Departemen IS
menentukan aturan untukmetadata sehingga informasi yang disimpan oleh
setiap mart kompatibel dengan yang disediakanoleh semua mart lainnya.
Ketika ini tidak dilakukan, data mart sulitmengintegrasikan, menciptakan
masalah fragmentasi yang berpotensi serius bagi organisasi.

5 . 9 BUSINES S INTELLIGENCE/BUSINES S ANALYTICS

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Sekarang kita tahu tentang database, gudang data, mart data, dan analitismetode
pengambilan keputusan yang dibahas dalam Bab 4, kami siap untuk
mendiskusikan bisnisintelijen / business analytics secara cerdas.

Intelijen bisnis menggambarkan komponen arsitektur dasar dari sebuah


bisnislingkungan intelijen, mulai dari topik tradisional, seperti proses
bisnispemodelan dan pemodelan data, untuk topik yang lebih modern, seperti
sistem aturan bisnis,profil data, kepatuhan informasi dan kualitas data, data
pergudangan, dan datapenambangan (lihat Loshin, 2003).

Intelijen bisnis melibatkan perolehan data dan informasi (dan bahkan


mungkinpengetahuan, lihat Bab 9) dari berbagai sumber dan
menggunakannyapengambilan keputusan Secara teknis, analitik bisnis
menambahkan dimensi tambahan untuk bisniskecerdasan: model dan metode
solusi. Ini sering dikubur begitu dalamalat-alat, bagaimanapun, bahwa analis
tidak perlu mendapatkan tangannya "kotor." Biasanya, istilah digunakan secara
bergantian. Kami menunjukkan aktivitas intelijen bisnis diGambar 5.6. Metode
dan alat intelijen bisnis sangat visual. Merekamenyediakan grafik dan grafik
data multidimensi dengan klik mouse. Inimetode umumnya mengakses data dari
gudang data dan menyimpannya ke lokal,sistem basis data multidimensional.
Metode pemrosesan analitik online (OLAP)memungkinkan seorang analis, atau
bahkan (kurang biasanya) seorang manajer untuk mengiris dan mencocokkan
datanyamengamati grafik dan tabel yang mencerminkan dimensi yang diamati.
Model mungkin
diterapkan pada data untuk memperkirakan atau mengidentifikasi peluang
(untuk contoh perangkat lunak,lihat Temtec Executive Viewer, Cognos
Impromptu dan PowerPlay, dan IBM CubeTampilan). Metode penambangan
data menggunakan model statistik dan deterministik, dan buatanmetode
intelijen untuk data, mungkin dipandu oleh analis (atau manajer), untuk
mengidentifikasihubungan tersembunyi atau menginduksi / menemukan
pengetahuan di antara berbagai data atau elemen teks(untuk contoh perangkat
lunak, lihat IBM DB2 Intelligent Miner Scoring, AngossKnowledgeSeeker,
Megaputer Intelligence PolyAnalyst, dan SAS Enterprise Miner).Penambangan
data juga sangat visual dalam cara hasil ditampilkan. Grafik dan grafikbiasanya
menampilkan hasilnya Dengan demikian perbedaan utama antara OLAP dan
penambangan data adalahbahwa penambangan data berjalan (kebanyakan)
secara otomatis, sementara OLAP digerakkan. Seiring peningkatan alatdalam
kemudahan penggunaan, semakin banyak manajer memanfaatkannya,
menghasilkan tren untuk memindahkan bisnisintelijen dari analis ke pengguna
(manajer). Ini memperkenalkan masalah baru:Manajer terkadang tidak
sepenuhnya memahami intelijen bisnis / analitik bisnismetode. Karena itu,
fokus mereka mungkin pada visualisasi daripadaaplikasi alat analisis yang tepat
dan akurat. Dengan kedua alat itu, itu pentinguntuk mengenali bahwa analis
sistem pada umumnya diperlukan untuk mengatur akses kedata yang akan
dianalisis. Ini melibatkan berurusan dengan pembersihan data dan integrasi,
tugassebaiknya diserahkan kepada spesialis IS. Lihat Vinyet Pembukaan dan
DSS dalam Tindakan 5.7.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Semua manajer dan eksekutif harus menggunakan sistem intelijen bisnis,
tetapibeberapa menemukan data tidak relevan atau alat terlalu rumit untuk
digunakan. Terkadang manajertidak dilatih dengan benar. Mendistribusikan
informasi dari analisis di seluruh perusahaanadalah tantangan utama;
kebanyakan bisnis menginginkan persentase yang lebih besar dari
perusahaanuntuk memanfaatkan analytics, tetapi sebagian besar tantangan
seputar teknologi melibatkan budaya,orang, dan proses (lihat Hatcher, 2003).
Masalah penting adalah menyelaraskan sistem BI dengan bisniskebutuhan. Jika
sistem tidak memberikan informasi yang berguna, maka hal itu dianggap tidak
berguna.Lihat DSS di Fokus 5.24 untuk rincian penelitian terbaru tentang
bagaimana para eksekutif saat ini menggunakannyaalat intelijen bisnis

Dalam 50 tahun pertama sejarah komputasi, sistem komputasi telah memiliki


kedalaman daninfus komprehensif ke berbagai domain bisnis. Sistem komputasi
sekarang menjadiinfrastruktur yang sangat diperlukan dengan mana kita
menjalankan, mengelola, dan mengoordinasikan operasi bisnis.Pada dekade
pertama milenium baru, kita melihat era baru komputasi di mana-manasistem.
Analytics akan menjalin sebagian besar, jika tidak semua, sistem perusahaan
(Delic danDayal, 2003). Pengambil keputusan di setiap perusahaan
membutuhkan arsitektur TIyang melayani kebutuhan mereka, bukan
sebaliknya. Delic dan Dayal (2003) menyediakanpandangan yang mengesankan
dari sistem analitik perusahaan yang sedang berkembang (lihat Bab 8)
itumenggunakan intelijen bisnis / persyaratan analitik bisnis sebagai basis
mereka.

Menurut laporan IDC yang dikeluarkan pada musim gugur 2002, organisasi yang
telah berhasildiimplementasikan dan digunakan aplikasi analitik telah
menyadari pengembalian mulaidari 17 persen menjadi lebih dari 2000 persen,
dengan median ROI sebesar 122 persen ("TheDampak Keuangan dari Business
Analytics, "IDC, Oktober 2002; juga lihat Kaliebe, 2003).Meski begitu, lebih dari
setengah dari semua proyek intelijen bisnis gagal. Seperti halnya data
pergudangan,kegiatan intelijen bisnis harus dilihat, tidak hanya sebagai
perangkat lainproyek TI, tetapi sebagai strategi, visi, dan arsitektur yang terus
berkembang secara terus-menerusberusaha menyelaraskan operasi dan arahan
organisasi dengan strateginyatujuan bisnis. Kami membahas gagasan bahwa BI
/ DSS tidak pernah benar-benar lengkap dalam Bab6. Mereka terus berkembang.
Perusahaan mencapai sukses ketika mereka melakukan hal berikut(lihat Atre,
2003):
 Buat keputusan yang lebih baik dengan kecepatan dan kepercayaan diri yang
lebih tinggi.
 Merampingkan operasi.
 Mempersingkat siklus pengembangan produk.Maksimalkan nilai dari lini
produk yang ada dan antisipasi peluang baru.
 Ciptakan pemasaran yang lebih baik, lebih terfokus, serta hubungan yang lebih
baikpelanggan dan pemasok.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Organisasi harus memahami dan mengatasi banyak tantangan penting untuk
bisnis
keberhasilan intelijen. Kami menjelaskan ini di DSS di Fokus 5.25.

Alat intelijen bisnis (baik data mining dan OLAP) telah digunakan untuk
mengidentifikasipencurian kerah putih dalam organisasi. Mereka mampu
mengidentifikasi faktur yang meningkat,penggelapan, peniruan identitas
pelanggan, dan pelanggaran serupa. Perkiraan totalpenipuan di Inggris hampir $
30 miliar (AS). Penipuan yang dilakukan olehkaryawan menyebabkan kerugian
rata-rata sebesar $ 60.000, sementara penipuan dilakukan oleh manajer
ataueksekutif menyebabkan kerugian rata-rata $ 250.000. Ketika manajer dan
karyawan bersekongkol,kerugian median naik menjadi $ 500.000. Jika semua
sistem data internal terintegrasi dengan datagudang untuk analisis penipuan
sehingga mereka dapat dibandingkan dengan data terkait penipuan
eksternalPola dan anomali menjadi lebih mudah diidentifikasi. Kegiatan yang
mencurigakan bisa terjaditerisolasi, diukur, dan dilacak. Lihat Dorrington
(2003) untuk detailnya.

Williams-Sonoma menghemat jutaan dengan pemasaran bertarget, pencitraan


merek multichannelmenggunakan perangkat lunak penambang data SAS,
Enterprise Miner, bersama dengan serangkaian CRMaplikasi dari SAS. Model
sistem pemasaran baru dan mengeksplorasi data pelanggandari lebih dari 30
juta rumah tangga untuk membantu pengecer menciptakan personalisasi,
kohesifpengalaman berbelanja di berbagai saluran dan beberapa merek. Lihat
Bolen(2003) untuk detailnya. Callaghan (2003a) menjelaskan bagaimana SPSS
Predictive Web Analytics danSAS Web dapat digunakan untuk memprediksi
perilaku pelanggan Web dan mengembangkan segmentasi pelangganmodel
(kluster) yang mengarah pada kinerja bisnis yang lebih baik. Pengecer
seringgunakan alat intelijen bisnis, seperti yang kami tunjukkan dalam DSS
dalam Tindakan 5.26.

Bentuk-bentuk baru intelijen bisnis terus bermunculan. Manajemen


kinerjasistem (PMS) adalah salah satu bentuk baru. Ini adalah alat intelijen
bisnis itumenyediakan kartu skor dan informasi relevan lainnya yang dapat
digunakan pembuat keputusanmenentukan tingkat keberhasilan mereka dalam
mencapai tujuan mereka. Dua alat termasuk BisnisObjects S.A. Performance
Manager dan SAS Institute, Inc. Berbasis AktivitasManajemen 6.0. Keduanya
menyediakan analisis Web-enabled. Objek Bisnis S.A.Perangkat lunak Manajer
Kinerja mencakup manajemen sasaran, kartu skor, dan strategipeta, dan
memungkinkan pelanggan untuk menyelaraskan tujuan dan kinerja dengan
strategi perusahaan.SAS Institute, Inc. Activity-Based Management 6.0
menyediakan biaya dan produktivitasanalisis pelanggan, produk, layanan, atau
proses bisnis. Lihat Callaghan (2003c)untuk detailnya.

DSS DALAM FOKUS 5.24

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


ADALAH KECERDASAN BISNIS
SISTEM PEMBUATAN PERUSAHAAN CERDAS?

Lebih dari 570 eksekutif TI menanggapi CIO Studi Penelitian Intelijen Bisnis Insight. CIO
Wawasan menemukan beberapa fakta menarik tentang arus keadaan intelijen bisnis.

• Terutama sekali, penggunaan teknologi intelijen bisnis tinggi, dan tumbuh.


• Perusahaan yang lebih besar agaknya lebih mungkin daripada perusahaan kecil untuk
menggunakan BI.
• Pada tahun 2002, perusahaan yang berhasil menghabiskan hampir 50 persen
lebih lanjut tentang teknologi BI daripada tidak berhasil
perusahaan. BI tampaknya diperlukan (tetapi tidak cukup)
untuk sukses
• Pemerintah menggunakan hampir setiap pasar teknologi intelijen pada tingkat yang lebih
tinggi secara signifikan daripada sektor ekonomi lainnya.
• Teknologi yang digunakan untuk mengumpulkan, mengumpulkan, menganalisis,
dan melaporkan intelijen kompetitif bersama dengan tanggapan persentase dalam tanda kurung
adalah: alat pelaporan (82.1), data / informasi otomatis feed (79), intranet / portal (70.4), data
pergudangan (69.8), manajemen konten (63), visualisasi data perangkat lunak (41.4), mesin
pencari khusus (41.4), perangkat lunak alur kerja (41.4), dan panen (mis., agen cerdas) (38,9).
Hanya 49 persen perusahaan yang kurang sukses senang dengan upaya intelijen kompetitif
mereka. Sekitar 88 persen perusahaan memiliki kepercayaan diri keakuratan informasi
pelanggan mereka mengumpulkan. Ketidakpuasan dengan BI biasanya berasal dari kesulitan
dalam mendistribusikan hasil.
CIO ingin memindahkan perusahaan ke perusahaan real-time.

Source: Adapted from "The 2003 CIO Insight Business Intelligence Research Study: Are Your BI Systems Making You Smarter?"
CIO Insight, No. 26, May 23,2003.

DSS DALAM FOKUS 5.25


SEPULUH TANTANGAN KRITIS
UNTUK KEBERHASILAN SUKSES BISNIS

Ada 10 alasan mengapa proyek intelijen bisnis


gagal. Organisasi harus memahami dan mengatasinya
10 tantangan penting untuk sukses:
1. Kegagalan untuk mengenali proyek-proyek BI sebagai lintas organisasi
inisiatif bisnis, dan untuk memahami itu
karena itu mereka berbeda dari solusi mandiri yang khas.

2. Sponsor bisnis yang tidak terlibat atau lemah.


3. Perwakilan bisnis yang tidak tersedia atau tidak mau.
4. Kurangnya staf yang terampil dan tersedia, atau suboptimal
pemanfaatan staf.
5. Tidak ada konsep rilis perangkat lunak (tidak ada pengembangan berulang
metode).
6. Tidak ada struktur kerusakan kerja (tidak ada metodologi).
7. Tidak ada analisis bisnis atau kegiatan standardisasi.
8. Tidak ada apresiasi terhadap dampak data kotor

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


profitabilitas bisnis.
9. Tidak ada pemahaman tentang kebutuhan untuk dan penggunaannya
metadata.
10. Terlalu bergantung pada metode dan yang berbeda
alat.

Source: Adapted from Shaku Atre, "The Top 10 Critical Challenges for Business Intelligence Success." ComputerWorld, White
Paper/Special Advertising Supplement, Vol. 37, No. 26, June 30,2003.

DSS BERAKSI 5.26


RETAIL MEMBUAT STEADY
PROGRESS INTELLIGENCE BISNIS

Hudson's Bay Co. berubah 333 pada Mei 2003. Terlepas dari ituusia, Hudson's Bay
meningkatkan sistem informasinyamemberi para eksekutif, manajer toko, dan metode pemasok
utamauntuk menganalisis rim penjualan dan data pelanggan. ItuMenantang wajah perusahaan
adalah untuk menentukan bagaimana mengubahdata menjadi informasi yang berguna.
Perusahaan menggunakan duagudang data dan alat intelijen bisnis daridivisi Teradata NCR Corp
untuk melacak make aindkeputusan tentang inventaris dan penjualan produk.

Sebagian besar pengecer bata-dan-mortir ketinggalan industri lainnyadalam kecerdasan bisnis.


Pengecualian pentingtermasuk Wal-Mart Stores Inc. dan Sears. Pengecer lainnyaterus membuat
langkah yang mengesankan.

Di Harry Rosen Inc., rantai 17 pakaian priatoko, eksekutif menggunakan alat analisis data Cognos
Inc.diintegrasikan ke dalam sistem merchandise. Masih ada lagidari selusin laporan penjualan
dan inventaris untuk dianalisispenjualan yang membantu perusahaan mengidentifikasi tren
penjualan, kelolapersediaan, dan meningkatkan margin laba kotor.

Pengecer lain mencari cara serupamendapatkan keunggulan kompetitif. Menempatkan produk


yang tepat ditempat yang tepat pada waktu yang tepat dengan harga yang tepat
(lihatmanajemen pendapatan dalam Bab 4) adalah tujuan pengecer.Melakukannya dengan tepat
menentukan siapa yang berhasil, dan siapagagal

Menggunakan intelijen bisnis dan alat analisis dariBusinessObjects SA, TruServ Corp.
(perusahaan indukPerangkat Keras True Value dan Rental Taylor)mengurangi persediaan "zona
merah" nya (produk yang adatidak terjual dalam satu setengah tahun) dengan $ 50 juta selama
dua tahundengan menganalisis stok produk. Untuk satu tahun, ituSistem juga telah
mengidentifikasi produk yang berada di 14 distribusinyapusat yang mungkin menjual lebih baik
di bagian lainnegara.

Toko sedang belajar dari pengecer online tentang bagaimanauntuk melakukan penyelidikan
analitik terhadap kinerja pelanggan.Misalnya, J. Crew Group dan Nordstrom Inc.gunakan
DigiMine untuk menganalisis penjualan online. Nordstrom memiliki sebuahsituasi tempat
pembeli daring menelusuricincin pusar sama seperti yang dikenakan oleh modeliklan.
Nordstrom dapat dengan cepat memperolehnyacincin untuk toko dan pelanggan online, bahkan
meskipun belum membawa produk itu sebelumnya.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


DASHBOARD

Dasbor menyediakan manajer dengan tepat informasi yang mereka butuhkan


dengan benarformat pada waktu yang tepat. Sistem intelijen bisnis adalah dasar
dasbor,yang telah berevolusi dari sistem informasi eksekutif menjadi informasi
perusahaansistem yang mengakses gudang data melalui sistem OLAP (lihat Bab
8 danLeon, 2003). Dasbor dapat berdampak pada komunikasi dan politik
perusahaan.Dasbor dan kartu skor mengukur dan menampilkan apa yang
penting. Setiap individuidealnya, dapat fokus pada apa yang penting baginya.
Pada dasarnya dasbor adalah presetTampilan OLAP. Lihat Gambar 5.7 untuk
contoh "CEO" Brio Performance SuiteDasbor. "Dasboard Bisnis Q Pasa!
MQSoftware, Inc. menyediakan real-timetampilan data Cognos Visualizer Series
7 adalah contoh lain dari dashboard perusahaanyang membantu memberikan
wawasan kepada para manajer untuk membuat keputusan yang lebih baik. Ini
adalah bagian dari Cognos Business Intelligence. Dasbor intelijen bisnis telah
menyebar ke berbagai nonfinansialdepartemen perusahaan, termasuk
penjualan dan layanan pelanggan. Lihat Tabel 5.4 untuk rincianbagaimana
dasbor telah menyebar melalui organisasi.

Di Southwest Airlines, mereka menyebut kokpits digital dashboard. Individu


bisa disesuaikanpandangan dari informasi yang mereka butuhkan untuk
pekerjaan mereka. Di Honeywell IncDivisi Bahan Khusus di Morristown, New
Jersey, dasbor Cognos Inc. memberikansetiap orang dalam penjualan memiliki
pandangan yang jelas ke dalam kinerja bisnis sehari-hari. Perwakilan penjualan
dapat melihat statistik penjualan mereka sendiri, tetapi mereka juga dapat
melihat bagaimana yang dilakukan orang lain, jugamanajer. Hal ini
menyebabkan tidak hanya perpindahan dari tampilan data bulanan dan
kuartalan menjaditampilan harian. Sekarang perusahaan memiliki definisi dan
pandangan umum dari semua informasi.

DSS DALAM FOKUS 5.27


PENILAIAN KECERDASAN BISNIS

Penilaian intelijen bisnis adalah biaya rendah, dapat ditindaklanjutipemeriksaan ketiga bidang
penting untuk implementasidari setiap inisiatif intelijen bisnis:

• Analisis kebutuhan bisnis: Analisis yang mendasarinyasasaran dan tujuan bisnis strategis dan
taktisyang mendorong pengembangan solusi BI,
termasuk apakah sponsor eksekutif danpendanaan tersedia.

• Analisis organisasi: Analisis yang adastruktur organisasi bisnis dan teknis,termasuk tingkat
kemitraan TI / bisnis di Indonesiatempat, budaya dan kepemimpinan organisasigaya,
pemahamannya tentang konsep BI, apakahperan dan tanggung jawab telah ditetapkan,dan
apakah orang dengan jumlah yang sesuaiwaktu dan keterampilan dalam plau

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


• Analisis teknis / metodologi: Analisis eapakah infrastruktur teknisnya sesuaidan metodologi
pengembangan sudah tersedia,termasuk semua perangkat keras dan perangkat lunak
terkait,kualitas dan kuantitas data sumber, danmetodologi dan proses kontrol-perubahan.

Penilaian memaksa organisasi untuk memeriksakekuatan dan kelemahan dalam tiga area ini
danmembuat rekomendasi tentang cara memperbaiki potensiarea masalah. Idealnya lakukan
analisis seperti itu sebelumnyamengembangkan sistem yang mahal, termasuk gudang
data,OLAP, dan penambangan data. Penilaian itu sendirimembantu membangun kesadaran dan
dukungan untuk inisiatif.

Source: Adapted from T. Burzinski, "The Case for Business Intelligence Assessments," DM Review, July 2002.

Burzinski (2002) merekomendasikan melakukan penilaian intelijen


bisnissebelum menanamkan inisiatif intelijen bisnis apa pun. Lihat DSS di Fokus
5.27 untuk detailnya.Pengembangan intelijen bisnis dan inisiatif penyimpanan
data di atasdekade terakhir telah menyebabkan banyak masalah dan solusi
mereka. Kami menggambarkan pelajaran pentingpelajari di DSS di Fokus 5.28.

Web telah memiliki dampak besar pada bagaimana alat-alat ini berfungsi dan
apa yang merekadigunakan untuk. Sifat visual dari kebanyakan perangkat
intelijen bisnis sering didasarkan padaAntarmuka browser web. Seiring
meningkatnya penggunaan Web dan e-commerce, ada lebih banyak
apermintaan untuk mengumpulkan dan menganalisis data dari clickstream,
untuk mengidentifikasi di mana pelanggan pergi di situs Web, dari mana mereka
berasal, ke mana mereka pergi sesudahnya, dan apamereka membeli atau tidak
membeli. (Sistem ini sering disebut kecerdasan Web / analisis Web;lihat Bagian
5.14.) Menggabungkan ini dengan data sensus dan informasi geografissistem,
perusahaan dapat mengidentifikasi apa yang menjadi target pasar untuk
pelanggan baru yang ada dan potensial.Kami menunjukkan basis data dan
teknologi intelijen bisnis dan Webdampak pada Tabel 5.5.

DSS DALAM FOKUS 5.28


PELAJARAN KRITIS DALAM BISNIS

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


INTELIJEN DAN DATA PERGUDANGAN

10 tahun pertama intelijen dan data bisnisinisiatif pergudangan telah menghasilkan banyak
keberhasilan,aplikasi teknologi informasi pengembalian tinggi.Berikut beberapa pelajaran
penting yang harus diikutidan diperiksa untuk membantu memastikan kesuksesan:

• Menciptakan stabilitas dalam struktur dasar data fundamentaluntuk menyediakan intelijen


bisnis danmenjalankan bisnis.
• Pastikan bahwa setiap elemen data berdiri sendiri sebagaisebuah fakta atau atribut.
Tetap fokus pada perusahaan, bukan departemen,regional, atau fokus kategori lainnya.

Jadikan kecerdasan bisnis bukan hanya analitislaporan, tetapi informasi seorang manajer atau
eksekutifperlu membuat keputusan.Gunakan beberapa teknologi intelijen bisnis yang berbeda
yang terintegrasi dengan baik. V

Source: Adapted from Richard Skriletz, "New Directions for Business Intelligence," DM Review, April 2002, p. 10.

Kurtyka (2003) membahas masalah yang berhubungan dengan pembelajaran


organisasi dan bisnisintelijen. Smith (2001) menjelaskan metode untuk
penilaian strategis bisnisalat intelijen. Dia menyediakan analisis terhadap
sejumlah besar alat. Lihat Smith (2001)untuk detailnya. Menentukan alat mana
yang digunakan memiliki konsekuensi signifikan terhadap keputusanfitur
analisis yang akan didukung. Kami dengan sengaja memisahkan penambangan
dataalat dari diskusi OLAP. Topik dan masalah yang berkaitan dengan OLAP,
penambangan data,dan Web dibahas dalam sisa bab ini.

Untuk lebih lanjut tentang intelijen bisnis, lihat Bolen (2003), Burzinski (2002),
Callaghan(2003a), Delic dan Dayal (2003), Dorrington (2003), Kaliebe (2003),
Kurtyka (2003),Leon (2003), Loshin (2003), Pallatto (2002a, b), Smith (2001),
Songini (2003), Ulfelder(2000a), Vitt, Luckevich, and Misner (2002), dan
Whiting (2003).

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


5.1 0 PENGOLAHAN ANALISIS ONLINE (OLAP)

Selama bertahun-tahun, TI berkonsentrasi pada pembangunan sistem misi-


kritis yang terutama didukungpemrosesan transaksi perusahaan. Sistem
semacam itu harus benar-benar tolerandan memberikan respon cepat. Solusi
yang efektif disediakan oleh transaksi onlineprocessing (OLTP), yang berpusat
pada lingkungan basis data relasional terdistribusi. Ituperkembangan terbaru di
bidang ini adalah pemanfaatan perangkat lunak ERP dan SCM untuk transaksi
memproses tugas, aplikasi CRM, dan integrasi dengan teknologi berbasis
webdan intranet. Banyak alat diciptakan untuk mengembangkan aplikasi OLTP ;,
yangINFORMIX OnLine Dynamic Server (informix.com) adalah contoh alat yang
efektif.

Akses terhadap data sering dibutuhkan oleh aplikasi OLTP dan MSS. Sayangnya,
mencoba untuk melayani kedua jenis permintaan mungkin bermasalah (Gray
danWatson, 1998). Oleh karena itu, beberapa perusahaan memilih untuk
memisahkan basis data ke OLTPjenis dan jenis OLAP. Jenis OLAP didasarkan
pada gudang data.Meski begitu, Gonzales dan Robinson (2003) menunjukkan
bahwa agar OLAP berfungsi dengan baik,sistem manajemen basis data

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


relasional harus dioptimalkan untuk mendukung OLAPbukannya langsung
menggunakan kubus data yang murni dan multidimensional. Basis data
harusterintegrasi dengan kontrol multidimensional yang terpusat, terpadu, dan
konsistendata di seluruh perusahaan. Untuk membuat database menyadari
organisasi data tingkat yang lebih tinggiOLAP membutuhkan, katalog basis data
memerlukan seperangkat objek tingkat lebih tinggiberhubungan langsung
dengan OLAP dan model bisnis. Akibatnya, benda-benda ini akan mengambil
yang adaentitas atom dan senyawa mereka untuk membuat entitas dimensi,
seperti atribut,fakta, hubungan, hierarki, dan dimensi. Setelah benda-benda
tingkat tinggi inididefinisikan, informasi baru dapat disimpan dan dikelola
sebagai bagian dari katalog (lihatGonzales dan Robinson, 2003). Akibatnya,
mengelola metadata menjadi bagian dari relasionalsistem manajemen basis data
untuk membuatnya "sadar OLAP."

Istilah pemrosesan analitik online (OLAP) mengacu pada berbagai kegiatan


biasanyadilakukan oleh pengguna akhir dalam sistem online (lihat DSS dalam
Tindakan 5.29). Tidak ada kesepakatan tentang kegiatan apa yang dianggap
OLAP. Biasanya satu termasuk kegiatan tersebutseperti membuat kueri (lihat
DSS dalam Tindakan 5.30), meminta laporan ad hoc dangrafik, melakukan
analisis statistik, dan membangun DSS dan aplikasi multimedia.Beberapa
termasuk sistem informasi dan data mining eksekutif dan / atau
perusahaan.Pada dasarnya, OLAP menyediakan kemampuan pemodelan dan
visualisasi untuk kumpulan data besar,baik ke sistem manajemen basis data
atau, lebih sering, sistem data warehouse.OLAP berbeda dengan data mining
sehingga pengguna dapat mengajukan pertanyaan terbuka dan spesifik.

Pengguna, biasanya analis, menjalankan sistem OLAP. Mereka mendorong OLAP,


sedangkan datapenambangan mencari hubungan, dengan beberapa arahan dari
analis. OLAP umumnyadifasilitasi dengan bekerja dengan gudang data (atau
dengan data mart atau multidimensionalgudang) dan dengan satu set alat OLAP.
Alat-alat ini bisa menjadi alat kueri,spreadsheet, alat penambangan data, alat
visualisasi data, dan sejenisnya. Untuk daftarAlat OLAP, lihat Costanza (2000),
Alexander (2003), Karpinski (1999), dan berkalaulasan di bagian perangkat
lunak PCWeek, Ulasan DM, InternetWeek, CerdasPerusahaan, dan Tinjauan
Perangkat Lunak. Vendor utama dari alat ini termasukBusinessObjects S.A., Brio
Software Inc., Computer Associates, Cognos Inc.,Comshare, Crystal Decisions
Inc., Hyperion Software Corporation, Informatica Corp,Pembangun Informasi,
IBM, Intersolve, Microstrategy Corporation, Oracle, SASInstitute Inc., Perangkat
Lunak A & G, dan Temtec. Sifat multidimensi dari hampir semuaSistem OLAP
dijelaskan pada Bagian 5.12.

ING Antai Insurance Co. (Taiwan) menggunakan Server OLAP IBM untuk
menganalisis besarjumlah data untuk mendeteksi klaim curang dan
mempercepat pemrosesan klaim. Saya thanya butuh beberapa hari untuk
menganalisis data yang sebelumnya memakan waktu beberapa minggu.
Sebagaialat dan perangkat keras meningkat, klaim dapat dianalisis secara
instan. Biaya pemrosesanklaim sangat berkurang. Lihat Raden (1997). TCF Bank
memanfaatkan OLAP untuk menyediakaninformasi langsung kepada mereka

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


yang membutuhkannya. Bank sekarang mengerti pelanggannyamendasarkan
lebih akurat untuk menargetkan upaya pemasarannya. Lihat DSS dalam
Tindakan 5.31 untukrincian. Kami mencakup lebih banyak materi di Bagian 5.11
dan dalam Aplikasi Perkara 5.3

SQL FOR QUERYING

Bahasa query terstruktur (SQL) adalah bahasa data standar untuk akses data
danmanipulasi dalam sistem manajemen basis data relasional. Ini adalah bahasa
yang mirip bahasa Inggristerdiri dari beberapa lapis peningkatan kompleksitas
dan kemampuan. SQL digunakanuntuk akses online ke basis data, operasi DBMS
dari program, dan fungsi administrasi basis data. Ini juga digunakan untuk akses
data dan fungsi manipulasi beberapamemimpin produk perangkat lunak DBMS
(misalnya, Oracle, DB2, Ingres IBM).

Karena SQL tidak prosedural dan cukup user-friendly, banyak pengguna akhir
dapat menggunakannya untukkueri dan operasi basis data mereka sendiri. SQL
dapat digunakan untuk program yang ditulisdalam bahasa pemrograman
standar apa pun; dengan demikian, ini memfasilitasi integrasi perangkat lunak.
MendukungDSS / intelijen bisnis dilakukan di gudang dengan produk dari
vendorseperti Brio, BusinessObjects, Cognos, Pilot Software, dan SAS. SQL cukup
sederhanaAlat OLAP. Kekuatan nyata OLAP adalah kemampuan analitis
utamanya.

OLAP TOOLS

Menggunakan SQL dan akses data dan alat analisis konvensional lainnya sangat
membantu, tetapi tidakcukup, untuk OLAP. Di OLAP, kelas khusus alat
digunakan, yang dikenal sebagai dukungan keputusan / bisnisbagian depan
analitik / bisnis analitik, ujung depan akses data, basis dataujung depan, dan
sistem akses informasi visual. Metode-metode ini jauh melampauispreadsheet
dalam kekuasaan dan hasil. Alat-alat tersebut dimaksudkan untuk
memberdayakan pengguna.Alat OLAP memiliki karakteristik yang membedakan
mereka dari alat pelaporandirancang untuk mendukung aplikasi pelaporan
OLTP tradisional. Karakteristik dariAlat OLAP secara ringkas didefinisikan oleh
E. F. Codd dan rekan (1993); Codd dianggapmenjadi "penemu" model database
relasional. Dua belas aturan untuk

Alat OLAP dirangkum dalam Tabel 5.6 (lihat Raden, 1997). Mereka
mendefinisikan empat jenispemrosesan yang dilakukan oleh analis dalam suatu
organisasi:
1. Analisis kategori adalah analisis statis berdasarkan data historis. Itu
didasarkan ataspremis bahwa kinerja masa lalu adalah indikator masa

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


depan. Ini yang utamaanalisis didukung oleh basis data berbasis transaksi
OLTP
2. Analisis eksegetis juga didasarkan pada data historis, menambahkan
kemampuan untuk melakukanteliti analisis. Drill down analysis adalah
kemampuan untuk melakukan query lebih jauh ke dalam datauntuk
menentukan data detail yang digunakan untuk menentukan nilai turunan.

3. Analisis kontemplatif memungkinkan pengguna untuk mengubah satu nilai


menjadi dampaknya.

4. Analisis formula memungkinkan perubahan ke banyak variabel.


Vendor di arena BI melakukan manuver untuk memberdayakan pengguna
akhir dengan kemampuanmenyesuaikan aplikasi analitik untuk memenuhi
kebutuhan bisnis yang berkembang. Ini termasukSpotfire (DecisionSite
analytics platform), Objek Bisnis (Enterprise BI Suite), danQlikTech
(QlikTech). Lihat Haverstein (2003b).

Ada ratusan alat OLAP yang tersedia saat ini. Mereka berbagi banyak fiturtetapi
juga memberikan beberapa perbedaan yang jelas (lihat DSS dalam Tindakan
5.30). Contoh dariOutput OLAP ditunjukkan pada Gambar 5.8, hasil dari Cognos
Impromptu Versi 7.0pertanyaan.

Temtec Executive Viewer menyediakan semua fitur OLAP yang diharapkan,


termasuk multidimensionaltampilan data, perluasan dimensi dan kolaps,
pemilihan kolom dinamis,perhitungan otomatis (jumlah, dll), grafik dan grafik
otomatis, fisikpeta untuk menampilkan data (Gambar 5.9), dan drilldown dan
rollup seketika. EksekutifPenampil memanfaatkan gagasan lampu lalu lintas
dalam tampilan datanya. Kami menunjukkan contohini pada Gambar 5.10.
Perhatikan bayangan di kolom kolom varians terakhir. Nilai -2,57
adalahberbayang merah, menunjukkan "berhenti, ada masalah"; 4.64 diarsir

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


dengan warna kuning menunjukkan"hati-hati, masalah mungkin berkembang";
dan sisa nomornya diarsirberwarna hijau, menandakan bahwa aman untuk
terus maju. Coba Executive Viewer online(www.temtec.com) menggunakan
buku demo (di mana data diintegrasikan ke dalam multidimensionalkerangka).

Kami menampilkan cuplikan layar dari Brio Performance Suite pada Gambar
5.11 dan Gambar5.12. Kemampuan drag dan drop berbasis Web, yang
menunjukkan bagaimana membangun sebuahlaporan dengan menyeret baris /
kolom untuk analisis, digambarkan pada Gambar 5.11. ItuPelaporan
Performance Suite dengan kemampuan OLAP digambarkan pada Gambar 5.12.
Catatancampuran grafik dan tabel.

Raden (1997) membahas pendekatan yang dapat digunakan dalam memilih


yang sesuaiTeknologi OLAP untuk sebuah organisasi. Menninger (1997)
membahas bagaimana sebuah organisasiharus mengembangkan aplikasi OLAP
yang berorientasi objek. Untuk lebih lanjut tentang OLAP, lihat Barquin dan
Edelstein (1997a, 1997b), Dash (2001), Kudyba (2002),Ledman (2003),
Menninger (1997), Gonzales dan Robinson (2003), Havenstein(2003a), dan
Raden (1997).

DSS BERAKSI 5.31


PENAMBUAN OLAP DAN DATA TCF BANK

Salah satu bank regional terbesar di Midwestern wilayah Amerika Serikat, TCF Bank memiliki
lebih dari390 cabang di enam negara bagian dan melayani pelanggan dari semuakelompok
pendapatan. TCF Bank memiliki aset dan $ 12,2 miliarmengoperasikan cabang perbankan
cabang terbesar keempatsistem di dalam negeri. TCF fokus pada kenyamananone-stop shop
untuk pelanggan; itu adalah salah satu dari sedikitbank di Amerika Serikat yang buka 12 jam per
hari,tujuh hari per minggu, termasuk hari libur.

Pengguna di grup utama bank (perbankan ritel,pinjaman konsumen, perbankan hipotek, broker)
ditemukanbahwa laporan TI tidak memenuhi kebutuhan mereka.Sebaliknya, mereka harus
mengembangkan proses kustom untuk mengunduhfile dari TI dan kemudian memuat data ke
dalam spreadsheetuntuk analisis lebih lanjut. Waktu yang diperlukan untuk membuat
laporan grafik standar hampir satu bulan. Itu mungkinluangkan enam minggu untuk
menghasilkan daftar pemasaran pelanggan.

Departemen manajemen informasi dibutuhkanuntuk menghasilkan proses baru yang


memungkinkan pengguna untuk mendapatkanwawasan pelanggan sehingga mengungkap
peluang danefektif menawarkan layanan baru kepada pelanggan. TCFdiadopsi Informatica
PowerCenter dan Power Analyzerpada pertengahan 2002. Wizard pembuatan laporan
PowerAnalyzer,pelaporan berbasis metrik, dan analisis-jalur menelusurifitur adalah fungsi
kemudahan-penggunaan yang penting dalamkeputusan adopsi. Sejumlah starter kunci-indikator
laporan untuk dashboard pengguna dikembangkan. Dalam seminggu,550 petugas pinjaman dan
eksekutif menggunakan ini danlaporan lain setiap hari.

Dengan sistem OLAP baru, yang mencakup aaplikasi cross-sell, TCF mampu mengidentifikasi
kelas-kelaspelanggan untuk mendekati layanan dan produk tertentu.Ini sangat penting dalam

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


mengidentifikasi kebutuhanpelanggan baru. Selain itu, laporan dibuatsegera, jadi analisis lebih
lanjut dapat dilakukan.

Source: Adapted from Ted Ledman, "TCF Bank," What Works: Best Practices in Business Intelligence and Data Warehousing,
Vol. 15, The Data Warehousing Institute, Chatsworth, CA, June 2003, p. 10.

5.1 1 DATA MINING

Analisis data tradisional dilakukan dengan memasukkan data ke dalam standar


atau model yang disesuaikan.Dalam kedua kasus, diasumsikan bahwa hubungan
antara berbagai variabel system terkenal dan dapat dinyatakan secara
matematis. Namun,dalam banyak kasus, hubunganmungkin tidak diketahui.
Dalam situasi seperti itu, pemodelan tidak mungkin dan penambangan
datapendekatan mungkin dicoba.

Data mining (DM) adalah istilah yang digunakan untuk menggambarkan


penemuan pengetahuan dalam basis data.Penambangan data adalah proses
yang menggunakan statistik, matematika, kecerdasan buatan danteknik
pembelajaran mesin untuk mengekstrak dan mengidentifikasi informasi yang
berguna dan selanjutnyapengetahuan dari database besar. Sebelumnya istilah
itu digunakan untuk menggambarkanproses di mana pola-pola yang belum
ditemukan dalam data diidentifikasi. Namun, berakhirwaktu, definisi asli telah
dimodifikasi untuk menyertakan sebagian besar jenis (otomatis)analisis data.
Menurut Gartner Group, penambangan data adalah proses rekayasapola
matematis dari set data yang biasanya besar. Pola-pola ini bisa menjadi
aturan,afinitas, korelasi, tren, atau model prediksi (lihat Nemati dan Barko,
2001;Linden, 1999).
.

DSS BERAKSI 5.31


PEKERJA MEMBERDAYAKAN DENGAN DATA
MINING DI ROCKWELL INTERNATIONAL

Divisi transportasi udara Rockwell International (CedarRapids, Iowa) diperlukan untuk


mengakses database perusahaansering. Selama bertahun-tahun, hanya beberapa personel SIM
memiliki pengetahuan teknis untuk menggali data perusahaandari mainframe. Namun, eksekutif
dan manajersemakin menuntut akses ke informasi yang tersimpan di dalamnyamainframe.
Frustrasi dan keterlambatan dalam menyediakaninformasi umum. Departemen SIM
dioperasikandi bawah beban kerja yang berat. Selanjutnya, karenaprioritas diberikan kepada
manajemen puncak, karyawan lainharus menunggu berhari-hari atau bahkan berbulan-bulan
untuk mendapatkan informasimereka dibutuhkan. Saat ini, manajer dapat dengan mudah dan
cepat mendapatkansebagian besar data yang mereka butuhkan sendiri.

Solusinya disediakan dengan membuat khususdatabase pada server di lingkungan klien /


server.Manajer dapat mengembangkan aplikasi mereka sendiri denganLightShip (dari Pilot
Software, pilotsw.com).Manajer dapat pergi tepat setelah informasi yang mereka butuhkantanpa
harus menjadi pemrogram, sehingga menghasilkan lebih sedikitfrustrasi dan backlog, dan
karyawan yang senang diRockwell.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Source: Condensed from public information provided by Pilot Software Inc., pilotsw.com.

Penambangan data ada di antarmuka ilmu komputer dan statistik,


memanfaatkankemajuan di kedua disiplin untuk membuat kemajuan dalam
mengekstraksi informasi dari besardatabase. Ini adalah bidang baru yang telah
menarik banyak perhatian dalam waktu yang sangat singkat.Glymour dkk.
(1997) mendiskusikan tema dan pelajaran statistik yang secara langsung
relevan dengan datapenambangan, dan beberapa peluang untuk bersinergi
antara komputasi dan statistic komunitas untuk kemajuan lebih lanjut dalam
analisis data.

Penambangan data termasuk tugas yang dikenal sebagai ekstraksi pengetahuan,


arkeologi data, dataeksplorasi, pemrosesan pola data, pengerukan data, dan
pengumpulan informasi. Semuakegiatan ini dilakukan secara otomatis dan
memungkinkan penemuan cepat bahkan oleh nonprogrammers(lihat DSS dalam
Tindakan 5.32). Berikut ini adalah karakteristik utama dantujuan penambangan
data:

• Data sering terkubur jauh di dalam database yang sangat besar, yang kadang-
kadangmengandung data dari beberapa tahun. Dalam banyak kemudahan, data
dibersihkan dankonsolidasi dalam gudang data.
• Lingkungan penambangan data biasanya merupakan arsitektur client / server
atau a
Arsitektur berbasis web.
• Alat-alat baru yang canggih, termasuk alat visualisasi canggih,
membantubuang bijih informasi yang terkubur di file perusahaan atau arsip
public catatan Menemukannya melibatkan memijat dan synchiom / ing data llio
c untuk mendapatkanhasil yang benar. Pengolah data mutakhir juga
mengeksplorasi kegunaannyadata lunak (teks tidak terstruktur yang disimpan
di tempat-tempat seperti basis data Lotus Notes.file teks di Internet, atau
intranet perusahaan-lebar).
• Penambang sering menjadi pengguna akhir, diberdayakan oleh latihan data
dan kekuatan lainnyaalat kueri untuk mengajukan pertanyaan ad hoc dan
mendapatkan jawaban dengan cepat dengan sedikit atautidak ada keterampilan
pemrograman.
• Memerasnya kaya sering melibatkan menemukan hasil yang tidak diharapkan
dan membutuhkan pengguna akhiruntuk berpikir kreatif.
• Data mining loois mudah dikombinasikan dengan spreadsheet dan perangkat
lunak lainnyaalat pengembangan. Ilius, data yang ditambang dapat dianalisis
dandiproses dengan cepat dan mudah.
• Karena banyaknya data dan pencarian besar-besaran. Terkadangdiperlukan
untuk menggunakan pemrosesan paralel untuk penambangan data.Efektif
memanfaatkan alat dan teknologi penambangan data dapat menyebabkan
perolehandan mempertahankan keunggulan kompetitif strategis. Data mining
menawarkan organisasilingkungan pengambilan keputusan yang sangat
diperlukan untuk mengeksploitasi peluang baru denganmentransformasikan

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


data menjadi senjata strategis. Lihat Nemati dan Barko (2001). Banyakpenulis
telah menulis tentang pendekatan praktis dan teoritis dari penambangan
data,termasuk Web, teks, pencarian, dan masalah transformasi organisasi. Di
antara merekaAnthes (2002), Barquin and Edelstein (1997a, 1997b), Barth
(1997), Berry (2000, 2002,2003a, 2003b), Bhandari dkk. (1997), Bigus (1996),
Bolen (2001), Boyd (2001), Buck(2000), Copeland (2001), Dunham (2003),
Fayyad (2003), Finlay (2001), Gimes (2001),Glymour dkk. (1997), Haskett
(2000a, 2000b), Hudnell dan Kitayama (2000), Lamont(2000), Linden (1999),
Linoff dan Berry (2002), Nemati dan Barko (2001), Palshikar(2001), Saarenvirta
(2001), Swartz (2003), Skalak (2001), Small and Edelstein (1997),Swift (2001),
Tillett (2000), Walker (2002), dan Zaima (2003). Juga lihat KdnuggetsSitus web
(www.kdnuggets.com). Lihat Groth (1998), Haskett (2000a, 2000b), dan
Nematidan Barko (2001) untuk pengenalan yang sangat baik untuk topik ini.

BAGAIMANA PEKERJAAN DATA DATA

Penambangan data cerdas, menurut Dunham (2003), menemukan informasi di


dalamnyagudang data yang query dan laporan tidak dapat secara efektif
mengungkapkan. Alat penambangan datatemukan pola dalam data dan mungkin
bahkan mengambil aturan dari mereka. Ada tiga jenis metodedigunakan untuk
mengidentifikasi pola dalam data (Nemati dan Barko, 2001):

• Model sederhana (query berbasis SQL, OLAP, penilaian manusia)


• Model perantara (regresi, pohon keputusan, pengelompokan)
• Model kompleks (jaringan saraf, induksi aturan lainnya)

Pola dan aturan ini dapat digunakan untuk memandu pengambilan keputusan
dan perkiraanefek keputusan. Penambangan data dapat mempercepat analisis
dengan memusatkan perhatian pada hal yang paling pentingvariabel penting.
Penurunan dramatis dalam rasio biaya / kinerja sistem computer telah
memungkinkan banyak organisasi untuk mulai menerapkan algoritma data yang
rumitteknik penambangan. Setiap kelas aplikasi penambangan data didukung
oleh satu set algoritmikpendekatan untuk mengekstrak hubungan yang relevan
dalam data. Pendekatan ini berbedadi kelas-kelas masalah yang dapat mereka
pecahkan (lihat Haskett, 2000b). Kelas-kelasadalah:

• Klasifikasi: menyimpulkan karakteristik yang menentukan dari kelompok


tertentu (mis.pelanggan yang telah kalah dari pesaing). Metode ini melibatkan
pembenihansatu set data dengan set kelas yang dikenal (mungkin ditemukan
dengan pengelompokan),dan memetakan semua item olher (pelanggan) ke
dalam set ini. Pohon keputusan danjaringan saraf adalah teknik yang
bermanfaat.
• Clustering: mengidentifikasi kelompok item yang memiliki karakteristik
cerlain(pengelompokan berbeda dari klasifikasi di bahwa tidak ada
karakteristik yang menentukan adalahdiberikan). Clustering mendekati masalah

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


segmentasi. Kekelompokanalgoritma dapat digunakan untuk mengidentifikasi
kelas pelanggan dengan kebutuhan tertentu
• Asosiasi: mengidentifikasi hubungan antara event1; itu terjadi satu
kali.Pendekatan asosiasi menangani kelas masalah yang dicirikan oleh
keranjang pasaranalisis. Dalam ritel, ada upaya untuk mengidentifikasi produk
apa yang dijual bersamaapa yang lainnya, dan pada tingkat apa. Metode statistik
biasanya digunakan.
• Sequencing: mirip dengan asosiasi, kecuali hubungan itu terjadiperiode waktu
(mis. kunjungan berulang ke a.supermarket. menggunakan perencanaan
keuanganproduk). Pembelian dapat dilacak bccnu> c pembeli dapat
diidentifikasidengan nomor akun atau cara lain.Regresi: digunakan untuk
memetakan data ke nilai prediktif. Saya. Masuk dan tidak linierteknik busur
digunakan. Ini adalah bentuk estimasi, sering melibatkan identifikasimetrik dan
mengevaluasi item (customc.) di sepanjang metrik dengan menetapkanskor.
Prediksi penjualan dapat diselesaikan juga.
• Peramalan: memperkirakan nilai masa depan berdasarkan pola dalam
kumpulan besar
data (misalnya, peramalan permintaan). Ini adalah bentuk es'imutinn. YhcTQ
adalahsebuah upaya untuk memanfaatkan metode time-series statistik untuk
memprediksi penjualan di masa mendatang.
• Teknik lain: ini biasanya didasarkan pada kecerdasan buatan adv
anccdmetode. Mereka termasuk penalaran berbasis kasus, logika fuz / y,
algoritma genetika,dan transformasi berbasis fraktal.

Pada Tabel 5.7, kami menunjukkan fungsi penambangan data ini bersama
dengan algoritme representative dan contoh aplikasi. Juga lihat Groth (1998).

Perusahaan sering secara efektif menggunakan sistem penambangan data


mereka untuk melakukan segmentasi pasardengan analisis klaster. Analisis
kluster adalah alat untuk mengidentifikasi kelas barang jadibahwa barang-
barang dalam kelompok memiliki lebih banyak kesamaan dengan satu sama lain
daripada dengan barang-barang lainnyakelompok. Kami memberikan
penjelasan rinci tentang analisis klaster dan contoh yang sangat baikdi bidang
perbankan dalam Aplikasi Perkara 5.3. Demikian pula, JCB Co., Ltd. (Jepang)
telahefektif digunakan analisis klaster sebagai bagian dari upaya penambangan
data dalam segmentasi pelanggandan mengarahkan produk pemasaran yang
sesuai ke segmen di sebelah kananwaktu dalam format yang tepat dengan harga
yang tepat (lihat sub-bagian pendapatan manajemen diBab 4). Lihat DSS dalam
Tindakan 5.33 untuk deskripsi. Tillett (2000) menjelaskan bagaimanabank lain
secara efektif menambang data pelanggan melalui analisis kluster menggunakan
Web-basedalat. Dalam DSS dalam Tindakan 5.31, kami membahas bagaimana
alat OLAP digunakan untuk hal yang serupatujuan.

Penambangan data dapat berupa hipotesis didorong atau penemuan didorong.


Hipotesispenambangan data dimulai dengan proposisi oleh pengguna, yang
kemudian mencari untuk memvalidasikebenaran proposisi. Sebagai contoh,

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


seorang manajer pemasaran dapat mulai denganproposisi, "Apakah penjualan
DVD player terkait dengan penjualan televisi?" Discovery driven data mining
menemukan pola, asosiasi, dan hubungan antar data. Saya tdapat mengungkap
fakta-fakta yang sebelumnya tidak diketahui atau bahkan tidak direnungkan
oleh suatu organisasi.

Buck (2000) mengatur kelas alat dan teknik penambangan data sebagaimana
adanyaberhubungan dengan teknologi informasi dan intelijen bisnis.

Taksonomi nya adalah:

• Paket analisis matematis dan statistik


• Alat personalisasi untuk pemasaran berbasis Web
• Analytics dibangun ke dalam platform pemasaran
• Alat CRM lanjutan
• Analytics ditambahkan ke platform spesifik industri vertikal lainnya
• Analytics ditambahkan ke alat basis data (mis., OLAP)
• Alat penambangan data mandiri

Dalam penambangan data (dan OLAP), skalabilitas dari metode dan dari gudang
data(atau database) adalah masalah penting. Ini karena jumlah data
danpencarian diperlukan. Lihat Small and Edelstein (1997) dan Section 5.7
untuk lebih lanjut tentang inimasalah dan bagaimana mereka dapat ditangani.

Edelstein (2001) menjelaskan tujuh langkah yang diperlukan untuk


penambangan data yang sukses.Lihat DSS di Fokus 5.34. Jika ini diikuti, dan
praktik bisnis benar, makaupaya penambangan data harus berhasil. Bertindak
atas hasil sangat penting, karena menemukanhubungan dalam data tidak
memiliki dampak kecuali hubungan digunakan.

Sejumlah kesalahpahaman telah berkembang tentang penambangan data. Kami


jelaskanini di DSS di Fokus 5.35. Banyak dari ini mencerminkan cara

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


penambangan data digunakanpraktek. Sebagai contoh, metode penambangan
data biasanya digunakan terutama oleh staf TI danmanajemen, dan oleh
konsultan / analis karena terlalu sulit bagi personel nonteknis untuk
menginterpretasikan hasil. Tapi ini berubah karena alat menjadi lebih mudah
digunakan. Di2001, hanya sekitar 35 persen dari manajemen dan staf
perusahaan yang langsung menggunakan dataminingalat (lihat Nemati dan
Barko, 2001). Hasil ini sebanding dengan untukgudang data dan OLAP.

Penambangan data bersifat berulang karena penambang data melakukan


kesalahan. Sebenarnya, itu adalahproses penemuan yang berulang-ulang.
Thomas A. Edison menyindir bahwa ia gagal menciptakanbola lampu 100 kali
sebelum dia berhasil. Jadi, sama seperti karya penemu terkenalproses, data
mining adalah proses penemuan. Ini adalah proses eksperimental
itumembutuhkan desain eksperimental yang bagus. Lihat DSS di Fokus 5.36
untuk "kesalahan" tertentupenambang data biasanya membuat dalam praktek
karena mereka sering tidak mengertiproses tetapi memahami hasil yang
diharapkan.

DSS BERAKSI 5.33


DATA MINING DI JCB CO., LTD.

Sebagai penerbit kartu kredit terbesar di Jepang, JCB Co., Ltd.telah memantapkan
dirinya sebagai merek internasional. Ituperusahaan, dengan 34 juta pemegang kartu,
menawarkan 200 layanandan 600 jenis kartu. Pada Juli 1999, penjualan JCBdepartemen
mulai mengembangkan proyek penambangan dataelacak kebutuhan pelanggan yang
semakin beragam dan kompleks.Sistem ini selesai dalam tiga bulan dengan
SASPenambang Perusahaan. (Enterprise Miner mengandung banyakmodel dan
algoritma terintegrasi, termasuk keputusanpohon, jaringan saraf, regresi, penalaran
berbasis memori,mengantongi dan meningkatkan ansambel, dua tingkatmodel,
pengelompokan, rangkaian waktu, dan asosiasi. Lihatwww.sas.com untuk detailnya.)
Sistem JCB mencakup pelangganprofil dan manajemen hubungan pelanggan.

JCB segmen pelanggannya (analisis cluster) untukmeningkatkan tingkat respons


kampanye pemasarannya,yang pada gilirannya meningkatkan pendapatan. Kemudian,
melalui pelangganteknologi profiling, ia merancang berfokus pada pelangganstrategi
penjualan. Sistem ini menganalisa bagaimana anggota menggunakankartu mereka,
membantu JCB mengidentifikasi dan mempertahankan paling banyakpelanggan yang
menguntungkan. JCB berencana untuk melayani pelanggannyaselama beberapa dekade
dengan menawarkan layanan yang berbeda untukberbagai tahapan kehidupan.

"Dengan mengelompokkan dan membuat asosiasi dengandata, kami mencoba untuk


mencari tahu apa yang pelanggan butuhkan.Dan kami ingin memoles model bisnis kami
mengulangi proses perencanaan, melakukan, pemeriksaan danberlatih, "kata Makoto
Nakaoka, manajer JCBdepartemen administrasi bisnis. Dalam waktu singkat,JCB
melipatgandakan tingkat respons pelangganpengajuan email langsung dan memulai

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


kampanye yang suksesuntuk mempertahankan pemegang kartu saat ini, pada tingkat
keberhasilan enamsampai sepuluh kali lebih besar dari sebelumnya
Source: Maria Hudnell and Hajime Kitayama, "Transforming Business with Data Mining," SAS com, November/December 2000,
pp. 22-23.

DSS DALAM FOKUS 5.34


LANGKAH TUJUH PENAMBANGAN DATA

Penambangan data menggunakan berbagai alat analisis data untuk ditemukanpola dan
hubungan dalam data yang mungkindigunakan untuk membuat prediksi yang akurat.
Penambangan data membantuorganisasi mengembangkan model yang paling akurat dari
merekapelanggan dan calon pelanggan. .

Tujuh langkahpenambangan data adalah:


1. Tentukan masalah bisnis.
2. Membangun (mencari atau mengakuisisi) database data mining.
3. Jelajahi data.
4. Siapkan data untuk pemodelan.
5. Bangun (atau temukan) model-modelnya.
6. Evaluasilah modelnya.
7. Bertindak atas hasilnya.

Source: Adapted from Herbert Edelstein, "Pan for Gold in the Clickstream," InformationWeek, March 12,2001, pp. 77-91.

DSS DALAM FOKUS 5.35


MITOS DATA MINING

Penambangan data adalah alat analitik yang kuat yang memungkinkaneksekutif bisnis untuk
maju dari menggambarkan sejarahperilaku pelanggan untuk memprediksi masa depan. Ia
menemukanpola yang membuka kunci misteri perilaku pelanggan.Hasil penambangan data
dapat digunakan untuk meningkatkanpendapatan, mengurangi biaya, mengidentifikasi
penipuan, dan mengidentifikasipeluang bisnis, menawarkan keunggulan kompetitif baru.

Ada sejumlah mitos tentang penambangan data,tercantum di bawah ini. Para visioner
pertambangan data telah menjadi sangat besarkeunggulan kompetitif dengan memahami itu
mitos-mitos ini hanya itu saja — mitos.

• Data mining memberikan prediksi bola kristal instan.Penambangan data adalah proses multi-
langkah itumembutuhkan desain dan penggunaan yang disengaja dan proaktif.

• Data mining belum layak untuk aplikasi bisnis.Keadaan terkini seni siap digunakanuntuk
hampir semua bisnis.

Penambangan data membutuhkan database yang terpisah dan berdedikasi.


Karena kemajuan teknologi basis data,database yang berdedikasi tidak diperlukan, meskipun
itu mungkin diinginkan.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Hanya Ph.D yang bisa melakukan penambangan data. Webbased yang lebih barualat-alat
membuat penambangan data oleh manajer menjadi mungkin.

Penambangan data hanya untuk perusahaan besar dengan banyakdata pelanggan. Jika data
secara akurat mencerminkanbisnis atau pelanggannya, perusahaan dapat
memanfaatkanpenambangan data.

Source: Adapted partly from Arlene Zaima, "The Five Myths of Data Mining," What Works: Best Practices in Business
Intelligence and Data Warehousing, Vol. 15, The Data Warehousing Institute, Chatsworth, CA, June, 2003, pp. 42-43.

DSS DALAM FOKUS 5.36


DATA PERTUMBUHAN DATA

Berikut ini sepuluh kesalahan penambangan data yang sering dilakukandalam praktek. Cobalah
untuk menghindarinya:

• Pilih masalah yang salah untuk penambangan data.


• Abaikan apa yang menurut sponsor Anda adalah penambangan data,dan apa yang benar-benar
bisa dan tidak bisa dilakukan.
• Berikan waktu yang tidak cukup untuk persiapan data. Inimembutuhkan lebih banyak usaha
daripada yang dipahami secara umum.
• Hanya perhatikan hasil agregat, tidak pernah pada individucatatan. IBM DB2 Intelligent Miner
Scoring bisasoroti catatan individu yang menarik.
• Ceroboh tentang melacak prosedur penambangandan hasil.
• Abaikan temuan yang mencurigakan dan cepat bergerak.

Jalankan algoritma penambangan berulang kali dan membabi buta.


Jangan berpikir cukup keras tentang tahap selanjutnya
analisis data. Penambangan data adalah kegiatan yang sangat aktif.

Percayalah pada semua yang Anda tahu tentang datanya.

Percayalah semua yang Anda tahu tentang milik Anda


analisis data mining.

Ukur hasil Anda secara berbeda

Source: Adapted from David Skalak, "Data Mining Blunders Exposed!" DB2 Magazine, Quarter 2,2001, pp. 10-13.

ALAT PERTAMBANGAN DATA DAN TEKNIK

Ada banyak metode untuk melakukan penambangan data. Perangkat lunak


penambangan data dapat digunakan, /orsatu atau lebih dari teknik ini; ini
adalah salah satu karakteristik yang identic perangkat lunak penambangan data.
Alat dan teknik penambangan data dapat berdasarkanstruktur data dan
algoritma yangmerupakan Yang utama adalah:

• Metode statistik. Ini termasuk regresi linier dan nonlinear, sebab,


Teorema Bayes (probabilitas distribusi), terpadu, dan analisis klaster.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


• Pohon hasil. Pohon terjemahkan dalam metode klasifikasi dan
pengelompokan.Pohon hasil memecah masalah menjadi bagian yang lebih
berbeda, dengan bekerjadari generalisasi ke informasi yang semakin spesifik.
Sebuah keputusanpohon dapat didefinisikan sebagai root diikuti oleh node
internal. Setiap node (termasukroot) beri label dengan pertanyaan. Arcs yang
berhubungan dengan setiap node mencakup semua yang diperlukanumpan
balik. Setiap umpan untuk hasil yang mungkin (lihat Dunham,2003).

• kasus berdasarkan pidana. Menggunakan kasus historis, pendekatan pidana


berbasis kasusdapat digunakan untuk menggantikan pola. Misalnya, pelanggan
Sistem KognitifInc menggunakan bantuan semacam itu untuk aplikasi help desk.
Satu pelanggan memiliki 50.000-pustaka kueri kasus. Kasus-kasus baru dapat
dicocokkan dengan cepat terhadap 50.000 sampeldi perpustakaan, memberikan
jawaban otomatis atas pertanyaan dengan lebih dari 90 persenketepatan. Untuk
lebih lanjut tentang pidana berdasarkan kasus, lihat Bab 12.

• Komputasi saraf. Jaringan syaraf menggunakan banyak simpul yang terhubung


(yang beroperasidengan cara yang mirip dengan bagaimana neuron fungsi otak
manusia). Inidata display data besar untuk pola. Jadi, satudapat menggunakan
database besar dan, misalnya, untuk potensialproduk baru (lihat DSS harian
5.37) atau perusahaan yang profilnya menunjukkan itumereka menuju
kebangkrutan. Banyak aplikasi dalam layanan keuangan(Fadlalla dan Lind,
2001) dan di bidang manufaktur. Deskripsi yang lengkap tentangjaringan saraf
kemudian dalam teks

• Agen cerdas. Salah satu pendekatan yang paling menjanjikan untuk mengambil
informasidari database, terutama yang eksternal, adalah penggunaan agen
cerdas. Denganketersediaan informasi yang luas dan terus bertambah
melaluiInternet, menemukan informasi yang tepat menjadi lebih sulit. Data
berbasis webaplikasi pertambangan biasanya diaktifkan oleh agen perangkat
lunak cerdas. Topik inidibahas dalam bab selanjutnya.

• Algoritme genetika. Algoritma genetika bekerja pada prinsip perluasanhasil


yang mungkin. Diberikan sejumlah hasil yang mungkin, algoritma
genetikaberusaha untuk menentukan solusi baru dan lebih baik. Algoritma
genetika digunakan untukpengelompokan dan aturan asosiasi.

• Alat lainnya. Beberapa alat lain dapat digunakan. Ini termasuk aturan induksi
danvisualisasi data. Sumber terbaik pengembangan alat baru adalah vendor
Websitus.

Penalaran berbasis kasus, komputasi saraf, agen cerdas, dan algoritma


genetikametode memiliki fondasi dalam kecerdasan buatan.

Algoritma penambangan data penting (lihat Dasu dan Johnson, 2003). Saat
berhadapandengan data perilaku pelanggan, yang dapat mencakup seratus
dimensi ataulebih lanjut, algoritma harus mampu menangani secara efektif
dengan data berdimensi tinggi.Algoritme ini juga harus dapat bekerja dengan

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


batasan dan aturan bisnis. Sederhanastatistik tidak berfungsi. Pengetahuan
tentang kendala bisnis, hubungan antaraproduk, dan dari berbagai segmen
perilaku pelanggan adalah suatu keharusan.Sejak serangan teroris pada 11
September 2001, ada banyakkemajuan dalam pemanfaatan metode
penambangan data oleh lembaga penegak hokum melacak terorisme dan
kejahatan secara umum. Lihat DSS dalam Tindakan 5.38 untuk rincian dan
contoh.

TEXT MINING

Penambangan teks adalah aplikasi penambangan data ke teks yang tidak


terstruktur atau kurang terstrukturfile. Penambangan data mengambil
keuntungan dari infrastruktur data yang disimpan untuk mengekstrak
tambahaninformasi berguna. Misalnya, dengan data mining database pelanggan,
analis mungkin menemukan bahwa setiap orang yang membeli produk A juga
membeli produk B dan C, tetapi enambulan kemudian. Penambangan teks
beroperasi dengan informasi yang kurang terstruktur. Dokumen jarangmemiliki
infrastruktur internal yang kuat, dan ketika mereka melakukannya, seringkali
lebih terfokus pada format dokumen daripada konten dokumen. Penambangan
teks membantu organisasi untuk

• Temukan isi dokumen yang "tersembunyi", termasuk hubungan yang berguna


tambahan.
• Hubungkan dokumen di seluruh divisi unnotice sebelumnya; misalnya,
temukan itu
pelanggan di dua divisi produk yang berbeda memiliki karakteristik yang sama.
• Kelompokkan dokumen berdasarkan tema umum; misalnya, semua pelanggan
dari perusahaan asuransi yang memiliki keluhan serupa dan membatalkan
kebijakan mereka.

Ellingsworth dan Sullivan (2003) menjelaskan proses penambangan teks (lihat


DSS diFokus 5.39). Mereka juga menjelaskan bagaimana Perusahaan Asuransi
Dana Fireman menggunakan penambangan teks untuk membantu memprediksi
klaim yang diharapkan dan memahami mengapa hasil menyimpangdari
prediksi. Penambangan teks digunakan untuk mengekstraksi entitas dan objek
untuk frekuensianalisis, mengidentifikasi file dengan atribut tertentu untuk
analisis statistik lebih lanjut, dan buatfitur data yang sama sekali baru untuk
pemodelan prediktif. Yang pertama dari ketiganya digunakan diberurusan
dengan kasus pengadilan yang melibatkan ban Firestone pada Ford SUV. Bolen
(2001)menjelaskan aplikasi farmasi penambangan teks yang efektif. Lihat DSS
dalam Tindakan 5.40untuk detailnya. Dalam DSS dalam Tindakan 5.41, kami
mendeskripsikan rincian farmasi lain yang efektifaplikasi penambangan-teks.

Berikut ini daftar beberapa alat dan vendor penambangan teks populer:
• SAS Text Miner (www.sas.com)
• IBM Intelligent Miner for Text (wwwjbm.com)
• SPSSLexiquest (www.spss.com)

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


• Penambang untuk Teks Insightful (www.insightful.com)
• Megaputer Intelligence TextAnalyst (www.megaputer.com)

DSS BERAKSI 5.38


DHS DATA MINING SPINOFFS
KEUNTUNGAN DALAM PENEGAKAN HUKUM

Pada akhir 2002, John Poindexter, mantan kepala Dewan Keamanan Nasional, menyebabkan
flap dengan proposalnya untuk Kantor Penyadaran Informasi baru di dalam Pentagon. Kritikus
mengecam rencana Poindexter untuk data menambang banyak kredit, perbankan, dan
pembelian eceran catatan warga AS, atas nama mendeteksi kemungkinan pola perilaku teroris.

Kenyataannya, agensi seperti National Reconnaissance Kantor dan Badan Keamanan Nasional
telah telah melakukan ini selama bertahun-tahun, dan pada pertengahan tahun 2003 Utara
Komando juga melakukannya. Padahal, alat penambangan data digunakan oleh badan-badan
intelijen nasional sudah digunakan oleh lembaga penegak hukum domestik di Amerika Serikat.
Alat-alat tersebut dipindahkan dari Space AS Perintah ke Komando Utara, dan dari sana ke
Departemen Keamanan Dalam Negeri, menunjukkan keduanya basis teknologi umum untuk
semua lingkungan danmungkin kekhawatiran kebebasan sipil yang melekat pada teknologi
semacam itu transfer. Semua lembaga prihatin tentang penghormatan kebebasan sipil.
Koordinasi intelijen yang lebih baik dengan negara dan pasukan polisi lokal adalah tujuan utama.

NRO dan NSA menggunakan komersial skala besar alat basis data dan pengenalan pola khusus
alat. Kontraktor pertahanan bertanggung jawab untuk mengintegrasikan alat bersama di suite
perangkat lunak yang akan terbukti berguna untuk badan intelijen. Banyak yang bekerja dengan
konstituen Departemen Keamanan Dalam Negeri lembaga sebelum DHS terbentuk pada akhir
tahun 2002. Mereka menyebarkan alat untuk penegakan narkoba domestik dan tugas
kontraterorisme melalui saluran-saluran Komando Utara dan DHS.

Misalnya, Web-enabled Northrop-Grumman Sistem Analisis Temporal (WebTAS) dikembangkan


bekerja sama dengan Lab Riset Angkatan Udara dan digunakan selama kampanye Irak. Ini
tersedia untuk koalisi intelijen kepolisian daerah melalui DHS. WebTAS menampilkan peta dan
menunjukkan tautan yang sesuai hubungan antar target. Mengklik pada tautan memanggil basis
data terkait yang dapat memberi tahu seorang analis, misalnya, semua panggilan yang dibuat
oleh target beberapa hari terakhir. Untuk mengambil pola yang mungkin terkubur dalam
kebisingan terlalu banyak informasi, sebuah mesin prediksi perilaku-perilaku melekat
memprediksi kemungkinan tren untuk mengembangkan situasi dan keadaan bendera yang
mengidentifikasi masalah untuk mengumpulkan lebih lanjut intelijen.

Kerjasama baru di antara Homeland Security para peneliti, khususnya dalam data
pertambangan, memproduksi terobosan besar dalam kasus-kasus nonterrorist, termasuk
kematian 19 orang asing ilegal ditemukan dimasukkan ke dalam trailer di Victoria, Texas, pada
14 Mei 2003. Terdeteksi melalui teknik penambangan data, transfer uang dan panggilan telepon
yang dibuat oleh korban dan lebih dari 50 saksi yang selamat dari insiden itu menyebabkan
pihak berwenang menjadi penduduk legal AS, yang mereka yakini memimpin penyelundupan
cincin yang membawa alien menyeberangi perbatasan Meksiko ke Kota-kota AS dengan biaya
substansial. Coconspirators sekitar Amerika Serikat juga diidentifikasi. Setelah tersangka
melarikan diri dari negaranya, dia terpikat oleh operasi penyerangan ke Honduras, di mana dia
ditangkap dan diekstradisi ke Amerika Serikat.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Sources: Adapted from Loring Wirbel, "Data Mining Comes Down to Earth," Electronic Engineering Times, No. 1270, May
19,2003, pp. 18,22; Mark Hosenball, "Crime Breakthrough," NewsWeek, June 20,2003, p. 9.

DSS DALAM FOKUS 5.39


BAGAIMANA KE TAMBANG TEKS

Istilah ekstraksi adalah bentuk paling dasar dari penambangan teks. Seperti semua teknik
penambangan teks, ini memetakan informasi dari data tidak terstruktur menjadi format
terstruktur. Itu struktur data paling sederhana dalam penambangan teks adalah vektor fitur,
atau daftar kata-kata berbobot. Kata-kata yang paling penting dalam sebuah teks terdaftar,
bersama dengan ukuran kerabat mereka pentingnya. Teks mengurangi ke daftar istilah dan
bobot. Seluruh semantik teks mungkin tidak ada, tetapi konsep-konsep kunci diidentifikasi.
Untuk melakukan ini, lakukan penambangan teks melakukan hal berikut:

1. Hilangkan kata-kata yang biasa digunakan (yang, dan, lainnya).


2. Ganti kata dengan akar atau akarnya (misalnya, hilangkanjamak, dan berbagai konjugasi dan
kemunduran).Dengan demikian istilah "menelepon," "menelpon," dan"ponsel" dipetakan ke
"ponsel".
3. Hitung bobot dari ketentuan yang tersisa. Itu metode yang paling umum adalah menghitung
frekuensi dengan mana kata itu muncul. Ada dua ukuran umum: frekuensi istilah, atau tf faktor,
mengukur jumlah aktual kali a kata muncul dalam dokumen, sementara kebalikannya frekuensi
dokumen, atau faktor idf, menunjukkan berapa kali kata itu muncul di semua dokumen dalam
satu set. Alasannya adalah faktor tf yang besar meningkatkan berat badan, sementara faktor idf
besar menurunkannya, karena istilah yang sering terjadi di semua dokumen adalah kata-kata
umum untuk industri dan tidak dianggap penting.

Misalnya, perhatikan paragraf pertama ini DSS dalam kotak Fokus hingga ke titik dua. Ada
sekitar 20 istilah dengan 28 kejadian setelah kami mempertimbangkan umum kata-kata. Berikut
adalah daftar istilah yang muncul lebih banyak dari sekali, bersama dengan frekuensi relatif
mereka (faktor tf) dari total 28:

Saat Anda mempertimbangkan semua kata penting dalam paragraf, mereka terdiri dari setengah
dari total pentingnya dan dapat digunakan untuk mengidentifikasi semantiknya. Jelas paragraf
adalah tentang penambangan teks (berat = 0,1429) dan melibatkan teks dan data dengan
struktur dan berat.
Sumber: Diadaptasi sebagian dari Martin Ellingsworth dan DanSullivan, "Tambang Teks Meningkatkan Kecerdasan
Bisnis danPemodelan Prediktif dalam Asuransi, "Ulasan DM, Jilid 13, No. 7,
Juli 2003, hlm. 42 ^ 14.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


DSS BERAKSI 5.40
TEXT MINING

Penambangan teks adalah pendekatan yang sangat efektif untuk secara otomatismelakukan
analisis pada dokumen standar dan Web.Misalnya, farmasi internasionalperusahaan
menggunakan penambangan teks untuk mengevaluasi 500 berbasis tekstanggapan dari pasien
yang berpartisipasi dalam studi klinisobat alergi baru. Perangkat lunak penambangan
teksmendeteksi sekelompok 50 pasien yang menggunakan spesifikkata-kata yang
menggambarkan efek samping negatif. Lebih lanjutpemeriksaan menunjukkan bahwa pasien ini
semuanya menerimadosis tinggi obat, dan wanita yang lebih tua dari 40sangat sensitif terhadap
dosis tinggi.Akibatnya, tingkat dosis disesuaikan, dan peringatanuntuk wanita di atas 40
termasuk dengan obat.

Source: Adapted from A. Bolen, "Data Mining for Text," SAS com, November/December 2001

DSS BERAKSI 5.41 DATA MINING AT Pfizer,

perusahaan farmasi besar, menggunakan penambangan teks untuk mencari kesejajaran dalam
pengujian farmasi di database yang sangat besar yang National Institutes of Penggunaan
kesehatan untuk katalog penelitian medis. Penambangan teks target proyek dokumen biomedis
diekstraksi dari berbagai sumber eksternal, seperti MedLine, medis layanan literatur penelitian
yang disediakan oleh National Institut Kesehatan. Sistem Pfizer mencari database dokumen dan
ekstrak satu set dokumen yang ditandai oleh kriteria pencarian sederhana berdasarkan
kombinasi kata kunci. Selanjutnya, set dokumen selanjutnya disegmentasi ke dalam topik. Topik
dicirikan oleh daftar kata kunci diekstraksi dari teks format bebas yang terkandung dalam
dokumen. Para ilmuwan memilih topik yang diminati oleh memeriksa daftar kata kunci. Pfizer
telah menyadari beberapa hal manfaat. Pertama, perusahaan telah menemukan teks itu
penambangan tidak hanya teknologi untuk kategorisasi informasi. Hasil penambangan teks juga
memungkinkan membangun aplikasi baru untuk navigasi lebih lanjut data dan dukungan
keputusan. Aplikasi baru ini bisa ambil prototipe untuk menyelesaikan pengembangan lebih
cepat daripada sebelumnya. Sekarang mungkin untuk cepat berkumpul aplikasi analitis yang
kuat dan mudah digunakan mengatasi keseluruhan persyaratan.

Source: Adapted from Lawrence Bell, "For Pfizer, AlphaBlox Is Just What the Doctor Ordered." What Works: Best
Practices in Business Intelligence and Data Warehousing, Vol. 10, The Data Warehousing Institute, Chatsworth, CA, June,
2003, p. 31.

SAMPLER APLIKASI DATA MINING

Penambangan data bisa sangat membantu, seperti yang ditunjukkan oleh contoh
perwakilan berikut.Perhatikan bahwa maksud dari sebagian besar contoh ini
adalah untuk mengidentifikasi peluang bisnismenciptakan keunggulan
kompetitif yang berkelanjutan.
• Pemasaran: memprediksi pelanggan mana yang akan merespons spanduk
Internet atau membeliproduk tertentu; mengelompokkan demografi pelanggan.
• Perbankan: meramalkan tingkat kredit macet dan penggunaan kartu kredit
palsu, kreditpengeluaran kartu oleh pelanggan baru, dan jenis pelanggan mana

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


yang akan memberikan respons terbaikpenawaran pinjaman baru atau produk
dan layanan lainnya.
• Penjualan dan penjualan: memprediksi penjualan dan menentukan tingkat
persediaan yang benar danjadwal distribusi antar gerai.• Manufaktur dan
produksi: memprediksi kapan harus mengharapkan kerusakan
mesin,menemukan faktor-faktor kunci yang mengontrol optimalisasi kapasitas
produksi.
• Pialang dan perdagangan efek: memprediksi kapan harga obligasi akan
berubah, perkiraankisaran fluktuasi saham untuk isu-isu tertentu dan pasar
secara keseluruhan;menentukan kapan harus memperdagangkan saham.
• Asuransi: meramalkan jumlah klaim dan biaya pertanggungan medis,
mengklasifikasikanelemen terpenting yang memengaruhi cakupan medis,
memprediksi pelanggan manaakan membeli kebijakan baru dengan fitur-fitur
khusus.
• Perangkat keras dan perangkat lunak komputer: memprediksi kegagalan drive
disk, memperkirakan caranyalama waktu yang dibutuhkan untuk membuat chip
baru, memprediksi potensi pelanggaran keamanan.
• Pemerintah dan pertahanan: meramalkan biaya peralatan militer yang
bergerak, pengujianstrategi untuk keterlibatan militer, memprediksi konsumsi
sumber daya.
• Maskapai: menangkap data tidak hanya di tempat pelanggan terbang tetapi
juga yang paling utamatujuan penumpang yang mengubah operator di tengah
penerbangan. Dengan informasi iniMaskapai penerbangan dapat
mengidentifikasi lokasi populer yang saat ini tidak mereka layaniuntuk
menambah rute dan menangkap bisnis yang hilang.
• Perawatan kesehatan: menghubungkan demografi pasien dengan penyakit
kritis; menggunakanpenambangan data, dokter dapat mengembangkan
wawasan yang lebih baik tentang gejala dan cara menyediakannyaperawatan
yang tepat.
• Broadcasting: memprediksi program apa yang paling baik ditampilkan selama
jam tayang utama danbagaimana memaksimalkan hasil dengan memasukkan
iklan.
• Polisi: melacak pola kejahatan, lokasi, perilaku kriminal, dan atribut untuk
membantumenyelesaikan kasus pidana (lihat DSS dalam Tindakan 5.55 di
Bagian 5.13).

Palshikar (2001) memberikan beberapa contoh penambangan data yang efektif


dalam praktek.Lihat DSS di Fokus 5.42 untuk informasi tentang upaya
penambangan dan analisis data di DHS.Data sensus dapat dikombinasikan
dengan data pasar lainnya saat melakukan segmentasi pelanggan (lihatGimes,
2001). Untuk kemampuan data mining dan perbandingan data miningalat, lihat
Dunham (2003), Roiger dan Geatz (2003).

Wal-Mart terus merintis usaha penambangan data. Bahkan, Wal-Mart bahkan


memberi tahublip dalam data karena hari libur etnis dan rencana untuk mereka.
Lihat DSS dalam Tindakan 5.43. Datapenambangan sangat penting ketika
digunakan dalam hubungan pelanggan (sumber daya) manajemen(CRM) sistem,

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


seperti yang dijelaskan dalam DSS di Fokus 5.44. Lihat Berry (2000, 2002,
2003a,2003b), Fayyad (2003), Linoff dan Berry (2000), dan Swift (2001).

Aplikasi data mining yang kurang umum diterapkan untuk meningkatkan


kinerjatim National Basketball Association (NBA) di Amerika Serikat. ItuNBA
mengembangkan Advanced Scout, aplikasi penambangan data berbasis PC yang
digunakan dengan pelatihanstaf untuk menemukan pola menarik dalam data
permainan bola basket. Proses polainterpretasi difasilitasi dengan
memungkinkan pengguna untuk menghubungkan pola ke rekaman video.Lihat
Bhandari et al. (1997) untuk detailnya.

KDD DAN DATA MINING


Penambangan data dan penemuan pengetahuan dalam basis data (KDD) sering
digunakan sebagai sinonim.
Fayyad dkk. (1996) mendefinisikan penemuan pengetahuan dalam basis data
(KDD) sebagai suatu proses
menggunakan metode penambangan data untuk menemukan informasi dan pola
yang berguna dalam data, sedangkan
penambangan data adalah penggunaan algoritma untuk mengidentifikasi pola
dalam data yang diturunkan oleh KDD
proses. KDD adalah proses komprehensif yang mencakup penambangan data.
Masukan ke
Proses KDD terdiri dari data organisasi. Gudang data perusahaan
memungkinkan
KDD harus dilaksanakan secara efisien karena menyediakan sumber tunggal
untuk data
beranjau. Dunham (2003) merangkum proses KDD sebagai terdiri dari langkah-
langkah berikut:
• Seleksi: Identifikasi data yang akan dipertimbangkan dalam penambangan
dataproses.
• Preprocessing: Data yang salah dan hilang harus ditangani. Ini melibatkan
koreksidan / atau memanfaatkan nilai prediksi.
• Transformasi: Data harus diubah menjadi satu format umum
untukpengolahan; ini mungkin melibatkan pengkodean data atau mengurangi
jumlah variable yang harus ditangani.
• Penambangan data: Algoritma diterapkan pada data yang diubah untuk
menghasilkankeluaran.
• Interpretasi / evaluasi: Agar bermanfaat, hasilnya harus disajikan dengan
carayang berarti bagi pengguna.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


PENAMBANGAN DATA INTELLIGENT DAN TEXT MINING

Metode data dan penambangan teks cerdas baru, seringkali berdasarkan


kecerdasan buatanmetode seperti jaringan saraf tiruan dan agen cerdas, terus
dikembangkandan diterapkan dalam praktek. Metode-metode ini sering terbukti
sangat efektif untuk spesifikmacam masalah dan set data dan teks. Banyak yang
diterapkan untuk mengidentifikasi informasidan pengetahuan tentang halaman
Web yang tersebar di seluruh dunia. Kami menjelaskan beberapametode
berbasis kecerdasan baru untuk penambangan data dalam DSS di Fokus 5.45.
Juga lihat Anthes(2002). Lihat situs Web Kdnuggets (www.kdnuggets.com)
untuk beberapa informasi tambahanpada metode cerdas untuk penambangan
data.

Ketika organisasi diganggu oleh penipuan, terutama dalam transaksi keuangan,


seperti padae-commerce, mereka beralih ke alat penambangan data khusus
untuk mendeteksi pola dalam data.Umumnya metode ini menggunakan jaringan
syaraf selain pengelompokan dan statistic metode. Perangkat Lunak Anti-
Pencucian Uang SAS adalah salah satu contoh bagaimana ini diterapkandalam
praktek. Lihat DSS dalam Tindakan 5.46 sebagai contoh.

Sebuah tim ahli biologi Norwegia telah mengembangkan metode cerdas untuk
mencari danmenambang Web untuk studi genetika yang berisi informasi yang
relevan dengan upaya mereka.Sejak setiap tiga tahun kami menggandakan
jumlah informasi yang kami hasilkan dan simpandi bumi (lihat Pallatto, 2002a),
metode seperti ini menjadi semakin penting untuk ilmiahpeneliti juga untuk
bisnis yang berjalan lancar. Lihat DSS dalam Tindakan 5.47dan Copeland (2001)
untuk bagaimana ini dilakukan. Metode lain, seperti agen cerdas, mungkinjuga
digunakan dalam penambangan cerdas. Lamont (2000) menjelaskan bagaimana
agen cerdas dapat digunakan untuk mengidentifikasi pengetahuan di Web. Boyd
(2001) menjelaskan bagaimana BizWorkspaket perangkat lunak menyediakan
agen cerdas untuk pencarian internal dan Web.

PERANGKAT LUNAK DATA MINING

Perangkat lunak penambangan data memiliki algoritme yang lebih rumit untuk
jaringan saraf,pengelompokan, segmentasi, dan klasifikasi yang umumnya lebih
canggih ituMetode OLAP (lihat Finlay, 2001). Banyak vendor perangkat lunak
menyediakan alat penambangan data yang kuat. Ini termasuk Angoss
Knowledge Engineering (KnowledgeServer /KnowledgeSeeker), Cognos
(berbagai alat), Perangkat Lunak Statistik Cytel (XL Miner,melakukan
penambangan data di Excel), DataMind Corporation (DataMind), IBM
(DB2Intelligent Miner Scoring, IMS), Analis Poli (Megaputer Intelligence Inc.),
dan SAS(berbagai alat). Angoss KnowledgeSeeker bahkan menginduksi aturan
dari data. Iniaturan dapat digunakan dalam sistem pakar. IBM DB2 Intelligent
Miner Scoring (IMS)menyediakan analisis dan penilaian data relasional data
relasional real-time. Ini menggunakan PrediktifModel Markup Language
(PMML) dari grup penambangan data. Perangkat lunak ini membawaproses

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


penambangan data satu langkah lebih dekat ke otomatisasi. Analis Poli
termasuk keduanyapenambangan data cerdas dan metode penambangan teks.
Lihat Buck (2000) untuk daftar penambangan dataperangkat lunak. Beberapa
perusahaan perangkat lunak dapat membuat data mining dan alat OLAP
tersediakepada sarjana universitas secara gratis atau dengan harga sangat
diskon. Periksa individusitus web vendor dan langsung dengan mereka.

5.1 2 VISUALISASI DATA,DIMENSIITAS MULTI,DAN ANALYTIK REAL-TIME

Pengolahan analitik online termasuk tidak hanya memperoleh dan menganalisis


data dan informasitetapi juga menyajikannya kepada pengguna dan
menafsirkannya. Melakukannya melibatkan datavisualisasi,
multidimensionalitas, dan analitik real-time.

VISUALISASI DATA

Teknologi visual membuat gambar bernilai seribu angka, dan dukungan


keputusanaplikasi lebih menarik dan mudah dipahami oleh pengguna.
Visualisasi data mengacu padateknologi yang mendukung visualisasi dan
terkadang interpretasi data dan informasidi beberapa titik di sepanjang rantai
pengolahan data (Gambar 5.6; lihat Fayyad,Grinstein, dan Wierse, 2002). Ini
termasuk gambar digital, sistem informasi geografis,antarmuka pengguna grafis,
multidimensi, tabel dan grafik, realitas virtual, pengolahan analitik online
termasuk tidak hanya memperoleh dan menganalisis data dan informasitetapi
juga menyajikannya kepada pengguna dan menafsirkannya. Melakukannya
melibatkan datavisualisasi, multidimensionalitas, dan analitik real-time.
presentasi tiga dimensi, dan animasi. Alat visual dapat membantu
mengidentifikasi hubunganlangsung. Kemampuan untuk mengidentifikasi tren
penting dalam data perusahaan dan pasarmemberikan banyak keuntungan.
Model prediksi yang lebih akurat memberikan signifikankeuntungan bisnis
dalam aplikasi yang mendorong konten, transaksi, atau proses.Percaya diri,
berdasarkan metode superior analisis data visual, membantu
perusahaanmeningkatkan pendapatan dan menghindari kesalahan yang mahal
(lihat Hallett, 2001). Misalnya, jaringansistem pemantauan terus menjadi
semakin rumit dan canggih.Visualisasi menyederhanakan pelaporan hasil tes.
Consonus (Salt Lake City, Utah)mendesain, membangun, dan mengoperasikan
pusat data, jaringan TI, dan aplikasi yang mendukung Websistem pengiriman.
Consonus menggunakan HP Open View Management Suite untuk membantu
mengelolapusat-pusat data ini. OpenView membantu mengelola sistem dan
penyediaan Web pelangganmereka dengan pemahaman tentang bagaimana
pelanggan melihat kinerja dan ketersediaan situs mereka.Lihat McCarthy (2002)
untuk detailnya.

Visualisasi data memungkinkan OLAP dan penambangan data, terutama


memanfaatkan berbasis Webalat. Daripada harus menunggu laporan atau

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


membandingkan kolom angka yang steril, amanajer dapat menggunakan
antarmuka browser secara real-time untuk melihat kinerja organisasi yang vital
data. Dengan menggunakan teknologi analisis visual, manajer, insinyur, dan
lainnyapara profesional telah menemukan masalah yang selama bertahun-tahun
tidak terdeteksi oleh analisis standarmetode.

Paket perangkat lunak visualisasi menawarkan kemampuan pengguna untuk


eksplorasi yang dipandu sendiridan analisis visual dari sejumlah besar data.
Misalnya, lihat Visualisasi ILOGSuite (www.ilog.com). Beberapa contoh sistem
OLAP dengan visualisasi yang sangat baiktermasuk Visual Insights (Cognos) dan
nVizn (SPSS Inc.). Cognos Visualizer, di antarafitur lainnya, memanfaatkan
tampilan lampu lalu lintas dalam tabel dan grafik. Hasil numerik
adalahditampilkan dalam warna merah / kuning / hijau yang menunjukkan
status mereka. NVizn SPSS adalah berbasis Javaperangkat alat pengembang
untuk membuat aplikasi visualisasi. Lihat Ulfelder (2000b) untukrincian. Lihat
DSS di Fokus 5.48 untuk gagasan tentang visualisasi di bidang Keuangan, dan
DSS dalam Tindakan5.49 untuk bagaimana cepat berkembang. Teknologi
visualisasi dapat diintegrasikan ke ereate presentasi informasi yang berbeda,
terutama dengan virtual reality (VR) metode.Di Bab 4, kami membahas
spreadsheet visual dan simulasi interaktif visual. Datavisualisasi memungkinkan
metode pemecahan masalah ini selain menyediakan grafikfitur untuk OLAP dan
alat penambangan data.

Visualisasi data lebih mudah untuk diterapkan ketika data yang diperlukan
berada dalam datagudang, atau lebih baik lagi di server multidimensi. Harrah's
melakukan persis inimengelola kasinonya. Lihat DSS dalam Tindakan 5,50.
Diskusi kami berfokus terutama padakonsep multidimensionalitas. Di bagian
selanjutnya, kami menyajikan informasi geografissistem, sebuah topik yang
terkait erat dengan visualisasi data.

ARAH BARU DALAM VISUALISASI DATA

Sejak akhir 1990-an, visualisasi data telah beralih ke komputasi mainstream,di


mana ia terintegrasi dengan alat pendukung keputusan dan aplikasi, dan
menjadi cerdasvisualisasi yang meliputi interpretasi data (informasi). Berikut
ini beberapaarea menarik:
• Grafik dan model interaktif yang memungkinkan pengguna menelusuri data
yang mendasarinyamereorganisasi dan membandingkan data sehingga
maknanya lebih jelas. Alat visualisasidapat berguna dalam tiga bidang: (1)
analisis statistik, (2) presentasi grafisalat, dan (3) aplikasi analitik.

• WatchMark Corporation, anak perusahaan Lucent Technologies menggunakan


teknologi canggihalat visualisasi data untuk operator jaringan nirkabel. Pilot
WatchMarkRelease 1.3 menggabungkan video replay engine yang inovatif
dengan kontrol seperti VCR,yang memungkinkan operator jaringan untuk
segera meninjau peristiwa yang terjadi sebelumnyamasalah jaringan, seperti
melihat tayangan ulang langsung dari olahraga televise peristiwa.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


• Comshare Inc. menyediakan Open Viz sehingga pengguna dapat berinteraksi
dengan gambar dan datadalam cara yang berarti. Ini menegaskan kembali
gagasan bahwa solusi visualisasi yang canggihsekarang milik desktop para
profesional bisnis. OpenViz adalah rangkaian darikomponen — mendukung
Microsoft Common Object Model (COM) danModel JavaBean — yang
memungkinkan pengembang TI untuk memperluas komersial dan
dikembangkan khusussolusi intelijen bisnis untuk mencakup visualisasi data
kelas bisnis.

• Identitech Inc. telah mengembangkan Antarmuka Grafis untuk Kognisi


Informasi, aalat visualisasi data yang dirancang untuk mendukung pengambilan
keputusan bisnis. Perangkat lunak inidapat diprogram untuk memetakan data
ke set persegi panjang yang melambangkan warnaberbagai tingkat kondisi,
seperti normal, tinggi, dan rendah.

• Beranalogi dengan spreadsheet visual (Bab 4), Visual Insights ADVIZOR


memungkinkanpengguna untuk menemukan dan memahami pola dan tren yang
tersembunyi dalam data kompleks. Ini menggabungkankemudahan penggunaan,
akses data standar industri, dan kekuatan data interaktifvisualisasi untuk
menciptakan antarmuka pengguna generasi mendatang untuk pengambilan
keputusan bisnis.

• Ada kategori baru yang muncul dari aplikasi visualisasi data


perusahaan,disebut visualisasi on-line untuk suatu perusahaan (OLIVE). Sistem
OLIVE adalahaplikasi grafik-sentris yang memberikan intelijen bisnis visual
kepada perusahaan.Ada 12 atribut yang harus alat aplikasi charting
perusahaanharus memenuhi syarat sebagai alat OLIVE, termasuk (1) bahasa
definisi grafik dan (2)
proses siklus hidup (lihat Craig, 1998).

• Perangkat lunak visual untuk mengurangi penipuan dan mengurangi risiko,


terutama dalam penegakan hukum,merupakan area perkembangan utama.
ChoicePoint (Alpharetta, Georgia,www.choicepoint.net) menyediakan perangkat
lunak dan layanan tersebut. Banyak organisasimengembangkan alat untuk
Departemen Keamanan Dalam Negeri menghasilkan bisnisintelijen spin-off
dalam penegakan hukum. Lihat DSS dalam Tindakan 5.38.

• Perkembangan dalam realitas virtual (VR) memiliki dampak luas dalam bisnis
sepertiserta bidang lainnya. Lihat DSS dalam Tindakan 5.51 untuk beberapa
aplikasi dan perangkat lunak Websampler. Selain itu, perangkat pengembangan
usia ChoicePoint, bentuk prediksivisualisasi, membantu menemukan anak yang
hilang. Pada awal 2003, ChoicePoint punyamembantu memulihkan 782 anak
yang hilang. Lihat situs Web-nya untuk melihat hasilperangkat lunak progresif
usia.

• Di sisi perangkat keras, ada perkembangan baru dalam visualisasi.Beberapa


melibatkan tutup kepala khusus atau kacamata, yang lain menggunakan
proyeksi holografik. Biasanya, ini melibatkan representasi realitas virtual data

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


sebagai lanskap.Lainnya berbasis televisi. Misalnya, Sistem Aktualitas,
Burlington,Massachusetts (www.actuality-systems.com), telah mengembangkan
tiga dimensitampilan untuk televisi. Layar Perspecta berukuran 20 inci (51 cm)
di dalamnyagambar 3-D mana yang mengapung. Pada pertengahan 2003,
sepuluh pajangan telah terjual (dengan harga $ 40.000setiap). NASA
menggunakannya untuk melihat gugus bintang, sementara Angkatan Darat AS
menampilkan medan perangsimulasi. Para ahli bereksperimen dengan tampilan
di area lain,termasuk obat-obatan, energi, dan penelitian perangkat lunak.
Akhirnya perusahaanberencana untuk mengembangkan sistem tampilan yang
menghilangkan bola dunia dan secara wajarharga untuk konsumen umum. Lihat
situs web perusahaan untuk gambar sampel. Jugalihat Copeland (2003).

Vendor OLAP utama menyediakan alat visualisasi tiga dimensi dengan


merekaalat pendukung keputusan. Misalnya, Forest Tree 6.0 adalah alat
pengembangan berbasis Webdengan versi visualisasi tiga dimensi yang
memungkinkan pengguna untuk memvisualisasikan dan dengan
mudahmengelola beberapa dimensi data dalam satu tampilan. Alat visual baru
terus-menerussedang dikembangkan untuk menganalisa kinerja situs web.
EBizinsights XL adalah salah satu alat tersebut.Lihat Bagian 5.14 untuk lebih
lanjut.

MULTIDIMENSITAS

Tabel Spreadsheet memiliki dua dimensi. Informasi dengan tiga atau lebih
dimensidapat disajikan dengan menggunakan satu set tabel dua dimensi atau
tabel yang cukup rumit. Didukungan keputusan, upaya dilakukan untuk
menyederhanakan penyajian informasi dan memungkinkanpengguna dengan
mudah dan cepat mengubah struktur tabel untuk membuatnya lebih
bermakna(mis., dengan membalik kolom dan baris, menggabungkan beberapa
baris dan columnrollup,atau memisahkan satu set baris atau kolom — drill
down).

PRESENTASI MULTIDIMENSI

Data ringkasan dapat diatur dengan berbagai cara untuk analisis dan presentasi.
Efisiencara melakukan ini disebut multidimensional. Keuntungan utama dari
multidimensionalitasadalah bahwa data dapat diatur dengan cara manajer
daripada analis sistem sepertiuntuk melihat mereka. Presentasi yang berbeda
dari data yang sama dapat diatur dengan mudah dan cepat.

Mendasari setiap OLAP (dan data mining) sistem adalah model data konseptual
seringdisebut sebagai model data multidimensi atau pemodelan multidimensi
(MDM).Teknik ini membantu konsep model bisnis sebagai serangkaian tindakan
yang dijelaskan olehaspek-aspek bisnis biasa. Metode ini sangat berguna untuk
menyaring, meringkas,dan mengatur data untuk memudahkan analisis. Berbeda
dengan teknik untuk mendesain secara onlinesistem pemrosesan transaksi,
yang mengandalkan entitas, hubungan, fungsionaldekomposisi, dan analisis
transisi negara, MDM menggunakan konstruksi fakta, dimensi,hierarki, dan

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


sparsity. Memilih alat yang tepat membutuhkan memeriksa kriteriafungsi,
kecocokan, kinerja, skalabilitas, dan penggunaan masa depan. Lihat Raden
(1997).

Tiga faktor yang dipertimbangkan dalam multidimensi: dimensi, ukuran,


danwaktu. Berikut beberapa contohnya:
• Dimensi: produk, wiraniaga, segmen pasar, unit bisnis, geografislokasi, saluran
distribusi, negara, industri
• Ukuran: uang, volume penjualan, jumlah kepala, laba inventaris, aktual vs.
perkiraan
• Waktu: harian, mingguan, bulanan, kuartalan, tahunan.

Seorang manajer mungkin ingin mengetahui penjualan suatu produk di area


geografis tertentu,oleh penjual khusus, selama bulan tertentu, atau dalam
satuan unit. Jawabannyapertanyaan semacam itu dapat disediakan terlepas dari
struktur basis data, tetapi dapat disediakanjauh lebih cepat, dan oleh pengguna,
jika data diatur dalam basis data multidimensiatau jika kueri atau produk
perangkat lunak terkait dirancang untuk multidimensi.Dalam kedua kasus,
pengguna dapat menavigasi melalui banyak dimensi dan tingkat data
melaluitabel atau grafik dan mampu membuat interpretasi cepat, seperti
mengungkap signifikanpenyimpangan atau tren penting.

Multidimensionalitas memiliki beberapa keterbatasan, menurut penelitian


Gartner Grouplaporan (Gray dan Watson, 1998):
• Database multidimensi dapat mengambil penyimpanan komputer yang jauh
lebih banyakruang dari database relasional yang dirangkum.
• Produk multidimensi jauh lebih mahal, berdasarkan persentase, daripada
standarproduk relasional.
• Pemuatan basis data menghabiskan sumber daya dan waktu sistem,
tergantung pada volume datadan jumlah dimensi.
• Antarmuka dan pemeliharaan lebih kompleks daripada di database relasional.
Multidimensionalitas tersedia dalam berbagai tingkat kecanggihan. Jadi
disanaadalah beberapa jenis perangkat lunak dari mana sistem multidimensi
dapat dibangun pada tingkat harga yang berbeda. Multidimensionalitas sangat
penting dalam sistem DSS / BI / BA,termasuk sistem informasi perusahaan
(misalnya, Keputusan Web dari Comshare Inc.,www.comshare.com, dan Pilot
Analysis Server dari Pilot Software Inc.,www.pilotsw.com).

Alat dengan kemampuan multidimensi sering bekerja bersama dengan basis


datasistem kueri dan alat OLAP lainnya. Misalnya, Tampilan Kubus IBM
mengotomatiskanpembuatan metadata OLAP di tingkat basis data sehingga
metadata dapat dibagikandi antara aplikasi yang mengakses database. Tampilan
Kubus menggabungkan data menjadi multidimensionalgrafik, memungkinkan
pengguna untuk mengakses data dari perspektif yang berbeda,
danmengembalikan jawaban atas pertanyaan sebagai layanan Web berbasis
XML. Tampilan Kubus didukung olehbanyak intelijen bisnis, vending, termasuk
Brio Software Inc., Crystal DecisionsInc., Cognos Inc., MicroStrategy Inc.,

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Informatica Corp, InterNetivityDatabeacon(www.internetivity.com), danObjek
Bisnis (www.businessobjects.com).
Untuk contoh perangkat lunak intelijen bisnis yang siap menangani
multidimensionalitas,lihat Callaghan (2003b), Whiting (2001), dan "Tinjauan
Produk Tahunan"masalah DM Review setiap Juli
(www.dmreview.comBusinessObjects S.A. Lihat Callaghan (2003b). Perangkat
Lunak Seagate (bagian dari SeagateTechnology LLC) Crystal Reports membuat
laporan yang mengekstrak dan menganalisis data daridatabase relasional. Ini
adalah bagian dari perangkat lunak Crystal Enterprise untuk
didistribusikanlaporan berdasarkan informasi itu. Crystal Analysis Professional
membangun laporan itu
ekstrak dan analisis data multidimensional dari sistem pemrosesan analitik
online,seperti Hyperion Essbase dan Seagate Holos, serta dari basis data utama,
seperti Microsoft SQL Server 2000, dan IBM DB2 dengan teknologi OLAP built-
in. LihatWhiting (2001). Alat-alat lain termasuk Brio Enterprise
(www.brio.com), PowerPlay(www.cognos.com), dan Data InterNetivity

REAL-TIME ANALYTICS

Sebuah penelitian terbaru menunjukkan bahwa manusia akan mencatat lebih


banyak informasi ditiga tahun ke depan dari sejak fajar peradaban. Kami
membutuhkan metode khusus untukmenyimpan informasi kami dalam banyak
format, dan dengan cepat mengambil dan memanfaatkannya (lihatPallatto,
2002a). Pengguna bisnis semakin menuntut akses ke real-time, tidak
terstruktur,atau data jarak jauh, terintegrasi dengan isi gudang data mereka
(lihat Devlin,2003). Misalnya, bus-bus di Houston, Texas, lebih andal dan efisien
sejak mereka dilengkapi dengan perangkat pengumpulan data seketika
memberikandriver kemampuan untuk mengakses informasi dan mengubah
perubahan lampu lalu lintas (lihat "HoustonBus Karena untuk 'Overhaul
Intelektual,' "ORMS Hari Ini, Juni 2003, hal 19). Dalam banyak kasus,pembaruan
dan akses data real-time sangat penting untuk keberhasilan organisasi. Lihat
DSS diTindakan 5.52 untuk contoh pengumpulan data dan analisis real-time, di
mana mereka harusdilakukan sebagai masalah hidup dan mati.

Data warehousing dan alat-alat intelijen bisnis secara tradisional berfokus pada
bantuanmanajer dalam membuat keputusan strategis dan taktis. Pada tahun
2003, dengan munculnya realtimedata pergudangan, ada awal pergeseran
menuju pemanfaatan teknologi iniuntuk keputusan operasional. Penggunaan
gudang data yang "aktif" ini baru saja dimulaiubah fokus alat-alat ini (lihat Kopi,
2003). Lihat DSS di Focus 5.53 untuk beberaparincian tentang bagaimana
konsep real-time berevolusi. Hewlett-Packard bergerak menuju sebuahStrategi
Adaptive Enterprise untuk menghasilkan komputasi sesuai permintaan (lihat
Follet, 2003).

Kecenderungan untuk perangkat lunak intelijen bisnis yang menghasilkan


pembaruan data secara real-timeanalisis real-time dan pengambilan keputusan
waktu nyata berkembang pesat (lihat Baer, 2002;CIO Insight, 2003; Kopi, 2003;

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Devlin, 2003; Gates, 2002; Langseth dan Vivatrat, 2002;Madsen, 2003; Pallatto,
2002a; Peterson, 2003; Raden, 2003a, 2003b; Barquin, Paller, dan Edelstein,
1997). Bagian dari dorongan ini melibatkan mendapatkan informasi yang tepat
untuk operasionaldan personil taktis sehingga mereka dapat menggunakan alat-
alat intelijen bisnis baru danhasil up-to-the-menit yang mendasari keputusan
mereka, karena karyawan ini pada umumnyaberurusan dengan aspek jangka
pendek menjalankan organisasi (lihat Bab 2 untuk adiskusi tentang model
Anthony).

Sistem analitik terus menjadi lebih cepat, dan banyak permintaan pelanggan
saat inidata. Semakin banyak manajer TI menghadapi pertanyaan mahal apakah
akan diambilsistem analitik real-time (lihat Baer, 2002). Semakin banyak data
pergudangan real-time /proyek analisis sedang dalam pengembangan dan
dikerahkan. Permintaan untuk realtimeaplikasi terus berkembang. Proliferasi
mesin aturan (aturan bisnismanajemen), misalnya, menciptakan tekanan untuk
mengimplementasikan bisnis yang lebih otomatisproses yang terbaik dapat
diimplementasikan dalam gudang data real-time. Ketika prosesyang
membutuhkan pembaruan seketika diperlukan untuk menjawab pertanyaan
analitis, arespon real-time diperlukan. Kueri, OLAP, dan waktu respons
penambangan data harusmendekati nol (lihat Raden, 2003a).

Gudang data real-time diperbarui secara rutin, tidak hanya mingguan


ataubulanan. Pada tahun 2003, pembaruan harian diharapkan; dan intervalnya
terus menyusut. DiSelain kueri real-time, aplikasi analitik bisnis sedang
digunakan. Ituyang terakhir dapat secara instan mengidentifikasi pola
pembelian pelanggan berdasarkan pada display toko,dan merekomendasikan
perubahan langsung pada penempatan atau tampilan itu sendiri. Aplikasi
laintermasuk dukungan call-center, deteksi penipuan, manajemen pendapatan,
transportasi,dan banyak transaksi keuangan. Jelas maskapai penerbangan,
jaringan hotel, agen penyewaan mobil,dan bahkan organisasi ritel dalam upaya
manajemen pendapatan mereka dapat memperbaruikurva elastisitas
penawaran-dan-permintaan untuk secara dinamis menetapkan harga produk
dan layanan mereka(lihat Bab 2 dan 4).

Di sisi lain, masalah penting dalam komputasi real-time adalah tidak semua data
harus diperbarui terus menerus. Ini tentu saja dapat menyebabkan masalah
ketika laporandihasilkan dalam waktu nyata, karena hasil satu orang mungkin
tidak cocok dengan orang lain. SEBUAHperusahaan menggunakan
BusinessObjects Weblntelligence memperhatikan masalah yang signifikan
dengankecerdasan real-time. Laporan real-time semuanya berbeda ketika
diproduksi dengan sedikit berbedakali (lihat Peterson, 2003). Juga, mungkin
tidak perlu memperbarui data tertentuterus menerus, seperti nilai kelas tiga
atau lebih tahun yang lalu.Persyaratan real-time mengubah cara kita melihat
desain database, datagudang, OLAP, dan alat penambangan data, karena mereka
secara harfiah diperbarui secara bersamaan saat kueri aktif. Di sisi lain, nilai
bisnis yang substansial dalam melakukannyatelah ditunjukkan, sehingga sangat
penting bahwa organisasi mengadopsi metode ini di merekaproses bisnis. Lihat
DSS di Fokus 5.54.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


Contoh perangkat lunak intelijen bisnis real-time berbasis WebBusinessObjects
Weblntelligence, Cognos Supply Chain Analytics dan BI Series 7,DataMirror
Livebusiness, IBM DB2 Intelligent Miner Scoring (IMS), InformaticaPlatform
Penyampaian Analytics, Informatica PowerAnalyzer, InterNetivity
Databeacon,KnowNow LiveSheet untuk Excel, NetlQ Corp WebTrends,
PeopleSoft Enterprise Manajemen Kinerja, SAS Supply Chain Intelligence Suite
(SAS), dan SonicPerangkat Lunak SonicMQ. Untuk ulasan, lihat Havenstein
(2003b), Lindquist (2003), danWallace (2000).

5.1 3 GEOGRAPHIC INFORMATION SYSTEMS

Sistem informasi geografis (GIS) adalah sistem berbasis komputer untuk


menangkap, menyimpan, memeriksa, mengintegrasikan, memanipulasi, dan
menampilkan data dengan peta digital. Nya karakteristik yang paling
membedakan adalah bahwa setiap catatan atau objek digital telah diidentifikasi
lokasi geografis. Dengan mengintegrasikan peta dengan berorientasi spasial
(lokasi geografis)database (disebut geocoding) dan basis data lainnya, pengguna
dapat menghasilkan informasi untuk perencanaan, pemecahan masalah, dan
pengambilan keputusan, sehingga meningkatkan produktivitas mereka dan
kualitas keputusan mereka, karena banyak bank dan pengecer besar telah
melakukannya. Area beragam seperti ritel, perbankan, grosir, pertanian,
pengelolaan sumber daya alam, administrasi publik, NASA, militer,
kesiapsiagaan darurat, dan perencanaan kotasemuanya telah berhasil
menggunakan SIG sejak awal tahun 1970-an.

Data spasial menjadi sangat penting bagi banyak organisasi. Mereka barudasar
untuk mengelola infrastruktur. Sebagai alat GIS dan sumber data menjadi
semakin canggih dan terjangkau, mereka membantu lebih banyak perusahaan
dan pemerintah untuk memahami dengan tepat di mana truk, pekerja, dan
sumber daya mereka berada, di mana mereka harus pergi melayani pelanggan,
dan cara terbaik untuk pergi dari sini ke sana. Daerahpemasaran yang
ditargetkan tumbuh pesat. Organisasi dapat dengan mudah menyegmentasikan
populasi. Misalnya, Credit Union of Texas (Dallas, Texas) menggunakan SIG
untuk membantu putuskan di mana menempatkan billboard dan ATM, dan
untuk membantu mengidentifikasi area yang paling responsive untuk
mengarahkan pengiriman. Tingkat respons umum untuk serikat kredit adalah 5
hingga 10 persen, jauh lebih baik daripada rata-rata 1 hingga 2 persen.
Pelanggan juga menikmati menerima lebih sedikit surat dari credit union.
Mereka hanya menerima surat yang relevan. Lihat Franklin (2002) untuk
detailnya. Lihat DSS dalam Tindakan 5.55 untuk beberapa contoh penting.

Bank menggunakan GIS untuk display yang mendukung


• Menentukan lokasi cabang dan ATM
• Menganalisis demografi pelanggan (misalnya, tempat tinggal, usia, tingkat
pendapatan) untuk masing-masing produk bank

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


• Menganalisis volume dan pola lalu lintas kegiatan bisnis
• Menganalisis area geografis yang dilayani oleh masing-masing cabang
• Menemukan potensi pasar untuk kegiatan perbankan
• Mengevaluasi kekuatan dan kelemahan terhadap mereka yang berkompetisi
• Mengevaluasi kinerja cabang.

SIG digunakan sebagai spreadsheet geografis yang memungkinkan manajer


untuk memodelkan bisnis aktivitas dan melakukan analisis apa-jika (mis.,
Bagaimana jika kita menutup cabang atau menggabungkan cabang? Bagaimana
jika pesaing membuka cabang?). Setiap peta mengkonsolidasikan halaman dari
analisis. Beberapa bank perintis di First Florida Banks (Tampa, Florida) dan NJ B
Keuangan (Princeton, New Jersey).

Bagi perusahaan-perusahaan laki-laki, organisasi cerdas di dalam suatu SIG


dapat menyediakan kerangka kerja untuk mendukung proses pengambilan
keputusan dan merancang alternative strategi. Beberapa contoh aplikasi SIG
yang berhasil dirangkum dalam Tabel 5.8.Perusahaan terkemuka
menggabungkan sistem informasi geografis ke dalam bisnis mereka sistem
intelijen. GIS idealnya menggabungkan data sensus (lihat www.census.gov)
sebagai sebuah sumber data demografis untuk pengambilan keputusan yang
efektif (lihat Gimes, 2001). Untuk banyak organisasi, GIS dan analisis spasial
terkait adalah untuk prioritas. Sears menginvestasikan beberapa juta dolar
dalam teknologi GIS untuk logistik yang mengarah ke penghematan $ 52 juta per
tahun (lihat Gonzales, 2003). Departemen Pertahanan AS telah
menginvestasikan sekitar $ 21 miliar dalam sistem Satelit yang memberi umpan
sistem posisi Geofisika (GPS). Perangkat GPS mendeteksi posisi mereka di bumi
dengan presisi yang masuk akal untuk memasangkan perangkat ini dengan
perangkat lunak pemetaan. GPS bersama dengan SIG sedang membuat
terobosan besar aplikasi intelijen bisnis. Penggunaan komersial dan pemerintah
tidak terbatas, karena perangkat deteksi relatif tidak mahal. Lihat DS S in Action
5.55 dan DSS in Action 5.56 untuk contoh bagaimana teknologi ini telah
digunakan dan mungkin bisa bekas.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


GIS DAN WEB / INTERNET / INTRANET

Sebagian besar vendor perangkat lunak GIS menyediakan akses Web, seperti
browser yang disematkan, atau a Web / Internet / server intranet yang
menghubungkan langsung ke perangkat lunak mereka. Dengan demikian,
pengguna dapat mengakses peta dan data dinamis melalui Internet atau intranet
perusahaan. Layanan Web GIS adalah berkembang biak. Sistem geografis ini
membentuk infrastruktur global yang kaya informasi yang menambah dimensi
baru bagi industri GIS dengan mengintegrasikan berbagai layanan aplikasi.
Layanan Web GIS merevolusi cara perusahaan menggunakan dan berinteraksi
dengan informasi geospasial. Misalnya, GIS dapat membantu manajer ritel
operasi menentukan tempat membuka toko yang terletak di persimpangan kota
besar, dalam a 15 menit berkendara dari jalan keluar jalan bebas hambatan,
dikelilingi oleh lingkungan kelas menengah dengan keluarga profesional. Lihat
Gonzales (2003). Big Horn Computer Services (Buffalo, New York)
menggunakan GIS yang diadaptasi oleh Web untuk mengembangkan aplikasi
khusus untuk televisi nasional jaringan yang menginginkan stasiun afiliasinya
untuk dapat mengakses intranet yang berisi informasi demografis tentang

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


pemirsa mereka. Menggunakan browser Web, karyawan di setiap stasiun dapat
melihat peta teduh tematik yang menganalisis pasar mereka.

Sejumlah perusahaan menyebarkan GIS di Internet untuk penggunaan internal


atau untuk digunakan oleh pelanggan mereka. Misalnya, Visa Plus, yang
mengoperasikan jaringan teller otomatis mesin, telah mengembangkan aplikasi
GIS yang memungkinkan pengguna Internet memanggil peta Temukan salah
satu dari 257.000 mesin ATM perusahaan di seluruh dunia. Sebagai server Web
GIS perangkat lunak digunakan oleh vendor, lebih banyak aplikasi akan
dikembangkan. Peta, data GIS, dan informasi tentang GIS tersedia melalui Web
melalui sejumlah vendor dan agensi publik. Terkait dengan ini adalah
dimasukkannya data spasial di gudang data, untuk digunakan nanti dengan
teknologi Web.

Beberapa perangkat lunak GIS yang penting adalah ArcView dan Arclnfo (ESRI),
AGISMap (AGIS), GeoMedia (Intergraph), dan Maplnfo Professional (Maplnfo).
Arclnfo (www.esri.com/arcinfo8/) memberi sebuah mode l menyediakan alat-
alat untuk memodelkan sistem spasial yang kompleks tanpa pemrograman.
Culpepper (2002) menjelaskan bagaimana CommunityViz
(www.communityviz.com) perangkat lunak mengintegrasikan simulasi dan
pemodelan perencanaan kota fungsionalitas ke perangkat lunak ESIS ArcView
GIS. Pengguna dapat mengatur dan menjalankan skenario yang berbeda,
berdasarkan variabies dan batasan yang ditentukan pengguna, untuk
menentukan hubungan di antara proyek kota dan indikator sosial, lingkungan,
atau ekonomi. Seluruh set kebijakan dapat diuji.

Tren saat ini untuk GIS sebagai alat pendukung keputusan / intelijen bisnis
melibatkan melanjutkan kombinasi atau integrasi GIS dengan yang lain,
terutama berbasis Web, pendukung keputusan / alat intelijen bisnis, seperti
gudang data, ERP, kolaborasi alat, dan aplikasi produktivitas pribadi. Data GIS
dapat diintegrasikan ke lainnya sistem melalui XML melalui Geografi Markup
Language (GML) (lihat Lais. 2000). Satu area penting yang telah berhasil
diintegrasikan GIS adalah CR M (lihat Dragoon, 2003a; Winslow dan Lea, 2002;
Sonnen, 1999; dan DSS dalam Tindakan 5.55). Untuk keterangan lebih lanjut
tentang GIS. GPS, dan Web, lihat Dragoon (2003a), Duff y (2002), Hapgood
(2001), Korte (2001), Kowal (2002), Lais (2000,2001), Leatham (2000), Harga
dan Schweitzer (2002), dan Winslow dan Lea (2002).

5.14 KECERDASAN BISNIS DAN WEB: WEB INTELLIGENCE / WEB ANALYTICS

KECERDASAN BISNIS

Kegiatan intelijen bisnis - dari akuisisi data, melalui pergudangan, hingga


penambangan – dapat dilakukan dengan alat Web atau terkait dengan teknologi
Web dan perdagangan elektronik. Secara khusus, alat intelijen bisnis dapat
digunakan untuk menganalisis Web kinerja situs secara real-time. Pengguna
dengan browser dapat masuk ke sistem, membuat pertanyaan, dapatkan

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


laporan, dan sebagainya, dalam pengaturan real-time. Ini dilakukan melalui
intranet, dan untuk orang luar melalui ekstranet (lihat
www.informationadvantage.com; juga, untuk diskusi yang komprehensif
intelijen bisnis di Web, lihat kertas putih di businessobjects.com).

Sebuah survei IDC tahun 2001 terhadap 500 manajer TI mengindikasikan


bahwa 20 persen organisasi memiliki 500 atau lebih karyawan yang
menghubungkan kegiatan intelijen bisnis mereka dengan Internet (lihat Kudyba,
2002; Dash, 2001). Pengguna pasti ingin meningkatkan aplikasi intelijen bisnis
di dan ke Web. Jumlah organisasi yang mengenali pentingnya melakukannya
terus berkembang.

Vendor perangkat lunak perdagangan elektronik menyediakan alat-alat Web


yang menghubungkan gudang data dengan pemesanan e-commerce dan sistem
katalogisasi. Salah satu contohnya adalahTradelink. produk dari Hitachi
(www.hitaci.com). Paket alat e-commerce Hitachi menggabungkan aktivitas e-
commerce, seperti manajemen katalog, aplikasi pembayaran, kustomisasi
massal, dan manajemen pesanan, dengan gudang data (marts) dan ERP sistem.
Aplikasi Perkara 5.2 menunjukkan bagaimana sebuah perusahaan menyediakan
layanan mandiri berbasis Web sistem sehingga pelanggan pengguna akhir dapat
menangani akun manfaat mereka sendiri.

Vendor data dan vendor pendukung keputusan mengintegrasikan produk


mereka dengan Teknologi web dan e-commerce, atau membuat yang baru untuk
tujuan yang sama. Contohnya adalah Comitel's Decision Web, Brio eWarehouse
(www.brio.com), Web Intelijen dari Objek Bisnis, DataMerchant Cognos. dan
Hyperion Produk Appsource "wired for OLAP", yang mengintegrasikan OLA P
dengan alat-alat Web. Pilot Penerbit Internet menggabungkan kemampuan
Internet dalam Dukungan Keputusan Percontohan Rangkaian. IBM Decision
Edge dan MicroStrategy DSS Web adalah alat lain yang ditawarkan Kemampuan
OLA P di Intranet dari mana saja di perusahaan, menggunakan browser, mesin
pencari, dan teknologi Web lainnya. MicroStrategy menawarkan DSS Agent dan
DSS Web untuk bantuan dalam mengebor untuk informasi rinci, memberikan
tampilan grafis, mendorong informasi ke desktop pengguna, dan lainnya.
Membawa pertanyaan interaktif, pelaporan, dan tugas OLA P yang lain kepada
pengguna pria (karyawan perusahaan dan mitra bisnis) melalui Web juga dapat
difasilitasi dengan menggunakan Oracle Financial Analyzer dan Sales Analyzer,
Hummingbird Bl / Web dan BI / Broker, dan beberapa produk yang disebutkan
di atas.

Mart data terus menjadi jauh lebih populer di lingkungan Web. Untuk Sebagai
contoh, Bell Canad menggunakan intranetnya secara ekstensif untuk akses data
yang cepat ke multipelnya data mart (lebih dari 300 analis; lihat PCWeek, 28 Juli
1997), dan di Nabisco, yang besar perusahaan, analis keuangan melacak
keuntungan dan kerugian dari 8000 produk menggunakan Browser web,
menghemat jutaan dolar (InfoWorld, Sept. 28,1998).

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


WEB ANALYTICS / WEB INTELLIGENCE

Analisis Web dan kecerdasan Web adalah istilah yang digunakan untuk
mendeskripsikan aplikasi business analytics / business intelligence to We b
sites. Alat dan metode sangat tinggi bersifat visual (lihat Bagian 5.12). Schlegel
(2003) menjelaskan dasar-dasar analisis Web, dan bahkan menyediakan
arsitektur analisis clickstream yang diusulkan. Dengan meningkatnya operasi
clickstream, jumlah data yang akan diproses akan meningkat secara
eksponensial, dan skalabilitas masalah akan menjadi penting untuk kecerdasan
Web / analisis Web. Lihat DSS di Fokus 5.57 dan Bagian 5.7. Werner dan
Abramson (2001) menjelaskan suatu metode (berdasarkan penyortiran dan
agregasi) untuk memproses satu miliar catatan sehari untuk gudang data Web.
Lihat juga Hayes (2001) dan Ruber (2003) untuk informasi tentang analisis
clickstream Web. Langseth dan Vivatrat (2002) membahas mengapa proaktif,
kecerdasan bisnis berbasis web adalah ciri dari perusahaan real-time. Sodhi dan
Aichlmayr (2001) mendiskusikan bagaimana dan mengapa kita harus
menanamkan model analitik spesifik dalam alat penambangan data berbasis
Web. Lihat DSS dalam Tindakan 5.58 untuk informasi, dengan contoh, tentang
bagaimana Kami analytics digunakan dalam praktik.

Informatica Corp telah berfokus pada penggunaan Web untuk memungkinkan


organisasi melacak kinerja bisnis. Menggunakan intelijen bisnis Informatica
Enterprise platform, organisasi mengumpulkan metrik kinerja bisnis melalui
sistem voic, the Web, dan transmisi nirkabel. Platform Pengiriman Informatica
Analytics adalah sebuah Sistem berbasis internet yang memberikan hasil kinerja
bisnis real-time.

Perangkat intelijen bisnis WebTrends Netl Q Corp berfokus pada analisis real-
time Kami lalu lintas dan transaksi online. WebTrends memungkinkan
organisasi untuk melacak tren pembelian konsumen, pendapatan, dan
keefektifan kampanye iklan atau promosi penjualan, melalui jutaan kunjungan
situs setiap hari. Site59.com Inc., situs perjalanan yang berspesialisasi di paket
liburan terakhir, ditemukan melalui analisis WebTrends Live bahwa pengunjung
tidak dapat dengan mudah menemukan semua paket perjalanan yang tersedia di
situs. Itu Analisis menunjukkan bagaimana merampingkan dan meningkatkan
desain. Sejak itu, Site59.com telah mengalami peningkatan jumlah pengunjung
dan proporsi mereka yang melakukan pembelian online (lihat Pallatto, 2002a,
2002b).

EBizinsights XL dari Visual Insights (www.visualinsights.com) memungkinkan


visualisasi Analisis performansi situs web. Graphi c di alam, dan
diimplementasikan pada sistem OLA P, EBizinsights termasuk Portal Visual
untuk memungkinkan pengguna untuk memilih dan menyesuaikan tampilan
sekitar 200 laporan grafis ("wawasan"). Analisis Jalur Visual ditampilkan secara
grafis jalur yang diikuti pengguna melalui situs Web. EBizinsights dan alat-alat
serupa sangat penting dalam mengevaluasi efektivitas dan desain situs Kami.
Lihat www.visualinsights.com dan Anonymou (2002) untuk detailnya. Angoss
KnowledgeWeb adalah contoh lain dari

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.


alat penambangan / analitik Web. Lihat Hallett (2001) untuk lebih lanjut
tentang visualisasi analisis Web alat. Lihat DSS di Fokus 5.59 untuk contoh paket
perangkat lunak yang mendukung analitik Web. Lihat Gambar 5.13 untuk
screenshot contoh.

1* Diubah dari Situs Strategi Nasional untuk Keamanan Dalam Negeri,www.whitehouse.gov/homeland/book/index.html.

You might also like