You are on page 1of 12

Skladišta

podataka
29 Mladen Varga

29.1. Skladištenje podataka


29.2. Dimenzijska baza podataka
29.3. Obrada dimenzijskih podataka
29.4. Oblikovanje skladišta podataka

Skladištenje podataka usmjereno je na pravovremeno dobivanje relevantnih


informacija potrebnih u postupcima odluèivanja. Ono donosi nove ideje aktivnog
pronalaženja i nuðenja informacija menadžerima, koristeæi postupke analitièke
obrade podataka i otkrivanja znanja iz podataka. Za pohranjivanje podataka
koristi se dimenzijska struktura podataka ugraðena kroz dimenzijsku bazu
podataka. U ovom æemo poglavlju razmotriti i operacije specifiène za dimenzijske
baze podataka i naèin njezinog oblikovanja.

29.1. Skladištenje podataka


Na tržištu koje se globalizira vlada sve veæa konkurencija. Istodobno su kupci sve
izbirljiviji. To tjera proizvoðaèe da stalno provjeravaju svoju konkurentnost na tržištu i
da pronalaze uspješnu poslovnu strategiju. Stratešku prednost pred konkurentima
nastoje ostvariti ispravnim planiranjem tržišta, inovacijama proizvoda, ispravnim
odnosima s kupcima, odnosno klijentima. Pritom je neophodno da posjeduju pravo-
vremene i relevantne informacije o svim aspektima poslovanja i situaciji na tržištu.
Skladištenje podataka je važan koncept uèinkovitog sustava potpore odluèivanju,
koji se intenzivno razvija posljednjih godina. Donosi ideju aktivnog pronalaženja i
nuðenja informacija menadžeru, potrebnih u procesu odluèivanja. Koristi se
postupcima analitièke obrade, rudarenje podataka i otkrivanja znanja iz podataka.
Spomenutim se konceptima i metodama na temeljima informacijske tehnologije želi
postiæi "inteligentno" poslovanje poduzeæa u kompleksnim tržišnim uvjetima. Za to
se veæ uvriježio naziv poslovna inteligencija. U doba internetske ekonomije
poslovna inteligencija poèiva na podacima, koji se transformiraju u informacije
potrebne za odluèivanje i upravljanje.
Poduzeæe koje analizira ponašanje svojih kupaca ponaša se "inteligentno". Ono npr.
ima sve potrebne podatke o kupcu te u bazi podataka bilježi svaku aktivnost koja je
400 II. INFORMACIJSKA TEHNOLOGIJA

s njim povezana. Analizom tih podataka, npr. analizom što je i kada kupac kupio,
koliko je reklamacija i na koje proizvode imao, izraðuje profil kupca ili ga svrstava
u neku kategoriju. Daljnje akcije prema kupcu usmjerava temeljem nalaza analize.
To npr. može biti nuðenje novog proizvoda specijalno krojenog za potrebe jednog
kupca ili skupine kupaca. Kriterije za grupiranje kupaca u skupine pronalazi
analizom razlièitih varijabli poslovanja. Analize tržišta radi uèestalo, a na promijenjene
okolnosti reagira promptno. Radi na tome da analizom podataka vlastitog poslovanja
i vanjskih èimbenika dobije informacije koje koristi u donošenju optimalnih
poslovnih odluka i na kraju ostvari profit i osigura daljnju egzistenciju.

Skladište podataka
Skladište podataka (engl. data warehouse) skup je podataka organizacije na kojem se
temelji sustav potpore odluèivanju. Iz svrhe proizlazi da skladište podataka treba
podacima potpuno "pokriti" jedno ili više poslovnih podruèja (npr. nabave, prodaje),
da podaci u skladištu trebaju biti sveobuhvatni, tj. "integrirani" od unutarnjih
podataka organizacije, ali i podataka iz njenog okruženja. Podaci moraju obuhvatiti
duži vremenski period (pet, deset ili više godina), jer su vremenske analize poslovno
vrlo znaèajne. Orijentiranost prema poslovnim analizama ne zahtijeva od skladišta
da se podaci promptno ažuriraju kao u bazi podataka (Inmon, 1992).
Manje skladište podataka koje obuhvaæa podatke samo jednog poslovnog podruèja
naziva se podruènim skladištem podataka (engl. data mart).
Skladište podataka namijenjeno je menadžerima, ali i svima koji u svom poslu
obavljaju razlièite analitièke zadatke, kao što su poslovi praæenja i izvještavanja,
koji se temelje na primjeni razlièitih poslovnih pravila, a obavljaju se postavljanjem
usmjerenih upita i analizom dobivenih rezultata; poslovi analize i dijagnosticiranja,
koji se temelje na umješnosti, a obavljaju se iterativnim pronalaženjem i analizom
dobivenih informacija; i poslovi planiranja i simulacije, koji se temelje na znanju, a
obavljaju se modeliranjem i izvršenjem izraðenog modela.

Zašto skladište i baza podataka


U prethodnom smo poglavlju vidjeli da baza podataka u transakcijskom dijelu
informacijskog sustava pohranjuje transakcijske podatke nastale pri obavljanju
poslovnog procesa. U bazi podataka podaci su strukturirani tako da uèinkovito
poslužuju transakcijsku obradu. Nakon obavljene obrade transakcijski su podaci
potrebni još samo za izradu izvještaja u okviru upravljaèkog izvještajnog sustava.
Nakon toga transakcijski se podaci sve rjeðe koriste, te se konaèno arhiviraju na
arhivskim medijima. Meðutim, što se dogaða kad menadžer promptno treba
specifièan izvještaj za analizu podataka? Ako on nije predviðen u izvještajnom
sustavu, treba ga programirati. To u kratkom vremenu vjerojatno nije izvedivo, pa
æe menadžer lako ostati bez potrebne analize.
29. Skladišta podataka 401

Rješenje je u izgradnji sustava za potporu odluèivanju opremljenog programskim


alatima za brzu i jednostavnu analitièku obradu podataka. Analitièka se obrada
podataka organizira u zasebnoj bazi podataka nazvanoj skladištem podataka.
Zbog analitièke je obrade struktura podataka u skladištu podataka dimenzijski
organizirana i razlikuje se od strukture istih podataka u transakcijskoj bazi podataka.
Poslovne su analize èesto vremenski orijentirane (npr. analizira se kretanje cijena po
mjesecima) pa skladište podataka treba imati podatke za duži poslovni period nego
transakcijska baza podataka. Skladište podataka stoga sadrži vremenski niz podataka
(Šošiæ i Serdar, 2000).
Odvajanjem baze i skladišta podataka, u bazi podataka zadržava se uèinkovitost
transakcijske obrade, a u skladištu podataka ostvaruje moguænost dobre analitièke
obrade. Meðutim, danas je, uz korištenje jaèih sustava za upravljanje bazom
podataka, moguæe transakcijske podatke baze podataka i analitièke podatke
skladišta podataka držati u jednoj fizièkoj bazi podataka. U takvoj su bazi podataka
transakcijski i analitièki podaci razdvojeni, a sustav za upravljanje bazom podataka
sposoban je istovremeno izvršavati transakcijske i analitièke obrade podataka.
Sl. 29.1. prikazuje odnos podataka transakcijskog sustava i sustava za potporu
odluèivanju. Podaci poslovnog procesa prikupljaju se raznim transakcijama sustava
za obradu transakcija (npr. raèunima, narudžbama, ponudama ...). Oni ulaze u bazu
podataka, te èine unutarnje (operativne) podatke. Obradom tih podataka nastaju
podaci za upravljanje poslovnim procesom. Istovremeno, unutarnji se podaci prenose
u skladište podataka i s vremenom postaju povijesnim podacima, jer opisuju pojave
poslovnog procesa iz prethodnih razdoblja. Za odluèivanje, pogotovo strateško, važni

Sl. 29.1. Veze sustava za obradu transakcija i sustava potpore odluèivanju


ostvaruju se transformacijom operativnih podataka iz baze podataka
u povijesne podatke u skladištu podataka
402 II. INFORMACIJSKA TEHNOLOGIJA

su vanjski podaci iz okruženja poduzeæa (npr. stanje tržišta, podaci konkurentnih


poduzeæa, stanja na burzama itd.) te je i njih potrebno staviti u skladište podataka.
Kao što se sustavi za obradu transakcija izgraðuju da bi skratili ciklus odvijanja
poslovnog procesa, tako se sustavi za potporu odluèivanju izgraðuju da bi skratiti
ciklus donošenja odluka. Informacijska infrastruktura, koja ukljuèuje sustav za
obradu transakcija i pogotovo sustav za potporu odluèivanju, omoguæuje smanjenje
broja razina odluèivanja, posebno smanjujuæi broj menadžera na taktièkoj razini.
Za izradu uspješnog skladišta podataka potrebno je posvetiti pozornost dvama
izvorima podataka - izvoru unutarnjih i izvoru vanjskih podataka. Unutarnji podaci
pripadaju poduzeæu i generirani su u sustavu za obradu transakcija. Ti podaci
opisuju aktivnosti koje se odvijaju unutar poduzeæa. U tipiènom se poduzeæu može
prepoznati nekoliko desetaka transakcijskih aplikacija ili podsustava: financijski
podsustavi (npr. glavna knjiga), logistièki podsustavi (planiranje materijala, nabava,
transport, distribucija itd.), podsustavi prodaje, podsustavi proizvodnje (upravljanje
i kontrola proizvodnje, praæenje radnih naloga, praæenje projekata, upravljanje
kvalitetom, proizvodnja podržana raèunalom itd.) itd.
Vanjski podaci opisuju aktivnosti koje se odvijaju izvan poduzeæa. Oni se pribavljaju
izvan poduzeæa posredstvom specijaliziranih institucija koje se bave prikupljanjem i
distribucijom informacija. Vanjski su podaci od velike važnosti za strateško odluèi-
vanje, jer preko njih poduzeæe uoèava povoljne prilike, ali i prijetnje. Vanjski podaci
su, npr., podaci o konkurentnosti (proizvodi, usluge, promjene konkurentnih
poduzeæa), ekonomski podaci (fluktuacija valuta, politièki indikatori, kretanja
kamata, burzovni podaci), strukovni podaci (tehnološki trendovi, marketinški
trendovi), financijski podaci, robni podaci (cijene sirovina), marketinški podaci, itd.
Uspješno izgraðeno skladište podataka može podacima "integrirati" poduzeæe.
Naime, dok su transakcijske obrade orijentirane na zadovoljavanje pojedinih
poslovnih funkcija poduzeæa (npr. prodaje sa stanovišta odjela prodaje), analitièke su
obrade orijentirane na razmatranje poslovnih procesa u cjelini (npr. procesa prodaje s
gledišta èitavog poduzeæa: od promidžbe, nabave, proizvodnje, prodaje do naplate).
Skladište podataka, dakle, može pomoæi da se poslovanje promatra procesno na
razini poduzeæa, a ne partikularno kroz pojedine funkcije poduzeæa. Praksa pokazuje
da procesno organizirana poduzeæa uspješnije izgraðuju skladišta podataka.

29.2. Dimenzijska baza podataka


Ljudi intuitivno promatraju poslovne pojave "dimenzijski". U menadžerskom
zahtjevu "zanima me prodaja proizvoda po tržištima i mjesecima (vremenu)" prepo-
znajemo dimenzije proizvoda, tržišta i vremena, kroz koje se prati prodaja. Sl. 29.2.
prikazuje podatke prodaje dimenzijski prikazane u obliku kocke. Svaka dimenzija
kocke odnosi se na jedno obilježje poslovne pojave. U prikazanom sluèaju radi se o
29. Skladišta podataka 403

tržištu, proizvodu i vremenu. Jedna æelija (kockica) odgovara jednom elementu


svake dimenzije i sadrži vrijednosti prodaje (npr. broj prodanih jedinica, novèani
iznos prodaje) za npr. proizvod VW, tržište Osijek i vrijeme 03/2004. Neke su
kockice prazne, jer za dotiène proizvode na tim tržištima u tim mjesecima nije
ostvarena prodaja.

Sl. 29.2. Dimenzijska struktura vizualno je prihvatljiva: tri dimenzije


prikazane su u obliku kocke

Ako se radi o više od tri dimenzije; radi se o hiperkocki koju je teško vizualizirati.
Dimenzija je obilježje (u statistici se naziva varijablom) kroz koju se prati poslovanje.
U našem primjeru dimenzije su tržište, proizvod i vrijeme. Elementi dimenzije su
pozicije ili èlanovi (u statistici su to modaliteti varijable). Pozicije dimenzije vrijeme
su npr. mjeseci 03/2004, 04/2004, 05/2004, a pozicije dimenzije tržište Osijek,
Valpovo, D. Miholjac, …, Zagreb. Dimenzije pripadaju kategorijalnim (kvalitativ-
nim) obilježjima, jer njihovi podaci, tj. elementi dimenzija pripadaju nominalnoj ili
ordinalnoj skali (Šošiæ i Serdar, 2000). Dimenzija tržište kategorizirana je po
gradovima koji èine osnovne pozicije dimenzije (pozicije razine 0). Osnovne se
pozicije, gdje je prikladno, mogu kategorizirati u nadreðene pozicije razine 1.
Gradovi, npr. Osijek, Valpovo i D. Miholjac kategorizirani su u poziciju Osjeèko
podruèje, razine 1. Skupina podruèja dalje je kategorizirana u nadreðenu poziciju
regije, Sjever. Sl. 29.3. prikazuje hijerarhijsku ureðenost pozicija dimenzije tržište.

Sl. 29.3. Hijerarhijsko ureðenje dimenzije "tržište" po regijama,


podruèjima i gradovima
404 II. INFORMACIJSKA TEHNOLOGIJA

Hijerarhijsko ureðenje omoguæuje da se u okviru jedne dimenzije pojava prati


detaljizirano (analitièki) ili agregirano (sintetièki). U spomenutom primjeru prodaja
se može pratiti kroz dimenziju tržište detaljizirano po gradovima, djelomièno
agregirano po podruèjima i potpuno agregirano po regijama. Analizu prodaje
prikladno je zapoèeti s razine agregiranih pozicija, a zatim se spuštati na niže razine.
Ovaj postupak silaženja u podruèje detaljnih podataka (detaljiziranje) naziva se i
"svrdlanje prema dolje" (engl. drill down). Obrnut postupak (agregiranje) je
"svrdlanje prema gore" (engl. drill up).
Vrijednost ili mjera (engl. fact, measure) je kvantitativno obilježje èiji podaci
pripadaju intervalnoj ili omjernoj skali (numerièko, diskretno ili kontinuirano
obilježje). Broj prodanih primjeraka i iznos prodaje primjeri su dviju mjera. Podaci
mjera su zbrojivi, jer se mogu zbrajati (npr. iznos prodaje po danima može se zbrojiti
tako da se dobije iznos prodaje u jednom mjesecu). Meðutim, to ne vrijedi za
dimenzijska obilježja, jer se dimenzijski podaci ne mogu zbrajati (npr. ne mogu se
zbrojiti mjeseci 03/2004 i 04/2004, jer to nema smisla).
Dimenzijski je prikaz podataka u mnogim primjenama "vizualniji" od tabliènog, jer se
tako prikazani podaci lakše interpretiraju. Na lijevoj je strani sl. 29.4. prikazan
uobièajen tablièni prikaz, a na desnoj dvodimenzijski prikaz podataka prodaje
proizvoda (zbog dvije dimenzije vrlo slièan obiènom tabliènom). U obiènom tabliènom
prikazu u trima stupcima vidimo podatke proizvoda, vremena i kolièine prodanih
primjeraka. Ako nas zanima odnos prodaje proizvoda po mjesecima, bit æe prikladniji
dimenzijski prikaz u kojem prvu dimenziju èini proizvod, drugu vrijeme, a kolièina
prodanih primjeraka zapisana je u presjecištu dimenzija. U dimenzijskom prikazu
promatramo dakle i odnos podataka dviju dimenzija proizvod i vrijeme (prodaja je
vrijednost, odnosno mjera), dok se u tabliènom prikazu taj odnos ne promatra.

Sl. 29.4. Za ovaj je problem dimenzijski prikaz na desnoj strani slike


èitljiviji od tabliènog na lijevoj strani

Dimenzijski prikaz dvaju obilježja u statistici je poznat kao kontingencijska tablica.


U statistièkoj analizi definirano je više mjera asocijacije obilježja (Šošiæ i Serdar,
2000). Zakljuèujemo da je dimenzijski prikaz pogodniji kada nas zanima i meðuodnos
"dimenzijskih" obilježja, dok je obièan tablièni prikaz pogodan kad nas taj odnos ne
zanima. Što je veæi broj unutarnjih meðuodnosa meðu obilježjima, to je veæa
29. Skladišta podataka 405

vjerojatnost da æe njihova dimenzijska analiza rezultirati vrijednim poslovnim


informacijama. Za korisnika su ti meðuodnosi èesto najvažniji, jer se u njima kriju
vrijedne poslovne informacije.

29.3. Obrada dimenzijskih podataka


Pri obradi dimenzijskih podataka susreæemo specifiène operacije: rotiranje, selekti-
ranje te detaljiziranje. Rotacija je promjena orijentacije dimenzija na ekranu ili
papiru, tj. odreðivanje redoslijeda dimenzija u prikazu. Ako se radi o dvjema
dimenzijama, rotacija predstavlja zamjenu redoslijeda dviju dimenzija:
tržište×proizvod rotirano je proizvod×tržište. Broj moguæih rotacija poveæava se
brojem dimenzija. Za dvije dimenzije dvije su moguænosti prikaza, za tri dimenzije
broj prikaza je 6, a za èetiri dimenzije 24 su moguæa prikaza.
Selekcija je izbor pozicija jedne dimenzije. Naravno, istovremeno se mogu selekti-
rati pozicije razlièitih dimenzija. Na sl. 29.5. u dimenziji tržište selektirane su
pozicije gradova Osijeka i Valpova, u dimenziji proizvod pozicije VW-a i Opela, a u
dimenziji vrijeme mjeseci 02/2004 i 03/2004. Isijecanje je uzimanje jednog isjeèka,
odnosno selektiranje jedne pozicije jedne dimenzije. Drugim rijeèima, isijecanje je
fiksiranje jedne pozicije, npr. izdvajanje dvodimenzionalne tablice iz kocke.
Fiksiramo li vrijeme, tj. naèinimo li isjeèak vremena, za kocku na lijevoj strani sl.
29.5. dobili smo tablicu tržište × proizvod.
Veæ spomenuto detaljiziranje (engl. drill down) i agregiranje (engl. drill up),
odnosno silaženje i uzlaženje po hijerarhiji pozicija jedne dimenzije takoðer se
smatra operacijom specifiènom za dimenzijsku bazu podataka.

Sl. 29.5 Selekcija je izbor pozicija dimenzija


406 II. INFORMACIJSKA TEHNOLOGIJA

Spomenute operacije meðutim nisu dovoljne, pa skladište podataka mora imati


znatno obimnije moguænosti obrade podataka. Skupno ih nazivamo analitièkom
obradom podataka (engl. On-Line Analytic Processing - OLAP). Ona omoguæuje
korisniku dimenzijske baze podataka da s lakoæom obavi analitièke upite, odnosno
obrade kao što su modeliranje i proraèunavanje dimenzijskih podataka, analiza
vremenskih serija, pronalaženje izuzetaka, detaljiziranje ili agregiranje promatranih
pojava. Analitièke su obrade u skladištu podataka raèunski znatno zahtjevnije od
jednostavnih transakcijskih obrada (engl. On-Line Transactional Processing -
OLTP) u sustavima za obradu.
U veæim sustavima za upravljanje relacijskom bazom podataka (npr. IBM DB2,
Microsoft SQL Server, Oracle10g) ugraðene su moguænosti izgradnje dimenzijske
strukture podataka (dimenzijske baze podataka), poznate pod nazivom OLAP-
poslužitelj. Na OLAP-poslužitelje nadovezuju se klijentske aplikacije, odnosno
OLAP-klijenti za razlièite analitièke obrade podataka. Poznatiji OLAP-klijenti su
npr. BusinessObjects, Panorama i hrvatski Manager.

29.4. Oblikovanje podataka u skladištu


podataka
Za oblikovanje skladišta podataka mogu se primijeniti ista pravila kao pri obliko-
vanju baze podataka. Za svaki se poslovni proces (npr. proces prodaja) izraðuje
podruèno skladište podataka kao dimenzijska struktura, odnosno "kocka" koja na
dijagramu entiteta ima zvjezdasti oblik. Na sl. 29.6. prikazana je "kocka" koja se
sastoji od dimenzija proizvod, tržište i vrijeme, prikazanih istoimenim dimenzijskim
entitetima Proizvod, Tržište i Vrijeme. Njih povezuje vezni entitet Prodaja, koji
sadrži vrijednosne atribute ProdanoJedinica i VrijednostProdaje.
Dva razlièita poslovna procesa mogu dijeliti iste dimenzije, odnosno dimenzijske
entitete. Npr., proces prodaje i proces nabave dijele istu dimenziju proizvod. To
omoguæuje analitièku usporedbu dvaju poslovnih procesa.
"Kocka" se implementira u relacijskoj bazi podataka kroz zvjezdastu shemu baze
podataka, koja ima tablice jednake entitetima sa sl. 29.6. Tablice nastale od dimenz-
ijskih entiteta Proizvod, Vrijeme i Tržište su dimenzijske tablice u kojima se nalaze
dimenzijski atributi. Tablica nastala od entiteta Prodaja je vrijednosna tablica. Ona
je povezana sa svim dimenzijskim tablicama. Njezini atributi ProdanoJedinica i
VrijednostProdaje pokazuju koliko je jedinica proizvoda prodano i koja je vrijed-
nost prodaje u jednom mjesecu (dimenzija vrijeme) za jedan odreðeni proizvod
(dimenzija proizvod) u jednom gradu (dimenzija tržište).
Broj redaka u dimenzijskim tablicama jednak je broju pozicija dimenzija. Jedan
redak u, npr., tablici Tržište sadrži podatke osnovne pozicije (npr. grad Osijek),
29. Skladišta podataka 407

Sl. 29.6 Dimenzijski model implementira se zvjezdastom strukturom u kojoj


vrijednosna tablica povezuje dimenzijske tablice

pripadnost nadreðenim pozicijama podruèja (Osjeèko) i regije (Sjever). Broj redaka


u vrijednosnoj tablici mnogostruko je veæi, sve do umnoška broja redaka svih
dimenzijskih tablica, pa je vrijednosna tablica najveæa.
U dimenzijskoj tablici ili u posebnoj tablici - agregatu mogu se pohraniti i podaci
agregiranih pozicija (npr. podruèja i tržišta u dimenziji tržište ili kvartali i godine u
dimenziji vrijeme). Agregirana vrijednost sadrži agregirane (zbrojene) vrijednosti
niže razine. Ako je, npr., osnovna pozicija dimenzije tržište grad, jedan agregat
može sadržati zbrojene vrijednosti za gradove unutar jednog podruèja, a drugi
zbrojene vrijednosti za podruèja jednog tržišta. Agregati znatno poveæavaju brzinu
obrade dimenzijskih podataka, jer je zbrajanje obavljeno prethodno pa se ne mora
obavljati tijekom analitièke obrade.

29.5. Primjer
Kao primjer uzeti su malo prilagoðeni podaci primjera skladišta podataka FoodMart
2000, njezine dimenzijske "kocke" Sales (prodaja), u sustavu za upravljanje bazom
podataka Microsoft SQL Server - Analysis Services. Spomenuti podaci obraðeni su
programskim sustavom za poslovno izvještavanje i analize SoftPro Manager 4, tzv.
OLAP-klijentom koji je izradila tvrtka SoftPro Tetral iz Zagreba. Osim što
omoguæuje klasièno izvještavanje, SoftPro Manager 4 služi za analitièku obradu
podataka. Služi za obavljanje više razlièitih vrsta poslovnih analiza, kao što su ABC-
analiza, analiza trendova i predviðanja, "top-bottom" analiza, analiza stabilnosti
mjera, analiza rangova, analiza "što-ako", a obavlja i neke statistièke analize kao što
je korelacijska analiza.
408 II. INFORMACIJSKA TEHNOLOGIJA

Sl. 29.7. Na ekranu za oblikovanje analize odabiru se podaci koji æe uæi u analizu

Sl. 29.8. Rezultati analize oblikovane na sl. 29.7


29. Skladišta podataka 409

Dimenzijska kocka Sales sastoji se od sljedeæih dvanaest dimenzija: Store


(prodavaonica), Time (vrijeme), Product (proizvod), Promotion Media (promocijski
medij), Promotions (promocija), Customers (kupci), Educational Level (razina
obrazovanja), Gender (spol), Marital Status (braèno stanje), Store Size (velièina
prodavaonice), Store Type (tip prodavaonice) i Yearly Income (godišnji prihod).
Veæina dimenzija je hijerarhijski ureðena, npr. dimenzija Time (vrijeme) na najnižoj
razini ima Month (mjesec), a na višoj razini Quater (kvartal) i Year (godinu).
Vrijednosti odnosno mjere (hiper)kocke su Unit Sales (prodano jedinica), Store
Sales (iznos prodaje), Sales Count (broj prodaja) itd.
Prikazano je nekoliko primjera analize podataka. Na sl. 29.7. prikazan je poèetni
ekran na kojem se jednostavnim izborom dimenzijskih podataka oblikuje analiza:
Country (zemlja) za Customers (kupce) prikazat æe se u recima, prvi kvartali godina
2000.-2002. (Q1/2000, Q1/2001 i Q1/2002) prikazat æe se u stupcima, a mjere su
Store Sales (iznos prodaje prodavaonice) i Profit (profit). Na sl. 29.8. podaci
izabranih dimenzija prikazani su tablièno, a na sl. 29.9. trodimenzijski. Na x-osi su

Sl. 29.9. Grafièki prikaz rezultata sa sl. 29.8.


410 II. INFORMACIJSKA TEHNOLOGIJA

kvartali koji su odabrani za analizu, na y-osi su pojedine provincije, a na z-osi su


iznosi prodaje. Analizom tablièno ili trodimenzijski prikaznih podataka analitièar bi
mogao zakljuèiti o kretanjima prodaje po zemljama i vremenu. Uoèi li kakav
izuzetak, mogao bi istažiti njegove uzroke analizom detaljnih podataka, a možda i
izradom dodatnih analiza po drugim dimenzijama.

Literatura
1. Inmon, W., Building the Data warehouse, QED Publishing Group, Wellesley,
1992.
2. Kimball, R., The data warehouse toolkit, John Wiley, New York, 1996.
3. Šošić, I., Serdar, V., Uvod u statistiku, Školska knjiga, Zagreb, 2000.

Preporuèena literatura
1. Kimball, R., The data warehouse toolkit, John Wiley, New York, 1996.
Knjiga na jednostavan i razumljiv način opisuje dimenzijsku strukturu podataka.
Uzima stvarne probleme iz poslovne prakse, razmatra koje podatke treba uzeti za
analizu, te rješavajući probleme razmatra teoretske postavke dimenzijske strukture.

Web stranice
1. Skladistenje.com
http://www.skladistenje.com
Hrvatske Web-stranice posvećene skladištenju podataka i poslovnoj inteligenciji.
Pogodne su za upoznavanje s pojmovima skladištenja podataka. Donose vijesti o
domaćim projektima.
2. The Data Warehousing Information Center
www.dwinfocenter.org
Informacijski centar s tekstovima, raspravama i referencama o skladištenju podata.

You might also like