You are on page 1of 15

Skladišta podataka

Stjepan Brozović

Doc.dr.sc. Marko Banek


Ukratko:
 Skladište podataka
 Povijest skladišta podataka
 Izgradnja skladišta podataka
 Metodologija izgradnje skladišta podataka
 Struktura sustava skladišta podataka
 Dimenzionalni model skladišta podataka
 Složene dimenzijske strukture
 Zaključak
Skladište podataka:

 je baza podataka koja omogućuje brzo i jednostavno


izvođenje pretraga i upita nad velikim količinama
podataka
 je skup podataka na kojem se temelji sustav potpore u
odlučivanju
 namjenjeno je menađerima, ali i svima koji u svom
poslu obavljaju analitičke zadatke
 sadrži ogromne količine podataka koji se koriste u
svrhu poslovnih analiza i postizanja što boljih tržišnjih
rezultata
Skladište podataka:

 Definicija skladišta podataka:


“Skladište podataka je baza podataka koja sadrži
povijesne, nepromijenjive podatke koji su logički i
fizički izvućeni iz raznih izvora. Ti podaci se u skladu s
definiranim modelom učitavaju u skladište i integriraju
s postojecim podacima, a sve to u svrhu potpore
poslovnom odlučivanju.”

R. Kimball, The Data Warehouse Toolkit


Povijest skladišta podataka:

 70-tih Bill Inmon uvodi pojam: Skladište podataka


 1983. Tvrtka Teradata predstavlja sustav upravljanja
bazama podataka stvoren za pomoć u odlučivanju
 1988. IBM-ovi znanstvenici Barry Devlin i Paul Murphy
razvijaju tkz. poslovno skladište podataka
 1991. Bill Inmon objavljuje knjigu: Building the Data
Warehouse
 1991. Tvrtka Prim Solutions predtavlja softver
namjenjen za izgradnju i razvoj skladišta podataka
 1995. Osniva se The Data Warehousing Institute
organizacija koja promiće skladišta podataka
 1996. Ralph Kimball objavljuje knjigu: The Data
Warehouse Toolkit
Izgradnja skladišta podataka: (1)

 Proces izgradnje započinje definiranjem korisničkih zahtjeva.


 Analiziraju se zahtjevi i postojeći podatci u operacijskoj bazi.
 Izgrađuje se logički model skladišta podataka.
 Podaci se logički transformiraju prilikom izvlačenja iz
transakcijske baze i učitavanja u skladište podataka.
 Podaci u skladištu podataka se modeliraju u dimenzijski model
podataka pogodan za izvođenje milijuna upita istovremeno.
 Podaci se zatim fizički dimenzijoniraju (pročišćavaju i
pojednostavljuju) što osigurava razumijevanje pojedinih
podataka.
Izgradnja skladišta podataka: (2)

 Osigurava se učitavanje novih podataka u nekim


vremenskim intervalima.
 Izgradnja skladišta je gotova, ali je skladiše potrebno
nadgledati i upravljati njime, te ako se javi potreba i
rekonstruirati.
Metodologija izgradnje skladišta
podataka:
 Tokom razvoja skladišta podataka pojavile su se
mnogobrojne metodologija, ali sve su imale ishodište
u dva najpoznatija pristupa:
 Odozgo-dolje – je stariji pristup kojeg je uveo B. Inmon. Brz,
ali ako skladiše podataka nije dovoljno temeljito definirano
najvjerojatnije će rezlutirati pogrešnim rezultatom
pretraživanja.
 Odozdo-gore – Noviji pristup predložen od strane R.
Kimbella. Jednostavniji i brži za izgradnju, ali sporiji u
pretraživanju podataka no samim time i točniji sa krajnjim
rezultatom.
 Zato se danas primjenjuju različiti kombinirani pristupi,
primjerice middle-out koji uvažava potrebe korisnika,
ali i realnost raspoloživosti pojedinih podataka.
Struktura sustava skladišta
podataka:
 Izvorišni sustav/sustavi – je područije u kojem se vrši unos
podataka koji nastaju kao rezultat poslovnog procesa.
 Privremeno područje – je dio sustava u kojem se vrši obrada
pristiglih podataka kako bi ih se pripremilo za njihov unos u bazu
skladišta podataka.
 Baza skladišta podataka – je odredišna točka prikupljenih izvorišnih
podataka.
 Korisnički pristup podatcima – je skup alata za pristup i analizu
podataka. Očekuje se brzina i jednostavnost rada.
Dimenzionalni model podataka:

 Nastanak dimenzionalnog modela uzrokovan je


nedostatcima složenih relacijskih sruktura (suviše
komplicirana struktura te spor odaziv pri
postavljanju upita).

 Dimenzionalni model zbog svoje jednostavnosti


daje mogućnost brzog dobivanja informacije.
Složene dimenzijske strukture: (1)

 Pahuljasta struktura:
 Nastaje kada se nad određenom dimenzijom
proizvoda izvrši postupak normalizacije. Npr. iz
dimenzije proizvoda izdvoji se određena kategorija i
stavi se u zasebnu dimenzijsku tablicu.

 Stvaranje ovakve strukture nije preporučljivo, jer


otežava korisniku razumjevanje te usporava upite.

 Ovakvom strukturom ostvaruje se ušteda na fizičkom


prostoru no ona je u nekim slučajevima zanemarivo
mala.
Složene dimenzijske strukture: (2)

 Mosna struktura:

 Se pojavljuje u slučajevima kada jednom zapisu mora


biti pridruženo više zapisa neke dimenzije. Npr.
pregled pacijenta kojem se na jednom pregledu pruža
dijagnoza ili bankovni račun koji ima više vlasnika.

 Ovakvu dimenziju nazivamo dimenzijom više-


prema-više
Zaključak:

 Na globaliziranom tržištu sa oštrom konkurencijom i


izbirljivim kupcima, proizvođaći traže idealnu poslovnu
strategiju. Stratešku prednos daje im skladište podataka,
odnosno analiza prikupljenih podataka o kupcima i
proizvodima koje odabiru. To im omogućuje kreiranje
profila kupca i usmjeravanje daljnih akcija prema kupcu u
svrhu povećanja prodaje i zadovoljstva samog kupca.
The End

Zahvaljujem se na pažnji!

You might also like