Professional Documents
Culture Documents
Skladištenje Podataka
Skladištenje Podataka
• Podatak – simbolički prikaz neke činjenice, tj. onog što se može neupitno i nepobitno potvrditi
da postoji ili se događa:
o Prikazan je u obliku brojki, slova ili drugih znakova
o Zapisan je na mediju (papiru – knjiga; filmu – fotografija, filmski zapis, magnetskom,
optičkom ili poluvodičkom mediju na računalu – datoteka, baza podataka)
• Jednoznačno protumačeni podatak ili skup podataka daju informaciju ili obavijest:
o Informacija je potrebna pri odlučivanju
o Bez kvalitetne informacije o predmetu odlučivanja teško je donijeti racionalnu odluku
• Znanje je kombinacija podataka i informacija o nekom predmetu, problemu ili području, koja je
protumačena ekspertnim mišljenjem, vještinom i iskustvom
• svako područje organizira svoje znanje utvrđivanjem prikladnih koncepata (elemenata znanja),
njihovih odnosa i ograničenja (prikaz znanja – pravila)
PODACI U POSLOVANJU
• poslovanje bez podataka danas nije moguće (npr. banka bez podataka o klijentima)
• poslovanje s „malim“ podacima
o pri obavljanju izvršnih i upravljačkih aktivnosti potrebno je bilježiti podatke
o za neke aktivnosti (primjerice računovodstvene) propisana je obveza vođenja podataka
• poslovanje s „velikim“ podacima
o sve veći broj uređaja „proizvodi“ podatke u digitalnom obliku, njihova količina
neprestano raste
o u umreženom okruženju „stvari“ razmjenjuju podatke (Internet stvari)
o podaci se nazivaju „velikim“ zbog količine, raznovrsnosti i brzine pristizanja – za obradu
je potrebno koristiti i nestandardne, napredne i kompleksne metode obrade
STRUKTURIRANI PODACI
POLUSTRUKTURIRANI PODACI
• polustrukturirani ili slabostrukturirani podaci podaci nemaju čvrstu strukturu: pojave istovrsnih
objekata ne moraju imati ista obilježja, svim podacima ne moraju biti pripisana obilježja
• dokumenti (članci, knjige) primjer su polustrukturiranih podataka
• polustrukturirani podaci objekta se pohranjuju kao dokument u bazi dokumenata ili kao
samostalna datoteka (primjerice u Wordu)
NESTRUKTURIRANI PODACI
BAZE PODATAKA
• pohranjuje skup raznovrsnih zapisa (studenata, nastavnika, predmeta) informacijskog sustava ili
aplikacije
• specifična baza podataka, namijenjena analitičkoj obradi podataka naziva se skladištem
podataka
• ako baza podataka pohranjuje podatke dokumenata, može se nazvati bazom dokumenata
• u specifičnim primjenama (ekspertni sustavi) baza podataka na specifičan način pohranjuje
znanje pa se govori o bazi znanja
• NoSQL baze podataka pohranjuju nestrukturirane podatke
RELACIJSKA BAZA PODATAKA
• Temeljni objekti poslovanja, kao što su kupci, dobavljači, računi i sl., opisuju se strukturiranim
podacima
• Oni se najbolje pohranjuju u relacijskoj bazi podataka
• Relacijska se baza podataka sastoji od skupa tablica (relacija) popunjenih podacima
o Jedan redak (zapis) pohranjuje vrijednosti obilježja jednog objekta (npr. studenta X)
o Jedan stupac pohranjuje podatke jednog obilježja za različite objekte
o Ćelija (redak x stupac) pohranjuje podatke jednog obilježja jednog objekta (npr. ime
studenta X)
PRIMARNI I STRANI KLJUČ, REFERENCIJSKI INTEGRITET
• Obilježje ili skup obilježja, čijim se podacima jednoznačno identificira svaki redak tablice naziva
se primarnim ključem
• Svaka tablica mora imati primarni ključ – u tablici Dobavljači primarni je ključ ŠifraDobavljača
• Strani ključ omogućuje povezivanje podataka dviju tablica
• ŠifraDobavljača u tablici Narudžbe je strani ključ koji se vezuje (referencira) na primarni ključ
ŠifraDobavljača u tablici Dobavljači – omogućuje povezivanje redaka tablice Narudžbe s recima
tablice Dobavljači koji se odnose na istog dobavljača
• Povezanost stranog i primarnog ključa naziva se referencijskim integritetom – on osigurava da u
bazu podataka nije moguće upisati narudžbu upućenu nepostojećem dobavljaču
KONCEPTUALNI MODEL
• Osnovni element konceptualnog modela podataka je objekt, za koji treba zabilježiti podatke i
pohraniti ih u bazu podataka
• Primjeri objekata: osobe, kupci, poduzeća, odjeli, proizvodi, računi, narudžbe, projekti, studenti,
kolegiji
• Slični objekti se klasificiraju u zaseban tip entiteta (npr. Osobe), a pojedinačno (npr. Ivan, Ana,
Josip) jesu njegove pojave
• Pojave istog tipa entiteta imaju jednake atribute ili obilježja (npr. ime, prezime, matični broj) ali
se međusobno razlikuju po vrijednostima atributa
• Konceptualni model ima grafički prikaz koji prikazuje tipove entiteta i njihove odnose (veze)
LOGIČKI MODEL
• Logički model iskazan relacijskom shemom baze podataka dobiva se od konceptualnog modela
prema pravilima:
o Entitet → relacija
▪ Pojave entiteta istog tipa nalaze se u istoj relaciji
o Atribut
▪ Atributi entiteta postaju atributi relacije
o Veza
▪ 1:M unosi strani ključ u relaciju koja je nastala od entiteta na strani M
▪ 1:1 se rješava kao i veza 1:M
▪ M:M tvori novu relaciju u koju ulaze primarni ključevi entiteta koji sudjeluju u
vezi – oni postaju stranim ključevima
KORIŠTENJE PODATAKA PRI OBAVLJANJU IZVRŠNIH PROCESA
• Izvršnim poslovnim procesima stvara se nova vrijednost (primjer procesa prodaje ili proizvodnje)
• Nakon izvršenja poslovnog procesa u bazi podataka ostaju zabilježena nova stanja poslovanja
(primjer stanja salda na poslovnom računu)
• Iz baze podataka vidljivo je tekuće stanje poslovanja, a po potrebi i prethodna stanja
• Promjena podataka iz starog u novo stanje obavlja se transakcijom u bazi podataka
informacijskog sustava te se govori o transakcijskoj obradi podataka – zato naziv sustav za
obradu transakcija
• Primjer: transakcijom koja unosi nove narudžbe u bazu podataka unosi se u tablicu Narudžbe
redak s podacima narudžbe, a u tablicu StavkeNarudžbe unose se stavke koje pripadaju toj
narudžbi
• Polazište:
o Velika konkurencija i izbirljivost kupaca
o Put postizanja konkurentnosti jest ispravna poslovna strategija koja uključuje donošenje
ispravnih poslovnih odluka temeljem pravovremenog posjedovanja kvalitetnih
informacija
• Trebamo informacijski sustav
• Informacijski sustav (IS) će omogućiti
o Pronalaženje kvalitetnih informacija
o Njihovo uobličavanje (prilagodbu) potrebama odlučivanja
o Njihovo aktivno nuđenje korisniku
INFORMACIJA
ZNAČAJKE INFORMACIJE
KVALITETNA INFORMACIJA
DIJELOVI IS-A
• Izvršni (operativni) sloj podupire izvršenje poslovnog procesa → sustav za obradu transakcija
• Upravljački (analitički) sloj generira informacije potrebne za odlučivanje (upravljanje) → sustav
za potporu upravljanju
• Informativni sloj omogućuje komunikaciju i suradnju → sustav za komunikaciju i suradnju
KLASIFIKACIJA ODLUKA
• Operativne odluke
o Vođenje i nadgledanje osnovnih poslovnih procesa
o Programirane odluke koje se ponavljaju
o Standardni izvještaji
• Taktičke odluke
o Praćenje skupine poslovnih procesa
o Djelomično programirane odluke
o Jednostavne analize podataka
• Strateške odluke
o Rješavanje strateških pitanja
o Neprogramirane odluke
o Kompleksne analize podataka
VRSTE OBRADA PODATAKA ZA ODLUČIVANJE
• Temelje se:
o Na pravilima – izvještavanje, praćenje/statičko izvještavanje (poslovi operativne analize
→ operativno odlučivanje)
▪ Pretraživanje podataka u bazi podataka
▪ Pripremljen upit ili zahtjev za obradom → standardni izvještaj
▪ Izvještavanje iz operativnog (transakcijskog) podsustava
o Na umješnosti – jednostavne analize/dinamičko izvještavanje (poslovi taktičke analize
→ taktičko odlučivanje)
▪ Iterativno pronalaženje informacija iz baze podataka
▪ Analitičar postavlja upit, analizira dobivene rezultate, ponavlja postupak → ad
hoc izvještaji tijekom analize/dijagnosticiranje
▪ Analitička obrada dimenzijskih podataka iz podsustava za potporu upravljanju
o Na znanju – kompleksne analize/dubinske analize (poslovi strateške analize → strateško
odlučivanje)
▪ Dobivanje informacija izradom i izvršenjem modela
▪ Analitičar izrađuje model obrade, upućuje ga na izvršenje, korigira model,
ponavlja postupak → izvještaj s rezultatima modela
▪ Metode otkrivanja znanja, simulacijske metode, ekspertni sustavi u okviru
podsustava za potporu upravljanju
POSLOVNE ANALITIKE
POSLOVNA INTELIGENCIJA
• Skladišta podataka
• Područna skladišta (eng. data mart)
• Analitičke obrade
• Alati za ekstrakciju, transformaciju i učitavanje podataka (eng. ETL tools)
• Rudarenje podataka (eng. data mining)
• Informacijski portali
• Modeliranje poslovanja
• Najčešće korištene: skladište podataka, analitičke obrade, rudarenje podataka
SKLADIŠTE PODATAKA
RAZLIČITOST
• Osobna računala i alati krajnjih korisnika – rast broja različitih aplikacija i različitih sustava za
upravljanje bazama podataka
• Razvoj računarskih komunikacija – rast broja različitih korisnika koji pristupaju tim podacima
• Različiti izvori podataka
o Unutarnji izvori podataka
▪ sustav za obradu transakcija [financijski podsustavi (glavna knjiga), logistički
podsustavi (planiranje materijala, nabava, transport, distribucija), podsustavi
prodaje, podsustavi proizvodnje (upravljanje i kontrola proizvodnje, praćenje
radnih naloga, praćenje projekata, upravljanje kvalitetom, proizvodnja podržana
računalom), podsustavi ljudskih resursa (plaće, radna mjesta, obrazovanje)],
sustav za potporu upravljanju (planovi, odluke, pravilnici), sustav za potporu
komunikaciji i suradnji (elektronička pošta i sl.)
o vanjski izvori podataka
▪ podaci konkurentnosti (proizvodi, usluge, promjene konkurentnih poduzeća),
ekonomski podaci (valutne promjene, politički indikatori, promjene kamata,
burzovni podaci), strukovni podaci (tehnološki, marketinški trendovi), financijski
podaci, robni podaci (cijene sirovina), ekonometrijski podaci (prihodi pojedinih
skupina, ponašanje kupaca), psihometrijski podaci (profiliranje kupaca),
meteorološki podaci, demografski podaci, marketinški podaci itd.
• zahtjevi različitosti
o opći zahtjev – povezati i učinkovito koristiti raznorodne i razdijeljene podatke iz različitih
izvora
o menadžerski zahtjev – dostupni i konzistentni podaci – precizno i sažeto opisuju tvrtku i
njeno okruženje
OSNOVNI POJMOVI
• skladište podataka – centralni repozitorij svih bitnih podataka koje jedna organizacija vodi o
svom poslovanju, to je baza podataka iz koje se crpe informacije za upravljačke zadatke
(odlučivanje)
• skladištenje podataka obuhvaća postupke pripreme i obrade podataka te dobivanja informacija
potrebnih u procesu upravljanja (odlučivanja)
OPERATIVNA BAZA PODATAKA – SKLADIŠTE PODATAKA
Obilježja Operativna baza podataka Skladište podataka
Vrijeme odziva Sekunde Sekunde do sati
Operacije DML Uglavnom čitanje
Priroda podataka 30-60 dana Vremenske serije
Organizacija podataka Aplikacija Područje, vrijeme
Veličina Male do velike Velike do izrazito velike
Izvori podataka Operativni, unutarnji Operativni, analitički, unutarnji,
vanjski
Aktivnosti Procesi analize
KRIVULJE KORIŠTENJA
• transakcijski sustav je predvidljiv
• skladište podataka (analitički sustav) – varijabilno i nepredvidivo
FUNKCIONIRANJE SKLADIŠTA
DIMENZIJSKA STRUKTURA PODATAKA
SVRHA MODELIRANJA
• IZVRŠNI PODACI
o Modelirati podatke u slijedu izvršenja poslovnog procesa
o Izvršni (operativni) model je „procesni“ jer prikazuje strukturu podataka pri izvršenju
poslovnog procesa
o Primjer: izvršenje poslovnog procesa Prodati robu
• ANALITIČKI PODACI
o Modelirati podatke rezultata (efekata) poslovnog procesa
o Analitički model je „analitički“ jer prikazuje strukturu podataka pogodnu za analizu
rezultata poslovnog procesa
o Primjer: praćenje poslovnog rezultata Prodaja robe (analiza rezultata poslovnog procesa
Prodati robu)
DEKOMPOZICIJA SUSTAVA
• U izvršnom sloju dekomponiraju se izvršni poslovni procesi do razine elementarnih poslovnih
procesa
o Elementarni se proces dalje ne dekomponira, a uobičajeno se implementira jednom
transakcijom
o Promatra se izvršenje procesa
• U upravljačkom sloju dekomponiraju se upravljački poslovni procesi kojima se analiziraju
poslovni rezultati do razine elementarnih poslovnih rezultata
o Pritom može pomoći dekompozicija izvršnih procesa jer se uz njih vežu poslovni rezultati
o Promatraju se procesi za čije smo rezultate zainteresirani
NAČIN MODELIRANJA
• Izvršni podaci
o Modeliranje počinje od osnovnih (samostalnih) objekata
o Modeliranje se nastavlja modeliranjem veza odnosno asocijativnih objekata
o Struktura modela pokazuje odnose između poslovnih objekata u slijedu izvršenja
poslovnog procesa
o Primjer: izvršenje poslovnog procesa Prodati robu
• Analitički podaci
o Modeliranje počinje uočavanjem mjera (asocijativnih objekata) kojima se prikazuju
poslovni rezultati (numerički podaci zbrojivi po različitim dimenzijama
o Modeliranje se nastavlja uočavanjem dimenzija (osnovnih objekata)
o Struktura modela pokazuje mjere (poslovne rezultate) gledane kroz dimenzije
poslovanja
o Primjer: praćenje rezultata Prodaja robe
• Odabir (poslovnih) procesa za koje se oblikuje skladište podataka (dimenzijska baza podataka)
• Konceptualno oblikovanje
o Izrada (pod)modela – zvijezde, kocke – dijagram entiteti-veze za svaki proces
o Ne promatra se izvršenje nego rezultati (efekti) procesa
• Logičko oblikovanje – pretvorba zvjezdaste sheme u relacijsku shemu baze podataka
• Fizičko oblikovanje
o Agregati
o Implementacija u relacijsku bazu podataka
NORMALIZIRANOST DIMENZIJSKIH ENTITETA
• „normalizirani“ entiteti – pahuljasta struktura daje normalizirane relacije (tablice) u relacijskoj
bazi podataka
• „nenormalizirani“ entiteti, fleksibilnost i brzina pretraživanja
ZBROJIVOST MJERA (VRIJEDNOSTI)
• Zbrojiva mjera – iznos prodaje u valuti moguće je zbrajati po svim dimenzijama
• Poluzbrojiva mjera – stanje računa na dan nije moguće zbrajati u vremenu, ali je moguće zbrojiti
sva stanja različitih računa jednog korisnika na dan
• Nezbrojiva mjera – vrijednost po jedinici (cijena)
• Podaci u skladištu podataka su jednako ažurni kao u bazi podataka ili je kašnjenje (latency time)
u ažurnosti prihvatljivo
• Pristupi
o Skoro stvarnovremenski (near real-time) ETL – učestalije izvođenje ETL procedure
o Direct trickle feed – direktno ažuriranje činjenične (vrijednosne) tablice
o Trickle and feed – ažuriranje se radi u posebnoj (staging) činjeničnoj tablici koja se
povremeno alternira s radnom činjeničnom tablicom
ANALITIČKE OBRADE
ANALITIČKA OBRADA
• Detaljiziranje i agregiranje
o Omogućuje hijerarhiju u pozicijama dimenzije
o Detaljiziranje – silaženje, svrdlanje (drill down) po hijerarhiji pozicija jedne dimenzije
o Agregiranje – dizanje (drill up) po hijerarhiji pozicija jedne dimenzije
ZA IZVOĐENJE OPERACIJA NA DIMENZIJSKOM MODELU TREBAJU NAM TEHNOLOGIJE ZA
ANALITIČKU OBRADU (PLATFORME POSLOVNE INTELIGENCIJE)
ALATI ZA ANALITIČKE OBRADE (BI PLATFORME)
• Programska rješenja koja prikuplja podatke iz različitih sustava, bez obzira na arhitekturu
podataka ili sustava
• Funkcioniraju neovisno o transakcijskim sustavima, ali se oslanjaju na njih
• Mogu ekstrahirati, transformirati i integrirati podatke iz višestrukih izvora
• Aplikacijski softver dizajniran za mjerenje, predviđanje i optimiziranje poslovnih performansi