Što ćete naučiti u ovom poglavlju?

4. Skladištenje podataka (Data Warehousing)

Što je skladište podataka i koje su njegove karakteristike? Koja je uloga skladišta podataka u informacijskom sustavu tvrtke? Koje se razine analiza koriste za obradu podataka u skladištu? Koji se alati koriste kod skladištenja podataka? Kako koristiti skladište podataka u cilju povećanja uspješnosti tvrtke?

M. Zekić- Sušac

1

M. Zekić- Sušac

2

Zašto skladištenje podataka?
poslovna inteligencija izvodi se iz podataka što nastaju tijekom redovitog poslovanja tvrtke zbog obima, ti se podaci svake godine arhiviraju, brišu i u bazi podataka ostaju samo podaci tekuće godine osim toga, podaci u bazi moraju biti ažurni, pa se stari podaci zamjenjuju novima (npr. stare cijene, stare količine na skladištu ili u prodavaonici se zamjenjuju novima), i tada se starim vrijednostima gubi trag u bazi za operativno vođenje poslovanja stare vrijednosti npr. količina na skladištu nisu važne, ali su važne za poslovnu inteligenciju koja prati vremenski redosljed zbivanja pojedinih poslovnih događaja
zaključak
transakcijske baze više nisu dovoljne, javlja se potreba za SKLADIŠTEM PODATAKA
M. Zekić- Sušac 3

Karakteristike baze podataka
Transakcijska baza podataka nastaje u informacijskom sustavu tvrtke (odnosno ERP-u – Entreprise Resource Planning sustavu), koji bilježi sve tokove sirovina, robe i novca u tvrtki, kreira i mijenja podatke u bazi podataka Podaci u (relacijskim) bazama su organizirani u dvo-dimenzionalne tablice koje su međusobno povezane (kao na slici) Baza podataka sadrži podatke za jedno poslovno razdoblje, i nakon tog razdoblja podaci se arhiviraju i brišu iz tekuće baze (tzv. otvaranje nove poslovne godine) Podaci se stalno ažuriraju pa se stare vrijednosti ne vide.
M. Zekić- Sušac 4

Po čemu se skladište razlikuje od baze podataka?
Skladište nisu nagomilani svi podaci iz baza podataka proteklih godina. U skladištima se arhiviraju neki podaci iz baze podataka, za koje se smatra da su važni za analize (relevantni). Podaci u skladištu se organiziraju u višedimenzionalne kocke (eng. cubes). Podaci u skladištu su trajni i vežu se uz vrijeme nastajanja. Cilj skladišta podataka nije operativnost poslovanja, nego stvoriti što bogatiji izvor informacija za različite dugoročne i kratkoročne analize i predviđanja.
M. Zekić- Sušac 5

Što je skladište podataka?
Prema definiciji Williama H. Immona, skladište podataka je onaj “oblik baze podataka kojemu su svojstvena sljedeća 4 obilježja:” (u Panian, Klepac, 2003):
usmjerenost predmetima (funkcionalnim područjima) sadržajna nepromjenjivost integriranost vezanost uz vrijeme (vremenska određenost)

M. Zekić- Sušac

6

1

Usmjerenost predmetima U skladištu se podaci organiziraju oko predmeta. i dr. jer je skladište usmjereno prema budućnosti u operativnim bazama podataka nalaze se samo aktualni. odnosno funkcionalnih područja (npr. data mining. da bi postali konzistentni (integrirani) M.Sušac 11 Kako nastaje skladište podataka? Data Warehousing – skladištenje podataka Analiza podataka Modeliranje podataka Skladište podataka Informacijski sustav tvrtke (ERP) ETL procesi Reporting. Zekić. Spremišta se koriste za analitičke obrade.Sušac 8 Integriranost U skladištu su podaci konzistentni. pa se može dogoditi npr. ili godini). Zekić. Zbog toga se prije pohrane u skladište. različit način pisanja datuma. podaci o prodavaonicama. trenutna količina na skladištu. Klepac. 4. mjesecu.Sušac 10 Funkcija skladišta podataka u informacijskom sustavu tvrtke U IS-u tvrtke. pa su podaci u skladištu historijski zašto? da bi se mogle raditi vremenske analize i predviđanja. OLAP. skladište je “muzej” strateških informacija čija se povijest može povezati s podacima i odnosima među njima. 2003): 1.Sušac 9 Vezanost uz vrijeme u skladištu se gotovo uz svaki podatak pohranjuje i vremenska određenost (za koji dan ili koje razdoblje se podatak odnosi. Zekić. skladište podataka je: mjesto na kojem se skupljaju i pohranjuju poslovni podaci. podaci o trenutnoj cijeni proizvoda.) U operativnoj bazi podataka se podaci mijenjaju jer uvijek odražavaju tekuće stanje (npr. način zapisa datuma). podaci o prodaji na određeni dan u određenoj prodavaonici i dr. skladište predstavlja točku u kojoj se skupljaju podaci koji će poslužiti za stvaranje integriranih. Data Marts). Zekić. tj. skladište je izvor informacija koje se izvode iz spremišta podataka (eng.) M. pa se tako vode podaci vezani uz obradu narudžbe ili uz kalkulaciju prodajne cijene i sl. izvor informacija za poslovno odlučivanje i stvaranje nove poslovne inteligencije. predmetno orjentiranih informacija 3. prodaja u određenom danu. ili postavljanje upita M. Data mining Ad hoc izvještaji Posebni izvještaji Dubinski izvještaji (drilldown i drillthrough) 12 baza podataka M. prikazuju se na dosljedan način (npr. Zekić. Zekić. Primarne funkcije skladišta podataka su (u Panian.) 7 Sadržajna nepromjenjivost U skladištu se jednom pohranjeni podaci uglavnom ne mijenjaju (npr. tjednu. podaci iz baze trebaju preprocesirati. kako bi se mogli koristiti u raznim analizama U operativnoj bazi se konzistentnost ne provjerava strogo. najsvježiji podaci potrebni za operativno poslovanje M.Sušac M. npr. skladište je odraz poslovnih pravila što se primjenjuju kod donošenja strateških odluka 2.Sušac 2 . podaci o prodaji. i dr.) Kod operativnih baza podataka su podaci organizirani oko operativnih (poslovnih) aplikacija.

excel formati. prodaji. Zekić. M. ili virusi) M. programi za inkrementalno punjenje se pokreću periodički (dnevno ili tjedno ili mjesečno) i stalno pune skladište podataka novim relevantnim podacima iz baze.Sušac 16 Arhitektura skladišta podataka Danas su u upotrebi 3 osnovne arhitekture skladišta podataka (Panian. razni probni podaci. Izbor ETL alata Analiza troškova i koristi Stvaranje popisa ETL proizvoda i ponuđača Usporedba ETL proizvoda i ponuđača Objektivno ocjenjivanje svakog ETL proizvoda Provjera referentne liste klijenata svakog ponuđača Sužavanje popisa ETL proizvoda i ponuđača Organiziranje demonstracija ETL proizvoda Testiranje odabranih ETL proizvoda izvor: Panian.94. punjenje povijesnih podataka i inkrementalno punjenje Nakon što se završi inicijalno punjenje i punjenje povijesnih podataka. proizvodima. Klepac. računima. pogrešno uneseni. .Sušac 15 M. modificirano Pri odabiru ETL alata koji će tvrtka koristiti.Što su ETL procesi? ETL je skup procesa koji “ima za cilj ekstrahirati odnosno zahvaćati ili vaditi (engl. Klepac. Load) podatke iz jednog ili više transakcijskih sustava u skladište podataka Transakcijske baze podataka Izvještaji poslovne inteligencije Uloga ETL procesa ETL procesi su nužni kada se podaci prebacuju iz baze podataka u skladište podataka ETL procesi počinju pripremom podataka.) transformaciju – prijenos podataka u format koji odgovara skladištu (reformatiranje. str. Zekić. koja uključuje: reformatiranje (podaci koji su u datotekama s različitim formatima se svode na isti format kako bi se mogli koristiti u daljnjim fazama obrade) . str. 2003. usklađivanje (neki podaci su redundantni. Zekić. Klepac.99. zalihama itd.Sušac 14 Skladište podataka ETL procesi izvor: Panian. 2003. pa njihove vrijednosti treba ujednačiti) – npr.txt formati i dr. 2003.Sušac Spremište podataka Spremište podataka izvor: Panian. formati različitih baza. Klepac. može se desiti da se ista prodavaonica vodi pod dvije različite šifre.Sušac 17 3 .86.npr. Zekić. pa ih treba otkriti i uskladiti. Zekić. transformirati odnosno preoblikovati (engl. modificirano 18 M. ili da se naziv istog proizvoda ne podudara u svim tablicama baze čišćenje (ukloniti “prljave” podatke koji su nastali zbog ranijih grešaka u radu sustava ili su namjerno ubačeni) – npr. potrebno je proći sve ove faze do konačnog izbora.Sušac 13 Programski alati za ETL Programski alati za ETL vrše: ekstrakciju – omogućuju korisniku izbor relevantnih podataka iz baze koji će se pohraniti u skladište (koji podaci o klijentima. 2003): dvoslojna s jednim zajedničkim skladištem podataka (Izvori podataka + Data Warehouse) dvoslojna s većim brojem nezavisnih lokalnih spremišta podataka (Izvori podataka + Data Marts) troslojna s jednim skladištem i većim brojem spremišta (Izvori podataka + Data Warehouse + Data Marts) Najviše u upotrebi: troslojna arhitektura Troslojna arhitektura skladišta Operativni podaci Podaci iz naslijeđenih sustava Podaci iz vanjskih izvora Skladište podataka Data Warehouse Spremište podataka Data Mart Spremište podataka Data Mart Spremište podataka Data Mart M. Transform) i puniti ili unositi (engl. Zekić. Najpoznatiji alati takve vrste su Ardent DataStage i Informatica. str. Extract). a neki inkonzistentni (nedosljedni). usklađivanje i čišćenje podataka iz baze) – oduzimaju 80% vremena cijelog ETL procesa punjenje skladišta – incijalno punjenje. narudžbama. modificirano M.

jedinica i dijelova tvrtke na poslovima koje treba obavljati zajednički moguće korištenje aplikacija koje nadilaze okvire tvrtke (povezivanje sa dobavljačima i kupcima u lancu vrijednosti) Nedostaci: razmjerno visoki troškovi uspostavljanja zajedničkog skladišta na razini tvrtke (da bi se ovaj nedostatak otklonio. a na kraju dolazi do osamostaljenja “pravog” skladišta) M. ali voditi računa o pouzdanosti (danas na tržištu zadovoljavaju te kriterije vodeće relacijske baze kao npr. str.Sušac 19 Prednosti: radno opterećenje informatičara se smanjuje (jer su podaci već usklađeni u skladištu. Zekić.Sušac npr. M. i dr. budući da oni omogućuju iskorištenje većih resursa ili iskoristiti postojeći DBMS ukoliko ga tvrtka ima. Zekić. Zekić. modificirano Tehnološka podloga skladištenja podataka Tehnološka podloga skladištenja podataka leži u: raspoloživoj bazi podataka – kvalitetan i pouzdan DBMS (Database Management System) iz kojeg će polako nastajati skladište Važno: Izabrati DBMS koji radi na platformama najraširenijih Windows i Unix operativnih sustava. radi se postupna (inkrementalna) izgradnja skladišta: najprije se kreira prvo spremište. gdje će se promatrati kroz te 3 dimenzije UPIT 1 tržište podaci koji se analiziraju Npr.Sušac 21 (prodajna mjesta) vrijeme proizvodi (artikli) M. Zekić. pa se u spremištu samo preuzimaju) više mogućnosti dodavanja novih aplikacija unapređenje točnosti i preciznosti informacija (jer sve potiču iz jednog skladišta) manje poteškoća u komunikaciji i suradnji org.Sušac 24 M. prodavaonicama i vremenu. zatim miniskladište.voditi računa o autorizaciji pristupa skladištu podataka. uzimaju one podatke koji im trebaju. prodaja se može grupirati po prodavaonicama.. 2003. Zekić. ako se promatra nabava. DB2. dobavljaču. te se radi postupno dodavanje novih spremišta i aktiviraju nove aplikacije.Sušac 23 4 . prema proizvodu. Zekić. te nakon definiranja strukture skladišta napraviti inicijalno punjenje i punjenje historijskim podacima alatu za analizu podataka (On-Line Analytical Processing) . po artiklima. Klepac.OLAP je danas postao standardnom tehnologijom za skladištenje podataka koji obrađuje podatke u relacijskim bazama podataka M.05.241. Oracle. tada će se u skladištu podaci formirati u trodimenzionalnu kocku. roku isporuke i vremenu): Proizvod Nabava Rok isporuke Vrijeme izvor: Panian. Informix. pa tako postoje dimenzijske tablice o prodavaonicama. grafički se prikazuju pomoću zvjezdastog dijagrama (npr. SQL Server) Dobavljač postojećem IS-u tvrtke (ERP-u) koji će puniti bazu (skladište) podataka . vremenskim razdobljima. 22 Prikaz više dimenzija podataka Ukoliko se rade analize u kojima je potrebno više od 3 dimenzije. vremenskim razdobljima. jer jedino preko njih dobivaju podatke M. prodaju želimo promatrati prema vrstama proizvoda.Sušac 20 Prednosti i nedostaci troslojne arhitekture skladišta Kako su podaci u skladištu organizirani? podaci po kojima se vrši grupiranje činjeničnih podataka Tablice činjenica (fact tables) Tablice dimenzija (dimension tables) Dimenzijski model podataka u skladištu Svako funkcionalno područje poslovanja može se promatrati kroz više dimenzija Ako npr. artiklima.Karakteristike troslojne arhitekture veći broj lokalnih spremišta podataka (Data Marts) povezan je u jedno skladište podataka Skladište je pozicionirano između lokalnih spremišta i izvora podataka U skladište se pohranjuju podaci iz baza podataka tvrtke da bi se onda isporučivali lokalnim spremištima u jedinstvenom usklađenom formatu Lokalna spremišta podatke dobivene iz skladišta agregiraju i sažimaju prema kriterijima koje diktiraju njihove lokalne aplikacije (tj. po potrebi ih sintetiziraju) Lokalna spremišta su zavisna o skladištima.2007. količina prodanog artikla X u prodavaonici Y na dan 24.

razvoja. 2.) izvor: Jackson. 2002 25 M. definiranje potrebnih podataka u skladištu i grupiranja podataka 3. te detekcije prijevara Magma koristi OLAP i BI alat za poboljšanje izvještajnog sustava o prodaji robe M. odabrati platformu (DBMS) – npr. SQL Server ili dr. proizvodnje. SoftPro Manager. kada. Zekić. SAP) specijalizirane tvrtke koje se bave proizvodnjom alata za poslovnu inteligenciju i skladištenje podataka temeljenog na OLAP server-u (neki od proizvoda su: Cognos. Oracle. Microsoft. Zekić. sortirane ili sumirane po nekim kriterijima. Treba definirati i način grupiranja podataka – radi dimenzijskih tablica (npr.Sušac 27 M.Sušac Koje podatke (varijable) izabrati? Veza s “Business Intelligence” kolegijem: poslovna inteligencija nastoji izlučiti informacije koje su ključne za uspješnost tvrtke: informacije o konkurenciji informacije o kupcima informacije o dobavljačima Prije upotrebe skladišta podataka u svrhu poslovne inteligencije. Zekić.Sušac 26 Alati za skladištenje podataka vodeći proizvođači DBMS sustava i statističkog softvera nude svoja rješenja (npr. marketinga i nabave. vremenska razdoblja koja su važna za analize (dnevno. ukoliko želimo dobiti podatke o prodaji auta “Mazda 323” s klimauređajem u Osijeku petkom poslijepodne).Sušac 28 Primjeri upotrebe skladištenja podataka Wolkswagen AG – koristi Business Objects alate za praćenje svih podataka – od financija. OLAP i kopanje podataka (Data mining) M. 3. Korisnici na svim razinama mogu pristupiti izvještajima u sklopu BI alata MasterCard International – koriste BI alat za praćenje podataka u području oglašavanja i autorizacije. Za prikaz podataka OLAP koristi najčešće trodimenzionalne kocke (cubes). M. definiranje strukture skladišta (obavljaju projektanti) 4.internetske tehnologije omogućuju brzinu. generiranje statičnih izvještaja ukoliko iz skladišta podataka trebamo samo izvještaj u tabličnom ili grafičkom formatu o postojećim podacima. i dr. Zekić. kako) i autorizacija pristupa 7. punjenje inicijalno učitavanje podataka u skladište (initial load) 5. Microsoft Crystal Reports ili Oracle Reports). transformacija. dovoljan alat su generatori izvještaja (npr. tjedno. zatim prodavaonice. važno je da manageri sami najprije definiraju jasne poslovne ciljeve.) i vrijeme potrebno za dobivanje informacije o poslovanju koristiti skladište putem web-a . automatizirano osvježavanje podataka u jednakim vremenskim razmacima (incremental load) 6. Zekić. (najbolje onaj sustav koji se već koristi ako omogućuje i skladištenje) 2. administrativnih troškova i dr. prodaje. podrazumijeva sofistirane metode za traženje skrivenih zakonitosti među podacima.Sušac 30 5 . Zekić. rudarenje (kopanje) podataka (Data mining) najsloženiji dio obrade podataka. a zatim prema njima odrede koji će biti ključni pokazatelji uspješnosti poslovanja. klijentima i partnerima osnovnu razinu korištenja skladišta – za izvještavanje o stanju tvrtke i procesa treba prevazići korištenjem skladišta za ostvarivanje poslovnih ciljeva (Management by Objectives) M. SAS) veći ERP-ovi također nude svoje OLAP servere (npr.Sušac 29 Kako koristiti skladište podataka u cilju povećanja uspješnosti tvrtke? skladište omogućuje koncept upravljanja pomoću informacija – informacije postaju osnovni resurs poslovanja koji ostvaruje konkurentsku prednost i dodaje novu vrijednost skladište smanjuje troškove (potrebnih informatičkih stručnjaka za izradu izvještaja. istraživanja. raspoloživost i dostupnost relevantnih informacija svim djelatnicima tvrtke. odjele. pojedinačne artikle i grupe artikala. WebIntelligence) postoje rješenja koja rade u lokalnoj mreži i rješenja za web (Web enabled OLAP) Razine analize podataka u skladištu 1. koji jednostavno iz baze prikazuju podatke filtirirane. kvartalno. OLAP (On-line analytical processing) Složenije analitičke obrade podataka po različitim dimenzijama rade se kod relacijskih baza na OLAP tehnologiji (npr. određivanje metapodataka (tko popunjava podatke. što. analize (kreiranje upita i izvještaja) – generatori izvještaja. Oracle.Faze u izgradnji skladišta podataka 1. mjesečno. ETL procesi – ekstrakcija.

Poslovna inteligencija kroz poslovne slučajeve. Intelligent Management Support System. Jackson.: Poslovno računalstvo. Zagreb. Tim Press. H. Panian. Znak. Zagreb. 2006.. š to povećava kredibilitet informacijskog sustava M.. J. Birola. L..Budućnost skladišta podataka i poslovne inteligencije Metode skladištenja podataka sve više postaju integrirane u softverske pakete temeljnog informacijskog sustava tvrtke . 1998. Poslovna inteligencija. Varga. ekstranet postaje infrastruktura poslovne inteligencije u lancu vrijednosti tvrtke trend tzv. Communications of the AIS. 267-296. London. Masmedia. 21.Sušac 31 Literatura Klepac. 2002.05.Quorum.novije verzije relacijskih baza podataka (kao npr. Čerić. Klepac. Zekić. Bidgoli. Lider Press.. Data Mining: A Conceptual Overview. G. samposluživanja – tvrtke svojim klijentima omogućuju da sve više poslova s njom obavljaju sami koristeći korporacijski web portal načela upravljanja prema ciljevima (Management by Objectives) će biti podržana mogućnostima online pristupa bazama i skladištima podataka. Mršić. G. H.skladistenje..com. kroz alate poslovne inteligencije koncept skladišta podataka usklađivanjem podataka omogućuje jedinstvenu istinu o tvrtci. www. Zagreb. Oracle i SQL server) imaju dio za Data Warehousing integriran u svom paketu kao OLAP managerima nije potrebno angažirati poseban tim analitičara za obradu ključnih pokazatelja o stanju tvrtke. te koristiti kao potporu u donošenju poslovnih odluka. Zekić.. odnosno kao dio svog DSS-a.. M. V. Ž. već takve podatke klikom miša mogu dobiti obrađene iz baze podataka.. 2003. Volume 8.2007.Sušac 32 6 . M. pp.

Sign up to vote on this title
UsefulNot useful