Professional Documents
Culture Documents
Kako Nagabhushana (2008) navodi, postoje 18 pravila kojih se OLAP alati moraju
držati, a Codd2 je ta pravila podelio u četiri grupe nazivajući ih karakteristikama.
Neka od Coddovih pravila za OLAP prema Nagabhusani (2008: 205-209):
1. Osnovne funkcije
• Multidimenzionalni konceptualni pogled - pogled kroz više dimenzija iliti
filtera.
• Intuitivno manipulacija podataka - prema Coddle to se odnosi na model
pružanja izbora prilikom manipulacije odnosno obrade podataka, jer svaki
korisnik ima svoj pristup određenim operacijama stoga treba imati mogućnost
izbora na koji način će određene operacije obavljati.
• Pristupačnost 2 Edgar Frank Codd (1923/08/19. - 18.04.2003.) - osmislio
relacijski model 13
• Batch vađenje vs interpretativno - pravilo koje nalaže da alati pružaju
mogućnost pristup eksternim bazama podataka koliko i sopstvenim bazama
podataka.
• OLAP modeli analiziranja - odnosi se na analiziranju i istraživanju podataka
koji uključuju operacije kao što su slice, dice, drill dovn, drill up ali i
parametarskog statičkog izveštavanja.
• Klijent / Server arhitektura
2. Specijalne funkcije
• Obrada ne normaliziranih podataka - to se odnosi na integraciju OLAP
sistema i ne normaliziranih izvora podataka, Codd navodi da bilo koja
ažuriranja podataka u OLAP okruženju ne bi smeli dopustiti menjanje ne
normaliziranih podataka u sistemu.
• Čuvanje OLAP rezultata - radi se o tome da Codd smatra kako OLAP
aplikacije ne bi trebale biti implementirane direktno na transakcijskih
podacima, a OLAP promene podataka bi se trebali držati odvojeno od tih
transakcijskih podataka. Nagabhushana navodi kako je najbolji primer za to
upravo Microsoftov Analisis Services o kojemu će autor detaljnije pisati u
praktičnom delu ovog završnog rada.
• Ekstrakcija vrednosti koji nedostaju
• Obrada vrednosti koji nedostaju - sve NULL vrednosti bi se trebali ignorisati
od strane OLAP sistema nezavisno o izvoru tih podataka odnosno vrednosti.
3. Izveštajnoj funkcije
• Fleksibilni izveštaji - korisnici bi trebali imati mogućnost kreiranja
fleksibilnih izveštaja, odnosno mogućnost da kreiraju izveštaje prema onim
dimenzijama koje oni žele.
• Ujednačeni izveštaji
• Automatsko prilagođavanje fizičkom nivou
4. Kontrola dimenzija 14
• Generička dimenzionalnost - svaka dimenzija mora biti ekvivalentna u
strukturalnim i operativnim sposobnostima.
• Neograničen broj dimenzija
• Neograničen broj operacija ukrštanja dimenzija - Codd navodi da bilo koja
forma kalkulacija mora biti moguća u svakoj dimenziji, to je vrlo važno ako se
rade složeni proračuni ne samo preko tablica, a posebno su važni u
aplikacijama koje analiziraju profitabilnost.
OLAP alati
1. Relacijski OLAP
2. Multidimenzionalni OLAP
3. Desktop OLAP
4. Hibridni OLAP
Slika 5 Varijante OLAP alata (Nagabhushana, 2008: 222)
Relacijski OLAP iliti ROLAP alati sve podatke koje dobiju spremaju u standardne
sisteme relacijskih baza podataka, ne spremivši tako ništa u eksterne repozitorije.
Sposobni su raditi sa vrlo velikim skupom podataka, ali su kompleksni što dovodi
do toga da su vrlo skupi za implementirati, a isto tako imaju spore performanse
izvođenja upita te nisu sposobni izvoditi složenije finansijske kalkulacije. ROLAP
alati ne spremaju nužno podatke za analizu odvojeno od ostalih izvornih podataka.
Panian i Klepac (2003) isto tako navode kako u ROLAP alati imaju otežanu
primenu standardnih upitnih jezika (npr. SQL-a), na koje su korisnici zapravo
navikli pa neke druge oblike interakcije sa bazama podataka ne smatraju zapravo
prednošću nego nedostatkom.
• Godine
• Promenljive
• Klase
Navedena kocka zapravo predstavlja godišnji strukturno-poslovni pokazatelj
preduzeća prema NKD-u 2007 za delatnost trgovine.
Skladišta podataka
Analitičke baze podataka uslovile su nastanak skladišta podataka (Data
Warehouse-DW), čija je osnovna namena izveštavanje korišćenjem transakcionih
podataka, istorijskih podataka, kao i podataka iz drugih sistema.
Skladištenje podataka - DW je proces integracije podataka u jedan
repozitorijum iz kojeg krajnji korisnici mogu sprovoditi ad-hock analize podataka i
praviti izveštaje.
Warehousing koncept je skladištenje agregiranih, ekstrahovanih i filtriranih
podataka u meta baze, koje omogućavaju slojevit, multidimenzionalni pristup
podacima, kakav je potreban za donošenje odluka najvišeg strateškog nivoa.
Skladište podataka je informaciona baza podataka dizajnirana za podršku
jedne ili više klasa analitičkih zadataka, kao što su nadgledanje i izveštavanje,
analiza i dijagnoza i simulacija i planiranje.
Osnovni cilj skladištenja podataka je prikupljanje i distribucija informacija
kroz preduzeće, tj. korišćenje bilo koje informacije, sa bilo kog mesta, u bilo koje
vreme, tačnije- ostvarenje principa „Biti uvek na usluzi korisniku informacija“.
Cilj skladištenja podataka nije da se podaci samo skladište, već je cilj da
menadžeri mogu sami da vrše analize. Čak i u svetu uspešnih menadžera postoje
ljudi koji nisu tehnički obrazovani, a imaju potrebu za informacijama i ne znaju da
programiraju.
Skladište podataka je arhitektura za organizovanje informacionih sistema.
Sastoji se od skupa programa koji vrše ekstrakciju podataka iz transakcionih
sistema, baze podataka u koju se smeštaju podaci i sistema koji obezbeđuju
podatke korisnicima.
Slika 1. Osnovna arhitektura skladišta podataka
2.1Izrada skladišta podataka
Pri izgradnji skladišta podataka najbitniji su sami podaci, a ne poslovni
procesi i funkcije, kao što je to slučaj sa transakcionim sistemima.
Za razvoj skladišta podataka potrebno je:
izvršiti analizu izvora podataka,
pripremiti podatake,
izgraditi skladište podataka.
Izgradnja „skladišta“ podataka nije samo prosto kopiranje podataka i
prepuštanje korisnika alatima za podršku odlučivanju već pretpostavlja i
restrukturiranje podataka denormalizacijom tabela, čišćenjem podataka od
redundansi i nelogičnosti i dodavanjem novih polja i ključeva radi zadovoljenja
korisnikovih potreba za sortiranjem, kombinovanjem i sumiranjem podataka.
Slika 2. Razvoj skladišta podataka
Prvi korak je identifikacija dimenzija i atributa koja podseća na klasično
projektovanje upotrebom ER modela i zove se dimenziono modeliranje.
Dimenziono modeliranje je tehnika logičkog dizajna čiji je cilj prezentacija
podataka u obliku koji obezbeđuje visoke performanse sistema radi vršenja analize
podataka.
U dimenzionom modeliranju, strukture podataka su tako organizovane da
opisuju mere i dimenzije.
Mere su numerički podaci smešteni u centralnoj, takozvanoj tabeli
činjenica (fakt tabela).
Dimenzije su standardni poslovni parametri koji definišu svaku
transakciju.
Osnovu za izradu dimenzionog modela predstavljaju meta podaci, na osnovu
kojih se vrši definisanje hijerarhija, elemenata i atributa, normalizacija i
denormalizacija i definisanje agregacija.
Svaka dimenziona tabela ima svoj primarni ključ, a svi oni učestvuju u
stvaranju primarnog ključa tabele činjenica. Ovakvi modeli se nazivaju šemama
zvezde.
Tabele činjenica sadrže podatke koji su, najčešće, numeričkog tipa i mogu
sadržati veliki broj zapisa.
CINJENICE
DIMENZIJA2 IDdimenzije1 (FK) DIMENZIJA3
IDdimenzije2 IDdimenzije2 (FK) IDdimenzije3
IDdimenzije3 (FK)
Atribut21 Atribut31
Atribut22 Mera1 Atribut32
Atribut23 Mera2 Atribut33
Mera3
1. OLAP sistemi
Interaktivno analitičko procesiranje (On Line Analytical Processing - OLAP)
namenjeno je on line analizama i izveštajima, za razliku od produkcionih sistema
namenjenih ažuriranju baza podataka i obradi transakcija (On Line Transaction
Processing - OLTP).
Postavlja se pitanje: šta je to krajnem korisniku potrebno? Ono što krajnem
korisniku treba je sledeće:
Da može da postavi bilo koje poslovno pitanje,
Da bilo koji podatak iz preduzeća koristi za analizu,
Mogućnost neograničenog izveštavanja.
U tu svrhu se koriste analitički OLAP sistemi koji obezbeđuju informacije
koje se koriste za analizu problema ili situacija.
Analitičko procesiranje se primarno vrši korišćenjem poređenja ili
analiziranjem šablona i trendova. Na primer, analitički sistem bi mogao da prikaže
kako se određena vrsta štampača prodaje u različitim delovima zemlje. Takođe,
mogao bi da prikaže i kako se jedna vrsta proizvoda trenutno prodaje u odnosu na
period kada se proizvod prvi put pojavio na tržištu.
OLAP sistemi omogućavaju jednostavnu sintezu, analizu i konsolidaciju
(agregacija podataka po zadatom kriterijumu) podataka. Koriste se za intuitivnu,
brzu i fleksibilnu manipulaciju transakcionim podacima. OLAP sistemi podržavaju
kompleksne analize koje sprovode analitičari i omogućavaju analizu podataka iz
različitih perspektiva (poslovnih dimenzija).
OLAP sistemi kao skladišta podataka koriste multidimenzionalnost i
denormalizaciju i može se reći da predstavljaju nadgradnju skladišta podataka.
Odabirom izvora Microsoft Access, iz padajućeg menija opcije Link To, otvara se
sistem datoteka iz koga biramo Northwind bazu podataka.
Slika 4: Izbor izvora podataka
Po izboru baze podataka, otvara se dijalog Tables iz koga se bira jedna ili vise
tabela koje će se koristiti pri izgradnji OLAP kocke (Slika 5).
U ovom primeru koristiće se tabela Prodaja (Slika 5) koja je kreirana kao upit
nad bazom NorthWind.
.
II Korak: Definisanje dimenzija i mera
1. Dobavljač,
2. Dostavljač,
3. Proizvod,
4. Kupac,
5. Prodavac,
6. Vreme,
1. Količina,
2. Cena,
3. Popust,
4. Cena sa popustom.
3. U donjem desnom delu, nalazi se panel koji prikazuje izabrane podatke (iz
izvora ili iz kocke)
Slika 6: OlapCube Writer dijalog
Kao rezultat ovog postupka dobijena je hijerahijska dimenzija Vreme (Slika 13).
U ovom primeru mera Cena, koja predstavlja ukupnu cenu jedne prodaje,
definisana je kao proizvod izvornih atributa CenaPoKomadu i Količina. Kao
funkcija agregiranja, izabrana je funkcija Sum (Slika 15).
40