Professional Documents
Culture Documents
1. Podatak je opis stvari i događaja s kojim se susrećemo. Oni mogu biti različitih oblika:
NUMERIČKI, ALFANUMERIČKI, ZVUCI, SLIKE i dr. i skladište se u bazu podataka,
organizuju na način da se lako pronalaze.
6. Data mart “je sposobnost kompjutera da se ponaša kao enormna memorija i prikupi sve
informacije.” Data mart predstavlja najjednostavniji oblik skladišta podataka.
A) Da
B) Ne
Najniži nivo normalne forme jeste prva normalna forma (1NF), druga normalna forma
(2NF), treća normalna forma (3NF), treća normalna forma je kasnije promovisana kao
Boyce-Codd Normal Form (BCNF). Kasnije su se javile i više normalne forme, koje su
povezane sa BCNF, a to su četvrta (4NF) i peta (5NF) normalna forma, poznata još kao i
Project-join Normal Form (PJ/NF). Najčešće u upotrebi su prve 3 normalne forme.
> Metapodaci - Metapodaci su podaci koji opisuju komponente skladišta podataka (npr.
njihovu šemu) i njihov odnos unutar skladišta podataka. Ne sadrži podatke koji su
direktno uzeti iz operativne okoline. Metapodaci (podaci o podacima, engl. metadata) je
izraz koji označava sekundarne, pomoćne podatke koji sadrže informacije o podacima u
skladištu podataka ili sadrže informacije kako te podatke najlakše obraditi. Metapodaci
nam pomažu i u izvlačenju podataka i u rješavanju upita nad podacima.
> Podaci o trenutnim detaljima - Glavna briga aplikacija DW jer održavaju aktuelne
događaje. Radi se o podacima na najnižem nivou granularnosti. Bez obzira na to, podaci
o trenutnim detaljima se inače čuvaju na disku kako bi se osigurao brz pristup pod
cijenu visokog troška i povećane kompleksnosti upravljanja.
> Podaci o starim detaljima - Podaci o starim detaljima su podaci o trenutnim detaljima
koji su prošli kroz vrijeme instantne važnosti, pa su zato smješteni na drugi, jeftiniji
prostor (podaci o starim detaljima se razlikuju od podataka o trenutnim detaljima ne
logički, napravljeni su na istom nivou granularnosti podataka, već po različitoj
vremenskoj tački, govoreći historijski).
> Blago skraćeni podaci - Blago skraćeni podaci su izvučeni podaci iz podataka o
trenutnim detaljima. Oni su posrednički korak prema jako skraćenim podacima i
„gotovo uvijek sačuvani na disku.“
> Jako skraćeni podaci - „Ponekad jako skraćeni podaci se mogu naći u skladištu
podataka i u ostalim slučajevima se jako skraćeni podaci mogu naći čak van trenutnih
zidova tehnologije koja koristi kuće skladišta podataka. Bez obzira gdje su podaci
smješteni fizički, jako skraćeni podaci su dio skladišta podataka.“
> Tablica činjenica je mjesto gdje se spremaju brojčani poslovni pokazatelji. Svaki od
tih pokazatelja se nalazi negdje na presjeku svih dimenzija. Ti pokazatelji se nazivaju
činjenicama i otuda se tablica zove tablica činjenica.
> Tipičan primjer za činjenicu je npr. atribut koji sadrži ukupnu vrijednost proizvoda
prodanog određeni dan.
> Najbolje i najkorisnije činjenice su: brojčane, kontinuirano vrednovane i zbrojive.
Činjenice trebaju biti brojčane jer su one pokazatelji nekog poslovnog procesa, a taj
proces se iskazuje nekakvim iznosima (koliki je profit, koliko firma duguje, koliki su
troškovi…).
> Činjenice su obično kontinuirano vrednovane što znaći da mogu poprimati različite
vrijednosti svaki put kad se mjere.
20. Ono što je dovelo do toga da se DW nametne i tretira kao izuzetan i potpuno novi pristup
u razvoju informacijskih tehnologija jeste što je:
Poboljšanje u razvoju hardvera, te mogućnost pohrane i obrade podataka, koja
predstavlja osnovu za korištenje DW-a.
> Kao osnovni preduvjete za praktičnu primjenu DW jeste baza podataka, koja
omogućava rad s kompleksnim upitima, brzina pristupa i rada s velikim količinama
podataka,kao i ugradnja osnova inteligencije u sisteme za upravljanje bazama
podataka.
> Dodatni podsticaj za razvoj DW jeste korištenje mrežne tehnologije za povezivanje
različitih računalni platformi, kao i Internet.
> Upotreba novih alata za podršku odlučivanju donijela značajne promjene:
multidimenzionalni analitički alati omogućavaju višestruke načine istovremenog
praćenja podataka, jer takve analize teško je izvesti bez pomoći računara jer ljudski um
nije sposoban da sve varijable istovremeno promatra.
> Omogućava praćenje konkurencije, jer organizacije su u situaciji da moraju što je više
moguće saznati o svojim kupcima ili korisnicima (njihove zahtjeve, primjedbe, navike i
slično) samo da bi i dalje ostali u tržišnoj utakmici.
> Svaka informacija ima svoju vrijednost, a to su uočili i menadžeri.
1. Informacija je podatak bitan za pomoć u izboru nekih AKTUELNIH ili BUDUĆIH akcija
ili NE-AKCIJA. Najčešće se podaci obrađuju aplikativnim programima, kako bi se proizvela
veća njihova korisnost od one koja se postiže u slučaju direktnog i jednostavnog pozivanja iz
baze podataka.
> Identifikacioni – podaci koji nam nešto identificiraju npr. Identifikacioni podaci o
firmi
> Klasifikacioni – podaci koje klasificiramo u određene klase
> Upravljački – podaci koji pomažu pri upravljanju
> Kvalitativni - Rezultat su promatranja, promišljanja ili druge misaone radnje -
Zapisuju se unaprijed definiranom oznakom (mogu biti i brojke) – npr. ime, zanimanje,
dijagnoza, OIB, spol
Kvantitativni - Rezultat su mjerenja i / ili brojanja - Zapisuju se brojkama i uvijek se
navodi jedinica mjerenja - upisujemo ih u izvornom obliku (onako kako su izmjereni) –
npr. dob, visina, težina, broj leukocita.
8. Godine 1991. Bil Inmon je izdao svoju prvu knjigu o skladištenju „Građenje skladišta
podataka“, koja sadrži najširu objavljenu definiciju skladišta podataka: „Skladište podataka je
predmetno-orijentirana, integrirana, vremenski različita, nepromjenjiva kolekcija podataka
koja podržava odluke rukovodioca. Objasniti značenje
> Predmetno-orijentirana
> Predmeti za skladište podataka su elementi podataka koji se koriste da se skrate
informacije Inmonovim primjerima predmeta – „potrošači, proizvodi, police“ –
su poprilično jasni primjeri za ono što multidimenzionalna zajednica zove dimenzijama.
Zato je orijentacija na predmet bila jasno raskidanje od funkcionalne organizacije
podataka koja je tada dominirala.
> Integrirana
> je jako važna, s obzirom da se skladišta podataka ne pune iz jednog izvora podataka,
već iz višestrukih operacijskih baza podataka ili čak vanjskih izvora podataka. Iz
historijskih razloga, ipak, čak jedna te ista operativna baza podataka ima često velike
nepodudarnosti kod reprezentacije podataka. Kao primjer možemo navesti
reprezentaciju 'muško' i 'žensko' kodom 'M' i 'F', 'O' i '1' ili 'istinito' i 'lažno'.
> Vremenski promjenjivi podaci
> Historijski podaci su od velike važnosti u svijetu skladišta podataka. Podaci mogu biti
dostupni u dnevnim, sedmičnim i/ili godišnjim skupinama.
> Nepromjenjiva grupa podataka
Nepromjenjivost, konačni primarni aspekat skladišta podataka, znači da nakon što su
podaci
> Relacijski model - Podaci se u relacijskoj bazi podataka nalaze u relacijama, odnosno
tablicama. Zasnovan na pojmu relacijama između atributa. I podaci i veze među
podacima prikazuju se “pravokutnim” tabelama. U navedenom primjeru imamo 2
tabele STUDENT i ISPIT.
> Mrežni model - Baza je predočena usmjerenim grafom. Čvorovi su tipovi zapisa, a
lukovi definiraju veze među tipovima zapisa. Mrežni model omogućava svakom zapisu
da ima više nadređeni i podređeni, kreirajući mrežastu strukturu
> Hijerarhiski model - Specijalni slučaj mrežnog. Baza je predočena jednim stablom ili
skupom stabala. Čvorovi su tipovi zapisa, a hijerarhijski odnos “nadređeni-podređeni”
izražava veze među tipovima zapisa. Ovo je takozvano 1:N (one-to-many) veza između
slogova stabla. U ovom modelu, relacije su takve da jedan podređeni može imati samo
jednog nadređenog, ali nadređeni može imati više podređeni
> Objektni model – Ovaj model se koristi u slučajevima kada podatke nije moguće
predstaviti relacijskim modelom. U relaciskom modelu svaki atribut ima samo jednu
vrijednost, dok kod objektnog modela entitet je predstavljen klasom. Klasa obuhvata i
atribute i ponašanje entiteta. Inspiriran je objektno-orijentiranim programskim
jezicima. Svaki objekt pripada nekoj klasi. Između klasa se uspostavljaju veze,
agregacije
14.U koje kategorije prema Russell Ackoff možemo podijeliti sadržaj ljudskog uma?
> operativne baze podataka zahtijevaju vrijeme odaziva prekinute sekunde, dok DSS
ne;
> uredska zajednica koristi baze podataka orijentirane na transakciju, dok
menadžerska zajednica koristi skladišta podataka;
> do kratkotrajnih odluka se dolazi iz operativnih sistema, a do dugoročnih iz skadišta
podataka;
> operativne baze podataka sadrže savremene informacije, dok skladišta podataka
sadrže historijske podatke;
> operativne baze podataka su jako neintegrirane dok skladišta podataka sadrže
integrirane podatke;
> operativne baze podataka su dizajnirane za detaljne podatke, dok su skladišta
podataka namijenjena za detaljne i sažete podatke;
> zahtjevi za obradu u operativnoj sredini su statični, dok su oni za obradu u okolini
baze podataka heuristični
> Potrebno je još spomenuti da postoje dvije (odnosno tri) vrste arhitekture skladišta
podataka. Prva je InmonovaCorporate Information Factory, gdje se svi podaci na razini
cijele tvrtke se nalaze u centralni repozitorij koji se naziva Enterprise Data Warehouse,
a karakterizira ga to što su podaci u 3. Normalnoj formi, odnosno koristi se relacijska
tehnologija, te se upiti ne postavljaju direktno u taj centralni repozitorij. On služi samo
kao osnova za Data Martove (možemo ih shvatiti kao mini skladišta podataka
specijalizirana za određeni segment poduzeća). Ti data martovi su prilagođeni za
pojedine segmente tvrtke (računovodstvo, proizvodnja, marketing…) i upiti se vrše na
njima.
> Druga vrsta arhitekture veže se za Kimball-a, a naziva se Dimensional Data
Warehouse. Iz naziva je vidljivo da se ovdje više ne koristi relacijska tehnologija, nego
isključivo dimenzijski dizajn. I ova arhitektura ima centralni repozitorij, gdje se nalaze
podaci na razini cijele tvrtke, ali se upiti vrše direktno na njemu, nema više potrebe za
data martovima, budući je sam repozitorij organiziran na dimenzijskom dizajnu.
> “Dimenzijski model je tehnika logičkog dizajna koja teži prikazivanju podataka na
standardiziran, intuitivan način koji omogućava pristup podacima velikom brzinom.”
> Dimenzijski model se najčešće prikazuje apstraktno kao kocka čije dimenzije
predstavljaju dimenzije posla koji modeliramo, a podatak na presjeku tih dimenzija
predstavlja podatak koji tražimo.
> Broj dimenzija u praksi može biti i veći od tri pa se onda govori o višedimenzionalnoj
kocki. Gotovo u svim dimenzijskim modelima postoji dimenzija vremena. Organiziranje
i spremanje podataka prema ovom modelu omogućuje korisnicima bolje razumijevanje
podataka i omogućuje da korisnička sućelja budu jednostavnija za korištenje, a izvedba
upita na zadovoljavajućoj razini.
19. Koje tipove Metapodataka razlikujemo?
20. Koje tehnike analize podataka poznajemo kod TREĆA FAZE izgradnje skladišta podataka?
A) Da
B) Ne
5. Mjere su:
c) Denormalizirani podaci
d) Ništa od navedenog
7. Skladište podataka je sistem koji periodicno povlaci podatke iz izvornih transakcijskih sistema i
konsoliduje ih u dimenzionalno ili normalizovano spremište podataka.
A) Da
B) Ne
8. ETL je proces koji označava korake u kojima se od
A) poluproizvoda dolazi do proizvoda
B) informacije do odluke
C) izvornog sistema dolazi do podataka smještenih u skladište podataka.
11. Objasni pojam DIKW(Data, Information, Knowledge, Wisdom).
Infrastruktura
skladište podataka, ETL alati, Operativno spremište podataka
Funkcionalnost
BI platforme, Data Mining, BI aplikacije (operativne, strateške, analitičke), adhoc
izvještavanje
Organizacija
mjerenje performansi, BI metodologije, BI centar (objedinjavanje znanja i vještina)
Poslovanje
ključni pokazatelji uspješnosti, trendovi, transparentnost
Bitmap indexi
Join indexi
-Data Base Management System (DBMS) služi za upravljanje bazom podataka. Što
znači da aplikacija korisnika direktno ne pristupa bazi podataka nego preko DBMS-a.
DBMS je uveden kao interfejs između korisnika i baze podataka.
-Pored te funkcije također ima funkciju da: čuva podatke, omogućava fleksibilnost
podataka, integritet, sigurnost, istovremeni pristupa podacima od strane više korisnika,
oporavak prilikom kvara sistema, te automatizira administrativne poslove.
-Baza podataka i DBMS-a su osnova informacionih sistema.
2. Skladište podataka omogućavaju vođenje svakodnevnih poslovnih aktivnosti i pružaju uvid u trenutno
stanje poslova.
A) Da
B) Ne
3. STRANI ILI VANJSKI KLJUČ služi za povezivanje relacija i referencira (vezuje) se na
PRIMARNI KLJUČ.
A) Da
B) Ne
5. Transakcijske baze podataka treba
c) Ništa od navedenog
7. ETL najkomplikovani proces u čitavom projektu jer ima za zadatak da podatke iz različitih platformi
koje upravljaju različitim operacinim sistemima i aplikacijama spoji u standardni format
10. U koje kategorije prema Russell Ackoff možemo podijeliti sadržaj ljudskog uma?
11. Šta je dovelo do cijepanja između operativnih baza podataka i skladišta podataka?
transakcijske baze podataka zahtijevaju vrijeme odaziva prekinute sekunde, dok DSS
ne;
uredska zajednica koristi baze podataka orijentirane na transakciju, dok menadžerska
zajednica koristi skladišta podataka;
do kratkotrajnih odluka se dolazi iz transakcijskih sistema, a do dugoročnih iz skadišta
podataka;
transakcijske baze podataka sadrže savremene informacije, dok skladišta podataka sadrže
historijske podatke;
transakcijske baze podataka su jako neintegrirane dok skladišta podataka sadrže
integrirane
podatke;
transakcijske baze podataka su dizajnirane za detaljne podatke, dok su skladišta podataka
namijenjena za detaljne i sažete podatke;
zahtjevi za obradu u transakcijskoj sredini su statični, dok su oni za obradu u okolini baze
podataka heuristični
15. Koje tehnike analize podataka poznajemo kod TREĆA FAZA izgradnje skladišta
podataka ?
Upiti i izvještaji – najbrži i najjednosavniji pristup podacima.
Višedimenzionalne analize – proširuje mogućnost upita i izvještaja; pregled podataka
iz bilo koje dimenzije.
DM – koristi algoritme; ne treba predhodno postavljati upite.
15. Šta znači da su činjenice treba da budu: brojčane, kontinuirano vrednovane i zbrojive?
16. Koje probleme treba da riješi generisanje fizičkog modela skladišta podataka?
* senzitivnost podataka,
* trošak i brzina enkodiranja i dekodiranja,
* težina administracije,
* zahtjevi za pohranjivanje.
Slika pokazuje da podaci u jasnoj formi prolaze na dio koda (enkoder) prije nego što je
kod napisan. Enkoder „ispremeće“ podatke i onda djeluje tako da se ti podaci ispišu u
ispremetanom formatu. Podaci su nerazgovijetni prilikom pristupa u skladištu podataka
osim ako podaci nisu dekodirani (ili „de-ispremetani“). Inače samo ne-ključni, ne-
indeksirani podaci se enkodiraju. Za algoritam enkodiranja odgovara algoritam
dekodiranja (dekoder). Dekoder je dio koda koji čita u enkodiranim podacima i ispsuje
podatke u originalnom stanju. Slika prikazuje korištenje dekodera. Bez algoritma
dekodiranja, pristup skladištu podataka nema smisla. Sigurnost onda postaje stvar
zaštite korištenja i pristupa algoritmima dekodiranja.