You are on page 1of 14

PRIPREME ZA TEST 1 DATA MINING

1. Podatak je opis stvari i događaja s kojim se susrećemo. Oni mogu biti različitih oblika:
NUMERIČKI, ALFANUMERIČKI, ZVUCI, SLIKE i dr. i skladište se u bazu podataka,
organizuju na način da se lako pronalaze.

2. Metapodaci su U DIGITALNOM SMISLU STRUKTUIRANI PODACI KOJI


OPISUJU, OBJAŠNJAVAJU, LOCIRAJU ili na neki drugi način omogućavaju lakše
upravljanje resursima.

3. ETL je proces koji označava korake u kojima se od :


A) poluproizvoda dolazi do proizvoda
B) informacije do odluke
C) izvornog sistema dolazi do podataka smještenih u skladište podataka.

4. DW objedinjuje podatke iz različitih IS realizovanih koje se nalaze na istim platformama i


direktan ručni unos u DW nije dizvoljen.
A) Da
B) Ne

5. DW objedinjuje podatke iz različitih IS realizovanih koje se nalaze na istim platformama i


direktan ručni unos u DW nije dizvoljen.
A) Da
B) Ne

6. Data mart “je sposobnost kompjutera da se ponaša kao enormna memorija i prikupi sve
informacije.” Data mart predstavlja najjednostavniji oblik skladišta podataka.
A) Da
B) Ne

7. Prema modelu podatka, kakve podatke razlikujemo i objasniti?


> Strukturirani podaci – podaci o klijentu; svaki podatak ima jedinstvenu strukturu
(atribute i njihove vrijednosti i veze među njima)
> dio su modela baza podataka za čije kreiranje, obradu, pretraživanju i predstavljanje
u korisniku razumljivoj formi se koriste posebni programski sistem (DBMS)
> Nestrukturirani podaci – podaci o multimediji; kreiraju se, pretražuju i obrađuju
posebnim softverskim alatima kako bi se u njihovim međusobnim odnosima otkrila
pravila i okviri koji za korisnika imaju karakter novosti (novostvorene vrijednosti)
> Slike, binarne datoteke, tekstualni podaci u nekom prirodnom jeziku i sl. i njihov
smisao se u danom kontekstu mora objasniti.
> (Metode datamininga, ekspertni sistemi)

8. Šta podrazumjevamo pod teorijom informacija?

Pod teorijom informacija danas se podrazumijeva “matematicka teorija komuniciranja


“ koja teorija se bavim problemima komuniciranja i to pocev od : prikupljanja,
prenosa, obrade, skladištenja podataka i koristenja informacija.
9. Zašto je skladište podataka bolje od operativne baze podataka?

- ne postoji vremenska odrednica pohranjenih podataka,


- ne postoji primjena različitih algoritama obrade podataka za iste
- probleme,
- postoji ne usaglašenost naziva i značenja atributa u bazi,
- može doći do gubitka informacija,
- ne postoje procedure za usaglašavanje podataka,
- ne postoji drill-down metoda,
- otezana je softverska podrška za analizu podataka i - podaci nisu
dimenzionalno organizovani.

10. Koje tri aplikacije koristi DW (Datawarehouse)?

DW koristi najmanje 3 aplikacije :


 Osnovne radne aplikacije - graficki alati koji se koriste na individualnim
racunarima za prikaz tabela i statistickih paketa
 Aplikacija za upite i izvjestaje - generisanje izvjestaja pomocu jednostavnih
upita.
 Aplikacija za analizu i planiranje - analiza podataka u svrhu povecanja
profitabilnosti

11. Navesti koje Normalne forme imamo kod baza podataka.

Najniži nivo normalne forme jeste prva normalna forma (1NF), druga normalna forma
(2NF), treća normalna forma (3NF), treća normalna forma je kasnije promovisana kao
Boyce-Codd Normal Form (BCNF). Kasnije su se javile i više normalne forme, koje su
povezane sa BCNF, a to su četvrta (4NF) i peta (5NF) normalna forma, poznata još kao i
Project-join Normal Form (PJ/NF). Najčešće u upotrebi su prve 3 normalne forme.

12. Navesto ko su korisnici DW (Data Warehouse)/ Skladišta podataka?

> Moćnici - Rudari podataka i istraživači – transformiraju istraživanja u kompleksna


pitanja u skladištu podataka. Dodatni instrumenti i tehnike se često koriste za uzorke
podataka koji se traže. No oni uključuju takođe analitičare podataka i farmere, koji
stvaraju pitanja/istraživanja na skladištu podataka sa postojećim/tradicionalnim
instrumentima, te djeluju tako da su ovi dostupni drugim korisnicima.
> Standardni korisnici - Menadžeri - Njima trebaju instrumenti na nivou desktopa, koji
odgovaraju na ključne probleme i daju informacije vezane za trenutne probleme u
biznisu. Takođe su uključeni korisnici odsjeka koji koriste standardne aplikacije i
skupljaju jednostavne upitnike kao i eksterni korisnici
sa potencijalnim pristupom skladištu. Kao primjer se mogu navesti B2B partneri koji
imaju pristup skladištu informacija u kompaniji.
> Podaci o starim detaljima - Podaci o starim detaljima su podaci o trenutnim detaljima
koji su prošli kroz vrijeme instantne važnosti, pa su zato smješteni na drugi, jeftiniji
prostor (podaci o starim detaljima se razlikuju od podataka o trenutnim detaljima ne
logički, napravljeni su na istom nivou granularnosti podataka, već po različitoj
vremenskoj tački, govoreći historijski).
> Blago skraćeni podaci - Blago skraćeni podaci su izvučeni podaci iz podataka o
trenutnim detaljima. Oni su posrednički korak prema jako skraćenim podacima i
„gotovo uvijek sačuvani na disku.“
> Jako skraćeni podaci - „Ponekad jako skraćeni podaci se mogu naći u skladištu
podataka i u ostalim slučajevima se jako skraćeni podaci mogu naći čak van trenutnih
zidova tehnologije koja koristi kuće skladišta podataka. Bez obzira gdje su podaci
smješteni fizički, jako skraćeni podaci su dio skladišta podataka.“

13. Koje vrste baza podataka poznajemo?

formatiranih podataka, neformatiranih podataka i baze znanja.

14. Objasni pojam DIKW(Data, Information, Knowledge, Wisdom).

> DIKW(Data, Information, Knowledge, Wisdom) je prijedlog organizacije podataka,


informacija, znanja i mudrosti struktuiraju u jednu informacijsku hijerarhiju gdje
svaki nivo dodaje svoja određena svojstva iznad i ispod one prethodne
> Podatak je najosnovniji nivo, informacija dodaje kontekst, znanje dodaje kako ga
upotrijebiti, a mudrost dodaje kada i zašto ga upotrijebiti
> DIKW model se temelji na pretpostavljanju slijedećeg niza postupaka:
> podatak dolazi u obliku neobrađenih zapažanja i dimenzija,
> informacija se oblikuje analiziranjem veza i odnosa između podataka,
> znanje se oblikuje koristeći informaciju za djelovanje,
> mudrost se oblikuje kroz upotrebu znanja,
> odnosno, da bi se kreirala informacija potreban je podatak i samo kada postoji
informacija znanje može izaći na vidjelo

15. Koji podaci čine strukturu skaldišta podataka?

> Metapodaci - Metapodaci su podaci koji opisuju komponente skladišta podataka (npr.
njihovu šemu) i njihov odnos unutar skladišta podataka. Ne sadrži podatke koji su
direktno uzeti iz operativne okoline. Metapodaci (podaci o podacima, engl. metadata) je
izraz koji označava sekundarne, pomoćne podatke koji sadrže informacije o podacima u
skladištu podataka ili sadrže informacije kako te podatke najlakše obraditi. Metapodaci
nam pomažu i u izvlačenju podataka i u rješavanju upita nad podacima.
> Podaci o trenutnim detaljima - Glavna briga aplikacija DW jer održavaju aktuelne
događaje. Radi se o podacima na najnižem nivou granularnosti. Bez obzira na to, podaci
o trenutnim detaljima se inače čuvaju na disku kako bi se osigurao brz pristup pod
cijenu visokog troška i povećane kompleksnosti upravljanja.
> Podaci o starim detaljima - Podaci o starim detaljima su podaci o trenutnim detaljima
koji su prošli kroz vrijeme instantne važnosti, pa su zato smješteni na drugi, jeftiniji
prostor (podaci o starim detaljima se razlikuju od podataka o trenutnim detaljima ne
logički, napravljeni su na istom nivou granularnosti podataka, već po različitoj
vremenskoj tački, govoreći historijski).
> Blago skraćeni podaci - Blago skraćeni podaci su izvučeni podaci iz podataka o
trenutnim detaljima. Oni su posrednički korak prema jako skraćenim podacima i
„gotovo uvijek sačuvani na disku.“
> Jako skraćeni podaci - „Ponekad jako skraćeni podaci se mogu naći u skladištu
podataka i u ostalim slučajevima se jako skraćeni podaci mogu naći čak van trenutnih
zidova tehnologije koja koristi kuće skladišta podataka. Bez obzira gdje su podaci
smješteni fizički, jako skraćeni podaci su dio skladišta podataka.“

16. Šta je Entropija?

> Količina informacije se izražava pomoću entropije


> Entropija je težnja sistema da spontano pređe u stanje veće neuređenosti
> Entropija je mjera neuređenosti sistema
> U teoriji organizacije entropija se definiše kao prirodna sila koja teži da svaki
organizovani sistem dovede do stanja potpune neorganizovanosti i haosa
> Entropija izražava zakon po kome se realni sistem ne može vratiti u stanje u kome je
jednom bio bez izvjesnog gubitka energije
Informacija je suprotno od entropije

18. Šta je činjenica?

> Tablica činjenica je mjesto gdje se spremaju brojčani poslovni pokazatelji. Svaki od
tih pokazatelja se nalazi negdje na presjeku svih dimenzija. Ti pokazatelji se nazivaju
činjenicama i otuda se tablica zove tablica činjenica.
> Tipičan primjer za činjenicu je npr. atribut koji sadrži ukupnu vrijednost proizvoda
prodanog određeni dan.
> Najbolje i najkorisnije činjenice su: brojčane, kontinuirano vrednovane i zbrojive.
Činjenice trebaju biti brojčane jer su one pokazatelji nekog poslovnog procesa, a taj
proces se iskazuje nekakvim iznosima (koliki je profit, koliko firma duguje, koliki su
troškovi…).
> Činjenice su obično kontinuirano vrednovane što znaći da mogu poprimati različite
vrijednosti svaki put kad se mjere.

19. SQL programski jezik je nastao od


A) DDL, XML, QL
B)DDL, DML, QL
C)Ništa od navedenog

20. Ono što je dovelo do toga da se DW nametne i tretira kao izuzetan i potpuno novi pristup
u razvoju informacijskih tehnologija jeste što je:
Poboljšanje u razvoju hardvera, te mogućnost pohrane i obrade podataka, koja
predstavlja osnovu za korištenje DW-a.
> Kao osnovni preduvjete za praktičnu primjenu DW jeste baza podataka, koja
omogućava rad s kompleksnim upitima, brzina pristupa i rada s velikim količinama
podataka,kao i ugradnja osnova inteligencije u sisteme za upravljanje bazama
podataka.
> Dodatni podsticaj za razvoj DW jeste korištenje mrežne tehnologije za povezivanje
različitih računalni platformi, kao i Internet.
> Upotreba novih alata za podršku odlučivanju donijela značajne promjene:
multidimenzionalni analitički alati omogućavaju višestruke načine istovremenog
praćenja podataka, jer takve analize teško je izvesti bez pomoći računara jer ljudski um
nije sposoban da sve varijable istovremeno promatra.
> Omogućava praćenje konkurencije, jer organizacije su u situaciji da moraju što je više
moguće saznati o svojim kupcima ili korisnicima (njihove zahtjeve, primjedbe, navike i
slično) samo da bi i dalje ostali u tržišnoj utakmici.
> Svaka informacija ima svoju vrijednost, a to su uočili i menadžeri.

1. Informacija je podatak bitan za pomoć u izboru nekih AKTUELNIH ili BUDUĆIH akcija
ili NE-AKCIJA. Najčešće se podaci obrađuju aplikativnim programima, kako bi se proizvela
veća njihova korisnost od one koja se postiže u slučaju direktnog i jednostavnog pozivanja iz
baze podataka.

2. Kod dimenzionog modeliranja mjere su:


A) numerički podaci smješteni u činjeničnoj tabeli
B) numerički podaci smješteni u dimenzionalnim tabelama
C) Ništa od navedenog

3.Skladište podataka je sistem koji periodicno povlaci podatke iz izvornih transakcijskih


sistema i konsoliduje ih u dimenzionalno ili normalizovano spremište podataka.
A) Da
B) Ne

4.Meta baza podataka ja baza koja čuva sve podatke o:


A) Poslovnim procesima
B) Donetim odlukama
C) O podacima

5. Skladište podataka promatra MIKRO i MAKRO aspekte.


A) Da
B) Ne

6. ___ETL____ekstrakcija, transformacija i punjenje; najkomplikovani proces u čitavom


projektu jer ima za zadatak da podatke iz različitih platformi koje upravljaju različitim
operacinim sistemima i aplikacijama spoji u standardni format

7. Sa aspekta obrade kakve podatke razlikujemo i objasniti?

> Identifikacioni – podaci koji nam nešto identificiraju npr. Identifikacioni podaci o
firmi
> Klasifikacioni – podaci koje klasificiramo u određene klase
> Upravljački – podaci koji pomažu pri upravljanju
> Kvalitativni - Rezultat su promatranja, promišljanja ili druge misaone radnje -
Zapisuju se unaprijed definiranom oznakom (mogu biti i brojke) – npr. ime, zanimanje,
dijagnoza, OIB, spol
Kvantitativni - Rezultat su mjerenja i / ili brojanja - Zapisuju se brojkama i uvijek se
navodi jedinica mjerenja - upisujemo ih u izvornom obliku (onako kako su izmjereni) –
npr. dob, visina, težina, broj leukocita.

8. Godine 1991. Bil Inmon je izdao svoju prvu knjigu o skladištenju „Građenje skladišta
podataka“, koja sadrži najširu objavljenu definiciju skladišta podataka: „Skladište podataka je
predmetno-orijentirana, integrirana, vremenski različita, nepromjenjiva kolekcija podataka
koja podržava odluke rukovodioca. Objasniti značenje

> Predmetno-orijentirana
> Predmeti za skladište podataka su elementi podataka koji se koriste da se skrate
informacije Inmonovim primjerima predmeta – „potrošači, proizvodi, police“ –
su poprilično jasni primjeri za ono što multidimenzionalna zajednica zove dimenzijama.
Zato je orijentacija na predmet bila jasno raskidanje od funkcionalne organizacije
podataka koja je tada dominirala.
> Integrirana
> je jako važna, s obzirom da se skladišta podataka ne pune iz jednog izvora podataka,
već iz višestrukih operacijskih baza podataka ili čak vanjskih izvora podataka. Iz
historijskih razloga, ipak, čak jedna te ista operativna baza podataka ima često velike
nepodudarnosti kod reprezentacije podataka. Kao primjer možemo navesti
reprezentaciju 'muško' i 'žensko' kodom 'M' i 'F', 'O' i '1' ili 'istinito' i 'lažno'.
> Vremenski promjenjivi podaci
> Historijski podaci su od velike važnosti u svijetu skladišta podataka. Podaci mogu biti
dostupni u dnevnim, sedmičnim i/ili godišnjim skupinama.
> Nepromjenjiva grupa podataka
Nepromjenjivost, konačni primarni aspekat skladišta podataka, znači da nakon što su
podaci

9. Koje korake je potrebno provesti prilikom pretprocesinga podataka?

- Pronalaženje ekstremnih vrijednosti (Outliers)


- Dijagnostika nedostajućih vrijednosti i predviđanje nedostajućih vrijednosti
- Povezivanje relacijskih ključeva iz različitih izvora podataka
- Postizanje jednoobraznosti (konzistentnosti) u podacima
- Uzorkovanje
- Kategorizacija vrijednosti atributa

10. Koje su prednosti i nedostaci data mart-ova?

> Prednosti Data Mart-ova


> Data mart je alat koji se smješta na dio server tehnologije prije nego na PC-u i
omogućava brojnim korisnicima da se povežu i koriste informacije sa njega. Korisni su
za kompanije koje imaju mnogo odjeljenja i željele brzo da odgovore na poslovne
prilike.
> Nedostaci Data Mart-ova
> Skladište podataka treba da ima mogućnost da pohrane informacije. Od početka data
martovi trebaju biti izgrađeni kao skladište podataka.
> Data mart pokriva samo jedan segmenat poslovanja

12. Kroz historiju razvoja koje baze podataka poznajemo?

> Relacijski model - Podaci se u relacijskoj bazi podataka nalaze u relacijama, odnosno
tablicama. Zasnovan na pojmu relacijama između atributa. I podaci i veze među
podacima prikazuju se “pravokutnim” tabelama. U navedenom primjeru imamo 2
tabele STUDENT i ISPIT.
> Mrežni model - Baza je predočena usmjerenim grafom. Čvorovi su tipovi zapisa, a
lukovi definiraju veze među tipovima zapisa. Mrežni model omogućava svakom zapisu
da ima više nadređeni i podređeni, kreirajući mrežastu strukturu
> Hijerarhiski model - Specijalni slučaj mrežnog. Baza je predočena jednim stablom ili
skupom stabala. Čvorovi su tipovi zapisa, a hijerarhijski odnos “nadređeni-podređeni”
izražava veze među tipovima zapisa. Ovo je takozvano 1:N (one-to-many) veza između
slogova stabla. U ovom modelu, relacije su takve da jedan podređeni može imati samo
jednog nadređenog, ali nadređeni može imati više podređeni
> Objektni model – Ovaj model se koristi u slučajevima kada podatke nije moguće
predstaviti relacijskim modelom. U relaciskom modelu svaki atribut ima samo jednu
vrijednost, dok kod objektnog modela entitet je predstavljen klasom. Klasa obuhvata i
atribute i ponašanje entiteta. Inspiriran je objektno-orijentiranim programskim
jezicima. Svaki objekt pripada nekoj klasi. Između klasa se uspostavljaju veze,
agregacije

13. Šta čini modul ekspertnog sistema (ES)?

> Baza znanja (knowledge base)


> Činjenice – glavni dio podataka o sistemu
> Heuristika – čine pravila rasuđivanja i vještine
> Mehanizam zaključivanja (inference engine) – koristi činjenice iz baze znanja i
informacije od korisnika. Simulira čovjekovo razmišljanje
> Komunikacioni interface (Communication interface)
> Globalna baza podataka (Global database) – informacije vezane za tekuće probleme
odlučivanja

14.U koje kategorije prema Russell Ackoff možemo podijeliti sadržaj ljudskog uma?

> Podaci: simboli


> Informacija: podaci koji su obrađeni da bi bili upotrebljivi i korisni; odgovaraju na
pitanja “tko”,”što”, “gdje” i “kada”
> Znanje: primjena podataka i informacija; odgovara na pitanja “kako”
> Razumijevanje: odgovara na pitanje “zašto”
> Mudrost: vrednuje razumijevanje
15. Šta je dovelo do cijepanja između operativnih baza podataka i skladišta podataka?

> operativne baze podataka zahtijevaju vrijeme odaziva prekinute sekunde, dok DSS
ne;
> uredska zajednica koristi baze podataka orijentirane na transakciju, dok
menadžerska zajednica koristi skladišta podataka;
> do kratkotrajnih odluka se dolazi iz operativnih sistema, a do dugoročnih iz skadišta
podataka;
> operativne baze podataka sadrže savremene informacije, dok skladišta podataka
sadrže historijske podatke;
> operativne baze podataka su jako neintegrirane dok skladišta podataka sadrže
integrirane podatke;
> operativne baze podataka su dizajnirane za detaljne podatke, dok su skladišta
podataka namijenjena za detaljne i sažete podatke;
> zahtjevi za obradu u operativnoj sredini su statični, dok su oni za obradu u okolini
baze podataka heuristični

16. Razlika između Inmonovog viđenja skladišta podataka i Kimballovog?

> Potrebno je još spomenuti da postoje dvije (odnosno tri) vrste arhitekture skladišta
podataka. Prva je InmonovaCorporate Information Factory, gdje se svi podaci na razini
cijele tvrtke se nalaze u centralni repozitorij koji se naziva Enterprise Data Warehouse,
a karakterizira ga to što su podaci u 3. Normalnoj formi, odnosno koristi se relacijska
tehnologija, te se upiti ne postavljaju direktno u taj centralni repozitorij. On služi samo
kao osnova za Data Martove (možemo ih shvatiti kao mini skladišta podataka
specijalizirana za određeni segment poduzeća). Ti data martovi su prilagođeni za
pojedine segmente tvrtke (računovodstvo, proizvodnja, marketing…) i upiti se vrše na
njima.
> Druga vrsta arhitekture veže se za Kimball-a, a naziva se Dimensional Data
Warehouse. Iz naziva je vidljivo da se ovdje više ne koristi relacijska tehnologija, nego
isključivo dimenzijski dizajn. I ova arhitektura ima centralni repozitorij, gdje se nalaze
podaci na razini cijele tvrtke, ali se upiti vrše direktno na njemu, nema više potrebe za
data martovima, budući je sam repozitorij organiziran na dimenzijskom dizajnu.

17. Šta je dimenzija?

> “Dimenzijski model je tehnika logičkog dizajna koja teži prikazivanju podataka na
standardiziran, intuitivan način koji omogućava pristup podacima velikom brzinom.”
> Dimenzijski model se najčešće prikazuje apstraktno kao kocka čije dimenzije
predstavljaju dimenzije posla koji modeliramo, a podatak na presjeku tih dimenzija
predstavlja podatak koji tražimo.
> Broj dimenzija u praksi može biti i veći od tri pa se onda govori o višedimenzionalnoj
kocki. Gotovo u svim dimenzijskim modelima postoji dimenzija vremena. Organiziranje
i spremanje podataka prema ovom modelu omogućuje korisnicima bolje razumijevanje
podataka i omogućuje da korisnička sućelja budu jednostavnija za korištenje, a izvedba
upita na zadovoljavajućoj razini.
19. Koje tipove Metapodataka razlikujemo?

Opisni, strukturalni, administrativni.

20. Koje tehnike analize podataka poznajemo kod TREĆA FAZE izgradnje skladišta podataka?

> Upiti i izvještaji – najbrži i najjednosavniji pristup podacima. Normalizovani podaci


obezbjeđuju najbrži i najbolji pristup podacima. Biraju se povezani elementi podataka,
njihova eventualna sumiranja i grupisanja u neku od kategorija i potom se prezentuju
rezultati.
> Višedimenzionalne analize – proširuje mogućnost upita i izvještaja; pregled podataka
iz bilo koje dimenzije. Npr. Koliko je prodavnica prodalo određen proizvod, određenog
dana u određenom rasponu cijena. Može se posmatrati iz različitih uglova prvi ugao
prodavnica, drugi ugao proizvod.
> DM – koristi algoritme; ne treba predhodno postavljati upite. DM može biti
pronalaženje važnosti u vezama između određenih elemenata podataka, i formi
grupisanja određenih elemenata podataka ili u nekoj drugoj formi za korištenje
određenih grupa elemenata podataka.

1. Sintaksni metapodaci opisuju sintaksu podataka ; Strukturni metapodaci opisuju strukturu


podataka; Semantički metapodaci opisuju značenje podataka u specifičnoj domeni

2. Bazu znanja čine:


a) Mehanizmi zaključivanja
b) Činjenice i heuristika
c) Podatak i kontekst
d) Ništa od navedenog
3. Operativne baze podataka rade sa multidimentionim podacima
A) Da
B) Ne
4. Glavna namjena poslovne inteligencije su generiranje što kvalitetnijih informacija potrebnih
poslovnim sistemima za donošenje pravih poslovnih odluka.

A) Da
B) Ne

5. Mjere su:

a) Numerički podaci unutar činjeničnih tabela

b) Binarni podaci unutar dimenzijskih tabela

c) Denormalizirani podaci

d) Ništa od navedenog

6. Činjenice treba da budu: brojčane, kontinuirano vrednovane i zbrojive

7. Skladište podataka je sistem koji periodicno povlaci podatke iz izvornih transakcijskih sistema i
konsoliduje ih u dimenzionalno ili normalizovano spremište podataka.
A) Da
B) Ne
8. ETL je proces koji označava korake u kojima se od
A) poluproizvoda dolazi do proizvoda
B) informacije do odluke
C) izvornog sistema dolazi do podataka smještenih u skladište podataka.
11. Objasni pojam DIKW(Data, Information, Knowledge, Wisdom).

DIKW(Data, Information, Knowledge, Wisdom) je prijedlog organizacije podataka,


informacija, znanja i mudrosti struktuiraju u jednu informacijsku hijerarhiju gdje
svaki nivo dodaje svoja određena svojstva iznad i ispod one prethodne

13. Od koji faza se sastoji faza mapiranja i transformacije podataka i objasni?


> kreiranje plana transformacije podataka - Plan transformacije podataka služi da bi se
odredio najbolji put migracije izvornih podataka do DW kao i dokumentovanje svih
izvornih platformi, metodi pristupa i programski jezik koji je potreban za ekstrakciju
podataka
> razvoj procedura za transformaciju podataka - Pod korakom transformacije
podataka podrazumjevamo da ako pravimo DW i
imamo isti podatak različito označen u dvije baze podataka, tada je potrebno da jedan
od njih transformišemo da bi dobili jedinstvene oznake za taj atribut
> razvoj procedura za učitavanje podataka - Kreiranje formata podataka, Prenošenje
podataka iz starijih sistema u DW, Kreiranje agregacija, Kreiranje ključeva za
agregacione zapise, Obrada neučitanih podataka, Indeksiranje podataka

> testiranje procedura - Nakon realizacije ekstrakciju i učitavanje podataka potrebno je


izvršiti testiranje, koje je se ostvaruje provjerom kvalitete podataka. Kvaliteta se
provjerava zadavanjem upita uz pomoć kojeg se vrši prebrojavanje podataka ili prikaz
u grafičkom obliku.
> generisanje metapodataka - Nakon realizacije svih predhodnih faza možemo preći na
posljednji korak, a to je izrade Meta baza podataka, koja je ustvari baza podataka o
bazi podataka.
> Meta baza podataka čuva sve podatke o podacima tako što ih mapira i uspostavlja
vezu između podataka sa izvora. Oni čuvaju informacije o transakcionim podacima.
> Tek nakon uspostavljanja meta baze podataka može se krenuti dalje u izdvajanje
podataka iz transakcione baze podataka, pa potom sumiranje, sortiranje i
organizovanje prije punjenja DW.

15. Koje su komponente sistema poslovne inteligencije (BI)?

 Infrastruktura
skladište podataka, ETL alati, Operativno spremište podataka
 Funkcionalnost
BI platforme, Data Mining, BI aplikacije (operativne, strateške, analitičke), adhoc
izvještavanje
 Organizacija
mjerenje performansi, BI metodologije, BI centar (objedinjavanje znanja i vještina)
 Poslovanje
ključni pokazatelji uspješnosti, trendovi, transparentnost

16. Od koji faza se sastoji mapiranja i transformacije podataka ?


PITANJE BROJ 13

17.Koji su osnovni ciljevi skladišta podataka (DW)?


Osnovna funkcija skladišta podataka je skupljanje i organizovanje podataka na način
da budu lako dostupni kako bi menadžment mogao na brz i jednostavan način da izvodi
analize svog poslovanja.
Skladište podataka mora omogućiti pristup podacima bitnim za neku organizaciju ili
kompaniju. Podaci u skladištu podataka moraju biti konzistentni
Podaci se u skladištu podataka mogu kombinirati na sve moguće načine (engl. dice and
slice requirement). Skladište podataka nisu samo podaci, već ono mora sadržavati i skup
alata za postavljanje upita (engl. query tools), alata za analizu i predstavljanje
informacije

18. Zašto je skladište podataka uspjelo?

> Jer pruža :


* integrirane podatke preko svih aplikacija tako da se zaista korporativan pogled na
informacije može formirati,
* sadrži ogromnu historijsku podlogu, tako da potrebe i za novijim (trenutne) i
historijskim informacijama mogu da se ostvare, te
* sadrži i detaljne i sumirane podatke tako da se mogu stvoriti perspektive
menadžmenta.

19. Koje dvije tehnike indeksiranja se koriste u DW?

Bitmap indexi
Join indexi

20. Zašto koristimo DBMS (DataBase Management System)?

-Data Base Management System (DBMS) služi za upravljanje bazom podataka. Što
znači da aplikacija korisnika direktno ne pristupa bazi podataka nego preko DBMS-a.
DBMS je uveden kao interfejs između korisnika i baze podataka.
-Pored te funkcije također ima funkciju da: čuva podatke, omogućava fleksibilnost
podataka, integritet, sigurnost, istovremeni pristupa podacima od strane više korisnika,
oporavak prilikom kvara sistema, te automatizira administrativne poslove.
-Baza podataka i DBMS-a su osnova informacionih sistema.

1. Tehnički metapodaci daju informacije o strukturama i sadržaju podataka i to unutrašnjim


metapodacima; poslovni metapodaci daju informacije o izvoru podataka

2. Skladište podataka omogućavaju vođenje svakodnevnih poslovnih aktivnosti i pružaju uvid u trenutno
stanje poslova.
A) Da
B) Ne
3. STRANI ILI VANJSKI KLJUČ služi za povezivanje relacija i referencira (vezuje) se na
PRIMARNI KLJUČ.

4. Ključna tehnika poslovne inteligencije je OLAP multidimenzionalna obrada podataka.

A) Da
B) Ne
5. Transakcijske baze podataka treba

a) Logički i fizički odvojiti

b) Koristiti zajedno unutar kompanije

c) Ništa od navedenog

6. Dimenzijske tablice su DENORMALIZIRANE radi jednostavnosti dizajna i učinkovitijeg izvođenja


upita.

7. ETL najkomplikovani proces u čitavom projektu jer ima za zadatak da podatke iz različitih platformi
koje upravljaju različitim operacinim sistemima i aplikacijama spoji u standardni format

8. 4. DW objedinjuje podatke iz različitih IS realizovanih koje se nalaze na istim platformama i direktan


ručni unos u DW nije dizvoljen.
A) Da
B) Ne

9. Koje korake je potrebno provesti prilikom pretprocesinga podataka?

Pronalaženje ekstremnih vrijednosti (Outliers), Dijagnostika nedostajućih vrijednosti i


predviđanje nedostajućih vrijednosti, Povezivanje relacijskih ključeva iz različitih
izvora podataka, Postizanje jednoobraznosti (konzistentnosti) u podacima, Uzorkovanje
(sample), Kategorizacija vrijednosti atributa, Grupiranje podataka

10. U koje kategorije prema Russell Ackoff možemo podijeliti sadržaj ljudskog uma?

Podaci, informacija, znanje, razumijevanje, mudrost.

11. Šta je dovelo do cijepanja između operativnih baza podataka i skladišta podataka?

transakcijske baze podataka zahtijevaju vrijeme odaziva prekinute sekunde, dok DSS
ne;
uredska zajednica koristi baze podataka orijentirane na transakciju, dok menadžerska
zajednica koristi skladišta podataka;
do kratkotrajnih odluka se dolazi iz transakcijskih sistema, a do dugoročnih iz skadišta
podataka;
transakcijske baze podataka sadrže savremene informacije, dok skladišta podataka sadrže
historijske podatke;
transakcijske baze podataka su jako neintegrirane dok skladišta podataka sadrže
integrirane
podatke;
transakcijske baze podataka su dizajnirane za detaljne podatke, dok su skladišta podataka
namijenjena za detaljne i sažete podatke;
zahtjevi za obradu u transakcijskoj sredini su statični, dok su oni za obradu u okolini baze
podataka heuristični

12. Razlika između Inmonovog viđenja skladišta podataka i Kimballovog?


Relacijski dizajnirani podaci – Inmon
Multidimenzionalno dizajnirani podaci – Kimbal
13. Šta je dimenzija?

Dimenzije omogućavaju selekcija i grupacija podataka u različitim smjerovima.


Izgradnja i održavanje dimenzija često podrazumijeva korištenje podataka iz
više izvora.

14. SQL programski jezik je nastao od?


A)DDL, XML, QL
B)DDL, DML, QL
C)Ništa od navedenog

15. Koje tehnike analize podataka poznajemo kod TREĆA FAZA izgradnje skladišta
podataka ?
Upiti i izvještaji – najbrži i najjednosavniji pristup podacima.
Višedimenzionalne analize – proširuje mogućnost upita i izvještaja; pregled podataka
iz bilo koje dimenzije.
DM – koristi algoritme; ne treba predhodno postavljati upite.

15. Šta znači da su činjenice treba da budu: brojčane, kontinuirano vrednovane i zbrojive?

Činjenice i ne moraju biti kontinuirano vrednovane, već se to pravilo o kontinuiranoj


vrijednosti više koristi kao snažna preporuka dizajnerima skladišta podataka kako bi
lakše razlučili činjenice od dimenzijskih atributa.
Najbolje činjenice su zbrojive i uvijek se teži k tome da činjenice budu zbrojive. Razlog
tomu je činjenica da se pri gotovo svakom upitu prolazi kroz stotine, hiljade, pa čak i
milijune zapisa kako bi se izgradio odgovor. Taj veliki broj zapisa se može sažeti u
nekoliko redova ako se činjenice zbroje.
Činjenice u tablici činjenica mogu još biti nezbrojive ili poluzbrojive.
Poluzbrojive činjenice se mogu zbrajati samo kroz neke dimenzije, dok se nezbrojive uopće
ne mogu zbrajati kroz nijednu dimenziju, a to nije prihvatljivo za skladišta podataka.

16. Koje probleme treba da riješi generisanje fizičkog modela skladišta podataka?

i. MULTIPLIKATIVNOST- broj instanci jednog eniteta u relaciji sa instancom drugog


entiteta
ii. REFERENCIJALNI INTEGRITET – unesena vrijednost atributa odgovara vrijednosti
primarnog ključa druge tabele; definiše se za operacije ubacivanje, brisanje i ažuriranje
podataka
iii. INDEKSIRANJE – za sve primarne ključeve u entitetu, čak i prenesene ključeve, jer se
pomoću njih vrši pretraživanje u DW
17. Stupanj sofisticiranosti algoritma enkodiranja ovisi o nekoliko faktora:

* senzitivnost podataka,
* trošak i brzina enkodiranja i dekodiranja,
* težina administracije,
* zahtjevi za pohranjivanje.

18. Šta čini unutrašnju sigurnost skladišta podataka DW?

Slika pokazuje da podaci u jasnoj formi prolaze na dio koda (enkoder) prije nego što je
kod napisan. Enkoder „ispremeće“ podatke i onda djeluje tako da se ti podaci ispišu u
ispremetanom formatu. Podaci su nerazgovijetni prilikom pristupa u skladištu podataka
osim ako podaci nisu dekodirani (ili „de-ispremetani“). Inače samo ne-ključni, ne-
indeksirani podaci se enkodiraju. Za algoritam enkodiranja odgovara algoritam
dekodiranja (dekoder). Dekoder je dio koda koji čita u enkodiranim podacima i ispsuje
podatke u originalnom stanju. Slika prikazuje korištenje dekodera. Bez algoritma
dekodiranja, pristup skladištu podataka nema smisla. Sigurnost onda postaje stvar
zaštite korištenja i pristupa algoritmima dekodiranja.

20. Zašto koristimo DBMS ?


Jednostavan pristup podacima, upravljanje zalihostima i nekonzistentnošću,
transakcijska obrada, složeni odnosi među podacima, istovremeni pristup više
korisnika, autorizirani pristup.

You might also like