You are on page 1of 8

1.Uloga DM tehnika u uspjesnom CRM sistemu?

Upravljanje odnosima sa kupcima (CRM -Customer Relationship Management) integrisanje i


analiziranje podataka o klijentima sa Interneta i drugih, tradicionalnih izvora podataka, rad i njihova
privlaenja, zadravanja, te poveanja profitabilnosti.
2.ta organizacija dobija koristenjem BI?
Osnauje svoju konkurentnost na trzistu,Optimizaciju sopstvenih poslovnih procesa,pojednostavljuje
pretrazivanje,pristup i analizu informacija,implementira ideju transformacije podataka u korisne
informacije.
3.ta nam daje BI?
Poslovna inteligencija poboljava pravovremenu dostupnost kao i bolji kvalitet samih informacija, a
menaderima omoguava bolji uvid u poloaj njihove firme u poredjenju sa konkurencijom.
4.Blok dijagram povezivanja DW-a i OLAP-a.

5.Koji se procesi i alati primjenjuju u procesu izgradnje DW-a?


ETL,EII,EAI.EII je proces integracije informacija a EAI je proces integracije aplikacije.
6.Prednosti DW-a u odnosu na operativnu bazu podataka?
Jer kod klasicne baze podataka : ne postoji opta vremenska odrednica podataka, ne postoji primena
razliitih algoritama obrade za iste probleme, postoji neusaglaenost naziva i znaenja atributa,moe
doi do gubitka informacija, ne postoje procedure za usaglaavanje podataka,ne postoje "drill-down"
izvetajni mehanizami, je oteana softverska podrka za analizu podataka i nema dimenzione baze
podataka.
7.Sta je meta baza podataka a sta su meta podaci?
Meta baza podataka, odnosno renik podataka je baza podataka o bazi podataka.Metapodatak je
podatak o drugom podatku.
8.Faze kreiranja DW-a?
ETL - Extraction, Transformation, Loading,EII Enterprise Information Integration,
EAI Enterprise Application Integration.

9.Od cega se sastoji skriveni dio DW-a?


Skriveni dio DW-a se sastoji od izvornih sistema koji se dijele na interne(arhiva i transakcije) i
eksterne(informacije o kupcima,statistika,konkurenti)
10.Od kojih se procedura sastoji ETL proces?
ETL se sastoji od procedura:ekstrakcije(extraction),transformacije(transformation) I
ucitavanja(loading).

11.Sta je ETL proces?


ETL je proces u izgradnji Data Warehouse-a koji obuhvata ekstrakciju podataka,transformaciju tih
podataka te na kraju ucitavanje podataka u bazu podataka.
12.Komponente DTS paketa?
1.Konekcije-Dozvoljava konekciju bilo kojem OLE (ObjectLinking and Embeded) DB compliant data
source(popustljiv izvor podataka).
2. Zadatke (taskove)-Zadatak je set komandi smetenih u paket. Taskovi mogu biti ugraeni u paket ili
pak da se prilagodjavaju
3. Koraci-Korak daje logiku paketu, postavlja redosled izvoenja paketa.
4. Globalne variable Proiruje dinamike mogunosti DTS-a.
13.Da bi uspjesno mogao raditi sta OLAP treba da ispuni?
Coddova pravila:1.Viedimenzionalni konceptualni pogled,2. Transparentnost,
3. Pristupanost,4. Konzistentne performanse izvetavanja,5. Klijent/server arhitektura,6. Generiko
dimenzionisanje,7. Dinamiko upravljanje matricama,8. Viekorisniki rad,9. Neograniene operacije
sa unakrsnim dimenzijama,10. Intuitivno upravljanje podacima,11. Fleksibilno izvetavanje,
12. Neograniene dimenzije i nivo agregacije.
14.Osnovni elementi OLAP sistema?
Osnovni elementi OLAP sistema su: baza podataka, koja slui kao osnova za analizu,OLAP server, za
upravljanje i manipulaciju podacima, interfejs sistem, prema korisniku i prema drugim aplikacijama i
alati za administriranje.
15.Sta je OLAP kocka i koje su njene prednosti?
OLAP kocka je struktura koja struktura koja OLAP-u omogucava visedimenzionalnu
funkcionalnost.Prednosti:
1. Izuzetne performanse u izvravanju kompleksnih upita,2. Ne ugroava konkurentnost obrade,3. Ne
zavisi od DBMS,4. Moe da objedinjuje podatke iz vie razliitih DBMS i 5. Poseduje jezik specijalno
dizajniran za analizu podataka.
16.Sta preduzecu omogucava koristenje OLAP kocke?
Kocka omoguuje multidimenzioni pogled na podatke, a, sa druge strane,moe da se poredi sa tabelom
u bazi podatka. Specifian dizajn OLAP kocke garantuje optimizaciju izvetaja.
17.Cime je Nigel Pendse prosirio OLAP?
Definicijom FASMI.Fast(brzina),Analysis(analiticnost),Shared(djeljivost
resursa),Multidimension(visedimenzionalnost),Information(informacija).
18.O cemu treba voditi racuna u procesu preciscavanja po Inmonu?
Treba voditi racuna o tome da se kontinuirano provjerava kvalitet podataka koji su pohranjeni u Data
Warehouse-u.
19.Koje korake treba izvesti kod rjesavanja problema?
Izgradnja Data Warehouse - DW:- ekstrakcija podataka,- transformacija podataka i- uitavanje
podataka.2. Generisanje OLAP kocke.,3. Prezentacija reenja.4. Donoenje odluke.
20.Tehnike DM-a?
Neuronske mreze,memorijsko zasnovano prosudjivanje,pravila asocijacija,Nave Bayas,Sequence
Clustering,Vremenske serije i Text Mining.

21.Sta omogucava primjena teorije fazi skupova?


Teorija fazi skupova omoguila je da se,usled nedostatka dobre evidencije, neizvesnost i
nepreciznost eliminiu.
22. ta su neuronske mree i gde se primenjuju?
Neuronske mree modeluju neuronske veze u ljudskom mozgu i na taj nain simuliraju uenje(ako
prodajete auto na cijenu uticu godine,stanje,proizvodjac,model)Nizom ulaznih i izlaznih faktora moze
se predvidjeti cijena prodaje.
23.Stablo odlucivanja?
Vrlo popularna metoda za klasifikaciju i predvidjanje.Koriscenjem serije pitanja i pravila za
kategorizaciju podataka mogu se predvidjeti da ce izvjesni tipovi imati specificne ishode.
24.Sta najvise doprinosi upravljanu znanjem?
Proces pronalaenja korisnih informacija iuzoraka u podacima.Upravljanju znanjem doprinose sljedeci
proscesi: Selekcija: Dobijanje podataka iz razliitih izvora,Preprocesiranje:ienje
podataka,Transformacija: Konverzija u odgovarajui oblik.Transformisanje u novi format,Data
Mining: Dobijanje eljenih rezultata,Interpretacijan/Evaluacija: Prezentovanje rezultata koja e se
koristiti na odgovarajui nain.
25.Sta je rudarenje podataka?
Data mining -DM je automatski ili poluautomatski proces koji izvodi znaajna pravila ili obrasce iz
ogromne koliine podataka.DM programi analiziraju delove podataka da bi
identifikovali veze izmeu naizgled "nepovezanih podataka".

26.Sta je histogram i koja je njegova primjena?


Histogram predstavlja nain prikazivanja podatakarasporeenih u odreene kategorije ili grupe. U
statistici histogram predstavlja grafiki prikaz tabelarnog predstavljanja frekvencije uz pomo
podeenih pravougaonika.Primjenjuje se u statistickim istrazivanjima.
27.Koraci u otkrivanju znanja?
Definisanje zadatka, Otkrivanje podataka, Izbor i ienje podataka, Transformacija podataka,
Redukovanje podataka, Otkrivanje obrazaca, Interpretacija rezultata i vizualizacija, Stavljanje znanja u
funkciju.
28.Koraci izgradnje DM model?
Izbor tehnike Data mininga, identifikacija sluaja, izbor entiteta koji treba da se predvidi,identifikacija
podataka za analizu, opciono kreiranje dimenzije i virtuelne kocke iz rezultujueg modela i obrada
modela i prikupljanje rezultata.
29.Tehnike i metode DM-a?
Tehnike: Grupisanje (Clustering),Neuronske mree,Fuzzy logika,Memorijski zasnovano prosuivanje
(MBR), Stablo odluivanja,Analiza potroake torbe.Metode: Klasifikacija,Grupisanje ,Pravila
asocijacije,Otkrivanje uzoraka Regresija,Otkrivanje devijacije.
31.Upotreba DM-a?
Bankarstvo,osiguranje,trgovina,policija,marketing,reklamiranje na internetu,zdravstvo,detekcija
prevara,prodaja na veliko,telekomunikacije,analiza dionica,turizam.

32.Od cega se sastoji DM algoritam?


Sastoji se od :
Cilj: Podesiti podatke kao model Descriptive Predictive;
Prioritet Pronai tehnike koje e omoguiti izbor najboljeg modela
Pretraivanje Tehnike pretraivanja podataka Query.

33.Deskriptivni i prediktivni model DM-a?


Deskriptivni-pomaze u razumijevanju procesa koji je opisan podacima.
Prediktivni-jednacina ili skup pravila koji omogucavaju predikciju zavisne varijable ili atributa na
osnovu skupa nezavisnih varijabli.
34.Komercijalni aspekti DM-a?
Komercijalni aspekt:Prikupljena je velika koliina podataka i smetena u DW,Web data, e-commerce,
Trgovine i supermarketi, Banke/transakcije kreditnim karticama,Raunari postali jeftiniji i snaniji,Jak
pritisak konkurencije,Obezbediti bolji i prilagoen servis (npr. Customer Relationship Management)
35.DM sa aspekta nauke?
Podaci prikupljeni i smeteni velikom brzinom (npr. GB/sat),Daljinski senzori na satelitu,Teleskopsko
skeniranje neba,Mikroskopsko generisanje podataka o genima,Nauna simulacija generisanja TB
podataka,Tradicionalne tehnike neizvodljive za sirove podatke.DM moe pomoi naunicima:U
klasifikaciji i segmentaciji podataka,U formiranju hipoteza.
37.Sta je klasifikacija?
Klasifikacija - potraga za novim uzorcima (moe
da prouzrokuje promenu naina organizovanja podataka).Pronalaenje modela koji opisuju razlike u
klasama ili konceptima za budue predvianje.
38.Sta je asocijacija?
Asocijacija traenje uzoraka sa povezanim dogaajima. Asocijacija pokuava da utvrdi koje se
osobine javljaju zajedno kod vie uzoraka u istoj transakciji, u istom dogaaju.Ona pokuava da
identifikuje zajednitvo i da ga iskoristi.
39.Sta je sekvencijalna analiza?
Sekvencijalna analiza traenje uzoraka u kojima jedan dogaaj kasnije dovodi do drugog.
Sekvencijalna analiza otkriva ponaanje objekta posmatranjem tokom vremena.
40.Sta je grupisanje?
Grupisanje(Clustering) je grupisanje zapisa podataka koji su slicni,pronalazenje i vizuelno
dokumentovanje prethodno nepoznatih grupa cinjenica.
41.Sta je predvidjanje?
Predvidjanje je otkrivanje uzoraka podataka koji vode do razumnog predvidjanja u buducnosti.
43.Sta je fuzzy skup?
Fuzzy skupovi su osnovni elementi kojima opisujemo nepreciznost.Fuzzy skupovi sadre elemente sa
slinim svojstvima.
44.Sta je fuzzy logika?
Fuzzy logika nejasna logika: Bavi se odlukama u sivoj zoni, Koristi kreativne procese za donoenje
odluka. U fuzzy logici pripadnost nekog elementa nekom skupu se meri u procentima.

45.Osnovne osobine fazi skupa su?


1. normalnost-Maksimalna vrednost funkcije pripadnosti je 1.
2. konveksnost
a) konveksan b) nekonveksan
3. broj elemenata -Broj elemenata skupa rauna sa kao zbir vrednosti
funkcije pripadnosti svakog elementa.
46.Fazifikacija,defaizifikacija,metoda tezista?
Fazifikacija predstavlja skaliranje realnihvrednosti u fazi vrednosti;defazifikacija je skaliranje fazi
vrednosti u realne vrednosti;metoda teita je algoritam za izraunavanje fazi upravljanja.
47.Sta je uzorak?
Uzorak je izabrani deo statistikog skupa koji treba da predstavlja reprezent populacije koja je
obuhvaena istraivanjem.Uzorak signalizira povezanost izmeu varijabli ali ne govori o njihovoj
uzronoposledinoj vezi.
48.Metode prepoznavanja uzorka?
Statisticka,sintakticka,metoda matematicke klasifikacije,treniranje i ucenje.
49.Statisticki pristup prepoznavanju uzorka?
Prvi postupak je donoenje odluke koje merne podatke izdvojiti iz objekta posmatranja. Drugi postupak
je klasifikacija koja se bazira na izdvojenim mernim podacima.
50.Sintakticki pristup prepoznavanju uzorka?
Sintaktiki pristup se koristi kod problema prepoznavanja uzoraka kod kojih je bitna struktura
informacije koja opisuje svaki objekt posmatranja ili uzorak. Baziran je na strukturi informacije koja
opisuje svaki objekt posmatranja.
51.Faze u prepoznavanju uzorka?
Objekt posmatranja moramo pretvoriti u podesnu formuza obradu na raunaru.
2. Sledea faza prepoznavanja uzoraka je ekstrakcija podataka kojom se smanjuje broj podataka na
potreban i dovoljan broj za opis objekta posmatranja, za opis uzorka.
3. Nakon utvrivanja opisa objekta posmatranja vri se klasifikacija.
52.Matematicke metode klasifikacije?
Matematike metode klasifikacije:linearna diskriminantna funkcija,minimalna distanca,metoda
najblieg suseda,polinom diskriminantne funkcije.
54.Sta je potrebno za razvoj stabla odlucivanja?
Potrebno je nai najbolje pitanje za svakigranu stabla na koje treba pronai odgovor.b. Moe postojati i
vie pitanja na koja treba dati odgovor kod kreiranja stabla odluivanja.
55.Osnovne varijable stabla odlucivanja?
Kostur stabla odluivanja, koji pomou grafikonaprikazuje strategije, mogue posledice svake
strategije i identifikovano stanje, verovatnoa razliitih posledica izabrane strategije, uslovna vrednost
(trokovi) pripadajue posledice ioekivana vrednost za pripadajue plaanje ili trokove.

56.Greedy algoritam-Greedy? Pohlepni metod koristi se za reavanje problema optimizacije, odnosno


problema u kojima se pretrauje skup nekih konfiguracija da bi se pronala ona koja minimizuje ili
maksimizuje ciljnu finkciju definisanu nad svim konfiguracijama.Ovakva konfiguracija se naziva
optimalno reenje.
57.ID3 algoritam?
ID3 pretrauje preko atributa svih primera u skupu podataka, te nalazi atribut koji najbolje odvaja
primere odreene klase. ID3 moe generisati stabla koja rade i pogrene klasifikacije na skupu primera
za uenje.
58.Kategorije stabla odlucivanja?
Classification tree analysis predvieni rezultati su klase kojoj prpadaju podaci.Regression Tree
analysis predvieni rezultati su realni brojevi (npr. cena kue).CART - Clasification and Regression
Tree je kombinacija gornje dve procedure CHi-squared Automatic Interaction Detector(CHAID)
izvrava multi level razdvajanja u procesu izraunavanja stabla...Random Forest klasifikator sastoji
se od vie stabla odluivanja.
59.Web Mining?
Rudarenje Weba je dio rudarenja podataka specijalizirano za otkrivanje podataka na internetu,
integracija informacija prikupljenih od strane tradicionalnih metoda i tehnika rudarenja podataka, sa
informacijama prikupljenim na internetu.
60.CRM i WEB Mining?
CRM aplikacije mogu imati Web Mining osobine koje grupiu kupce u segmente,Web Mining moze
pomoci CRM-u informacijama o kupcima i navikama i osobinama kupaca,sto je znacajno za
poslovanje.
61.ROC kriva?
Moemo komparirati dva klasifikacijska modela preko irokog spektra pouzdanosti pomocu ROC krive
koja opisuje ovisnost broja stvarno pozitivnih primjera naspram broja lav no pozitivnih primjera
detektiranih modelom, ili pak senzitivnost naspram veliini.
62.ROC analiza-?
Pojam graninih vrijednosti pouzdanosti odredjenog klasifikatora. Za vrlo striktne granine vrijednosti
pouzdanosti (visoka pouzdanost), senzitivnost klasifikatora je uvijek niska, a specifinost visoka.
63.Sta je masinsko ucenje?
Disciplina koja se bavi izgradnjom prilagodljivih raunarskih sistema koji su sposobni da poboljavaju
svoje performanse uenjem.

64.Biometrijski sistemi?
Veliki je interes za korienje biometrike u aplikacijama za identifikaciju. Oni
imaju niz prednosti u odnosu na sisteme zasnovane na znanju ili posedovanju. Sa aspekta sigurnosti
neophodno je ukazati na ogranienja biometrijskih sistema, kao i odrediti stepen njihove ugroenosti od
razliitih napada.
65.Metoda K najblizeg susjeda?
Metoda lokalne regresije s teinskim faktorima i zakljuivanje na temelju sluajeva.

66.Sta su samoorganizirajuce mape?


Disciplina koja se bavi izgradnjom prilagodljivih raunarskih sistema koji su sposobni da poboljavaju
svoje performanse uenjem, uva prostorne odnose meu pojedinim clusterima.
67.Rudarenje podataka sa aspekta BI?
DM predstavlja proces koji koristi razne alate za analizu podataka s ciljem otkrivanja oblika I odnosa
meu podacima, koji onda mogu biti upotrebljeni za predvianja, anticipiranje promena i donoenje
znanjem podranihodluka.
68.Bayesove mreze?
Bayesove su mree grafiki prikaz distribucija vjerojatnosti. Uglavnom se koriste za predstavljanje
neodreenosti u raznim domenama na jednostavan i lako razumljiv nain. Bayesova mrea se sastoji
od usmjerenog aciklinog grafa (eng. Directed acyclic graph, DAG) i skupa tablica uslovnih
vjerojatnosti.
69.REFII model?
REF II model predstavlja novi pristup u analizi vremenskih serija, koji se oslanja na jedinstveni model
transformacije vremenske serije. Prednost ovakvog pristupa oituje se u mogunosti integracije itavog
niza analitikih postupaka nad vremenskom serijom.
70.Survivali modeli?
Survivali modeli koriste se za ranopronalaenje zajednikih karakteristika klijenatakoji su prekinuli
saradnju, analizu trendova prekida kao i prorauna verovatnoe duine poslovnog odnosa klijenta.
71.Asocijativni algoritmi?
Asocijativni algoritmi obrauju podatke putem asocijativnih pravila koja ukazuju na to koliko se
esto dogaaji pojavljuju zajedno(apriori algoritam i stablo frekventnih uzoraka).Odreeni su
pitanjima:ta ako,ako tada.
72.Sta omogucava analiza veza?
Pronalazi meuzavisnost izmeu posmatranih kategorija atributa preraunavajui frekvencije
pojavljivanja veza meu njima.
73.Sta je CRISP metoda?
CRISP DM je skraenica od Cross Industry Standard Process for Data Mining i vjerojatno jedna od
najpopularnijih metologija rudarenja podataka pri rjeavanju odreenih (poslovnih) problema. CRISP
se sastoji od est osnovnih koraka, a oni su:Definiranje poslovnog cilja ,Razumijevanje
podataka,Priprema podataka,Modeliranje,Evaluacija,Implementacija.

Napomena:
Pitanja 30,36,42 i 53 se ponavljaju pa zbog toga su ona
preskoena.

You might also like