You are on page 1of 6

1. ta je Data mining?

Rudarenje podataka je proces pronalaenja novog i potencijalno korisnog znanja iz podataka, odnosno
kao otkrivanje ili rudarenje znanja iz velike koliine podataka.
2. Sa kojim terminima se Data mining izjednaava?
otkrivanje i predvianje znanja
3. Koje koncepte, metode i tehnike upotrebljava Data mining?
Baze podataka, statistiku i vjetaku inteligenciju
4. ta predstavlja otkrivanje znanja?
Proces otkrivanja znanja implicira korisnikovo razumevanje izreenih informacija za koje je bitno da su u
itljivom obliku.
5. ta predstavlja predvianje znanja?
Odnosi se na budue dogaaje i u nekim pristupima moe biti itljivo i providno dok u drugim
neprovidno.
6. Porijeklo pojma Data mining-a?
Potie od prvih stvari koje su se pojavile sa pojavom raunara.
7. ta je mainsko uenje?
Mainsko uenje - kao oblast vjetake inteligencije predstavlja skup paradigmi, algoritama,
teorijskih rezultata i primjena iz razliitih oblasti vjetake inteligencije i evolucionih modela (u smislu
pretraivanja) ali i drugih oblasti: statistike i vjerovatnoe (Bajesov klasifikator, raspodjele i testovi) i
drugih oblasti matematike, teorije izraunljivosti (mora postojati svijest o sloenosti problema i
ogranienjima koja proistiu iz toga), teorije (adaptivnog) upravljanja, informacione teorije, psihlogije
i neurobiologije (neuronske mree), filozofije, kognitivnih i drugih nauka.
8. ta je vjetaka inteligencija?
predstavlja mjeavinu konvencionalne nauke, fiziologije i psihologije, sve u cilju da se napravi maina
koja bi se, po ljudskim mjerilima, mogla smatrati "inteligentnom".
9. ta je baza podataka?
Baze podataka predstavlja kolekciju podataka organizovanih za brzo pretraivanje i pristup, koja
zajedno sa sistemom za administraciju, organizovanje i memorisanje tih podataka, ini sistem baze
podataka. Iz ugla korisnika, podaci su na neki nain logiki nain povezani.
10.Gdje je najvie zastupljeno koritenje Data mining a?
U poslovanju Data Mining se najvie koristi na podruju marketinga
11.Za ta se koristi Data mining u marketingu?
Direktni marketing
Izradu profila kupca
Segmentaciju
Istrazivanje povezanosti prodaje razlicitih proizvoda
Stimulacija kupovine drugih artikala istog preduzeca
Zadrzavanja kupaca

12.Gdje se koristi Data mining u bankarstvu?


Prognoze loih platia kreditinih rata, prognoze vrijednosti dionica i osiguranju.
13.Koritenje data mining a u edukaciji !
Omoguavanje korienje Data Mininga menaderima i bez specijalizovanog strunog znanja.
14.Koritenje data mining a u zdravstvu!
Povezivanje demografskih podataka sa kritinim oboljenjima, uvid u identifikaciju simptoma opasnosti,
uzroci opasnosti i itd...
15.Koje se metode koriste za rudaranje podataka?
PREDVIDIVE : Klasifikacija, Regresija, Vremenske serije, Predvianja te OPISNE: Klasterovanje ,
sumarizacija, Pravila pridruivanja, Nizovi otkria
16.ta je to klasifikacija?
Klasifikacija je potraga za novim uzorcima, a moe da prouzrokuje promjenu naina organizovanja
podataka

17.Navesti par primjera primjene klasifikacije!


Direktni marketing
Otkrivanje prevara
Otkrivanje terorista
Odliv priliv kupaca
Katagoliziranje nebeskih tijela
18.Kada se upotrebljava regresija?
na osnovu vrijednosti nekih promjenljivih se predvia vrijednost promjenljive iji je domen skup realnih
brojeva
1. Predvia se koliina prodaje novog artikla na osnovu utroenih sredstava u reklamnoj kampanji
2. Predvia se brzina vjetra kao funkcija temeprature, vlanosti, vazdunog pritiska, koliine oblaka
3. Predvia se cijena akcija na berzi u zavisnosti od vremenskog perioda i optih ekonomskih prilika na
tritu
19.ta je analiza vremenskih serija?
Istrauju se promjene vrijednosti atributa kroz vrijeme
20.ta je predvianje?
Vid klasifikacije kod koga se predviaju budua stanja na osnovu prolih i trenutnih stanja podataka
21.Navesti par primjera primjene predvianja!

Predvianje ponaanja glasakog tijela na izborima


Cilj: raspisati izbore u "pogodnom" momentu
Pristup:
a) istorija glasanja u nekoj oblasti
b) obrazovno-socijalna struktura stanovnitva

c) podjela teritorije na "pogodne" okruge


d) promjena sistema glasanja

Predvianje poplava
Cilj: predvidjeti na vrijeme poplave da bi se umanjile posledice
Pristup:
a) mjerenje vodostaja
b) mjerenje koliine padavina
c) vremenska prognoza
22.ta je grupisanje (klasterovanje)?
Grupisanje (Klastering) - je razvrstavanje jedinki u grupe u kojima je postignuta njihova najvea
slinost. Slini podaci (u odnosu na odgovarajue atribute) se grupiu zajedno u klastere.Klasteri nisu
unaprijed odreeni. Obino je potrebno znanje eksperta da bi protumaio znaenje formiranih klastera.
Naziva se i uenje bez nadzora jer klasteri nisu odreeni prije ispitivanja podataka. Segmentacija
pojam koji se ee koristi kod baza podataka. Oznaava podelu podataka u disjunktne grupe.
23.Primjeri klasterovanja!

Upravljanje Marketnigom
Cilj: smanjiti trokove tampe kataloga u robnim kuama. Katalozi su namijenjeni demografskim
grupama u zavisnosti od atributa (zarada, lokacija, nivo obrazovanja, fizike karakteristike - visina,
teina, ...)potencijalnih kupaca
Pristup:
a. koristi se klasterovanje potencijalnih kupaca na osnovu odreivanja vrijednosti atributa
b. Na osnovu izlaza se formiraju posebni katalozi za odreene grupe kupaca

Otkrivanje prevara
Cilj: preduprediti mogue prevare kreditnim karticama
Pristup:
a. registrovanje transakcija svih vlasnika kartica zajedno sa informacijama o godinjem prihodu,
kreditnoj sposobnosti,godinama ivota, ...
b. broj prevara sa karticama je relativno mali u odnosu na broj transakcija primenom tehnika za
otkrivanje anomalija se formira profil vaee transakcije za korisnika.
c. svaka nova transakcija se poredi sa profilom korisnika
d. u sluaju velike razlike transakcija se oznaava kao mogue rizina, odn. potencijalna prevara
24.ta je sumarizacija?
Sumarizacija (Summarization) - Preslikava podatke u podskupove sa pridruenim (jednostavnim)
opisima. Izdvaja ili izvodi reprezentativne informacije iz baze.Naziva se i karakterizacija ili
generalizacija. Iz podataka mogu da se izvedu i razliiti sumarni prikazi (npr. numeriki).

25.ta je pridruivanje?
Pridruivanje (Association Rules) - su pravila oblika AKO-TADA. Pokazuje vjerovatnost da jedan
dogaaj vee uz sebe drugi dogaaj. Analiza pridruivanja (analiza veza, analiza afiniteta) oznaava
otkrivanje obrazaca koji opisuju meusobno vrsto povezane osobine podataka. Obino se predstavljaju
preko implikacije ili osobina podskupova. Kako prostor koji se pretrauje raste eksponencijalno, cilj je
izdvojiti najinteresantnije obrasce na najefikasniji nain.
26.Koje su metode rudarenja podataka?

Stabla odluke, Neuronske mree, genetski algoritmi, text mining (tekst rudarstvo)
27.ta je stablo odluivanja?
Stabla odluke - su serije pravila pomou kojih se izdvajaju odreene klase ili vrijednosti. Mogu se
podijeliti kandidati za kredit na dobre ili loe. Prva komponenta u stablu odluke jeste korijen stabla
koji sutinski predstavlja test koji treba uraditi. Sutina tog testa je grananje stabla na podstabla od
kojih svako predstavlja jedan od moguih odgovora. Zavisno od algoritma svaki nod stabla moe imati
dva ili vie podstabla. Svako podstablo vodi do noda koji predstavlja novu taku odluke i tako se ide do
dna stabla do nodova koji se nazivaju listovi,koji predstavljaju zavrnu klasifikaciju i predstavljaju
odgovor na postavljeno pitanje.
28.ta su neuronske mree?
Neuronske mree - djeluju slino ljudskom mozgu. One se upotrebljavaju u analizi rizika i
prognoziranju npr. vrijednosti deonica. Rudarenje podataka temeljeno na ovoj metodi poinje
uenjem mree pomou podataka za koje je poznata vrijednost koju elimo prognozirati. Nakon toga
naueno znanje se provjerava. Postupak uenja i provjere ponavlja se sve dok rezultati provjere ne budu
zadovoljavajui. Problem neuronske mree je to to ona funkcionie kao crna kutija, pa tako ona daje
odgovore, ali ne daje objanjenja, pa korisnik ne mora strogo da vjeruje metodu neuronske mree. Za
upotrebu neuronskih mrea,potrebna je intenzivna obuka, jer se ona razlikuje od klasinih statistikih
metoda.
29.Koje su prednosti, a koji nedostaci upotrebe neuronskih mrea?
Dobre strane neuronskih mrea:
1) iroke su primjene, daju dobre rezultate u veliokom broju komplikovanih problem.
Loe strane neuronskih mrea:
1) Neuronske mree ne pomau razumjevanju podataka
2) Ulazne i izlazne vrijednosti najee moraju biti normalizovane u odgovarajue intervale
30.ta su genetski algoritmi?
Genetski algoritmi - su temeljeni na ideji imitiranja pravila biolokog razvoja. Koriste se za
optimizaciju i mainsko uenje pri rjeavanju problema. Primjena genetskih algoritama je mogua u
sluajevima kada problem moemo opisati kao pretraivanje ili optimizaciju proizvoljnih podataka, te
poznajemo nain mogueg mjerenja uspjenosti svakog pojedinog rjeenja.
31.Koje su karakteristike genetskih algoritama?
Model
Davanje prednosti nekom kriterijumu radi izbora najboljeg modela
Tehnike za pretraivanje podataka
32.ta je Text mining?
Tekst rudarstvo (Text Mining) - ponekad naizmjenino nazivaju tekst data mining, odnosi se na
proces izvoenja kvalitetnih informacija iz teksta. Kvalitetne informacioje obino se izvode kroz
osmiljavanje uzoraka i trendova putem sredstava kao to su statistiki uzorak za uenje. Tekst
rudarstvo obino ukljuuje proces strukturiranja unosa teksta (obino ralanjivanjem, uz dodatak nekih
izvedenih jezinih karakteristika i uklanjanje drugih, i kasnije ubacivanje u bazu podataka), iz ega
proistiu uzorci unutar strukturiranih podataka, te konano procenu i tumaenje izlaza.
33.ta je proces rudarenja podataka?
Proces Data Mininga sastoji se od vie faza koje jedna osoba samostalno ne moe izvriti. Te faze,
odnosno zadatke, moemo posmatrati iz tri perspektive. Prva je problemska perspektiva koja je vana
na samom poetku i kraju Data Mininga. Sastoji se od odabira problema, njegovog definisanja, procjene
i primjene znanja. Osoba koja obavlja ove zadatke moe se jednostavno nazvati korisnik. Druga
perspektiva je perspektiva podataka i obuhvata sve zadatke vezane za pripremu podataka za njihovo
rudarenje, a obavlja je informatiar. Metodoloka perspektiva, kao trea i poslednja, sastoji se od svih
zadataka vezanih za analizu podataka, metode selekcije, implementacije, prezentacije i interpretacije

rezultata. Osoba zaduena za te zadatke je strunjak Data Mininga.


34.Nabrojati korake rudarenja podataka?
Definisanje problema
Prikupljanje i priprema podataka
Odabir metode Data Mininga
Uenje
Interpretacija rezultata
35.Opisati korak Definisanje problema kod rudarenja podataka!
Definisanje problema
Ovo je prvi korak kod Data Mininga. Znai treba se definisati problem koji se eli rijeiti. Ako se
problem loe definie, ne moe se oekivati da e Data Mining u poslovnom smislu biti uspjean, iako
rezultati analize mogu biti adekvatni.
Primjer dobrog definisanja problema je primjer banke s velikim brojem klijenata koji kasne s
otplatama rata hipotekarnih kredita. Ovde banka eli ustanoviti da li je mogue od podataka o
zaduenicima predvidjeti hoe li on kasniti s otplatama ili ne.
36.Opisati korak Prikupljanje i priprema podataka kod rudarenja podataka!
Prikupljanje i priprema podataka
Iskustva iz prakse pokazuju da je najvei trud u procesu Data Mininga potrebno uloiti u ovaj korak.
Zavisno o kvalitetu i organizovanosti podataka u organizaciji, uloeni rad u ovoj fazi kree se od 5080% cjelokupnog truda u procesu Data Mininga.Izbor i priprema podataka su kritine aktivnosti za
konani uspjeh projekta. Ovaj korak obuhvata izbor izvora podataka, integraciju podataka iz razliitih
baza podataka, njihovo ienje i dodatno sakupljanje podataka koji su potrebni, a nisu trenutno
raspoloivi.
37.Opisati korak Odabir metode Data mininga kod rudarenja podataka!
Odabir metode Data Mininga
U ovom koraku se ne moe znati najbolja metoda, jer sve zavisi od prirode problema. Npr. neuronske
mree su najbolje obrazloenje neke pojave npr. vrijednost kue,a metoda stabla odluivanja je
pogodna za npr. analizu odobravanja kredita. Znai potrebno je vie metoda rudarenja prvo
eksperimentisati pa onda izabrati onu najbolju koja daje rezultate.
38.Opisati korak Uenje kod rudarenja podataka!
Ovdje metoda ui na podacima. Ovdje postoji opasnost da se uz previe uenja dobiju rezultati koji
odlino odgovaraju podacima na kojima je algoritam uio i izgradio model, a loe buduim podacima. A
cilj modela je da se dobro ponaa na buduim podacima.
39.Opisati korak Interpretacija rezultata kod rudarenja podataka!
U ovom koraku analitiar na kraju odluuje da li pravilo zanimljivo, relevantno i upotrebljivo za
organizaciju.
40.Ko su uesnici u procesu Data mining a?
U procesu Data Mininga poeljno je da saradjuju:
informatiar on brine o pripremi podataka
analitiar podataka to je npr. statistiar. On brine o izboru metode i metodolokoj interpretaciji
rezultata rudarenja
strunjak on mora biti poznavalac poslovnog podruja, koji definie poslovni problem, odabira
relevantne podatke, interpretira rezultate i predlae aktivnosti na temelju rezultata rudarenja

menader projekta - on planira i organizovano vodi projekat Data Mininga


41.Nabrojati neke alate za rudaranje podataka!
Clementine
Darwin
Rapid miner
SAS
Model1
S-plus
42.ta je SPSS Clementine?
Alat koji je najvie korien u period od decembra 2008. godine do maja 2009. godine bio je IBM-ov alat
SPSS PASW Modeler (nekadanji Clementine),

You might also like