Professional Documents
Culture Documents
Klaster Analiza
Klaster Analiza
EKONOMSKI FAKULTET
PRISTUPNI RAD
KLASTER ANALIZA
Mentor:
Prof. dr Miodrag Lovri
Doktoranti:
Ili Milena
2008/13
Reovi Selvija 2008/25
Kragujevac, 19.06.2009.god.
SADRAJ
UVOD
2
6
6
7
7
8
8
3.1. Izbor uzorka na kojem se vri klasterizacija
9
3.2. Izbor varijabli koje e reprezentovati obeleja objekata (entiteta)10
3.3. Odluka o transformaciji varijabli
11
3.4. Izbor mere udaljenosti / slinosti:
11
3.4.1. Mere slinosti
11
3.4.2. Mere korelacije
11
3.4.3. Mere udaljenosti
12
3.4.4. Mere udruivanja
12
3.5. Izbor metode za povezivanje objekata u klastere
15
3.5.1. Hijerarhisjki postupak klasterovanja
15
3.5.2. Nehijerarhijski postupak klasterovanja
17
3.5.3. Aglomeracioni postupak: tabelarni prikaz
19
3.5.4. Dendrogram: ematski prikaz
21
4.
5.
6.
7.
8.
9.
21
22
22
23
23
24
25
25
26
29
32
ZAKLJUAK
LITERATURA
37
37
UVOD
Akademici i istraivai trita se esto sreu sa situacijama koje su najbolje reene
definisanjem grupa homogenih objekata bilo da su individue, firme, proizvodi ili ak njihova
2
Klaster analiza moe izvriti redukciju podataka objektivno putem redukcije informacija
iz cele populacije ili uzorka do informacija o specifinim, manjim podgrupama. Klaster analiza
je takoe korisna kada istraiva poeli da razvija hipoteze uzimajui u obzir prirodu
podataka ili da ispita prethodno ustanovljene hipoteze. Na primer, istraiva moe verovati da
stavovi prema konzumaciji dijetalnih nasuprot obinim piima mogu biti korieni da izdvoje
korisnike soft pia u logine segmente ili grupe. Klaster analiza moe da klasifikuje korisnike
bezalkoholnih pia po njihovim stavovima o dijetalnim nasuprot obinim bezalkoholnim
piima , i rezultujui klasteri,ako postoje, mogu biti profilirani za demografske slinosti i
razlike.
Ipak, uz pogodnosti klaster analize idu i neke opomene. Klaster analiza moe biti
okarakterisana kao opisna, ateoretina i noninferentna. Klaster analiza nema statistiku
osnovu kojih se mogu izvui statistika zakljuivanja iz uzorka do populacije i koriena je
prvenstveno kao tehnika istraivanja. Reenja nisu jedinstvena , kao to lanstvo u klasteru
za bilo koji broj reenja zavisi od mnogih elemenata u proceduri, i mnoga razliita reenja
mogu biti dobijena varijetetima jednog ili razliitih elemenata. tavie, klaster analiza e uvek
kreirati klastere bez obzira na istinsko postojanje bilo kakve sturkture u podacima. Konano,
klaster reenje u potpunosti zavisi od varijabli koje su koriene kao osnova za meru
slinosti. Dodavanja ili brisanja relevantnih varijabli moe imati znaajan uticaj na rezultujue
reenje. Dakle, istraiva mora voditi rauna u proceni uticaja svake odluke ukljuene u
izvoenje klaster analize.
U klaster analizi grupna pripadnost objekata nije poznata, kao ni konani broj
grupa.Cilj klaster analize jest utvrivanje homogenih grupa ili klastera. Naelno jedinice koje
ine klastere mogu biti neki objekti (varijable) ili ispitanici.
U prvoj situaciji pokuavamo utvrditi grupisanje nekih objekata, entiteta (ispitanika,
gradova,kola, ivotinja i sl.) prema nekim varijablama, kao npr.
Primer 1: grupiranje objekata prema izmjerenim karakteristikama
Objekti
Objekt 1
Objekt 2
Objekt 3
...
Objekt N
VAR k
X11
X21
X31
X12
X22
X32
X13
X23
X33
X1k
X2k
X3k
XN1
XN2
XN3
XNk
U gornjem sluaju klaster analizom pokuali bismo utvrditi kako se grupiu objekti
obzirom na neke njihove izmerene karakteristike. Pretpostavimo da objekte ine politike
stranke, od 1. do N-te. Relevantne karakteristike pojedinih stranaka reprezentiraju neke
numerike varijable, od 1 do k. Potrebna nam je barem jedna varijabla s nekim izmerenim
karakteristikama objekata. Pretpostavimo da za svaku stranku imamo 3 varijable koje
reprezentiraju njene relevantne karakteristike:
P1= poloaj na dimenziji levica - desnica;
P2 = broj lanova;
VAR k
X11
X21
X31
X12
X22
X 32
X13
X23
X33
X1k
X2k
X3k
XN1
XN2
XN3
XNk
U ovom gornjem sluaju zanima nas kako se grupiu ispitanici prema nekim njihovim
karakteristikama (V1 do Vk)
Drugu moguu situaciju s obzirom na sadraj ulazne matrice moe predstavljati
sluaj kada su nam u kolonama varijable (varijable u tom sluaju predstavljaju objekte ili
entitete) ije grupiranje nastojimo ispitati, dok su nam u redovima ispitanici koji su procenjivali
svaki od objekata prema nekoj karakteristici i koji nam slue kao izvor informacije o slinosti
ili razliitosti varijabli.
ne bi bilo mogue videti razlike u stavovima. Iz tog razloga istraiva mora biti svestan teine
varijabli zasnovane na relativnoj disperziji.
2.
Primarni cilj klaster analize je podela objekata u dve ili vise grupa na osnovu slinosti
odredjenih obeleja (klaster varijabla). Pri formiranju homogenih grupa, istraiva moe
postii bilo koji od sledea tri cilja:
1. Taksonomija opisa. Najpoznatiji tradicionalini nain korienja klaster analize je u
istraivake svrhe i za formiranje jednog taksonoma (taksonomija je oblast sistematike
koja se bavi prouavanjem principa, metoda i pravila klasifikacije, drugim reima,
taksonomija je nauka o taksonomskim jedinicama) empirijski zasnovana klasifikacija
objekata. Kao to je ranije opisano, klaster analiza se koristi u irokom spektru
aplikacija za njegovu ocenu sposobnosti. Ali klaster analiza moe takodje generisati
hipoteye koje se odnose na strukturu objekata. Ipak, iako je posmatran prvenstveno
kao istraivaka tehnika, klaster analiza moe se koristiti za potvrdu neega ve
ustanovljenog. Ako je predloena struktura moe biti definisana za skuo objekata,
klaster analiza moe biti primenjena a predloena tipologija ( teorijski zasnovana
klasifikacija) moe se porediti na osnovu onoga to je izvedeno klaster analizom.
2. Pojednostavljenje podataka. U toku izvodjenja procesa taksonomije, klaster analiza
takodje postie pojednostavljen nain posmatranja. Sa definisanom strukturom
zapaanja mogu biti grupisana u cilju daljih analiza. Dok faktorska analiza pokuava
da prui dimenzije ili strukturu promenljivih, klaster analiza obavlja isto to sa
posmatranjem. Stoga, umesto da gledaju sva zapaanja kao jedinstvena, one mogu
biti posmatrana kao lanovi klastera i profilisani po svojim optim karakteristikama.
3. Identifikacija odnosa. Sa definisanim klasterima i osnovnom strukturom podataka u
njima, istraiva objanjava odnos izmedju posmatranja koje nije bilo mogue sa
individualnim posmatranjem. S toga, klaster analiza prikazuje odnos ili slinosti i
razlike koje prehodne analize nisu objavile.
(odvojeni) od drugih grupa tako da kada je odbaena, moemo uvesti pristrasnost u proceni
strukture. Istraiva mora shvatiti da je klaster analiza dobra u reprezentativnosti uzorka.
Dakle, sve napore treba preduzeti kako bi se osiguralo da je uzorak reprezentativan i da su
rezultati od opteg interesa za celu populaciju.
10
11
12
Distance (X,Y) =
(X
Yi ) 2
Primer:
X
Y
X-Y
(X-Y)2
V1
6
4
V2
2
2
V3
3
5
Distance
(X
Yi ) 2
Primer:
X
Y
X-Y
(X-Y)2
V1
6
4
V2
2
2
V3
3
5
Distance
13
Distance (X,Y) =
X i Yi
Primer:
X
Y
X-Y
V1
6
4
V2
2
2
V3
3
5
Distance
MAX X i Yi
V1
6
4
V2
2
2
V3
3
5
Distance
14
15
16
Odreuje udaljenost izmeu klastera kao udaljenost izmeu aritmetikih sredina oba
klastera (njihovih centroida). Jedan nedostatak centroidne metode jeste u tome to se
poetna udaljenost dva klastera moe smanjiti izmeu dva sukcesivna koraka analize.
Klasteri spojeni u kasnijim fazama su vie razliiti nego oni spojeni u ranijim koracima. U
centroidnoj metodi udaljenost izmedju dva klastera je udaljenost (tipino kvadratna Euklidova
ili prosta Euklidova metoda) izmedju njihovih centroida. Centroidni klaster znai srednju
vrednost posmatranih varijabli u klaster promenljivima. Po ovoj metodi, svaki put kada je su
pojedinci grupisani, centroid je preraunat. Postoji promena u klaster klaster centroidu svaki
put kada se jedinka ili grupa jedinki doda postojeem klasteru. Ove metode su najpopularnije
kod biologa, ali mogu napraviti nered I esto zbunjujue rezultate. Konfuzija nastaje zbog
inverzije ili obrnutosti koja se javlja kada izmerena udaljenost izmedju jednog para centroida
je manja u odnosu na neko ranije merenje. Prednost ove metode je das u manji uticaji na
outliere u odnosu na neke druge metode.
17
18
19
Na slici je tzv. aglomeracioni raspored (poetak i kraj sredinu samo odsekli jer bi
slika onda bila prevelika) koji pokazuje kako ta je sa im spajano (korak po korak). U koloni
STAGE je redni broj koraka koji se opisuje. U koloni CLUSTER COMBINED su dati redni
brojevi (imena) klastera koji se spajaju u datom koraku. U koloni COEFFICIENTS je su data
udaljenosti klastera koji se spajaju. U koloni STAGE CLUSTER FIRST APPEARS su podaci o
tome u kom je koraku prvi odnosno drugi klaster nastao (za pojedinane ispitanike ovde je
vrednost 0) i konano u koloni NEXT STAGE su podaci o koraku u kom se ovde
novoformirani klaster prvi put pojavljuje. Novoformirani klaster nasleuje broj (ime) od onog
od sastavnih klastera koji ima manji broj. Dakle, npr. u prvom koraku se spajaju klasteri 3 i 56
(koji su pojedinani ispitanici to se vidi iz kolona STAGE CLUSTER FIRST APPEARS gde
imaju vrednosti 0, a sem toga to je i prvi korak, pa jo nema vielanih klastera) i formira se
novi klaster koji se zove 3, a koji se ponovo pojavljuje u koraku broj 6. Njihova udaljenost u
trenutku spajanja je 0,02 (tj. 2,0000E-02).
Jo se moe primetiti da su kako koraci odmiu klasteri koji se spajaju sve udaljeniji i
udaljeniji, a poto ovde nema oiglednog kolena (sluaja da je u nekom koraku udaljenost
spojenih klastera mnogo vea nego u prethodnom), ostaje i pitanje koliko klastera zadrati
(ostaje da se o tome odluka donosi na osnovu teorijskih postavki i znanja o problemu koji se
ispituje).
20
Na ovoj slici je tzv. Dendrogram (tanije njegov deo) koji pokazuje grafiki isto to i
aglomeracioni raspored. Linije pokazuju ta se sa im spaja, na vertikalnoj osi su entiteti, a
na horizontalnoj je udaljenost. Znai, npr. ispitanici 3 i 56 su spojeni u isti klaster u jednom od
koraka i njihova udaljenost (reskalirano ne mora da se poklapa sa brojkama iz
aglomeracionog rasporeda), onda je taj klaster spojen sa klasterom koji su inili entiteti 24 i
29 itd.
21
Postoji odredjeni broj specifinih procedura koje su predloene ali se ni jedna nije
pokazala kao najbolja u svim situacijama. Takodje, istraivai moraju dati vrste procene, sa
konceptom teorijskih odnosa koji moe predloiti prirodan broj klastera. Moe se pokrenuti
proces u kojem odredjeni kriterijumi, na osnovu praktinih ispitivanja, pokazuju da rezultati
moraju biti pregledni i razumljivi za komunikaciju kada se poseduje prirodan broj klastera, tj.
od 3-6, i tada najbolje reenje za ovaj broj klastera je izbor najbolje alternative posle njihove
procene. U konanoj analizi je verovatno najbolje da se uzme jedan broj klaster reenja (npr.
2,3,4) i tada doneti odluku, sa alternativnim reenjima, koristei apriori kriterijume i praktinu
ocenu, zdrav razum ili teorijske ocene. Klaster reenja e biti poboljana kada se nadju
reenja za konceptualne aspekte problema.
Osnovni problem jeste gde povui crtu, tako da ostane optimalni broj klastera. Treba
rei da ovaj problem nema zadovoljavajue reenje. Itertivne metode zahtevaju od korisnika
da unapred odredi broj klastera. U statistikom smislu nulta-hipoteza o nepostojanju strukture
unutar nekog skupa objekata nije sasvim jasna, pa ni smislena.
U socijalnim znanostima dominiraju dva pristupa odreivanju broja klastera: heuristiki
pristup, i formalni testovi. Prvi pristup je najei, a odnosi se na subjektivno postavljanje
granice na dendrogramu dobivenom hijerahijskom klasterizacijom. Osnovni kriterijum jeste
smislenost ili interpretabilnost dobijenog reenja.
Drugi nain, podjednako subjektivan (slian scree plot testu kod faktorske analize)
jest analiza koeficijenata (koeficijenti fuzije) koji pokazuju slinosti meu klasterima pri
sukcesivnom spajanju klastera. Naglo opadanje (ili poveanje vrednosti kod mera
udaljenosti) ukazuje na manju povezanost meu klasterima koji se spajaju. Nagli skok
ukazuje na spajanje dva relativno razliita klastera.
22
23
izvodio na sveim podacima, to bi tada bio jedan logian opis. A ukoliko su podaci
standardizovani ili ukoliko se klaster analiza izvodi koristei faktorsku analizu, istraivai se
vraaju na svee podatke za poetne varijable i izraunavaju prosek koristei te podatke.
Nastavljajui sa naim primerom bezalkoholnih osveavajuih pia u ovoj fazi ispitaemo
proseni rezultat profila uz izvetaj za svaku grupu i davanja opisne veze za svaki klaster
posebno. Mnogo se puta diskriminaciona analiza primenjuje za generisanje ocene profila, ali
se nesme zaboraviti da statistiki znaajne razlike nisu optimalno reenje, jer se to oekuje s
obzirom na cilj klaster analize. Ispitivanje profila omoguava jedan bogat opis svakog
klastera pojedinano. Na primer, imamo dva klastera sa povoljnim stavom o dijetalnim
napicima i trei klaster sa nepovoljim stavom. ta vie, dva klastera sa povoljnim stavom
mogu imati povoljne stavove prema obema vrstama napitaka i to prema dijet i obinom
bezalkoholnom piu. Iz ovog analitikog procesa moemo oceniti stav svakog klastera i
razvijati znaajne interpretacije radi olakanog obeleavanja svakog pojedinano. Na primer,
jedan klaster moe biti oznaen kao zdravstveno-kalorijska svesnost dok drugi moe biti
oznaen kao dobijanje eernog napada.
Profilisanje i interpretacija klastera postigla je mnogo vie nego to je opisano. Prvo,
oni pruaju sredstva za procenu slinosti dobijenog klastera od teorije do prakse. Kod
upotrebe u utvrdjenom modelu, klaster analiza profila prua direktna sredstva za procenu
slinosti. Drugo, klaster profili pruaju jedan nain za ocenjivanje praktinog znaenja.
Istraivai mogu zahtevati da postoje velike razlike u setu klaster varijabli pa klaster reenja
mogu biti proirena sve dok se razlika poveava. U procenjivanju njihovih slinosti ili njihovog
praktinog znaenja, istraivai uporedjuju dobijene klastere sa unapred odredjenjim
klasterima.
24
V1
12.5
V2
11.0
V3
12.0
V4
10.7
Postupak u kome se unapred definie broj klastera, pa onda kompjuter krene od nekih
sluajno rasporeenih taaka (poetni centri) ili se definiu koordinate poetnih centara
klastera, pa onda program rauna i premeta ispitanike iz klastera u klaster, raunajui
centroide klastera u svakom koraku iznova i pravi razne kombinacije sve dok se ne nae
takvo reenje u kome je varijabilitet unutar klastera (udaljenost ispitanika od centroida) to je
mogue manji, a varijabilnost izmeu klastera (tj. meusobna udaljenost centroida klastera)
to je mogue vei (pria o varijabilnosti unutar i izmeu grupa je kao kod analize varijanse).
25
26
otii
na
27
U Meniju Metod treba treba definisati koji metod sprovoenja klaster analize (Cluster
Method) elimo (tj. ta je kriterijum udaljenosti dva klastera vidi gore objanjenje metoda).
Nakon toga treba definisati nivo merenja na kom su merene nae varijable. U igri su
Intervalni, Apsolutni (Counts nastaju prebrojavanjem prirodne jedinice merenja, sve
ostalo kao za racio skalu (realna nula, jednake jedinice) ili binarni nivo merenja, a nakon to
to odaberemo treba odabrati i meru udaljenosti (vidi gore za mere udaljenosti) koju elimo da
se koristi.
Poto je uslov za smislenu primenu klaster analize to da sve varijable budu na istoj
skali (idealno ista AS i SD), ako to nije sluaj treba ih transponovati sve na istu skalu i to se
moe naloiti SPSS da se uradi (opcija Standardizuj Standardize ima razliitih skala na
koje je mogue transponovati vrednosti). Takoe je mogue transformisati vrednosti tako da
im se promeni znak (obrtanje skale) opcija Promeni znak (Change sign), da se pretvore u
apsolutne vrednostni (Absolute Values) ili da se reskaliraju na raspon od 0 do 1 (Rescale to
0-1 range).
koliko najvie klastera da snima reenja) snimi u matricu sa podacima nove varijable koje za
svakog ispitanika definiu njegovu klastersku pripadnost u datom klasterskom reenju).
8. Primer broj 1
Primer podataka
1 znai da je ispitanik vezan za promenljivu i 0 znai da ispitanik nije vezan za
promenljivu. Podaci su generisani pomou DE/WC lexikona i prebacuju se u Excel tabele to
je od velike vanosti, radi sagledavanja zajednikog cilja.
Ispitanici su prikazani u levoj koloni a promenljive su navedene u prvom redu na vrhu tabele.
Promenljive predstavljaju sledee:
Povrina ili podruje: region ispitanika
BU: vrsta poslovnih jedinica
P: nezadovoljstvo ispitanika proizvodima
S: nezadovoljstvo ispitanika uslugama
Respondent 1
Respondent 2
Respondent 3
Respondent 4
Respondent 5
Respondent 6
Respondent 7
Respondent 8
Respondent 9
Respondent 10
Respondent 11
Respondent 12
Respondent 13
Respondent 14
Respondent 15
Respondent 16
Respondent 17
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
0
0
1
0
0
0
1
1
1
0
1
1
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
1
1
1
0
0
0
1
0
0
0
0
1
0
0
1
0
0
1
0
0
0
0
0
1
1
1
0
0
0
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
1
0
0
0
1
0
1
1
1
1
0
0
0
1
1
1
1
1
1
1
1
1
1
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
1
1
1
1
1
1
0
0
0
0
1
0
0
0
0
0
0
1
1
1
1
0
1
0
1
1
0
0
1
1
1
0
0
0
1
1
1
1
1
0
0
0
0
0
1
0
0
0
0
0
0
1
1
1
0
1
0
0
0
0
0
1
0
0
0
0
0
0
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
1
1
1
0
0
0
0
0
0
1
1
1
1
0
1
1
1
1
1
1
0
0
0
0
0
0
1
0
1
0
0
0
1
1
1
1
1
0
0
0
0
0
0
29
30
31
9. Primer broj 2
Matrica podataka
Ekipa
Juventus
Milan
Udinese
Cagliari
Inter
Lecce
Palermo
Sampdoria
Roma
Chievo
Livorno
Fiorentina
Reggina
Messina
Lazio
Brescia
Bologna
O
1
5
1
5
1
5
1
5
1
5
1
5
1
5
1
5
1
5
1
5
1
5
1
5
1
5
1
5
1
5
1
5
1
Ukupno
D N I
1
2 2 1
1
0 4 1
8
4
1
2
5
3
2
4
8
8
B
3
8
3
4
2
8
2
2
2
1
2
1
2
1
2
1
2
0
2
0
1
9
1
9
1
9
1
8
1
7
1
7
1
Domain
O D N I
7
8
7
2
2
B
1
9
1
5
Gost
O D N I
8
11
1
7
11
1
3
1
4
1
0
1
0
1
2
1
3
1
2
1
3
1
2
1
2
5
3
32
B
1
9
1
9
1
7
Gol razlika
Dato Primljeno
28
27
22
13
24
25
5
1
0
32
24
30
26
13
11
11
11
11
1
0
25
22
14
18
17
19
14
17
14
17
18
24
19
20
7
8
7
8
3
1
1
2
3
5
8
1
0
5
13
13
20
18
5
1
5
1
5
1
5
Parma
Siena
Atalanta
O Odigrano
3
1
2
1
2
D Dobijeno
1
0
15
24
10
23
11
22
N Nereeno
I Izgubljeno
Variable View:
33
B Bodovi
Reenje:
Naredbom iz menija: AnalyzeClassifyHierarhical Cluster pokreemo
hijerarhisku klaster analizu. U polje Variable(s) ubacujemo promenljive na osnovu kojih se
vri analiza. U polje Label Cases by ubacujemo varijablu tipa String preko koje identifikujemo
objekte (u naem sluaju ekipe). U opcijama Plots izaberemo opciju Dendogram kako bi na
izlazu dobili i dendogram povezivanja objekata. U opcije metoda (Method) biramo metod za
analizu (u naem sluaju to je jednostruko povezivanje Nearest neighbor) i kao interval za
meru izabiramo Euklidsko kvadratno odstojanje. Pritiskom na dugme OK dobijamo rezultate
analize.
Dendogram je grafiki izvetaj reenja problema. Objekti su poreani po levoj
vertikalnoj osi. Horizontalna osa pokazuje razdaljinu izmeu objekata kada se povezuju.
Deljenje dendograma kako bi dobili odreen broj grupa je subjektivna procena. Generalno
traimo velike skokove izmeu povezivanja na horizontalnoj osi. Vidimo da je najvei skok
kada se povezuje objekat broj 20 (Atalanta) sa objektima 1 i 3 (Juventus i Udineze), pa
presecanjem dendograma na ovom mestu moemo dobiti dve grupe. Ponavljanjem ovog
postupka moemo dobiti proizvoljan broj grupa
34
Agglomeration Schedule
Stage Cluster First
Appears
Cluster Combined
Stage
1
2
Cluster 1
11
17
Cluster 2
13
19
Coefficients
,000
1,000
Cluster 1
0
0
Cluster 2
0
0
Next Stage
3
13
11
14
1,000
10
12
1,000
10
11
1,000
10
1,000
1,000
1,000
10
2,000
11
10
15
5,000
11
11
5,000
10
12
12
16
8,000
11
13
13
17
10,000
12
14
14
20
13,000
13
15
35
15
18
13,000
14
16
16
13,000
15
19
17
16,000
18
18
20,000
17
19
19
37,000
18
16
36
ZAKLJUAK
Klaster analiza daje istraivaima jednu empirijsku i objektivnu metodu za izvodjenje
jednog od najbitnijih zadataka kao to je klasifikacija ljudi. Da li za svrhu uproavanja,
istraivanja ili potvrde, klaster analiza je jedan vrlo moan analitiki aparat koji ima vrlo iroku
paletu upotrebe. Ali ova tehnika povlai odgovornost istraivaa pa oni moraju sa
odredjenom dozom opreza nju koristiti. Medjutim, ukoliko je podesno korste, ona tada ima
potencija da otkrije podarke koji do tada nisu otkriveni pomou drugih metoda. Tako, ova jaka
tehnika adresa na koju se javljaju istraivai, zahteva velika istraivanja na svim poljima,
mora biti potpomognuta velikim znanjem jer lako moe doi do loe upotrebe.
LITERATURA
1.
2. www.ffzg.hr
3. www.hm.co.rs
4. www.hamilton-locke.com
5. www.cubaselogic.googlepages.com
6. www.norusis.com
7. www.statisticshell.com
37