You are on page 1of 27

1.

Multivarijaciona statistika analiza 1



F
F
a
a
k
k
t
t
o
o
r
r
s
s
k
k
a
a
a
a
n
n
a
a
l
l
i
i
z
z
a
a

Faktorska analiza predstavlja jednu od najpopularnijih multivarijacionih tehnika koja ima dva cilja:
1. Identifikacija i razumevanje osnovne ideje, odnosno zajednikih karakteristika za vie
varijabli.
2. Smanjivanje broja varijabli u analizi kada ih je previe, pri emu se neke od njih
preklapaju jer imaju slino znaenje i ponaanje.
Faktorska analiza je tehnika meuzavisnosti jer trai grupu varijabli koje su sline u smislu da se
zajedno pomeraju i zbog toga imaju veliku meuzavisnost. Kada jedna varijabla ima veliku
vrednost, onda i ostale varijable u grupi imaju veliku vrednost. U marketing istraivanjima ova
tehnika vrlo esto slui za analiziranje rejtinga proizvoda ili karakteristika brenda, stavova i slino.
Kod tehnika meuzavisnosti ne postoji podela na zavisne i nezavisne varijable jer su sve zapravo
nezavisne. Ovim tehnikama se zapravo trai model odnosa izmeu varijabli koji ima smisla sa
aspekta problema istraivanja. Tehnike meuzavisnosti su zapravo heuristiki, aproksimativni
metodi kojima se traga za razumnim, smislenim, optimalnim reenjima.
Za efikasnu primenu faktorske analize, pa i drugih multivarijacionih tehnika meuzavisnosti,
potrebno je da postoji minimalna koliina redundancije varijabli, odnosno da se varijable barem
malo preklapaju u svom znaenju. Zahvaljujui toj redundantnosti mogue je otkriti ablon u
ponaanju varijabli, odnosno osnovnu ideju (faktor) kojom su proete.
Sa druge strane, kod multivarijacionih tehnika zavisnosti, gde postoji jedna zavisna i vie nezavisnih
varijabli, redundantnost nije uopte poeljna jer moe da utie na visinu regresionog koeficijenta
svake nezavisne variable pojedinano u modelu. Drugim reima, dolazi do multikolinearnosti pa se
ne vidi jasno koliko koja nezavisna varijabla ima uticaja na zavisnu varijablu.
Kada se pravi anketa, esto dolazi do redundantnosti izmeu postavljenih pitanja. Kada se dizajnira
upitnik, istraiva nikada ne moe biti siguran da je pokrio pravu temu u potpunosti sa pitanjima
koja je odabrao. Zbog toga se esto u upitnik uvrtava vie pitanja koja se na isti ili slian nain
odnose na temu istraivanja. Na primer, u istraivanju na tritu deije hrane, upitnik moe da
sadri najmanje 15 pitanja koja pokrivaju za nijansu razliite aspekte iste teme: deiju hranu.
U ovom kontekstu, jedan od glavnih ciljeva faktorske analize je da trai grupu slinih iskaza od
strane respondenata jer oni izraavaju istu osnovnu ideju na naine koji se razlikuju u nijansama. Mi
elimo da identifikujemo tu osnovnu ideju i da je izmerimo. Te osnovne ideje se nazivaju faktorima.
Faktori se ne mogu identifikovati i izmeriti direktno. Oni se mogu otkriti preko odnosa izmeu
varijabli koje ih svojim ponaanjem ispoljavaju.
Poto se faktori statistiki izdvajaju, svi faktori su inicijalno meusobno nepovezani (ortogonalni).
Ovo pojednostavljuje razumevanje irokog spektra varijabli koje opisuju neku kategoriju iz sektora
usluga ili proizvodnje. Takoe se stvara okvir za dalju analizu podataka.
1. Multivarijaciona statistika analiza 2

Iako faktori inicijalno nisu povezani, to ne znai da se to odnosi i na pojedine, originalne iskaze
respondenata. Jedan iskaz respondenta moe u sebi da sadri vie faktora. Takvi iskazi su faktorski
kompleksni. Sami po sebi, ovi iskazi nee jasno definisati ni jedan faktor, ali mogu da doprinesu u
opisivanju faktora od kojih se sastoje.
Identifikovani faktori reprezentuju osnovne ideje odnosno komponente koje su bitne, na primer,
potroaima prilikom vrednovanja nekog proizvoda. Za istraivaa je mnogo lake da se fokusira na
nekoliko najvanijih karakteristika proizvoda koje reprezentuju faktori nego na sve mogue
karakteristike koje su posmatrane. Faktorska analiza na taj nain prua dobar osnov za razumevanje
najvanijih, sutinskih dimenzija ili ideja vezanih za posmatranu pojavu.
Faktorska analiza ima i svoja ogranienja koja se esto navode u literaturi (Hair, Black, Babin, &
Anderson, 2010):
Poto postoji mnogo tehnika kojima moe da se izvede faktorska analiza, ne postoji
konsenzus koja od njih je najbolja.
Subjektivni aspekt je veoma izraen (koliko faktora, koja rotacija, kolika statistika
znaajnost faktorskih optereenja) to dovodi do velikog razmimoilaenja u stavovima
istraivaa.
Problem pouzdanosti je prisutan.
R Ra ac ci io on na al li iz za ac ci ij ja a p pr re ek ko o f fa ak kt to or rs sk ke e a an na al li iz ze e
Drugi glavni cilj u faktorskoj analizi je da se smanji redundancija ili preklapanje varijabli, odnosno
pitanja u anketi, da bi se smanjili trokovi i optereenje respondenata u buduim, slinim
istraivanjima. Kada se otkrije grupisanje varijabli uz pomo faktorske analize, mogue je uraditi
jednu od sledeih intervencija:
1. Eliminisanje jedne ili vie varijabli (pitanja u anketi) u svakoj grupi.
2. Kombinovanje dva ili vie iskaza sa slinim znaenjem u jedan iskaz.
3. Izbor po jedne varijable iz svake grupe koja najbolje karakterie odreeni faktor i koristiti
je kao marker varijablu odnosno surogat.
4. Korienje jednog faktor skora koji predstavlja prosek svih varijabli vezanih za dati faktor.
5. Kombinacija gore nabrojanog.
Faktorska analiza se esto koristi da bi se racionalizovao broj pitanja koji se nalaze u anketama.
Nakon racionalizacije dogaa se da se u istraivanju koriste identifikovani faktori a ne originalne
varijable.
Rezultati faktorske analize u mnogome zavise od samog istraivaa, jer e analiza otkriti obrasce
ponaanja bilo kojih varijabli koje istraiva ukljui u model. Ukoliko se odlui za itav niz
varijabli koje su vezane za jednu ideju, a kod drugih ideja postoji znatno manje varijabli, definisae
se jedan faktor sa velikom vrednou. Zbog toga dizajniranje upitnika bitno utie na rezultate
faktorske analize. Cilj faktorske analize je da pronae grupu povezanih varijabli, ali ne i da utvrdi
vanost tog grupisanja.
1. Multivarijaciona statistika analiza 3

Primer: Restorani brze hrane
U jednom gradu izvrena je anketa u kojoj su respondenti ocenjivali restorane brze hrane. Cilj
studije je bio da se utvrdi relativna vanost pojedinih karakteristika restorana tog tipa. Oko 400
respondenata je anketirano i svaki od njih je morao da oceni 23 razliite karakteristike ocenom od 1
do 10, pri emu je 1 bila najloija ocena a 10 najbolja. Kao dodatak, traena je i ukupna ocena za
svaki lanac brze hrane, takoe na skali od 1 do 10.
Nakon ankete uraena je faktorska analiza da bi se grupisale karakteristike (osnovne ideje) koje su
najslinije. Nakon to su napravljene grupe odnosno odreeni faktori (tabela), potrebno je svakom
faktoru dati odgovarajui naziv tako da povezuje sve karakteristike koje se nalaze u datoj grupi.
Faktorsko optereenje (factor loading) ukazuje na relativnu vanost svake karakteristike u
definisanju faktora. To je zapravo koeficijent korelacije izmeu svake karakteristike (varijable,
pitanja) i samog faktora. to je vea korelacija, data karakteristika bolje opisuje faktor. Ova
korelacija moe biti i pozitivna i negativna. Ako je korelacija pozitivna, onda pokazuje u kojoj meri
odreena varijabla doprinosti tom faktoru, a ako je negativna, pokazuje koliko varijable ne
uestvuje u datom faktoru.
U ovo primeru, faktor 1 ima najvee optereenje kod karakteristike Koriste visoko kvalitetne
sastojke u hrani (0,78), zatim Njihova hrana zaista ima dobar ukus (0,72) itd. Zbog navedenih
karakteristika kod prvog faktora, faktoru je dodeljen naziv Hrana. Ovaj naziv je dodeljen
arbitrarno i mogui su i drugi odgovarajui nazivi.
Kod drugog faktora najvee prisustvo je kod karakteristika Unutranjost uvek izgleda lepo (0,72)
i Osoblje je uredno i isto (0,69) itd. Usled toga, logian naziv za faktor 2 je Objekat jer se ovaj
faktor odnosi na objekat sam po sebi i njegov izgled.

Tabela: Ocenjivanje restorana brze hrane glavna pitanja
Faktor Faktorsko optereenje (Factor Loading)
1. faktor Hrana
Koriste visoko kvalitetne sastojke u hrani. 0.78
Njihova hrana zaista ima dobar ukus. 0.72
Uvek mogu da pronaem u meniju neto to mi se svia. 0.69
Imaju konstantan kvalitet hrane. 0.59
Hrana se sprema po narudbi. 0.59
Ovo je mesto od poverenja. 0.59
Porcije su odgovarajue. 0.53
2. faktor Objekat
Unutranjost uvek izgleda lepo. 0.72
Osoblje je uredno i isto. 0.69
Imaju puno mesta za parking. 0.68
Toaleti su isti. 0.60
Zgrade su atraktivne. 0.58
1. Multivarijaciona statistika analiza 4

Nikada ne ostaju bez jela iz menija. 0.55
Nikada nisu otvoreni do kasno. 0.53
Oseam se prijatno pored drugih gostiju. 0.52
3. faktor Okruenje
Moe biti brzo usluen. 0.77
Zaposleni su ljubazni. 0.65
Mesto je uvek uredno i isto. 0.58
Dobio sam pravu vrednost za svoj novac. 0.57
4. faktor Meni
Povremeno imaju nova jela. 0.77
esto imaju specijalnu ponudu uz popust. 0.74
Meni prua irok izbor. 0.59
Postoji mnogo odgovarajuih lokacija. 0.48

Kada se dobijeni koeficijent za prvu karakteristiku (0,78) podigne na kvadrat, dobija se da je oko
61% varijacija u oceni zajedniko sa faktorom. Ovako mali koeficijent determinacije je dobijen zato
to su mnoga pitanja u anketi izbaena jo prilikom dizajniranja upitnika zbog utede u resursima.
To znai da su mnoge slinosti i redundantnosti izmeu pitanja ranije eliminisane. Vee optereenje
faktora bi moglo lako da se dobije dodavanjem novih pitanja koja su slina ve postojeim.
Faktor 3 je mnogo tei za interpretaciju. Karakteristike nisu logiki povezane i ne ine celinu. Ipak,
faktorska analiza ukazuje da se ove karakteristike pomeraju zajedno u ocenjivanju. To znai kada
respondent da relativno visoku ocenu jednoj karakteristici iz grupe, i ostale karakteristike iz grupe
imaju tendenciju ka visokoj oceni. Zbog toga nije bilo jednostavno dodeliti pravi naziv faktoru. Na
kraju je izbor pao na naziv Okruenje.
etvrtom faktoru je bilo lake dati ime jer se karakteristike odnose uglavnom na meni restorana.
Zbog toga je dodeljen naziv Meni.
Izbor imena za faktore je izuzetno bitan jer je kasnije prilikom donoenja bilo kakvih odluka fokus
upravo na nazivima. To je ponekad lake kada postoje i pozitivno i negativno optereenje faktora jer
nam negativni govore ta dati faktor ne predstavlja.
Na osnovu definisanih faktora stvorena je globalna slika o restoranima brze hrane koju strateki
menadment mora da uvai. Pored toga, 23 karakteristike su smanjene na svega 4 glavne varijable
(faktore) koje mogu biti upotrebljene za dodatnu analizu podataka. Iako ova etiri faktora ne
pokrivaju sve to su pokrivale 23 karakteristike, ipak pokrivaju vei deo varijacija.

Primer: Auto-dileri
140 kupaca automobila zamoljeno je da oceni auto-dilere koje su posetili na osnovu 20 datih
karakteristika. Faktorska analiza je dala vrlo jasne rezultate na osnovu ankete.
1. Multivarijaciona statistika analiza 5


Tabela: Ocenjivanje restorana brze hrane glavna pitanja
Faktor Faktorsko optereenje (Factor Loading)
1. Lini pristup
Jasno su mi odgovarali na pitanja. 0.90
Diler kojem se moe verovati. 0.86
Potrude se da shvate moje potrebe. 0.79
Objasne uslove prodaje. 0.76
Prodavci su ljubazni i kulturni. 0.75
Nisu izbegavali moja pitanja. 0.59
Dobro servisno odeljenje. 0.57
2. Izbor robe
Mnogi modeli ili tipovi su na zalihama. 0.90
Mnogo boja i opcija. 0.87
Otvoreno uvee ili subotama radi servisa. 0.63
3. Uslovi prodaje
Dobre kamate. 0.83
Dobra cena za razmenu. 0.73
Cene su vrlo konkurentne. 0.66
4. Objekti
Dovoljno prostora za parking. 0.75
Atraktivna izlobena sala. 0.69
5. Karakteristike vozila.
Poreenja sa drugim markama. 0.79
Vie od jedne marke vozila. 0.64
Ukazano na mnoge osobine vozila. 0.61
6. Nema pritiska
Nisu navalentni. 0.90
Zovu kasnije da provere da li sam zadovoljan. -0.48

Identifikovano je est faktora na osnovu 20 karakteristika. Ovim verovatno problem istraivanja nije
u potpunosti pokriven. Faktorska analiza ne moe da ukae na to ta nedostaje u nizu karakteristika.
Jedan od naina da se proveri pokrivenost je da se uradi viestruka regresiona analiza gde bi zavisna
varijabla bila ukupna ocena auto-dilera i da se izrauna koeficijent determinacije. Ako je on nizak
(recimo ispod 70%), moe se rei da odreene karakteristike, odnosno odreena pitanja treba dodati
u anketu.
1. Multivarijaciona statistika analiza 6

Nekada je jedno od pitanja u anketi ponueno da se da opta ocena o posmatranoj pojavi pored
svih ostalih pojedinanih karakteristika i onda se ta varijabla takoe ukljuuje u faktorsku analizu. U
tim sluajevima esto se deava da takva varijabla nema visoko faktorsko optereenje ni kod jednog
faktora nego je podjednako rasprena na vie faktora sa malim faktorskim optereenjem.
Ponekad se deava da gotovo sve varijable imaju visoko faktorsko optereenje za prvi faktor. Taj
sluaj se javlja, na primer, kada respondenti treba da ocene veliki broj performansi nekog proizvoda
koji je za njih zapravo nov i nedovoljno poznat. Tada se deava da respondenti daju odgovore na
osnovu nekog opteg utiska. Ova pojava se naziva halo efekat i postoji vie naina da se on
izbegne. Jedno reenje je da standardizuju odgovori za svakog respondenta posebno, a drugi je
eliminisanje halo efekta uz pomo parcijalne korelacije. Vie o ovim tehnikama moe se nai u
Myers i Mullet (2003).
I Iz zb bo or r v va ar ri ij ja ab bl li i z za a a an na al li iz zu u i i v ve el li i i in na a u uz zo or rk ka a
Bez obzira koji je krajnji cilj faktorske analize, mora se voditi rauna o tome kakve se varijable
koriste u postupku.
Izbor varijabli i njihove karakteristike imaju direktnog uticaja na konani ishod analize. Na primer,
ako se istrauje imid neke prodavnice, i ako se u analizu ne ukljui ni jedna varijabla koja je
vezana za osoblje koje radi u prodavnici, onda faktorska analiza nee moi da identifikuje tu
dimenziju. Prema tome, veoma je vano ukljuiti varijable koje pokrivaju sve vane dimenzije
odreenog predmeta istraivanja.
Mora se imati u vidu da e faktorska analiza uvek, bez obzira na to kakvi su podaci, kao rezultat
izraunati faktore. Zbog toga treba voditi rauna da se ne desi sluaj GIGO (garbage in-garbage
out), odnosno da e se na osnovu beskorisnih ulaznih podataka dobiti i beskorisni faktori. Ukoliko
analitiar misli da e ubacivanjem ogromnog broja varijabli faktorska analiza biti u stanju da tu
umu raisti i ponudi smisleno reenje onda je on na pogrenom putu. Kvalitet dobijenih faktora
je u direktnoj vezi sa konceptualnim znaajem varijabli ukljuenih u analizu.
Prilikom odabira varijabli dva pitanja se moraju postaviti: Koji tip varijabli moe da se analizira?
i Koliko varijabli treda ukupno da bude?.
Kad je u pitanju tip varijabli treba imati na umu da je za faktorsku analizu bitno da moe da se
izrauna koeficijent korelacije. Metrike varijable se mogu lako izmeriti, dok su nemetrike
problematine jer ne moe da se koristi isti tip korelacije kao kod metrikih. Iako postoje specijalni
metodi za izraunavanje korelacije izmeu nemetrikih varijabli, najracionalniji pristup jeste da se
takve varijable izbegavaju. Ako ve nemetrika varijabla mora da bude uvrtena, jedan pristup je da
se izraunaju kodirane varijable (dummy variables) koje su kodirane sa 0, 1 itd. i koje na taj nain
reprezentuju nemetrike varijable. Ako su sve varijable u bazi kodirane, onda je bolje koristiti
posebnu vrstu faktorske analize, kao to je Boolean analiza.
Analitiar treba da se trudi da smanji broj varijabli ali takoe i da zadri razuman broj varijabli po
faktoru. Ako analiza ima za cilj da objasni odreenu strukturu, potrebno je ukljuiti nekoliko
varijabli koje mogu da reprezentuju odreeni faktor barem pet. Znaaj faktorske analize je u
1. Multivarijaciona statistika analiza 7

pronalaenju ablona unutar grupe varijabli i mala je korist od faktora koji se zasniva na jednoj
varijabli.
to se tie veliine uzorka, nije preporuljivo analizirati uzorak koji ima manje od 50 jedinica i
poeljno je da uzorak ima barem 100 jedinica. Generalno je pravilo da postoji barem pet puta vie
jedinica nego to ima varijabli u bazi, a najbolje bi bilo da je taj odnos 10:1. U sluajevima kada je
taj odnos manji od 5:1, potrebno je rezultate objanjavati sa velikom rezervom.
V Vr rs st te e f fa ak kt to or ra a
Postoje dve vrste faktora u faktorskoj analizi: zajedniki i specifini faktori. Zajedniki faktori su
oni ije varijacije su podeljene izmeu dve ili vie varijabli iz skupa varijabli. Specifini faktori su
oni ije su varijacije vezane za pojedinane varijable i te varijacije nisu obuhvaene zajednikim
faktorima. Skoro svaka varijabla ima makar malu koliinu specifine varijanse. Faktorska analiza
identifikuje samo zajednike faktore. Bitno je znati da specifini faktori nekad mogu biti od veeg
znaaja u nekom istraivanju od zajednikih. Specifini faktori se mogu izvui na povrinu
dodavanjem novih pitanja u anketi.
Varijable koje imaju malo zajednikog sa drugim varijablama i imaju malo faktorsko optereenje
(manje od 0,30) prema svim zajednikim faktorima nazivaju se esto nezavisnim varijablama.
esto se deava da se previdi vanost takvih varijabli i da se one iskljue iz interpretacije rezultata
to moe da bude velika greka.
V Vr rs st te e f fa ak kt to or rs sk ke e a an na al li iz ze e
U osnovi postoje dva pristupa u otkrivanju faktora: preko analize glavnih komponenti i faktorska
analiza u uem smislu (common factor analysis). Ukratko, analiza glavnih komponenti identifikuje
sve izvore varijacija u skupu varijabli, ukljuujui zajednike i specifine faktore. Faktorska analiza
pokuava da otkrije i objasni samo zajednike varijacije koji su zastupljene kod dve ili vie
varijabli.
Kod analize glavnih komponenti 40 varijabli koje se analiziraju bie zamenjene sa 40 glavnih
komponenti, s tim to e samo nekoliko glavnih komponenti imati veliko prisustvo u varijabilitetu
podataka pa e samo one biti interesantne. Zbog toga se analiza glavnih komponenti smatra pre
svega tehnikom za redukciju obima podataka u kojoj je cilj dobiti minimalni broj faktora koji imaju
maksimalni udeo u ukupnoj varijansi originalnih varijabli.
Faktorska analiza u uem smislu (common factor analysis) slui da se podstakne razumevanje i
znaenje posmatrane pojave. Osnovni cilj faktorske analize jeste da se smanji broj povezanih,
preklapajuih varijabli na manji broj nepovezanih komponenti koje bi se mogle efikasnije koristiti u
daljoj analizi.
Poto je faktorska analiza u uem smislu sloenija, postoji tendencija u svetu da se mnogo vie
primenjuje analiza preko glavnih komponenti. U svakom sluaju, empirijski rezultati pokazuju da se
rezultati dve vrste analize znaajno podudaraju ako broj varijabli prelazi 30 ili komunalitet prelazi
0,60 za vei broj varijabli.
1. Multivarijaciona statistika analiza 8

Postoji jo jedna podela, i to na R faktorsku analizu i Q faktorsku analizu. R faktorska analiza
podrazume otkrivanje latentnih dimenzija u skupu varijabli, odnosno slui za redukciju broja
varijabli u modelu.
Q faktorska analiza ima isti zadatak kao i klaster analiza, a to je da grupie jedinice posmatranja
prema svojoj slinosti u grupe ili klase. Razlika izmeu klaster analize i Q analize je u tome to se u
klaster analizi posmatraju stvarne udaljenosti izmeu jedinica posmatranja i spajaju se najblii
parovi, dok kod se kod Q analize posmatraju sline strukture kovarijansi.
Na primer, u tabeli se vide etiri jedinice posmatranja i tri varijable.
Jedinica posmatranja
Varijable
V
1
V
2
V
3

A 8 8 12
B 9 9 8
C 4 4 6
D 3 3 2
Claster analiza bi zbog blizine taaka u prostoru zajedno grupisala jedinice A i B u jednu grupu a C
i D u drugu, dok bi Q faktorska analiza grupisala zajedno jedinice A i C u jednu a B i D u drugu
grupu jer se pomeraju zajedno.
M Mo od de el l f fa ak kt to or rs sk ke e a an na al li iz ze e
Razlika izmeu analize glavnih komponenti i faktorske analize je u tome to se faktorska analiza
zasniva na matematikom modelu sa faktorima koji su dobijeni kao standardizovane glavne
komponente. Poetak razvoja faktorske analize se vezuje za radove arlsa Spirmana (Charles
Spearman), s poetka XX veka.
Opti faktorski model ima sledei oblik:
e F a F a F a X i m im i i i
...
2 2 1 1

gde su:
X vrednost varijable (skor faktora za varijablu) sa aritmetikom sredinom nula i varijansom jedan,
i redni broj varijable,
F faktori koji su meusobno nezavisni,
m redni broj faktora,
a faktorsko optereenje (konstanta),
e specifini faktor vezan samo za datu varijablu.
1. Multivarijaciona statistika analiza 9

Varijansa varijable X
i
je pri tome:
e
Var
a a a e
Var
F
Var
a F
Var
a F
Var
a X
Var
i im i i i m im i i i
2 2
2
2
1
2
2
2
2 1
2
1
... ... 1
pri emu
a a a im i i
2 2
2
2
1
... predstavlja komunalitet varijable X
i
(deo varijanse koji je povezan sa
zajednikim faktorima), a Var(e
i
) je specifina varijansa varijable X
i
(deo varijanse koji nije
povezan sa zajednikim faktorima). Takoe je dokazano da je korelacija izmeu varijabli X
i
i X
j
:
a a a a a a r jm im j i j i ij
...
2 2 1 1

Prema tome, dva faktorska skora mogu biti jako povezana ako imaju visoko optereenje za iste
faktore. Poto komunalitet ne moe da bude vei od 1, mora biti zadovoljen uslov:
1 1
aij
.
P Po os st tu up pa ak k f fa ak kt to or rs sk ke e a an na al li iz ze e
Tipina faktorska analiza se izvodi u nekoliko koraka:
1. Izraunavanje kompletne tabele koeficijenata korelacije izmeu svih originalnih varijabli.
2. Izraunavanje faktorskog optereenja (factor loading) iz matrice koeficijenata korelacije.
3. Rotacija zajednikih faktora radi vee razumljivosti.
4. Evaluacija i eventualno redefinisanje modela.
5. Interpretacija zajednikih faktora, ukljuujui i izbor adekvatnog naziva.
6. Izraunavanje faktor skorova, da bi svaki zajedniki faktor bio predstavljen jednim,
vaganim indeksim brojem.
U nastavku, termin faktor e se zapravo odnositi na zajednike faktore.
T Ta ab be el la a k ko oe ef fi ic ci ij je en na at ta a k ko or re el la ac ci ij je e
U faktorskoj analizi trai se obrazac odnosa izmeu velikog broja varijabli. To znai da moramo
poeti analizu sa pregledom korelacionih odnosa originalnih varijabli. Najee se koristi Pirsonov
koeficijent proste korelacije koji pokazuje jainu i smer veze izmeu dve varijable.
Dobijena tabela koeficijenata korelacije moe da doprinese boljoj identifikaciji, imenovanju i
razumevanju faktora. Ukoliko istraiva uri, esto se preskae ovaj korak to moe da se odrazi na
kvalitet cele analize. Neki raunarski programi automatski izraunavaju tabelu koeficijenata
korelacije, dok se kod nekih posebno mora traiti ova tabela. Ona moe da bude korisna pri
razumevanju i davanju imena faktorima, posebno kod manje vanih faktora.
Za izraunavanje Pirsonovog koeficijenta proste korelacije potrebno je da obe varijable imaju
vrednosti sa intervalne ili racio skale, dok se u sluaju ordinarne skale primenjuje specijalna verzija
faktorske analize. Preporuuje se da se vrednosti sa nominalne skale analiziraju jedino ako varijabla
1. Multivarijaciona statistika analiza 10

ima samo dva modaliteta (na primer, obeleje je vlasnitvo automobila, a modaliteti su ima i
nema odnosno 1 i 0).
Analitiar mora da se uveri da u korelacionoj matrici ima dovoljno visokih koeficijenata korelacije
da bi imalo smisla primeniti faktorsku analizu. Ako su svi koeficijenti niski, ili su svi jednaki (to
znai da nije mogue grupisati varijable), pitanje je da li treba raditi faktorsku analizu. Ako ne
postoji znaajan broj koeficijenata korelacije koji su vei od 0,30, onda faktorsku analizu ne treba
primenjivati.
Korelacija izmeu varijabli se moe analizirati i preko parcijalnih koeficijenata korelacije izmeu
varijabli. Parcijalna korelacija je korelacija koja je neobjanjena kada se uzmu u obzir uticaji ostalih
varijabli. Ako postoje znaajni faktori u strukturi podataka, onda bi parcijalni koeficijenti trebali biti
mali, jer se varijabla moe objasniti preko uea varijabli u faktoru. Ako su parcijalni koeficijenti
veliki, onda ne treba raditi faktorsku analizu.
Bartlett-ov test sferinosti je jo jedan nain da se analizira korelaciona matrica. Ovaj test analizira
postojanje statistike znaajnosti odnosno da li postoji korelacija barem izmeu nekih varijabli.
Treba imati u vidu da sa poveanjem uzorka Bartlett-ov test postaje sve osetljiviji na otkrivanje
korelacije.
MSA (measure of sampling adequacy) je jo jedan nain da se kvantifikuje stepen korelacije izmeu
varijabli i opravdanost faktorske analize. Indeks se kree u granicama od 0 do 1. to je MSA blii
jedinici, to je lake predvideti odreen varijablu uz pomo ostalih varijabli. MSA se posmatra prema
sledeoj skali:
preko 0,80 vrlo jaka korelacija
izmeu 0,70 i 0,80 jaka
izmeu 0,60 i 0,70 srednja
izmeu 0,50 i 0,60 slaba
ispod 0,50 neprihvatljiva.
MSA moe da se povea u sledeim sluajevima:
poveanjem veliine uzorka
porastom prosene korelacije
poveanjem broja varijabli
smanjivanjem broja faktora.
Opti MSA mora da bude iznad 0,50 pre nego to se primeni faktorska analiza. Ako opti MSA
padne ispod 0,50 onda specifine MSA vrednosti varijabli mogu da ukau na one varijable koje
treba iskljuiti iz analize.
Poto je mogue izraunati specifine MSA za svaku varijablu posebno, mogue je iskljuiti
varijablu sa najniim specifinim MSA i onda ponovo uraditi faktorsku analizu. Ovaj postupak
potrebno je ponavljati sve dok sve preostale varijable imaju MSA iznad 0,50.
1. Multivarijaciona statistika analiza 11

I Iz zr ra a u un na av va an nj je e f fa ak kt to or rs sk ko og g o op pt te er re e e en nj ja a ( (z za aj je ed dn ni i k ki ih h f fa ak kt to or ra a) )
Potrebno je izvui zajednike faktore koji se nalaze u tabeli koeficijenata korelacije. Ovaj korak
se obino izvodi uz pomo analize glavnih komponenti.
Analiza glavnih komponenti pronalazi grupe varijabli koje imaju visoke koeficijente u okviru grupe
a male u odnosu na druge grupe. Ova analiza e izvui onoliko glavnih komponenti koliko ima i
varijabli, zato to ona obuhvata i zajednike i specifine varijacije podataka. Panja istraivaa se
zadrava na nekoliko prvih glavnih komponenti koje imaju najvei uticaj (najvee faktorsko
optereenje) i obuhvataju najvei deo varijabiliteta podataka. Tih nekoliko glavnih komponenti
predstavljaju faktore.
Mnogi statistiki programi nude opciju da se umesto faktorske analize na osnovu glavnih
komponenti uradi analiza tako da se izvuku samo zajedniki faktori a ne svi koji su mogui.
Ono to se eli postii je da faktorsko optereenje ili bude blizu nule, to znai da nije povezano sa
datom varijablom ili da bude znatno udaljeno od nule, to bi znailo da je data varijabla znatno
povezana sa faktorom. Ukoliko varijabla ima veliko faktorsko optereenje samo za jedan faktor a za
ostale ne, onda je lako identifikovati taj faktor.
Metod dakle polazi od modela glavnih komponenti, gde e glavnih komponenti biti isto onoliko
koliko ima i originalnih varijabli. Glavne komponente su zapravo linearna kombinacija originalnih
varijabli:
X b X b X b Z p p 1 2 12 1 11 1
...
X b X b X b Z p p 2 2 22 1 21 2
...
...
X b X b X b Z p pp p p p
...
2 2 1 1

gde su vrednosti b
ij
ajgenvektori korelacione matrice. Sledi ortogonalna transformacija za dobijanje
vrednosti varijabli. Inverzna linearna kombinacija glasi:
Z b Z b Z b X p p1 2 21 1 11 1
...
Z b Z b Z b X p p2 2 22 1 12 2
...
...
Z b Z b Z b X p pp p p p
...
2 2 1 1

Za faktorsku analizu zadrava se samo m komponenti od ukupnog broja komponenti p:
e Z b Z b Z b X m m 1 1 2 21 1 11 1
...
e Z b Z b Z b X m m 2 2 2 22 1 12 2
...
...
1. Multivarijaciona statistika analiza 12

e Z b Z b Z b X p m mp p p p
...
2 2 1 1

gde je e
i
linearna kombinacija ostalih, izostavljenih glavnih komponenti, od Z
m+1
do Z
p
. Sada treba
transformisati preostale glavne komponente da imaju jedininu varijansu. Za dobijanje faktorskih
jednaina potrebno je Z
i
podeliti sa standardnom devijacijom, , koja je kvadratni koren
odgovarajue ajgenvrednosti u korelacionoj matrici:
e F b F b F b X m m m 1 1 2 21 2 1 11 1 1
...
e F b F b F b X m m m 2 2 2 22 2 1 12 1 2
...
...
e F b F b F b X p m mp m p p p
...
2 2 2 1 1 1

gde je
i i i Z F
. Iz datog se vidi da su nerotirani faktori zapravo vrednosti glavnih komponenti
poto su transformisani tako da imaju varijansu jednaku jedinici. Nerotirani faktorski model onda
glasi:
e F a F a F a X m m 1 1 2 12 1 11 1
...
e F a F a F a X m m 2 2 2 22 1 21 2
...
...
e F a F a F a X p m pm p p p
...
2 2 1 1

pri emu je
b a ji j ij
.
R Ro ot ta ac ci ij ja a f fa ak kt to or ra a
Nakon analize glavnih komponenti, faktorska analiza poinje da rotira komponente. Cilj je da se
redefinie i pojasni znaenje svakog faktora. Postupak se svodi na preraspodelu uticaja faktora sa
prve glavne komponente na ostale, tako da je ukupna varijansa koja je objanjena preko faktora
ravnomernije rasporeena izmeu komponenti.
U koordinatnom sistemu, glavne komponente su predstavljene kao prave linije koje prolaze kroz
ishodite i izmeu varijabli koje se nalaze u vidu taaka u prostoru. Ako su varijable u jaoj
korelacionoj vezi, nalaze se blizu jedna drugoj. Prave linije (glavne komponente) prolaze kroz grupu
bliskih varijabli. Te prave linije zapravo predstavljaju faktore koji se trae. Prave linije komponenti
su meusobno pod uglom od 90 stepeni jer komponente nisu meusobno zavisne.
Najpoznatija rotacija je varimax rotacija koja maksimizira sumu varijansi kvadrata faktorskih
optereenja.
Nakon varimax rotacije, ili neke druge, faktorski model ima oblik:
1. Multivarijaciona statistika analiza 13

e F
g
F
g
F
g
X m
m
1
1
2
12
1
11
1
* ... * *
e F
g
F
g
F
g
X m
m
2
2
2
22
1
21
2
* ... * *
...
e F
g
F
g
F
g
X p m
pm p p
p
* ... * *
2
2
1
1

gde *
Fi
predstavlja novi, i-ti faktor.

Primer: Rotacija faktora na primeru vonih sokova
Nakon ankete koja je sprovedena meu potroaima dobijeni su podaci o 14 razliitih osobina
vonih sokova. Uraena je analiza glavnih komponenti i dobijene su etiri glavne komponente koje
su prikazane u tabeli.
Najvea optereenja prve komponente su 0,93; 0,92; 0,90 itd. Ovo su vrlo velika optereenja i treba
u mnogome da nam pomognu prilikom davanja imena prvoj komponenti. Problem je to ima previe
varijabli (osobina vonih sokova) kod kojih je optereenje veliko, pa to ini interpretaciju
komplikovanom. Takoe, kod druge glavne komponente, najvee optereenje je 0,35, a kod tree -
0,30. Potrebno je pronai nain za redistribuiranje ovih optereenja da bi se postigla interpretacija
koja ima smisla za sve faktore. To se postie rotiranjem osa u koordinatnom sistemu koje
predstavljaju komponente oko skupa originalnih podataka.
U ovom konkretnom sluaju, rotiraju se etiri komponente kroz varimaks rotaciju i to na sledei
nain:
Sve ose ostaju pod pravim uglom (90), jedna u odnosu na drugu.
Svaka par komponenti obuhvata maksimalan broj taaka (varijabli) u prostoru izmeu njih.
Varijanse faktorskih optereenja izmeu svih varijabli, na svakoj osi, su maksimizirane
(odatle i naziv varimaks, to za posledicu ima nekoliko visoko varijabilnih optereenja i
mnogo malih, ak negativnih).

Tabela: Faktorsko optereenje pre i posle rotacije
Osobine vonih sokova
Glavne komponente pre rotacije Faktori posle Varimax rotacije
Komunalitet
1 2 3 4 1 2 3 4
1.Prijatan ukus 0.84 -0.001 -0.29 0.14 -0.62 0.38 0.36 0.34 0.76
2.Iskriav ukus 0.93 -0.02 -0.02 -0.1 0.48 0.43 -0.53 0.38 0.84
3.Zreo ukus 0.76 -0.11 -0.28 0.1 -0.70 0.26 0.38 0.36 0.83
1. Multivarijaciona statistika analiza 14

4.Bogat ukus 0.91 0.16 -0.001 -0.11 0.45 -0.53 0.54 0.29 0.86
5.Zadovoljavajui ukus 0.78 -0.002 -0.20 0.21 -0.74 0.38 0.30 0.32 0.88
6.iv ukus 0.93 0.12 -0.02 -0.16 0.50 0.43 -0.59 0.35 0.91
7.Ukus pravog voa 0.90 -0.04 0.04 -0.21 0.42 0.38 -0.64 0.37 0.84
8.Dubok, originalni ukus 0.78 0.35 0.11 0.16 0.31 -0.74 0.27 0.22 0.78
9.Ukus tek isceenog voa 0.85 -0.28 0.24 -0.09 0.23 0.24 0.52 -0.62 0.81
10.Topao ukus 0.86 0.25 0.22 0.17 0.28 -0.75 0.33 0.39 0.86
11.ist i jasan ukus 0.89 0.11 -0.05 0.10 0.52 -0.55 0.36 0.36 0.79
12.Sladak ukus 0.86 -0.29 0.04 0.27 0.43 0.28 0.16 -0.67 0.77
13.Sve ukus 0.84 -0.27 0.19 0.12 0.33 0.32 0.36 -0.70 0.81
14.Ukupan utisak 0.92 0.04 0.08 -0.23 0.38 0.43 -0.65 0.34 0.85
Objanjena varijansa u % 75.2 2.4 3.1 2.5 23.6 20.2 21.3 19.0 -
Kumulativno varijansa u % 75.2 77.6 80.7 83.2 23.6 43.8 65.1 84.1 -

Pod nazivom varimaks rotacija u tabeli se nalaze faktorska optereenja za svaku varijablu posle
rotacije. Sada je prikladnije koristiti termin faktor umesto komponenta. Uoava se da su visoka
optereenja kod prve komponente pre rotacije uglavnom nestala kod prvog faktora. Sada je lake
utvrditi ta je zapravo faktor 1 i ta nije. Visoka optereenja, ako su pozitivna, govore ta faktor
jeste, a negativna ta nije.
Procenat ukupne varijacije (objanjena varijansa) se dramatino menja. Pre rotacije, prva
komponenta je objanjavala 75,2% od ukupne varijacije, sledea 2,4% itd. Nakon rotacije
postignuta je ravnomernost u objanjenoj varijansi izmeu faktora (od 23,6% do 19,0%) to govori
o redistribuciji faktorskog optereenja.
Negativna optereenja su se pojavila kod sva etiri faktora posle rotacije. Ona ukazuju na to to
faktor ne predstavlja. Zbog naina na koji se rotacija izvodi, faktoru se dodeljuje ime na osnovu
najveeg optereenja i to bez obzira na predznak. Najvee faktorsko optereenje ukazuje na
varijable koje imaju najjau korelaciju sa datim faktorom.
Poslednja kolona tabele pokazuje komunalitet svake varijable. Komunalitet je proporcija varijanse
varijable koja je zajednika sa svim ostalim varijablama zajedno. Izraunava se tako to se saberu
kvadrati faktorskih optereenja varijable. Na primer, za varijablu Prijatan ukus, komunalitet
iznosi:
(0,62)
2
+0,38
2
+0,36
2
+0,32
2
=0,76.
1. Multivarijaciona statistika analiza 15

To pokazuje da je 76% od ukupne varijacije varijable Prijatan ukus obuhvaeno sa etiri
zajednika faktora. Isto tako, 24% varijacija se odnosi na specifinost same varijable plus odreeni
iznos greke u merenju (e).
Za 14 varijabli vonih sokova komunalitet se kree od 76% do 91%. To znai da su prilino visoki
i da mogu da obuhvat barem jedan faktor i da neke imaju umereno optereenje za dva faktora. Ne
postoji isto nezavisna varijabla u analizi.
U pretposlednjem redu tabele nalazi se objanjena varijabla u procentima. Ona moe da poslui
kao zavisna varijabla u viestrukoj regresionoj analizi sa ostalim varijablama ili faktorima
kao nezavisnim da bi se ocenila relativna vanost faktora.
Problem multikolinearnosti koji se javlja kod regresije moe da se rei korienjem faktora kao
nezavisnih varijabli umesto originalnih varijabli jer su oni, po definiciji, u potpunosti nezavisni.
Uoava se da je komunalitet za svaku varijablu u zbiru isti pre i posle rotacije. To znai da se od
ukupne varijanse kod bilo koje varijable nije nita izgubilo u procesu rotacije. To je zato to se u
toku postupka same varijable ne pomeraju. Njihova lokacija u prostoru je odreena meusobnim
odnosima sa drugim varijablama. Prilikom rotacije osa koje predstavljaju faktore, za koliko se
jedna varijabla priblii osi, za toliko se druga udalji.
Koliko faktora treba rotirati? Iako glavnih komponenti ima onoliko koliko ima i varijabli, najvei
procenat varijacija podataka je objanjen sa svega nekoliko prvih komponenti. Zbog toga su u
primeru sa vonim sokovima odabrane etiri komponente za rotaciju. Ostale komponente bi samo
doprinele konfuziji i teoj interpretaciji. Poto su varijable gotovo uvek standardizovane pre analize,
nas interesuju one komponente koje imaju varijansu veu od 1 jer u sebi sadre vee
varijacije nego pojedinane varijable. Ovo je samo jedan od nekoliko naina. U praksi se
preporuuje da se uradi vie naina za izbor broja faktora pre donoenja konane odluke. Zbog toga
u e nastavku biti dat njihov detaljniji opis.
O Or rt to og go on na al ln na a i i k ko os sa a r ro ot ta ac ci ij ja a
Kod ortogonalne rotacije, ose koje predstavljaju faktore ostaju pod pravim uglom i pre i posle
rotacije. Kao posledica toga, faktori su uvek u potpunosti nepovezani. Ovo je tradicionalni pristup
koji se prvi pojavio.
Neki analitiari su kasnije zastupali stav da podaci govore sami za sebe i da se zanemari
ogranienje o ortogonalnosti faktora. U tom sluaju ose same zauzimaju najbolju poziciju bez
obzira na poloaj ostalih. Rotacija ove vrste se zove kosa rotacija (oblique rotation) jer vie ne
vai pravilo o pravouglom odnosu linija faktora. Mnogi programski paketi ovaj oblik rotacije nude
kao opciju.
Primeri za ortogonalnu i kosu rotaciju dati su na slikama. Na slici uoava se da su sve tri ose ostale
pod pravim uglom nakon rotacije. Na slici , meutim, nakon rotacije ose zauzimaju drugaiji
poloaj koji nije pod 90.

1. Multivarijaciona statistika analiza 16

Faktor 1
Faktor 3
Faktor 2
+
+
+
-
-
-
90
90
90

Slika: Ortogonalna rotacija faktora

Faktor 1
Faktor 3
Faktor 2
+ +
+
-
-
-

Slika: Kosa rotacija faktora
Razliiti programi pruaju razliite opcije za kosu rotaciju. Na primer, analitiar moe da odabere
ciljnu varijablu i program e smestiti ose kroz nju. Ova varijabla oko sebe okuplja ostale bliske
varijable dajui im visoko faktorsko optereenje. Postoji i takozvana Prokrustova rotacija kod
koje se prvo izvede ortogonalna rotacija, a zatim se ose rotiraju dok osa ne proe kroz bilo koju
varijablu koja ima najvee faktorsko optereenje za svaki ortogonalni faktor.
Kosa rotacija moe da prui jasnije razumevanje strukture faktora. Ukoliko ortogonalna rotacija nije
dovoljno ravnomerno rasporedila faktorska optereenja na faktore, moe se pribei kosoj rotaciji
koja e to efikasnije izvesti.
1. Multivarijaciona statistika analiza 17

Nedostatak kose rotacije je taj to se izmeu faktora javlja zavisnost (kolinearnost) pa se dobijeni
rezultati ne mogu kvalitetno upotrebiti u viestrukoj regresionoj analizi. Ipak kosa rotacija nee
imati uticaja na prognostiku mo regresionog modela. Ukoliko se za regresionu analizu koriste
ortogonalni faktori, onda je problem multikolinearnosti potpuno reen. to je vei broj ortogonalnih
varijabli, regresioni model je efikasniji.
Poto rotirani faktor u kosoj rotaciji vie nisu pod uglom od 90 stepeni, oni se mogu tretirati kao
nove originalne varijable na kojima moe da se uradi drugostepena faktorska analiza.
Metod rotacije koji se najee koristi je takozvana varimax rotacija. Ona se bazira na pretpostavci
da razumljivost datog faktora moe da se izmeri varijansom faktorskih optereenja. Ako je ta
varijansa velika onda vrednosti faktorskih optereenja tee da budu ili blizu nule ili blizu jedinice.
Varimax rotacija maksimizira sumu tih varijasni za sve faktore. Ova rotacija moe da se radi bez ili
sa prethodnom normalizacijom faktorskih optereenja (Kaiser normalizacija).
K Kr ri it te er ri ij ju um mi i z za a o od dr re e i iv va an nj je e b br ro oj ja a f fa ak kt to or ra a
U odluivanju koliko e faktora biti uzeto u obzir, analitiar mora da kombinuje konceptualna
znanja (Koliko faktora treba da bude u datoj strukturi?) sa empirijskim dokazima (Koji je racionalan
broj faktora koji se mogu objasniti?). Analitiar polazi od unapred postavljenih kriterijuma, kao to
je opti broj faktora plus opti prag praktine znaajnosti (procenat objanjenosti varijanse koji je
unapred postavljen). Ovi kriterijumi se kombinuju sa empirijskim rezultatima. Tehnika za tano
odreivanje broja faktora nije razvijena.
Najei metod koji se primenjuje jeste kriterijum latentnog korena (latent root criterion). Prema
ovom kriterijumu u obzir se uzimaju samo oni faktori koji imaju ajgenvrednost veu od 1. Faktori
koji imaju manju ajgenvrednost od 1 se smatraju nebitnim jer objanjavaju manje varijabiliteta nego
to ga objanjavaju same varijable. Ovaj metod je najbolji kada je broj varijabli izmeu 20 i 50. Ako
ima manje od 20 varijabli, postoji tendencija da se izabere premalo faktora, a ako je broj varijabli
vei od 50, tendencija je da se izabere previe faktora.
A priori kriterijum polazi od unapred definisanog broj faktora koji se eli i raunaru se prosto da
instrukcija da se dati broj faktora izvue.
Kriterijum procenta objanjene ukupne varijanse. Polazi se od toga da se odredi procenat ukupne
varijanse za koji se eli da bude objanjen i kada se taj procenat dostigne, tada se utvrdi koliko je
faktora potrebno da bi se to dostiglo. Ne postoji vrsto pravilo koji je to procenat objanjene ukupne
varijanse dovoljan, nego se ide od sluaja do sluaja. U prirodnim naukama obino se zahteva vei
procenat (barem 95%), dok kod drutvenih nauka, gde je informacija manje precizna, esto se
analitiari zadovoljavaju i sa 60% od ukupno objanjene ukupne varijanse.
Scree test je grafiki metod za odreivanje broja komponenti za rotaciju. Na linijskom dijagramu se
predstavljaju ajgenvrednosti komponenti poevi od najvee. Trai se mesto na kojem linija naglo
menja pravac i do te take se broje komponente koje e biti ukljuene u analizu. Na slici je prikazan
jedan takav grafikon gde se uoava nagli prelom linije kod druge komponente, to znai da e za
rotaciju biti izdvojena samo dva faktora koji zajedno objanjavaju 82,95% varijacija.
1. Multivarijaciona statistika analiza 18

Eigenvalues of correlation matrix
Active variables only
72.32%
10.63%
7.73%
6.03%
3.29%
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0
Eigenvalue number
-0.5
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
E
i
g
e
n
v
a
l
u
e

Slika: Grafiki prikaz ajgenvrednosti za primenu Scree metoda
Prilikom konanog izbora faktora treba voditi rauna o tome da broj faktora bude adekvatan. Iako
su faktori nezavisni, negativne posledice se javljaju i kad je izabrano previe i kad je izabrano
premalo faktora. Ako je izabrano premalo faktora, onda se ne objanjava prava struktura i vane
dimenzije nee biti otkrivene. Ako se zadri preveliki broj faktora, interpretacija postaje
komplikovana kada se rezultati rotiraju. Po analogiji, izbor broja faktora je neto kao fokusiranje
mikroskopa. (Hair, Black, Babin, & Anderson, 2010).
E Ev va al lu ua ac ci ij ja a i i e ev ve en nt tu ua al ln no o r re ed de ef fi in ni is sa an nj je e m mo od de el la a
Analitiar mora da evaluira dobijeno reenje. Ukoliko reenje nije adekvatno ili dovoljno
zadovoljavajue, mogue je da se javi potreba za redefinisanjem celog modela i to upotrebom
sledeih koraka:
iskljuivanje jedne ili vie varijabli iz analize
upotreba drugaijeg metoda za rotiranje faktora radi bolje interpretacije
izvlaenje drugaijeg broja faktora u analizi
upotreba drugaijeg modela za definisanje faktora putem deljenja varijanse.
Potrebno je videti da li su faktorska optereenja dovoljno znaajna. Faktorska optereenja je
potrebno posmatrati na sledei nain:
1. Multivarijaciona statistika analiza 19

Ako su optereenja u intervalu od 0,30 do 0,40 onda oni ispunjavaju minimalne zahteve
za uee u interpretaciji date strukture podataka.
Optereenja preko 0,50 se smatraju praktino signifikantnim.
Optereenja preko 0,70 se smatraju indikativnim za jednu dobro definisanu strukturu i oni
su pravi cilj faktorske analize.
Pored navedene skale, postoji i kriterijum za statistiku znaajnost faktorskih optereenja uz
verovatnou 95%, odnosno koliko treba da bude velik uzorak da bi se odreeni nivo faktorskog
optereenja smatrao znaajnim (tabela).
Tabela: Identifikacija statistiki znaajnih faktorskih optereenja na osnovu veliine uzorka
Faktorsko optereenje
Potrebna veliina uzorka da bi se postigla
znaajnost
0,30 350
0,35 250
0,40 200
0,45 150
0,50 120
0,55 100
0,60 85
0,65 70
0,70 60
0,75 50
Izvor: Hair et al. (Multivariate Data Analysis - A Global Perspective, 2010)
Broj varijabli koje se posmatraju takoe je bitan za donoenje odluke o tome koja su faktorska
optereenja znaajna. Kako se broj analiziranih varijabli poveava, prihvatljivi nivo statistike
znaajnosti opada. Prilagoavanje broju varijabli postaje sve vanije kako se analiza pomera od
prvog ka poslednjem faktoru.
Jednom kada su definisana sva statistiki znaajna optereenja, potrebno je potraiti varijable koje
nisu adekvatno zastupljene dobijenim faktorskim reenjem. Prvo se potrae sve one varijable koje
nemaju ni jedno znaajno faktorsko optereenje. Drugi pristup je da se ispita komunalitet svake
varijable, koji reprezentuje zapravo koliinu varijanse koja je obuhvaena faktorskim reenjem za
svaku varijablu. Na primer, analitiar moe da odredi da barem jedna polovina varijanse svake
1. Multivarijaciona statistika analiza 20

varijable mora da bude uzeta u obzir. Prema tome, ona varijabla koja ima komunalitet manji od 0,50
nema dovoljno dobro objanjenje u modelu.
Kada su istraena faktorska optereenja i komunalitet, mogu da se jave sledei problemi:
varijabla nema znaajno faktorsko optereenje
komunalitet varijable je nizak, bez obzira to je faktorsko optereenje znaajno
varijabla ima unakrsno faktorsko optereenje, odnosno ista varijabla ima znaajna
faktorska optereenja za vie faktora (cross-loadings).
Potrebno je preduzeti odreene mere, koje mogu da se kombinuju (Hair, Black, Babin, & Anderson,
2010):
Ignorisati problematine varijable i interpretirati faktore takve kakvi su. Ovo je opravdano
ako je cilj redukcija podataka, ali mora se imati na umu da su odreene varijable loe
reprezentovane u faktorskoj strukturi.
Razmisliti o eventualnom brisanju varijable iz analize, to zavisi od opteg doprinosa u
celokupnom istraivanju i u komunalitetu date varijable. Nakon toga se izrauje novo
faktorsko reenje bez te varijable. Brisanje variable se esto radi i u sluaju unakrsnog
faktorskog optereenja.
Uraditi neku drugu vrstu rotacije, moda i kosu rotaciju ako je do tada koriena samo
ortogonalna rotacija.
Smanjiti ili poveati broj faktora da bi se videlo da li e onda problematina varijabla biti
bolje reprezentovana.
Promena vrste faktorske analize (analiza glavnih komponenti vs. faktorska analiza u uem
smislu) da bi se videlo da li e se znaajnije promeniti faktorska struktura.
I In nt te er rp pr re et ta ac ci ij ja a r ro ot ti ir ra an ni ih h f fa ak kt to or ra a
Kao finalna faza istraiva posmatra faktorska optereenja nakon rotacije (ako je ona bila uopte
potrebna) i eventualnog redefinisanja modela. Da bi se dodelili adekvantni nazivi faktorima
posmatraju se faktorska opereenja za svaku varijablu sa ciljem da se odredi njena uloga i doprinos
u definisanje strukture faktora.
Predznaci faktorskih optereenjsa se interpretiraju kao kod bilo kog drugog koeficijenta korelacije,
to znai da su kod pozitivnih faktorskih optereenja faktor i varijabla pozitivno povezani a u
suprotnom sluaju negativno. Kod ortogonalnih reenja faktori su nezavisni to znai da se
negativno ili pozitivno faktorsko optereenje kod jednog faktora ne povezuje ni na koji nain sa
drugim faktorima.
U primeru sa vonim sokovima, sledei korak je da se daju imena faktorima. Imena faktora uvek
zavise od najveeg i najmanjeg (negativnog) faktorskog optereenja. Na primer, u tabeli, pod
varimaks rotacijom, za faktor 1, najvea optereenja su za Zadovoljavajui ukus (-0,74), Zreo
ukus (-0,70) i Prijatan ukus (-0,63), svi sa negativnim optereenjem. To zapravo znai da ako je
odreena vrsta vonog soka visoko ocenjena po jednoj od ovih osobina, verovatno e biti visoko
ocenjena i po ostalim osobinama i obrnuto. Pored toga, najvea pozitivna optereenja kod faktora 1
su ist i jasan ukus (0,52), iv ukus (0,50), Iskriav ukus (0,48) i Bogat ukus (0,45). To
1. Multivarijaciona statistika analiza 21

zapravo znai da voni sok koja ima ist, iv, iskriav i bogat ukus obino nema zadovoljavajui,
zreo i prijatan ukus.
Istraiva je za prvi faktor izabrao ime Zadovoljavajui ukus na osnovu najveeg, negativnog
faktorskog optereenja. Faktor 2 je dobio ime Toplina ukusa, faktor 3 Ukus pravog voa i
faktor 4 Sveina.
Primer: Zaposlenost u evropskim zemljama
Faktorska analiza je primenjena na podacima o zaposlenosti u evropskim zemljama. Korelaciona
matrica kao i ajgenvrednosti i ajgenvektori za ovu seriju su izraunati kod analize glavnih
komponenti. Poto ima ukupno etiri ajgenvrednosti vee od jedan, primenuje se grubo pravilo da
bude i etiri faktora u modelu.
Izraunata su faktorska optereenja za etiri faktora i devet varijabli:
e F F F F X 1 4 3 2 1 1
02 , 0 34 , 0 03 , 0 90 , 0 (0,93)
e F F F F X 1 4 3 2 1 2
12 , 0 63 , 0 00 , 0 66 , 0 (0,85)
e F F F F X 1 4 3 2 1 3
06 , 0 61 , 0 58 , 0 43 , 0 (0,91)
e F F F F X 1 4 3 2 1 4
02 , 0 36 , 0 15 , 0 56 , 0 (0,46)
e F F F F X 1 4 3 2 1 5
81 , 0 09 , 0 33 , 0 39 , 0 (0,92)
e F F F F X 1 4 3 2 1 6
17 , 0 08 , 0 55 , 0 67 , 0 (0,79)
e F F F F X 1 4 3 2 1 7
50 , 0 12 , 0 74 , 0 23 , 0 (0,87)
e F F F F X 1 4 3 2 1 8
33 , 0 44 , 0 07 , 0 76 , 0 (0,88)
e F F F F X 1 4 3 2 1 9
04 , 0 50 , 0 69 , 0 36 , 0 (0,87)
Vrednosti u zagradama predstavljaju komunalitet. Na primer, komunalitet za varijablu X
1
(AGR,
poljoprivreda, umarstvo i ribarstvo) se izaunava na sledei nain:
93 , 0 02 , 0 34 , 0 03 , 0 90 , 0
2 2 2 2

Komunaliteti su veliki za sve varijable osim za X
4
(PS, proizvodnja elektrine energije, gasa i
vode). To znai da je vei deo varijabiliteta podataka osam varijabli obuhvaeno zajednikim
faktorima.
Faktorska optereenja koja su vea od 0,50, bez obzira na predznak, predstavljaju velika i umerena
optereenja koja pokazuju kako je varijabla povezana sa faktorom. Oigledno je da je varijablia X
1

gotovo u potpunosti odreena faktorom 1, X
2
je meavina faktora 2 i faktora 3, X
3
je odreen
faktorima 1 i 2 itd. Nepovoljno je to su pet od devet varijabli jako povezane sa dva faktora.
Rotacija faktora e moda pruiti bolje reenje.
Primenjena je varimax rotacija sa Kaiser-ovom normalizacijom. Dobijen je sledei model:
e F F F F X 1 4 3 2 1 1
36 , 0 27 , 0 10 , 0 85 , 0
1. Multivarijaciona statistika analiza 22

e F F F F X 1 4 3 2 1 2
10 , 0 86 , 0 30 , 0 11 , 0
e F F F F X 1 4 3 2 1 3
09 , 0 89 , 0 32 , 0 03 , 0
e F F F F X 1 4 3 2 1 4
14 , 0 64 , 0 04 , 0 19 , 0
e F F F F X 1 4 3 2 1 5
95 , 0 04 , 0 08 , 0 02 , 0
e F F F F X 1 4 3 2 1 6
65 , 0 15 , 0 48 , 0 35 , 0
e F F F F X 1 4 3 2 1 7
01 , 0 00 , 0 93 , 0 08 , 0
e F F F F X 1 4 3 2 1 8
04 , 0 12 , 0 17 , 0 91 , 0
e F F F F X 1 4 3 2 1 9
14 , 0 03 , 0 57 , 0 73 , 0
Komunalitet je nepromenjen a faktori su i dalje nepovezani. Reenje je neto bolje jer je samo
varijabla X
9
povezana neto vie sa dva faktora.
U sledeem koraku potrebno je dati nazive faktorima, to podrazumeva odreeni stepen
inovativnosti.
Faktor 1 ima visoko pozitivno optereenje za varijablu X
1
(AGR poljoprivreda, umarstvo i
ribarstvo), gde je optereenje 0,85 i visoka negativna optereenja za varijable X
8
(SPS drutvene i
line usluge), sa optereenjem 0,91 i X
9
(TC - transport i komunikacije), sa optereenjem 0,73.
To znai da se meri stepen u kojem su ljudi zaposleni u poljoprivredi pre nego u dravnoj upravi i
komunikacijama. Naziv faktora 1 je zbog toga ruralna industrija pre nego drutveni servis i
komunikacije.
Faktor 2 ima negativno optereenje za X
7
(FIN finansije), i to 0,93 i dovoljno visoko pozitivno
optereenje za X
9
(TC - transport i komunikacije) od 0,57. Usled toga je dobio naziv nedostatak
finansija.
Faktor 3 ima visoko pozitivno optereenje za X
2
(MIN rudarstvo) od 0,86 i negativna optereenja
za X
3
(MAN preraivaka industrija) od 0,89 i X
4
(PS - Proizvodnja elektrine energije, gasa i
vode) od 0,64. Naziv ovog faktora je rudarstvo pre nego proizvodnja.
Faktor 4 ima visoka pozitivna optereenja za varijable X
5
(CON graevinarstvo) od 0,95 i X
6

(SER usluge) od 0,65. Logino je da naziv bude graevinarstvo i usluge.
Na osnovu jednaina izraunavaju se faktorski skorovi za svaku varijablu pojedinano. Rezultati su
dati u tabeli.
Tabela: Rotirani skorovi faktora
Zemlja Faktor 1 Faktor 2 Faktor 3 Faktor 4
Belgium 0.97 0.56 0.10 0.47
Denmark 0.89 0.47 0.03 0.67
France 0.56 0.78 0.15 0.25
Germany -0.05 0.57 0.47 -0.58
1. Multivarijaciona statistika analiza 23

Ireland -0.48 -0.19 0.23 -0.02
Greece -0.28 0.60 0.36 -0.03
Italy -0.25 0.13 -0.17 -1.00
Luxembourg 0.46 0.36 -0.02 -0.92
Netherlands 1.36 1.56 0.03 2.08
Portugal -0.66 0.45 0.37 -0.64
Spain -0.24 0.11 0.09 -0.93
U.K. 0.50 1.14 0.35 0.04
Austria -0.18 -0.05 0.71 -0.56
Finland 0.78 0.20 0.21 0.52
Iceland 0.18 0.04 0.06 -0.46
Norway 1.36 0.17 -0.20 0.41
Sweden 1.20 0.52 -0.04 0.74
Switzerland -0.12 0.67 -0.01 -0.65
Albania -3.16 1.82 -1.76 1.79
Bulgaria -0.47 -1.56 0.57 0.65
Czech/Slovak Rep. 0.26 -1.45 -3.12 -0.44
Hungary 1.05 -1.70 -2.82 0.14
Poland -0.97 -0.71 0.37 0.42
Romania -1.11 -1.73 1.69 0.81
USSR (form.) -0.08 -2.09 0.11 -0.14
Yugoslavia (form.) -0.13 -1.48 1.70 -0.17
Cyprus -0.46 0.32 -0.03 -1.08
Gibraltar 0.05 1.05 -0.08 -3.26
Malta 1.18 -0.49 0.79 1.31
Turkey -2.15 -0.07 -0.15 0.56
Na osnovu analize faktorskih skorova uoava se da je vrednost faktora 1 visoka u Albaniji i Turskoj,
to znai da je tamo akcent na ruralnoj industriji pre nego na drutvenom servisu i komunikacijama.
Bugarska, Maarska, Rumunija i bivi SSSR imaju malo zaposlenih u finansijama, dok Holandija i
Albanija imaju velik broj zaposlen u toj oblasti. Ovo je uoljivo na osnovu faktora 2. Faktor 3
stavlja u kontrast Albaniju i bivu ehoslovaku sa jedne strane i Rumuniju i bivu Jugoslaviju sa
druge strane zbog broja zaposlenih u rudarstvu. Faktor 4 stavlja u kontrast Gibraltar, sa velikim
brojem zaposlenih u graevinarstvu i uslugama, naspram Holandije i Albanije gde je obrnut sluaj.
Moda bi bilo racionalno i izvodljivo nastaviti analizu sa manjim brojem faktora i drugaijim
metodima faktorske analize. Razliiti softverski paketi mogu da daju ajgenvektore sa suprotnim
predznacima. Takoe, obrnuti predznaci mogu da se pojave prilikom rotacije faktora, tako da
faktorska optereenja idu u suprotnom smeru od onog koji je naveden u ovom primeru. U takvom
sluaju potrebno je obrnuti i interpretaciju.
1. Multivarijaciona statistika analiza 24

F Fa ak kt to or r s sk ko or ro ov vi i
Jednom kada je broj originalnih varijabli smanjen na odreeni broj faktora, mogue je izraunati
faktor skorove. Oni zapravo predstavljaju rezultate za svaku jedinicu posmatranja po pojedinim
faktorima. Skup faktor skorova ini novi, redukovani set podataka. Oni predstavljaju visinu
individualnih skorova koji su povezani sa visinom faktorskog optereenja. Odnosno, visoka
vrednost varijable u pogledu faktorskog optereenja e rezultovati i visokim faktor skorom.
U sluaju sa vonim sokovima, umesto 14 varijabli sada imamo 4 varijable koje na najbolji nain
odslikavaju stav ispitanika prema vonim sokovima.
Postoje sluajevi kada faktor skorove nije poeljno izraunavati:
Kada struktura faktora nije dovoljno jasna i kada se neki faktori ne mogu dobro
interpretirati.
Kada veliki broj varijabli ima mali komunalitet, to znai malu varijaciju zajednikih
faktora.
Kada je potrebna velika preciznost u analizi. Tada je bolje primeniti neku od
multivarijacionih tehnika zavisnosti, ako je mogue.
U Up po ot tr re eb ba a f fa ak kt to or rs sk ke e a an na al li iz ze e s sa a d dr ru ug gi im m m mu ul lt ti iv va ar ri ij ja ac ci io on ni im m
t te eh hn ni ik ka am ma a
Poto faktorska analiza obezbeuje uvid u meusobni odnos varijabli i otkriva skrivenu strukturu
podataka, ona predstavlja dobru poetnu osnovu za druge multivarijacione tehnike. Faktorska
analiza omoguuje analitiaru jasno razumevanje oko toga koje varijable imaju najvaniji uticaj i
koliki je njihov broj. Na primer, u zavisnosti od dobijenih rezultata moe se uraditi sledee:
Varijable koje su visoko korelisane i pripadaju istom faktoru verovatno imaju iste
karakteristike kada su u pitanju statistiki znaajne razlike izmeu grupa u
multivarijacionoj analizi varijanse ili u diskriminacionoj analizi.
Visoko korelisane varijable, unutar istog faktora, imaju uticaj na stepwise proceduru
viestruke regresije i diskriminacione analize prilikom dodavanja novih varijabli i
poveavanja moi predvianja modela. Ako je jedna varijabla vezana za neki faktor ve
uvrtena u model, onda je malo verovatno da e sledea varijabla koja je vezana za isti
faktor biti uvrtena u model jer e mo predvianja celog modela biti neznatno uveana.
To ne znai da druge varijable istog faktora nisu bitne ili da imaju manji uticaj, ali njihov
efekat je ve reprezentovan preko prve varijable koja je uvrtena.
Faktorska analiza prua empirijsku osnovu za evaluaciju strukture varijabli i uticaj te strukture na
interpretaciju rezultata dobijenih nekom drugom multivarijacionom tehnikom. Ako je cilj, naprotiv,
da se identifikuju odgovarajue varijable za primenu u nekoj drugoj analizi, onda e neka od tehnika
redukcije biti primenjena. Postoje dve opcije:
Izbor varijable sa najveih faktorskim optereenjem kao surogat koji e reprezentovati
odreeni faktor odnosno dimenziju.
1. Multivarijaciona statistika analiza 25

Zamena originalnog seta varijabli sa potpuno novim, redukovanim setom varijabli koje su
kreirane uz pomo sumirane skale ili faktor skorova.
O sumiranim skalama vie informacija moe da se nae u Hair et al. (2010).
Bilo koja od pomenutih opcija kreira nove varijable koje bi, na primer, mogle da se koriste kao
nezavisne varijable u diskriminacionoj analizi, kao zavisne varijable u multivarijacionoj analizi
varijanse ili kao klaster varijable u klaster analizi. U svakom sluaju, ako je cilj to vea
jednostavnost, onda se favorizuje reenje sa surogat varijablama, ako se eli replikacija u drugim
studijama, favorizuje se sumirana skala, a ako je akcenat na ortogonalnosti, onda se biraju faktor
skorovi. Sa empirijskog stanovita postoji velika slinost izmeu sumirane skale i faktor skorova.
Ipak, vrlo esto su rezultati faktorske analize sami sebi cilj, kada je dovoljno da se identifikuje
logika kombinacija varijabli i bolje razumevanje njihovog meusobnog odnosa.
F Fa ak kt to or rs sk ka a a an na al li iz za a u u s st ta at ti is st ti i k ko om m p pa ak ke et tu u S ST TA AT TI IS ST TI IC CA A
Koraci za izvoenje analize u programu su sledei:

Pokretanje analize:
StatisticsMultivariate Exploratory Technique Factor Analysis
Dobija se poetni meni za analizu.

Definisanje tipa podataka koji se analizira:
Input file:
Izabrati Raw Data ako su u pitanju sirovi podaci ili Correlation Matrix ako su u pitanju
koeficijenti korelacije koji su ranije izraunati.

Definisanje varijabli:
QuickVariables
Otvara se prozor sa spiskom varijabli od kojih treba odabrati one koje e biti uvrtene u analizu.
OK

Dobija se drugi glavni meni sa opcijama Quick, Advanced i Descriptives

Odreivanje broja faktora i minimalne ajgenvrednosti:
1. Multivarijaciona statistika analiza 26

Quick Maximum no. of factors (upisati eljeni broj faktora)
Quick Minimum eigenvalue (ostaviti neka bude 1)

Izbor metoda faktorske analize i metoda analize glavnih komponenti:
AdvancedExtraction Method (odabrati Principal Components)
AdvancedPrincipal factor analysis (ostaviti sve neobeleeno)
I u ovom modulu se moe definisati broj faktora i minimalna ajgenvrednost.

Izraunavanje korelacione matrice:
DescriptivesReview correlations, means, standard deviationsQuickCorrelations
U modulu Descriptives se nalazi jo nekoliko opcija koje mogu biti od koristi prilikom analize.

Izraunavanje ajgenvrednosti:
QuickOKEigenvalues

Izraunavanje faktorskih optereenja:
Quick OKQuick (ili Loadings) Summary: Factor loadings

Grafiki prikaz faktorskih optereenja:
Quick OK Quick (ili Loadings) Plot of factor loadings, 2D

Rotacija podataka:
QuickOK Quick (ili Loadings) Factor rotation (izabrati vrstu rotacije iz padajueg menija)

Scree metod odreivanja broja faktora:
QuickOKExplained varianceScree plot

Izraunavanje komunaliteta:
QuickOKExplained varianceCommunalities

1. Multivarijaciona statistika analiza 27

Izraunavanje faktorskih skorova:
QuickOKScoresFactor scores

L Li it te er ra at tu ur ra a
Hair, J., Black, W., Babin, B., & Anderson, R. (2010). Multivariate Data Analysis - A Global
Perspective. New Jersey: Pearsib.
Manly, B. F. (2005). Multivariate Statistical Methods - A primer (3rd Edition izd.). New York:
Chapman & Hall/CRC.
Myers, J. H., & Mullet, G. M. (2003). Managerial Applications of Multivariate Analysis in
Marketing. Chicago: American Marketing Association.

You might also like