You are on page 1of 27

Regresijska analiza

Regresijskom analizom se utvruje funkcionalna veza (relacija) izmeu jedne


zavisne varijable (kriterijska) i jedne ili vie nezavisnih varijabli (prediktorske), to
omoguava predvianje moguih vrijednosti zavisne varijable na temelju promjena
skupa nezavisnih varijabli. Takoer omoguava odgovor na pitanje objanjava li
prediktorski skup varijabli statistiki znaajno uspjenost u kriterijskoj varijabli
(multipla korelacija i njena znaajnost), te koja prediktorska varijabla i koliko
doprinosi uspjenosti u kriteriju (beta ponder). Primjer koritenja regresijske analize
je pokuaj objanjenja uspjenosti u nekom sportu (kriterij) na osnovu sposobnosti,
osobina, situacijski parametara kao prediktora. Odnosno, cilj je utvrditi to i koliko
utjee na uspjenost u nekoj sportskoj aktivnosti.

Izraun RA ide slijedom slijedeih slika:

Odaberemo iz izbornika statistics modul Multiple Regression


U dobivenom prozoru odaberemo Variables

Pri odabiru varijabli lijevo biramo jednu kriterijsku (zavisnu) a desno prediktorske
(nezavisne) varijable. Ukoliko trebamo birati varijable na preskok tada se koristimo
tipkom Ctrl, ije dranje nam omoguava selektiranje i deselektiranje jedne po jedne
varijable.

U ovom primjeru na datoteci Judo.sta elimo prognozirati rezultate u SDM (skok u


dalj s mjesta) na osnovu svih ostalih varijabli u matrici (okretnost na tlu-ONT,
okretnost u zraku-OUZ, neritmiko bubnjanje-NEB, sklekovi-SKL, trbunjaci-TRB,
unjevi-CUC, bacanje medicinske lopte-BML). U toj matrici se nalaze rezultati 60
judaa u navedenih 8 varijabli.

Nakon odabira varijabli kliknemo OK i ponovno OK te dobijemo rezultate regresijske


analize.
Interpretiramo rezultate:
Multpla R- je multipla korelacija kao maksimalno mogua povezanost svih
prediktorskih varijabli (kao jedne varijable) s kriterijskom varijablom. U ovom primjeru
iznosi 0,72 (visoka povezanost)

Znaajnost R testira se F testom i statistiki je znaajna sa pogrekom od 0,000001


odnosno znaajna je na razini znaajnosti od 0,01.

R2 koeficijent determinacije, proporcija objanjene varijance kriterijske varijable na


osnovu skupa prediktorskih varijabli. Znai, kriterij SDM kao standardizirana varijabla
ima varijancu 1 od ega je 0,51 varijance objanjeno sa 7 prediktorskih varijabli.
Odnosno od svega onoga to odreuje rezultat (uspjenost ili uzroke zato neko ima
bolji ili loiji rezultat) u SDM mi smo u ovom sluaju sa 7 prediktorskih varijabli
objasnili 51% od varijance 1, odnosno od 100% svih uzroka uspjenosti u SDM.

Beta ponder (parcijalni regresijski koeficijenti) predstavlja veliinu doprinosa pojedine


prediktorske varijable u prognozi rezultata u kriterijskoj varijabli. Odnosno vanost ili
pojedinani utjecaj pojedinog prediktora za uspjeh u kriteriju. Tako u ovom sluaju
BML ima beta ponder od 0,37 te je jedina prediktorska varijabla koja znaajno
doprinosi prognozi uspjeha u kriteriju.

Zato se multipla korelacija (R) definira kao maksimalno mogua povezanost i


izmeu konkretno kojih varijabli je ta povezanost? I to znai navod trai se ona
optimalna kombinacija beta pondera za prediktore koja e dati maksimalnu multiplu
korelaciju?

Postoje razne matematike formule i algoritmi za raunanje R i beta. Njih u ovdje


zanemariti jer mi nije cilj objasniti kako izraunati nego to je R i beta.
Multipla korelacija je povezanost sumiranih prediktorskih varijabli dodatno prethodno
pomnoenih svaka sa svojom betom. To zbrajanje vie varijabli u jednu naziva se
njihovom linearnom kombinacijom a ako ih se mnoi betama onda se taj zbroj naziva
ponderirana linearna kombinacija prediktorskih varijabli (vidi file Slijed i opis
koritenja primjera DPLKa u Statistici). Nazovimo tu varijablu K*. Znai, 7
prediktorskih varijabli je jednostavno zbrojeno uz prethodno mnoenje svake
varijable pripadajuom betom (to ini prognozirane rezultate ispitanika u kriteriju a
dobiveno je jednadbom specifikacije). Taj ponderirani zbroj (K*) kada se korelira s
kriterijskom varijablom (u naem sluaju SDM) dobije se najvea mogua korelacija
koja se zove multipla korelacija (u ovom sluaju 0,72).

Zakljuak: ponderirana linearna kombinacija (PLK) u regresijskoj analizi je nova


varijabla koja je suma prediktorskih varijabli prethodno ponderiranih takvom
kombinacijom beta pondera da se dobije maksimalno mogua multipla korelacija
kako bi se minimizirala pogreka prognoze.

PLK u regresijskoj analizi je dobivena istom logikom kao i faktori u faktorskoj analizi
(ponderirana suma manifesnih varijabli) uz razliku koja se odnosi na cilj analize. U
regresijskoj je to maksimizirati multiplu korelaciju optimalnom kombinacijom beta
pondera i time minimizirati pogreku prognoze rezultata u kriteriju. U faktorskoj
analizi je cilj drugaiji (maksimizirati varijancu latentne varijable kako bi objasnili to
vei dio varijance manifesnih varijabli) i koriste se drugaiji algoritmi za dobivanje
pondera ali je logika ista kao u regresijskoj analizi dobiti ponderiranu sumu
varijabli u skladu s ciljem pojedine analize.

Ista logika vai i za kanoniku i diskriminacijsku analizu. Sve se baziraju na


utvrivanju optimalnih pondera i time dobivanju PLK-a ovisno o ciljevima koji se ele
postii u pojedinoj od tih analiza (u kanonikoj preko parova kanonikih faktora koji
su u maksimalno moguoj kanonikoj korelaciji utvrditi odnose dva skupa varijabli. U
diskriminacijskoj analizi dobiti latentnu varijablu zvanu diskriminacijska funkcija u
kojoj e ispitanici jedne skupine biti to loiji a druge to bolji, odnosno koja e to
vie razlikovati skupine ispitanika).

U okviru regresijske analize mogue je jo izraunati b koeficijente i njihovu


znaajnost. Odabirom gumba Summary Regression dobijemo
U tabeli su prvo navedeni beta ponderi a u treem stupcu se nalaze b
koeficijenti. To su isti koeficijenti samo su bete standardizirane (u Z
vrijednostima) a b nestandardizirane vrijednosti (izraeni u originalnim
rezultatima sekunde, cm, kg, broj sklekova, trb itd) parcijalnih regresijskih
koeficijenata.
to je beta ili b brojano gledano? To je brojana vrijednost za koju e se
promijeniti rezultat u kriteriju ako rezultat u prediktoru poveamo za jedininu
vrijednost (za jedan cm, kg, standardnu devijaciju ili ono u emu je taj prediktor
mjeren).
Npr. Za sklekove je b 0,27 to znai da ako bi se kod nekog ispitanika rezultat u
sklekovima poveao za jedininu vrijednost (jedan sklek vie ) njegov rezultat u
kriteriju (SDM) bi se poveao za 0,27cm. Odnosno za svaki sklek to se poboljamo
profitirat emo u SDM za 0,27cm. Ili standardizirano ako se u sklekovima poboljamo
sa +1 na +2 standardne devijacije (za jedininu vrijednost a sada je to jedna
standardna devijacija) rezultat e nam se poveati za beta odnosno za 0,14
standardnih devijacija.
Naravno, ovo vai samo za sluaj da pripadamo populaciji na kojoj ili za koju je to
utvreno. Znai konkretno da smo judai. Jer rezultate nekog istraivanja smijemo
generalizirati samo ako su statistiki znaajni i samo na populaciju iz koje su
ispitanici sluajno izvueni. Ovako zakljuivanje sa uzorka na populaciju naziva se
statistiko zakljuivanje.
Takoer, ovu prognozu rezultata treba shvatiti kao prognozu koja ima svoju pogreku
(ovisna odnosno obrnuto proporcionalna veliini multiple korelacije) i prognozirani
rezultat nije sigurni nego najvjerojatniji rezultat nekog ispitanika.

U jednadbi za dobivanje pravca regresije

y=a+bx

y je prognozirani rezultat za nekog ispitanika u kriterijskoj varijabli


a je intercept, odsjeak na osi y odnosno koliko bi bili dobri u kriteriju da smo napravili 0
rezultat u prediktoru
b je ponder (vrijednost za koju e se promijeniti rezultat u kriteriju ako rezultat u prediktoru
poveamo za jedininu vrijednost)
x je bilo koja vrijednost u prediktoru za koju prognoziramo rezultat u kriteriju, pa ako se zna
intrecept i ponder mogue je izraunati prognozirani rezultat za bilo koji opaeni x
K y=a+bx

ei = yi yi

xi
P

ei pogreka prognoze, razlika izmeu stvarne i prognozirane vrijednosti rezultata


jednog ispitanika
yi - stvarni rezultat u kriteriju
yi - prognozirani rezultat u kriteriju

slika x. Prikaz logike b ili beta koeficijenta - b je ponder (vrijednost za koju e se


promijeniti rezultat u kriteriju ako rezultat u prediktoru poveamo za jedininu vrijednost,
odnosno za svaki pojedinani rezultata vie u prediktoru na prognozirani rezultata u kriteriju
se poveava ili smanjuje za onoliko koliko je b koeficijent
Prognozu rezultata u kriteriju na osnovu odreenih rezultata u prediktoru u
statistici 7 moemo izraunati na slijedei nain

Odaberemo gumb Residuals/assumptions/prediction i potom gumb Predict


dependet variable i dobijemo prozor lijevo u koji unesemo rezultate u prediktorima,
kliknemo ok i dobijemo prognozirani rezultat u kriteriju na osnovu zadanih rezultata u
prediktorima.

U ovom sluaju ako u prediktorima napravimo uneene rezultate (u stupcu Value)


prognozirani rezultat u kriteriju e nam biti 237,8 cm. Zadnji stupac je zapravo
jednadba specifikacije za SDM, naravno za dotinu populaciju mladih judaa.
nestandardizirano

k = b1x1 + b2x2 + ...+ bmxm


standardizirano

k = 1z1 + 2z2 + ...+ mzm


Analizu rezidualnih vrijednosti mogue je provesti pokretanjem opcije perform
residuals analysis i summary. Ovim nam se otvara tabela u kojoj se nalaze opaeni
rezultati ispitanika u kriteriju (observed value), prognozirani rezultati ispitanika u
kriteriju (predict value), te razlika izmeu opaenih i prognoziranih rezultata, odnosno
rezidualne vrijednosti (residual). Cilj regresijske analize je objasniti uspjenost u
kriteriju u to veoj mjeri, stoga reziduali trebaju biti to manji time je i pogreka
prognoze manja, a to sve ovisi o veliini multiple korelacije.
Prognozirane vrijednosti (predict value) predstavlja varijablu K*, odnosno
ponderiranu linearnu kombinaciju prediktora na nain da multipla korelacija bude
maksimalno mogua.
Zadatak 1.: na kosarka.sta filu napravi regresijsku analizu, kao kriterij uzmi K2
(uspjenost koarkake ekipe izraena kroz broj koeva sa kojim se izgubila ili
pobjedilau dotinom susretu) a prediktori neka budu prvih 13 varijabli situacijske
efikasnosti kao rezultati ekipe (u ovom sluaju su one entiteti) u pojedinanoj
utakmici. Interpretiraj rezultate u skladu sa prethodnim primjerom iz fila Judo
Zadatak 2. Na filu Skola kao kriterij koristi varijablu TRGM (tranje na 6 minuta) a sve
ostale varijable kao prediktore (visina, teina, opseg podlaktice, nabor nadlaktice,
taping, poligon, skok u dalj, podizanje trupa, pretklon raznono i izdraj u visu).
Interpretiraj rezultate u skladu s primjerom iz fila Judo.

FAKTORSKA ANALIZA
Faktorska analiza ima cilj saeti podatke prikupljenih na veem broju manifesnih
varijabli (testova) meu kojima postoji povezanost (korelacija) na manji broj
latentnih dimenzija (faktora).

Faktorska analiza pokuava pronai latentne varijable (faktore) za koje se smatra da


su uzroci razlika meu ispitanicima u manifesnim varijablama, kao i uzroci
povezanosti izmeu manifesnih varijabli.

Npr. ispitanici e se razlikovati u skoku u dalj iz mjesta (SDM) prvenstveno zbog


razlika u razini eksplozivne snage kao faktora ili latentne varijable koja u najveoj
mjeri odreuje rezultat ispitanika u tom testu (faktori kao uzroci razlika meu
ispitanicima u manifesnim varijablama). SDM e biti u visokoj korelaciji sa BML
budui je za uspjenost u oba testa presudna eksplozivna snaga (faktori kao uzroci
povezanosti izmeu manifesnih varijabli).

Slijed izraunavanja F.A. u statistici 7

Koristit emo za primjer datoteku Judo.sta koju smo ve opisali kod regresijske
analize. Iz navedenih 8 varijabli oekujemo dobiti faktore koordinacije (ONT, OUZ,
NEB), zatim faktor jakosti (SKL, TRB, CUC) i faktor eksplozivne snage (SDM, BML).
Uz napomenu da u pravilima faktorske analize stoji kako je za dobivanje jednog
faktora neophodno imati najmanje 3 manifesne varijable koje dominantno grade taj
faktor. Tako da emo faktor eksplozivnosti uzeti sa rezervom jer nemamo 3 testa koji
procjenjuju eksplozivnost nego samo dva.
Nakon odabira varijabli kliknemo dva puta OK, te odredimo maksimalni broj faktora
na eljeni broj (najbolje na broj manifesnih varijabli). Takoer, minimalnu svojstvenu
vrijednost ostavimo na 1 jer je to u skladu sa GK kriterijem za redukciju faktora na
one koji imaju varijancu veu od 1. Znai, dobivamo uvijek onoliko faktora koliko je
manifesnih varijabli ali nisu nikada svi znaajni pa ih trebamo reducirat samo na one
s varijancom veom od 1 to e nam napraviti sam program statistica.

Idemo na ok i dobijemo rezultate faktorske analize

Eigenvalues- su svojstvene vrijednosti (lambde) odnosno varijance ili veliine faktora.


Vidimo da smo dobili 3 znaajna faktora koji imaju lambdu veu od 1. Ostali imaju
manju pa ih je statistica eliminirala u skladu sa naim prethodno zadanim uvjetima za
redukciju.
Ovim su napravljena prva dva koraka u faktorskoj analizi:
Ekstrakcije izvlaenje ili dobivanje latentnih iz manifesnih varijabli
Redukcija - utvrivanje broja faktora koje ima smisla koristiti u nastavku analize

Klikom na gumb eigenvalue iz izbornika Quick


Dobivamo statistiku svojstvenih vrijednosti (varijance faktora lambda)

% total variance nam govori koliko posto od ukupne varijance svih manifesnih
varijabli (iznosi 8 jer ih je u ovom sluaju 8) je objasnio svaki od znaajnih faktora
Ostatak podataka je kumulativni prikaz varijanci i postotaka tako da zadnji broj govori
koliko su svi znaajni faktori objasnili % varijance manifesnih varijabli (68,7%)

Faktori su dobiveni tako da svaki pokupi to vie varijance od svih manifesnih


varijabli to je osnovni uvjet pod kojim se vri ekstrakcija latentnih varijabli. Ukupna je
varijance manifesnih varijabli 8 jer ih 8 a svaka ima varijancu 1 kad je
standardizirana. Nakon ekstrakcije s ciljem dobiti to vei prvi i ostale faktore
interpretacija faktora obino nije povoljna jer prvi faktor bude dominantno povezan s
veinom manifesnih varijabli. Potrebno je rotirati ekstrahirane i reducirane faktore da
ih se dovede u povoljniju poziciju (korelaciju) sa pojedinim skupovima visoko
meusobno koreliranih manifesnih varijabli (npr. sa setom varijabli CUC, TRB, SKL)
Rotacija ima za cilj transformirati poetno nepovoljno stanje za interpretaciju faktora
u finalnu soluciju koja to olakava.
Rotiramo kao na slici ispod

Nakon odabira rotacije idemo na Summary i dobijemo matricu rotiranih korelacija


faktora i varijabli, odnosno matricu strukture faktora na osnovu koje odreujemo koji
je koji faktor.
U ovom sluaju Factor1 je jakosna izdrljivost (jer taj faktor najvie odreuju, imaju s
njime najveu korelaciju, varijable SKL i CUC). Factor2 je eksplozivna snaga zbog
istih razloga kao kod prethodnog. Trei faktor je koordinacija jer je u visokoj korelaciji
sa testovima za koje znamo da mjere koordinaciju (NEB, ONT). Vidimo da se faktori
interpretiraju ili utvruju na osnovu znanja, pretpostavki, dosadanjih istraivanja ili
logike koju istraiva navede.

Vee od 0,70 korelacije su u gornjoj matrici crvene to je zato to korelacija na kvadrat


od 0,70 je 0,49 a to je zajednika varijanca faktora i varijable. Znai na primjer da u
BML ima eksplozivnosti 0,64 (0,80 na kvadrat) od ukupno 1 ili 64%. Znai od svega
onoga to determinira rezultat nekog ispitanika u BML, 64% otpada na eksplozivnost
kao uzrok uspjenosti. Primjeujemo da je 0,70 granica stoga to tada zajednika
varijanca prelazi 50%. Da bi neki test bio valjan za mjerenje nekog faktora mora biti
dominanto taj faktor zastupljen u varijanci tog testa, odnosno biti 50% ili vie tog
faktora koji elimo mjeriti. Npr. Ako elimo nekim testom agilnosti mjeriti (pravilnije
reeno procjenjivati) agilnost onda u tom testu mora dominirati faktor agilnosti.

Da bi pokazali logiku ili neophodnost rotacije prikazat emo istovremeno rotirane


(desno) i nerotirane korelacija (lijevo) da bi vidjeli kako ne rotirana solucija
onemoguava smislenu interpretaciju faktora.

Rotacija se izvodi s ciljem dobivanja jednostavne strukture faktora, odnosno tei se


tomu da jedan faktor bude u to je mogue veoj korelaciji s jednim skupom varijabli
(snopom gledano vektorski), a istovremeno to manjoj sa svim ostalim varijablama ili
snopovima varijabli. to je vidljivo na slici ispod (napomena, vektorski gledano
korelacija je vea to su dva vektora/varijable blie jedna drugoj).

Isprekidane strelice/vektori su faktori prije rotacije, plavi vektori su faktori nakon


rotacije. Vidimo da je F1 (fi1) rotiran tako da bude to blii jednom snopu vektora a
istovremeno to dalji od ostalih snopova. Time se omoguava lake interpretacija,
dobivaju se ii faktori, s jednostavnijom strukturom.

Da bi vidjeli sam faktor trebamo zapravo pogledat rezultate ispitanika u pojedinom


faktoru jer to je zapravo stvarni faktor gledano statistiki. Kao to visina nije varijabla
zato to pie oznaka VISINA nego je varijabla kada imamo rezultate ispitanika u
visini, tako i faktor nije neki imaginarni znak nego konkretna varijabla (istina ne
direktno dobivena mjerenjem nego kombinirana manifesnim varijablama) u kojoj
svaki ispitanik ima svoj rezultat dan naravno ne u cm, kg, broju sklekova nego u
standardnim devijacijama.

Da bi vidjeli rezultate ispitanika u faktorima idemo u statistici na gumb Scores pa


Facor scores
Desno vidimo rezultate prvih 26 ispitanika u faktorima 1,2,3. Npr. Ispitanik pod
rednim brojem loe jakosti, dosta loe eksplozivnosti (jer moramo uzeti u obzir
predznak korelacija SDM i BML s faktorom 2. koji je negativan to daje naposljetku
lo a ne dobar rezultata jer plus i minus daju minus) i jako loe koordinacije. I tako za
svakog etniteta.
Rezultati su naravno izraeni u standardni devijacijama i predstavljaju stvarnu
latentnu varijablu, faktor. Faktor je latentna varijabla i nije direktno mjerljiva ali
faktorskom analizom se dobivaju rezultati ispitanika u faktorima to predstavlja
latentnu varijablu jednako kao to rezultati ispitanika u npr. SDM ine varijablu SDM.
Kao to je manifesnu varijablu unjevi zapravo ine rezultati svih ispitanika u
unjevima, tako faktor jakosne izdrljivosti ine rezultati ispitanika u tom faktoru,
odnosno sad u jakosnoj izdrljivosti.

Objanjenu varijancu pojedine manifesne varijable (njen komunalitet)


moemo oitati kada pokrenemo padajui izbornik Explained varinace i gumb
Communalities.

Komunalitete pojedine varijable oitavamo uvijek u stupci posljednjeg


znaajnog faktora iz razloga to su objanjene varijance u ovoj tabeli date
kumulativno. Npr, varijabla SKL ima zajednike varijance s prvim faktorom
0,50 (odnosno varijance faktora repetitivne snage u sklekovima ima 0,50 ili
50%). Prvi i drugi faktor objanjavaju zajedno 0,67 varijance SKL. Iz toga
proizlazi da varijance drugog faktora (eksplozivne snage) u SKL ima 0,17.
Dok trei faktor (koordinacija) objanjava 0,03 varijance varijable sklekovi.
Znai komunalitet u ukupna objanjena varijanca neke manifesne varijable na
osnovu znaajnih faktora u dotinoj faktorskoj analizi. Unikvitet je
neobjanjena varijanca, odnosno razlika izmeu komunaliteta i ukupne
varijance standardizirane manifesne varijable koja uvijek iznosi 1.
Zakljuno faktorska analiza

Faktor ili latentna varijabla u faktorskoj analizi zapravo ponderirana (ponedrima


pomnoena) suma manifesnih varijabli s ciljem dobivanja latentne varijable koja e
objasniti to vei udio ukupne varijance manifesnih.

Odnosno to faktiki znai isto to i imati to veu korelaciju sa svim manifesnim


varijablama.

Potom nakon rotacije e ta PLK-a biti takva da zadovolji uvjet jednostavne strukture
faktora, to jest da bude u to je mogue veoj korelaciji sa jednim skupom visoko
koreliranih manifesnih varijabli i istovremeno u to manjoj korelaciji sa ostalim
skupovima.

Oito je da se faktorska i regresijska analiza ne poklapaju samo u logici da koriste isti


nain kombiniranja varijabli u nove latentne varijable nego im je ak i cilj vrlo slian.

Dok je u regresijskoj cilj dobiti to veu multiplu korelaciju prediktora kao jedne PLK-
a (latentnu varijablu) sa kriterijem (odnosno objasniti u to je mogue veoj mjeri
varijancu kriterijske varijable),

u faktorskoj analizi je cilj dobiti takvu PLK-a manifesnih varijabli (latentnu varijablu)
da budu u to veim pojedinanim korelacijama sa manifesnim varijablama, odnosno
da objasni to veu koliinu njihove varijance.

Iako su algoritmi raunanja prilino razliiti (vidi Dizdar 2006.) ciljevi su gotovo
identini, uvijek se radi o pokuaju maksimiziranja objanjenje varijance.

Razlika je jedino u polaznim osnovama ciljeva analiza. U jednoj je cilj objasniti kriterij
(NJEGOVU VARIJANCU) na osnovu vie prediktora a u drugoj objasniti vie
manifesnih varijabli (NJIHOVU VARIJANCU I POVEZANOST) na osnovu manjeg
broja latentnih varijabli.

Zadaci: napravi faktorsku analizu na filu skola uzmi varijable VISI, TEZI, OBPO
(pokuat e dobiti morfoloki faktor iz ove tri varijable) te jo varijable POTR, IZVI i
TRGM (pokuat dobiti motoriki faktor jakosne i aerobne izdrljivosti)
Pokuaj slino izvesti i sa podacima u filu Pejcic 318. Interpretiraj rezultate u skladu s
prikazom iz Judo fila.

Kanonika analiza
KKA koristi se u sluajevima kada je potrebno prouavanje odnosa izmeu dviju
skupina varijabli. Relacije izmeu dvaju skupova varijabli utvruju se preko tvz.
parova kanonikih faktora

Kanoniku analizu u ovom prikazu emo raditi na matrici skola.sta


Idemo slijedom
U prvom prozoru odabira varijabli odaberemo sve varijable i idemo na OK

Potom biramo varijable za lijevi i desni set varijabli. Desno odaberemo prve 4
morfoloke varijable, a lijevo od 4. do 11. motorike varijable. I kliknemo OK

I dobijemo rezultate kanonike analize


Cilj analize je utvrditi relacije izmeu dva seta varijabli.

KKA koristi se u sluajevima kada je potrebno prouavanje odnosa ili relacija izmeu
dviju skupina varijabli. Relacije izmeu dvaju skupova varijabli utvruju se preko tvz.
parova kanonikih faktora, koji se nalaze u kanonikim parovima i izmeu kojih je
kanonika korelacija kao maksimalno mogua povezanost jednog kanonikog faktora
lijevog seta i njemu odgovarajueg kanonikog faktora desnog seta.

Prvo to trebamo utvrditi je pitanje statistike znaajnosti kanonike korelacije?


To emo uiniti klikom na gumb Chi square tests na slici iznad i dobijemo rezultate na
tstiranja znaajnosti kanonikih korelacija pomou hi kvadrat testa na slici ispod.

Dobili smo 4 kanonike korelacije jer imamo 4 kanonika para (zbog 4


varijable u manjem setu jer je broj latentnih varijabli jednak broju manifesnih).
Znaajne kanonike korelacije su prva i druga (gledamo p, jel manji od 0,05).

Kanoniki faktori su kao i faktori u faktorskoj analizi i prognozirane vrijednosti u


regresijskoj analizi, dobivene kao ponderirane linearne kombinacije varijabli (zbroj
prethodno ponderima pomnoenih manifesnih varijabli) uz uvjet maksimalno mogue
povezanosti parova kanonikih faktora.

Potom da bi interpretirali kanonike faktore idemo na gumb Factor structures i


potom na Factor structure redundancies
Tada dobijemo 4 matrice od kojih gledamo factor structure left i factor
structure right sets.

Interpretacija kanonike analize je neto sloenija iz razloga to treba gledati


povezanost dva seta varijabli u latentnom prostoru kanonikih faktora (kroz
kanonike korelacije) ali i istovremeno gledati koja od manifesnih varijabli
odreuje koji kanonikih faktora.
Na slici iznad je vidljivo da Root 1 prvi kanoniki faktor lijevog seta ima
najvee korelacije sa varijablom TRGM (tranje na 6 minuta), dok njemu
odgovarajui prvi kanoniki faktor desnog seta ima visoku korelaciju sa NABN
(naborom nadlaktice). Zakljuak je da morfoloke faktor potkonog masnog
tkiva negativno djeluje na uspjeh ispitanika u tranju na 6 minuta, a dijelom i
na taping rukom i podizanje trupa (trbunjake).

Pokuaj sam interpretirati kinezioloku logiku kanonike korelaciju u drugom


kanonikom paru koji kao to smo iznad vidjeli ima znaajnu kanoniku
korelaciju.

Za izraunavanje rezultata ispitanika u kanonikim faktorima koristi se


padajui meni Canonical scores te gumb Save canonical scores.
Iz tabele je mogue oitati rezultate npr. 3. Ispitanika u drugom faktoru lijevog
(left) seta L_fac2 koji iznosi -1,08 standardnih devijacija

Ako bi izraunali korelacije izmeu kanonikih faktora pokazalo bi se da nema


korelacije izmeu kanonikih faktora izvan kanonikog para. Odnosno, svaki
kanoniki faktor je u korelaciji 0 sa svim ostalim faktorima osim to je u
kanonikoj (maksimiziranoj) korelaciji sa sebi odgovarajuim faktorom drugog
seta.

Kanoniki ponderi na osnovu kojih su dobiveni kanoniki faktori (s kojima su


mnoene poetne varijable prije nego su linearno kombinirane, zbrojene u
kanonike faktore) mogu se izraunati pokretanje gumba Left&right set
canonical weights. Naravno, radi se o standardiziranim koeficijentima.

Napravi kanoniku analizu na Pejcic318.sta izmeu morfolokih i motorikih


varijabli i interpretiraj rezultate na prethodno prikazan nain.

Zakljuno kanonika analiza


KA je po svojoj logici jednaka regresijskoj analizi jer utvruje relacije dva skupa
varijabli s time da u ovom sluaju nije vano jeli neki skup kriterij ili nije (iako po elji
moe biti). Razlika je u tomu to ima vie varijabli u oba skupa a ne samo jedna kao
u regresijskoj analizi (kriterijska). Druga je razlika u koritenom algoritmu za
izraunavanje pondera koji je gotovo identian komponentnom modelu faktorske
analize uz razlike da se trae parovi faktora koji su u to veoj korelaciji. Odnosno
trae se PLK-a (kanoniki faktori) s ciljem maksimiziranja povezanosti dva skupa na
latentnoj razini.

K.K.A. ima logiku regresijske analize izraunate logikom faktorske analize.

Diskriminacijska analiza
Diskriminacijska analiza (DA) utvruje znaajnost razlika vie grupa entiteta
mjerenih u vie varijabli, utvrujui pritom razlikuju li se grupe meusobno statistiki
znaajno i koliko pojedine varijable pridonose toj razlici, a mogue je i prognozirati
pripadnost pojedinog entiteta grupi.

Izraun DA emo prikazati na Pejcic318 matrici podataka. Idemo slijedom


Odaberemo varijable tako da lijevo uzmemo varijablu spol koja e nam kreirati
dvije skupine (uenike i uenice). Desno emo odabrati morfoloke i
motorike varijable od 5. do 16.

Kliknemo dva puta OK i dobijemo rezultate diskriminacijske analize


Prvo moemo na gumbu Summary: Variables in the model utvrditi razlikuju li
se statistiki znaajno uenici od uenica u pojedinim od varijabli zasebno.

Vidimo da se skupine razlikuju znaajno u gotovo svim varijablama (gledaj


uvijek p-level za znaajnost). U ovoj tabeli u polju iznad nalaze se rezultati
multivarijatnog F-testa odnosno MANOVE (multivarijatne analize varijance)
koja testira znaajnost razlika vie grupa ispitanika u vie varijabli
istovremeno. Vrijednosti p-levela u tabeli za svaku varijablu odgovaraju
zapravo vrijednostima p-level vrijednosti za beta pondere ako bi napravili
regresijsku analizu pri emu bi gruping varijabla bila kriterij a ostale varijable
prediktori. To zapravo dovodi od zakljuka da vrijednosti pogreke u tabeli
iznad testiraj statistiku znaajnost vanosti pojedine varijable za razlikovanje
grupa ispitanika.
Potom idemo na Perform canonical analysis

I potom idemo testirat znaajnost diskriminacijske funkcije klikom na gumb


Summary: Chi square.

Diskriminacijska funkcija (DF) znaajno razlikuje uenike i uenice. Jednu DF


smo dobili stoga to imamo dvije grupe a broj DF je jednak broju grupa manje
jedan.

Slijedei korak je interpretirati koja varijabla je koliko povezana sa DF.


Odnosno trebamo utvrditi strukturu DF kako bi smo vidjeli koja varijabla vie a
koja manje doprinosi razlikovanju grupa.
Vidimo da se uenici i uenice najvie razlikuju u MPOL (poligonu), potom MDTR
(podizanje trupa), ANN (nabor nadlaktice)
to neka od varijabli ima veu korelaciju sa DF to ona vie razlikuje grupe ispitanika.
Dodatno da bi vidjeli kojoj varijabli je neka skupina bolja od druge trebamo gledati
aritmetiku sredinu te grupe na diskriminacijskoj funkciji (tzv centroid grupe, odnosno
aritemtika sredina grupe u svim varijablama istovremeno)

U ovom sluaju su uenici se nalaze na pozitivnoj strani DF-a (prosjek im je na 0,64


standardne devijacije diskriminacijske funkcije). U skladu sa time uenici imaju vee
prosjene rezultate od uenica i onim varijablama koje imaju pozitivnu korelaciju sa
DF. Konkretno, uenici imaju vie rezultate u npr. MDTR dok uenice imaju vie
rezultate u ANN.

Za dobivanje rezultata ispitanika u diskriminacijskoj funkciji pokrenemo opciju


Canonical scores i potom gumb Canonical scores for each case

Vidimo da su rezultati takvi da se veina uenica ima negativne rezultate u


diskriminacijskoj funkciji a veina uenika pozitivne. To je dogovor na pitanje to
znai tvrdnja da je diskriminacijska funkcija dobivena sa ciljem da to bolje razlikuje
grupe. Znai da se ispitanicu skupina u toj latentnoj varijabli to vie razlikuju,
odnosno da su jedni to vie pozitivni a drugi to vie negativni.
Prognoza pripadnosti pojedinog ispitanika grupama moe se izraunati iz
padajueg menija Clasification i gumba Clasification of cases

Prvi stupac pokazuje opaenu izvornu pripadnost ispitanika pojedinoj skupini. Drugi
stupac prikazuje prognoziranu pripadnost pojedinoj skupini utvrenoj na osnovu
rezultata tog ispitanika. Npr. ispitanik broj 2. je enskog roda i ima rezultate u
varijabla morfologije i motorike koji ga klasificiraju u skupinu ena. Dok je ispitanik
broj 1 enskog roda ali mu je prognozirana pripadnost mukom rodu na osnovu
njegovih morfolokih i motorikih karakteristika (u ovom sluaju se radi o uenicima i
uenicima od prvog do etvrtog razreda osnovne kole).
Diskriminacijska analiza se esto koristi za prognozu pripadnosti pojedinog entiteta
odreenoj skupini. Na primjer u kineziologiji pripadnost nekog mladog sportaa
skupini uspjenih ili skupini neuspjenih sportaa ime se zapravo prognozira
njegova sportska uspjenost.
Zakljuno o diskriminacijskoj analizi
Cilj je ponderiranim linearnim kombiniranje varijabli pronai novu varijablu koja e se
ispitanici skupina to vie razlikovati u svojim rezultatima. Na osnovu znaajnosti
diskriminacijske funkcije i visine kanonike korelacije odreuje se diskriminacijska
mo diskriminacijske funkcije (DF). Varijabla koja ima veu korelaciju ili pondere sa
DF vie doprinosi razlikovanju grupa jer vie doprinose izgradnji diskriminacijske
funkcije.

Pondere za diskriminacijsku funkciju moemo izraunati pokretanjem


padajueg menija Advanced i gumba Coefficient for canonical variables

Zadatak: napravi sve isto samo umjesto Spola koristi varijablu razred da
utvrdi razlikuju li se i u kojim varijablama i koliko prvi, drugi, trei i etvrti
razred osnovne kole. Ovaj puta e imati vie DF-a. Zato? Interpretiraj sve
rezultate kao u primjeru iznad.

Uivaj

You might also like