You are on page 1of 23

Uvod

Svi procesi u prirodi i drutvu su u osnovi multivarijatni.

Razumijeti procese u njihovoj multivarijatnoj prirodi, a ne kroz


univarijatni pristup (jedna varijabla u vremenskoj taki,
izolirana od drugih varijabli).

Multivarijatne analize dio su statistike koja se koristi na


podacima dobivenim na veem broju varijabli (multivarijatna
vie varijabli).

Omoguava ispitivanje povezanost izmeu varijabli, kao i


razlike izmeu grupa, ili jedinica analize (kojima pojedinano i
kombinovano, doprinose varijable).
Multivarijatna statistika je nadogradnja univarijatne i
bivarijatne statistike.

Univarijatna i bivarijatna statistika: spacijalni sluaj


multivarijatne statistike.
Univarijatna statistika:
Jedna zavisna varijabla
Jedna ili vie nezavisnih varijabli
T-test, ANOVA
Eksperimentalna istraivanja
Bivarijatna statistika
Analiza dvije varijable
Povezanost izmeu varijabli
Pearsonov produkt-moment koeficijent korelacije, hi-
kvadrat
Neeksperimnatalna istraivanja
Multivarijatna statistika
Simultana analiza vie zavisnih i vie nezavisnih varijabli
Neeksperimentalna i eksperimentalna istraivanja
Podaci u multivarijatnim analizama

Matrica podataka
Uenik x1 x2 x3 x4
1 1 500 3,2 1
X1-tehnike poduavanja
2 1 420 2,5 2 X2 test znanja
X3 prosjena ocjena
3 2 650 3,9 1 X4 - spol

4 2 550 3,5 2

5 3 480 3,3 1

6 3 600 3,25 2
MULTIPLA REGRESIJSKA ANALIZA
Skup statistikih tehnika kojima procijenjujemo povezanost
izmeu jedne zavisne varijable (kriterij) i vie nezavisnih
varijabli (prediktori).

Primjenjuje se u eksperimentalni i neekseprimentalnim


istraivanjima.
Slikovni prikaz formalne strukture multiple regresijske analize
(prema Tacq, 1997)
Regresijska jednaina:

Y A B1 X 1 B2 X 2 ..... Bk X k

regresijski koeficijenti:
minimiziraju (sumu kvadrata) odstupanja izmeu
prognoziranih i opaenih vrijednosti Y, i
optimiziraju korelacije izmeu prognoziranih i opaenih Y
Istraivaka pitanja:
Povezanost izmeu kriterijske i prediktorskih varijabli;
koliko je svaki prediktor vaan?
Povezanost izmeu kriterijske varijable i pojedinih
prediktorskih varijabli kada je efeketa drugih prediktorskih
varijabli statistiki iskljuen.
Uporeivanje nekoliko skupova prediktora u prediciji
kriterijske varijable.
Najbolja jednaina predikcije (statistika /stepwise/
regresija koje prediktore treba ukljuiti u jednainu i
kojim redoslijedom).

Prediktori mogu biti kontinuirane i/ili dihotomne varijable;


diskretne varijable se pretvaraju u dihotomne kroz postupak
kreiranja dummy varijabli
Regresijski koeficijenti
Koliko snano prediktor utjee na kriterij
Nestandardizirani
Koliko se mijenja vrijednost Y uz jedininu promijenu X,
Standardizirani
U jedinicama standardne devijacije
Beta = 1,5 znai da e promijena od jedne standardne
devijacije prediktora dovesti do promijene od 1,5
standardnih devijacija kriterija.
Primjer
Pretpostavimo da nastavnik statistike eli znati koji studenti e postizati
bolji uspjeh iz ovog predmeta. Primijenio je test matematikog rezoniranja
i utvrdio da je korelacija izmeu rezultata na ovom testu i uspjeha na ispitu
iz statistike r=0,5, tj. 25% varijabiliteta uspjeha iz statistike objanjeno
matematikim rezoniranjem. Meutim, 75% varijance ostalo je
neobjanjeno. Pretpostavimo da je ostatak neobjanjene varijance jednim
dijelom povezan sa trudom i zalaganjem studenata. Stoga je nastavnik
utvrdio koliko se svaki student posveuje uenju statistike tokom jednog
dana u zadnjih 30 dana prije ispita. Povezanost izmeu ukupnog broja sati
koje student provede u spremanju ispita i uspjeha na ispitu iznosila je
r=0,4. Pretpostavimo da izmeu matematikog rezoniranja i vremena
provedenog u spremanju ispita nema povezanosti, tj. r=0. Moemo
zakljuiti da je objanjeno dodatnih 16% varijance uspjeha iz statistike.
Odnos izmeu ove tri varijable moe se predstaviti preko Vennovog
dijagrama.
Matrica korelacija X1 X2 Y
X1 1 0 0,5
X2 1 0,4
Y 1

Prikaz uea prediktora


u objanjenju varijance Uspjeh iz
uspjeha iz Statisitike Statistike
preko Vennovog
dijagrama
Matematiko Spremanje
rezoniranje ispita
25% 16%
Ukupni iznos objanjene varijance oznaava se sa R2
koeficijent multiple determinacije.
Simbol R oznaava koeficijent multiple korelacije.
R2=0,41, tako da je
izraz za odeivanje koeficijenta multiple korelacije (i ukupnog
iznosa objanjene varijance) u sluaju kada izmeu
prediktorskih varijabli nema povezanosti glasi:

R r YX1 rYX 2
2 2 2
R 2 0,41
R r YX1 rYX 2
2 2 R 0,64
Pretpostavimo da smo u gornjem primjeru umjesto broja sati
provedenih u spremanju ispita kao prediktorsku varijablu izabrali
prosjenu ocjenu koju je student imao u srednjoj koli iz matematike.
Neka je koeficijent korelacije izmeu matematikog rezoniranja (MR) i
uspjeha iz statistike (US) rYX1=0,5, a izmeu prosjene ocjene iz
matematike (POM) i uspjeha iz statistike rYX2=0,4.Nadalje,
pretpostavimo da je korelacija izmeu dva prediktora (matematiko
rezoniranje i prosjena ocjena iz matematike) rX1X2=0,3. S obzirom da
su dva prediktora povezana, Vennov dijagram izgledat e drugaije u
odnosu na sluaj kada su izmeu prediktora nema povezanosti.
Matrica korelacija X1 X2 Y
X1 1 0,3 0,5
X2 1 0,4
Y 1

Prikaz uea prediktora


u objanjenju varijance Uspjeh iz
uspjeha iz Statisitike Statistike
preko Vennovog
dijagrama

Prosjena
Matematiko ocjena
rezoniranje
Standardizirani regresijski koeficijenti ili beta ponderi
oznaavaju udio prediktorske varijable u prognozi rezultata
kriterijske varijable

rYX1 rYX 2 r12 rYX 2 rYX 1 r12


1 2
1 r12
2
1 r12
2

Opti izraz na odreivanje koeficijenta multiple korelacije (i


ukupnog iznosa objanjene varijance) glasi:

R 2 1r YX1 2 rYX 2
R 1r YX1 2 rYX 2
Koeficijent multiple korelacije moe se odrediti i na osnovu
vrijednosti koeficijenata korelacije prema sljedeem izrazu:

rYX1 rYX 2 2rYX1 rYX 2 rX 1 X 2


2 2

R
2

1 rX 1 X 2
2
Prognoza rezultata kriterijske varijable

Jednaina za prognozu sirovih rezultata glasi:

Y ' b0 b1 X 1 b2 X 2

Vrijednosti b1 i b2 su nestandardizirani regresijski koeficijenti i


mogu se odrediti prema izazima:
sY sY
b1 1 b2 2
sX sX 2
1

b0 M Y b1 X 1 b2 X 2
Regresijski koeficijenti
Koliko snano prediktor utjee na kriterij
Nestandardizirani
Koliko se mijenja vrijednost Y uz jedininu promijenu X,

Standardizirani
U jedinicama standardne devijacije
Beta = 1,5 znai da e promijena od jedne standardne
devijacije prediktora dovesti do promijene od 1,5
standardnih devijacija kriterija.
Standardiziran multipla regresijska jednaina glasi:

zY ' 1 z X1 2 z X 2
Semiparcijalna korelacija

Proporcija varijance objanjena samo jednim prediktorom (ne


i drugim), tj. jedinstvani doprinos prediktora multiploj
korelaciji. Kvadratni korijen ove proporcije je koeficijent
korelacije kojeg nazivano semiparcijalna korealacija (ili part
correlation).

Semiparcijalna korelacija jednog prediktora sa kriterijem


zapravo je korealcija kriterija s dijelom tog prediktora koji nije
povezan sa drugim prediktorom. Drugim rijeima, parcijalizira
se efekat drugog prediktora na prvi prediktor.
rY (1.2) 1 1 r12
2

rY ( 2.1) 2 1 r12
2
Parcijalni koeficijent korelacije

Za razliku od semiparcijalne korelacije, kod parcijalne


korelacije parcijalizira se efekat drugog prediktora i na kriterij i
na prvi prediktor.

rYX1 rYX 2 r12


rY 1.2
(1 rYX 2 )(1 r12 )
2 2

You might also like