You are on page 1of 11

Korelacija i regresija

- korelacija mjera povezanosti dvije ili vie varijabli


Karl Pearson
- regresija definira oblik povezanosti dvaju ili vie varijabli
Francis Galton

Korelacija
Mjera povezanosti dvije ili vie varijabli metoda kojom se utvruje da
li meu varijablama postoji funkcionalna ovisnost
Pearson-ov koeficijent korelacije r moe poprimiti vrijednost od -1.00
do +1.00
r<0 definira negativnu korelaciju
r>0 definira pozitivnu korelaciju
SMJER POVEZANOSTI

Metoda korelacije prati odstupanja i usporeuje varijacije dvaju ili vie


varijabli te mjeri odnose meu varijacijama. jakost veze
Metoda najmanjih kvadrata odstupanja koristi se za odreivanje
koeficijenta korelacije odnosno koeficijenta determinacije

Metoda najmanjih kvadrata odstupanja u odreivanju koeficijenta korelacije:

- r Pearsonov koef. korelacije


- xi, yi originalne vrijednosti
- n broj parova podataka

x y
i

nx y

2
x

n
x

i
2

2
y

n
y
i
2

Primjeri kretanja koeficijenta korelacije za razliite grupe podataka:

Izvod koeficijenta determinacije:

yi y yi y y y
yi y ( y y ) ( yi y ) / 2
n

i 1

i 1

(
y

y
)

(
y

y
)

2
(
y

y
)(
y

y
)

(
y

y
)
i

i
i
i 1

i 1

SKOukupno SKO protumaro o SKOostatka


r
2

SKO protumaro o
SKOukupno

- koeficijent korelacije se rauna kao drugi korijen koeficijenta determinacije


- r2 koeficijent determinacije utvruje koliko je promjene zavisne varijable
objanjeno promjenom nezavisne varijable
Primjer. Ako je koeficijent korelacije 0.9, tada je koeficijent determinacije 0.8
- to znai da je 80% promjene zavisne varijable objanjeno promjenom
nezavisne varijable
- kada se govori o jaini veze ne smije se govoriti na nivou r , ve treba uzeti u
obzir i koeficijent determinacije!!!

Testiranje koeficijenta korelacije (T-test)


Upotreba metode uzoraka u teoriji korelacije
Koeficijent korelacije podlijee testiranju t-testom samo ako su promatrane
varijable normalno distribuirane
Testira se hipoteza o koeficijentu korelacije osnovnog skupa iz kojeg je uzet
uzorak sa n parova podataka

r n2

k n - 2

; t tab

1 r
0.05
H 0 koeficijent korelacije osnovnog skupa 0
2

H1 koeficijent korelacije osnovnog skupa 0

Regresijska analiza
Odreuje oblik krivulje koja najbolje opisuje zadane podatke
Oblik povezanosti varijabli:
Linearna povezanost: y=ax+b
Krivolinijska:
y=aebx
y=a+blnx
y=abx

Kod regresijske analize se zna to je uzrok a to posljedica


(zavisna, nezavisna varijabla)
Osnovni problem ove metode je odrediti koeficijente regresije
Regresijska analiza: jednostavna linearna regresija; nelinearna
regresija (linearizacija); viestruka regresija

Jednostavna linearna regresija


Bit metode je odrediti koeficijente regresijskog pravca 0 i 1
Oblik regresijskog pravca:

= 0 + 1x
Pravac koji najbolje aproksimira originalne vrijednosti mora biti tako poloen
da SUMA KVADRATA ODSTUPANJA (S) procijenjenih i originalnih
vrijednosti bude minimalna!

Izvod koeficijenata regresijskog pravca


S ( 0 , 1 )
S ( 0 , 1 )

( y
i 1
n

(
i 1

yi ) 2

min

1 xi yi ) 2

min

n
S
2 ( 0 1 xi yi ) 0
0
i 1
n
S
2 xi ( 0 1 xi yi ) 0
1
i 1
n

n 0 1 xi
i 1

i 1

i 1

y
i 1

0 xi 1 xi

i
n

xi yi
i 1

Konani izrazi za koeficijente regresijskog pravca oblika =0+1x


n

x y
i 1
n

nx y

2
x

n
x
i
i 1

0 y 1 x

Ispitivanje adekvatnosti modela (F-test)

s2P
F 2
s R
s2P

s2R

(
y

y
)

(
y

y
)
i
i

n2

F F0 model je neadekvatan (nije dobro odabran)

Metoda linearizacije:
- transformacija u linearni sustav
- tipine transformacije:

1. y a x b ln y ln a b ln x
Y* a* b X *

2. y a e bx ln y ln a bx
Y * a * bx

b
1
3. y b 0 1 y b 0 b1
x
x
y b 0 b1 X *

4. y b 0 b1 x y b 0 b1 X *

5. y 1 e -bx ln( y 1) bx
- ln( y 1) bx
ln( y 1) 1 bx
1
ln(
) bx
y 1
Y * bx