Professional Documents
Culture Documents
REGRESIJSKA I KORELACIJSKA ANALIZA Neke pojave u poslovanju, gospodarstvu i drugim podrujima djelatnosti meusobno su povezane i uvjetovane, uvjetovane npr. poveanje opsega proizvodnje poveava ukupne trokove; osobna potronja stanovnitva ovisi o raspoloivom dohotku i dr. Cilj istraivanja odnosa meu pojavama je utvrditi statistiku ovisnost i pokazatelje jakosti takve ovisnosti. U tu svrhu koriste se metode regresijske i korelacijske analize (regresija =statistiki odnos meu pojavama; korelacija = uzajamna ovisnost).
REGRESIJSKA ANALIZA
Za statistiku analizu potrebno je izabrati: empirijske vrijednosti za varijable X i Y oblik modela, modela tj. funkciju f(X) Pomono sredstvo za izbor funkcije je dijagram rasipanja (grafiki prikaz empirijskih vrijednosti).
xi
xi
yi
yi
xi
xi
yi
yi
xi
xi
xi
Za razliku od korelacijske analize zadaa regresijske analize je da pronae analitiko-matematiki oblik veze izmeu jedne ovisne ili regresand varijable i jedne ili vie neovisnih ili regresorskih varijabli.
yi
xi
Yi = a + bX i + ei
odnosno svaka toka Yi odstupa od linije pravca za pozitivnu ili negativnu razliku ei.
y ei yi
= a +bX Y
xi
ei pogreka relacije, relacije varijabla koja izraava nepoznate i apstrahirane utjecaje na varijaciju varijable Y
1. Regresijska funkcija
Ocijenjeni model glasi:
= a + bX Y
gdje je: a konstantni lan, tj. oekivana vrijednost zavisne varijable kada je nezavisna varijabla jednaka nuli: a = Y (kada je X=0). Ovaj parametar interpretira se i kao odsjeak na osi koordinata u kojoj regresijski pravac sijee os, uz pretpostavku da je apscisa te toke X=0.
Regresijski koeficijent b pokazuje prosjenu promjenu zavisne varijable kada se nezavisna varijabla promjeni za jedinicu mjere. mjere Ovaj parametar interpretira se i kao koeficijent smjera, odnosno nagiba regresijskog pravca koji moe imati pozitivni i negativni predznak, ovisno o smjeru veze izmeu promatranih varijabli.
2. Regresijska funkcija
Moe se postaviti i suprotna ovisnost u modelu, na nain da je varijabla X sada ovisna ili regresorska varijabla:
Xi = a + bYi + ei
Ocjena parametara u ovom sluaju vri se na jednak nain kao kod poetnog modela , samo to je sada X ovisna varijabla, pa u izrazima za izraunavanje parametara (metoda najmanjih kvadrata), X i Y mijenjaju mjesta.
b=
x y
i i =1 n i =1
nx y
a = y bx
2 2 x n x i
= a + bx y
= a + bx + u y
u i = yi y ui = yi (a + bx)
ui pogreka relacije
b=
x y
i =1 n i
nx y nx 2
a = y bx
x
i =1
2 i
ui'
pogreka relacije
b' =
x y
i =1 n i
nx y ny 2
a'= x b' y
y
i =1
2 i
Standardna devijacija regresije je apsolutni pokazatelj reprezentativnosti regresijskog modela, a pokazuje prosjeni stupanj varijacije stvarnih vrijednosti ovisne varijable u odnosu na oekivane regresijske vrijednosti:
2 ( ) y y i i i =1 n
y =
Vy =
y
y
100
i y ) SP = ( y
i =1
Ukupna odstupanja:
ST = ( yi y )
i =1
Neprotumaena odstupanja:
) SR = ( yi y
i =1
SP R = ST
2
0 R2 1
r = R2
Vrijednost koeficijenta korelacije kree se u intervalu:
-1 r 1
6 8 10 12 12 14 14 15 16 18 125
Izvor: Podaci trgovine Z, 2010. god.
3.500 3.600 3.600 4.100 4.200 4.900 4.700 4.900 5.800 6.500 45.800
Zadatak je: a) nacrtati dijagram rasipanja b) ocijeniti parametre jednadbi pravaca linearne regresije c) izraunati koeficijent determinacije d) izraunati Pearsonov koeficijent linearne korelacije e) izraunati koeficijent varijacije regresije
Dijagram rasipanja
Grafikon 1. Godine obrazovanja i prosjene plae zaposlenika u trgovini Z u 2009. god.
7.000 6.000
Mjesena plaa
Godine obrazovanja
Izvor: Podaci trgovine Z, 2010.god.
Primjer 1.
n
n
y=
yi
i =1
45800 = = 4580 10
x=
x
i =1
125 = 12,5 10
(xi)
(yi)
xiyi
x i2
6 3.500 21.000 8 3.600 28.800 10 3.600 36.000 12 4.100 49.200 12 4.200 50.400 14 4.900 68.600 14 4.700 65.800 15 4.900 73.500 16 5.800 92.800 18 6.500 117.000 125 45.800 603.100
b=
X Y nXY
i i 2 i i =1 n
X
i =1
nX 2
= a + bX = 1457,5 + 249,8 X Y
Regresijski koeficijent (b) pokazuje da se mjesena neto plaa poveava u prosjeku za 249,8 kn kada se duina obrazovanje produi za 1 godinu.
Primjer 1.
x = 12,5
(xi) (yi) xiyi
y i2
y = 4580
6 3.500 12.250.000 21.000 8 3.600 12.960.000 28.800 10 3.600 12.960.000 36.000 12 4.100 16.810.000 49.200 12 4.200 17.640.000 50.400 14 4.900 24.010.000 68.600 14 4.700 22.090.000 65.800 15 4.900 24.010.000 73.500 16 5.800 33.640.000 92.800 18 6.500 42.250.000 117.000 125 45.800 603.100 218.620.000
X Y nXY
i =1 n i i 2
Y
i =1
nY 2
Primjer 1.
Koeficijent determinacije
= 1457,2 + 249,8 X Y
(xi) 6 8 10 12 12 14 14 15 16 18 125 (yi) 3.500 3.600 3.600 4.100 4.200 4.900 4.700 4.900 5.800 6.500 45.800
i y
i y )2 (y
( yi y )2
1166400 960400 960400 230400 144400 102400 14400 102400 1488400 3686400 8856000
R2 =
R2 =
2.956 3.456 3.956 4.455 4.455 4.955 4.955 5.204 5.454 5.954 45.800
2636316 1263560 389988 15600 15600 140395 140395 389987 764375 1887539 7643754
SP ST
7643754 = 0,863 8856000
1 y ) SP = ( y
i =1
SP = 7643754
ST = ( yi y)
i =1 n 2
ST = 8856000
r = R2
r = 0,863 = 0,93
Primjer 1.
Koeficijent varijacije regresije
(xi) (yi)
i )2 ( yi y
Varijanca regresije:
2 y =
6 3.500 295.581 8 3.600 20.760 10 3.600 126.387 12 4.100 126.097 12 4.200 65.077 14 4.900 2.991 14 4.700 64.869 15 4.900 92.714 16 5.800 119.519 18 6.500 298.250 125 45.800 1.212.245
(y
i =1
i ) y
n
n
2 y =
1212245 = 121224,5 10
i )2 SR = ( yi y
i =1
SR = 1212245
y = 121224,5 = 348,17
Vy =
y
y
100
Vy =
rs = 1
6 d i2 n n
i =1 3
Tablica 2. Bodovi postignuti na testu i broj prodanih automobila 10 prodavaa (N=10) autosalona Z, 2009. godine
Prodava A B C D E F G H I J Bodovi na testu (xi) 51 65 49 66 50 64 68 72 77 75 Broj prodanih automobila (yi) 35 46 33 45 29 42 47 50 52 53
Primjer 2.
Prvo se rangiraju vrijednosti varijabli:
Prodava A B C D E F G H I J Bodovi na testu (xi) 51 65 49 66 50 64 68 72 77 75 Broj prodanih automobila (yi) 35 46 33 45 29 42 47 50 52 53 Rangirane varijable r(xi) 8 6 10 5 9 7 4 3 1 2 r(yi) 8 5 9 6 10 7 4 3 2 1
Primjer 2.
Nakon rangiranja varijabli, izraunavaju se razlike rangova vrijednosti varijabli X i Y (d): Prodava Rangirane varijable r(xi) A B C D E F G H I J 8 6 10 5 9 7 4 3 1 2 r(yi) 8 5 9 6 10 7 4 3 2 1 di = r(xi)-r(yi) 0 1 1 -1 -1 0 0 0 -1 1 di2 0 1 1 1 1 0 0 0 1 1
N
d
i =1
2 i
=6
Primjer 2.
Spearmanov koeficijent korelacije ranga iznosi:
66 = 0,96 rs = 1 =1 3 N N 10 10
i =1 3
6 d i2
d
i =1
2 i
=6
gdje N = broj parova vrijednosti varijabli X i Y Oita je jaka veza izmeu postignutih bodova na testu i broja prodanih automobila.