Professional Documents
Culture Documents
Fran Galetić
1. UVOD U REGRESIJU
Ako se dvije pojave javljaju zajedno, to
ne mora značiti da su one međusobno
povezane. Da bi se ustanovila
međusobna ovisnost jedne pojave o
drugoj ili više njih korist se regresijska
analiza. U regresijskoj analizi pojave se
predočuju varijablama.
Varijable mogu biti nezavisne i zavisne.
Zavisne varijable su one varijable čije se
promjene objašnjavaju pomoću drugih
varijabli. To su varijable koje se
mijenjaju zbog promjene drugih
varijabli. Nezavisne su one varijable
kojima se objašnjava promjena zavisne
varijable.
Povezanost pojava može biti funkcionalna
(deterministička) i statistička (stohastička).
Statistička povezanost je pod utjecajem
stohastičkih (=nepredvidivih) varijacija. Svaki
regresijski model sadrži stohastičku varijablu,
i po tome se razlikuje od determinističkog
modela. Regresijski model je jednadžba ili
skup jednadžbi s konačnim brojem varijabli.
Podaci za regresijsku analizu nastaju
opažanjem ili mjerenjem u statističkim
pokusima. U gospodarskim primjenama
regresijskog modela podaci se javljaju
kao
1. brojčane vrijednosti pojava za određene
gospodarske ili prostorne jedinice
2. vremenske serije
3. kombinacija (1) i (2).
Podaci na temelju kojih se provode postupci ponekad
se transformiraju kako bi bilo jednostavnije računati.
Najčešće se transformacija provodi logaritmiranjem.
Regresijski model koji se sastoji od jedne jednadžbe
ima jednu zavisnu i jednu ili više nezavisnih varijabli.
Kada su u modelu jedna zavisna i jedna nezavisna
varijabla, riječ je o modelu jednostavne regresije.
Višestruka (multipla) regresija sadrži jednu zavisnu i
dvije ili više nezavisnih varijabli.
Model je linearan ako svaka varijabla u modelu ima
potenciju 1.
2. MODEL JEDNOSTAVNE
LINEARNE REGRESIJE
Sadrži jednu zavisnu i jednu nezavisnu
varijablu. Primjenjuje se kada jedinično
povećanje vrijednosti nezavisne
varijable uzrokuje približno istu linearnu
promjenu vrijednosti zavisne varijable.
Regresijska jednadžba
yi a bxi ui Yi X i i
y – zavisna varijabla
x – nezavisna varijabla
a,b – nepoznati parametri koje treba procijeniti
u – slučajna varijabla
Procjenjivanje parametara
bˆ
x x y y x y n x y
i i i i
x x x nx
2 2 2
i i
aˆ y bˆ x
Parametar «b» zove se regresijski koeficijent i
pokazuje za koliko se u prosjeku mijenja zavisna
varijabla ako se nezavisna varijabla promijeni za
jedan. Regresijski koeficijent je najvažniji
pokazatelj regresijske analize.
Parametar «a» je konstanta i pokazuje vrijednost
zavisne varijable u slučaju kada je nezavisna
varijabla jednaka nuli.
Zadatak 1:
x nx 91050 6 *121,67
2 2
i
2 2228,47
y yˆ
i i
Zadatak 2:
Analiziraju se ukupni troškovi proizvodnje u
poduzeću ABC. Na temelju kvartalnih
podataka utvrđene su količine proizvodnje i
ukupni troškovi proizvodnje. Podaci su dani u
tablici.
(a) Nacrtajte dijagram rasipanja. Što zaključujete
iz dijagrama?
(b) Procijenite vrijednosti parametara regresijskog
modela i protumačite njihovo značenje.
(c) Izračunajte regresijske vrijednosti.
(d) Odredite vrijednosti rezidualnih odstupanja.
Proizvodnja Uk troškovi
352 146
373 153
411 177
441 190
462 205
490 208
529 227
577 238
641 268
692 274
743 300
xi yi x i2 xi y i
352 146 123904 51392
373 153 139129 57069
411 177 168921 72747
441 190 194481 83790
462 205 213444 94710
490 208 240100 101920
529 227 279841 120083
577 238 332929 137326
641 268 410881 171788
692 274 478864 189608
743 300 552049 222900
5711 2386 3134543 1303333
5711 2386
x 519,1818 y 216,9091
11 11
ˆ 1303333 11 * 519,1818 * 216,9091 64565,17
b 0,38092
3134543 11 * 519,1818 2
169495,84
aˆ 216,9091 0,38092 * 519,1818 19,14236
yˆ i 19,14236 0,38092 xi
xi yi x i2 xi y i ŷi ui ui,rel
352 146 123904 51392 153,2262 -7,2262 -4,95%
373 153 139129 57069 161,2255 -8,2255 -5,38%
411 177 168921 72747 175,7005 1,2995 0,73%
441 190 194481 83790 187,1281 2,8719 1,51%
462 205 213444 94710 195,1274 9,8726 4,82%
490 208 240100 101920 205,7932 2,2068 1,06%
529 227 279841 120083 220,6490 6,3510 2,80%
577 238 332929 137326 238,9332 -0,9332 -0,39%
641 268 410881 171788 263,3121 4,6879 1,75%
692 274 478864 189608 282,7390 -8,7390 -3,19%
743 300 552049 222900 302,1659 -2,1659 -0,72%
5711 2386 3134543 1303333 2386,0001 0,0000 -
ANOVA (tabela analize varijance)
iy y 2
yˆ i y y i yˆ i
2 2
ST = SP + SR
yˆ i
n
pokazuje koliko je prosječno odstupanje
empirijskih vrijednosti zavisne varijable
od njezinih regresijskih vrijednosti
izražena je u istim mjernim jedinicama
kao i zavisna varijabla
Koeficijent varijacije
yˆ
V yˆ 100
y
r
2
0 r2 1
yi y 2
y yˆ
i i
2
r 2
1
y y
i
2
Korigirani koeficijent
determinacije
n 1
r 1
2
n2
1 r2
yˆ 5,96
V yˆ 100 100 17,838%
y 33,4125
Stvarne vrijednosti zavisne varijable odstupaju od
procijenjenih vrijednosti u prosjeku 17,838%.
r
2 yi y
ˆ 2
7665,853
0,9642
iy y 2
7950,069
x x 908482
i1 i 2 x i1 y i 6152958 x i2 yi 930967
yi 6092722
2
xi1 6287366
2
xi 2 184126
2
Parametri se procjenjuju metodom
najmanjih kvadrata, rješavanjem
sustava jednadžbi:
ˆn ˆ1 xi1 ˆ2 xi 2 yi
ˆ xi1 1 xi1 ˆ2 xi1 xi 2 xi1 yi
ˆ 2
ˆ xi 2 1 xi 2 xi1 2 xi 2 xi 2 yi
ˆ ˆ 2
14ˆ 8430ˆ1 1592 ˆ2 8578
8430ˆ 6287366ˆ1 908482 ˆ2 6152958
1592ˆ 908482 ˆ 184126ˆ 930967
1 2
ˆ 611,1702969
ˆ 0,669347084
1
ˆ2 3,530766379
yˆ 611,1702969 0,669347084x1 3,530766379x2