You are on page 1of 38

METODE REGRESIJSKE ANALIZE

Fran Galetić
1. UVOD U REGRESIJU
 Ako se dvije pojave javljaju zajedno, to
ne mora značiti da su one međusobno
povezane. Da bi se ustanovila
međusobna ovisnost jedne pojave o
drugoj ili više njih korist se regresijska
analiza. U regresijskoj analizi pojave se
predočuju varijablama.
 Varijable mogu biti nezavisne i zavisne.
Zavisne varijable su one varijable čije se
promjene objašnjavaju pomoću drugih
varijabli. To su varijable koje se
mijenjaju zbog promjene drugih
varijabli. Nezavisne su one varijable
kojima se objašnjava promjena zavisne
varijable.
 Povezanost pojava može biti funkcionalna
(deterministička) i statistička (stohastička).
Statistička povezanost je pod utjecajem
stohastičkih (=nepredvidivih) varijacija. Svaki
regresijski model sadrži stohastičku varijablu,
i po tome se razlikuje od determinističkog
modela. Regresijski model je jednadžba ili
skup jednadžbi s konačnim brojem varijabli.
 Podaci za regresijsku analizu nastaju
opažanjem ili mjerenjem u statističkim
pokusima. U gospodarskim primjenama
regresijskog modela podaci se javljaju
kao
 1. brojčane vrijednosti pojava za određene
gospodarske ili prostorne jedinice
 2. vremenske serije
 3. kombinacija (1) i (2).
 Podaci na temelju kojih se provode postupci ponekad
se transformiraju kako bi bilo jednostavnije računati.
Najčešće se transformacija provodi logaritmiranjem.
 Regresijski model koji se sastoji od jedne jednadžbe
ima jednu zavisnu i jednu ili više nezavisnih varijabli.
Kada su u modelu jedna zavisna i jedna nezavisna
varijabla, riječ je o modelu jednostavne regresije.
Višestruka (multipla) regresija sadrži jednu zavisnu i
dvije ili više nezavisnih varijabli.
 Model je linearan ako svaka varijabla u modelu ima
potenciju 1.
2. MODEL JEDNOSTAVNE
LINEARNE REGRESIJE
 Sadrži jednu zavisnu i jednu nezavisnu
varijablu. Primjenjuje se kada jedinično
povećanje vrijednosti nezavisne
varijable uzrokuje približno istu linearnu
promjenu vrijednosti zavisne varijable.
Regresijska jednadžba
yi  a  bxi  ui Yi    X i   i

 y – zavisna varijabla
 x – nezavisna varijabla
 a,b – nepoznati parametri koje treba procijeniti
 u – slučajna varijabla
Procjenjivanje parametara
bˆ 
  x  x  y  y    x y  n x y
i i i i

  x  x  x  nx
2 2 2
i i

aˆ  y  bˆ x
 Parametar «b» zove se regresijski koeficijent i
pokazuje za koliko se u prosjeku mijenja zavisna
varijabla ako se nezavisna varijabla promijeni za
jedan. Regresijski koeficijent je najvažniji
pokazatelj regresijske analize.
 Parametar «a» je konstanta i pokazuje vrijednost
zavisne varijable u slučaju kada je nezavisna
varijabla jednaka nuli.
Zadatak 1:

xi yi Procijenite vrijednosti parametara


100 26
regresijskog modela. Regresijsku
105 29
funkciju prikažite dijagramom
110 33
rasipanja. Izračunajte regresijske
120 36
vrijednosti i vrijednosti rezidualnih
145 41
odstupanja.
150 43
xi yi xi2 xi yi yi
100 26 10000 2600 28,05567
105 29 11025 3045 29,58182
110 33 12100 3630 31,10797
120 36 14400 4320 34,16027
145 41 21025 5945 41,79102
150 43 22500 6450 43,31717

730 208 91050 25990 208,0139


bˆ 
 x y  n x y  25990  6 *121,67 * 34,67  680,2  0,30523
i i

 x  nx 91050  6 *121,67
2 2
i
2 2228,47

aˆ  y  bˆ x  34,67  0,30523 *121,67  2,46733

yˆi  aˆ  bˆxi  ui  2,46733  0,30523 xi  ui


xi yi ŷi ui

100 26 28,05567 -2,05567


105 29 29,58182 -0,58182
110 33 31,10797 1,89203
120 36 34,16027 1,83973
145 41 41,79102 -0,79102
150 43 43,31717 -0,31717

730 208 208,0139 0

 y   yˆ
i i
Zadatak 2:
 Analiziraju se ukupni troškovi proizvodnje u
poduzeću ABC. Na temelju kvartalnih
podataka utvrđene su količine proizvodnje i
ukupni troškovi proizvodnje. Podaci su dani u
tablici.
 (a) Nacrtajte dijagram rasipanja. Što zaključujete
iz dijagrama?
 (b) Procijenite vrijednosti parametara regresijskog
modela i protumačite njihovo značenje.
 (c) Izračunajte regresijske vrijednosti.
 (d) Odredite vrijednosti rezidualnih odstupanja.
Proizvodnja Uk troškovi
352 146
373 153
411 177
441 190
462 205
490 208
529 227
577 238
641 268
692 274
743 300
xi yi x i2 xi y i
352 146 123904 51392
373 153 139129 57069
411 177 168921 72747
441 190 194481 83790
462 205 213444 94710
490 208 240100 101920
529 227 279841 120083
577 238 332929 137326
641 268 410881 171788
692 274 478864 189608
743 300 552049 222900
5711 2386 3134543 1303333
5711 2386
x  519,1818 y  216,9091
11 11
ˆ 1303333  11 * 519,1818 * 216,9091 64565,17
b   0,38092
3134543  11 * 519,1818 2
169495,84
aˆ  216,9091  0,38092 * 519,1818  19,14236
yˆ i  19,14236  0,38092 xi
xi yi x i2 xi y i ŷi ui ui,rel
352 146 123904 51392 153,2262 -7,2262 -4,95%
373 153 139129 57069 161,2255 -8,2255 -5,38%
411 177 168921 72747 175,7005 1,2995 0,73%
441 190 194481 83790 187,1281 2,8719 1,51%
462 205 213444 94710 195,1274 9,8726 4,82%
490 208 240100 101920 205,7932 2,2068 1,06%
529 227 279841 120083 220,6490 6,3510 2,80%
577 238 332929 137326 238,9332 -0,9332 -0,39%
641 268 410881 171788 263,3121 4,6879 1,75%
692 274 478864 189608 282,7390 -8,7390 -3,19%
743 300 552049 222900 302,1659 -2,1659 -0,72%
5711 2386 3134543 1303333 2386,0001 0,0000 -
ANOVA (tabela analize varijance)

 iy  y  2
   yˆ i  y     y i  yˆ i 
2 2

ST = SP + SR

 ST – suma kvadrata odstupanja vrijednosti varijable


od njezine aritmetičke sredine
 SP – suma kvadrata odstupanja regresijskih
vrijednosti varijable od njezine aritmetičke sredine
(odstupanja protumačena modelom)
 SR – suma kvadrata odstupanja empirijskih
vrijednosti varijable od regresijskih vrijednosti
(odstupanja neprotumačena modelom)
Izvor varijacije ss Zbroj kvadrata Sredina kvadrata F-omjer
protumačen modelom 1 SP SP SP/(SR/(n-2))
neprotumačen modelom n-2 SR SR/(n-2)
Ukupno n-1 ST
Standardna devijacija regresije
 y  yˆ i 
2

 yˆ  i

n
 pokazuje koliko je prosječno odstupanje
empirijskih vrijednosti zavisne varijable
od njezinih regresijskih vrijednosti
 izražena je u istim mjernim jedinicama
kao i zavisna varijabla
Koeficijent varijacije
 yˆ
V yˆ  100
y

 relativna mjera disperzije


 pokazuje omjer standardne devijacije
regresije i aritmetičke sredine zavisne
varijable
Koeficijent determinacije
  ˆ
y i  y  2

r 
2
0  r2  1

 yi  y  2

 omjer protumačenog i ukupnog zbroja kvadrata


 bolje je da je što veći, dakle što bliži jedinici, jer je
tada mala vrijednosti rezidualnog zbroja kvadrata
 alternativno se može izračunati prema formuli:

  y  yˆ 
i i
2

r 2
 1
  y  y
i
2
Korigirani koeficijent
determinacije
n 1
r 1
2

n2
1  r2 

 može biti manji ili jednak od koeficijenta


determinacije
 ovisi i o broju vrijednosti za koje se
računa
 nepovoljno obilježje je to što može biti
manji od nule
Zadatak 3:
Izračunajte elemente koji nedostaju u tabeli.
Izvor varijacije ss Zbroj kvadrata Sredina kvadrata F-omjer
protumačen modelom 1 7665,853 ? ?
neprotumačen modelom 6 284,216 ?
Ukupno ? ?

Zatim odredite standardnu devijaciju


regresije, koeficijent varijacije i koeficijent
determinacije. Prilikom računanja koristite
podatak da je prosječna vrijednost zavisne
varijable 33,4125.
Izvor varijacije ss Zbroj kvadrata Sredina kvadrata F-omjer
protumačen modelom 1 7665,853 7665,853 161,833
neprotumačen modelom 6 284,216 47,369
Ukupno 7 7950,069
 y  yˆ i 
2
284,216
 yˆ  i
  5,96
n 8
 Prosječno odstupanje stvarnih vrijednosti zavisne
varijable od regresijskih vrijednosti je 5,96.

 yˆ 5,96
V yˆ  100  100  17,838%
y 33,4125
 Stvarne vrijednosti zavisne varijable odstupaju od
procijenjenih vrijednosti u prosjeku 17,838%.
r 
2   yi  y 
ˆ 2


7665,853
 0,9642

 iy  y  2
7950,069

 Regresijskim modelom protumačeno je


96,42% odstupanja. Neprotumačeno je
ostalo 3,58% odstupanja.
Zadatak 4 (DZ):
 Istraživanjem su utvrđene količine
potražnje pri određenim cijenama.
Cijena Potražnja  (a) Nacrtajte dijagram rasipanja.
10 704  (b) Kako glasi regresijska jednadžba
12 662 potražnje?
15 597
20 511
 (c) Interpretirajte vrijednost
25 408 regresijskog koeficijenta.
30 302  (d) Odredite regresijske vrijednosti.
 (e) Kolika je standardna devijacija
regresije?
Zadatak 5 (DZ):
 Na temelju podataka o
cijeni i količini odredite: Cijena Ponuda
 (a) dijagram rasipanja 120 4500
 (b) regresijsku jednadžbu 150 5800
ponude 170 6700
 (c) rezidualna odstupanja 200 8300
250 11000
300 14200
Zadatak 6 (DZ):
Izračunajte elemente koji nedostaju u
tabeli.
Izvor varijacije ss Zbroj kvadrata Sredina kvadrata F-omjer
protumačen modelom 1 15693 ? ?
neprotumačen modelom 16 1243 ?
Ukupno ? ?

Odredite standardnu devijaciju


regresije, i koeficijent determinacije. Je
li ovaj model dobar?
3. MODEL VIŠESTRUKE
REGRESIJE
 Sastoji se od jedne zavisne i dvije ili
više nezavisnih varijbli, te slučajne
varijable.

yi  a  b1 xi1  b2 xi 2  ...  bn xin  ei


Zadatak 7:
 Služba za marketing neke kompanije
ispituje prodaju proizvoda A po
segmentima tržišta. Pretpostavlja se da
su glavni faktori koji utječu na prodaju
izdaci za reklamu (u tisućama €) i
prodajna cijena (u tisućama €). Podaci
o prodaji, izdaci za reklamu i prodajne
cijene dani su u tablici:
Prodaja Izdaci za reklamu
Područje (000 kom) (000 €) Prosječna cijena (€)
  yi xi1 xi2
1 331 220 129
2 299 285 138
3 301 256 121
4 398 395 139
5 402 317 127
6 487 500 111
7 601 432 103
8 614 599 122
9 703 701 101
10 711 794 110
11 799 802 100
12 927 980 99
13 990 1021 97
14 1015 1128 95
 Kako glasi model višestruke regresije za ovaj
primjer? Interpretirajte značenje regresijskih
koeficijenata.
 Pri računanju koristite sljedeće međurezultate:
n  14 y i  8578 x
i1  8430 x i2  1592

x x  908482
i1 i 2 x i1 y i  6152958 x i2 yi  930967

 yi  6092722
2
 xi1  6287366
2
 xi 2  184126
2
 Parametri se procjenjuju metodom
najmanjih kvadrata, rješavanjem
sustava jednadžbi:
ˆn  ˆ1  xi1 ˆ2  xi 2   yi
ˆ  xi1 1  xi1 ˆ2  xi1 xi 2   xi1 yi
ˆ 2

ˆ  xi 2 1  xi 2 xi1  2  xi 2   xi 2 yi
ˆ ˆ 2
14ˆ  8430ˆ1  1592 ˆ2  8578
8430ˆ  6287366ˆ1  908482 ˆ2  6152958
1592ˆ  908482 ˆ  184126ˆ  930967
1 2

ˆ  611,1702969
ˆ  0,669347084
1

ˆ2  3,530766379
yˆ  611,1702969  0,669347084x1  3,530766379x2

 Ako se izdaci za reklamu povećaju za tisuću


€, vrijednost prodaje prosječno se povećava
za 0,66935 tisuća komada, uz nepromijenjene
cijene.
 Drugi regresijski koeficijent pokazuje da se
prodaja u prosjeku smanjuje za 3,53077
tisuća komada ako se cijene povećaju za 1€,
uz nepromijenjene izdatke za reklamu.

You might also like