You are on page 1of 9

REGRESIJSKA FUNKCIJA POPULACIJE I

REGRESIJSKA FUNKCIJA UZORKA


Potronja zaposlenika
- ovisi o raspoloivim sredstvima za troenje, tj dohotku.
- zaposlenici s istom razinom dohotka imat e razliitu potronju
sluajna varijabla koja ima distribuciju vjerojatnosti.

f(y x=3)

f(y)

f(y x=4)

y
=2.45
E(y x=3)

=3.1
E(y x=4)

Kada bismo skupili sve podatke populacije (npr.za zaposlenike jedne drave) graf oekivanih
vrijednosti potronje za sve razine dohotka bio bi:

E(y x=4)
==3.1

E(y x=3)
==2.45

RFP

3
2.5

.....
.

Sve oekivane vrijednosti potronje lee na pravcu koji zovemo RFP.

Populacija
- ne raspolaemo podacima
cijele populacije;
- RFP i sluajna odstupanja
ui ostaju uvijek nepoznata;
0 , 1 (stvarni parametri)
ostaju nepoznati.

Uzorak
- koristimo uzorak iz populacije;
- pomou uzorka ocjenjujemo
RFU (RFU je ocjena RFP);
0 , 1 su ocjene stvarnih
parametara 0 , 1
RFU: Yi 0 1 X i
Svako opaanje Yi se razlikuje od
Yi za rezidual ei :
Yi = Yi + ei

RFP : E (Y Xi) = 0 + 1 Xi
Svako opaanje Yi se razlikuje od
E (Y Xi) za odstupanje ui :
Yi = E (Y Xi) + u i
Y

E(Y X i )

Y
i
3
2.5

.....
.

Primjer vezan uz pretpostavke primjene OLS vezane za odstupanja


Sluajna odstupanja su normalno distribuirana s oekivanom vrijednou 0 i varijancom 2 tj.
ui N(0, 2).
Raspodjela reziduala na uzorku od 110 opaanja:
e
((-1,5) - (1))
((-1) - (0,5))
(-0,5-0)
(0-0,5)
(0,5-1)
(1-1,5)

e
(-1,5) -(1)
(-1)-(-0,5)
(-0,5-0)
(0-0,5)
(0,5-1)
(1-1,5)

fr

fr=fi/ fi
=P

fr
1

0,01

15
39
39
14
2
110

0,14
0,35
0,35
0,13
0,02

P(vjerojatno
st)

0,01
0,14
0,35
0,35
0,13
0,02
0

Svojstva regresijskih paramatara


Ako su zadovoljene pretpostavke OLS, ocijenjeni parametri imaju optimalna svojstva:
nepristrani

su

E(

)= ,
imaju

minimalnu varijancu ,

konzistentn

i su ako se poveava veliina uzorka statistikih


podataka, ocjene parametra konvergiraju
stvarnim vrijednostima parametra.
2
normalno su distribuirani N( , )

Tada ocjenjeni parametar predstavlja veliinu za koliko se mijenja zavisna varijabla ako se nezavisna uz
taj parametar mijenja za jedinicu, a ostale nezavisne varijable drimo konstantnim.
Primjer:
Normalna distribuiranost sluajne greke implicira takoer normalnu distribuiranost ocjena parametara.
Zamislimo da ocjenjujemo model
yi =0 + 1xi + ui te da znamo stvarne vrijednosti parametara: 0=0,
1=1. Kad bi iz populacije uzeli npr. 5000 uzoraka po 15 opaanja i svaki put ocijenili 1 te ocjene
grupirali u razrede dobili bismo distribuciju vjerojatnosti ocjena parametra:
Raspodjela ocjena od dobivenih na osnovi 5000 uzoraka:
^
(-0.5 - 0)
(0 - 0.5)
(0.5-1)
(1-1.5)
(1.5-2)
(2-2.5)

^
(-0,5 - 0)
(0 - 0,5)
(0,5-1)
(1-1,5)
(1,5-2)
(2-2,5)

frekv.
rel.fr.
(fi)
(fr)
300
0.06
950
0.19
1250
0.25
1250
0.25
950
0.19
300
0.06
5000
(fr)
0,06
0,19
0,25
0,25
0,19
0,06

PP

=1

Svojstvo sredine : eljeno svojstvo distribucije ocjenjivaa je da je prosjena vrijednost ocjena


regresijskog parametra (dobivena metodom najmanjih kvadrata na velikom broju
ponovljenih uzoraka) jednaka stvarnoj vrijednosti parametra , tj.
E( k)= k
U tom sluaju govorimo o nepristranom ocjenjivau.
Slika 3.5. Distribucija OLS ocjena parametra dobivenih iz velikog broja
uzoraka.
a) nepristrana

b) pristrana

E( )=
E( )
RAUNALNI ISPIS REZULTATA OCJENE MODELA
(primjer knjiga str.22.)
REGRESS : dependent variable is Y

Using
1
5
-----------------------------------------------------------------Variable
| Coefficient |
Std Err
|
T-stat
| Signf
---------------|--------------|-------------|--------------|-----^CONST
|
.193548
| .442039
|
.437854
| .691
X
|
.763441
| .100102
|
7.62662
| .005
------------------------ Equation Summary ---------------------No. of Observations =
5
R2=
.9510
(adj)=
.9346
Sum of Sq. Resid. =
.279570
Std. Error of Reg.= .305270
Log(likelihood)
=
.115160
Durbin-Watson
= 3.10639
Schwarz Criterion = -1.49428
F ( 1,
3)
=
58.1654
Akaike Criterion = -1.88484
Significance
=
.004680
-------------------------------------------------------------------Analysis of Variance
-------------------SOURCE
Sum of Squares
DF
Mean Sq Error
F Ratio/SIG(F)
-------------------------- ---------------- -------------Regression
5.420430
1
5.420430
58.16538
Residual
.2795699
3
.9318996E-01
.00468
----------------------------------------TOTAL
5.700000
4
1.42500
-----------------------------------------------------------------Variance-Covariance Matrix of Coefficients

^CONST
X

^CONST
X
...............................
.
.195398
-.420858E-01
.
-.420858E-01
.100204E-0

Interpretacija pokazatelja:
t

Studentov t pokazatelj za testiranje znaajnosti parametra.


koliko se stvarna vrijednost parametra razlikuje od ocjene.
signf. p najnia razina signifikantnosti uz koju se H0 moe prihvatiti.
R2, R 2 % varijacija zavisne varijable objanjenih modelom.
s za koliko u prosjeku ocijenjene vrijednosti zavisne varijable odstupaju od
stvarnih vrijednosti ( u jedinicama mjere zavisne varijable).
V za koliko u prosjeku ocijenjene vrijednosti zavisne varijable odstupaju od
stvarnih vrijednosti ( u % iznosu prosjene vrijednosti zavisne varijable)
F pokazatelj za testiranje znaajnosti regresijske funkcije.
s

Utvrivanje pouzdanosti modela - zakljuak :


(Kriteriji knjiga str.7)
ekonomski
- u model moraju ui nez.varijable prema ek.teoriji;
- predznak i veliina parametra prema ek.teoriji;
statistiki
- R2, R 2 , F,t test, V, s , s , ...
- u granicama prihvatljivosti, nebitne varijable izbaciti i ponovno
ocijeniti model
ekonometrijski
- pretpostavke primjene OLS:
korektna specifikacija,
nema autokorelacije,
nema heteroskedastinosti,
nema multikolinearnosti.

Naruene pretpostavke primjene OLS


Heteroskedastinost
Varijanca (rasprenost) sluajne varijable ui nije konstantna. Prava i neprava
heteroskedastinost.
Primjer:

bogatiji ljudi
vei reziduali

siromani ljudi
manji reziduali
Y potronja
X - dohodak

Posljedice: s , t-test , F-test netoni


Otkrivanje: - grafiki (ponaanje reziduala)
- posebni testovi, Park test (primjena)
Rjeavanje: transformacije modela, Vagana metoda najmanjih kvadrata
Problem ne postoji kad je varijanca sluajne varijable konstantna (homoskedastinost).

Autokorelacija
(Serijska korelacija odstupanja)
Korelacija izmeu reziduala u razliitim vremenskim periodima.
(Reziduali pokazuju neku pravilnost u ponaanju). Prava i neprava; autoregresijski model.
ut

ut

ut-1
ut

ut

ut-1

Posljedice: t-precijenjen, s , R2 , F nepouzdani


Otkrivanje: - grafiki (ponaanje reziduala)
- Durbin-Watsonov test (DW), primjena
Rjeavanje:
- ako je uzrok pogreka: isputena varijabla ili kriva funkcijska veza
ispraviti pogreku;
- ako je uzrok u podacima (ek.okovi) ocjenjivanje parametara
pomou GLS (generalizirana metoda najmanjih kvadrata)
Problem ne postoji kad reziduali imaju sluajni raspored.

Multikolinearnost
Nezavisne varijable su meusobno visoko korelirane. Ako je nez.varijabla viekratnik druge
nez.varijable parametri se ne mogu ocijeniti (savrena multikolinearnost).
Posljedice: t- nizak, R2 vrlo visok
krivi predznaci parametara
Otkrivanje: vrlo visok R2, niske t-vrijednosti, visok koeficijent korelacije
( r ) meu nezavisnim varijablama (vei od 0.7); VIF.
Rjeavanje: (vie mogunosti):poveati uzorak podataka, transformirati podatke, izbaciti
nezavisnu varijablu koja je u korelaciji.
Slika : Primjer multikolinearnosti za model Yi = 0 + 1X1i + 3X3i + ui

Problemi specifikacije modela


Specifikacijske pogreke ine :

- pogreke odabira varijabli


- pogreke odabira funkcijske veze
Otkrivanje nevane varijable
Ukoliko nismo sigurni da je neka varijabla trebala biti u modelu, moemo to utvrditi ispitujui
signifikantnost parametra uz tu varijablu, odnosno primijeniti t-test.
Postoje specifikacijski kriteriji za utvrivanje treba li varijablu ukljuiti u model. Prema
Studenmund (1992) to su:
1. Teorija da li teorijski varijabla treba biti u modelu?
2. t test da li je ocjenjeni parametar signifikantno razliit on nule?
3. R 2 - da li se poveava kad se varijabla ukljui u model?
4. Pristranost da li se koeficijenti ostalih varijabli znaajno mijenjaju kad se
varijabla doda u jednadbu?
Ako su odgovori pozitivni, varijabla pripada modelu, ako su odgovori negativni, varijabla se
moe iskljuiti iz modela. Meutim, u praksi najee nemamo tako eksplicitno jasne situacije.
Zbog isputene vane varijable iz modela ocjene parametara su pristrane pa se moe kao
posljedica dogoditi neoekivani predznak parametara, a isto tako i autokorelacija.
Ako je u model ukljuena nevana varijabla, ocjene parametara su neefikasne (poveane su
standardne pogreke parametara).
Zbog toga su t-vrijednosti i R 2 manji nego to bi trebali biti (ali ne i R2).
Otkrivanje netone funkcijske veze DW test.
Primjer 1.
n= 16 god. , godinji podaci
Y - prodana kol. proizvoda (u tis.komada)
X1 -prosj.cijena proizvoda (u$)
X2 -prosj.dohodak potencijalnih kupaca (u$)
Model A Yt 51.24 30.92 X 1t
R 2 0.3907
t:

Model B

(3.00)

Yt 123.47 24.84 X 1t 0.03 X 2 t


t:

(-5.02)

R 2 0.9597

(13.55)

a) Interpretirajte ocij.parametre uz nez.varijable i obrazloite jesu li predznaci u skladu s


ek.teorijom.
b) Zakljuak o prihvatljivosti modela prema ekonomskim i stat.kriterijima!
c) Koji je model prihvatljiviji i zato?

Primjer 2.
Ocijenjena je funkcija uspjenosti pogodaka u golfu za vrijeme prvenstva:
n= 19 ukupan broj gaanja
P - % pogodaka
L -udaljenost od ciljne udubine (u stopama)

Model A

83.6 4.1L
P
i
i
t:

Model B

R 2 0.861 DW= 0.48

(-10.6)

5.50 0.92 ln L
ln P
i
i
t:

R 2 0.903

DW= 1.50

(-13.0)

a) Obrazloite (bez testiranja) ima li parametar uz nezavisnu varijablu oekivan


predznak!
b) Testirajte modele na prisutnost autokorelacije.
c)Usporedivost veliina koef.determinacije? koji je model prihvatljiviji?
e) Koji je razlog nastanka autokorelacije (vidi sliku)?
Primjer 3.
n= 20 god., godinji podaci.
Y razina aktivnosti u sivoj ekonomiji
X -visina poreza
Z -Razina vladinih mjera za spreavanje sive ekonomije.
Model A

Yt 315.7 1.54 X t
t:

Model B

R2=0.94

Ho !

tc = 2.101

HA !

(-16.0)

Yt 218.0 2.85 X t 1.21Z t


t:

tc =2.101

(1.59)

Yt 128.6 0.96 Z t
t:

Model C

R 2 0.12

(11.4)

R 2 0.99

tc = 2.110 HA ! ZA OBA PAR.

(-40.3)

a) Obrazloite jesu li predznaci u skladu s ek.teorijom.


b) Izraunajte korigirani koef.determinacije. Zakljuak o prihvatljivosti modela prema ekonomskim i
stat.kriterijima!
c) Koji je model najprihvatljiviji i zato?