You are on page 1of 96

1

Ekonomski fakultet u Sarajevu


II ciklus studija: master studij

Prof. dr Rabija Somun-Kapetanovi

Akademska godina 2012/2013

METODOLOGIJA NAUNO
ISTRAIVAKOG RADA
II DIO
Teme:
Osnovne kvantitativne metode analize podataka:

osnovne statistike metode

korelaciona i regresiona analiza

analiza varijanse

kvantitativne metode predvianja.

studije sluajeva.

2
Statistike metode temeljene na
zavisnosti (dependence methods)
Ova grupa metoda istrauije prisutnost ili odsutnost
relacije izmeu dva skupa, odnosno izmeu zavisne i
nezavisne varijable. Ova grupa metoda se dijeli
prema broju nezavisnih varijabli, broju zavisnih
varijabli, i vrsti mjerne skale nezavisne i zavisne
varijable.
Regresija
Analiza varijanse (ANOVA)
Diskriminantna analiza
Kanonska korelacijska analiza

3
Statistike metode temeljene na
meuzavisnosti (interdependence methods)
Ove metode se primjenjuju kada nisu eksplicitno
definisani skupovi zavisnih i nezavisnih varijabli.
Zadatak je istraiti zato su varijable meusobno
korelirane. U ovu grupu spadaju:

Metoda glavnih komponenti
Faktorska analiza
Grupisanje podataka klaster analizom

4
Jednostavni linearni model
Analiza osnovnih elemenata ekonometrijske regresije pomou
jednostavne linearne veze.
Veza izmeu konceptualnog ekonomskog modela i njegovog
ekonometrijskog izraza.
Tehnike za ocjenu ekonometrijskog modela:
estimator (procjenitelj) metode najmanjih kvadrata.
Provjera statistike pouzdanosti ocijenjenih modela
Korisni indikatori za evaluaciju kvaliteta ocjena.


5
Od ekonomskog do
ekonometrijskog modela
Ako se analizira evolucija posmatranog fenomena
izmeu razliitih individua u vremenskom presjeku
model se pie u sljedeem obliku:


gdje indeks i oznaava da se istrauje promjena
varijable Y u funkciji varijable X izmeu razliitih
individua (jedinica posmatranja, npr. zemlje,
potroai, preduzea).

6
i i
X Y
1 0
| | + =
Od ekonomskog do
ekonometrijskog modela
U prethodnom dijelu smo definisali funkciju potronje u obliku
linearne veze: C = + | Y
gdje je C potronja, Y dohodak , nuna potronja, | granina
skladnost potronji.

Ako se koriste podaci vremenskih serija model se izraava
sljedeom relacijom:

gdje indeks t pokazuje da se analizira evolucija varijable Y kao
funkcija varijable X u toku vremenskog perioda (godina, mjeseci).


7
X Y
1 0
+ = | |
t t
X Y
1 0
| | + =
Od ekonomskog do
ekonometrijskog modela

Ukoliko se ekonomske pojave analiziraju za vie
posmatranih jedinica u toku odabranog vremenskog
perioda, radi se o modelu sa panel podacima koji se
formalizira sljedeim izrazom:


8
it it
X Y
1 0
| | + =
Od ekonomskog do
ekonometrijskog modela
Svi faktori koji nisu (eksplicitno) ukljueni u model se mogu
grupisati u teorijskom modelu sintetikim izrazom koji
predstavlja stohastiki lan ili greku koji se oznaava kao:

c
t
za model sa podacima vremenske serije,
c
i
za model u vremenskom presjeku
c
it
za model sa panel podacima

Ovaj izraz predstavlja greku specifikacije modela zbog
neukljuivanja u model nekih eksplikativnih faktora i
istovremeno uzima u obzir greke mjerenja podataka.
9
Od ekonomskog do
ekonometrijskog modela
Uvoenje ovog lana omoguava da se pree sa teorijskog na
ekonometrijski model i za vremensku seriju izraz je:

Y
t
zavisna varijabla koja se objanjava tj. endogena , Xt nezavisna
varijabla kojom se objanjava tj. Egzogena

je regresiona prava, |0 konstantna, |1 nagib, a stohastiki lan ili
greka koja predstavlja razlike izmeu teorijskog i ekonometrijskog
modela.
Zadatak je ocjeniti parametre |0 i |1 .
Nije mogue poznavati njihove prave vrijednosti.

10
t t t
X Y c | | + + =
1 0
t
X
1 0
| | +
Parametri i pretpostavke o osobinama
stohastinosti modela
a) , normalnost

b) , oekivana vrijednost greke je jednaka nuli

c) , konstantna varijansa homoskedastinost

d) za svako i, j; i=j; , nepostojanje autokorelacije

e) nezavisnost greke od egzogene varijable j.

11
n. 1,2,..., i ,
1 0
= + + =
i i i
x y c | |
) , 0 ( ~
2
o c N
i
0 ) ( =
i
E c
2 2
) ( o c =
i
E
0 ) , ( =
j i
E c c
0 ) , ( =
j i
X E c
Osobine procjenitelja
Da bi se ocijenile vrijednosti parametara regresionog modela
potrebno je odabrati formulu (procjenitelj, estimator) kojim
e se doi do njihove najbolje procjene.

Procjenitelji trebaju imati sljedee osobine:

1. Nepristrasnost
2. Konzistentnost
3. Efikasnost
4. Najbolja linearna nepristrasnost



12
Metod najmanjih kvadrata i
kriterij izbora regresione prave

Vidjeti detaljno u knjizi:

Somun-Kapetanovi, R.: Statistika u ekonomiji i
menadmentu, Sarajevo, Ekonomski fakultet, 2006.
str. 111 145.


13
Regresiona i korelaciona analiza
Zadatak regresione analize je istraivanje analitikog
oblika veze izmeu pojava kojem se najvie
pribliavaju promjene analiziranih pojava.

Zadatak korelacione analize je utvrivanje stepena i
smjera povezanosti pojava.

14
Metod jednostavne regresije
Analiza sluaja 1.
Cilj:
izraunati koeficijent korelacije i testirati
signifikantnost u odnosu na 0.
ocijeniti parametre modela jednostavne linearne
regresije i seriju reziduala
ocijeniti rezidualnu varijansu i varijansu i standardnu
greku dobivenih parametara.
15
Bourbonnais R., (2008): Exercice pedagogiques d'econometrie, Economica, Paris, str.14.
Podaci za varijable Y
t
, X
t

16
t Y X

1 20 54
2 19 53
3 21 59
4 21 66
5 23 63
6 20 62
7 25 65
8 24 60
9 28 59
10 27 65
11 31 70
12 33 65
Ocjena modela


Ocijeniemo relaciju


b
0
i b
1
parametri modela koje treba ocijeniti i koji se
jo nazivaju regresioni koeficijenti, n broj podataka,
e
t
rezidual.



17
t t t
x y c | | + + =
1 0
n t e X b b y
t t t
,..., 1 = , + + =
1 0
Pitanja:
P.1. Nacrtati grafikon i izraunati koeficijent korelacije.
Da li je koeficijent korelacije znaajno razliit od 0?

P.2. Objasniti znaenje sluajnog lana, ocijeniti
parametre b
0
i b
1
i kompletirati seriju reziduala.

P.3. Ocijeniti neobjanjenu (rezidualnu) varijansu i
standardne greke koeficijenata b
0
i b
1
.

18
Odgovori: P.1.
Grafika prezentacija: oblak rasipanja Y u funkciji X (Excel u
prilogu)
Grafikon ukazuje na pozitivnu korelaciju varijabli
Koeficijent jednostavne linearne korelacije je dat sljedeim izrazom:

19
=

= =


= =
=
n
t
t
n
t
t
t
n
t
t
y x
y x
y y x x
y y x x
y x COV
r
1
2
1
2
1
,
) - ( ) - (
) - ( ) - (
) , (
o o
62 , 0
67 , 230 25 , 274
00 , 157
.
1
2
1
2
1
2
1
2
1 1 1
.
= =
|
.
|

\
|
|
.
|

\
|

=


= = = =
= = =
n
t
n
t
t t
n
t
n
t
t t
n
t
n
t
n
t
t t t t
y y n x x n
y x y x n
Odgovori: P.1.
r
x,y
= 0,62
Test hipoteze na je sljedei
Za ovaj test potrebno je primjeniti t statistiku



Ako je t * > t
n-2
tj. t izraunato vee od tabline vrijednosti t za nivo
o % i (n 2) stepena slobode odbacuje se H0 to znai da je
teorijski koeficijent korelacije znaajno razliit od 0.
Ako je broj stepeni slobode vei od 30 tada se Studentova
distribucija moe aproksimirati normalnom distribucijom.


20
y x,

0 : ; 0 :
, 1 , 0
= =
y x y x
H H
2
) 1 (
2
,
,
*

=
n
r
r
t
y x
y x
Odgovori: P.1.
Veza se u optem sluaju smatra signifikantnom ako
je rizik da e se pogrijeiti manji od 5% afirmiui da
je koeficijent korelacije razliit od 0.

t * = 2,52 > t
0,05
12-2
= 2,228

Odbacujemo H
0
koeficijent korelacije
x,y
je
znaajno razliit od nule na nivou rizika 5%.


21
Odgovori: P.2.
Estimator MNK, pouzdan i konvergentan je jednak



22
2
1
) , (
X
Y X Cov
b
o
=
572 , 0
) (
) ( ) (
1
2
1
1
=

=
=
n
t
t
n
t
t t
x x
y y x x
b
017 , 11 8 , 61 572 , 0 3 , 24
1 0
= = = x b y b
t t t
x x b b y 572 , 0 017 , 11
1 0
+ = + =
t t t
y y e =
Odgovori: P.3.

Varijanse ocijenjenih parametara su:





Standardne greke ocijenjenih parametara su:

23
079 , 14
2 12
79 , 140
2

1
2
2
=

=
n
e
n
t
t
c
o
92 , 196
25 , 274
82 , 61
12
1
079 , 14
) (
1

1
2
2
2 2
0
= |
.
|

\
|
+ =
|
|
|
|
.
|

\
|

+ =

=
n
t
t
b
x x
x
n
c
o o
0513 , 0
25 , 274
079 , 14
) (

1
2
2
2
1
= =

=
n
t
t
b
x x
c
o
o
03 , 14 =
bo
o 226 . 0
1
=
b
o
Primjena Excela
24
Primjena Excela
25
Primjena Excela
26
Nastavak Analize sluaja 1
Ciljevi:
statistiki testovi
Studentov test za parametre (jednostrani i dvostrani)
raun kritine vjerovatnoe
test analize varijanse
interval povjerenja parametara i objanjenje
varijanse
Interval predvianja


27
Testiranje hipoteza, sluaj 1.
P.1. Testirati na nivou 5% hipotezu:

Zato je ova hipoteza znaajna za testiranje ? Dajte kritinu
vjerovatnou testa.
Odredite interval povjerenja za koeficjent
1
sa pouzdanou 95%.

P.2. Testirati sljedee hipoteze uz =5%:


i dajte kritine vjerovatnoe testa.


28
0 : ; 0 :
1 1 1 0
= = | | H H
5 , 0 : ; 5 , 0 :
1 1 1 0
= = | | H H
P.3. Izraunati:
Ukupan zbir kvadrata odstupanja TSS (total sum of square):

Neobjanjeno odstupanje kvadrata ili zbir kvadrata rezidualnih odstupanja
RSS (residual sum of square):

Zbir kvadrata objanjenih odstupanja ESS (estimated sum of square),
objanjeno odstupanje:

Izraunati koeficijent determinacije R
2
i kompletirati tabelu analize
varijanse. Testirati uz =5% sljedee hipoteze:


ta moete zakljuiti?


29

=

n
t
t
y y
1
2
) (

= =
=
n
t
t t
n
t
t
y y e
1
2
1
2
) (

=

n
t
t
y y
1
2
) (
0 ) -

( :
1
2
0
=

=
n
t
t
y y H 0 ) -

( :
1
2
1
=

=
n
t
t
y y H
Odgovori:
P.1.


Prema



Odbacuje se H
0
nepoznati teorijski koeficijent je
znaajno razliit od 0.

30
0 : , 0 :
1 1 1 0
= = | | H H
2 - n
1 1
t ~

1
b
b
o
|
2
1
1 0
~

0
) 0 ( :
1

=
n
b
t
b
H
o
|
> 53 , 2 =
226 . 0
572 , 0
=

= *
1
1
b
b
t
o
228 , 2
05 , 0
10
= t
Odgovori
Interval povjerenja je:






Nepoznati koeficjent
1
ima 95% vjerovatnoe da se nae u tom
intervalu.
Konstatujemo da je nula van tog intervala to je u saglasnosti sa
prethodnom hipotezom i donesenom odlukom.


31
| | 08 , 1 ; 07 , 0
226 , 0 228 , 2 572 , 0

1
1
2 /
2 1 1
2 /
2
1 1
1
1
e
=
=
=

|
|
o |
o
|
o
o
b n
n
b
t b
t
b
Odgovori:
P.2.





Ne moe se odbaciti nulta hipoteza to znai da
nije znaajno razliit od 0,5


32
5 , 0 :
1 0
= | H
5 , 0 :
1 1
= | H
t test ) 5 , 0 = (
1 0
| H
2
1
~

5 , 0
1

n
b
t
b
o
32 , 0
226 , 0
5 , 0 572 , 0

5 , 0
*
1
1
=

=
b
b
t
o
228 , 2 32 , 0 *
05 , 0
10
= < = t t
1
|
P. 3.
Ukupan zbir kvadrata odstupanja:

Rezidualni zbir kvadrata odstupanja:

Objanjeni zbir kvadrata odstupanja:

Koeficijent determinacije:

33
67 , 230 ) (
1
2
=

=
n
t
t
y y
79 , 140
1
2
=

=
n
t
t
e
88 . 89 ) (
2
1
=

=
y y
n
t
t
389 , 0
) (
1
) (
) (
1
2
1
2
1
2
1
2
2
=

=
=
=
=
n
t
t
n
t
t
n
t
t
n
t
t
y y
e
y y
y y
R
389 , 0 ) 62 , 0 (
2 2
,
2
= = =
y x
r R
P. 3.
Tabela: Analiza varijanse
34
STEPENI
SLOBODE
ZBIR
KVADRATA
SREDINA
KVADRATA
REGRESIJA
1 89,88 89,88
REZIDUAL
10 140,79 14,08
UKUPNO
11 230,67
Odgovori
Kako odrediti stepene slobode? Stepen slobode je
jednak broju parametara koji se mogu slobodno
izabrati poslije realizacije statistike ocjene.

Npr. ako je raspoloiv uzorak od 6 podataka i ako se
poznaje aritmetika sredina uzorka tada se slobodno
moe odabrati 5 podataka a esti e se izraunati iz
aritmetike sredine: broj stepeni slobode je dakle (n -
1).

35
Odgovori
Za ukupan zbir kvadrata odstupanja poznata je aritmetika sredina
od Y to znai gubitak jednog stepena slobode tj. (n-1).

Za rezidualnu sumu kvadrata odstupanja potrebno je poznavati dva
parametra :
to znai gubitak 2 stepena slobode (n-2).

Za objanjenu sumu kvadrata odstupanja potrebno je poznavati b
1

da bi se izraunala ESS: i
odakle slijedi broj stepeni slobode jednak je 1.


36
1 0
b i b ) (
1 0 t t t
x b b y e =
t t
x b b y .
1 0
+ =
x b b y .
1 0
+ =
) ( ) (
1
x x b y y
t t
=
Testiranje


F test

Ako je odbacuje se H
0
to znai da je
objanjena suma kvadrata odstupanja znaajno razliita od 0.
Varijabla X
t
objanjava varijablu Y
t
.
Kritina vjerovatnoa (rizik da se pogreno odbaci H
0
je data
vrijednou vjerovatnoe takoe
Odbacujemo nultu hipotezu jer je rizik manji od 5%.


37
0 ) ( :
2
1
0
=

=
y y H
n
t
t
0 ) ( :
2
1
1
=

=
y y H
n
t
t
38 , 6
10 / 79 , 140
1 / 88 , 89
2 / ) (
1 / ) (
*
1
2
1
2
=

=
=
n
t
t t
n
t
t
n y y
y y
F
05 , 0
2 , 1
*

>
n
F F
96 , 4
10 , 1
=
c
F
o
= 03 , 0
c
o
Analiza sluaja 2.
Cilj: Statistiki testovi i poreenje koeficijenata regresije
Interesuje nas veza izmeu ocjene iz ekonometrije i ocjene iz
statistike dobivene prethodne godine za odreenu grupu studenata
Model za ocjenu je
ocjena iz ekonometrije za individuu i

ocjena dobivena iz statistike prethodne godine za individuu i

parametri za ocjenu

stohastiki lan, greka koja zadovoljava klasine hipoteze.



38
i i i
x y c | | + + =
1 0
i
y
i
x
1 0
| | i
t
c
Rezultati ocjene modela
Uzet je uzorak 97 studenata i to 54 mladia i 43 djevojke.

39
Model 1 za mladie Model 2 za djevojke
i i i
e x y + + = 3 , 3 81 , 0
, 1
) 12 , 2 (
54 = n
84 , 0
2
= R
i i i
e x y + + = 5 , 1 09 , 1
, 1
) 20 , 3 (
43 = n
87 , 0
2
= R
Pitanja:
P.1. Obrazloite postupak

P.2. Postoji li statistiki znaajna relacija izmeu ocjene
iz statistike i ocjene iz ekonometrije? Odredite
kritinu vjerovatnou testa i komentariite rezultat.

P.3. Za dva modela testirati

Odrediti kritinu vjerovatnou testa.


40
1 : ; 1 :
1 1 1 0
= = | | H H
Odgovori - Rjeenja
P.1. Modeli su specificirani u vremenskom presjeku jer su podaci
prikupljeni u trenutku t za 97 individua (jedinica posmatranja).
Uzorak je podijeljen na 2 podskupa (mladii i djevojke) i ocijenjena
su 2 modela jer se pretpostavlja da su parametri 2 modela razliiti.
P.2.


Za model 1.
Poto je broj stepeni slobode vei od 30 Studentova distribucija se
moe aproksimirati normalnom. Odbacuje se nulta hipoteza
to znai da postoji veza izmeu ocjene iz ekonometrije i ocjene iz
statistike u prethodnoj godini za mladie.

41
0 : ; 0 :
1 1 1 0
= = | | H H
96 , 1 12 , 2

*
05 , 0
52
1
1
= > = = t
b
t
b
o
Odgovori - Rjeenja
Kritina vjerovatnoa o
c
se dobija kao , o
c
=0,039
Postoji rizik od 3,9% da e se napraviti greka ako se odbaci H
0
.
Nulta hipoteza se odbacuje jer je rizik greke manji od 5%.

Za drugi model
Odbacuje se H
0
kao to znai da postoji veza izmeu ocjene iz
ekonometrije i ocjene iz statistike u prethodnoj godini za djevojke.
Kritina vjerovatnoa o
c
: odnosno o
c
= 0,0026.
Postoji 0,26% rizika da e se pogrijeiti ako se odbaci H
0
.

U oba modela je pokazana statistiki znaajna veza i za drugi
model relacija je jaa jer je kritina vjerovatnoa manja.

42
12 , 2
52
=
c
t
o
96 , 1 20 , 3

*
05 , 0
41
1
1
= > = = t
b
t
b
o
20 , 3
41
=
c
t
o
Primjena Excela
43
Odgovori - Rjeenja
P.3. Treba izraunati standardnu greku za svaki od
koeficjenata


Za model 1:


Za model 2:

44
*
1 1 *
1
1
1
1

b
b
b
b
t
b b
t = = o
o
382 , 0
12 , 2
81 , 0

1
= =
b
o
340 , 0
20 , 3
09 , 1

2
= =
b
o
Odgovori - Rjeenja
Dvostrani test

Za kolinik

Za prvi model

Poto je empirijska vrijednost negativna, nalazimo se u negativnom
dijelu kritinog regiona i vrijednost je
Prihvatamo H
0
, teorijski koeficijent nije znaajno razliit od 1.
Kritina vjerovatnoa odnosno o
c
=0,62.
Postoji 62% rizika da e se pogrijeiti ako se odbaci H
0
i zbog toga se
ne odbacuje.


45
1 :
1 0
= | H 1 :
1 1
= | H
) 1 (
1 0
= | H 2
1
~

1
1

n
b
t
b
o
497 , 0
382 , 0
1 81 , 0

1
*
1
1
=

=
b
b
t
o
. 497 , 0 96 , 1
05 , 0
53
< = t
1
|
497 , 0
53
=
c
t
o
Odgovori-Rjeenja
Za drugi model:



H
0
se prihvata, nije znaajno razliit od 1.

Kritina vjerovatnoa , o
c
=0,79

79% rizik greke ako se odbaci H
0
. Zbog toga prihvatamo H
0






46
96 , 1 264 , 0
34 , 0
1 09 , 1

1
*
05 , 0 05 , 0
41
1
1
= = < =

=

t t
b
t
b
o
1
|
264 , 0
41
=
c
t
o
Model multiple regresije
Treba ocijeniti sljedei model



zavisna varijabla

eksplikativne varijable ije su vrijednosti poznate
za period od 10 godina.




47
t t t t
x x y c | | | + + + =
, 2 2 , 1 1 0
t
y
t t
x i x
, 2 , 1
Analiza sluaja 3. : Model multiple regresije
Tabela:
48
t t t
x i x y
, 2 , 1
,
t
1 12 7 48
2 21 9 40
3 24 11 18
4 24 12 28
5 13 7 40
6 17 9 32
7 21 12 31
8 26 14 24
9 31 19 22
10 30 21 25
t
y
t
x
, 1
t
x
, 2
Analiza sluaja 3. : Model multiple regresije
P.1. Ocijeniti regresioni model.

P.2. Testirati sljedee hipoteze uz nivo pouzdanosti 95%.




i odrediti kritinu vjerovatnou testa.

Komentarisati dobivene rezultate.


49
0 : ; 0 :
2 1 1 0
= = | | H H
0 : ; 0 :
2 1 2 0
= = | | H H
Primjena Excela
50
Primjena Excela
51
Primjena Excela
52
Odgovori - Rjeenja

P.1. Ocijenjeni regresioni model je :

53
t t
e b b y + + =
2 1
256 , 0 902 , 0 87 , 18
Odgovori-rjeenja
P.2.






i nepoznati koeficijent
1
je znaajno razliit od 0.
Kritina vjerovatnoa testa
Postoji 3,2 ansi na hiljadu da pogrijeimo ako odbacimo H
0
,
odbacujemo je jer je rizik da emo pogrijeiti manji od 5%.



54
1
1
1 1 0
~

0
~

0 : ; 0 :

= =
k n
b
i
k n
b
i i
t
b
t
b
H H
i
i
o
o
|
| |
36 , 2
37 , 4
206 , 0
902 , 0

05 . 0
1
1 *
1
1
=
= = =
k n
b
b
t
b
t
o
0
05 , 0
7
*
1
H se odbacuje t t
b
>
0032 , 0 37 , 4
7
= =
c
tj t
c
o
o
Odgovori - rjeenja



nalazimo se lijevo od kritine oblasti za H
0


odbacuje se H
0
.
Nepoznati parametar
2
je razliit od nule.

Kritina vjerovatnoa

Postoji 4,3% rizika da emo pogrijeiti ako odbacimo nultu hipotezu.
Odbacujemo je jer je rizik da emo pogrijeiti manji od 5%.

55
46 , 2
104 , 0
256 , 0

0 : 0 :
2
2
2 *
2 1 2 0
=

= =
= =
b
b
b
t
H H
o
| |
36 , 2 46 , 2
05 , 0
7
*
2
= < = t t
b
043 , 0 , 46 , 2
7
= =
c
c
t o
o
Odgovori-rjeenja



Interval povjerenja je:


Koeficjent
1
ima 95% vjerovatnoe da se nae u ovom
intervalu. Nula je izvan ovog intervala to potvruje
prethodni test .


56
2 /
2
1 1
1

o
o
|

n
b
t
b
| |. 38 , 1 ; 43 , 0 206 , 0 306 , 2 902 , 0
1 1
2 /
2 1
1
e =

| | o
o
b n
t b
Nastavak analize sluaja 3. : Predvianje
Cilj: analiza varijanse, raunanje koeficijenta multiple korelacije,
korigovanog koeficijenta determinacije. Predvianje i interval.
Uzeti podatke i rezultate iz vjebe 4. multipla regresija.
P.2. Kompletirati tabelu analize varijanse
P.3. Izraunati r,
P.4.Testirati znaajnost regresije uz rizik od 5%
P.5. Izraunati predviene vrijednosti Yt i interval sa 95%
znaajnosti za periode 11 i 12 znajui sljedee vrijednosti:


57
R R
___
,
2
Period
11 24 21
12 12 30
t
x
, 1 t
x
, 2
Odgovori: P.1.
TSS:




RSS:

ESS:



58

= = =
+ =
n
t
n
t
t
n
t
t
y y y y y y
1 1
2
1
2
)

( )

( ) (

=
= =
=
=
= =
=
n
t
t
n
t
t
n
t
t t
n
t
t
y y
e y y
y y
1
2
1
2
1
2
1
2
43 , 345 )

(
47 , 31 )

(
9 , 376 ) (
Analiza varijanse
Broj stepeni slobode objanjenog zbira kvadrata
odstupanja (ESS) je jednak k kada imamo k
eksplikativnih varijabli ne raunajui konstantnu.

59
Stepeni slobode Zbir kvadrata Sredina kvadrata
Regresija k=2 ESS=345,43 172,72
Rezidual n-k-1=7 RSS=31,47 4,49
Ukupno n-1=9 TSS=376,9
Output iz Excela Analiza varijanse
60
ANOVA
df SS MS F Significance F
Regression 2 345,4314 172,7157 38,41957 0,000168182
Residual 7 31,4686 4,495514
Total 9 376,9
Analiza rezultata








Zato korigovati stepene slobode?
U modelu multiple regresije injenica da se doda jedna eksplikativna varijabla
ak i neznaajna ima za posljedice da smanji zbir kvadrata neobjanjenih
odstupanja i povea zbir kvadrata objanjenih odstupanja. Dodavanje
eksplikativne varijable rezultira u poveanju koeficijenta determinacije ali i
gubitkom jednog stepena slobode. Kako bi se to uzelo u obzir rauna se
koeficijent determinacije korigovan za stepene slobode.

61
892 , 0 ) 1 (
) 1 (
1
1
957 , 0
916 , 0
) (
1
) (
) (
2
2
1
2
1
2
1
2
1
2
2
=

=
= =
=

=
=
R
k n
n
R
y y
e
y y
y y
R
R
R n
t
t
n
t
t
n
t
t
n
t
t
P.3.
62
0
05 , 0
) 1 ( ,
*
) 1 ( ,
2
2
*
1
2 1 0
~
) 1 (
) 1 (
0 :
) 0 ... ( 0 :
H se odbacuje F F je Ako
F
k n
R
k
R
RSS ddl
RSS
ESS ddl
ESS
F
ESS H
ESS H
k n k
k n k
k


>

= =
=
= = = = = | | |
P.3.


Odbacuje se H
0
, ESS je razliita od nule, varijable x
1t
i x
2t
su
eksplikativne varijable od y
t
.


Ogranienje F testa za globalnu znaajnost regresije. U sluaju
odbacivanja ovaj test ima ogranieni znaaj. On samo konstatuje da
ima najmanje jednu varijablu eksplikativna signifikantna bez drugih
indikacija.


63
74 , 4 41 , 38
2
47 , 31
2
43 , 345
05 , 0
7 ; 2
*
= > = = F F
00016818 , 0 41 , 38
7 ; 2
= =
o
o C
F
c
P. 4. Predvianje
64
h n h n h n
x x y
+ + +
+ =
, 2 , 1
256 , 0 902 , 0 87 , 18

Period x1t x2t Predvianje


11 24 21
12 12 30
14 , 35 21 256 , 0 24 902 , 0 87 , 18
1 10
= + =
+
y
01 , 22 30 256 , 0 12 902 , 0 87 , 18
2 10
= + =
+
y
Analiza sluaja 4:
Cilj: Upotreba dummy varijabli, test linearnog ogranienja na
koeficijente.
Podaci su prikupljeni za 364 domainstva i to:
- godinja potronja za rekreaciju-odjeu (R-0) varijabla
potronja u Y
i
- godinji prihodi domainstava u x
1i

- mjesto stanovanja
- selo = 1, ako nije selo 0 x
2i
- grad = 1, ako ne 0 x
3i
- predgrae = 1, ako ne 0 x
4i

Podaci za 364 domainstva su predstavljeni u Excelu za Analizu sluaja 4.

65
P. 1. Ocijenite koeficijente sljedea tri
modela i intepretirajte rezultate.







P. 2. Za model 2. izraunati predvianje za potronju rekreacija -
odjea za domainstvo u gradu iji je godinji prihod 50 000.

66
i i i i i i
i i i i i i
i i i i i
i i i i i i
pred grad selo prihod potronja Model
x x x x Y Model
x x x Y Model
x x x x Y Model
c | | | | |
c | | | |
c | | | |
c | | | | |
+ + + + + =
+ + + + =
+ + + + =
+ + + + + =
. :
. 3
. 2
. 1
4 3 2 1 0
4 4 3 3 2 2 1 1
3 3 2 2 1 1 0
4 4 3 3 2 2 1 1 0
Odgovori - Rjeenja
P.1. Trai se veza izmeu prihoda domainstava i potronje za
rekreaciju-odjeu. Mislimo da mjesto stanovanja moe biti
eksplikativni (objanjavajui ) faktor potronje.
Kreirali smo tri varijable
selo = 1, ako ne 0
grad = 1, ako ne 0
predgrae = 1, ako ne 0

Varijabla je - dihatomna, binarna, dummy na engleskom. To je
posebna eksplikativna varijabla koja uzima vrijednost 0 ili 1.


67
Ocjena modela 1.
Koeficijenti modela se ne mogu ocijeniti jer postoji
perfektna multikolinearnost. Zbir tri dummy varijable je
jednak 1, i perfektno je koreliran sa vektorom 1
konstantnog lana.

Estimatori metode najmanjih kvadrata se ne mogu
utvrditi.

U sluaju kvalitativnih varijabli koje imaju vie
modeliteta (npr. boja oiju, porodina situacija itd.)
treba kodirati toliko varijabli indikatora koliko ima
modeliteta manje 1.


68
Primjena Excela
69
Ocjena modela 2.
Koeficijenti su znaajno razliiti od 0, model je validan
prema statistikim kriterijima.

U prosjeku od 100 prihoda potronja za R-0
predstavlja 5,80 (100x0,057993).

Stanovnici seoske zone troe 533,1635 manje od
prosjeka, a stanovnici grada troe 1545 vie od
prosjeka.

70
Primjena Excela
71
Model.3.
U modelima 2. i 3. koeficijent uz varijablu prihod je
identian.

Stanovnici grada troe 1545 vie nego oni iz
predgraa (2487,83-942,90 = 1544,92) koji troe
533,17 (942,90 - 409,73 = 533,17) vie nego
stanovnici sela.

Dobivamo koeficijente modela 2.

72
Primjena Excela
73
P. 2. Predvianje
Za model 2 predvianje potronje za R-0 za
domainstvo koje ivi u gradu i iji je godinji prihod
50 000 je dobiveno sljedeim izrazom

74
eura Y
Y
e x x x Y
i
i
i i i i i
83 , 5387
1 93 , 1544 0 16 , 533 000 . 50 058 , 0 90 , 942
93 , 1544 16 , 533 058 , 0 90 , 942
3 2 1
=
+ + =
+ + + =
Analiza sluaja 5. Mobilnost kapitala
Ekonomsko podruje primjene: Monetarna i finansijska
makroekonomija

Od 1980. godine uoava se porast liberalizacije
internacionalog trita kapitala i ova liberalizacija je
rezultirala u finansijskoj globalizaciji tj. u svjetskom tritu
kapitala.
U kontekstu liberalizacije trita kapitala, FELDSTEIN i
HORIOKA (1980) su eljeli evaluirati stepen mobilnosti
internacionalnog kapitala u dugom roku na bazi analize veza
izmeu investiranja i tednje zemalja OECD.


75
Analiza sluaja 5. Mobilnost kapitala
Ovo pitanje je znaajno jer u zavisnosti od stepena
mobilnosti kapitala uticaj ekonomskih politika moe
biti jai ili slabiji. Npr. porezna politika u korist
nacionalne tednje e imati znaajniji efekat na
investiranje u zemlji ukoliko je nivo mobilnosti
kapitala slabiji.
U sluaju nepostojanja mobilnosti kapitala nalaze se
rezultati zatvorene ekonomije, nacionalna tednja je
jednaka nacionalnom investiranju i svaki porast
tednje rezultira identinim porastom investiranja.

76
Analiza sluaja 5. Mobilnost kapitala
FELDSTEIN i HORIOKA su mjerili stepen mobilnosti
kapitala na bazi analize izmeu tednje i investicija.
Oni su ocijenili regresioni model:


u kojem:

predstavljaju proporciju bruto investicija i tednje u
BDP (GDP), stohastiki lan.

77
c | | + + =
Y
S
Y
I
.
2 1
Y
S
i
Y
I
c
Analiza sluaja 5. Mobilnost kapitala
U sluaju perfektne mobilnosti kapitala, porast stope tednje
u jednoj zemlji mora uzrokovati porast investicija. Granina
produktivnost kapitala je opadajua funkcija stoka kapitala to
znai da e prvo imati koristi zemlje koje inicijalno imaju
manje kapitala.

U sluaju jake mobilnosti kapitala porast nacionalne (dravne)
tednje ne rezultira u identinom porastu nacionalnih
investicija. Ocjena blizu jedinici pokazuje da porast
nacionalne tednje uzrokuje identian porast nacionalnih
investicija. Dodatna tednja ostaje u zemlji i mobilnost
kapitala je slaba.

78
2
|
Prezentacija baze podataka
Podaci su publikovani u ,,Ekonomske perspektive OECD
2000. Serija podataka o GDP, dravnoj tednji, privatnoj
tednji, javnoj tednji i nacionalnim investicijama su izraene
u nacionalnoj valuti u tekuim cijenama, a serije izvoz, uvoz su
raspoloive kao proporcija u GDP.
Na osnovu ovih podataka su izraunate stope investiranja
tednje i prosjean komercijalni deficit za razliite
podperiode.
U dokumentu podataka dati su podaci za 19 zemalja: USA,
Japan, Njemaka, Francuska, Italija, Holandija, Norveka,
Portugal, panija, vedska, vajcarska, Australija i Velika
Britanija.

79
Prezentacija baze podataka
Serije su godinji prosjeci
txi = I/Y udio investicija u GDP
txs = S/Y udio nacionalne tednje u GDP
tx priv = S privatna /Y udio privatne tednje u GDP
tx javna = S javna /Y udio javne tednje u GDP
dc = -(X-M)/Y je udio komercijalnog deficita u GDP

Npr. txi 7098 prosjena stopa investicija u periodu 1970-1998.



80
Analiza sluaja 5. Mobilnost kapitala
Ocijeniti obinom metodom najmanjih kvadrata
model:





txi7098i=b1+b2txs7098i+ei = 0,085+0,62txs7098i+ei

Analizirajte dobiveni rezultat.



81
19 ,..., 2 , 1 ,
2 1
= +
|
.
|

\
|
+ =
|
.
|

\
|
i
Y
S
Y
I
t
i i
c | |
i i i
txs txi c | | + + = 7098 7098
2 1
Analiza sluaja 5. Mobilnost kapitala
Za vjebu provjerite ocjenu sljedeeg modela i
interpretirajte dobivene rezultate:

txi7098i=b1+b21txpriv7098i+b22txsjav7098i+ei=
=0,067+0,71txpriv7098i+0,54txsjav7098i+ei

U Excelu je prezentovana baza podataka i ocjene
modela.


82
Primjena Excela
83
Primjena Excela
84
Analiza varijanse
Analiza varijanse se koristi u analizi veeg broja
uzoraka za utvrivanje statistike znaajnosti razlika
izmeu njihovih aritmetikih sredina.
Cilj analize varijanse je da utvrdi da li je varijabilitet
izmeu uzoraka (posmatranih grupa podataka)
statistiki znaajniji od varijabiliteta u uzorku.
U zavisnosti od broja nezavisnih varijabli koje se
ukljuuju u analizu razlikuju se jednofaktorska (
jednostavna) i dvofaktorska (sloena) analiza
varijanse.

85
Jednofaktorska analiza varijanse
Statistiku znaajnost razlika aritmetikih sredina
izmeu dva uzorka se odreuje t testom.

Kada je broj uzoraka vei od dva primjenjuje se
jednofaktorska analiza varijanse. Nije neophodno da
uzorci imaju isti broj podataka i zakljuak se donosi
na osnovu dobijene p vrijednosti.

86
Primjer 6.

U tri pogona se proizvodi isti proizvod. Ispituje se
produktivnost rada mjerena utrokom vremena za
proizvodnju proizvoda. Sluajnim izborom iz pogona
A je izabrano 8, iz pogona B 7 i iz pogona C 9
proizvoda. Utroeno vrijeme za proizvodnju
proizvoda u minutama je dato u sljedeoj tabeli:
87
Analiza varijanse Primjer 6
Moe li se prihvatiti
pretpostavkada ne
postoji razlika u
prosjenom
utroku vremena za
proizvodnju
proizvoda u datim
pogonima uz nivo
signifakantnosti
(znaajnosti, rizika)
od 5%?

88
Primjer 6 Jednofaktorska analiza varijanse
Pogon A Pogon B Pogon C
29 21 26
30 26 23
27 25 23
27 28 24
22 21 25
28 20 29
25 22 20
24 22
27
Primjer 6
89
Primjer 6
90
Hipoteze Primjer 6



Odgovor
Empirijski F odnos je manji od teorijskog F odnosa pa se na
nivou rizika od 5% ne odbacuje nulta hipoteza
p- vrijednost je 0,0974 i vea je od nivoa 5% to upuuje na
prihvatanje nulte hipoteze
Na osnovu dobivenih rezultata ne moe se prihvatiti
pretpostavka da je produktivnost rada u pogonima razliita.


91
= = =
3 2 1 0
: H
= = =
3 2 1 0
: H
Primjer 7
Sluba za istraivanje i razvoj Pote ispituje
produktivnost rada slubenika na alterima
poslovnice. Posmatrana su 4 slubenika. Evidentiran
je broj usluenih stranaka po satu za sluajno
odabrane vremenske intervale i rezultati prikazani u
tabeli.
Testirajte hipotezu da slubenici u prosjeku usluuju
jednak broj stranaka uz nivo rizika 5%. Navedite
pretpostavke od kojih se polazi u ovom testu.

92
Primjer 7
93
Dvofaktorska analiza varijanse Primjer 8

Na trite se lansira novi parfem. Glavni element
marketinke strategije je dizajn proizvoda. Razvijena
su tri mogua dizajna. Prije konane odluke eli se
ispitati reakcija potroaa. Proizvodi tri dizajna (A, B i
C) na sluajan nain su alocirani u parfimerijama
priblino istih karakteristika u etiri regije. U tabeli su
predstavljeni podaci o sedminoj prodaji:

94
Primjer 8
95
Hipoteze
Za regije:

Za dizajn:


Odgovor
F test: na nivou rizika od 5% odbacuje se nulta hipoteza da su
prosjene prodaje u svim regijama i tri razliita dizajnirana
proizvoda jednake.
Na osnovu dobivenih rezultata zakljuuje se da i faktor regija i
faktor dizajn utiu na prodaju parfema.

96
0 : ; 0 :
3 2 1 1 3 2 1 0
= = = = = = H H
0 : ; 0 :
4 3 2 1 1 4 3 2 1 0
= = = = = = = = H H

You might also like