You are on page 1of 38

Univerzitet Crne Gore u Podgorici Ekonomski fakultet

XI REGRESIONA I KORELACIONA ANALIZA


1. Uvod. U prethodnom dijelu programa bilo je rijei o jednodimenzionalnim
rasporedima i istraivan je varijabilitet jednog obiljeja kod niza posmatranih individua. Na
osnovu pojedinanih mjerenja modaliteta obiljeja traene su zajednike karakteristike jedinica u
skupu preko parametara skupa: aritmetike sredine i drugih mjera centralne tendencije, mjera
varijacije, koeficijenata asimetrije i spljotenosti i sl.
!egresiona analiza se odnosi na dvodimenzionalne i viedimenzionalne rasporede. "na je
grana statike teorije koja se iroko koristi u skoro svim granama nauke, a naroito u ekonomiji,
tehnici, medicini i drugim.
U ekonomiji je regresiona analiza vrlo snano sredstvo za mjerenje raznih ekonomskih
veliina ili ocjenjivanje relacija izme#u njih. $arijable kao to su produktivnost rada,
proizvodnja, tehnika opremljenost, narodni dohodak i investicije, uvoz, izvoz, ponuda i tranja,
cijene, razne demografske kategorije %pismenost, smrtnost i dr.&, su u tijesnoj vezi, bilo da je ta
veza direktna ili indirektna. 'esto neke od ovih varijabli pokazuju istu tendenciju i smjer
kretanja ( na pr. obje veliine ili vie njih pokazuju rast, a ima i onih, koje pokazuju obrnut smjer
kretanja jedna od druge. )ako, dok jedna od varijabli raste, druga opada %kad narodni dohodak i
pismenost rastu smrtnost odojadi opada& i sl.
*. $eza izme#u pojava koje se posmatraju, moe biti dvojakog karaktera. "na moe biti
funkcionalna kao u matematici, gdje nezavisno promjenljivoj odgovara tano odre#ena
vrijednost zavisno promjenljive + tj. , - f%.& i stohastika, koja je mnogo labavija od vrste
matematike veze. /tohastika zavisnost izme#u posmatranih pojava se moe uoiti tek kad se
posmatra masa sluajeva. "vaj oblik veza izme#u pojava je predmet regresione analize.
0e#u pojavama kod kojih postoji stohastika povezanost, individualni sluajevi
pokazuju znatan varijabilitet od strogo funkcionalnog. 1li, u posmatranju mase sluajeva, zapaa
se taj funkcionalan odnos ili bolje re2i taj !ros"ean odnos sla#an"a iz$e%u vari"a&li . 3roz
posmatranje mase individualnih varijacija datih pojava, uoava se tendencija njihovog
ponaanja. )ako na pr. narodni dohodak i investicije pokazuju veliko slaganje, jer ako investicije
rastu, normalno bi bilo oekivati da poraste i narodni dohodak. 4li, ako cijene rastu tada se, po
pravilu, potronja smanjuje i sl. 5ostoji niz pojava koje pokazuju vr2u ili slabiju me#uzavisnost
i !reko re#resionalne analize tr&a na'i o&lik $ate$atike krive ko"a 'e izraziti ta"
!ros"ean odnos sla#an"a vari"aci"a iz$e%u !os$atranih !o"ava(
0e#u ekonomskim pojavama ima takvih pojava koje su teko mjerljive tj. teko je o
njima dobiti kvalitetne empirijske podatke %kvalifikaciona struktura, zainteresovanost
radnika,...&. "tuda nije rijetko nai2i na podjelu pojava na $"erl"ive) o kojima se mogu imati
kvalitetni empirijski podaci i ne$"erl"ive pojave, kod kojih dobijanje podataka priinjava
znacajne poteko2e.
11-1.1 Prosta regresija
"snovna svrha regresione analize je u tome da otkrije funkcionalni odnos izme#u dvije
pojave od kojih je jedna nezavisno promjenljiva, a druga zavisno promjenljiva.
1ko bi podatke o dvjema pojavama ucrtali u pravouglom koordinatnom sistemu, moe
se, na osnovu variranja promjenljivih, uoiti tendencija slaganja posmatranih pojava. "bino je
na .6osi vrijednost nezavisno promjenljive, a na ,6osi vrijednost zavisno promjenljive. )ako
dobijamo di"a#ra$ rasturan"a podataka. 7rupisanje taaka moe biti u obliku razliitih krivih:
prave linije, parabole, hiperbole i dr. %slika 84. 1.&.
19*
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
Slika XI(*
Na osnovu ovakvih oblika rasturanja podataka, jasno je koji oblik funkcije moe najbolje
da aproksimira vezu izme#u pojava 8 i +. 5oto podaci pokazuju prvailnost u grupisanju, veza
se pribliava funkcionalnoj.
1li, ima pojava kod kojih ta veza nije tako vrsta i podaci se nepravilno raspore#uju %sl.
84. *.&. :a takve pojave kaemo da ne pokazuju nikakvu me#usobu vezu i nema neke uoljive
tendencije u rasturanju podataka.
Slika XI(+
11-1.2. Matematiki model u linearnoj regresiji
3ao to je navedeno, vezu izme#u pojava 8 i + treba izraziti preko neke krive koja 2e
najbolje da se prilagodi tendenciji slaganja, ispoljenoj na dijagramu rasturanja. )a kriva se zove
lini"o$ re#resi"e. "va kriva mora da najbolje aproksimira jedan empirijski raspored, kako bi
odstupanja individualnih vrijednosti od te linije bila to manja.
3oji oblik krive koristiti za aproksimaciju je pitanje od ijeg tanog odgovora zavisi
valjanost analize. )u se mogu koristiti razni statistiki testovi %preko analize varijanse, preko
19;
! " # " $ ! " $ % #
samog dijagrama rasturanja i sl.&. 1li, naje2e se za tu svrhu koristi tendencija slaganja,
ispoljena na dijagramu rasturanja.
:a ekonomska istraivanja je vrlo vana linearna funkcija oblika:
X Y +
gdje su

konstante6parametri. 5arametar

je parametar presjeka< a parametar


izraava koeficijenat pravaca ili nagib krive. 4 dok

pokazuje vrijednost promjenljive y kad je


= x , dotle parametar

pokazuje promjenljivu + u odnosu na odgovaraju2u promjenu


nezavisne promjenljive 8. )o ilustruje sl. 84. ;.
Y
X Y +
Y
X

= X
0
X
Slika XI(,
Linearna funkci"a izraava najprostije veze izme#u pojava kao to su promjene u
potronji zbog porasta cijena, promjene potronje u zavisnosti od pove2anja dohotka, promjene
narodnog dohotka zbog promjena u investicijama, promjene u tednji u zavisnosti od dohotka i
mnoge druge pojave.
1li, za linearnu vezu me#u pojavama koristi se linearna funkcija oblika:
+ + X Y
gdje je

sluajno odstupanje. 3ao to se zapaa, + zavisi od promjene izraza


& % X +
i znaka
za sluajno odstupanje

. Najbolje je kad je

malo i nezavisno od 8.
3od objanjavanja matematikog modela u linearnoj regresiji, postavljaju se dvije
pretpostavke i to:
a& greka

je nezavisna sluajna varijabla, sa oekivanom vrijedno2u


= & %
i
E
i
varijansom $ar.
i

& %
za svaku vrijednost 8.
b& kovarijansa
1
od
i

i j

je jednaka nuli za svako


j i
.
1
1ko su %u& i %v& dvije sluajne varijable sa oekivanim vrijednostima
v i u
,
19>
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
1ko se nezavisna promjenljiva 8 fiksira na sukcesivnim razmacima tada je + - ?%.&.
3oriste2i pretpostavku da je
= & %
i
E
, tada je ralacija izme#u promjenljivih 8 i + izraena
regresionom linijom
x Y
i
+
.
4li:
X E X X E X Y E
i
+ + + + + & % @ A & %
jer je 8 fiksirano na odre#enim razmacima. 4zraz B%+C8& se ita kao oekivana vrijednost + za
dato 8.
Dalje, varijansa + za dato 8 bi2e:
*
& % @ A & C %

+ + Var X V X Y Var
Na taj nain, za date vrijednosti 8 zavisna veliina + ima funkciju uslovne vjerovatno2e, sa
sredinom
& % X +
i varijansom
*

. "na ima oblik sl. 84. >.



& C % X Y f

& % X +
Slika XI(-
1ko se u trodimenzionalnom koordinatnom sistemu ucrtaju sredine ovih relacija tj.
& % X +
i oblik promjenljive + za date vrijednosti 8, dobijamo ukupnost ovih relacija
prikazanu na sl. 84. E.
tada se izraz:
v u uv E v u u E v v E u uv E v u u v v u uv E v v u u E + + & % & % & % & % @ A &@ &% A% zove
kovarijansom u i v. "na se obiljeava sa Fov %uv&. 1ko su = v u tada je kovarijansa samo B%uv&.
19E
! " # " $ ! " $ % #
Slika XI(.
Gednostavnije napisano, kad treba aproksimirati jedan raspored linearnom funkcijom, tada
treba imati na umu da, u masi posmatranja, odre#ene vrijednosti 8 stoje u linearnoj vezi sa
sredinama jednodimenzionalnih normalnih rasporeda razliitih vrijednosti +. /vakom 8
odgovara po jedan skup normalno raspore#enih vrijednosti +. "vi rasporedi+6a imaju svoju
aritmetiku sredinu
& %
yx

i standardnu devijaciju. )ako dobijamo da je:


za
1
X
sredina
1
& %
1 yx
X +
, a varijansa
*
1
yx

za
*
X sredina
*
& %
* yx
X +
, a varijansa
*
*
yx

i tako redom. Na taj nain, uz pretpostavku normalnog raspore#ivanja, regresioni model


karakterie normalno raspore#ivanje vrijednosti +, sa aritmetikim sredinama tih normalnih
krivih, koje se, u stvari, raspore#uju po liniji regresije
X y
c
+
i standardnim devijacijama
yx

, koje su, po istoj pretpostavci, jednake.


$eliina standardne devijacije izraava veliinu varijabiliteta vrijednosti
i
Y
od
c
Y
tj.
od linije regresije. 1ko je
=
yx

, tada su promjenljive 8 i + u funkcionalnoj zavisnosti.


Na osnovu svega izloenog moemo pisati linearni regresioni model uz date
pretpostavke:
1.
+ + X Y
za svako i

199
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
*.
i i
X X Y E + & C %
;.
*
& C %

X Y v
>.
= & < .% Y Cov
E. $arijabla 8 je fiksirana na
sukcesivnim razmacima
9.
= & %
i
E
za svako i
za svako i
za
j i
/ za svako 8 postoji grupa
vrijednosti + raspore#enih po
normalnom rasporedu
/ aritmetike sredine normalnih
krivih lee na regresionoj pravoj
/ standardne devijacije normalnog
rasporeda su iste
11-1.&. 'cjenjivanje (arametara regresije
:a ocjenjivanje linije regresije koriste se razne metode kao to su grafika metoda,
metoda sredina, metoda najmanjih kvadrata i dr. U praktinom radu se naje2e koriste grafika
metoda i metoda najmanjih kvadrata.
0etod na"$an"ih kvadrata daje takvu liniju regresije od koje je suma odstupanja
originalnih podataka
i
Y
manja nego od bilo koje druge linije, provuene %HprosjeeneH& izme#u
podataka na dijagramu rasturanja. "vaj metod, kako mu i samo ime kae, se zasniva na
minimizaciji odstupanja tj. ovaj metod najmanjih kvadrata minimizira sumu odstupanja od linije
regresije:

. min & %
*
c i
Y Y
)aj vertikalni razmak %sl. 84. 9.&
Y

X Y +
Y
4


Y
2
Y
1
Y
3
Slika XI(1
izme#u stvarnih %originalnih& podataka i linije regresije je najmanji kad je linija regresije tj. njeni
parametri izraunati po metodu najmanjih kvadrata. "na je najbolje linija koja se moe Hprovu2iH
19I
! " # " $ ! " $ % #
izme#u podataka na dijagramu rasturanja, te je otuda i suma kvadrata odstupanja individualnih
vrijednosti
i
y
od linije regresije
c
y
minimalna, tj.

. min & %
*
c i
y y
1ko je matematiki model linije regresije
+ + X Y
, ocijenjena linija regresije ima
oblik:
bx a y
c
+
gdje je HaH ocjena parametra

, a HbH ocjena parametra

. "znaimo li sa
i
e
odstupanje
pojedinih taaka
& &<.....% % &< %
* * 1 1 n n
y x y x y x
od linije regresije
bx a y
c
+
, dobijamo:
& % & %
i i c i i
bx a y Y Y e
)ako se dobija nova funkcija, koja predstavlja su$u kvadrata odstu!an"a
*
i
e



n
i
n
i
n
i
i i c i i
bx a y y y e F
1 1 1
* * *
& % & %
2o $etodu na"$an"ih kvadrata tre&a na'i takve vri"ednosti !ara$etara 3a3 i 3&3 da se
do&i"e takva lini"a re#resi"e od ko"e 'e su$a kvadrata odstu!an"a &iti $ini$alna.
:ato treba traiti minimum funkcije F po parametrima a i b. 5reko ovih parcijalnih izvoda
funkcije F po HaH i HbH i uslova za ekstremnu vrijednost dobijamo:

n
i
i i
bx a y
a
F
F
1
,
= & % *

n
i
i i i
x bx a y
a
F
F
1
,
= & % *
!eavanjem ovih jednaina, dobijamo tzv. nor$alne "ednaine preko kojih dobijamo
vrijednosti parametara HaH i HbH. "ne glase:


+
+
*
i i i
i i
x b x a y x
x b na y
gdje je n broj opservacija %podataka&. U ovom sistemu jednaina nepoznate su a i b tako da
reavanjem jednaina dobijamo vrijednosti parametara u regresiji.
5arametar HaH moemo dobiti iz prve jednaine, tako da se dobija:
X b Y a ili
n
x
b
n
y
a
x b Y na x b na y
i

+


1ko iznos za HaH zamijenimo u drugoj jednaini dobi2emo obrazac za raunanje parametra HbH:
19J
Univerzitet Crne Gore u Podgorici Ekonomski fakultet






+
+
+
+
* *
* *
* *
* *
*
*
*
*
& 8 % 8 n
+ 8 8+ n
b + 8 8+ n @ & 8 % 8 n A b
+ 8 8+ n & 8 % b 8 nb
8 nb & 8 % b + 8 8+ n
8 b
n
& 8 % b
n
+ 8
8+
8 b 8 @
n
8
b
n
+
A 8+
8 b . a 8+
3ao to se zapaa iz obrasca za a i b, potrebno je prethodno izraunati parametar b da bi,
kasnije, tu vrijednost koristili u obrascu za izraunavanje parametra a.
1ko su 8 i + i B sluajne varijable, gdje su 8 i

stohastiki nezavisne, onda je odnos


izme#u parametara

i njegove ocjene HaH mogu2e izraziti preko jednaine


X y +
.
Na#emo li oekivanu vrijednost ovog izraza i rijeimo po

dobijamo:
& % & % & % @ A & % X E Y E X E X E Y E + +
5omnoimo li poetnu jednainu sa 8 i na#emo njenu oekivanu vrijednost, dobi2emo:
& % & % & %
*
*
X E X E XY E
X X XY


+
+
ovo je mogu2e zbog pretpostavke o nezavisnosti 8 i

gdje je
= & % & % & % X E E X E
.
:amijenimo li u gornjoj jednaini umjesto

njegovu vrijednost
& % & % X E Y E
dobijamo:
& % & % A & % & % & %
& % & % &@ % & % A & %
* *
*
X E X E Y E X E XY E
X E X E X E Y E XY E


+
+
!eavaju2i po

dobijamo da je:
* * *
& %
& %
& %
&@ % A & %
& % & % & %
x
xy Cov
x Var
xy Cov
x E x E
y E x E xy E

Izraz u &ro"itel"u "e kovari"ansa a znak !ara$etra

zavisi od znaka kovari"anse i tako


odra4ava na#i& re#resivne krive. 4zraz u imenitelju je varijansa pojave 8, pa otuda parametar

dobijamo iz odnosa:
*
& %
& %
& %
x
xy Cov
x Var
xy Cov


Otuda se tvrdi da "e 3&3) izraunato !o $etodu na"$an"ih kvadrata) ne!ristrasna oc"ena
!ara$etra

.
5r. prosjean prihod i tednja porodica sa jednog podruja kretali su se:
19K
! " # " $ ! " $ % #
5a&ela/XI(*(
5rihod porodica %.& Ltednja %,& ., .
*
,
*
1J * ;9 ;*> >
>1 9 *>9 19J1 ;9
1I 1 1I *JK 1
*= ; 9= >== K
*> ; I* EI9 K
;J > 1E* 1>>> 19
;E E 1IE 1**E *E
1K * ;J ;91 >
E* I ;9> *I=> >K
99 1= 99= >;E= 1==
;;= >; 1J*= 1;;9= *E;
Slika XI(6
5rimjenom obrazaca za raunanje parametara a i b dobijamo:
19*; , =
I== *>
>=1=
K== 1=J 9== 1;;
1K= 1> *== 1J
;;= ;9= 1; 1=
>; ;;= 1J*= 1=
& %
* * *



x x n
y x xy n
b
=EEK , 1 ;EEK , E ; , > ;; 19*; , = ; , > x b y a
Minija regresije je:
X bx a y
i
19*; , = =EEK , 1 + +
Dobili smo jednu rastu2u liniju %jer je parametar b ve2i od nule& koja sijee ,6osu u taci
& =EEK , 1 %
. :a njeno ucrtavanje %sl. .I.& smo uzeli dvije take za 8 i to *= x i E= x . )ako
dobijamo:
1I=
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
=EK1 , I E= 19*; , = =EEK , 1 E=
1K=1 , * *= 19*; , = =EEK , 1 *=
*
+
+
c
c i
Y x
Y x
Radi !rov"ere tanosti !ostu!ka) nu4no "e u lini"i re#resi"e na'i vri"ednost ) za svako * "er
su$a tako izraunatih vri"ednosti $ora &iti "ednaka suni ori#inalnih !odataka) ili7

i c
y y
:a raunanje parametara a i b uzimaju se u obzir sve vrijednosti x i y, tako da one i utiu na
visinu parametra. 1ko bi neke vrijednosti znaajno odstupale od uoene tendencije ostalih
taaka, tada se ekstremne take mogu izostaviti.
11-1.+. #naliza variranja taaka oko linije
regresije
1. Minija regresije predstavlja neprekidnu funkciju, koja najbolje aproksimira vezu
izme#u dvije pojave. Ukoliko su take
i
x
i
i
y
na toj liniji, tada odstupanje originalnih taaka
od linije regresije ne postoji.No, to bi bio isto funkcionalni odnos izme#u promjenljivih, a u
praksi se javljaju sluajevi kada opservacije
i i
y x
odstupaju vie ili manje od linije regresije.
1ko bi sve opservacije leale na regresionoj pravoj, tada ne bi postojala greka ocjene pa bi
prognoziranje moglo te2i sa potpunom tano2u. No, kako su u ekono$i"i !o"ave stohastiko#
karaktera, to je nemogu2e zbog seta najrazliitijih faktora, koji utiu, kako na zavisnu, tako i na
nezavisnu pojavu. Neke vrijednosti ovih taaka su ispod, a neke iznad linije regresije, ali je

c i
y y
, tj suma originalnih podataka
i
y
jednaka je sumi izraunatih vrijednosti
c
y
,
preko linije regresije, kad u liniji regresije promjenljivoj x dajemo njene originalne vrijednosti
i
x
.
3ad je rasipanje %rasturenost& originalnih podataka oko linije regresije velika, tada ne
moemo biti sigurni da linija regresije dobro aproksimira vezu izme#u pojava X i Y. )u
rasturenost moemo mjeriti kao udaljenost
i
y
od aritmetike sredine serije podataka za y tj.
udaljenost taaka
i
y
od
y
, a moe da se mjeri odstupanje podataka
i
y
od linije regresije
c
y
.
1ko bi se samo uzimala odstupanja
& % y y
i
ili
& %
c i
y y
, ona bi bila jednaka nuli zbog
osobine aritmetike sredine
= & % x x
i
, pa se zato uzimaju kvadrati ovih odstupanja, na koji
se nain izbjegavaju potiranja.
*. "dstupanja originalnih podataka od aritmetike sredine date serije tj.
*
& %

y y
i

predstavljaju uku!an vari"a&ilitet. 4li, varijabilitet promjenljive y bi2e izraen varijansom te
promjenljive:
N
y y
y

*
*
& %

0e#utim, odstupanje
i
y
od linije regresije
c
y
pokazuje nam da je jedan dio ukupnog
varijabiliteta ostao neo&"a8n"en re#resioni$ $odelo$. )aj neo&"a8n"eni vari"a&ilitet
izra4ava vari"ansa re#resi"e
*
yx
S
oblika:
*
& %
*
& %
*
* * *
*


n
bx a y
n
y y
n
e
S
c
yx
1I1
! " # " $ ! " $ % #
U stvari, jedan dio ukupnog varijabiliteta objanjava linija regresije, a to je
*
& %

y y
c
, ali
ostaje neobjanjeni varijabilitet
*
& %


c i
y y
. )ako se ukupni varijabilitet promjenljive y moe
napisati kao z&ir neo&"a8n"eno# vari"a&iliteta %koji izraava varijansa regresije9 i o&"a8n"eno#
vari"a&iliteta) tj.
*
& %
*
& %
*
& %
* * *


n
y y
n
y y
n
y y
c c
4z ovog proizilazi da su varijanse objanjenog i neobjanjenog varijabiliteta takve da njihov zbir
daje varijansu ukupnog varijabiliteta %sl. 84.J.&., ali standardne devijacije ovih izraza ne daju
ukupnu standardnu devijaciju.
/uma kvadrata odstupanja individualnih vrijednosti od linije regresije
*
& %


c i
y y
izraava
odstupanja izraunatih od stvarnih vrijednosti tj od originalnih podataka
N
. )ako se pribliavamo
mjerenju greke, mjeri ukupnih kvadrata odstupanja. 1ko se na#e aritmetika sredina sume
kvadrata odstupanja %
c i
y y
&, i iz te sume izvue kvadratni korjen, tada dobijamo standardnu
greku ocjene regresije kao:
k n
y y
S
c i
yx


*
& %
gdje je %nk& broj stepeni slobode a k asocira na broj parametara u regresiji.
Slika XI(:
!C 6 ukupni varijabilitet
N
1ko se individualna odstupanja %greke kod pojedinih opservacija& raspore#uju po normalnom rasporedu, tada se
standardna greka ocjene regresije uslovno moe koristiti za aproksimaciju vrijednosti zavisne veliine y, koje
nastaju promjenom nezavisne veliine x. 1li treba biti svjestan da pouzdanost takve ocjene je ograniena. )im
putem se mjeri prosjean iznos greaka ocjena y, za neke poznate vrijednosti x.
1I*
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
!" 6 objanjeni varijabilitet
"C 6neobjanjeni varijabilitet
4zraz:
*
& %
*
* *


n
bx a y
n
e
S
yx
predstavlja standardnu greku ocjene regresije ili standardnu #re8ku re#resi"e. "na je
apsolutna mjera varijabiliteta od linije regresije, za dato x. 4zraz
& * % n
predstavlja broj stepeni
slobode jer se rauna da su podaci za raunanje regresione krive dobijeni iz uzorka veliine n.
/tandardna greka regresije se u razvijenijem i upro2enijem obliku pie kao:
*
*


n
xy b y a y
S
i
yx
i slui za odre#ivanje intervala varijacije statistikih ocjena, dobijenih preko linije regresije.
3ako se standardna greka rauna po obrascu:
k n
e
S
yx


*
e je odstupanje stvarnih podataka zavisne promjenljive # od linije regresije
bx a y
c
+
tj.
bx a y e
1ko obje strane ove relacije pomnoimo sa HeH i sumiramo, dobijamo vanu relaciju:

e x b e a e y e
*
$e2 je ranije navedeno da je suma odsupanja od srednje vrijednosti jednaka nuli, pa imamo da je

= e
. U te2em lanu sa desne strane ove relacije imamo, tako#e, da je
= xe
. 1ko se
uzme samo
xe
i uvom izrazu zamijeni izraz za e, tada se ovaj izraz svodi na drugu normalnu
jednainu

=
*
X b X a XY
"dnosno, dobijamo da je
= xe
. )ako iz gornje relacije otpadaju drugi i tre2i lan sa desne
strane, pa dobijemo da je:

e y e
*
:amijenimo li na desnoj strani izraz za bX a Y e , tada dobijamo

XY b y a y e
* *
Na ovaj nain dobijen je brojitelj potkorijene veliine za standardnu greku regresije i slui za
odre#ivanje intervala varijacije statistikih ocjena dobijenih preko linije regresije.
$eliina standardne greke regresije izraava ve2u ili manju rasturenost taaka y oko
linije regresije te je, sa tim u vezi, pouzdanost predvi#anja, uz kori2enje yx
S
, ve2a ili manja.
Na njenu veliinu utie i veliina samog uzorka iz kojeg je raunata linija regresije.
1I;
! " # " $ ! " $ % #
4z prethodnog primjera dobijamo da je standardna greka regresije:
91> , = ;II* , =
J
=1II , ;
J
;J9 , *KE >=;I , *KJ
J
*J9 , *EK >=;I , >E *E;
J
1J*= 19*; , = >; & =EEK , 1 % *E;

yx
S
Standardna #re8ka re#resi"e $o4e se koristiti !riliko$ !ro$"ena zavisne veliine Y
kad nezavisna veliina X poraste ili se smanji. 5e statistike oc"ene su dosta krute i nedovoljno
pouzdane. 1ko elimo da ispitamo promjenu Y kad se X promijeni, tada moe da se koristi ranije
kori2eno pravilo
;
tj . yx
S ;
kao interval procjene traene vrijednosti Y. Lto se interval iri,
tada je ve2a vjerovatno2a da 2emo tanije procijeniti vrijednost Y. :a odre#ivanje intervala
procjene %povjerenja& za zavisno promjenljivu, koristimo tablicu povrina ispod normalne krive,
a moe se koristiti i $6distribucija, zavisno od veliine n.
1ko bi u prethodnom primjeru trebali da ispitamo kolika se tednja moe oekivati ako
dohodak poraste na J= uz prag znaajnosti =,=E, tada bi u na#enoj liniji regresije zamijenili
mjesto X njegovu vrijednost J= i dobili traeno y preko linje regresije, tj.
K*J1 , 11 KJ> , 1* =EEK , 1 J= 19*; , = =EEK , 1 19*; , = =EEK , 1
J=
+ + + x Y
"vako izraunata vrijednost za Y nam omogu2ava da aproksimativno odredimo i skiciramo
interval povjerenja za pravu vrijednost Y. 3ako je preko linije regresije procijenjena vrijednost
K*J1 , 11
& J= %
y
, to uz vjerovatno2u =,KE dobijamo da 2e se vrijednost zavisno promjenljive
kretati u intervalu:
;>;KJ> , 1; E1**19 , 1=
>1EJJ> , 1 K*J1 , 11 >1EJJ> , 1 K*J1 , 11
91> , = ;=9 , * K*J1 , 11 91> , = ;=9 , * K*J1 , 11
N
*
& %
N *
& %

+
+
+

Y
Y
Y
S $ X Y S $ Y
yx k n yx k n c

/tandardna greka regresije se moe koristiti u predvi#anju raznih veliina, jer se polazi
od pretpostavke da su odstupanja od linije regresije sluajna i da je raspored ovih odstupanja
priblian normalnom rasporedu. )o je pretpostavka od koje se i polo.
1I>
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
11.1.+.1 ,egresioni model u ocjenjivanju i (redvi-anju
1. 3ako su ekonomske pojave podlone uticaju niza najrazliitijih faktora, to je
kori2enje regresionog modela mogu2e ako je parametar

%koeficijenat pravca& znaajno


razliit od nule i ako je sam koeficijenat determinacije visok. 3od izraavanja relacija izme#u
dvije varijable to je preko jednaine regresije potrebno odrediti jednu varijablu ako je druga ve2
poznata. )ako se dobija vjerovatna veliina druge pojave u tim konkretnim uslovima. 0e#utim,
ni"e do&ro koristiti relaci"e iz$e%u vari"a&li nekritiki i $ehaniki, ve' dovoditi u vezu
vari"a&le tako da one izra4ava"u neku realnost) a !rihvatl"ivost n"ihove veze koristiti za
definisan"e ekono$skih relaci"a(
*. /vaka ocjena, bazirana na liniji regresije, je aproksimatvna. Ukoliko su promenljive u
vr2oj vezi, utoliko 2e ocjena biti vjerodostojnija. 5oto iz regresionog modela proizilazi da za
svako X postoji grupa mogu2ih vrijednosti Y, raspore#enih po normalnom rasporedu, a da
aritmetike sredine tih normalnih krivih lee na regresivnoj pravoj, slijedi da je:
o o
X x Y E + & %
)ako za datu vrijednost
o
x
moe da se odre#uje interval !ov"eren"a %confidence interval& za
pravu sredinuY , tj
& %Y E
. 5o "e "edinstvena vri"ednost ko"a le4i na "edinstveno" lini"i
re#resi"e
+ + X Y
) a oko n"e se ras!ore%u"u $o#u'e n"ene oc"ene) ko"e u se&e
ukl"uu"u #re8ke nastale kod ocjenjivanja parametara

, preko linija regresije iz uzoraka


%sl. 84.K.&
)o variranje ocjena oko linije regresije
upu2uje na potrebu ocjenjivanja intervala
povjerenja za pravu vrijednost
+ & + % B

za dato
o
x
. 4li,
Y x Y E Y
x x Y E Y
b E X a E x Y E Y
bX a E x Y E Y
o
o o
o o
o o

+
+
+
& %
O
& %
O
& % & % & %
O
& % & %
O

2o8to oc"ene a za

a . za

varira"u oko !ravih vri"ednosti %prave2i normalne


rasporede gdje su

simetrale tih rasporeda&, a te ocjene nijesu u korelaciji, tada varijansa


ocjene sredine moe da se napie kao zbir varijansi ocjena a i b, pa dobijamo:
@
1
A
var var
*
*
*
*
*
*
*
*

+
+
+
x
x
n
S
x
S
x
n
S
b x a Var
yx
yx yx
o
gdje je
& % X x x
o

a
*
yx
S
jednako varijansi standardne greke regresije
;. Na osnovu ovog izraza dobijamo yx
S
O
, standardnu #re8ku oc"ene !rave sredine
zavisne promjenljive Y, koja u razvijenom obliku glasi:
1IE
! " # " $ ! " $ % #
*
*
*
*
*
& % 1
& %
& % 1
O
x n x
x x
n
S
x x
x x
n
S S
o
yx
o
yx yx

5omo2u nje dobijamo interval povjerenja za pravu sredinu Y , kao


yx k n yx k n
S $ Y Y S $ Y
O O O O
*
& %
*
& %
+


4z primjera %84.1&, ako je prihod
;=
o
x
, ima2emo:
J1;1 , ;
;= 19*; , = =EEK , 1 19*; , = =EEK , 1
& ;= %
& %

+ +
Y
x Y
o x
o
kao mogu2a ocjena prave aritmetike sredine Y .
3ori2enjem ovih veliina dobijamo interval !ov"eren"a na pravu vrijednost Y , uz
vjerovatno2u =,KE, iz relacija:
*9JK*I , > ;EI*;I , ;
1KI9I , = ;=9 , * J1;1 , ; 1KI9I , = ;=9 , * J1;1 , ;
1KI9I , = J1;1 , ; 1KI9I , = J1;1 , ;
O O O O
*
& %
*
& %
*
& %
*
& %

+
+
+


Y
Y
$ Y $
S $ Y Y S $ Y
k n k n
yx k n yx k n


/a vjerovatno2om =,KE konstatujemo da 2e se prosjena tednnja6prava sredina, %za
prihod od
;=
o
x
& na2i u intervalu ;,;EI*J; do >,*9JK*I.
>. ;irina intervala !ov"eren"a zavisi od vi8e faktora a prije svega od veliine
standardne greke regresije yx
S
, kao apsolutne mjere varijabiliteta, to se prenosi i na
standardnu greku ocjene intervala povjerenja yx
S
O
. 5ove2anje veliine uzorka n smanjuje
standardnu greku intervala povjerenja. Lto se vrijednosti
i
x
vie udaljavaju od x , interval
povjerenja za te se vrijednosti iri, a to smanjuje kvalitet predvi#anja za one vrijednosti
i
x
koje
su udaljenije od aritmetike sredine promjenljive X.
1ko bi se opisani postupak proveo za razliite vrijednosti
i
x
, pa se pojedinano
izraunate vrijednosti granica intervala povjerenja ucrtavale sa obje strane ve2 ucrtane linije
regresije, dobio bi se interval oko te linije koji ne bi bio paralelan i simetrian sa linijom
regresije. )o bi bila zona !ov"eren"a za sredinu !ro$"enl"ive / koja bi vie liila na #rane
hi!re&ole( 1li, sa odre#enim rizikom bi mogli potvrditi da se prava sredina Y , za svako
i
x

nalazi u toj zoni. Dakle, ako se
i
x
vie udaljava od x , sa jedne i druge strane, tada se granice
tog intervala povjerenja za Y ire. :a vrijednosti x, udaljenije od x , granice intervala
povjerenja postaju manje precizne %sl. 84.1=.&.
Interval !redvi%an"a !o"edinanih vri"ednosti /. 0nogo vaniji problem je
predvi#anje individualnih vrijednosti za Y nego to je samo odre#ivanje intervala povjerenja za
sredinu Y tj.
& %
o
x Y E
. )aj interval za predvi#anje individualnih vrijednosti se zove
intervalo$ !redvi%an"a <!rediction interval9( "dre#ivanje intervala povjerenja
& %
o
x Y E
,
gdje je srednja vrijednost konstanta, je sa manje neizvjesnosti od intervala kojim se predvi#a
variranje individualnih vrijednosti Y. Otuda "e lo#ino da "e interval !redvi%an"a
i
y
8iri od
intervala !ov"eren"a za sredn"u vri"ednost. )ako se manifestuje sloenost problema koji su
obuhva2eni ovom procedurom.
E. !anijoj varijansi, potrebnoj za raunanje srednje vrijednosti za mogu2e vrijednosti Y,
dodaje se pripadaju2a varijansa za individualnu opservaciju Y. 4li,
1I9
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
@
& % 1
1 A
& % 1
A
* *
*
* *
* *
*
*
x n x
x x
n
S S
x n x
x x
n
S
o
yx yx
o
yx

+ + +

+

pa je standardna #re8ka !redvi%an"a individualne vri"ednosti /:
* *
*
N
& % 1
1
x n x
x x
n
S S
o
yx yx

+ +

Ne samo to je ova varijansa ve2a za jedinicu u podkorjenoj veliini, nego to i interval


!redvi%an"a individualne vri"ednosti / &iva 8iri od ranijeg intervala povjerenja za srednju
vrijednost %sl. 84.1=.&.
1.
Slika XI(*=
4nterval za predvi#anje individualne vrijednosti
N
Y
%za iste poetne uslove
;=
o
x
& bi2e:
N *
& %
N N *
& %
O O
yx k n yx k n
S $ Y Y S $ Y +


5oto je
J1;1 , ;
O
Y
, standardna greka predvi#anja individualne vrijednosti Y bi2e:
9>E=;* , =
1=JK 1= ;9= , 1;
& ;; ;= %
1=
1
1 91> , =
& % 1
1
*
* *
*
N

+ +

+ +

x n x
x x
n
S S
o
yx yx
/lijedi interval predvi#anja:
;==E>> , E ;*E9E9 , *
9>E=;* , = ;=9 , * J1;1 , ; 9>E=;* , = ;=9 , * J1;1 , ;
9>E=;* , = J1;1 , ; 9>E=;* , = J1;1 , ;
N
N
=*E , =
& J %
N =*E , =
& J %

+
+
Y
Y
$ Y $
1II
! " # " $ ! " $ % #
/a vjerovatno2om od =,KE moe se oekivati da 2e pojedninano doma2instvo, za ;= x
ostvariti tednju u intervalu od *,;*E9E9 do E,;==E>> jedinice. "vaj interval je znatno iri od
prethodnog jer individualne vrijednosti imaju izraen varijabilitet , uslovljen nizom faktora.
9. $ano je uoiti razliku izme#u dva tipa predvi#anja: !rvi, kad predvi#amo interval za
srednju vrijednost Y za dato
o
x
, i dru#i, kad predvi#amo pojedninano Y za dato
o
x
.
5ostupak predvi#anja je u principu isti ali se standardne greke razlikuju. /tandardna greka za
predvi#anje individualnih vrijednosti Y za
o
x
je
N
yx
S
ve2a od standardne greke za predvi#anje
intervala povjerenja za aritmetiku sredinu Y .
I. 1ko se izraunavaju bilo interval za sredinu Y, bilo interval za neku individualnu
vrijednost Y za dato x, vano je znati da li je
o
x
iz intervala
1
x
do
n
x
. Utvr#ivanje intervala
povjerenja za srednju vrijednost Y a za bilo koju vrijednost x od
1
x
do
n
x
%bez obzira da li je
ona ranije identifikovana u paru sa Y&, zove se !roceso$ inter!olaci"e. Lto su vrijednosti
i
x
iz
tog intervala blie aritmetikoj sredini x , interval 2e biti ui i pouzdaniji. 0e#utim, ako je
vrijednost
o
x
van intervala %
1
x
do
n
x
&, sa bilo koje strane, proces raunanja
& %Y E
ili Y za
dato x, se zove !roceso$ ekstra!olaci"e(
0etodolo8ki se to $o4e izvesti ali treba biti vrlo obazriv, !o#otovo ako "e konkretno x
udal"eno od sredine x ( 0ora se znati karakter regresione veze i van intervala %
1
x
do
n
x
&, s
obzirom da postoji rastu2i rizik greke to se
o
x
vie udaljava od x , kao srednje vrijednosti.
"tuda je jasno da ekstrapolacija donosi znaajan rizik u matematikom i praktinom smislu. U
matematikom smislu veliina greke se uve2ava to se udaljavamo od x , jer pretpostavke
modela to potvr#uju kad interval predvi#anja postaje sve iri.
U praktinom smislu treba uoiti da $ate$atiki $odel ni"e a!solutno taan i da "e on
korisna a!roksi$aci"a re#resione veze iz$e%u !os$atrani !o"ava. No, kako na ekonomske
pojave utie niz faktora koje je teko predvidjeti, onda utvr#ena stohastika veza izme#u pojava
moe da HskreneH sa ranije utvr#ene putanje, pod dejstvom raznih faktora %sl.84. 11&.
Slika XI(**
:ato, ako se primijeni linearni model za neku vrijednost, udaljenu od intervala %
n
x x ,
1
& i
izvri ekstrapolacija, tada rezultati takve prognoze postaju besmisleni !a "e nu4no !rilaziti
ekstra!olaci"i o!rezno i uz !rethodnu analizu veze iz$e%u !o"ava kako &i !ri$"ena
$odela &ila korektna i korisna(
1IJ
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
11-1.0. !tatistiko testiranje (arametara

1. 1ko je X nezavisna varijabila i ako uzimamo iz jednog skupa uzorke od n jedinica, kad
bi ocijenili pojedinano linije regresije na osnovu podataka iz pojedinih uzoraka, tada 2e ocjene
vrijednosti pravih parametara

varirati od uzoraka do uzoraka. Naime, ocjene parametara


HaH i HbH, dobijene metodom najmanjih kvadrata, tako#e 2e varirati od uzorka do uzorka.
3ako su za ekonomska i druga istraivanja vana oba parametra, i parametar a kao
koefici"enat !res"eka i naroito parametar . kao koefici"enat !ravca, potrebno je na2i
standardne greke raspore#ivanja ovih ocjena oko prave vrijednosti parametra

, jer su
ocjene a i b njihove nepristrasne ocjene.
/tandardne greke parametara a i b %uzete su bez dokazivanja& imaju oblik:

* *
* *
& %
& %
& %
i
i
yx
a
x x n
x S
S

* *
*
& %
& % x x n
nS
S
yx
b
i one se obino upisuju ispod parametara linije regresije, u zagradama.
*. 3ao to se vidi iz obrasca, da bi se dobile standardne greke parametara a i b, potrebno
je prethodno izraunati standardnu greku regresije. 3ako se predpostavlja da se greke
normalno rapore#uju, tada ocjene a i b prave, tako#e, normalan raspored sa odgovaraju2om
aritmetikom sredinom i varijansom. )a osobina raspore#ivanja ocjena parametara omogu2uje
nam da odredimo interval procjene parametara

. Naime, koriste2i izraze:


& %a
S
a
$

i
& %b
S
b
$

i $6distribuciju sa
& * % n
stepeni slobode, mi, uz odgovaraju2i rizik greke, odre#ujemo
intervale povjerenja za parametre

.
"vi intervali 2e biti:
& % & % a a
S $ a S $ a +
za koeficijent presjeka

& % & % b b
S $ b S $ b +
za koeficijent pravca

4z naeg zadatka o tednji i prihodu, imali smo liniju regresije


x y 19*; , = =EEK , 1 +
.
3oriste2i uslove tog zadatka dobili smo
;II* , =
*

yx
S
i
91> , =
yx
S
. /tandardne greke
pojedninih parametara a i b 2e biti:
=1 , = ===1 , =
I== *>
II* , ;
I== *>
;II* , = 1=
& %
>E1 , = *=>= , =
I== *>
;K* , =;K , E
;;= 1;;9= 1=
;9= , 1; ;II* , =
& %
& %
* *
*
& %
* * *
* *
& %

x x n
nS
S
x x n
x S
S
yx
b
yx
a
)ako sada imamo kompletnu jednainu regresije sa grekama parametara za a i b:
& =1 , = % & >E1 , = % & % & %
19*; , = =EEK , 1
b a
c
S S
x bx a y + +
"va jednaina nam pokazuje prosjean odnos slaganja prihoda porodice %X& i tednje kao
zavisno promjenljive %Y&. U ovoj jednaini parametar

, odnosno njegova ocjena


19*; , = b

1IK
! " # " $ ! " $ % #
predstavlja ekstra tednju, koja je rezultat pove2anja prihoda za jedninicu. Ustvari, to je
marginalno pove2anje tednje, koje je izazvano pove2anjem prihoda porodice. U ovom sluaju je
koeficijenat pravca %HprinosaH& ve2i od nule tako da kriva ima pozitivan nagib i ona pokazuje
rast, odnosno, koliko 2e tednja porasti ako se prihod porodice pove2a za jedinicu.
;. 1li, predpostavimo da ne postoji pove2anje tednje tj. da je
=
. )ada bi linija
regresije bila

c
y
i bila bi paralelna sa x6osom za svaku vrijednost nezavisne promjenljive X.
No, kako je u naem primjeru prametar

imao ocjenu
19*; , = b
i standardnu greku
=1 , =
b
S
, mi moemo testirati hi!otezu da "e
=
t"(
= :
o
%
nasu!rot
= :
1
%
) sa
odgovaraju2im rizikom greke. U tom sluaju 2emo prvo izraunati vrijednost promjenljive
*
& * %

n
$
za
& * % n
stepeni slobode preko izraza:
*; , 19
=1 , =
= 19*; , =
N

b
S
b
$

1ko izraunata vrijednost
N
$ prelazi teorijsku vrijednost
*
& * %

n
$
, tada se odbacuje hipoteza
= :
o
%
, a prihvata alternativna hipoteza
= :
1
%
. Utvrdi li se da je
=
, tada se
potvr#uje postojanje veze izme#u prihoda i tednje.
5oto je u naem sluaju
& =*E , = %
$
za J stepeni slobode %*,;=9=& mnogo manje od
izraunate $-19,*;, tj. izraunato
N
$ prelazi preko teorijskih granica, odbacujemo poetnu
hipotezu
= :
o
%
a prihvatamo alternativnu hipotezu
= :
1
%
. :nai, da se uz rizik greke
=,=*E moe tvrditi da tednja zavisi od prihoda i da 2e se pove2avati sa pove2anjem prihoda.
>. 3ad se uvjerimo da
=
, onda se moe uz istu vjerovatno2u odrediti interval
!ov"eren"a za !ara$etar

!reko n"e#ove oc"ene


19*; , = b
i standardne #re8ke
=1 , =
b
S
( Na taj nain mogu da se odrede granice povjerenja za marginalno pove2anje tednje,
uslovljeno pove2anjem dohotka. "tuda imamo da je:
1JE; , = 1;K; , =
=*; , = 19*; , = =*; , = 19*; , =
=1 , = ;=9= , * 19*; , = =1 , = ;=9= , * 19*; , =
& %
=*E , =
& * % & %
=*E , =
& * %

+
+
+

b n b n
S $ b S $ b
/lijedi da sa vjerovatno2om =,KE tvrdimo da je interval povjerenja za parametar

od =,1;K; do
=,1JE;. )o 2e re2i da 2e sa pove2anjem prihoda rasti i tednja tj. da 2e se imaoci dohotka
odluivati na to da dio sredstava odvoje za tednju.
11-2. %orelaciona analiza
1. U objanjavanju linearne regresije jedna pojava je bila obiljeena kao nezavisna, a
druga kao zavisna promjenljiva veliina. )u je jedna pojava u funkciji druge, ustvari, jedna
pojava je uzimana da objasni ponaanje druge pojave.
U razliitim ekonomskim i drugim analizama vrlo se esto koristi korelaciona analiza,
kad treba objasniti vezu izme#u posmatranih varijabli na poseban nain. 1ko ne moe da se
tano identifikuje nezavisna promjenljiva ili se ona i ne eli identifikovati, zbog toga to postoji
vrsto uzajamno dejstvo jedne pojave na drugu, tada se primjenjuje korelaciona analiza. 5reko
korelacione analize treba da se utvrdi i pokae kvantitativno sla#an"e varijacija posmatranih
pojava. 3orelaciona analiza treba da, preko odre#enih pokazatelja, izrazi vrstinu veze
posmatranih pojava tj. treba da se preko korelacione analize utvrdi mjera me#usobnog slaganja
datih pojava. 3orelaciona analiza vie daje sliku veze koja postoji izme#u pojava i vrstinu te
veze, nego to treba da izrazi prosjeno slaganje varijacija izme#u njih. 5rosjeno slaganje
1J=
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
varijacija se izraava regresionom analizom, mada i pokazatelji korelacione analize mogu da
poslue za odre#ivanje regresija X na Y i obrnuto Y na X.
1ko imamo na pr. narodni dohodak i izvoz kao dvije pojave, znamo da veliina izvoza
zavisi od porasta narodnog dohotka. No, isto tako i izvoz sa svoje strane utie na rast narodnog
dohotka, bilo direktno ili indirektno. )u bi moglo da se na#e !ros"eno sla#an"e izme#u
narodnog dohotka %X& i izvoza %Y&, ako ih tako obiljeimo. 1li, za ekonomske analize, za
ekonomsko ponaanje, je od izuzetne vanosti da se utvrdi korelaciona zavisnost izme#u
promjena u narodnom dohotku i promjena u izvozu.
*. Osnovu korelacione analize !redstavl"a u!ore%ivan"e neo&"a8n"eno# ili
o&"a8n"eno# vari"a&iliteta sa uku!ni$ vari"a&iliteto$ "edne od !os$atranih !o"ava. U
ovom upore#ivanju razliitih varijabiliteta nije vano da li je neka od pojava zavisna ili
nezavisna veliina ili ak uopte nije odre#ena njena funkcija. $arijabilitet pojava moe biti ve2i
ili manji, zavisno od vrstine veze izme#u pojava X i Y, za koje se predpostavlja da su sluajne
varijable. O&lik sla#an"a pojava na dijagramu rasturanja moe biti linearan ili krivolinijski, dok
veza izme#u pojava moe biti direktna ako sa porastom %ili padom& jedne pojave raste %ili pada&
druga i indirektna veza, kad porastu jedne pojave odgovara pad druge i obrnuto, padu jedne
odgovara porast druge pojave.
;. :a mjerenje linearne %proste& korelacije koriste se tri osnovna pokazatelja:
6 koefici"enat !roste korelaci"e)
6 koefici"enat deter$inaci"e)
6 koefici"enat ali"enaci"e
11-2.1. %oeficijenat (roste korelacije
Koefici"enat !roste korelaci"e je mjera koja pokazuje stepen slaganja izme#u dvije
pojave. On se kre'e u #ranica$a od >* do *( ;to "e koefici"enat korelaci"e &li4i #ranini$
vri"ednosti$a >* i *) tada "e korelaci"a iz$e%u !os$atranih !o"ava vr8'a. 3oeficijenat
korelacije je vrlo vana mjera kvantitativnog slaganja pojava i zato mu treba posvetiti potrebnu
panju.
5ostoji vie metoda izraunavanja koeficijenata korelacije, ali se za praktine svrhe
koriste dva metoda i to:
6 $etod kovari"anse i
/ $etod iz ori#inalnih !odataka(
>. 0etod kovari"anse je dosta prost, ali da bi se izraunao koeficijenat korelacije

,
odnosno, njegova ocjena r, treba imati i varijanse pojedinih pojava X i Y i kovarijansu tih
pojava.
Kovari"ansa predstavlja prosjeno slaganje varijacija pojava X i Y . 1ko su X i Y
sluajne varijable, tada se kovarijansa definie kao oekivana vrijednost proizvoda odstupanja
pojedinih vrijednosti
i
X
i
i
Y
od njihovih aritmetikih sredina. 4li,
&@ &% A% & < % y y x x E Y X Cov
"vako izraunata kovarijansa se esto koristi za dobijanje koeficijenata korelacije %r&, kao mjere
slaganja izme#u pojava X i Y . Dalje imamo:
1J1
! " # " $ ! " $ % #
xy xy E
xy xy y x xy E
xy y E x x E y xy E
xy y x y x xy E xy Cov

+
+
+
& %
& %
& % & % & %
& % & %
?ri"ednost kovari"anse kod zavisnih) koreliranih veliina $o4e &iti !ozitivna ili
ne#ativna) 8to zavisi od s$"era veze iz$e%u !os$atranih !o"ava. 1li, kod nezavisnih
veliina vrijednost kovarijanse je jednaka nuli. )o proizilazi iz definicije kovarijanse %jer je
oekivana vrijednost proizvoda jednaka prizvodu oekivanih vrijednosti&, pa dobijamo:
= & % & % & % & % xy xy xy y E x E xy xy E xy Cov
1ko od varijabli X i Y dobijemo njihove standardizovane varijable, tj.
x
x x
x

N
i
y
y y
y

N
gdje su
x

i y

standardne devijacije pojava X i Y , dobijamo njihove oekivane vrijednosti


i varijanse, pojedinano.
4li,
= & %
1
& %
1
& %
1
& % & %
N

x x x x E x x E
x x
E x E
x x x x

= & %
1
& %
1
& %
1
& % & %
N

y y y y E y y E
y y
E y E
y y y y

$arijanse ovih standardizovanih varijabli su slede2e:
1
1
& %
1
& % & %
*
*
*
*
* N

x
x x x
x x E
x x
E x Var

1
1
& %
1
& % & %
*
*
*
*
* N

y
y y y
y y E
y y
E y Var

"vo potvr#uje da su
N
x i
N
y standardizovane veliine i da njihova kovarijansa ima oblik:

&@ % & A%
1
@ A & % & %
N N N N
y y x x E
y y x x
E y x E y x Cov
y x y x

5oto su X i Y zavisne veliine, tada je kovarijansa
= & , % y x Cov
, pa dobijamo da je:
y x
xy Cov
y x Cov

& %
& %
N N
gdje se kovarijansa moe dobiti po obrascu y x
N
xy
xy Cov

& % .
4zraz koji smo dobili kao vrijednost kovarijanse standardizovanih veliina
N
x i
N
y zove
se koefici"ento$ !roste korelaci"e, pa dobijamo da je:
y x
xy
xy Cov

& %
1J*
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
4li, da bi dobili ocjenu koeficijenta korelacije treba izraunati kovarijansu
& %xy Cov
i podijeliti
je proizvodom standardnih devijacija pojava X i Y , kao pojava izme#u kojih mjerimo stepen
korelacione zavisnosti.
3ao to se vidi, vrijednost koeficijenta korelacije zavisi od predznaka kovarijanse
& %xy Cov
. Ako "e
1
xy

) tada !osto"i !erfektna !ozitivna korelaci"a) ustvari)


funkcionalna veza. "brnuto je za
1
. 1ko je
= & % xy Cov
tada je normalno
=
, a to
pokazuje da izme#u pojava ne postoji nikakva korelaciona zavisnost. )ada se za pojavu X i Y
moe re2i da nisu korelirane ili da izme#u njih ne postoji linearne veze.
E. :a mnoge praktine probleme je lake do2i do koeficijenta korelacije

iz originalnih
podataka. Ustvari, preko metoda najve2e vjerodostojnosti se moe pokazati da je najbolja ocjena
za

* * * * * *
& % & % & % & %
& &% %
y y n x x n
y x xy n
y y x x
y y x x
r
"va ocjena koeficijenta korelacije nazivamo koefici"ento$ !roste korelaci"e i taj postupak
2emo ilustrovati slede2im primjerom.
5r. 4spituju2i uspjeh studenata traena je veza sa uspjehom u srednjij koli. U tom cilju je
posmatrano I studenata iji je uspjeh u srednjoj koli i uspjeh na studijama iz nekoliko ispita dao
slede2e iznose bodova:
5a&ela/XI(+
!ed. broj
"stv. bod. u
sred. koli .
Podovi na
studijama ,
., .
*
,
*
1. *= J 19= >== 9>
*. *J 1* ;;9 IJ> 1>>
;. ;E *= I== 1.**E >==
>. ;J *> K1* 1.>>> EI9
E. >= *E 1.=== 1.9== 9*E
9. >E ;= 1.;E= *.=*E K==
I. E= ;E 1.IE= *.E== 1.**E
*E9 1E> 9.*=J K.KIJ ;.K;>
4spitati da li izme#u ovih pojava postoji kavantitativno slaganje i ako postoji ispitati koliko ono
iznosi:
KK , =
11K , J*
I , J1
J; , J * , K
I , J1 & %
J; , J IJ >J> E9*
* , K J> , JE E9 , ;;K . 1 > , >*E . 1
I , J1 * , J=E K , JJ9 ** 9 , ;9
I
*=J . 9
*
*
*
*

y x
xy
y
x
xy Cov
r
y
N
y
x
N
x
xy
N
xy
Cov

1J;
& 'e$o(
! " # " $ ! " $ % #
KK , =
9I , =EJ . >
=;* . >
J*= . >I* . 19
=;* . >
J** . ; ;1= . >
>*> . ;K ;E9 . >;
1E> ;K;> I *E9 KKIJ I
1E> *E9 9*=J I
& % & %
* *
* * * *



y y n x x n
y x xy n
r
xy
3ao to se vidi, izme#u uspjeha na studijama i uspjeha u srednjoj koli postoji visok stepen
slaganja, jer je koeficijent korelacije vrlo visok.
5r. *. )rokovi reklame i ostvareni promet jedne robe kretali su se ovako.
5a&ela/XI(,
!ed. broj
)rokovi
reklame .
5romet , ., .
*
,
*
1. *,1 I,= 1>,I= >,>1 >K,==
*. 1,J E,= K,== ;,*> *E,==
;. ;,; J,= *9,>= 1=,JK 9>,==
>. ;,9 K,= ;*,>= 1*,K9 J1,==
E. *,E 1=,= *E,== 9,*E 1==,==
9. ;,= 1;,= ;K,== K,== 19K,==
I. *,9 11,> *K,9> 9,I9 1*K,K9
1J,K 9;,> 1I9,1> E;,E1 91I,K9
a& Nacrtati dijagram rasturanja,
b& Na2i liniju regresije i ucrtati je na dijagramu rasturanja,
c& 3oliki se promet moe oekivati ako trokovi reklame porastu na E, ako je rizik greke
=,=E,
d& Na2i koeficijent korelacije.
1J>
&& 'e$o(
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
Slika XI(@
b&
bx a y +
*
;9 , 1I
I* , ;>
*1 , ;EI EI , ;I>
*9 , 1KJ . 1 KJ , *;* . 1
K* , 1J E1 , IE;
> , 9; K , 1J 1> , 1I9 I
& %
* *



x x n
y x xy n
b
x y
x b y a
c
* 9EI , ;
9EI , ; > , E =EI , K *I * =EI , K
+

c&
9EI , 1; E * 9EI , ;
& E %
+ Y
I;* , * I9E> , 9
E
J*9* , ;;
E
*J , ;E* JE;1 , *;1 K9 , 91I
E
1> , 1I9 * > , 9; 9EI , ; K9 , 91I
*
*


n
xy b x a y
S
yx
=1* , 1K ;=* , J
;EE , E 9EI , 1; ;EE , E 9EI , 1;
I;* , * K9 , 1 9EI , 1; I;* , * K9 , 1 9EI , 1;
N
N
N
N

+
+
+
Y
Y
Y
#S Y Y #S Y
yx c yx c
d&
>I9 , =
1JJI , 1
I=K , = & %

y x
xy
xy Cov
r

I=K , = >EI , *> 19; , *E
=EI , K I , *
I
1> , 1I9
& %



y x
n
xy
xy Cov
E=* , * *E1 , 9 =* , J* *J , JJ =EI , K
I
K9 , 91I
EKE , = ;E> , = *K , I 9>> , I I , *
I
E1 , E;
*
* *
*



y
x
x
n
x

9. 1ko su
N
X
i
N
Y
standardizovane veliine, postavlja se pitanje emu je jednak kvadrat
razlike izme#u ovih veliina, odnosno, oekivana vrijednost te razlike. 3ada bi se pojave X i Y
!ot!uno sla#ale, tada bi oekivana vrijednost kvadrata razlike ovih veliina trebala biti jednaka
nuli. 4li,
= Q R
*

y x
y y x x
E

Daljim razvijanjem ovog izraza dobijamo:
1JE
! " # " $ ! " $ % #
1 * *
= 1 * 1
=
& %
*
=
& % & &% %
*
& %
Q & % & % & % * & R%
*
*
*
*
*
*
*
* *

+
+

xy xy
xy
x
y
y x
x
x
y
y x
x
y y x x
xy Cov
y y E y y x x E x x E
y y y y x x x x
E


)o je sluaj perfektne korelacione zavisnosti, to je u skladu sa ranijim tvrdnjama da 2e
koeficijenat korelacije biti jednak jedinici kad izme#u pojava postoji funkcionana zavisnost. 1li,
ako je gornji izraz ve2i ili manji od nule, tada se dobijaju granice u kojima se kre2e koeficijenat
korelacije.
I. Koefici"enat korelaci"e $o4e da se iskoristi za raunan"e lini"a re#resi"e. )o je
mogu2e uraditi preko izraza za kovarijansu i izraunatih standardnih devijacija posmatranih
pojava X i Y. "tuda dobijamo da je:
& % & % x x r y y
x
y
xy

kad se regresira y na x
& % & % y y r x x
y
x
xy

kad se regresira x na y
U naem prvom zadatku smo imali da je
** < 9 , ;9 < J; , J < * , K < KK , = y x r
y x xy

, pa 2e "ednaine re#resionih !ravih &iti:
a&
& % & % x x r y y
x
y
xy

b&
& % & % y y r x x
y
x
xy

& 9 , ;9 %
* , K
J; , J
KK , = ** x y & ** %
J; , J
* , K
KK , = 9 , ;9 y x
III; , ;> KE=* , = ** x y IJ , *1 =;1 , 1 9 , ;9 y x
x y KE=* , = III; , 1* + y x =;1 , 1 J* , 1> +
5oto je
*
& %
x
xy Cov


a
y x
xy
xy Cov

& %
, iz ega je y x xy
xy Cov & %
, to zamjenom u


dobijamo da je
x
y
xy


odnosno regresiona jednaina moe da se napie kao
& % & % x x y y
1J9
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
11.2.2. %oeficijenat korelacije iz gru(isani1 (odataka
*( Koefici"enat korelaci"e iz #ru!isanih !odataka. 1ko u serijama koje posmatramo
imamo veliki broj podataka onda je potrebno te podatke grupisati i od njih stvoriti odre#ene
grupne intervale. )ako se postupak raunanja koeficijenta korelacije u mnogome
pojednostavljuje iako prividno izgleda da je tee dobiti kovarijansu i varijanse pojedinih serija
podataka pojava 8 i +. )o dolazi oduda to se u raunanju ovih veliina pojavljuju frekvencije.
!adi ilustracije ovog postupka, pretpostavimo da je kod 1== uenika raspored teina i
visina bio slede2i:
5a&ela/XI(-(
E;6EE EE6EI EI6EK EK691 9169; 9;69E 9E69I 9I69K 9K6I1 f
.
1E*,E61EI,E * 1 ;
1EI,E619*,E 1 * * 1 9
19*,E619I,E 1 ; E * 11
19I,E61I*,E 1 9 J 1* I 1 ;E
1I*,E61II,E 1 > I E * 1 *=
1II,E61J*,E 1 * E E * * 1 1J
1J*,E61JI,E * * 1 * 6
f
,
; E 1; *= *9 1K I > ; 1==
Da bi lake doli do kovarijanse i varijanse, odnosno, standardnih devijacija ovih
pojava, uvodimo umjesto 8 i + novo, transformisano obiljeje oblika:
l
Y Y
V
l
X X
)
o o

gdje su U i $ nova obiljeja, a


o
Y i X
=
su neka proizvoljno uzete vrijednosti iz serije 8 i +, a l
je duina klasnog intervala. Uzevi nove vrijednosti U i $ nije teko dokazati da su standardne
devijacije pojava 8i + i kovarijansa slede2eg oblika:
u x
l
v y
l
*

1
]
1



)V V ) f
N
l l C
j i ij xy
1
* 1
:a dalji rad je potrebno na2i intervale sredine kod pojedinih intervala u seriji, a zatim
obiljeja U i $. )o je prikazano u narednoj radnoj tabeli.
1JI
! " # " $ ! " $ % #
5a&ela/XI(.
E> E9 EJ 9= 9* 9> 99 9J I= f%.& U fU fU
*
f
ij
U
i
$
i
S 6
1EE * 1 ; 6; 6K *I ;;
19= 1 * * 1 9 6* 61* *> ;=
19E 1 ; E * 11 61 611 11 1>
1I= 1 9 J 1* I 1 ;E = = = =
1IE 1 > I E * 1 *= 1 *= *= 1* 9
1J= 1 * E E * * 1 1J * ;9 I* ;J J
1JE * * 1 * I ; *1 9; E1
f
v
; E 1; *= *9 1K I > ; 1== >E *1I 1IJ 1>
$ 6> 6; 6* 61 = 1 * ; >
f$ 61* 61E 6T 6*= = T 1> ;* 1J 619
f$
*
>J >E E* *= 6 1K *J ;9 >J *K9 f
ij
U
i
$
i
-1IJ.1>-19>
"vdje je neto sloenije prona2i f ij U
i
$ j , jer treba uzeti u obzir frekvencije f ij . !adi
upro2avanja su odre#ene vrijednosti za
o
X
-9* u seriji teina i
o
Y
-1I=, sa vrijednostima $
i

da bi te pojedinane proizvode mnoili sa U
i
. :avisno od predznaka, suma ovih pojedinih
proizvoda je upisana u odgovaraju2u kolonu %S& i %6& kod f ij U
i
$ j . )ako za prvi red imamo
*U%6>& U%6;& S1 U%6;& U%6;& - ;; i tu smo vrijednost upisali u koloni %S& kod f ij U
i
$ j . Dalje, za
drugi red slijedi 1 U%6>& U%6*& S* U%6;& U%6*& S* U%6*& U%6*& S1%61& U%6*& - ;=, i tako redom. 5ostupak
raunanja kovarijanse i pojedinih standardnih devijacija
u

i
v

ilustrova2emo u narednom
postupku.
> , 1 K9IE , 1 *=*E , = 1I , * >E , =
1==
*1I
*
*
*


u
n
fu
u

( ) I1; , 1 K;>> , * =*E9 , = K , * 19 , =


1==
*K9
*
*
*


v
n
fv
v

( ) I1* , 1 =I* , = 9> , 1 19 , = >E , =


1==
19> 1
+

v u fuv
N
C
uv
I1> , =
;KJ* , *
I1* , 1
I1; , 1 > , 1
I1* , 1


xy uv
r r
/lino bi bilo ako bi traili proizvode f ij U
i
mnoene sa pojedinim vrijednostima $
i
. 4 tada bi, kao sumu f ij U$ dobili 19>.
4stu vrijednost koeficijenta korelacije bi dobili preko izraza:
y x
xy
xy
C
r


gdje su kovarijansa i standardne devijacije
x

i y

raunate po slede2im obrazcima:


*
*
1
u
N
u f
l
i
x


1
1
]
1



v u
v u f
l l C
j i ij
xy * 1

1JJ
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
*
*
*
v
N
v f
l
i
y

)ako dobijamo:
[ ] 1* , 1I I1* , 1 1= =I* , = 9> , 1 1=
1==
19
1==
>E
1==
19>
* E +
1
]
1



xy
C

,
_




*
*
*
i
.
1==
19
1==
*K9
* v
N
v f
*
>*9 , ; I1; , 1 * K;>> , * * =*E9 , = K9 , * *

,
_



*
*
*
1==
>E
1==
*1I
E E u
N
u f
i
y

I > , 1 E K9IE , 1 E *=*E , = 1I , * E


Uvrstimo li ove vrijednosti u obrazce za xy
r
dobi2emo:
I1> , =
KJ* , *;
1* , 1I
>*9 , ; = , I
1* , 1I

y x
xy
xy
C
r

3oriste2i izraunatu vrijednost za koeficijenat korelacije
I1> , =
xy
r
moemo izvriti
aproksimacije linija regresije za pojave 8 i +. "ne se raunaju po slede2em postupku:
( ) ( ) y y r x x
y
x
xy


( ) ( ) x x r y y
x
y
xy

( ) 9J , 91
>*9 , ;
I
I1> , = *E , 1I* x y

( ) ( ) *E , 1I*
I
>*9 , ;
I1> , = 9J , 91 y x

( ) 9J , 91 >EJJ , 1 *E , 1I* x y *=1> , 9= ;>KE , = 9J , 91 y x
*I1* , J* >EJJ , 1 + x y >IJ9 , 1 ;>KE , = + y x
*. 3ako se + ocjenjuje uz date vrijednosti 8 i dobijamo liniju regresije +-aSb8, a 8
ocjenjuje uz date vrijednosti +, pa dobijamo 8-aSb+, one 2e praviti manji ugao i to utoliko
manji ukoliko je korelacija jaa. 1ko je prisutan funkcionalan odnos izme#u sluajnih
promjenljivih, onda 2e linije 8 i + biti jednake tj. poklapa2e se za razliku od sluaja kad nema
korelacije i kad su te pojave normalne jedna na drugu. U prvom sluaju je
1
xy
r
, a u drugom,
graninom, sluaju je
=
xy
r
. 3od funkcionalnog odnosa ne postoji neo&"a8n"eno# varijabiliteta
pojave, jer je ukupan varijabilitet izjednaen sa objanjenim varijabilitetom i kod 8 i kod +.
Ustvari, varijansa objanjenog varijabiliteta
( )
n
y y
c

*
je jednaka sa varijansom koja
oznaava ukupan varijabilitet
( )
N
y y


*
. )akav je sluaj i sa varijansama objanjenog i
neobjanjenog varijabiliteta kod pojave 8, tj.
( )
N
x x
c

*
( )
N
x x

*
. /lijedi da 2e kolinici
objanjenog i ukupnog varijabiliteta pojava 8 i + biti jednaki jedinici, tj.
1JK
! " # " $ ! " $ % #
( )
( )
1
*
*

x x
x x
c
i
( )
( )
1
*
*

y y
y y
c
;. No, za statistika istraivanja su od velike vanosti ba one krive koje koje pokazuju
prilino veliko slaganje i gdje se koeficijenat korelacije izme#u ekstremnih vrijednosti
( ) 1 1 r
. U tim sluajevima se pojavljuju i neobjanjeni i objanjeni varijabilitet pojava.
Neobjanjeni varijabilitet je utoliko ve2i ukoliko su krive udaljenije jedna od druge.
)ada se objanjeni varijabilitet u odnosu na ukupni smanjuje kad 1 t r , tei
ekstremnim vrijednostima. Odnos iz$e%u o&"a8n"eno# i uku!no# vari"a&iliteta zove$o
koefici"nto$ deter$inaci"e ( )
*
xy
r . !azmak izme#u regresionih linija nam pokazuje koliko je
od ukupnog varijabiliteta objanjeno tom korelacionom vezom izme#u pojava 8 i +. ?ri"ednost
koefici"enta deter$inaci"e se kre'e od nule do "edinice ( ) 1 =
*

xy
r . /lijedi da je tom
korelacionom vezom objanjen ve2i dio ukupnog varijabiliteta ukoliko je
*
xy
r blii jedinici.
5raktino, toliko procenata od ukupnog varijabiliteta se objanjava djelovanjem faktora 8.
:apravo, koeficijenat determinacije izraava onaj procenat varijacije zavisne promjenljive +,
koji je objanjen uticajem nezavisnih veliina 8. $eliina ovog koeficijenat izraava znaaj
samih uzetih nezavisnih veliina i varijacije zavisne veliine + od njihovog ukupnog utucija.
11-2.&. %oeficijenat alijenacije
*( Koefici"enat nedeter$inaci"e predstavlja korijen odnosa izme#u neobjanjenog i ukupnog
varijabiliteta i kod jedne i kod druge pojave. "n ima slede2i oblik:
( )
( )

*
*
y y
y y
c
za pojavu + i
( )
( )

*
*
x x
x x
c
za pojavu 8
3ako je ranije navedeno, neobjanjeni dio varijabiliteta izraava kvadrat standardne
greke regresije ,.
*
/ , to se kofici"enat nedeter$inaci"e moe napisati u obliku odnosa:
*
*
y
yx
S

"vaj koeficijenat ima suprotno znaenje od koeficijenta determinacije to se moe izraziti


relacijom:
1
*
*
*
+
y
yx
xy
S
r

3ad je koeficijenat determinacije ve2i, tada je koeficijenat nedeterminacije manji, jer je tada ve2i
dio ukupnog varijabiliteta objanjen korelacionom vezom izm#u posmatranih pojava. 4z gornje
relacije se dobija koeficijenat determinacije
1K=
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
*
*
*
1
y
yx
xy
S
r


"vaj se koeficijenat moe inperpretirati kao procenat varijacija , koji je objanjen uticaj
nezavisne promjenljive . %ili niza nezavisnih promjenljivih .< koje se uzimaju u analizi&
$a#enjem kvadratnog korjena iz
*
xy
r dobijamo koeficijenat korelacije:
*
*
1
y
yx
xy
S
r


*. 1ko se na#e kvadratni kor"en iz koefici"enat nedeter$inaci"e do&i"a$o koefici"enat
ali"enaci"e k) ili7
*
*
y
yx
S
k

:bir koeficijenta korelacije %r& i koeficijenta alijenacije %k& nije nikad 1< sem ako je jedan od ovih
koeficijenata jednak jedinici:
k r + V1
1ko je r blizu jedinice, tada je korelaciona veza izme#u pojava jaka i obrnuto. Dobijemo li
koeficijenat korelacije iz koeficijenta determinacije ( )
*
r ,potrebno mu je odrediti !redznak
zavisno od !ara$etra %b& u regresionoj jednaini. 2ozitivno & da'e koefici"entu korelaci"e
!ozitivan !redznak i tako se izraziti direktna zavisnost iz$e%u !o"ava7 ako raste . tada raste
, i obrnuto: sa padom . opada i ,. Ako "e !ara$etar & ne#ativan) tada "e i koefici"enat r
ne#ativno# !redznaka) i$e se izra4ava indirektna zavisnost iz$e%u !o"ava: sa porastom .
opada , i obrnuto: sa padom . raste ,.
4z koeficijenta nedeterminacije
*
,
*
,.
*
/
k

slijedi da je
y
yx
S
k

odnosno
k S
y yx

< ili
*
1 r S
y yx
. )ako dobijamo da je:
y yx
k S
tj. standardna #re8ka re#resi"e "e "ednaka !roizvodu koefici"enta ali"enaci"e i standardne
devi"aci"e !ro$"enl"ive A(
11-2.+. "astiranje 1i(oteze o koeficijentu korelacije W
1. :a testiran"e hi!oteze o koefici"entu korelaci"e W, koristimo njegove ocjene
i
r

dobijene na osnovu uzorka. )a distribucija ocjena zavisi od veliine W i veliine uzorka, jer se
pretpostvlja da 8 i + prave dvovarijantni normalan raspored. "tuda se pretpostavlja da se ocjene
i
r
iz uzorka normalno raspore#uju ako prave vrijednosti W sa varijansom:
( )
*
1
*

n
r
r Var
*
1
*

n
Var

1K1
! " # " $ ! " $ % #
1ko pretpostavimo da je W - =, tada moemo testirati hipotezu
=
%
:W - =. )ada 2e ocjene iz
uzoraka o koeficijentu korelacije bite simetrine oko nule i sa odgovaraju2om varijansom, pa se
moe re2i da varijabila
*
1
*

n
r
r
$

ima t6raspored sa %n6*& stepeni slobode.
Da bi testirali hipotezu
=
%
: W -= nasuprot
1
%
: W V =, koristi2emo podatke iz naeg primjera o
uspjehu na studijama u zavisnoti od uspjeha u srednjoj koli koriste2i X -=,=E
I , I=
=1> , =
KK , =
===* , =
KK , =
E
=1 , =
KK , =
*
1
=
*

n
r
r
$
3ako su teorijske vrijednosti za E stepeni slobode uz X - =,=E Y *,EI=9, to odbacujemo
=
%
: W -=, a prihvatamo
1
%
: W V =."vim postupkom testiranja smo , ustvari, ispitivali
hipotezu o nezavisnosti promjenljivih 8 i + koje, kao dio nekog osnovnog skupa, imaju
koeficijenat linearne korelacije W - =. 4zraunata ocjena r treba da potvrdi ili odbaci hipotezu
zavisnosti od veliine izraunate vrijednosti za $ uz odgovaraju2i rizik greke.
*. 1li, varijabla $ se moe koristiti samo za testiranje hipoteze
=
%
: W - =. "na nije
pogodna za testiranje hipoteza kao na pr.
=
%
: W Z =,E ili neke druge hipoteze kao
=
%
:
W
1
- W
*
i sl.
3ada je W Z = tada distribucija ocjena
i
r
iz uzorka postaje asimetrino. Da bi se moglo
obaviti testiranje nultih hipoteza, 4. ?ier je traio rjeenje za ove probleme transformiu2i r u
novu varijabilu # koja je normalno raspore#ena. 5retpostavimo li da je W Z =, tada se moe re2i
da, ako je r transformisano u novu varijabilu # oblika:
*
1

r
#
log
r
r

+
1
1
tada nova varijabila ima normalan raspored sa sredinom koja predstavlja oekivanu vrijednost
B ( )
r
#
*
1


#
log

+
1
1
$arijansa ove varijabile
r
#
ima oblik:
( )
*
1
*


n
# V
r r

Dobivi varijabile
r
#
<
#
i
r

, moemo izvesti postupak testiranja o koeficijentu korelacije


koriste2i varijabilu:
r
r
# #
#

1K*
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
3ako smo u prethodnom primjeru dobili r - =,KK testiramo hipotezu o tome da je
=
%
: W - =,E
na suprot hipotezi
1
%
: W V = uz rizik greke X - =,=E. u ovom sluaju nam koriste tablice
normalne distribucije, ali prethodno treba izraunati vrijednosti
r
#
i
#
.
*
1

r
#
log
E , =
KK , = 1
KK , = 1

+
log
e

9>99E , * *K;;= , E E , = 1KK
*
1

#
log

+
E , = 1
E , = 1
E , =
log
e

E>K;=E , = =KJ91 , 1 E , = ;
E , = *E , =
>
1
;
1

n
r

4z ovih vrijednosti dobijamo da je:


1K>9K , >
E , =
=KI;>E , *
E , =
E>K;=E , = 9>99E , *

r
r
# #
#

5oto je dat rizik greke X -=,=E onda teorijsko z iznosi Y1,K9, to se dobija iz tablica normalne
distribucije. 3ako nae izraunato z prelazi teorijske granice %Y 1,K9&, odbacujemo
=
%
: W - =,E,
a prihatamo
1
%
: W V =,E.
Uvjerivi se da je W V =,E trebamo utvrditi interval povjerenja za z preko z
r
kada je X -
=,=E. 3ako je z
r
- *,9>99E dobijasmo da je interval povjerenja za
#
:
r r r r
# # # # #

*
1
*

+ < <
E , = K9 , 1 9>99E , * E , = K9 , 1 >99E , * + < < #
KJ , 9>99E , * KJ , = 9>99E , * + < < #
9*99E , ; 9999E , 1 < <#
Na ovaj nain dobili smo gornju i donju granicu za z, a iz tablice se moe dobiti
vrijednost koeficijenta korelacije za odgovaraju2e
#
. 4z tablice dobijamo za
#
-1,9999E da je
W - =,K;=E, a za
#
- ;,9* da je W - 1. )ako sa vjerovatno2om od =,KE moe da se tvrdi da je
prva vrijednost koeficijenta korelacije u granicama od =,K;=E do 1.
11-2.0. %orelacija ranga
$e2 je ranije istaknuto da linearna korelacija izraava vrstinu veze izme#u pojava, koje
pokazuju izvjestne pravilnosti u ponaanju jedna, zavisno od druge i da su i pojava 8 i pojava +
izraene brojano. "ne pojave se mogu i grafiki predstavljati na dijagramu rasturanja, a zatim je
mogu2e na tom dijagramu ucrtati prave.
& % & % y x r y y
x
y
xy

( ) ( ) y y r x x
y
xy

1li, postoje i takve pojave, koje se mogu iskazati brojano, ali ipak se uoavaju izvjesne
pravilnosti u ponaanju jedne pojave u zavisnosti od druge. Neke se pojave mogu izraziti sa mo
1K;
! " # " $ ! " $ % #
o!isano, pa se za analizu korelacionih veza izme#u takvih pojava, pojava koje se izraavaju
opisno, koristi korelacija ranga.
3ako i sam naziv govori, ovakve pojave treba tako izraziti da je uoljiv ran# veliina.
Naime, i jedna i druga serija podataka imaju iste vrijednosti, ali je njihov redosljed po rangu
razliit. )o znai da treba ran#irati i "ednu i dru#u seri"u !odataka, a zatim na2i razlike u
rangu. )e razlike u rangu 2e nam omogu2iti da izraunamo koeficijenat korelaicje ranga.
Uzimamo na pr. da utvrdimo vezu izme#u kvalifikacione strukture radnika i njihove
produktivnosti. Normalno bi bilo oekivati da 2e radna grupa koja ima bolju kvalifikacionu
strukturu %sa ve2im brojem kvalifikacionim i visokokvalifikacionih radnika &, dati ve2i broj
proizvoda od grupe koja ima loiju kvalifikacionu strukturu. Uinak svakako da zavisi od
umjenosti, boljeg kori2enja maina i sirovina i sl. )aj ostvareni uinak je lako izraunati
brojano, ali se javlja problem kako izraziti kvalifikacionu strukturu, a poznata je injenica da
ove pojave zavise jedne od druge. U ovom sluaju 2e trebati prvo izvriti rangiranje grupa po
kvalifikacionoj strukturi, tj. po ve2oj zastzupljenosti visokokvalifikovanih i kvalifikovanih
radnika. Uinak je lako mjeriti, i ovom sluaju je lako utvrditi rang po uinku. Nakon tako
utvr#enog ranga veliina 8 i + mogu2e je izraunati koeficijent korelacije ranga.
*. 1ko jedna od posmatranihpojava ima dvije ili vie jednakih vrijednosti, to bi im
davalo isti rang, tada, prilikom rangiranja, treba na2i srednju vrijednost ovih mjesta u rangu koja
treba popuniti tim jednakim veliinama. )ako na pr. ako imamo da traimo etvrto i peto mjesto
u rangu, a na tim mjestima imamo iste vrijednosti pojava, tada nalazimo prosjek
*
E > +
i objema
veliinama pridruujemo tu izraunatu srednju vrijednost >,E. Na taj nain bi suma u tom rangu
bila ista kod obje posmatrane pojave, a to treba obezbijediti, tj.
y x
. /lino bi bilo
kad bi imali tri ili vie istih numerikih veliina kojima odgovara isti rang, tj. prethodno bi
izraunali prosjek i pridruili ga u rangu onim veliinama koje bi imale isti rang.
;. 3oeficijenat korelacije ranga se moe izaunati na vie naina, ali se naje2e koristi
S!ear$an/ov o&razac kao najjednostavniji, a koji ima oblik:
( ) 1
9
1
*
*



N N
(

gdje je d razlika u rangovima izme#u korespondiraju2ih vrijednosti u serijama, a N je broj
parova podataka.
U dokazivanju ovog obrasca polazi se od jednakosti
y x
, a zatim se
izraunava
y x
, da bi se sve ove vrijednosti, kasnije, zamijenile u glavnom obrazcu za
raunanje koeficijenta korelacije iz originalnih podataka, odakle se dobija konaan obrazac.
5r. 4spituju2i vezu izme#u kvalifikacione strukture 1= grupa radnika i njihovog uinka, dobili
smo slede2e serije podataka iz kojih treba raunati koeficijenat korelacije ranga.
5a&ela/XI(1(
!ang po kval.
str. 8
Uinak %kom& + !ang po uinku !azlika u rangu %d& d
*
1 E== * 61 1
* E*= 1 1 1
; >J= > 61 1
> >K= ; 1 1
E >E= E = = =
9 >;= 9 = = =
I >== J 61 1
J >*= I 1 1
K ;K= K = = =
1K>
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
1= ;J= 1= = = =
9
( )
K9; , = =;I , = 1
KK=
;9
1
KK 1=
9 9
1
1
9
1
*
*



N N
(

3ao to smo vidjeli iz ranga po uinku, ne postoji potpuna podudarnost izme#u


kvalifikacione i strukture uinka. )ako je druga grupa, iako sa manjim brojem kvalifikovanih i
visokokvalifikovanih radnika imala ve2i uinak od prve grupe i sl. 4z ovih uslova smo dobili da
posotoji visoka korelaciona zavisnost izme#u kvalifikacione strukture i uinka.
3oeficijenat korelacije ranga ima isto znaenje kao i koeficijenat proste korelacije xy
r
,
jer i ovaj koeficijenat izraava istu mjeru slaganja izme#u pojava 8 i +.
4pak, koefici"enat korelaci"e ran#a da"e sa$o #ru&u $"eru korelacione zavisnosti
izme#u posmatranih pojava. 1li, ba zbog svoje jednostavnosti u izraunavanju, on se esto
koristi, jer, bez ve2ih teko2a , dobijamo dosta znaajne podatke o vezama izme#u posmatranih
pojava. :bog jednostavnosti raunskog postupka, koeficijenat korelacije ranga se moe koristiti i
za serije podataka koje su izraene brojano. 1li, prethodno treba izvriti rangiranje i jedne i
druge serije brojanih podataka. )ako od numerikih vrijdnosti dobijamo serije ranga, iz kojih se
vrlo jednostavno izraunava koeficijenat korelacije ranga. "vaj koeficijenat se koristi i u onim
sluajevima kada ne raspolaemo sa dovoljno velikim brojem podataka i u sluajevima kada u
seriji postoje ekstremne vrijednosti, pa ih, na ovaj nain, preko rangiranja moemo eliminisati tj.
ublaiti njihov uticaj na krajnji pokazatelj. 1 mogu2e je da ove ekstremne vrijednosti znaajno
utiu na iznos kvantitativnog slaganja me#u pojavama, tako da se ne dobijaju realni podaci.
"tuda koeficijenat korelacije ranga moe vrlo korisno da se iskoristi.
11-&. %rivolinijska regresija
1. 4spitivanjem raznih drutvenih ekonomskih pojava nailazi se na sluajeve gdje se
odnosima izme#u dvije pojave ne moe prilagoditi linearna funkcija 5reko linearne funkcije bi
dobili pogrene zakljuke o slaganju varijacija izme#u posmatranih pojava. Ni koeficijenat
korelacije kao mjera kvantitativnog slaganja varijacija izme#u posmatranih pojava, ne bi davao
tanu sliku o povezanosti ovih pojava, zbog toga to je ovaj koeficijenat proste korelacije
mogu2e primijeniti samo kod pojava izme#u kojih postoji linearna zavisnost. 0noge odnose
izme#u pojava bi daleko bolje izrazili neki tipovi krivolinijskih funkcija tj. funkcija vieg
stepena.
1ko se posmatra kretanje trokova po jedinici u zavisnosti od obima proizvodnje, oni
opadaju sa porastom obima proizvodnje. 1li, esto to opadanje moe da bude samo do jedne
granice odakle ponovo nastaje izvjestan porast. /lino je i sa kretanjem cijena i potronje neke
robe koja nije neophodna doma2instvu. Do odre#enog nivoa cijena, potronja takve robe moe
da opada uporedo sa porastom cijena, da bi, sa daljim porastom cijena te robe, dolo do naglog
pada potronje takve robe, i sl. U ovim sluajevima, pogreno bi bilo podacima prilagoditi
linearnu funkciju zato to ove odnose me#u navedenim pojavama mnogo bolje i tanije mogu da
izraze krive vieg stepena. :bog toga se u svim ovakvim sluajevima moe govoriti o
krivoliijskoj regresiji.
Da bi se opredijelili za odgovaraju2i oblik funkcije koji na"&ol"e od#ovara
!ros"eno$ sla#an"u vari"aci"a posmatranih pojava. 8 i +, podatke o ovim funkcijama treba
prethodno ucrtati na dijagramu rasturan"a. )akav dijagram i rasipanje podataka i jedne i druge
pojave bi nam omogu2io da se utvrdi veza izme#u ovih pojava i oblik te veze.
*. 3od prilago#avanja krive vieg stepena vezama izme#u posmatranih pojava, postavlja
se problem odre#ivanja parametara te krivolinijske regresije. Naime, potrebno je odrediti takve
1KE
! " # " $ ! " $ % #
vrijednosti parametara u krivolinijskoj regresiji da ova najbolje aproksimira prosjeno slaganje
varijacija pojave koju posmatramo.
Naje2e se za odre#ivanje vrijednosti parametara u krivolinijskoj regresiji koristi metod
najmanjih kvadrata. Na taj se nain dobija odgovaraju2a kriva linija od koje je suma kvadrata
odstupanja originalnih podataka najmanja, odnosno, manja nego to bi bila suma kvadrata
odstupanja od bilo koje druge linije, istog stepena, kojom bi aproksimirali vezu izme#u ovih
pojava. 5o metodi najmanjih kvadrata, za odre#eni oblik krive linije dobijaju se odgovaraju2e
nor$alne "ednaine iz kojih dobijamo parametre za traeni oblik krive.
5retpostavimo da je u pitanju kriva oblika:
*
cx bx a y + +
Njene parametre a, b i c bi dobili metodom najmanjih kvadrata, tj. traenjem ekstremnih
vrijednosti funkcije:
( ) ( )



n
i
n
i
c i
cx bx a y y y F
1 1
* *
4z ove sloene funkcije dobijamo sistem normalnih jednaina, traenjem parcijalnih izvoda po
parametrima [a\, [b\ i [c\, slijede2i pravila za traenje ekstremnih vrijednosti sloene funkcije.
Normalne jednaine za ovaj oblik krive imaju oblik:

+ +
*
x c x b a n y

+ +
; *
x c x b x a xy

+ +
> ; * *
x c x b x a y x
3od krive tre2eg stepena, oblika
; *
(x cx bx a y + + +
imali bi etiri normalne jednaine zato to se pojavljuju etiri parametra [a\, [b\, [c\ i [d\.
0etodom najmanjih kvadrata se dobijaju normalne jednaine i za sloenije oblike
funkcija.
1. 3od krivolinijske regresije drugogo ili vieg stepena, odstupanja originalnih podataka
od linije regresije, mjere se pomo2u standardne greke regresije. 1ko bi ta odstupanja bila
jednaka nuli, tada bi bio u pitanju funkcionalan odnos slaganja varijacija izme#u posmatranih
pojava. 1ko bi odstupanja originalnih podataka od izraunate krive linije bila velika ili ak
jednaka standardnoj devijacije zavisno promjenljive + tj. y yx
S
, tada ne postoji korelaciona
zavisnost izme#u promjenljivih 8 i +.
Standardna #re8ka krivolini"ske re#resi"e treba da izrazi odstupanja originalnih
podataka %
i
y
& od odgovaraju2ih vrijednosti regresije drugog ili vieg stepena. "na ima istu
ulogu kao i standardna greka linearne regresije. /tandardnu greku kod krivolinijske regresije
obino izraunavamo sa yx
S
, a ona se moe dobiti neposredno iz originalnih podataka. 5rilikom
izraunavanja standardne greke krivolinijske regresije mogu da se iskoriste ista svojstva kao
kod raunanja standardne greke kod linearne regresije. Naime, moemo po2i od toga da je:

= e
1K9
Univerzitet Crne Gore u Podgorici Ekonomski fakultet
gdje je ( ) ( )
*
cx bx a y Y Y e
c

= xe
"sim toga, kod krivolinijske regresije drugog stepena imamo da je:

=
*
e x
3ako je kod krivolinijske regresije
( )
*
cx bx a y e
to moemo ovaj izraz pomnoiti sa [e\ i sumirati. )ada dobijamo da je :

e x c xe b e a ye e
* *
3ako su poslednja tri izraza sa desne strane jednaka nuli, ima2emo da je od prethodnog izraza
ostalo
( )


* *
cx x b a y y ye e
"d ovog izraza, nakon naznaenog mnoenja i dijeljenja sa %n6k&, gdje je n broj podataka u seriji
a k broj parametara u regresiji, dobijamo obrazac za varijansu regresije drugog stepena:
k n
y x c xy b y a y
S
yx


* *
]
"davde je standardna greka krivolinijske regresije korijen iz varijanse regresije. 4li,
k n
y x c xy b y a y
S
yx


* *
]
*. :a mjerenje korelacione zavisnosti kod krivolinijske korelacije koristi se slian
obrazac kao kod linearne regresije. 3od lineatne povezanosti me#u posmatranim pojavama
mjeru te zavisnosti izraava koeficijent proste koreladije. 3od krivolinijske veze izme#u parova
vrijednosti 8 i +, pokazatelj korelacije se naziva indekso$ korelaci"e. 4ndeks korelacije W
dobijamo iz opteg obrazca
*
*
]
1
y
yx
S


gdje je
*
]
yx
S varijanse krivolinijske regresije, a
*
y

je varijansa zavisno6promjenljive %
i
y
& od
linije regresije, drugog ili vieg stepena %
c
y
&. "n je uvijek pozitivan i varira od nule do 1 za
razliku od koeficijenata proste korelacije koji, kao to je poznato varira od %61& do %1&, tj.
izraava pozitivan ili negativan odnos %smjer slaganja& za itav niz podataka. 4ndeks korelacije se
ne moje upotrijebiti za mjerenje pozitivnog ili negativnog slaganja varijacija i pored toga to
kod krivolinijske regresije odnos izme#u promjenljivih 8 i + moe biti dijelom pozitivan, a
dijelom negativan.
2ri$"er. Neka su pojave 8 i + imale slede2e podatke iz kojih treba izraunati regresiju
drugog stepena:
1KI
! " # " $ ! " $ % #
5a&ela/XI(1(
8 + 8+ 8
*
+
*
8
*
+ 8
;
8
>
+
c
> E= *== 19 *E== J== 9> *E9 E1,JJ*J
* ;= 9= > K== 1*= J 19 *K,9IE1
; ;E 1=E K 1**E ;1E *I J1 >=,;IK=
J 11= JJ= 9> 1*1== I=>= E1* >=K9 1=E,JK9
E
1* 1I= *=>= 1>> *JK== *>>J= 1I*J *=I;9 1I*,I=I
J
1 *E *E 1 9*E *E 1 1 1K,II=K
9 I= >*= ;9 >K== *E*= *19 1*K9 II,*K==
11 1E= 19E= 1*1 **E== 1J1E= 1;;1 1>9>1 1E>,J=E
*
K 1;E 1*1E J1 1J**E 1=K;E I*K 9E91 1*1,;KK
9
I K= 9;= >K J1== >>1= ;>; *>=1 K1,1JKJ
9; J9E I**E E*E KKKIE 9JIKE >KEK E==JE J9>,KK9
I
Na osnovu prethodne radne tabele dobili smo potrebne podatke za normalne jednaine iz
kojih 2emo raunati parametre krive drugog stepena. "ve jednaine su:
1= a S 9; b S E*E c - J9E
9; a S E*E b S >KEK c - I**E
E*Ea S >KEK b S E==JE c -9JIKE
3ori2enjem metode determinanti za rjeavanje ovih jednaina dobijene su vrijednosti
pojedinih drterminanti i to:
^ - (e$er*inan$a +i+$e*a ,1.EI9.J==
^
1
- (e$er*inan$a -ara*e$ra a - 19.J1K.*==
^
*
- (e$er*inan$a -ara*e$ar b - 1;.I*E.===
^
;
- (e$er*inan$a -ara*e$ra c - 9;=.9==
5reko ovih determinanti dobijene su vrijednosti pojedinih parametara i to:
a - 1=,9999I
b - J,I=>;>
c - =,;KKK*>
)raena kriva drugog stepena sada ima oblik:
+
c
- 1=,9999I S J,I=>;> 8 S =,;KKK*> 8
*
"d podataka iste radne tabele moemo dobiti standardnu greku ove krive, zamjenjuju2i u
obrazcu za standardnu greku odgovaraju2e vrijednosti. 4li:


k n
y x c xy b y a y
S
yx
* *
]
1KJ
Univerzitet Crne Gore u Podgorici Ekonomski fakultet

I
9JIKE KKK*> , ; , = I**E I=>;> , J J9E 999I , 1= KKKIE

I
II1EJ , E1* , *I JE9E , JJJ , 9* 99KEE , **9 K KIE KK
=;II , I JK1 , E* , >K
I
;>9
I
*KI9; , 9*J KK KIE KK

4ndeks korelacije 2e biti:



*E , E1E . *
E*JK1 , >K
1 1
*
*
]
y
yx
S

KK=11 , = KJ=;1 , = =1K9K , = 1


4z ovih podataka smo dobili da je indeks korelacije vrlo visok.
E. "sim ovog , do sada opisanog, najprostijeg sluaja krivolinijske regresije u rjeavanju
raznih praktinih i teorijskih ekonomskih i drugih problema koriste se sloeniji oblici krivih.
)akve bi bile razne proizvodne funkcije.
)akav jedan oblik krive bila bi proizvodna funkcija oblika:

. / ! 0
koja ima vrlo iroku primjenu u razmatranju raznih ekonomskih problema. )o bi bio oblik
poznate Fobb6Douglas (ove funkcije.
Da bi se dolo do vrijednosti parametara ove funkcije X i _, potrebno je izvriti
logaritamsku transformaciju ove funkcije, pa tek tada traiti vrijednosti njenih parametara.
1KK