You are on page 1of 28

Regresija i korelacija

Regresija i korelacija
Neke masovne pojave su meusobno povezane i uvjetovane
Cilj istraivanja odnosa meu pojavama je utvrditi statistiku ovisnost
i pokazatelje jakosti takve ovisnosti
Za to se koriste metode regresijske i korelacijske analize
Regresija = statistiki odnos meu pojavama
Korelacija = uzajamna ovisnost

Funkcionalne i statistike veze


Funkcionalna veza = odnos koji se izraava analitiki jednadbom
Svakoj vrijednosti jedne pojave odgovara tono odreena vrijednost druge
pojave.

Statistika (stohastika) veza = slabija od funkcionalne


Svakoj vrijednosti jedne pojava odgovara vie razliitih vrijednosti druge
pojave.
npr. Sve osobe iste visine nemaju i istu teinu

Regresijska analiza
Regresijska analiza sastoji se u primjeni metoda kojima se analitiki
(jednadbom) objanjava statistika veza izmeu promatranih pojava
Istrauje se uzrono-posljedini karakter veze jedna varijabla je
uzrok (nezavisna varijabla), a druga je posljedica (zavisna varijabla)
Temelji se na regresijskom modelu = jednadbi s parametrima i
varijablama kojima se objanjava povezanost promatranih pojava
Ako imamo samo jednu nezavisnu varijablu = jednostavni regresijski
model
Ako imamo vei broj nezavisnih varijabli = model multiple ili
viestruke regresije

Za statistiku analizu potrebno je izabrati:


Empirijske vrijednosti za varijable X i Y
Oblik modela, tj funkciju f(X)

Pomono sredstvo za izbor funkcije je dijagram rasipanja

Dijagram rasipanja

Dijagram rasipanja

Dijagram rasipanja

Dijagram rasipanja

Korelacija
Meuzavisnost ili povezanost varijabli
Po smjeru korelacija moe biti pozitivna ili negativna
Pozitivna = rast jedne varijable prati rast druge varijable
Negativna = rast jedne varijable prati pad druge varijable

Zadaa regresijske analize:


Pronai analitiko-matematiki oblik veze izmeu jedne ovisne ili
regresand varijable i jedne ili vie neovisnih ili regresorskih varijabli.

Model jednostavne linearne regresije


Ako su u analizi prisutne samo dvije varijable, onda se radi o
jednostavnoj regresiji.
Na temelju uzorka parova varijabli X i Y crta se dijagram rasipanja

Model jednostavne linearne regresije


Jednostavna linearna regresija predstavlja odnos izmeu dvije pojave
i to takav da promjenu jedne pojave prati priblino linearna promjena
druge pojave
= + ,
gdje je deterministika komponenta, a je sluajna pogreka.
Deterministiki dio modela glasi:

= +

Model jednostavne linearne regresije


Povuemo li na dijagramu rasipanja pravac, on je oblika
= +
Svaka toka dijagrama rasipanja zadovoljava jednadbu
= + +
Odnosno svaka toka Yi odstupa od linije pravca za

Model jednostavne linearne regresije


Regresijska analiza trai parametre a i b tako da pravac prolazi
izmeu stvarnih toaka promatranih varijabli i da najbolje tumai vezu
izmeu njih, tj. pravac mora biti takav da odstupanja budu
minimalna
Parametri se ocjenjuju metodom najmanjih kvadrata

Regresijska funkcija
= +
a = oekivana vrijednost zavisne varijable kad je nezavisna varijabla
jednaka 0
b = prosjena promjena zavisne varijable kad se nezavisna varijabla
promijeni za jedinicu mjere

Regresijska funkcija
Moe se postaviti i suprotna ovisnost u modelu, tj. zamijeniti zavisna i
nezavisna varijabla
= + +
Analiza se provodi na isti nain, osim to u metodi najmanjih kvadrata X
i Y mijenjaju mjesta.

Procjena parametara modela


Imamo n vrijednosti X i Y. Model se moe tada zapisati kao:
= + +
= +
=
Kriterij za izbor procjene parametara metodom najmanjih kvadrata:

( ) 2 =
=1

Parametri modela
=

=1
,

2
2
=1

Regresijska funkcija:
= +

Drugi regresijski model


Analogno, zamjenom X i Y, tj zavisne i nezavisne varijable, dobije se
drugi regresijski model s parametrima
=

=1
,

2
2
=1

Regresijski model:

= +

Reprezentativnost linearne regresije


Varijanca regresije aritmetika sredina kvadrata rezidualnih
odstupanja

2
(

=1
2 =

Standardna devijacija regresije prosjeni stupanj varijacije stvarnih


vrijednosti ovisne varijable u odnosu na oekivane regresijske
vrijednosti
=

=1(

)2

Reprezentativnost linearne regresije


Relativni pokazatelj reprezentativnosti regresijskog modela je
koeficijent varijacije regresije

=
100

Ako je koeficijent varijacije manji od 10%, model se smatra dobrim


(reprezentativnim).

Reprezentativnost linearne regresije


Odstupanja protumaena modelom (SP=ST-SR)

( )2

=
=0

Ukupna odstupanja

( )2

=
=0

Neprotumaena odstupanja

( )2

=
=0

Reprezentativnost linearne regresije


Koeficijent determinacije R2 = omjer protumaenih i ukupnih
odstupanja
2

=
=1

Model je reprezentativniji to je R2 blie 1.

Procjena koeficijenta korelacije


Najpoznatija mjera je Pearsonov koeficijent linearne korelacije (r)
Kree se u intervalu od -1 do 1

Procjena koeficijenta korelacije


Rauna se kao
=

Ili
=

=1

VANO!
Prije donoenja zakljuka provjeriti koeficijent varijacije regresije (je
li zaista rije o linearnoj funkciji)
Kod donoenja zakljuka treba tumaiti i koeficijent determinacije i
koeficijent korelacije

Primjer

You might also like