Professional Documents
Culture Documents
Predavanje 13
Regresiona i
korelaciona analiza
Na ovom predavanju razmatraćemo međusobnu vezu dve
promenljive i to na osnovu:
1. regresione analize
2. korelacione analize.
Upotrebom regresionih modela može se oceniti kako se
menja jedna promenljiva pod uticajem promene druge
promenljive.
Koeficijent korelacije u korelacionoj analizi pokazuje da li
između varijacija dve promenljive postoji kvantitativno
slaganje, ali on ne daje informaciju o stepenu promene jedne
promenljive kojanastaje kao rezultat promene druge
promenljive.
Predavanje 13 / 1
Deterministička i
stohastička veza
Naše interesovanje ćemo usmeriti na istraživanje
međusobnih veza i uticaja između dve ili više pojava. Pojave
na osnovu veza između promenljivih možemo podeliti na
determinističke i stohastičke.
Deterministička veza se javlja kada jednoj vrednosti
nezavisno promenljive X odgovara tačno jedna vrednost
zavisno promenljive Y. Ova veza se još naziva egzaktna ili
funkcionalna.
Stohastičke veze su slabije i kod njih jednoj vrednosti
nezavisno promenljive X odgovara više mogućih vrednosti
zavisno promenljive Y. Svaku od tih vrednosti zavisno
promenljiva može uzeti sa određenom verovatnoćom, pa je
zavisno promenljiva Y slučajna promenljiva.
Predavanje 13 / 2
Deterministička i
stohastička veza
Suština stohastičke veze je sledeća:
Prosek Y = f (X)
Predavanje 13 / 3
Ciljevi regresione i
korelacione analize
Regresiona i korelaciona analiza primenjuju se u istraživanju
kvantitativnog slaganja varijacija između dve ili više pojava.
Predavanje 13 / 4
Ciljevi regresione i
korelacione analize
Cilj regresije je da se utvrdi priroda veze, tj. oblik zavisnosti
među posmatranim pojavama. Ovo se postiže odgovarajućim
regresionim modelima.
Regresioni model je statistički model koji matematičkim
formulama, uz određene pretpostavke najbolje opisuje
kvantitativnu zavisnost između varijacija posmatranih pojava u
realnosti. Kako je reč o stohastičkim vezama, regresioni model
pokazuje prosečno slaganje varijacija ispitivanih pojava.
Predavanje 13 / 5
Vrste regresionih modela
Predavanje 13 / 6
Prosta linearna regresija
Predavanje 13 / 7
Dijagram raspršenosti
Prvi korak u analizi zavisnosti dve pojave je grafičko
prikazivanje empirijske serije podataka, bilo da se odnose
na osnovni skup ili uzorak.
x je nezavisno promenljiva
y je zavisno promenljiva
a je konstanta u linearnoj jednačini otsečak na y osi
b je koeficijent nagiba prave
Predavanje 13 / 9
Prost linearni regresioni
model
Cilj regresije je predvideti vrednosti y za pojedine vrednosti x.
Kako je reč o stohastičkim vezama između x i y ne može se
tačno predvideti vrednost y za određenu vrednost x.
Predavanje 13 / 10
Prost linearni regresioni
model
Model proste linearne regresije u opštem obliku:
Yi = β0 + β1xi + εi i =1, 2,…, N
gde su
Yi i-ta zavisna promenljiva
xi i-ta vrednost nezavisna promenljiva
β0 i β1 nepoznate konstante, regresioni parametri
εi stohastički član ili slučajna greška
N veličina osnovnog skupa
Nezavisno promenljiva X se naziva objašnjavajućom
promenljivom jer pomoću nje pokušavamo da objasnimo
varijacije promenljive Y.
Predavanje 13 / 11
Ocenjivanje:
Metod najmanjih kvadrata
Na osnovu dijagrama raspršenosti odabira se tip krive koji
najviše odgovara empirijskim podacima. Tek tada na osnovu
dijagrama, ako on ukazuje na linearnu vezu dveju pojava,
prelazimo na drugu etapu regresione analize – ocenjivanje
nepoznatih parametara: slobodnog člana β0 i koeficijenta
nagiba β1.
Slučajnom greškom u stohastičkom regresionom modelu
obuhvaćene su:
1. nedostajuće ili izostavljene promenljive (efekti
promenljivih koje nisu direktno uključene u model),
2. slučajne varijacije (domaćinstvo može u jednom mesecu
da organizuje više zabava i potroši više na hranu, a sledećeg
meseca zbog dečje ekskurzije ili kupovine nameštaja
prištedeće na hrani.
Predavanje 13 / 12
Ocenjivanje:
Metod najmanjih kvadrata
U regresionom modelu su β0 i β1 parametri osnovnog skupa.
Međutim, kako nisu poznati svi podaci o osnovnom skupu,
regresioni model osnovnog skupa ocenjujemo na osnovu
podataka iz uzorka. Ocene nepoznatih parametara, odsečka β0
i koeficijenta nagiba β1 se označavanju sa b0 i b1.
Predavanje 13 / 14
Ocenjivanje:
Metod najmanjih kvadrata
e (Y Yˆ )0
Predavanje 13 / 15
Ocenjivanje:
Metod najmanjih kvadrata
Kako je suma svih reziduala jednaka 0 njenim
minimiziranjem i ne možemo dobiti najbolje prilagođenu
regresionu krivu, ali minimiziranjem sume kvadrata
reziduala (SKR) mogu se dobiti vrednosti b0 i b1 u
regresionom modelu uzorka. Od svih mogućih pravih linija
treba odabrati onu koja ima najmanju sumu kvadrata
vertikalnih odstupanja (reziduala).
SKR e (Y Y )
2
ˆ 2
SPxy XY
X Y SK xx X 2
( X ) 2
n n
gde je SK i SP označavaju odgovarajuću sumu kvadrata i
sumu proizvoda.
Predavanje 13 / 17
Testiranje značajnosti
regresione veze
Predavanje 13 / 18
Testiranje značajnosti
regresione veze
b1 1 b1 s
t S b1
S b1 S b1 x 2
n x 2
Predavanje 13 / 20
Prosta linearna korelacija
Predavanje 13 / 21
Koeficijent proste
linearne korelacije
n xy x y
r
n x 2 ( x ) 2 n y 2 ( y ) 2
Predavanje 13 / 24
Testiranje značajnosti ocene
koeficijenta proste linearne korelacije
n2
tr
1 r 2
Predavanje 13 / 25
Regresiona analiza:
kompletan primer
Predavanje 13 / 26
Regresiona analiza:
kompletan primer
Predavanje 13 / 27
Regresiona analiza: primer
3. Izračunati SKxx, SKyy i SKxy
Vozačko Premija auto
iskustvo, x osiguranja, y xy x2 y2
5 64 320 25 4096
2 87 174 4 7569
12 50 600 144 2500
9 71 639 81 5041
15 44 660 225 1936
6 56 336 36 3136
25 42 1050 625 1764
16 60 960 256 3600
Σx=90 Σy=474 Σxy=4739 Σx2=1396 Σx2=29642
Predavanje 13 / 28
Regresiona analiza: primer
x
x 90
11,25 y
y 474
59,25
n 8 n 8
SK i SP označavaju odgovarajuće sume kvadrata i sume proizvoda.
SPxy xy
x y
4739
90 474
593,5000
n 8
( x ) 2 90 2
SK xx x 2 1396 383,5000
n 8
( y ) 2 474 2
SK xy y 2 29642 1557,5000
n 8
Predavanje 13 / 29
Regresiona analiza: primer
yˆ b0 b1 x 76,6605 1,5476 x
Predavanje 13 / 30
Regresiona analiza:
kompletan primer
Predavanje 13 / 31
Regresiona analiza:
kompletan primer
100
Premija osiguranja
90
80
70
60
Series1
50 Linear (Series1)
40
30
20
10
0
0 10 20 30
Vozačko iskustvo
Predavanje 13 / 32
Koeficijent proste
linearne korelacije
7. Izračunajte koeficijente r i r2 i objasnite njihovo značenje.
Predavanje 13 / 33
Regresiona analiza: primer
yˆ b0 b1 x 76,6605 1,5476 x
76,6605 1,5476 10 61,18 evra
Predavanje 13 / 35
Regresiona analiza: primer
9. Formirati 90% interval poverenja za parametar β1.
Predavanje 13 / 37
Testiranje hipoteze o parametru β1
α =0,05
-1,943 0
Odbacuje se H0 Ne odbacuje se H0
Predavanje 13 / 38
Testiranje hipoteze o parametru β1
Predavanje 13 / 39
Testiranje hipoteze o parametru β1
Predavanje 13 / 40
Hvala
na pažnji!
Predavanje 13