Professional Documents
Culture Documents
10 Predavanje
10 Predavanje
REGRESIJA I
KORELACIJA
4
5
10.1. JEDNOSTAVNA LINEARNA REGRESIJA
Y = a + bX + u
X = nezavisna varijabla
Y = zavisna varijabla
u = odstupanje od funkcionalnog odnosa
a, b = parametri
6
Regresijska analiza provodi se na temelju n parova vrijednosti
varijabli X i Y : (x1, y1), (x2, y2), ..., (xn, yn), pa se model
predočuje sustavom od n jednadžbi:
yi= a + bxi + ui
7
Kako su odnosi među pojavama statistički, treba odrediti kriterij
prema kojemu će se izabrati jednadžba pravca ŷ = a + bx
koja će ‘najbolje’ opisati odnos pojava na temelju njihovih
opaženih vrijednosti
8
Do procjene parametara najčešće se dolazi metodom najmanjih
kvadrata – sastoji se u određivanju onih procjena parametara za
koje rezidualni zbroj kvadrata postiže minimum
n
∑x y
i =1
i i − n⋅ x ⋅ y
b= n
, a = y −b⋅ x
∑ i
2
x − n ⋅ x 2
i =1
9
Regresijska jednadžba je analitički izraz koji u smislu prosjeka
opisuje odnos među pojavama – osnova za mjerenje
reprezentativnosti disperzija oko regresije, koja se očituje na
rezidualnim odstupanjima (manja odstupanja empirijskih
vrijednosti zavisne varijable od regresijskih vrijednosti ⇒ bolja
reprezentativnost regresije)
11
CHADOCKOVA LJESTVICA:
12
PRIMJER 1. U tabeli 1. izložen je postupak računanja parametara
linearne regresijske jednadžbe i dane su regresijske vrijednosti.
Uzmimo, na primjer, da neko poduzeće analizira podatke o
ostvarenom prometu i dobiti (oboje u mil. kn) u 8 uzastopnih godina:
Regresijske
Promet Dobit
vrijednosti
xi yi xi yi xi 2 $y
i
20 1 20 400 1.05
30 3 90 900 2.35
40 3.5 140 1600 3.65
50 5 250 2500 4.95
70 7 490 4900 7.55
80 8.5 680 6400 8.85
90 9 810 8100 10.15
100 13 1300 10000 11.45 Tabela 1.
480 50 3780 34800 50.00
Prikažimo prvo 8 parova vrijednosti prometa i dobiti na
dijagramu rasipanja:
Slika 1.
dobit u mil. kn
14,0
12,0
10,0
8,0
6,0
4,0
2,0
0,0
0 20 40 60 80 100 120
promet u mil. kn
Vidimo sa slike da su točke raspoređene približno pravcu, a veza
je pozitivna, tj. porast vrijednosti jedne varijable prati rast druge
varijable
x=
∑ x i
=
480
= 60 , y =
∑y i
=
50
= 6.25
n 8 n 8
8
∑ x y − n ⋅ xy
i =1
i i
3780 − 8 ⋅ 60 ⋅ 6.25
b= 8
= 2
= 0.13
34800 − 8 ⋅ 60
∑x
2
2
i − n⋅ x
i =1
$y = a + bx = −1.55 + 0.13 x
L
$y = a + bx = −1.55 + 0.13 ⋅100 = 11.45
8 8
σ $y 0.758
V$y = ⋅100 = ⋅100 = 12.13%
y 6.25
n n
a ∑ yi + b∑ xi yi − n ⋅ y
2
i =1 i =1
R2 = n
=
∑y
2
2
i − n⋅ y
i =1
19
20
Polazna veličina za mjerenje jakosti i smjera je kovarijanca
varijabli X i Y:
1 n 1 n
cov ( X , Y ) = µ11 = ∑ xi − x
( )( yi − y = ∑ xi yi − x ⋅ y
)
n i =1 n i =1
23
Sa di su označene razlike između rangovima pojedinih
vrijednosti varijable X i Y :
di = r ( xi ) − r ( yi )
24
PRIMJER 2. Novinari dvaju časopisa birali su menadžera
godine. Desetorici kandidata novinari pojedinog časopisa su
davali bodove kojima je mjerena njihova uspješnost. Izračunat
ćemo stupanj korelacije kriterija ocjenjivanja obaju uredništava:
25
Bodovi dodijeljenih od Rang Rang
Kvadrati
Redni broj uredništva časopisa vrijednosti vrijednosti Razlike
razlika
kandidata varijable varijable rangova
A B rangova
X Y
xi yi r ( xi ) r ( yi ) di di 2
1 53 48 8 6 2 4
2 15 32 2 5 -3 9
3 30 62 6 7 -1 1
4 47 64 7 8 -1 1
5 60 70 9 10 -1 1
6 75 65 10 9 1 1
7 14 17 1 2 -1 1
8 25 28 4.5 3 1.5 2.25
9 25 30 4.5 4 0.5 0.25
10 19 16 3 1 2 4
Ukupno - - 55 55 0 24.5
Objašnjenje rangova u 4. stupcu: najmanjoj vrijednosti varijable
X koja iznosi 14, pridružen je rang 1. Sljedeći su po veličini
bodova 15 i 19, pa su njima pridruženi rangovi 2 i 3. nakon toga
slijede dva po veličini jednaka broja bodova, 25, a kako su na
redu rangovi 4 i 5, to je svakoj vrijednosti pridružena aritmetička
sredina tih dvaju rangova, tj. 4.5. Slijedi po veličini 30 bodova,
kojima je pridružen rang 6, ...
n
6∑ di2
i =1 6 ⋅ 24.5
rs = 1 − = 1− 3 = 0.8515
n −n
3
10 − 10
Spearmanov koeficijent korelacije ranga je dosta blizu jedinice,
što znači da je veza među rangovima dviju varijabli pozitivna i
dosta jaka. Kandidat kojeg je jedno uredništvo ocijenilo dobro,
prošao je dobro i kod drugog urednika i obrnuto. To upućuje na
dosta dobru usklađenost kriterija obaju uredništva
PITANJA ZA USMENI DIO ISPITA:
28