Professional Documents
Culture Documents
MergeResult 2023 05 19 07 45 47
MergeResult 2023 05 19 07 45 47
Predavanje 11
Y Y
X X
Y Y
X X
Statistika – Predavanje 11 11-6
Tipovi relacija
(nastavak)
Snažne relacije Slabe relacije
Y Y
X X
Y Y
X X
Statistika – Predavanje 11 11-7
Tipovi relacija
(nastavak)
Nema relacije
X
Statistika – Predavanje 11 11-8
Uvod u
regresionu analizu
Regresiona analiza se koristi za:
Predviđanje vrijednosti zavisne varijable na osnovu
vrijednosti makar jedne nezavisne varijable
Objašnjavanje efekata promjena nezavisne varijable
na zavisnu promjenljivu
Zavisna varijabla: varijabla koju želimo da
objasnimo ili predviđamo
Nezavisna varijabla: varijabla koja se koristi da za
objašnjavanje zavisne varijable
Koeficijent Slučajna
Presjek Y Nezavisna greška
nagiba
(populacija) varijabla
(populacija)
Zavisna
varijabla
Yi β0 β1Xi ε i
Linearna komponenta Komponenta
greške
Y Yi β0 β1Xi ε i
Opservirana
(prava) vrijednost
Y za Xi
εi Nagib = β1
Predviđena Greška za
(ocijenjena)
vrijednost Xi
vrijednost Y za Xi
Presjek = β0
Xi X
Statistika – Predavanje 11 11-10
Pretpostavke regresionog modela
Ocijenjena (ili
predviđena) Y Ocjena
Ocjena
vrijednost za regresionog
regresionog
opservaciju i presjeka
nagiba
Vrijednost X za
Ŷi b0 b1Xi
opservaciju i
n XY X Y
b1
n X 2 ( X ) 2
b0 Y b X
Xi X
Statistika – Predavanje 11 11-18
Koeficijent determinacije, R2
Koeficijent determinacije mjeri dio ukupnih
varijacija zavisne promjenljive koji je objašnjen
varijacijama nezavisne varijable
Koeficijent determinacije se naziva R na
kvadrat, R2
pažnja: 0 R 1
2
X
R2 =1
Statistika – Predavanje 11 11-20
Primjeri za R2 vrijednosti
Y
0 < R2 < 1
X
Statistika – Predavanje 11 11-21
Primjeri za R2 vrijednosti
R2 = 0
Y
Nema linearne veze između
X i Y:
Vrijednost Y ne zavisi od X.
X (Nimalo varijacijaY nije
R2 = 0
objašnjeno varijacijama X.)
SSE i i
( Y Ŷ ) 2
S YX i1
n2 n2
gdje
SSE = suma kvadrata grešaka
n = veličina uzorka
Y Y
S YX S YX
Sb1
SSX (X X)
i
2
gdje:
Sb1 = standardna greška ocjene koeficijenta nagiba – metod ONK
Y Y
b1 β1
gdje:
b1 t / 2, n 2Sb1 s.s. = n - 2
Interval predviđanja
individualnih Y, za
dato Xi
Xi X
Statistika – Predavanje 11 11-29
Interval povjerenja za sredinu
promjenljive Y, za dato X
Interval povjerenja za prosječnu vrijednost
Y
za datu vrijednost Xi
Interval povjerenja za μ Y|X X i :
Yˆ t n 2SYX hi
Veličina intervala varira u skladu
sa udaljenosti od sredine, X.
Interval povjerenja za YX X i :
Yˆ t n 2SYX 1 hi
Identifikacija promjenljivih
Odabir slučajnog uzorka
Dijagram raspršenosti i izbor odgovarajućeg
regresionog modela
Primjena metoda ONK
Vrednovanje ocijenjenih vrijednosti
Ispitivanje da li su pretpostavke modela
ispunjene
Testiranje značajnosti regresije
Predviđanje
Statistika – Predavanje 11 11-32
Slabosti regresione analize
( xi )( yi )
SS xy ( xi x )( yi y ) xi yi
n
( xi ) 2
SS xy ( xi x ) 2 xi2
n
Hipoteza
H0: ρ = 0 (nema korelacije između X i Y)
HA: ρ ≠ 0 (postoji korelacija)
Test statistika
r -ρ
t (sa n – 2 stepeni slobode)
1 r 2
gdje
n2
r r 2 ako b1 0
r r 2 ako b1 0
Predavanje 12
12.00
na horizontalnoj osi su 10.00
8.00
vremenski periodi 6.00
4.00
2.00
0.00
1975
1977
1979
1981
1983
1985
1987
1989
1991
1993
1995
1997
1999
2001
Godina
Vremenska serija
Statistika - Predavanje 12
Vrijeme 12-5
Trend komponenta
Prodaja Prodaja
Vrijeme Vrijeme
Opadajući linearni trend Rastući nelinearni trend
Prodaja
Ljeto
Zima
Ljeto
Zima Proljeće Jesen
Proljeće Jesen
Vrijeme (kvartali)
Statistika - Predavanje 12 12-7
Ciklična komponenta
Dugoročna “talasasta” putanja
Regularlno se pojavljuje ali može biti različite
dužine
Obično se mjeri od vrha do vrha ili od dna do
dna 1 Ciklus
Prodaja
Godina
Statistika - Predavanje 12 12-8
Neregularna komponenta
Yi Ti Ci Ii
Koristi se za predviđanje
Omogućava uvažavanje
sezonskih varijacija
Yi Ti Si Ci Ii
Koriste se za “peglanje”
Serije aritmetičkih sredina tokom vremena
Rezultat zavisi od izbora vrijednosti L (dužina
perioda za računanje sredina)
Primjeri:
Za petogodišnji pokretni prosjek, L = 5
Za sedmogodišnji pokretni prosjek, L = 7
Itd.
Y1 Y2 Y3 Y4 Y5
MA(5)
5
Drugi prosjek:
Y2 Y3 Y4 Y5 Y6
MA(5)
5
itd.
Statistika - Predavanje 12 12-14
Primjer: Godišnji podaci
God. Prodaja
1 23
2 40 Godisnja prodaja
3 25 60
4 27 50
5 32 40
Prodaja
30
6 48
20
7 33
10
8 37 0
1 2 3 4 5 6 7 8 9 10 11
9 37
Godina
10 50
11 40
itd… itd…
60
50
40
Prodaja
30
20
10
0
1 2 3 4 5 6 7 8 9 10 11
Godina
2000 1 40 80
70
2001 2 30 Prodaja 60
50
2002 3 50 40
30
20
2003 4 70 10
0
2004 5 65 0 1 2 3 4 5 6
Godina
Prodaja
50
2003 4 70 40
30
20
2004 5 65 10
0
2005 6 ?? 0 1 2 3 4 5 6
Godina
Pi
Ii 100
Pbaza
gdje
Ii = indeks za godinu i
Pi = cijena u godini i
Pbaza = cijena u baznoj godini
Statistika - Predavanje 12 12-22
Indeksni brojevi: primjer
Cijene avionskih karata u periodu od 1995 do 2003:
Indeks
Godina Cijena (bazna
godina =
2000)
P1996 288
1995 272 85.0 I1996 100 (100 ) 90
1996 288 90.0 P2000 320
1997 295 92.2
1998 311 97.2 Bazna godina:
P2000 320
1999 322 100.6 I2000 100 (100 ) 100
2000 320 100.0 P2000 320
2001 348 108.8
P2003 384
2002 366 114.4 I2003 100 (100 ) 120
2003 384 120.0 P2000 320
Statistika - Predavanje 12 12-23
Indeksni brojevi: interpretacija
Grupni
indeksi
Neponderisani Ponderisani
agregatni agregatni
indeksi cijena indeksi cijena
i
P (t)
i = proizvod
I
(t)
U
i1
n
100 t = vremenski period
P
i1
i
(t)
= zbir cijena za grupu proizvoda u vremenu t
n
i1
I2004
P 2004
100
410
(100) 118.8
P 2001 345
Neponderisani ukupni troškovi su bili
18.8% viši u 2004. nego u 2001.
Statistika - Predavanje 12 12-27
Ponderisani
agregatni indeksi cijena
Laspeyres-ov indeks Paasche-ov indeks
n n
i Qi
P ( t ) (0)
P i
(t)
Q (t)
i
I
(t)
L
i1
n
100 I
(t)
P
i1
n
100
Pi1
i
(0)
Q (0)
i P i
(0)
Q (t)
i
i1
Vremenske serije
Komponente vremenskih serija
Peglanje podataka u vremenskim serijama
Pokretni prosjeci
Predviđanje na osnovu trenda
Indeksi