You are on page 1of 77

Doc.dr.sc. Draenka izmi predavanja 2009.g.

STATISTIKA
Doc.dr.sc.Draenka izmi
- predavanja 2009.g -
1
Doc.dr.sc. Draenka izmi predavanja 2009.g.
SADRAJ:
1. UVOD
Statistiki skup................................................................................... 4
Vrste i izvori statistikih podataka.................................................... 4
2. UREIVANJE PODATAKA
Statistiki nizovi i tabele.............................................. 5
Numeriki nizovi........................................................... 7
3. OSNOVNA ANALIZA VREMENSKIH NIZOVA
................................................................
Grafiko prikazivanje vremenskih nizova..................... 10
Individualni indeksi....................................................... 10
4. SREDNJE VRIJEDNOSTI STATISTIKOG NIZA
Mod....................................................................................................
.....................................................................................12
Medijan.............................................................................................
.....................................................................................13
Aritmetika sredina...........................................................................
.....................................................................................15
Geometrijska sredina.......................................................................
.....................................................................................17
Skupni indeksi..................................................................................
.....................................................................................18
5. MJERE DISPERZIJE
Raspon varijacije, Interkvartil, Koeficijent kvartilne devijacije....... 19
Srednje apsolutno odstupanje (MAD)........................................... 22
Varijanca, Standardna devijacija, Koeficijent varijacije.................. 23
Standardizirana varijabla..................................................................
.....................................................................................25
6. MJERE ASIMETRIJE
Koeficijent asimetrije, Pearsonova mjera, Bowleyjeva mjera........ 26
7. MJERE ZAOBLJENOSTI
Koeficijent zaobljenosti....................................................................
.....................................................................................29
8. MJERE KONCENTRACIJE
Koncentracijski omjer, Ginijev koeficijent....................................... 31
9. OSNOVNI POJMOVI VJEROJATNOSTI
2
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Definicije i svojstva vjerojatnosti......................................................
.....................................................................................32
Modeli distribucija vjerojatnosti.......................................................
.....................................................................................34
10................................................................OSNOVNI
POJMOVI INFERENCIJALNE STATISTIKE
Plan uzorka.......................................................................................
.....................................................................................37
Sampling distribucija........................................................................
.....................................................................................38
11................................................................PROCJENE
PARAMETRA
Procjena aritmetike sredine...........................................................
.....................................................................................39
Procjena totala osnovnog skupa..................................................... 42
Procjena proporcije osnovnog skupa............................................. 44
12................................................................TESTIRANJE
HIPOTEZA O PARAMETRU
Testiranje hipoteza o pretpostavljenoj vrijednosti aritmetike
sredine osnovnog skupa................................................................ 44
Testiranje hipoteza o razlici aritmetikih sredina dvaju
osnovnih skupova nezavisnim uzorcima.......................................... 49
13................................................................REGRESIJSKA
ANALIZA
Model jednostavne linearne regresije............................................... 52
- deskriptivno statistika analiza modela............................... 52
- inferencijalno statistika analiza modela............................ 57
- testiranje hipoteza o modelu................................................ 58
14................................................................MODEL
VIESTRUKE REGRESIJE
Analiza modela viestruke regresije................................................
.....................................................................................58
Testiranje hipoteza o modelu viestruke regresije......................... 59
15................................................................MODELI
VREMENSKIH SERIJA
Komponente vremenskih serija.......................................................
.....................................................................................60
3
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Modeli trenda....................................................................................
.....................................................................................61
4
Doc.dr.sc. Draenka izmi predavanja 2009.g.
PREDAVANJE #1
STATISTIKA znanstvena metoda koja se bavi prikupljanjem, ureivanjem, analizom i
tumaenjem podataka.
DESKRIPTIVNA u okviru deskriptivne statistike zakljuci se donose na
temelju svih podataka. Ona obuhvaa postupke ureivanja, grupiranja,
tabeliranja, grafikog prikazivanja te izraunavanja razliitih statistiko-
analitikih veliina
INFERENCIJALNA u sklopu inferencijalne statistike zakljuci se dodose na
temelju dijela podataka (uzoraka). Temelji se na teoriji vjerojatnosti
STATISTIKI SKUP ine jedinice koje su predmetom promatranja statistikom
metodom. Moemo promatrati osobe, poduzea, zemlje, proizvode itd.
OPSEG SKUPA broj jedinica. S obzirom na opseg statistiki skupovi se dijele na:
KONANI STATISTIKI SKUP studenti upisani na efzg
BESKONANI STATISTIKI SKUP bacanje novia ili proizvodnja
Statistiki skupovi definiraju se pojmovno, prostorno i vremenski.
OSNOVNI SKUP (POPULACIJA) skup podataka o promatranom svojstvu za svaku
jedinicu statistikog skupa.
UZORAK podskup, dio osnovnog skupa. Dio podataka izdvojen iz cjelovite evidencije.
STATISTIKO OBILJEJE (VARIJABLA) svojstvo koje stupnjem ili oblikom varira od
jedinice do jedinice statistikog skupa.
VRSTE STATISTIKOG OBILJEJA:
1. NUMERIKO (KVANTITATIVNO) izraava se brojevima
DISKRETNO (diskontinuirano) poprima iskljuivo cjelobrojne vrijednosti. npr.
broj uenika u razredu, broj djece u obitelji
KONTINUIRANO moe poprimiti bilo koju vrijednost iz nekog intervala. npr.
visina, teina, cijena...
2. KVALITATIVNO
NOMINALNO (atributivno i geografsko) izraava se opisno ili rijeima. npr.
atributivno spol, zanimanje ; geografsko mjesto roenja
REDOSLIJEDNO (obiljeje ranga) npr. ocijena, stupanj kvalitete
MJERENJE postupak pridruivanja numerikih i nenumerikih oznaka jedinicama
statistikih skupova na temelju odreenog pravila. Temelji se na primjeni mjerih skala.
MJERNE SKALE:
1. NOMINALNA sastoji se od liste naziva
2. ORDINALNA ovom skalom jedinicama statistikih skupova pridruuju se slovne
oznake, simboli ili brojevi sukladno intenzitetu mjernog svojstva
3. INTERVALNA - ovom skalom jedinicama statistikih skupova pridruuju se brojevi
sukladno intenzitetu mjernog svojstva. Za ovu skalu karakteristino je da ima
definiranu mjernu jedinicu i dogovorno utvrenu nulu. npr. temperaturna ljestvica.
4. OMJERNA - ovom skalom jedinicama statistikih skupova pridruuju se brojevi
sukladno intenzitetu mjernog svojstva. Za ovu skalu karakteristino je da ima
5
Doc.dr.sc. Draenka izmi predavanja 2009.g.
definiranu mjernu jedinicu i nulu koja oznaava nepostojanje svojstva. npr. plaa,
broj zastoja rada stroja.
IZVORI PODATAKA:
PRIMARNI prikupljaju se u skladu s ciljem istraivanja.
SEKUNDARNI prikupljaju ih razne institucije (dravni zavod za statistiku,
banke, agencije za istraivanje trita, osiguravajui zavodi...)
PREDAVANJE #2
UREIVANJE PODATAKA ureivanjem podataka nastaju statistiki nizovi
STATISTIKI NIZOVI:
1. NOMINALNI NIZ nastaje ureivanjem podataka o nominalnom obiljeju
2. REDOSLIJEDNI NIZ nastaje ureivanjem podataka o rang varijabli
3. NUMERIKI NIZ nastaje ureenjem podataka koji predstavljaju vrijednosti
numerike varijable
4. VREMENSKI NIZ nastaje kronolokim nizanjem podataka o nekoj pojavi
(proizvodnja,uvoz,izvoz)
STATISTIKE TABELE:
JEDNOSTAVNA
SKUPNA sadri barem dva niza koji su grupirani prema modalitetima istog
obiljeja
Poljoprivredna povrina po kategorijama u
tisuama hektara u RH, 2003.g
KATEGORIJE POVRINA
oranice i vrtovi 1460
vonjaci 68
vinogradi 57
livade 396
panjaci 1156
izvor: SLJRH, 2004.g., str.250
6
Doc.dr.sc. Draenka izmi predavanja 2009.g.
KOMBINIRANA (TABELA KONTIGENCE, TABELA S DVA ULAZA) podaci su
grupirani prema modalitetima dvaju ili vie varijabli
Stanovnitvo prema spolu i starosti u tisuama u RH, popis
iz 2001.g.
STAROST SPOL
M
0 14 388 370
15 64 1482 1501
65 - 266 430
izvor: SLJRH, 2004.g., str.95
RELATIVNI BROJEVI omoguavaju elementarnu analizu podataka u sklopu
deskriptivne statistike
proporcije (dio/cjelina), postoci (dio/cjelina*100) odnosno relativne frekvencije
indeksi
relativni brojevi koordinacije omjerni brojevi koji nastaju diobom dvaju
koordinirajuih veliina (npr.gustoa stanovnitva, dohodak po stanovniku,
BDP per capita)
NIZOVI KVALITATIVNIH PODATAKA
Kvalitativni podaci su oblici nominalne ili redoslijedne varijable.
ako ih je mali broj navode se nekim redom odabranim po volji ili prema
intenzitetu mjernog obiljeja kod redoslijednih podataka (npr.ocjene od
najmanje prema najveoj)
ako se radi o veem broju podataka pristupa se grupiranju. Grupiranjem se
skup podataka ralanjuje na podskupove koji se meusobno ne preklapaju.
FREKVENCIJA broj podataka istog ili slinog modaliteta varijable
NOMINALNI ILI REDOSLIJEDNI NIZ ine parovi razliitog oblika kvalitativne varijable o
i
i pripadajuih frekvencija f
i
(o
i
, f
i
), i=1,2,....,k
Izvoz i uvoz prema pretenoj ekonomskoj
namjeni u milijunima am. $ u RH, 2003.g.
EKONOMSKA NAMJENA IZVOZ UVOZ
proizvodi za reprodukciju 2959 6583
proizvodi za investicije 1341 3316
proizvodi za iroku
potronju
1886 4311
izvor: SLJRH, 2004.g., str.386
7
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Uenici i studenti koji su zavrili osnovnu
ili srednju kolu odnosno diplomirai na
visokim uilitima u RH, 2003.g.
STUPANJ
OBRAZOVANJA
BROJ OSOBA
o
i
f
i
osnovno 51211
srednje 47092
struni studij 6489
sveu.studij 9243
ukupno 114035
izvor: SLJRH, 2004.g., str.487
OPSEG SKUPA zbroj frekvencija
RELATIVNA FREKVENCIJA omjer frekvencije i opsega skupa

k
i
i
i
i
f
f
p
1
POSTOTNA RELATIVNA FREKVENCIJA relativna frekvencija pomonoena sa 100
100
1

k
i
i
i
i
f
f
P
nizovi sa relativnim frekvencijama (o
i
, p
i
) ili (o
i
, P
i
)
Kvalitativni nizovi grafiki se prikazuju povrinskim grafikonima:
STUPCI (poloeni, uspravni)
STRUKTURNI KRUGOVI I POLUKRUGOVI
RAZDIJELNI STUPCI
VIESTRUKI STUPCI
NUMERIKI NIZOVI nastaju ureenjem numerikih podataka. Nain njihova
ureivanja ovisi o tome da li su podaci diskretni ili kontinuirani.
NAINI UREIVANJA:
1. mali broj podataka - ureuje se nizanjem po veliini. Pojedinani numeriki
podaci grafiki se prikazuju dijagramom s tokama i dijagramom stablo-list (S-L
dijagram)
Primjer 1.
Podaci o prodaji proizvoda A za 15 dana jednog razdoblja:
X
i
: 8, 15, 9, 17, 20, 14, 34, 27, 30, 18, 10, 18, 24, 25, 29
Podaci ureeni po veliini:
X
i
: 8, 9, 10, 14, 15, 17, 18, 18, 20, 24, 25, 27, 29, 30, 34
dijagram s tokama:
8
Doc.dr.sc. Draenka izmi predavanja 2009.g.
dijagram stablo-list:
0 8 9
1 0 4 5 7 8 8
2 0 4 5 7 9
3 0 4
O|8 predstavlja 8
2. diskretno obiljeje - velik broj podataka i manji broj oblika pristupa se
grupiranju. Numeriki niz odnosno distribucija frekvencija se sastoji od parova (x
i
,
f
i
), i=1,2,....,k
x
i
modaliteti numerikog obiljeja
f
i
pripadajue frekvencije
Primjer 2.
Dnevna prodaja garnitura sobnog
namjetaja
BROJ
GARNITURA
BROJ DANA
xi fi
1 1
2 5
3 8
4 26
5 19
6 12
ukupno 71
3. kontinuirano obiljeje/ diskretno obiljeje s veim brojem oblika
grupiranje se provodi na temelju razreda. Svaki razred ima donju i gornju granicu.
frekvencija razreda broj podataka omeen donjom i gornjom granicom razreda
Numeriki niz odnosno distribucija frekvencija sastoji se od parova razreda i
pripadajuih frekvencija (L
i1
x
i
L
i2
, f
i
), i= 1,2,....,k
L
i1
donja granica i-tog razreda; L
i2
gornja granica i-tog razreda; f
i
frekvencija i-
tog razreda
Primjer 3.
Radnici poduzea A
prema starosti
STAROST BROJ RADNIKA
18 26 5
26 34 6
9
Doc.dr.sc. Draenka izmi predavanja 2009.g.
34 42 10
42 50 5
50 58 4
ukupno 30
Formiranju distribucije frekvencija prethodi odreivanje broja razreda i njihove
veliine. Za odreivanje broja razreda koristi se Sturgesovo pravilo: k 1 + 3,3
logN
k-broj razreda; N-zbroj frekvencija
Ako su razredi jednakih veliina, veliina im se aproksimira tako da se raspon
varijacije podijeli sa brojem razreda:
k
x x
i
i
min max


Razredi jednakih veliina primjenjuju se kada su podaci simetrino rasporeeni.
Razredi razliitih veliina primjenjuju se kada su podaci asimetrino rasporeeni.
Pri brojanoj analizi numerikog niza potrebno je utvrditi da li su granice prave, a
nakon toga odrediti veliinu razreda i rezredne sredine.
GRANICE RAZREDA:
PRAVE donja granica tekueg razreda je jednaka gornjoj granici
prethodnog razreda
NOMINALNE pretvaraju se u prave tako da se svaka donja granica
umanji za polovicu jedinice, a svaka gornja se uvea za polovicu
jedinice. To vrijedi za sve sluajeve osim za navrene godine ivota.
Kod navrenih godina ivota svaka se gornja granica povea za
jedinicu.
VELIINA RAZREDA odreuje se kao razlika gornje i donje prave granice
razreda
REZREDNA SREDINA i-tog razreda odreuje se kao poluzbroj gornje i donje
prave granice razreda
Distribucija frekvencija grafiki se prikazuje histogramom i poligonom frekvencija.
10
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Primjer 4.
Prvi i posljednji razred mogu biti otvoreni razredi. Njihove se veliine procjenjuju i
procjena se stavlja u zagradu.
Kada su razredi razliitih veliina potrebno je korigirati frekvencije:

i
i
ci
i
f
f
- ova se formula koristi kada su svi razredi razliitih veliina, a
moe se
koristiti i generalno

b
i
i
ci
i
i
f
f
- bazna veliina razreda (najee se pojavljuje)
IZVEDENI NIZOVI:
KUMULATIVNI NIZ nastaje postupnim zbrajanjem apsolutnih ili relativnih
frekvencija. On se grafiki prikazuje kumulantom.
Nepismeno stanovnitvo staro 10.g. i vie prema starosti u RH prema popisu iz
2001.g.
STAROST BROJ
OSOBA
PRAVE
GRANICE
RAZREDNA
SREDINA
VELIINA
REZREDA
KORIGIRANE
FREKVENCIJE
f
i
x
i
i
i
1 2 3 4 5 6
10-19 1845 9.5-19.5 14.5 10 2768
20-34 3160 19.5-34.5 27 15 3160
35-49 4457 34.5-49.5 42 15 4457
50-64 11108 49.5-64.5 57 15 11108
65-(99) 49207 64.5-(99.5) 82 35 21089
UKUPNO 69777 - - - -
11
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Primjer 5.
PREDAVANJE #3
VREMENSKI NIZ skup kronoloki ureenih vrijednosti koje predstavljaju neku
pojavu (proizvodnja, uvoz, izvoz).
LANOVI NIZA vrijednosti koje tvore niz
Vremenski niz noe biti:
INTERVALNI nastaje trajanjem vrijednosti pojave po intervalima vremena
(godina, kvartal, mjesec) npr. proizvodnja, uvoz, izvoz...
TRENUTANI sastoji se od kronoloki ureenih vrijednosti koje
predstavljaju stanja pojave u odabranim vremenskim tokama (poetak,
sredina, kraj) npr. stanje na raunima, zakljune cijene dionica..
GRAFIKO PRIKAZIVANJE VREMENSKIH NIZOVA:
INTERVALNI NIZOVI prikazuju se povrinskim i linijskim grafikonima.
TRENUTNI NIZOVI prikazuju se samo linijskim grafikonima
Radi lakeg praenja u grafikon se ucrtava mrea. Prikaz je u pravokutnom koordinatnom
sustavu s aritmetikim mjerilima na osima. Na osi apscisa je mjerilo za varijablu vrijeme,
a na osi ordinata za lanove vremenskog niza.
OKOMITI PREKID GRAFIKONA ako se ne raspolae podacima za dio razdoblja
mogue je izostaviti dio mjerila na osi apscisa.
VODORAVNI PREKID GRAFIKONA ako neka pojava varira na velikim razinama
mogue je izostaviti dio mjerila osi ordinata.
Stanovnitvo prema starosti u RH u tisuama prema popisu iz
2001.g.
STAROST BROJ OSOBA PRAVE
GRANICE
KUMULATIVNI
NIZ
0-14 758 -0.5 14.5 758
15-64 2983 14.5 64.5 3741
65-(99) 696 64.5 (99.5) 4437
12
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Prekidaju se samo linijski grafikoni.
POLULOGARITAMSKI GRAFIKON koristi se ako se na istom grafikonu usporeuju
raznorodni podaci (nizovi izraeni u razliitim mjernim jedinicama). To je grafikon sa
aritmetikim mjerilom na osi apscisa, a logaritamskim na osi ordinata.
INDIVIDUALNI INDEKSI njima se prati razvoj jedne pojave u vremenu
verini indeksi njima se prati razvoj pojave u uzastopnim vremenskim
razdobljima. Verini indeks V
t
razdoblja t dobije se tako da se vrijednost toga
razdoblja podijeli s vrijednou prethodnog razdoblja te se pomnoi sa sto
100
1

t
t
t
y
y
V
Verini indeksi se grafiki prikazuju specifinim linijskim grafikonom i
grafikonom jednostavnih stupaca.
KOEFICIJENT DINAMIKE vrijednost tekueg razdoblja podijeljena sa
vrijednou prethodnog razdoblja ne pomnoena sa sto
1

t
t
t
y
y
V
STOPA PROMJENE od verinog indeksa se odbije sto
100
t t
V S

Primjer 1.
Izvoz RH u milijunima US$ u razdoblju od 1999. do 2003.g.
GODINA IZVOZ VERINI INDEKSI STOPA PROMJENE
y
t
V
t
S
t
1999 4302 - -
2000 4432 103,2 3,02
2001 4665 105,26 5,26
2002 4904 105,12 5,12
2003 6197 126,36 26,36
izvor: SLJRH 2004., str.384
Indeks se interpretira kao postotna promjena u odnosu na 100. Ako je vei
od 100 predstavlja postotno poveanje, a ako je manji od 100 predstavlja
postotno smanjenje.
npr. Izvoz u RH u 2003.g. poveao se za 26.36% u odnosu na 2002.g.
indeksi na stalnoj bazi njima se mjere promjene u odnosu na neko
odabrano bazno razdoblje. Izraunavaju se tako da se svaki lan niza podijeli
s vrijednou baznog razdoblja te pomnoi sa 100
100
b
t
t
y
y
I
BAZNO RAZDOBLJE razdoblje u kojemu pojava nije bila izloena nekim
neuobiajenim utjecajima (prirodne katastrofe, rat). Ponekad se uzima neka
vrijednost izvan niza ili nekakav prosjek.
13
Doc.dr.sc. Draenka izmi predavanja 2009.g.
STOPA PROMJENE kad od indeksa odbijemo sto
100
*

t t
I S
Bazni indeksi se grafiki prikazuju linijskim grafikonom jednostavnih stupaca.
Primjer 2.
GODINA IZVOZ BAZNI INDEKSI
1999 = 100
STOPA PROMJENE
1999 4302 100,00 0,00
2000 4432 103,02 3,02
2001 4665 108,44 8,44
2002 4904 113,99 13,99
2003 6197 144,05 44,05
U 2003.g. izvoz se poveao za 44.05% u odnosu na baznu 1999.g.
SREDNJE VRIJEDNOSTI STATISTIKOG NIZA konstante kojima se
predstavljaju nizovi varijabilnih podataka.
POTPUNE raunaju se na temelju svih podataka. U njih se ubrajaju
aritmetika, geometrijska i harmonijska sredina.
POLOAJNE u pravilu su jednake jednom modalitetu statistike varijable. U
njih se ubrajaju MOD i MEDIJAN.
MOD najei modalitet varijable, odnosno to je modalitet varijable s najveom
frekvencijom
1. pojedinani podaci kod pojedinanih podataka MOD je vrijednost koja se najee
pojavljuje
Primjer 3.
Slijedei niz predstavlja cijene jednog proizvoda evidentirane na 10 prodajnih
mjesta u kn:
25 24 25 23 25 22 21 25 20 25 Najea prodajna cijena (MOD) je 25 kn.
2. distribucija frekvencija formirana na temelju pojedinanih vrijednosti tu je MOD
modalitet varijable s najveom frekvencijom
Primjer 4.
14
Doc.dr.sc. Draenka izmi predavanja 2009.g.
MOD distribucije dnevne prodaje garnitura namjetaja iznosi 4, tj. najea dnevna
prodaja iznosila je 4 garniture
3. distribucija frekvencija sa razredima MOD se aproksimira pomou izraza:
i
c b a b
a b
L M
o

+

+
) ( ) (
) (
1
b najvea korigirana frekvencija
a frekvencija ispred nje
c frekvencija iza nje
L
1
donja prava granica modalnoga razreda
i njegova veliina
MODALNI RAZRED razred s najveom korigiranom frekvencijom
Primjer 5.
Dnevna prodaja garnitura sobnog
namjetaja
BROJ
GARNITURA
BROJ DANA
x
i
f
i
1 1
2 5
3 8
4 26
5 19
6 12
UKUPNO 71
Aktivno stanovnitvo u RH u 2003.g. (2.polugodite) u tisuama
STAROST BROJ
OSOBA
PRAVE
GRANICE
VELIINE
RAZREDA
KORIGIRANE
FREKVENCIJE
f
i
i
i
f
ci
15-24 216 14,5-24,5 10 216,0
25-49 1152 24,5-49,5 25 460,8
50-64 370 49,5-64,5 15 246,7
65-(74) 55 64,5-(74.5) 10 55,0
15
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Mo = 24.5 + (460.8-216.0)/(460.8-216.0)+(460.8-246.7) * 25 = 37.84 god
Najea starost aktivnog stanovnitva u RH u 2003.g. iznosi 37.84 godine.
MEDIJAN srednja vrijednost koja numeriki niz ureen po veliini dijeli na dva
jednakobrojna dijela
1. pojedinani podaci (neparan broj) MEDIJAN je jednak vrijednosti varijable
sredinjeg lana u nizu
INT
N

2

r e
x M

1
2
+
,
_

N
INT r
Primjer 6.
Podaci moraju biti ureeni po veliini
1 3 5 8 10 12 14 7/2 = 3.5 ; r =4 ; Me = x
4
= 8
2. pojedinani podaci (paran broj) MEDIJAN je jednak poluzbroju vrijednosti varijable
sredinjih dvaju lanova niza ureenog po veliini N/2 = INT ; Me = (x
r
+X
r+1
)/2 ;
r = N/2
Primjer 7.
11 24 29 37 40 53 65 72 N=8 ; r=4 ; Me = (37+40)/2 = 38.5
3. distribucija frekvencija formirana na temelju pojedinanih vrijednosti odreivanje
MEDIJANA se pojednostavljuje uporabom kumulativnog niza manje od. MEDIJAN je
jednak vrijednosti varijable ija kumulativna frekvencija prva ukljuuje N/2.
Primjer 8.
N/2 = 35.5
Me = 4
4. distribucija frekvencija s razredima MEDIJAN se aproksimira pomou izraza:
Dnevna prodaja
BROJ
GARNITURA
BROJ DANA KUMULATIVNI NIZ
xi fi S(x
i
)
1 1 1
2 5 6
3 8 14
4 26 40
5 19 59
6 12 71
UKUPNO 71 -
16
Doc.dr.sc. Draenka izmi predavanja 2009.g.

i
f
f
N
L M
med
i
e

+

2
1
L
1
donja prava granica medijalnog razreda
N zbroj apsolutnih ili relativnih frekvencija
f
i
zbroj frekvencija do medijalnog razreda
f
med
frekvencija medijalnog razreda
i veliina medijalnog razreda
MEDIJALNI RAZRED onaj ija kumulativna frekvencija prvi put ukljuuje N/2.
Primjer 9.
STAROST BROJ OSOBA PRAVE
GRANICE
VELIINE
RAZREDA
KUMULATIVN
E
FREKVENCIJE
fi ii S(xi)
15-24 216 14,5-24,5 10 216
25-49 1152 24,5-49,5 25 1368
50-64 370 49,5-64,5 15 1738
65-(74) 55 64,5-(74,5) 10 1793
N/2 = 896.5
Me = 24.5 + (896.5-216)/1152 * 25 = 39.27 god
Prvih 50% osoba imalo je 39 godina i manje, a preostalih 50% osoba bilo je
starije od 39 godina
KVANTILI numeriki niz ureen po veliini dijele na jednakobrojne dijelove. Medijan
spada meu kvantile
KVARTILI niz ureen po veliini dijele na 4 jednakobrojna dijela
DECILI niz ureen po veliini dijele na 10 jednakobrojnih dijelova
PERCENTILI niz ureen po veliini dijele na 100 jednakobrojnih dijelova
Broj kvartila je za jedan manji od njihova reda, tj. 3 su kvartila, 9 decila i 99 percentila
PREDAVANJE #4
ARITMETIKA SREDINA dobije se tako da se zbroje vrijednosti numerike
varijable i podijele sa njihovim brojem.
TOTAL zbroj vrijednosti numerike varijable; aritmetika sredina je jednaki dio totala po
jedinici
Svojstva aritmetike sredine:
1. zbroj vrijednosti odstupanja numerike varijable od njezine aritmetike sredine
jednak je nuli
2. zbroj kvadrata odstupanja vrijednosti numerike varijable od njezine aritmetike
sredine minimalan je
3. aritmetika sredina nalazi se izmeu najmanje i najvee vrijednosti niza za koji je
izraunata
17
Doc.dr.sc. Draenka izmi predavanja 2009.g.
JEDNOSTAVNA ARITMETIKA SREDINA rauna se kod pojedinanih kvantitavnih
podataka
N
x
x
N
i
i

1
Primjer 1.
Slijedei niz predstavlja cijene jednog proizvoda evidentirane na 10 prodajnih mjesta u
kn:
25 24 25 23 25 22 21 25 20 25 235/10=23.5 prosjena prodaja iznosila je
23.5 kn
Aritmetika sredina izraena je u istim mjernim jedinicama kao i obiljeje.
VAGANA (PONDERIRANA) ARITMETIKA SREDINA primjenjuje se za grupirane
podatke, tj. za distribuciju frekvencija
1. ponderi: APSOLUTNE FREKVENCIJE (f
i
)

fi
fixi
x
k
i 1
2. ponderi: RELATIVNE FREKVENCIJE U VIDU POSTOTAKA (P
i
)
100
1

k
i
pixi
x
3. ponderi: RELATIVNE FREKVENCIJE U VIDU PROPORCIJA (p
i
)

k
i
pixi x
1
Primjer 2. Distribucija frekvencija formirana na temelju pojedinanih vrijednosti
Dnevna prodaja garnitura sobnog namjetaja
BROJ
GARNITURA
BROJ DANA kol. 1*2
x
i
f
i
f
i
x
i
1 1 1
2 5 10
3 8 24
4 26 104
5 19 95
6 12 72
UKUPNO 71 306
18
Doc.dr.sc. Draenka izmi predavanja 2009.g.
PRAVI TOTAL ukupan broj
prodanih garnitura
4 31 , 4
71
306
x garniture dnevno
Primjer 3. Distribucija frekvencija formirana na temelju razreda
PROCIJENJENI PODTOTALI
PROCIJENJENI
TOTAL-
ukupna starost
promatranih
osoba
godina x 02 , 40
1793
5 , 71748

Prosjena starost aktivnog stanovnitva iznosila je 40.02 godina.
ARITMETIKA SREDINA ARITMETIKIH SREDINA odreuje se kao vagana sredina u
kojoj se za pondere uzima broj podataka za koje su pojedine sredine raunate ili tom
broju proporcionalne veliine.

k
i
k
i
Ni
i x Ni
X
1
1
Aktivno stanovnitvo u RH u 2003.g. (drugo polugodite)
u tisuama
STAROS
T
BROJ
OSOBA
PRAVE
GRANICE
RAZREDN
E
SREDINE
kol.2*4
f
i
x
i
f
i
x
i
15-24 216 14.5-24.5 19.5 4212.0
25-49 1152 24.5-49.5 37.0 42624.0
50-64 370 49.5-64.5 57.0 21090.0
65-(74) 55 64.5-(74.5) 69.5 3822.5
UKUPN
O
1793 - - 71746.5
19
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Primjer 4.
Prosjena plaa za sve kompanije:
39 , 3313
1120
3711000
X
Ako se svaka individualna vrijednost numerikog obiljeja zamijeni aritmetikom
sredinom dobiva se polazna veliina tj. total ili zbroj vrijednosti numerikog obiljeja.
ARITMETIKA SREDINA RELATIVNIH BROJEVA KOORDINACIJE odreuje se kao
vagana sredina u kojoj su ponderi baze tih brojeva

k
i
k
i
Bi
BiRi
R
1
1
RELATIVNI BROJEVI KOORDINACIJE omjerni su brojevi koji nastaju diobom dviju
koordinirajuih veliina
Bi
Vi
Ri
Grafiki se prikazuju na 2 naina:
1. jednostavnim stupcima
2. pravokutnicima ije su osnovice proporcionalne bazama tih brojeva, a visine
samim relativnim brojevima koordinacije
Primjer 5.
Odabrane kompanije zaposlenih i prosjene mjesene
plae u kn
KOMPANIJA BROJ
ZAPOSLENI
H
PROSJENA
PLAA
UKUPNA
PLAA
N
i
x
Ni
i
x
ALFA 550 3500 1925000
GAMA 320 2300 736000
TRADE 250 4200 1050000
UKUPNO 1120 - 3711000
20
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Prosjean broj stanovnika na km
2
za sve navedene drave:
2
/ . 35 22 . 35
54786277
1929776010
km st R
GEOMETRIJSKA SREDINA jednaka je N-tom korijenu produkta N pojedinanih
vrijednosti

N
N i
x x x x G .... ....
2 1

Za grupirane podatke geometrijska sredina dana je izrazom:


N
f
k
f
i
f f
k i
x x x x G .... ....
2 1
2 1

Primjer 6. zadani su koeficijenti dinamike


GODIN
A
2000 2001 2002 2003 2004
Vt - 1,06 1,05 1,03 1,02
prosjena stopa raunata pomou geometrijske sredine:
Promatrana pojava prosjeno se godinje
poveavala
za 3.99%.
Geometrijska i harmonijska sredina relativno se rijetko primjenjuju. Geometrijska sredina
se primjenjuje u analizi vremenskih nizova. Pomou nje se rauna prosjena stopa
promjene pojave. Geometrijska sredina poprima niu vrijednost od aritmetike sredine.
Najvee drave svijeta, povrina u km
2
i broj stanovnika na km
2
DRAVA POVRINA U
km
2
STANOVNITVO/
km
2
UKUPAN BROJ
STANOVNIKA
Bi Ri Vi= Ri*Bi
RUSIJA 17075400 8 136603200
KANADA 9970610 3 29911830
SAD 9629091 30 288872730
KINA 9596961 135 1295589735
BRAZIL 8514215 21 178798515
UKUPNO 54786277 - 1929776010
21
% 99 . 3 100 ) 1 03988 . 1 (
03988 . 1 02 . 1 03 . 1 05 . 1 06 . 1
.....
100 ) 1 (
4
1
3 2

S
G
V V V G
G S
n
n
Doc.dr.sc. Draenka izmi predavanja 2009.g.
HARMONIJSKA SREDINA reciprona vrijednost aritmetike sredine recipronih
vrijednosti varijable x
negrupirani pojedinani podaci

N
i i
x
N
H
1
1
grupirani podaci

k
i i
i
k
i
i
x
f
f
H
1
1
Harmonijska sredina manja je od aritmetike i geometrijske sredine
Primjer 7.
Ugostiteljska poduzea, ukupan promet (u tisuama kn) i promet po zaposlenom (u
tisuama kn)
UGOSTITELJSKA
PODUZEA
PROMET PROMET PO
ZAPOSLENOM
ZAPOSLENI
Vi Ri Vi/Ri = Bi
HOTELI 6272146 199 31518
KAMPOVI 272070 158 1722
RESTORANI 814160 178 4574
BAROVI 716065 131 5466
KANTINE 331094 137 2417
UKUPNO 8405535 - 45697
Prosjean promet po zaposlenom za sva ugostiteljska poduzea: kn tis R . 184
45697
8405535

Ako nazivnici relativnih brojeva koordinacije nisu poznati, a brojnici jesu ili se lake
procjenjuju do sredine e se doi pomou izraza za vaganu ponderiranu harmonijsku
sredinu:

k
i i
i
k
i
i
R
V
V
R
1
1
Ako imamo zadano Bi koristimo formulu za aritmetiku, a ako su nam zadane Vi
koristimo harmonijsku vaganu sredinu.
SKUPNI INDEKSI njima se prati dinamika skupine pojava u vremenu
npr.proizvodnja, uvoz, izvoz....
SKUPNI INDEKSI CIJENA
SKUPNI INDEKSI KOLIINA
SKUPNI INDEKS VRIJEDNOSTI
22
Doc.dr.sc. Draenka izmi predavanja 2009.g.
U pravilu se raunaju kao vagana aritmetika sredina individualnih indeksa. Ponderi su
obino vrijednosti. Uglavnom se izraunavaju:
LASPEYRESOV INDEKS CIJENA I KOLIINA
PAASCHEOV INDEKS CIJENA I KOLIINA
FISHEROV INDEKS CIJENA I KOLIINA
INDEKS VRIJEDNOSTI
Skupne indekse izraunavaju i objavljuju statistiki uredi. Obino su Laspeyresova tipa:
INDEKS POTROAKIH CIJENA mjera inflacije; INDEKS INDUSTRIJSKE PROIZVODNJE
Skupni indeksi cijena koriste se u postupku deflacioniranja tj. uklanjanja utjecaja
promjena cijena na vrijednosno izraene pojave.
PREDAVANJE #5
MJERE DISPERZIJE
Reprezentativnost srednje vrijednosti ovisi o stupnju varijabilnosti podataka.Varijabilnost
numerikog obiljeja predoava se i pomou grafikih prikaza: dijagram s tokama i
dijagram s pravokutnikom
Mjere za varijabilnost podataka su:
1. raspon varijacije
2. interkvartil
3. koeficijent kvartilne devijacije
4. varijanca
5. standardna devijacija
6. koeficijent varijacije
7. srednje apsolutno odstupanje (MAD)
23
Doc.dr.sc. Draenka izmi predavanja 2009.g.
1. RASPON VARIJACIJE
pojedinani podaci odreuje se kao razlika izmeu najvee i najmanje
vrijednosti
min max
x x R
x

distribucija frekvencija formirana na temelju pojedinanih podataka
odreuje se kao razlika izmeu posljednje i prve vrijednosti
1
x x R
k x

distribucija frekvencija s razredima aproksimira se kao razlika izmeu
gornje granice posljednjeg i donje granice prvog razreda ili kao razlika
razrednih sredina posljednjeg i prvog razreda.
Raspon varijacije je apsolutna (izraena je u istim mjernim jedinicama kao i obiljeje) i
nepotpuna (dobiva se iz samo dvije vrijednosti) mjera disperzije.
2. INTERKVARTIL
KVARTILI:
PRVI ILI DONJI KVARTIL (Q
1
) vrijednost numerike varijable koja lanove niza
dijeli u dvije skupine. U prvoj je skupini 25% elemenata s vrijednostima varijable
koja je jednaka ili manja od donjeg kvartila, a u drugoj je skupini 75% elemenata
s vrijednostima veim od donjeg kvartila.
DRUGI ILI MEDIJAN (Q
2
)
TREI ILI GORNJI KVARTIL (Q
3
) - vrijednost numerike varijable koja lanove niza
dijeli u dvije skupine. U prvoj je skupini 75% elemenata s vrijednostima varijable
koja je jednaka ili manja od gornjeg kvartila, a u drugoj je skupini 25%
elemenata s vrijednostima veim od gornjeg kvartila.
Interkvartil se odreuje kao razlika kvartila
1 3
Q Q I
Q

50%
Interpretira se kao raspon varijacije sredinjih 50% podataka:
Interkvartil je takoer apsolutna i nepotpuna mjera disperzije.
3. KOEFICIJENT KVARTILNE DEVIJACIJE njime se usporeuje stupanj disperzije
raznorodnih nizova. Odreuje se kao omjer interkvartila i zbroja kvartila:
1 3
1 3
Q Q
Q Q
V
Q
+

0 V
Q
< 1
Ovo je relativna i nepotpuna mjera disperzije.
GRAFIKI PRIKAZ VARIJABILNOSTI PODATAKA dijagram s pravokutnikom box-plot (B-
P) dijagram
Za njegovu konstrukciju koristi se 5 pokazatelja numerikog niza 5's (five summary
numbers)
najmanja vrijednost
najvea vrijednost
medijan
donji kvartil
24
Doc.dr.sc. Draenka izmi predavanja 2009.g.
gornji kvartil
Na ovom grafikom prikazu ouava se raspon varijacije i interkvartilni raspon te se
prosuuje o moguoj asimetriji kao i o pojavi netipinih vrijednosti ( out lier)
25
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Primjer 1. Negrupirani tj. pojedinani podaci
Mjereno je vrijeme u minutama potrebno za rjeavanje jednog zadatka iz statistike za 10
studenata. Dobiveni su ovi rezultati : 20 22 25 27 28 28 30 30 33 35
Podaci moraju biti ureeni po veliini.
raspon varijacije: 3015 = 15 min
Vrijeme potrebno za rjeavanje zadatka bilo je izmeu 20 i 35 min. Odnosno
u raponu od 15 min.
interkvartil:
donji kvartil: N/4 = 10/4 = 2.5 INT
r = INT (N/4) + 1 = 2+1 = 3, Q
1
=x
3
=25
Prva etvrtina studenata imala je vrijeme 25 min i manje, a
preostale 3
etvrtine imale su vrijeme vee od 25 min.
gornji kvartil: 3N/4 = 30/4 = 7.5 INT
r = INT (3N/4) + 1 =7+1=8, Q
3
=x
r
=x
8
=30
Prve tri etvrtine studenata imale su vrijeme 30 min i manje, a
preostala
etvrtina imala je vrijeme vee od 30 min.
I
Q
= Q
3
Q
1
= 30 - 25=5 min
Raspon varijacije sredinjih 50% studenata iznosio je 5 min, tj. njihova
vremena bila su izmeu 25 i 30 min.
koeficijent kvartilne devijacije
V
Q
= (Q
3
-Q
1
)/(Q
3
+Q
1
) = (30-25)/(30+25) = 0.09
Raspon varijacije sredinjih 50% studenata u relativnom iznosu je 0.09.
B-P dijagram
N/2 = 10/2 = 5 = INT , r=5
M
e
= (x
r
+X
r+1
)/2 = (x
5
+x
6
)/2 = (28+28)/2 = 28
26
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Primjer 2. Distribucija frekvencija formirana na temelju pojedinanih vrijednosti
Pismeni ispit iz statistike sadri 5 zadataka. Distribucija frekvencija prema broju rjeenih
zadataka dana je u tabeli:
BROJ
ZADATAKA
BROJ
STUDENAT
A
KUMULATIVNI
NIZ manje od
x
i
f
i
S(x
i
)
0 10 10
1 25 35
2 55 90
3 125 215
4 50 265
5 15 280
UKUPNO 280 -
raspon varijacije: R
x
= x
k
x
1
= 5-0 = 5 zadataka
Broj rjeenih zadataka bio je izmeu 0 i 5 odnosno u rasponu od 5 zadataka.
interkvartil:
donji kvartil: N/4 = 70 ; Za Q
1
se uzima vrijednosti varijable s prvom
kumulativnom frekvencijom
koja sadri vrijednost N/4 Q
1
= 2
gornji kvartil: 3N/4 = 210 Q
3
=3
I
Q
= Q
3
Q
1
= 3 2= 1
Raspon varijacije sredinjih 50% studenata iznosio je 1 zadatak, tj. broj rjeenih
zadataka bio je
izmeu 2 i 3.
koeficijent kvartilne devijacije
V
Q
= (Q
3
-Q
1
)/(Q
3
+Q
1
) = (3-2)/(3+2) = 0.2
Raspon varijacije sredinjih 50% studenata u relativnom iznosu je 0.2
Primjer 3. Distribucija frekvencija s razredima
Distribucija studenata prema vremenu potrebnom za rjeavanje jednog zadatka iz
statistike u min.

UTROEN
O VRIJEME
BROJ
STUDENAT
A
KUMULATIVNI
NIZ manje od
VELIINA
RAZREDA
f
i
S(x
i
) i
i
10-15 15 15 5
15-20 20 35 5
20-25 30 65 5
25-30 10 75 5
UKUPNO 75 - -
27
Doc.dr.sc. Draenka izmi predavanja 2009.g.
raspon varijacije
Rx = 30 10 = 20 min
Rx = 27.5 12.5 = 15 min
interkvartil
N/4 = 75/4 = 18.75
Kvartilni razred je razred ija kumulativna frekvencija prva ukljuuje vrijednost N/4
i
f
f
N
L Q
k

+

var
1
1 1
4 min 9 . 15 5
20
15 75 . 18
15
1

+ Q
i
f
f
N
l Q
k

+

var
1
1 3
4
3
min 5 . 23 5
30
35 25 . 56
20
3

+ Q
I
Q
= 23.5 15.9 = 7.6 min
Raspon varijacije sredinjih 50% studenata iznosio je 7.6 min.
V
Q
= (Q
3
-Q
1
)/(Q
3
+Q
1
) = (23.5 15.9)/(23.5 15.9) = 0.19
Raspon varijacije sredinjih 50% studenata u relativnom iznosu je 0.19.
4. SREDNJE APSOLUTNO ODSTUPANJE (MAD) za mjerenje disperzije moe se
koristiti i prosjeno apsolutno odstupanje vrijednosti varijable od njezine aritmetike
sredine ili medijana:
pojedinani podaci:
N
x x
MAD
N
i
i

1

N
M x
MAD
N
i
e i
Me

1
za distiribuciju frekvencija apsolutne razlike ponderiraju se apsloutnim ili
relativnim frekvencijama
Primjer 4.
Dnevna prodaja hladnjaka u 10 prodavaonica iznosila je: 2 5 3 3 7 3 4 6 4 3
4
10
40

N
x
x
PRODAJ
A
x
i
x x
i

2 2
5 1
3 1
3 1
7 3
3 1
4 0
6 2
4 0
3 1
40 12
PRODAJ
A
xi
e i
M x
2 1,5
5 1,5
3 0,5
3 0,5
7 3,5
3 0,5
4 0,5
6 2,5
4 0,5
3 0,5
40 12,0
28
Doc.dr.sc. Draenka izmi predavanja 2009.g.
MAD = 12/10 = 1,2
2 3 3 3 3 4 4 5 6 7
N/2 = 5 = INT, r = 5
M
e
= (x
5
+x
6
)/2 = (3+4)/2 = 3.5
PREDAVANJE #6
5. VARIJANCA aritmetika sredina kvadrata odstupanja vrijednosti numerike varijable
od njezine aritmetike sredine. Varijanca je mjera disperzije u drugom stupnju koju je
potrebno vratiti u prvi stupanj.
negrupirani podaci
N
x x
N
i
i

1
2
2


grupirani podaci

k
i
i
k
i
i i
f
x x f
1
1
2
2
) (

6. STANDARDNA DEVIJACIJA pozitivni drugi korijen iz varijance. Potpuna i apsolutna


mjera disperzije.
negrupirani podaci
N
x x
N
i
i

1
2
) (

grupirani podaci

k
i
i
k
i
i i
f
x x f
1
1
2
) (

7. KOEFICIJENT VARIJACIJE realtivna mjera disperzije. Odreuje se kao omjer


srtandardne devijacije i aritmetike sredine pomnoen sa sto.
100
x
V

29
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Standardna devijacija se interpretira kao prosjeno odstupanje od prosjeka izraeno
apsolutno, a koeficijent varijacije kao to isto odstupanje izraeno relativno i to u vidu
postotka.
Primjer 1. Negrupirani tj. pojedinani podaci
Mjereno je vrijeme (u minutama) potrebno za rjeavanje jednog zadatka iz statistike za
10 stuudenata. Dobiveni su ovi rezultati:
% 76 . 15 100
8 . 27
38 . 4
100
min 38 . 4 16 . 19
16 . 19
10
60 . 191
) (
min 8 . 27
10
278
2
1
2
2
1


x
V
N
x x
N
x
x
N
i
i
N
i
i

Interpretacija:
Prosjeno vrijeme rjeavanja zadataka iznosilo je 27.8 minuta s prosjenim odstupanjem
od 4.38 minute odnosno 15.76%.
Primjer 2. Distribucija frekvencija formirana na temelju pojedinanih podataka
Pismeni ispit iz statistike sadri 5 zadataka. Distribucija studenata prema broju rjeenih
zadataka dana je u tabeli:

% 64 . 39 100
80 . 2
11 . 1
100
11 . 1 23 . 1
23 . 1
280
2 . 344
) (
80 . 2
280
785
2
1
1
2
2
1
1


x
V
zadataka
f
x x f
zadataka
f
x f
x
k
i
i
k
i
i i
k
i
i
k
i
i i

Prosjeni broj rjeenih zadataka iznosio je 2.80 zadatka. S prosjenim odstupanjem od


1.11 zadataka odnosno 39.64%.
Primjer 3. Distribucija frekvencija s razredima
Struktura aktivnog stanovnitva u drugom polugoditu 2003.g. u RH
VRIJEME
x
i
2
) ( x x
i

20 60.84
22 33.64
25 .
27 .
28 .
28 .
30 .
30 .
33 .
35 .
UKUPNO 191.60
BROJ
ZADATAK
A
BROJ
STUDENA
TA
kol. 1x2
x
i
f
i
f
i
x
i
2
) ( x x f
i i

0 10 0 78.4
1 25 25 81.0
2 55 110 .
3 125 375 .
4 50 200 .
5 15 75 .
UKUPNO 280 785 344.2
30
Doc.dr.sc. Draenka izmi predavanja 2009.g.
STAROS
T
STAROS
T%
PRAVE
GRANICE
RAZRED
NE
SREDINE
kol. 2x4 VELIIN
A
RAZRED
A
KORIGIRAN
E
FREKVENCIJ
E
P
i
x
i
P
i
x
i
2
) ( x x P
i i
P
ci
15-24 12 14.5-24.5 19.5 234.0 5043.00 10 12
25-49 64 24.5-49.5 37.0 2368.0 . 25 25.6
50-64 21 49.5-64.5 57.0 1197.0 . 15 14.0
65-(74) 3 64.5-
(74.5)
69.5 208.5 . 10 3.0
UKUPN
O
100 - - 4007.5 14298.75 - -
Interpretacija:
Prosjena starost aktivnog stanovnitva
iznosila je 40
godina. S prosjenim odstupanjem od
11.96 godina
odnosno 30%.
STANDARDIZIRANA VARIJABLA linearna transformacija numerike varijable x.
Odreuje se tako da se odstupanja numerike varijable od njezine aritmetike sredine
podijele sa standardnom devijacijom, tj. da se izraze u jedinicama standardnih devijacija.
Aritmetika sredina standardizirane varijable jednaka je nuli, a standardna devijacija
jednaka je jedan.

x x
z

1 ; 0
z
z
PRAVILO EBIEVA govori da je najmanja proporcija lanova bilo kojeg niza
obuhvaenih bilo kojim intervalom
2
1
1 , 1 ,
k
jednaka k k x > t .
U pojasu 2 t x nalazi se najmanje 0.75 tj. 75% svih podataka.
U pojasu 3 t x nalazi se najmanje 0.889 tj. 88.89% svih podataka.
Ako su podaci rasporeeni po normalnoj distribuciji
onda:
pojas 1 + x obuhvaa oko 68% podataka
pojas 2 t x obuhvaa oko 95% podataka
31
% 30 100
00 . 40
96 . 11
100
96 . 11 99 . 142
99 . 142
100
75 . 14298
) (
40
100
5 . 4007
100
2
1
1
2
2
1


x
V
godina
P
x x P
godina
x P
x
k
i
i
k
i
i i
k
i
i i

Doc.dr.sc. Draenka izmi predavanja 2009.g.


pojas 3 t x obuhvaa oko 99.73% podataka


3 2 1 1 2 3 x
Primjer 4.
Prosjean broj bodova na 1. kolokviju iz statistike iznosi 15, a prosjeno odstupanje od
prosjeka iznosi 5. Na drugom kolokviju postignut je prosjean broj bodova 17 s
prosjenim odstupanjem od prosjeka 4. Student je na prvom kolokviju postigao 20, a na
drugome 22 boda. to se moe zakljuiti o uspjehu studenta na kolokvijima?
22 20
4 5
17 15
2 1
2 1
2 1



x x
x x


Vrijednost standardiziranog obiljeja na prvom kolokviju:

00 . 1
5
15 20
1
1
1

x x
z
Vrijednost standardiziranog obiljeja na drugom kolkviju:

25 . 1
4
17 22
2
2
2

x x
z
Student je na oba kolokvija postigao iznad prosjean rezultat. Bolji je na drugom
kolokviju jer je odstupanje od prosjeka na vie 1.25 , a na prvome 1 .
Primjer 5.
Mjereno je vrijeme u minutama potrebno za rjeavanje jednog zadatka iz statistike za 10
studenata. Dobiveni su ovi rezultati: 20 22 25 27 28 28 30 30 33 35
Je li vrijeme rjeavanja od 35 minuta netipino?
Netipian je podatak koji se nalazi izvan pojasa 2 t x tj. ako od prosjeka odstupa za vie
od 2.
Ako se podaci rasporeuju po normalnoj distribuciji netipian je podatak koji se nalazi
izvan pojasa 3 t x tj. ako od prosjeka odstupa za vie od 3.
Budui da se vrijeme od 35 minuta nalazi u
pojasu 2 t x ne moe se

smatrati netipinim.
PREDAVANJE #7
MJERE ASIMETRIJE njima se mjeri nain rasporeda podataka prema aritmetikoj
sredini ili nekoj drugoj vrijednosti.Najvanije su:
1. Koeficijent asimetrije
3
- potpuna mjera
2. Pearsonova mjera nepotpune
3. Bowleyeva mjera mjere
1. KOEFICIJENT ASIMETRIJE
3

32

64 . 1
38 . 4
8 . 27 35
min 38 . 4
min 8 . 27

x x
z
x
Doc.dr.sc. Draenka izmi predavanja 2009.g.
MOMENTI OKO SREDINE aritmetike sredine odstupanja vrijednosti numerike
varijable od
njezine aritmetike sredine podignuti na neku potenciju
pojedinani podaci
N
x x
N
i
i
r

1
) (

grupirani podaci

k
i
i
k
i
r
i i
r
f
x x f
1
1
) (

- s obzirom na veliinu r govori se o nultom, prvom, drugom, treem ili etvrtom


momentu oko
sredine
- koeficijent asimetrije
3
je omjeru treeg momenta oko sredine i standardne
devijacije podignute
na treu potenciju
3
3
3

obino se kree u intervalu z, a u odreenim


sluajevima moe
biti izvan toga intervala:

3
= 0 simetrina distribucija

3
< 0 negativno asimetrina
distribucija

3
> 0 pozitivno asimetrina
distribucija
2. PEARSONOVA MJERA temelji se na odnosu srednjih vrijednosti u distribucijama
frekvencija
simetrina distribucija
pozitivno asimetrina distribucija
33
Doc.dr.sc. Draenka izmi predavanja 2009.g.
negativno asimetrina distibucija
- Pearsonova mjera definira se kao standardizirano odstupanje vrijednosti medijana
ili moda od
aritmetike sredine:

) ( 3 Me x
S
t

) ( Mo x
S
t

kree se u intervalu
S
t
= 0 simetrina distribucija
S
t
> 0 pozitivno asimetrina distribucija
S
t
< 0 negativno asimetrina distribucija
3. BOWLEYJEVA MJERA temelji se na odnosu medijana i kvartila


simetrina distribucija
0 2
3 1
3 1
+

Me Q Q
Me Q Q Me

pozitivno asimetrina distribucija
0 2
3 1
3 1
> +
<
Me Q Q
Me Q Q Me
negativno asimetrina distibucija
0 2
3 1
3 1
< +
>
Me Q Q
Me Q Q Me
34
Doc.dr.sc. Draenka izmi predavanja 2009.g.

1 3
3 1
2
Q Q
Me Q Q
S
ka

kree se u intervalu 1
S
ka
= 0 simetrina distribucija
S
ka
> 0 pozitivno asimetrina distribucija
S
ka
< 0 negativno asimetrina
distribucija
Primjer 1. pojedinani podaci
Radi kontrole deklarirane teine izabran je uzorak od 10 proizvoda pakiranih u vreice.
Mjerenjem su dobiveni ovi rezultati u gramima: 10 12 15 13 10 11 12 11 11
15


15 5 . 7
4
3
11 5 . 2
4
5 . 11
2
12 11
2
5
2
11
12
10
120
8 3
3 1
6 5

x Q
N
x Q
N
g
x x
INT
N
Me
g Mo
g
N
x
x
i
1.koeficijent asimetrije
-
3
je pozitivan, distibucija je umjereno pozitivno asimetrina
2. Pearsonova mjera 3. Bowleyjeva mjera

5 . 0
11 13
5 . 11 2 13 11 2
1 3
3 1

Q Q
Me Q Q
S
ka
i
x ) ( x x
i

2
) ( x x
i

3
) ( x x
i

10 -2 4 -8
12 0 0 0
15 . . .
13 . . .
10 . . .
11 . . .
12 . . .
11 . . .
11 . . .
15 . . .
120 0 30 36
35
69 . 0
73 . 1
6 . 3
73 . 1 3
3 3
3
3
2


M
g
3
10
30
) (
6 . 3
10
36
) (
1
2
2
2
1
3
3

N
x x
N
x x
N
i
i
N
i
i

53 . 0
173
11 12

Mo x
S
k
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Primjer 2. distribucija frekvencija s razredima
Distribucija studenata prema vremenu potrebnom za rjeavanje
jednog zadatka iz statistike
UTROE
NO
VRIJEME
BROJ
STUDENAT
A
RAZREDNE
SREDINE
i
f
i
x
i i
x f
2
) ( x x f
i i

3
) ( x x f
i i

10-15 15 12.5 187.5 187.5 -5907.49
15-20 20 17.5 350 - -
20-25 30 2.5 675 - -
25-30 10 17.5 275 - -
UKUPNO 75 - 1487.5 1716.67 -1076.29
Distribucija je blago negativno asimetrina.
Pearsonova mjera: 38 . 0
78 . 4
67 . 21 83 . 19

Mo x
S
k
Bowleyjeva mjera:
18 . 0
94 . 15 54 . 23
42 . 80 2 54 . 23 94 . 15 2
1 3
3 1

Q Q
Me Q Q
S
ka
MJERA ZAOBLJENOSTI
KOEFICIJENT ZAOBLJENOSTI
4
njime se mjeri zaobljenost modalnog vrha
distribucije. Izraunava se kao omjer etvrtog momenta oko sredine i standardne
devijacije podignute na 4. potenciju
4
4
4

negrupirani podaci
N
x x
M
N
i
i

1
4
4
) (
grupirani podaci

k
i
i
k
i
i i
f
x x f
M
1
1
4
4
) (
36
13 . 0
78 . 4
35 . 14
min 78 . 4 89 . 22
87 . 22
75
67 . 1716
) (
35 . 14
75
29 . 1076
) (
min 83 . 19
75
5 . 14875
3 3
3
3
2
2
2
2
3
3

M
f
x x f
M
f
x x f
M
f
x f
x
i
i i
i
i i
i
i i
min 54 . 23
min 94 . 15
min 42 . 20
min 67 . 21
3
1

Q
Q
Me
Mo
Doc.dr.sc. Draenka izmi predavanja 2009.g.
-
4
= 3 NORMALNA DISTRIBUCIJA najvanija teorijska distribucija
-
4
> 3 iljatija distribucija od normalne
-
4
< 3 plosnatija distribucija od normalne
-
4
1.8 pravokutna distribucija
-
4
< 1.8 U-distibucija
EKSCES alternativna mjera zaobljenosti
3
1
K
K = 0 ---- normalna distribucija
K > 0 ---- iljatija distribucija
K < 0 ---- plosnatija distribucija
Primjer 3. pojedinani podaci
Distribucija je plosnatija od normalne.
Primjer 4. distribucija frekvencija s razredima
i
x
4
) ( x x
i

10 16
12 0
15 .
13 .
10 .
11 .
12 .
11 .
11 .
15 .
120 198
37
79 . 0 3 21 . 2 3
21 . 2
73 . 1
8 . 19
8 . 19
10
198
) (
73 . 1
12
3
4 4
4
4
4
4


K
M
N
x x
M
g
g x
i
Doc.dr.sc. Draenka izmi predavanja 2009.g.
96 . 0 3 04 . 2 3
04 . 2
78 . 4
99 . 1066
99 . 1066
75
41 . 80024
) (
min 78 . 4
min 83 . 19
4
4 4
4
4
4
4


K
M
f
x x f
M
x
i
i i
Distribucija je plosnatija od normalne.
MJERE KONCENTRACIJE njima se mjeri nain rasporeda totala po jedinicama niza
apsolutne najee se koriste koncentracijski omjeri
relativne najee se koristi Ginijev koeficijent
koncentracije
1. KONCENTRACIJSKI OMJER reda r se odreuje tako da se zbroj r vrijednosti (od
njih N) podijeli sa zbrojem N vrijednosti. Pri tome se pretpostavlja da su podaci
poredani od najveeg prema najmanjem.

1
1
1
1

r
N
i
i
r
i
i
r
C
N
x
x
C
Ako se radi o ravnomjernoj raspodjeli, koncentracijski omjer poprima vrijednost
od 1 do N.
A ako se radi o maksimalnoj raspodijeli, koncentracijski omjer poprima vrijednost
1.
- u analizi koncentracije koristi se grafiki prikaz LORENZOVA KRIVULJA
1) na osi apscisa nalazi se aritmetiko mjerilo za kumulativni niz relativnih
frekvencija
2) na osi ordinata nalazi se aritmetiko mjerilo za kumulativni niz proporcija
podtotala
3) prva toka ima koordinate (0,0); posljednja toka ima koordinate (1,1);
koordinate ostalih toaka odreene su vrijednostima lanova kumulativnih
nizova
4) u grafiki prikaz ucrtava se pravac jednolike raspodjele, on prolazi tokama
(0,0) i (1,1)
UTROENO
VRIJEME
BROJ
STUDENATA
RAZREDNE
SREDINE
i
f
i
x
4
) ( x x f
i i

10-15 15 12.5 13 301.92
15-20 20 17.5 .
20-25 30 22.5 .
25-30 10 27.5 .
UKUPNO 75 - 80 024.41
38
Doc.dr.sc. Draenka izmi predavanja 2009.g.
2. GINIJEV KOEFICIJENT temelj za njegovo utvrivanje je povrina izmeu pravca
jednolike raspodjele i Lorenzove krivulje. to je koncentacija vee to se Lorenzova
krivulja vie udaljuje od toga pravca
x
i
- pojedinane vrijednosti
varijable
negrupirani podaci
i - redni broj podatka
- podaci moraju biti ureeni od najmanjeg prema najveem
- kree se u intervalu od 0 do 1
- G = 0 ravnomjerna raspodjela
- G = 1 maksimalna koncentracija
- NORMIRANI KOEFICIJENT GINIJA
1

N
N
G G
0 = G nema koncentracije
0 < G 0,25 slaba
0.25 < G 0,5 umjerena
0.5 <G 0.75 visoka
0.75 < G 1 izrazito visoka
G = 1 - maksimalna
39

N
i
i
N
i
N
i
i i
x N
x N ix
G
1
1 1
) 1 ( 2
Doc.dr.sc. Draenka izmi predavanja 2009.g.
PREDAVANJE #8
OSNOVNI POJMOVI VJEROJATNOSTI
VJEROJATNOST brojana mjera nastanka neizvjesnih, tj. sluajnih dogaaja.
Vjerojatnost nastanka dogaaja A jednaka je P(A) pri emu je 0 P(A) 1. Nekada se
izraava i u obliku postotka.
DEFINICIJE VJEROJATNOSTI
SLUAJNI POKUS pokus je sluajan ako se u definiranim uvjetima moe ponavljati, ako
postoje barem 2 razliita ishoda te ako se ishodi ne mogu predvidjeti sa sigurnou.
PROSTOR UZORKA S skup svih moguih ishoda sluajnog pokusa
SLUAJNI DOGAAJ jednolani ili vielani podskup skupa S te su sa dogaajima
doputene skupovne operacije.
1. KLASINA DEFINICIJA (vjerojatnost a priori) pretpostavlja se da se pokus ponavlja
konaan broj puta, pri emu se vjerojatnost odreuje kao omjer povoljnog broja
ishoda m i ukupnog broja ishoda n
n
m
A P ) (
2. STATISTIKA VJEROJATNOST (vjerojatnost a posteriori) broj ponavljanja pokusa je
beskonaan, a vjerojatnost se aproksimira relativnom frekvencijom, tj.omjerom
apsolutne frekvencije opsega i opsega statistikog skupa.
3. SUBJEKTIVNA VJEROJATNOST to je broj iz intervala [0,1] odreen na temelju
prosudbe okolnosti relevantnih za nastup sluajnog dogaaja.
SVOJSTVA VJEROJATNOSTI:
1) vjerojatnost da dogaaj A nee nastupiti jednaka je P()=1-P(A)
2) vjerojatnost istodobnog nastupa dogaaja A
1
i A
2
jednaka je P(A
1
A
2
)
3) ako su dogaaji meusobno iskljuivi, vjerojatnost da e nastupiti dogaaj A
1
ili A
2

jednaka je P(A
1
UA
2
)=P(A
1
)+P(A
2
)
4) ako dogaaji nisu meusobno iskljuivi, vjerojatnost nastupa barem jednog od njih
jednaka je P(A
1
UA
2
)=P(A
1
)+P(A
2
)-P(A
1
A
2
)
5) ponekad je potrebno odrediti vjerojatnost nastupa dogaaja A uz uvjet da se
dogodio dogaaj B. Takva se vjerojatnost naziva uvjetnom vjerojatnou
) (
) (
) | (
B P
B A P
B A P

6) ako su dogaaji neovisni tada vrijedi da je P(AB)=P(A)P(B)


SLUAJNA VARIJABLA X numerika funkcija koja svakom ishodu sluajnog pokusa
pridruuje realan broj.
diskretna- ako poprima konaan broj vrijednosti
kontinuirana moe poprimiti bilo koju vrijednost iz nekog intervala
DISTRIBUCIJA VJEROJATNOSTI
diskretne sluajne varijable skup ureenih parova razliitih vrijednosti sluajne
varijable x
i
i pripadajuih vjerojatnosti p(x
i
). Ima slijedea svojstva:
40
Doc.dr.sc. Draenka izmi predavanja 2009.g.
- p(x
i
) 0
- p(x
i
) = 1
Kumulativna funkcija ili funkcija distribucije F(x
i
) pokazuje kolika je vjerojatnost
da sluajna
varijabla x poprimi vrijednost x
i
ili manju.
kontinuirane sluajne varijable opisuje razdiobu vjerojatnosti na intervalu
vrijednosti varijable. Njena svojstva:
- f(x) 0
-


1 ) ( dx x f
Primjer 1.
KVALITETA
PROIZVODA
(KLASA)
BROJ PROIZVODA UKUPNO
DOB A DOB B
I 20 10 30
II 10 10 20
III 30 20 50
UKUPNO 60 40 100
marginalne vjerojatnosti
a) Kolika je vjerojatnost odabira proizvoda I. klase? P(A
1
)=0.3
b) Kolika je vjerojatnost odabira proizvoda dobavljaa B? P(B
2
) = 0.4
c) Kolika je vjerojatnost izbora proizvoda III. klase dobavljaa A? P(A
3
B
1
) = 0.3
d) Kolika je vjerojatnost izbora proizvoda I. ili III. klase? P(A
1
UA
3
) = P(A
1
)+P(A
3
) =
0.3+0.5 = 0.8
e) Kolika je vjerojatnost da se izabere proizvod III. klase ili proizvod dobavljaa B?
P(A
3
UB
2
) = P(A
3
)+P(B
2
)-P(A
3
B
2
)= 0.5 + 0.4 0.2 =0.7
f) Kolika je vjerojatnost izbora proizvoda dobavljaa A ako je poznato da je III. klase?

6 . 0
5 . 0
3 . 0
) (
) (
) | (
3
1 3
3 1

A P
B A P
A B P
g) Jesu li varijable kvaliteta i dobavlja neovisne?
Ako bi varijable kvaliteta i dobavlja bile neovisne, vjerojatnosti bi u polju tabele bile
jednake umnoku
KVALITETA
PROIZVODA
(KLASA)
BROJ PROIZVODA UKUPNO
DOB A
(B
1
)
DOB B
(B
2
)
I (A
1
) 0.2 0.1 0.3
II (A
2
) 0.1 0.1 0.2
III (A
3
) 0.3 0.2 0.5
UKUPNO 0.6 0.4 1
41
Doc.dr.sc. Draenka izmi predavanja 2009.g.
marginalnih vjerojatnosti
18 . 0 6 . 0 3 . 0 ) ( ) ( ) (
) ( ) ( ) (
1 1 1 1


B P A P B A P
B P A P B A P
j i j i
Budui da je 0.20.18, izmeu kvalitete proizvoda i dobavljaa postoji zavisnost.
Primjer 2.
a) Pokaite da je navedena distribucija, distribucija
vjerojatnosti!

1 ) ( ) 2
0 ) ( ) 1
i
i
x p
x p
DA
b) Odredite oekivanu vrijednost!
[ ]

00 . 2 ) (
i i
x p x x F
c) Odredite vrijednosti funkcije distribucije! (tablica)
d) Odredite vjerojatnost p(x2)!
7 . 0 4 . 0 2 . 0 1 . 0 ) 2 ( + + x p
MODELI DISTRIBUCIJA VJEROJATNOSTI temelj inferencijalne statistike
Distribucije vjerojatnosti diskretne sluajne varijable: (najee se koriste binomna i
poissonova)
1. BINOMNA
2. POISSONOVA
3. HIPERGEOMETRIJSKA
4. UNIFORMNA
1. BINOMNA DISTRIBUCIJA njena je definicija povezana sa Bernaulijevim pokusom.
Bernaulijev pokus je sluajni pokus slijedeih svojstava: - ima dva ishoda (uspjeh i
neuspjeh)
- vjerojatnost ishoda uspjeh je p, a neuspjeh q=1-p
- pokusi su neovisni

x n x
q p
x
n
x P

,
_

) (

)! ( !
!
x n x
n
x
n

,
_

n-broj ponavljanja Bernaulijevih pokusa


p-vjerojatnst ishoda uspjeh
x-sluajni broj ishoda uspjeha

Oekivana vrijednost
[ ] p n x E
Varijanca
q p n
2

2. POISSONOVA DISTRIBUCIJA granini sluaj binomne distribucije. Prikladna je za


opis rijetkih dogaaja, tj. dogaaja koji se javljaju s malom vjerojatnou.
x
i
p(x
i
)
xi
p(x
i
)
F(x
i
)
0 0.1 0 0.1
1 0.2 0.2 0.3
2 0.4 0.8 0.7
3 0.2 0.6 0.9
4 0.1 0.4 1.0
UKUPN
O
1.0 2.0 -
42
Doc.dr.sc. Draenka izmi predavanja 2009.g.
!
) (
x
e
x p
x n

x-broj povoljnih ishoda


Oekivana vrijednost
[ ] x E
Varijanca

2
Primjer 3.
Prema raspoloivim podaciima banke u prosjeku 5 stranaka po satu zahtijeva usluge
oroavanja depozita. Pretpostavi li se da stranke prispjevaju u banku neovisno, po
satima u random vremenu s itom vjerojatnosti, kolika je vjerojatnost da se pred elterom
za oroavanje nau: (broj stranaka koje u jednom satu za radnog vremena dolaze
neovisno i s istom vjerojatnosti diskretna je sluajna varijabla koja se ravna prema
Poissonovoj distribuciji s parametrom = 5.)
a) 3 stranke? 14037 . 0
! 3
) 3 (
5

e
P
b) vie od 1 stranke?

[ ]
03369 . 0
! 1
5
) 1 (
00674 . 0
! 0
5
) 0 (
95957 . 0 ) 1 ( ) 0 ( 1 ) 1 (
1 5
0 5


+ >

e
p
e
p
p p x P
PREDAVANJE #9
Distribucije vjerojatnosti kontinuirane sluajne varijable:
1. NORMALNA (GAUSSOVA)
2. STUDENTOVA (T-DISTRIBUCIJA)
3.
2
(HI-KVADRAT)
4. F-DISTRIBUCIJA
5. UNIFORMNA KONTINUIRANA
6. EKSPONENCIJALNA
1. NORMALNA (GAUSSOVA) DISTRIBUCIJA najvanija distribucija vjerojatnosti.
- dvoparametarska funkcija (odreena s 2 parametra) : oekivana vrijednost i
varijanca
) , (
2
N
- zvonolika je i simtrina
- budui da aritmetika sredina i standardna devijacija ovise o mjernim jedinicama
varijable uvodi se
jedinina (standardizirana) normalna distribucija

x
z

2
2 2
; 0 ); 1 , 0 ( N
Jedinina normalna distribucija je tabelirana. U poljima tabele nalaze se povrine koje
predstavljaju
vjerojatnosti. U pred-stupcu tabele su sve vrijednosti izraene kao brojevi s jednom
decimalom. Druga
decimala nalazi se u zaglavlju.Budui da je distribucija simetrina u tabeli su dane
samo vrijednosti z.
43
Doc.dr.sc. Draenka izmi predavanja 2009.g.
oznaena povrina oznaava vjerojatnost
da
sluajna varijabla poprimi vrijednost iz
intervala od 0 do z.
Primjer 1.
Sluajna varijabla x distribuirana je po normalnoj distribuciji N ( ,
2
). Odredite
vjerojatnost da varijabla poprimi vrijednost:
a) - < x < +

6826 . 0 3413 . 0 2 ) 00 . 1 ( 2
) 1 1 ( ) (

< < + < <
z P
z p x p
Kaemo da je 68.26% vjerojatno da e sluajna varijabla z zauzeti vrijednosti izmeu
-1 i 1 ili da e
sluajna varijabla x zauzeti vrijednost izmeu - i +.
44
1
) (
1
) (
0

z
z
z
z
x
z
Doc.dr.sc. Draenka izmi predavanja 2009.g.
b) -2 < x < +2


Kaemo da je 95,44% vjerojatno da e sluajna varijabla z zauzeti vrijednost izmeu -2 i


2 ili da e sluajna varijabla x zauzeti vrijednost izmeu -2 i +2.
2. STUDENTOVA DISTRIBUCIJA
- njen oblik je odreen veliinom n
- za n>30 (veliki uzorak) distribucija se po obliku pribliava normalnoj distribuciji
- za n<30 (mali uzorak) distribucija je vie razvuena na obje strane uzdu apscise
- i ona je zvonolika i simetrina te tabelirana
- u pred-stupcu tablice nalaze se stupnjevi slobode, u zaglavlju su vjerojatnosti. U
poljima tabele su
kritine vrijednosti.
Vjerojatnost da e sluajna varijabla koja se ravna po
Studentovoj distribuciji poprimiti vrijednost veu od t

iznosi .
Primjer 2.
Sluajna varijabla t distibuirana je po Studentovoj distribuciji s 8 stupnjeva slobode.
Odredite slijedee vjerojatnosti:
a) P (t 1.397)

b) P (t -1.397)

45
9544 . 0 4772 . 0 2
) 00 . 2 ( 2 ) 2 2 (
) 2 2 (

< <
+ < <
z P z p
x p
( ) ( ) 900 . 0 100 . 0 1 397 . 1 1 397 . 1 > t p t p
( ) ( ) 100 . 0 397 . 1 397 . 1 > t P t P
Doc.dr.sc. Draenka izmi predavanja 2009.g.
46
Doc.dr.sc. Draenka izmi predavanja 2009.g.
OSNOVNI POJMOVI INFERENCIJALNE STATISTIKE
INFERENCIJALNA STATISTIKA skup analitikih metoda koje polaze od uzorka..
Budui da se zakljuci donose na temelju dijela podataka oni sadre pogreku nastalu
zbog primjene uzorka (Sampling error).
Faktori koji uvjetuju primjenu uzorka su slijedei:
1. pojedini konani skupovi sadre veliki broj lanova pa bi njihovo istraivanje
zahtijevalo velika financijska sredstva
2. do rezultata se dolazi u kraem vremenu
3. uzorak se primjenjuje kada bi se istraivanjem unitio itav statistiki skup
(npr.istraivanje trajnosti elektrinih arulja)
4. beskonani skupovi istrauju se iskljuivo metodom uzorka (pr.beskonanog
skupa:proizvodnja)
Dvije su osnovne zadae metode uzorka:
1. procjenjivanje parametra
2. testiranje hipoteza
PLAN UZORKA plan izbora jedinica u uzorak. Osnovna svrha plana je izbor
reprezentativnog uzorka, tj. uzorak mora biti umanjena slika osnovnog skupa.
S obzirom na nain izbora jedinica uzorka razlikuju se namjerni i sluajni uzorci.
1. namjerni uzorci jedinice uzorka izabiru se prema odluci istraivaa
prigodni uzorak ispituju se dostupne jedinice (npr.javno miljenje)
uzorak izabran na temelju prosudbe istraivaa istraiva izabire
reprezentativne jedinice pri emu je potrebno da dobro poznaje osnovni
skup
kvotni uzorak anketari se slobodno odluuju za jedinice u sklopu kvota
Namjerni uzorci jednostavni su za primjenu te se esto koriste. Analiziraju se
metodama
deskriptivne statistike.
Nedostatak: nije mogue izraunati greku nastalu zbog primjene uzorka.
2. sluajni uzorci svaki elemnt ima vjerojatnost izbora veu od nule. Kod ovih
uzoraka mogue je izraunati greku. Analiziraju se metodama inferencijalne
statistike.
jednostavni sluajni uzorak svaki element ima jednaku vjerojatnost
izbora. primjenjuje se kod homogenih skupova.
stratificirani uzorak prikladniji je kod skupova koji pokazuju vei
stupanj varijabilnosti. Jedinice se izabiru iz homogenih dijelova osnovnog
skupa koji se nazivaju STRATUMI.
uzorak skupina u uzorak se ne izabiru pojedini elementi nego njihove
skupine.
Ponekad se primjenjuje sistematski izbor (npr.ako iz skupa od 10 000 lanova
biramo uzorak
veliine 1000 birat emo svaki 10. lan). Budui da se radi o sluajnom uzorku
potrebno je
odrediti sluajni poetak.
47
Doc.dr.sc. Draenka izmi predavanja 2009.g.
OKVIR IZBORA popis lanova statistikog skupa (npr.biraki popis)
48
Doc.dr.sc. Draenka izmi predavanja 2009.g.
PREDAVANJE #10
SAMPLING DISTRIBUCIJA teorijska distribucija vjerojatnosti procjenitelja
parametra. Zasniva se na konceptu ponovljenih izbora sluajnih uzoraka iz danog
osnovnog skupa pri emu razliiti uzorci dovode do razliitih vrijednosti procjena.
Primjer 1.
Vrijednosti numerike varijable x koje tvore osnovni skup su 1, 3 i 5. Iz skupa se izabiru
uzorci veliine n=2. Izbor je s jednakom vjerojatnou svakog elementa skupa odnosno
svakog uzorka.
aritmetika sredina osnovnog skupa ()
3
3
9
1

N
x
N
i
i


standardna devijacija osnovnog skupa
3
8
) (
2


N
x
i

vrijednosti
varijabla
elemenata u
uzorku
1 ; 1 1 ; 3 1 ; 5 3 ; 3 3 ; 1 3 ; 5 5 ; 1 5 ; 3 5 ; 5
aritmetika
sredina uzorka
i
x
1 2 3 3 2 4 3 4 5
Provest emo izbor s ponavljanjem izbor u kojem se svaki izabrani element za uzorak
nakon izbora vraa u osnovni skup i tako sudjeluje u izboru sljedeeg elementa za
uzorak.
Budui da je vjerojatnost izbora svakog sluajnog uzorka veliine n=2 jednaka, iznosi
1/9, distribucija je sredina:
[ ]

3 ) (
i i
x p x x E
sampling distribucija
aritmetika
sredina uzorka
i
x
) (
i
x P ) (
i i
x P x
1 1/9 1/9
2 2/9 4/9
3 3/9 9/9
4 2/9 8/9
5 1/9 5/9
ukupno 1 27/9=3
49
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Oekivana vrijednost sampling distribucije aritmetikih sredina uzoraka jednaka je
aritmetikoj sredini osnovnog skupa. Standardna devijacija sampling distribucije sredina
prosjeno je odstupanje aritmetikih sredina od aritmetike sredine osnovnog skupa.
Ona izraava pogreku koja nastaje zbog primjene uzorka, stoga se naziva standardnom
pogrekom aritmetike sredine.
50
Doc.dr.sc. Draenka izmi predavanja 2009.g.
PROCJENE PARAMETARA parametar se procjenjuje brojem i intervalom.
Intervalna procjena sastoji se od odreivanja granica u kojima e se nai nepoznati
parametar.
) .

.. .. .

( procjene greka procjene greka + < <

- karakteristika uzorka, a ujedno i procjena broja


- karakteristika osnovnog skupa koja se procjenjuje (npr. aritmetika sredina, total i
proporcija)
Procjenitelj :
nepristran ako je njegova oekivana vrijednost jednaka parametru koji se
procjenjuje
[ ]

E
konzistentan ako njegova standardna devijacija s porastom uzorka tei nuli
PROCJENA ARITMETIKE SREDINE moe biti brojem i intervalom
procjena brojem jednaka je aritmetikoj sredini uzorka
intervalna procjena za veliki uzorak (n>30) koristi se normalna distribucija
(Gaussova)
x aritmetika sredina uzorka

z koeficijent pouzdanosti koji se odreuje na temelju


povrina ispod normalne krivulje

standardna pogreka procjene


aritm.sredine


aritmetka sredina osnovnog skupa,a
ujedno i
parametar koji se procjenjuje

( ) 1
razina signifikantnosti
intervalna promjena za mali uzorak (n30) koristi se Studentova T distribucija
( )


,
_

+ < < 1
2 2
x x
t x t x P

2

t
-koeficijent pouzdanosti koji se odreuje na temelju
studentove distribucije
Primjer 2.
Odredite vrijednost standardne pogreke procjene aritmetike sredine osnovnog
skupa za ove sluajeve:
a) Procjenjuje se sredina konanog skupa od 125 768 lanova pomou sluajnog
uzorka veliine 1250
lanova. Standardna devijacija osnovnog skupa iznosi 64.
N-broj elemenata osnovnog skupa
n-broj elemanata uzorka
Frakcija izbora (f) pokazuje da je u uzorak
izabrano priblino 1% osnovnog skupa.
51
( )

,
_

+ < < 1
2 2
x x
z x z x P
05 0 0099 0
125768
1250
1250
125768
. f ; .
N
n
f
n
N
<

'

<

05 . 0 ,
05 . 0 ,
1
f
n
f
N
n N
n
x

81019 . 1
1250
64

n
x

Doc.dr.sc. Draenka izmi predavanja 2009.g.


b) Sredina se procjenjuje pomou sluajnog uzorka veliine 600 formiranog izborom
svakog desetog lana
konanog osnovnog skupa, a varijanca skupa iznosi 100.

10 100
6000 10 10
600
2
>
>


n N
n
N
n

38733 . 0
1 6000
600 6000
600
10
1
05 . 0 , 1 . 0
6000
600

>
N
n N
n
f
N
n
f
x

c) Uzorak veliine 36 izabran je iz beskonanog osnovnog skupa N(, 5


2
)
beskonani skup f<0.05 (kad u zadatku nemamo N pretpostavljamo da je skup
beskonaan i f<0.05)

83333 . 0
6
5
36
5

n
x

d)

10
2500
35679

n
N
- nepristrani procjenitelj standardne devijacije populacije
(osnovnog skupa)
e) Veliina je uzorka 256 i ini 2% osnovnog skupa, a standardna devijacija uzorka je 32.
s standardna devijacija uzorka
00392 . 2

06268 . 32
05 . 0 , 02 . 0

<
n
f f
x

n
n
s
faktor korekcije
Primjer 3.
Tvrtka isporuuje vijke pakovanih po 100 komada. Kupac je primio poiljku od 10000
pakovanja. Radi kontrole izabran je sluajni uzorak od 60 pakovanja. Kontrolom je
52

'

<

05 . 0 ,

05 . 0 ,
1

f
n
f
N
n N
n
x

05 . 0 , 07 . 0
35679
2500
> f
N
n
f
19287 . 0
1 35679
2500 35679
2500
10
1

N
n N
n
x

12800 100
256
2
256
32
>

N
N
n
s
Doc.dr.sc. Draenka izmi predavanja 2009.g.
ustanovljen slijedei broj neispravnih vijaka po pakovanju: 4, 3, 3, 1, 3,. Njihov zbroj je
117.
293 , 117
60
1
2
60
1


i
i
i
i
x x
Procjenite brojem i intervalom prosjean broj neispravnih vijaka po pakovanju za cijelu
poiljku. Razina povjerenja je 95%.
05 . 0 , 006 . 0
10000
60
60
<
>
f
N
n
f
uzorak veliki n
procjena brojem procjenitelj aritmetike sredine je aritmetika sredina uzorka
2 95 . 1
60
117


N
x
x
i
procjena prosjenog broja neispravnih vijaka po
pakovanju
intervalni procjenitelj

( )

,
_

+ < < 1
2 2
x x
z x z x P

0.95:2 = 0.4750
z(P=0.4750) = 1.96
Kako nije poznata standardna devijacija osnovnog skupa potrebno je izraunati njezinu
procjenu pomou podataka iz uzorka.
( )
1
1

2
2


n
x
n
x
i i

( )
( ) 95 . 0 21529 . 2 68471 . 0
95 . 0 13535 . 0 96 . 1 95 . 1 13535 . 0 96 . 1 95 . 1
< <
+ < <

P
P
Interpretacija: S vjerojatnou od 0.95 odnosno 95% oekuje se da e se prosjean broj
neispravnih
vijaka po pakovanju kretati izmeu 0.68471 i 2.21529.
Primjer 4.
Ispituje se prosjeno trajanje pozivnih telefonskih razgovora preko telefonske centrale
poduzea Market. Trajanje u minutama 10 sluajno odabranih razgovora iz evidencije
8967 razgovora bilo je slijedee:
x
i
: 2 1 1 2 3 4 2 1 1 3
53
13535 . 0
60
04840 . 1
04840 . 1
59
117
60
1
293

n
x

Doc.dr.sc. Draenka izmi predavanja 2009.g.


Pretpostavlja se da je trajanje pozivnih razgovora na centrali normalno distribuirano s
nepoznatom aritmetikom sredinom i nepoznatom standardnom devijacijom.
Odredite granice za koje se moe oekivati da obuhvaaju prosjeno trajanje razgovora
za osnovni skup. Pouzdanost procjene je 90%.
( )
min 2
10
20
1
10
2 2

,
_

+ < <
>

n
x
x
t x t x P
uzorak mali n
i
x x


koeficijent pouzdanosti t odreuje se pomou tablice studentove T-distribucije.
S vjerojatnou od 90% oekuje se da e se prosjeno trajanje razgovora za osnovni skup
kretati izmeu 1.38901 i 2.61099.
PREDAVANJE #11
PROCJENA TOTALA OSNOVNOG SKUPA
TOTAL zbroj vrijednosti numerikog obiljeja. Taj je parametar povezan s aritmetikom
sredinom.

N
T
N
x
i


N T
Zbog toga se postupak procjenjivanja totala svodi na postupak procjenjivanja aritmetike
sredine.
procjena totala brojem -
x N T

54
9 1 . .
05 . 0
2
90 . 0 1

n s s
( )
( ) 90 . 0 61099 . 2 38901 . 1
90 . 0 33333 . 0 833 . 1 2 33333 . 0 833 . 1 2
< <
+ < <

P
P
( )
05 . 0 0011152 . 0
8967
10
33333 . 0
10
05409 . 1
05409 . 1
9
10
20
50
1
1

833 . 1
2
2
2
) 9 (
05 . 0
< >


f
N
n
f
n
n
x
n
x
t
x
i i

Doc.dr.sc. Draenka izmi predavanja 2009.g.


-
x T
N

intervalna procjena za veliki uzorak -


( )

'

< < 1


2

2
T T
z T T z T P
2

z
- koeficijent pouzdanosti
T

- standardna pogreka procjene totala


( ) 1
- razina pouzdanosti (povjerenja)
intervalna procjena za mali uzorak kao koeficijent korisnosti koristi se
2

t
.
ODREIVANJE VELIINE UZORKA ZA PROCJENU ARITMETIKE SREDINE
OSNOVNOGA SKUPA
Veliina uzorka ovisi o slijedeim elementima:
1. vrsti osnovnog skupa (konaan ili beskonaan)
2. razini pouzdanosti procjene
3. eljenoj pouzdanosti procjene
4. stupnju varijabilnosti podataka
PRETHODNA VELIINA UZORKA n
0
:
ako su pogreka (d) i stupanj varijabilnosti izraeni apsolutno:
2
2
0
1
1
]
1

d
z
n


ako su pogreka (d
r
) i stupanj varijabilnosti izraeni relativno:
1
1
]
1

r
d
V z
n
.
2
0

KONANA VELIINA UZORKA:


frakcija:
Primjer 1.
U grafikoj djelatnosti zaposlena su 9 754 zaposlenika. Koliko zaposlenika treba izabrati
u uzorak pomou kojega se procjenjuje prosjeni radni sta svih zaposlenika. Procjenjuje
se s 95% pouzdanosti. Tolerira se pogreka od najvie 0.5 godine. Pretpostavlja se da
je osnovnog skupa 6 godina.
55

'

+
<

05 . 0 ,
1
05 . 0 ,
0
0
0 0
o
f
f
n
f n
n
N
n
f
0
0

Doc.dr.sc. Draenka izmi predavanja 2009.g.
6
5 . 0
95 . 0 ) 1 (
9754

d
N

( ) 96 . 1 4750 . 0
4750 . 0
2
95 . 0

P z

553
5 . 0
6 96 . 1
0
2
0
2
2
0

,
_

,
_

n
n
d
z
n


523
05669 . 0 1
553
1
05 . 0 05669 . 0
9754
553
0
0
0
0
0

> >
f
n
n
f
N
n
f
Prema navedenim uvjetima u uzorak treba izabrati 523 zaposlenika.
PROCJENA PROPORCIJE OSNOVNOG SKUPA
PROPORCIJA OSNOVNOG SKUPA parametar koji predstavlja omjer broja lanova
osnovnog skupa s odreenim modalitetom obiljeja i opsega statistikog skupa
procjenitelj procjene brojem:
n
m
P

m - broj elemenata s odreenim modalitetom


obiljeja u uzorku
n - broj elemenata uzorka
Sampling distribucija proporcija uzoraka ima oblik binomne ili hipergeometrijske
distribucije. Za dovoljno veliki uzorak aproksimira se normalnom distribucijom.
intervalna procjena za veliki uzorak:
( )


,
_

+ < < 1

2

2
p p
z p p z p P
p-proporcija osnovnog skupa
TESTIRANJE HIPOTEZA O PARAMETRU
STATISTIKA HIPOTEZA tvrdnja o veliini parametra ili o obliku distribucije osnovnog
skupa ija se istinitost ispituje pomou sluajnog uzorka.
TESTIRANJE STATISTIKIH HIPOTEZA postupak kojim se donosi odluka o
prihvaanju ili ne prihvaanju tvrdnje.
STATISTIKI TESTOVI:
parametarski polazi se od danog oblika numerike varijable u osnovnom skupu
neparametarski
Svaki postupak testiranja polazi od nulte (H
0
) i alternativne hipoteze (H
1
)
U postupku donoenja odluka mogu se pojaviti dvije vrste pogreaka:
POGREKA TIPA I nastaje ako se odbaci istinita nulta hipoteza
POGREKA TIPA II nastaje ako se prihvati lana nulta hipoteza
RAZINA ZNAAJNOSTI (RAZINA SIGNIFIKANTNOSTI) vjerojatnost odbacivanja
istinite nulte hipoteze
vjerojatnost prihvaanja lane nulte hipoteze
SNAGA TESTA (1-) vjerojatnost odbacivanja lane nulte hipoteze
56
Doc.dr.sc. Draenka izmi predavanja 2009.g.
TESTIRANJE HIPOTEZA O PRETPOSTVLJENOJ VRIJEDNOSTI
ARITMETIKE SREDINE OSNOVNOG SKUPA ovo se testiranje provodi na
temelju sluajnog uzorka od N lanova
N > 30 veliki uzorak TEST VELIKIM UZORKOM
N 30 mali uzorak TEST MALIM UZORKOM
Testiranje se provodi u slijedeim koracima:
1. postavljanje hipoteza
2. identificiranje izraza za testnu veliinu i odreivanje njene vrijednosti
3. odabir razine signifikantnosti i odreivanje kritinih granica
4. donoenje odluke
Test moe biti:
dvosmjeran
jednosmjeran (na donju ili na gornju granicu)
Odluka se moe donijeti na idue naine:
pomou kritinih granica
Z-test ; T-test
pomou empirijske razine signifikantnosti tj. p-vrijednosti
DVOSMJERNI TEST nije ogranien smjer odstupanja. Pretpostavka je da je aritmetika
sredina jednaka pretpostavljenoj. Pretpostavka se formulira kao nulta hipoteza.
0 1
0 0
. ..........
. ..........

H
H
Primjer 2.
Prema standardu prosjena trajnost elektrinih arulja od 75W iznosi 2000 h s
prosjenim odstupanjem 250 h. Iz serije arulja izabran je, uz frakciju izbora manju od
5%, sluajni uzorak 64 arulje. Ispitivanjem je ustanovljeno da je prosjena trajnost
arulja u uzorku 1935 h. Moe li se prihvatiti pretpostavka da je uzorak izabran iz
osnovnog skupa kojemu je aritmetika sredina prema standardu tj.2000 h. testirati na
razini znaajnosti 5%.
2000 ........
2000 ........
1
0

H
H
veliki uzorak normalna distribucija
% 5
1935
64
05 . 0
250

<

x
n
f

25 . 31
64
250

n
x

Koeficijent znaajnosti za danu razinu znaajnosti odreuje se pomou povrina ispod


normalne krivulje. Postupak odreivanja toga koeficijenta jednak je postupku odreivanja
koeficijenta povjerenja pri procjeni parametra. Meutim koeficijent znaajnosti odraava
razinu znaajnosti tj. vjerojatnost pogreke tipa I., a koeficijent povjerenja razinu
povjerenja procjene.
57
Doc.dr.sc. Draenka izmi predavanja 2009.g.
( ) ( ) 96 . 1 ) 4750 . 0 025 . 0 5 . 0 P z P z
1.
Ove kritine granice izraene su u mjernim jedinicama varijable.
ODLUKA:
1 2
1 1
0 2 1
H C x
H C x
H C x C
>
<
< <

1
75 . 1938 1935 H <
Na danoj razini znaajnosti odbacuje se nulta hipoteza tj. ne prihvaa se pretpostavka
da je uzorak izabran iz skupa arulja s prosjenom trajnou 2000 h.
2. Z-test
test veliina ( empirijski z-omjer)
08 . 2
25 . 31
2000 1935
0

x
x
z


ODLUKA:

1
2
0
2
H z z
H z z
>
<


1
96 . 1 08 . 2 H >
3. Pomou empirijske razine signifikantnosti tj. p-vrijednosti
Teorijska razina signifikantnosti sastavni je element. Ona predstavlja odabranu
vjerojatnost odbacivanja istinite nulte hipoteze.
Empirijska razina signifikantnosti ili opaena razina signifikantnosti (p-vrijednost)
vjerojatnost je odbacivanja istinite nulte hipoteze izraunata pomou podataka iz
uzorka odnosno test veliina (empirijskog z odnosno t omjera)
( ) ( ) ( ) 0376 . 0 4812 . 0 5 . 0 2 08 . 2 2 2
08 . 2
> <

z P z z P vrijednost p
z
ODLUKA:
1
0
H p
H p
<
>


1
05 . 0 0376 . 0 H <
JEDNOSMJERNI TEST NA GORNJU GRANICU - od interesa je promatrati odstupanje na
vie. Pretpostavlja se da je aritmetika sredina osnovnog skupa vea od pretpostavljene.
Pretpostavka se formulira kao alternativna hipoteza. (vie od, najmanje, barem)
0 1
0 0
. ..........
. ..........


>

H
H
58
25 . 2061 25 . 31 96 . 1 2000
75 . 1938 25 . 31 96 . 1 200
2
0 2
2
0 1
+ +

x
x
z C
z C

Doc.dr.sc. Draenka izmi predavanja 2009.g.


Primjer 3.
Radi poveanja produktivnosti strojeva predloena je njihova preinaka. Prema
proraunima preinaka je poslovno opravdana ako se postigne povean broj operacija po
satu i ako u prosjeku iznosi vie od 120. Na jednom stroju provedena je preinaka i
evidentiran je broj operacija po satu 144 mjerenja. Prosjean broj operacija po satu iznosi
je 125. Zbroj kvadrata vrijednosti mjerenja iznosi 2 307 600. Do kojeg se zakljuka dolazi
na temelju provedenog ispitivanja? Vjerojatnost odbacivanja istinite nulte hipoteze iznosi
5%.
120 .......
120 .......
1
0
>

H
H

( ) ( ) 65 . 1 4500 . 0 05 . 0 5 . 0
67248 . 1
144
06981 . 20
. 05 . 0
06981 . 20
143
1252 144 2307600
1

2307600
125
144
2
2


<

P z P z
n
skup besk f
n
x n x
x
x
uzorak veliki n
x
i
i

1. pomou kritinih granica


76 . 122 67248 . 1 65 . 1 120
0 2
+ +
x
z C

ODLUKA:
1 2
0 2
H C x
H C x
>
<

1
76 . 122 125 H >
Odstupanje aritmetike sredine uzorka na vie znaajno je pa se prihvaa
pretpostavka da je preinaka strojeva opravdana.
2. Z-test
99 . 2
67248 . 1
120 125
0

x
x
z

ODLUKA:
1
0
H z z
H z z
>
<


1
65 . 1 99 . 2 H >
3. pomou empirijske razine signifikantnosti tj. p-vrijednost
( ) ( ) 0014 . 0 4986 . 0 5 . 0 99 . 2
99 . 2
> >

z P z z P vrijednost p
z
ODLUKA:
1
0
H P
H P
<
>


1
05 . 0 0014 . 0 H <
59
Doc.dr.sc. Draenka izmi predavanja 2009.g.
60
Doc.dr.sc. Draenka izmi predavanja 2009.g.
PREDAVANJE#12
JEDNOSMJERNI TEST NA DONJU GRANICU od interesa je promatrati odstupanje na
nie. Pretpostavlja se da je aritmetika sredina osnovnog skupa manja od
pretpostavljene. Pretpostavka se formulira kao alternativna hipoteza. (manje od,
najvie, ne vie od)
0 1
0
.........
.........


<

H
H
o
Primjer 1.
Poslovodstvo banke odluilo je promijeniti programsku potporu alterskog poslovanja
kako bi se smanjio prosjeni utroak vremena obrade naloga stranaka i time skratilo
vrijeme ekanja stranaka. Analizom je utvreno da se promjena potpore isplati ako
prosjeno vrijeme obrade iznosi najvie 30 sekundi po nalogu. Razvojna sluba banke
izradila je programsku potporu koja se testira u odabranom broju poslovnica. Na temelju
podataka o trajanju obrade pomou nove programske potpore za 453 sluajno odabrana
naloga izraunano je prosjeno utroeno vrijeme po nalogu koje iznosi 28 sekundi s
prosjenim odstupanjem 4 sekunde. Do kojeg se zakljuka dolazi na temelju provjere
rada s novim programom? Testirati na razini znaajnosti 2%.
30 ........
30 ........
1
0
<

H
H
Uzorak je velik pa koristimo normalnu distribuciju.
( ) 02 . 0 % 2
4
28
453

s
x
n

18814 . 0
453
0042 . 4
0042 . 4
452
453
4
1

x
n
n
s


( ) ( ) 05 . 2 4800 . 0 02 . 0 5 . 0
05 . 0 .

<
P z P z
f skup besk
1. pomou kritine granice
61430 . 29 18814 . 0 05 . 2 30
2

x
z C

ODLUKA:
1 1
0 1
H C x
H C x
<
>

1
61430 . 29 28 H <
Odstupanje aritmetike sredine uzorka nanie je znaajno na danoj razini
signifikantnosti pa se zakljuuje da nova programska potpora skrauje vrijeme obrade
naloga.
2. Z-test
test veliina (empirijski z-omjer) je:
630 . 10
18814 . 0
30 28
0

x
x
z

ODLUKA:
1
0
H z z
H z z
<
>


1
05 . 2 630 . 10 H <
61
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Empirijski z-omjer manji je od teorijske vrijednosti pa se na danoj razini
signifikantnosti odbacuje nulta hipoteza.
TESTIRANJE HIPOTEZA O RAZLICI ARITMETIKIH SREDINA DVAJU
OSNOVNIH SKUPOVA NEZAVISNIM UZORCIMA
Uzorci su nezavisni ako rezultati opaanja i mjerenja u jednome uzorku ne ovise o
rezultatima opaanja i mjerenja u drugome uzorku, npr. ispitivanje efikasnosti rada
radnika u dvije tvornice.
Uzorci su zavisni ako se vrijednosti iz uzorka dobivaju ponovljenim opaanjem odnosno
mjerenjem odabrane varijable na istim jedinicama u razliitim vremenskim terminima,
npr. mjerenje efikasnosti rada radnika u istoj tvornici prije i nakon provedenog programa
strunog usavravanja.
DVOSMJERNI TEST pretpostavlja se da su aritmetike sredine osnovnih skupova
jednake (
1
,
2
). Pretpostavka se formulira kao nulta hipoteza.
0 ........
0 ........
2 1 1
2 1 0




H
H
Primjer 2.
Pomou uzorka se ispituje razlika u prosjenoj mjesenoj potronji mlijeka etverolanih
kuanstava u dva naselja. U naselju Lug je 2500 etverolanih kuanstava, a u naselju
Gaj 2000. Kod etverolanih kuanstava u naselju Lug izabrano je u uzorak svako 50.
kuanstvo, a od ukupnog broja etverolanih kuanstava u naselju Gaj u uzorak je
izabrano 2% kuanstava. Na temelju podataka iz uzorka kuanstava naselja Lug
utvrena je prosjena mjesena potronja po kuanstvu 53 litre s prosjenim
odstupanjem od 1 litre. Pomou vrijednosti iz uzorka kuanstava iz naselja Gaj utvrena
je prosjena mjesena potronja po kuanstvu 50 litara s prosjenim odstupanjem od
1.41 litre. Moe li se prihvatiti pretpostavka da se prosjena mjesena potronja mlijeka
etverolanih kuanstava u naseljima Lug i Gaj signifikantno ne razlikuju? Razini
signifikantnosti je 3%.
0 ........
0 ........
2 1 1
2 1 0




H
H
l s
l x
n
1
53
50
1
1
1


l s
l x
n
41 . 1
50
40
2
2
2


( ) ( ) 17 . 2 4850 . 0 015 . 0 5 . 0
03 . 0

P z P z

03908 . 2
39
40
41 . 1
1

02041 . 1
43
50
1
1

2
2
2
2
2
2
2
2
1
1
2
1
2
1


n
n
s
n
n
s

standardna pogreka za velike uzorke: 26719 . 0


40
03908 . 2
50
02041 . 1
2
2
2
1
2
1
2 1
+ +

n n
x x

62
Doc.dr.sc. Draenka izmi predavanja 2009.g.
1. pomou kritinih granica
57980 . 0 26719 . 0 17 . 2 0 0
57980 . 0 26719 . 0 17 . 2 0 0
2 1
2 1
2
2
2
1
+ +

x x
x x
z C
z C

test veliina: 3 50 53

2 1
x x D
ODLUKA:
1 2
1 1
0 2 1


H C D
H C D
H C D C
<
<
< <

1
57980 . 0 3 H >
Ne moe se prihvatiti pretpostavka da se prosjena mjesena potronja mlijeka
etverolanih kuanstava u naselju Lug i Gaj signifikantno se ne razlikuju.
2. Z-test
test veliina (empirijski z-omjer)
22997 . 11
26719 . 0
50 53
2 1
2 1

x x
x x
z

ODLUKA:
1
2
0
2
H z z
H z z
>
<


1
17 . 2 22797 . 11 H >
JEDNOSMJERNI TEST NA GORNJU GRANICU pretpostavlja se da je aritmetika
sredina prvog osnovnog skupa vea od aritmetike sredine drugog osnovnog skupa.
Pretpostavka se formulira kao alternativna hipoteza.
0 .......
0 .......
2 1 1
2 1 0
>



H
H
Primjer 3.
Ispituje se pretpostavka da su prosjeni izdaci za odjeu poljoprivrednih kuanstava vei
od prosjenih izdataka za odjeu nepoljoprivrednih kuanstava. U tu svrhu odabrani su
sluajni uzorci od po 500 kuanstava. Promatrani su godinji izdaci.
poljoprivredna kuanstva nepoljoprivredna kuanstva
kn s
kn x
30 . 520
50 . 5900
1
1

kn s
kn x
50 . 480
70 . 5830
2
2

0 .......
0 .......
2 1 1
2 1 0
>



H
H
63
Doc.dr.sc. Draenka izmi predavanja 2009.g.
( ) ( ) 33 . 2 4900 . 0 01 . 0 5 . 0
01 . 0

P z P z


9359 . 231342
499
500
50 . 480
1

5992 , 271254
499
500
30 . 520
1

2
2
2
2
2
2
2
2
1
1
2
1
2
1


n
n
s
n
n
s

standardna pogreka za velike uzorke:


7048 . 31
500
9359 . 231342
500
5992 . 271254
2
2
2
1
2
1
2 1
+ +

n n
x x

1. pomou kritine granice


8722 . 73 7048 . 31 33 . 2 0 0
2 1
2
+ +
x x
z C

test veliina: 8 . 69 70 . 5830 50 . 5900

2 1
x x D
ODLUKA:
1 2
0 2

H C D
H C D
>
<

0
8722 . 73 80 . 69 H <
Ne moe se prihvatiti pretpostavka da su prosjeni izdaci za odjeu poljoprivrednih
kuanstava vei od prosjenih izdataka za odjeu nepoljoprivrednih kuanstava.
2. Z-test
test veliina (empirijski z-omjer)
20 . 2
7048 . 31
70 . 5830 50 . 5900
2 1
2 1

x x
x x
z

ODLUKA:
1
0
H z z
H z z
>
<


0
33 . 2 20 . 2 H <
3. pomou empirijske razine signifikantnosti (p-vrijednost)
( ) ( ) 0139 . 0 4861 . 0 5 . 0 20 . 2
20 . 2
> >

Z P z Z P vrijednost p
z
ODLUKA:
1
0
H p
H p
<
>


0
01 . 0 0139 . 0 H >
JEDNOSMJERNI TEST NA DONJU GRANICU pretpostavlja se da je aritmetika sredina
prvog osnovnog skupa manja od aritmetike sredine drugog osnovnog skupa.
Pretpostavka se formulira kao alternativna hipoteza.
0 ........
0 ........
2 1 1
2 1
<



H
H
o
Primjer 4.
Ispituje se tvrdnja da su maloprodajne cijene prehrambenih proizvoda nie u diskontima
nego u klasinim prodavaonicama. U tu su svrhu odabrani sluajni uzorci od 50
maloprodajnih cijena u diskontima i 80 maloprodajnih cijena u klasinim
prodavaonicama. Uzorci cijena prikupljeni su u istom vremenskom razdoblju i za isti
prehrambeni proizvod.
64
Doc.dr.sc. Draenka izmi predavanja 2009.g.
diskonti klasine prodavaonice
kn s
kn x
30 . 2
90 . 9
1
1


kn s
kn x
10 . 2
42 . 11
2
2

Moe li se na osnovi podataka iz uzorka zakljuiti da je prosjena maloprodajna cijena


prehrambenih proizvoda nia u diskontima nego u klasinim prodavaonicama? Razina
signifikantnosti je 1%.
0 ........
0 ........
2 1 1
2 1
<



H
H
o
( ) ( )
4658 . 4
79
80
10 . 2
1

3980 . 5
49
50
30 . 2
1

33 . 2 4900 . 0 01 . 0 5 . 0
2
2
2
2
2
2
2
2
1
1
2
1
2
1



n
n
s
n
n
s
P z P z


standardna pogreka za velike uzorke:
4047 . 0
80
4658 . 4
50
3980 . 5
2
2
2
1
2
1
2 1
+ +

n n
x x

1. Z-test
test veliina (empirijski z-omjer)
7064 . 3
4047 . 0
40 . 11 90 . 9
2 1
2 1

x x
x x
z

ODLUKA:
1
0
H z z
H z z
<
>


1
33 . 2 7064 . 3 H <
Moe se prihvatiti pretpostavka da je prosjena maloprodajna cijena prehrambenih
proizvoda nia u diskontima nego u klasinim prodavaonicama.
PREDAVANJE #13
REGRESIJSKA ANALIZA njom se ispituje ovisnost jedne varijable o drugoj
varijabli ili o vie drugih varijabli, npr.proizvodnja o broju zaposlenih, potronja o visini
plae
ZAVISNA VARIJABLA varijabla ije se varijacije objanjavaju
NEZAVISNE VARIJABLE varijable kojima se objanjavaju varijacije zavisne varijable
REGRESIJSKI MODEL jednadba ili skup jednadbi s konanim brojem parametara i
varijabli
linearni
nelinearni
65
Doc.dr.sc. Draenka izmi predavanja 2009.g.
MODEL JEDNOSTAVNE LINEARNE REGRESIJE njime se izraava odnos
meu dvjema pojavama. Model sadri jednu zavisnu i jednu nezavisnu varijablu.
Primjenjuje se za varijable koje su u linearnom statistikom odnosu.
DESKRIPITVNO STATISTIKA ANALIZA MODELA JEDNOSTAVNE LINEARNE
REGRESIJE
opi oblik modela jednostavne regresije:
( )
e f y
x
+
f
(x)
funkcionalni dio modela
e stohastika varijabla koja odraava nesistemske utjecaje na zavisnu varijablu
Ako je funkcionalni dio modela oblika ( )
x f
x
+
model postaje:
e x y + +
Ako su a i b procjene nepoznatih parametara i , a u
i
procjene nepoznatih vrijednosti
varijable e, model se moe izraziti na slijedei nain:
i i i
u bx a y + +

linearna regresijska jednadba:
i i
bx a y +
Do procjene a i b dolazi se primjenom metode najmanjih kvadrata:
2 2
x n x
y x n y x
b
i
i i


x b y a
KONSTANTNI LAN a - predstavlja vrijednost regresije u sluaju kada je nezavisna
varijabla jednaka nuli
REGRESIJSKI KOEFICIJENT b - pokazuje za koliko se u prosjeku mijenja zavisna varijabla
ako se nezavisna varijabla povea za jedinicu.
JEDNADBA ANALIZE VARIJANCE
( ) ( ) ( )
SR SP ST
y y y y y y
i i i i
+
+

2 2 2

ST ukupan zbroj kvadrata
SP protumaeni zbroj kvadrata
SR rezidualni ili neprotumaeni zbroj kvadrata
i
y - empirijske ili stvarne vrijednosti zavisne
varijable
y
- aritmetika sredina zavisne varijable
i
y - regresijske vrijednosti
Osnove za mjerenje reprezentativnosti regresije su rezidualna odstupanja.
Varijanca regresije aritmetika je sredina kvadrata rezidualnih odstupanja:
( )
n
SR
n
y y
i i
y


2
2

66
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Standardna devijacija regresije:
n
SR
y

Koeficijent varijacije regresije:


100


y
V
y
y

Standardna devijacija regresije interpretira se kao prosjeno odstupanje empirijskih


vrijednosti od regresijskih izraeno apsolutno.
Koeficijent varijacije je to isto odstupanje izraeno relativno.
Specifian pokazatelj reprezentativnosti regresije je koeficijent determinacije:
( )
( )


2
2
2

y y
y y
ST
SP
r
i
i
1 0
2
r
Regresija je to reprezentativnija to se koeficijent determinacije vie pribliava jedinici.
KORELACIJSKA ANALIZA njome se odreuju jakosti veze. Mjera jakosti veze je
koeficijent korelacije.
Koeficijent korelacije drugi je korijen iz koeficijenta determinacije:
2
r r t

b sign r sign
1 1 r
Ako je koeficijent korelacije jednak nula, meu pojavama ne postoji veza.
Ako je koeficijent korelacije jednak -1, veza je potpuna i negativnog smjera.
Ako je koeficijent korelacije jendak +1, veza je potpuna i pozitivnog smjera.
Primjer 1.
U 6 prodavaonica na podruju A registriran je slijedei broj zaposlenih i ostvareni promet
u tisuama kn.
broj
zaposleni
h
prom
et
2
i
x
2
i
y i i
y x
i
x
i
y
2 25 4 625 50
3 31 9 961 93
8 85 . . .
4 51 . . .
7 69 . . .
6 65 . . .
30 326 178 20 398 1900
a) Odredite status varijabli u modelu!
Zavisna varijabla (y) promet u tisuama kuna
Nezavisna varijabla (x) broj zaposlenih
b) Nacrtajte dijagram rasipanja!
Konstruira se u pravokutnom koordinatnom sustavu. Na osi-x nalazi se aritmetiko
mjerilo za nezavisnu
varijablu (x), a na osi-y mjerilo za zavisnu varijablu (y). Predstavlja pomono sredstvo
za izbor oblika
67
Doc.dr.sc. Draenka izmi predavanja 2009.g.
funkcije u modelu.

Iz dijagrama rasipanja se zakljuuje o :
1. obliku veze oblik veze je linearan
2. smjeru veze smjer je pozitivan
3. jakosti veze veza je relativno jak
c) Kako glasi linearna regresijska jednadba s procijenjenim parametrima?

08 . 6 5 65 . 9 33 . 54
65 . 9
5 6 178
33 . 54 5 6 1900
2 2 2

x b y a
x n x
y x n y x
b
i
i i

x y
bx a y
65 . 9 08 . 6

+
+
Interpretacija:
a (konstantni lan) Kada je broj zaposlenih jednak 0 regresijska vrijednost ukupnog
prometa je 6.08
tisua kuna.
b (regresijski koeficijent) Ako se broj zaposlenih povea za jednu osobu tada e se
ukupan promet
poveati linearno i u prosjeku za 9.65 tisua kuna.
d) Odredite regresijske vrijednosti i vrijednosti rezidualnih odstupanja te relativnih
rezidualnih odstupanja!
Regresijske vrijednosti odreuju se tako da se u regresijsku jednadbu redom
uvrtavaju stvarne
vrijednosti nezavisne varijable.
Interpretacija:
Za dva zaposlena oekivana vrijednost ukupnog prometa iznosi 25.38 tisua kuna.

i i
y y
68
33 . 54
6
326
5
60
30

n
y
y
n
x
x
i
i
.
.
.
.
38 . 25 2 65 . 9 08 . 6
1
+ y
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Rezidualna odstupanja izraunavaju se tako da se od stvarne varijable
i
y
oduzme
pripadajua
regresijska vrijednost
i
y :
Relativna rezidualna odstupanja definiraju se izrazom:
Interpretacija:
Prema regresiji za 2 zaposlena precijenjen je ukupan promet za 0.38 tisua kuna ili
1,52%.
e) Regresijski pravac ucrtajte u dijagram rasipanja!
f) Kolika varijanca, standardna devijacija i koeficijent varijacije regresije?

( )
% 76 . 6 100
33 . 54
67 . 3
100
. 67 . 3 49 . 13
49 . 13
6
92 . 80

92 . 80 1900 65 . 9 326 08 . 6 20298

2
2


y
V
kn tis
n
SR
n
y y
n
SR
y x b y a y SR
y
y
y
i i
y
i i i i

Prosjeno odstupanje empirijskih vrijednosti prometa od regresijskih vrijednosti iznosi


3.67 tisua kuna
ili relativno 6.76%
g) Izraunajte vrijednosti lanova u jednadbi ralambe zbroja kvadrata odstupanja
vrijednosti zavisne
varijable od njezine aritmetike sredine! (jednadba analize varijance)

92 . 80
89 . 2606 33 . 54 6 1900 65 . 9 326 08 . 6
51 . 2687 33 . 54 6 20398
2 2
2
2
2

+ +

SP ST SR
y n y x b y a SP
y n y ST
i i i
i
h) Odredite koeficijent determinacije i koeficijent linearne korelacije!
97 . 0
51 . 2687
59 . 2606
2

ST
SP
r
Interpretacija:
Linearnom regresijskom vezom protumaeno je 97% svih odstupanja. Na temelju toga
moe se
zakljuiti da je model reprezentativan.
98 . 0 97 . 0
2
r r

69




0
. 38 . 0 38 . 25 25

i
i
i i i
u
kn tis u
y y u
% 52 . 1 100
25
38 . 25 25
100

, 1
,

rel
i
i i
rel i
u
y
y y
u
Doc.dr.sc. Draenka izmi predavanja 2009.g.
koeficijent
determinacije
apsolutna vrijednost
koeficijenta linearne
korelacije
tumaenje
2
r
r
0 0 odsutnost korelacije
0,00-0,25 0,00-0,50 slaba korelacija
0,25-0,64 0,50-0,80 korelacija srednje jaine
0,64-1 0,80-1 vrsta korelacija
1 1 potpuna korelacija
(perfektna)
Radi se o vrstoj korelaciji pozitivnog smjera
i) Koliko iznosi korigirani koeficijent determinacije?

( )
( ) 96 . 0 97 . 0 1
1 6
1 6
1
, 1
2
1
1
2
2 2 2 2


r
r r r
n
n
r
j) Sastavite tabelu ANOVA!
Tabela ANOVA za jednostavnu regresiju:
izvor
varijacije
stupnjevi
slobode
zbroj
kvadrata
sredina
kvadrata
empirijski t-
omjer
protumaen
modelom
1
1
SP
2606.59
SP/1
2606.59
( ) 2 n
SR
SP
128.85
neprotumae
na
(rezidualna)
odstupanja
n-2
4
SR
80.92
SR/(n-2)
20.23
/
UKUPNO n-1
5
ST
2687.51
/ /
PREDAVANJE #14
INFERENCIJALNO-STATISTIKA ANALIZA MODELA JEDNOSTAVNE LINEARNE
REGRESIJE empirijske vrijednosti zavisne varijable smatraju se uzorkom iz
zamiljenoga beskonanoga osnovnog skupa. U sklopu inferencijalno-statistike analize
provodi se procjenjivanje parametara i testiranje hipoteza.
model osnovnog skupa (populacije):
i i i
e x y + +
i nepoznati parametri populacije
e nepoznate vrijednosti sluajne varijable
model uzorka:
i i i
e x y

+ +


i - procjene nepoznatih parametara
e - procjene nepoznatih vrijednosti sluajne varijable
70
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Procjene parametara brojem u sklopu inferencijalne statistike jednake su procjenama u
sklopu deskriptivne statistike, tj. b a

,
procjena varijance brojem:
( )
2

1
2
2

n
y y
n
i
i i

procjena standardne devijacije:


( )
2

1
2

n
y y
n
i
i i

intervalna procjena parametra :


mali uzorak
( )


,
_

+ < < 1


2

2
t t P
veliki uzorak
( )


,
_

+ < < 1


2

2
z z P

2 2
2


x n x
i

Primjer 1.
Dana je regresijska jednadba :
( )

03 . 0

92 . 0 125 x y +
U kojim se granicama moe oekivati da e se nai parametar ? Pouzdanost procjene je
95%, a n=25.
( )
( ) ( )
069 . 2
23 2 1 . .
23
025 . 0
2
2

+

t t
n k n s s
n


( )
( ) 95 . 0 98207 . 0 85793 . 0
95 . 0 03 . 0 069 . 2 92 . 0 03 . 0 069 . 2 92 . 0
< <
+ < <

P
P
Uz pouzdanost od 95% oekuje se da e se nepoznati parametar nai unutar ovih
granica.
TESTIRANJE HIPOTEZA U MODELU JEDNOSTAVNE LINEARNE REGRESIJE moe se
provesti na vie ekvivalentnih naina:
1. F-TEST
i i i
i i
e x y H
e y H
+ +
+

........
........
1
0
ili alternativno (ee)
0 .........
0 .........
1
0

H
H
test veliina (empirijski f-omjer) :
( )
2
1
2

n
i
i
y y
F
Odluka se donosi usporedbom empirijskog f-omjera sa teorijskom
vrijednou koja se oitava iz tablica.
2. T-TEST
test veliina (empirijski t-omjer) :

t
71
Doc.dr.sc. Draenka izmi predavanja 2009.g.
Odluka se donosi usporedbom empirijskog t-omjera sa teorijskom
vrijednou koja se oitava iz tablica.
Test se moe provesti kao dvosmjerni ili jednosmjerni (na donju ili
gornju granicu). Ako je <0 jednosmjerni test na donju granicu
Ako je >0 jednosmjerni test na gornju granicu
Primjer 2.
Dana je regresijska jednadba:
( )

03 . 0

92 . 0 125 x y +
Moe li se prihvatiti pretpostavka da je varijabla x suvina u modelu? Testirati na razini
5% signifikantnosti. n=25. Primjenite t-test.
0 .......
0 .......
1
0

H
H
dvosmjerni test
667 . 30
03 . 0
92 . 0

t

( )
069 . 2
05 . 0
23
025 . 0

ODLUKA:
1
2
2
H t t
H t t
o
>
<


1
069 . 2 667 . 30 H >
Nezavisna varijabla x nije suvina u modelu.
MODEL VIESTRUKE REGRESIJE (MULTIPLA REGRESIJA) njime se
izraava ovisnost jedne varijable o vie drugih varijabli.
ANALIZA MODELA VIESTRUKE LINEARNE REGRESIJE
model osnovnog skupa (populacije):
e x x x y
k k
+ + + + + .......
2 2 1 1
model uzorka:
e x x x y
k k

......

2 2 1 1
+ + + + +
alternativno
e y y +
linearna regresijska jednadba s procijenjenim parametrima:
k k
x x x y

......


2 2 1 1
+ + + +
Za procjenjivanje parametra koristi se metoda najmanjeg kvadrata.
- konstantni lan predstavlja vrijednost regresije kada su nezavisne varijable jednake
0.
j

- regresijski koeficijent pokazuje za koliko se u prosjeku mijenja zavisna varijabla


ako se nezavisna
varijabla x
j
povea za jedan uz uvjet da ostale nezavisne varijable ostanu
nepromijenjene.
REGRESIJSKE VRIJEDNOSTI odreuju se uvrtavanjem vrijednosti nezavisnih varijabli
u regresijsku jednadbu.
REZIDUALNA ODSTUPANJA odstupanja empirijskih vrijednosti od regresijskih
izraena apsolutno
i i i
y y e
RELATIVNA REZIDUALNA ODSTUPANJA -
100

i
i i
rel i
y
y y
e
STANDARDIZIRANA REZIDUALNA ODSTUPANJE -
100

i i
rel i
y y
e
72
Doc.dr.sc. Draenka izmi predavanja 2009.g.
NEPRISTRANA PROCJENA VARIJANCE BROJEM -
( )
( ) ( ) 1 1

2
2
+


k n
SR
k n
y y
i i

( )
( ) 1

2
+


k n
y y
i i

INTERVALNE PROCJENE PARAMETARA -


( )


,
_

+ < < 1


2

2
j j
t t P
j j
KOEFICIJENT VIESTRUKE DETERMINACIJE -
( )
( ) ST
SP
y y
y y
R
i
i

2
2
2

opi pokazatelj
kvalitete modela
Model je to reprezentativniji
to je koeficijent
determinacije blie jedinici.
TESTIRANJE HIPOTEZA O MODELU VIESTRUKE REGRESIJE najee se koriste
slijedei testovi:
1. PARCIJALNI TEST testira se znaajnost podskupa nezavisne
varijable
2. POJEDINANI TEST testira se znaajnost jedne nezavisne
varijable. Moe se
provesti i kao f-test i kao t-test
3. SKUPNI TEST testira se znaajnost svih nezavisnih varijabli u
modelu. Uvijek
se provodi kao f-test.
0 ........
0 .... ........
1
2 1 0


j
k j
H
H


U hipotezi H0 stoji da nijedna nezavisna varijabla nije znaajna za
model.
U hipotezi H1 stoji da je barem jedna nezavisna varijabla znaajna
za model.
Test veliina je empirijski f-omjer iz tabele ANOVA.
Odluka se donosi usporedbom empirijskog f-omjera sa teorijskom
vrijednou koja se oitava iz tablica.
TABLICA ANOVA ZA VIESTRUKU REGRESIJU:
73
Doc.dr.sc. Draenka izmi predavanja 2009.g.
k broj nezavisnih varijabli

ukupna odstupanja: empirijske vrijednosti od prosjeka
protumaena odstupanja: regresijske vrijednosti od prosjeka
neprotumaena odstupanja: empirijske vrijednosti od regresijskih
PREDAVANJE #15
MODELI VREMENSKIH SERIJA njima se opisuje razvoj pojava u vremenu.
Vremenska serija se moe ralaniti na slijedee komponente:
KOMPONENTA TRENDA predstavlja osnovnu tendenciju razvoja pojave u
vremenu. Izraava se nekom funkcijom vremena. S obzirom na tu funkciju
vremena trend moe biti linearni i eksponencijalni.
SEZONSKA KOMPONENTA posljedica je klimatskih faktora, ritma, proizvodnje,
potronje Oituje se onda kada se vremenska pojava obnavlja na priblino
isti nain unutar jedne godine.
CIKLIKA KOMPONENTA oituje se onda kada se vremenska pojava obnavlja
na priblino isti nain s periodom od 2 ili vie godine.
SLUAJNA (STOHASTIKA) KOMPONENTA odraava nesistematske utjecaje
na pojavu
opi oblik aditivnog modela:
e S C T Y + + +
Y pojava koju promatramo
T vrijednost komponente trenda
C vrijednost ciklike komponente
S vrijednost sezonske komponente
e vrijednost sluajne komponente
U kratkom vremenskom razdoblju trend i ciklus komponente se ne razdvajaju pa se
model moe pisati:
izvor
varijacije
stupnjevi
slobode
zbroj
kvadrat
a
sredine
kvadrata
empirijs
ki f-
omjer
protumaen
modelom
k SP
k
SP
( ) 1 + k n
SR
k
SP
neprotumae
na modelom
(rezidualna)
odstupanja
n-(k+1) SR
( ) 1 + k n
SR /
ukupno n-1 ST / /
74
Doc.dr.sc. Draenka izmi predavanja 2009.g.
e S TC Y + +
ili
e S T Y + +
T komponenta trend ciklusa
opi oblik multiplikativnog modela:

I I T Y
s


komponenta slu I
komponenta sezonska I
s
.

MODELI TRENDA njima se statistiki opisuje dugorona kovarijacija pojave sa


vremenom
1. ADITIVNI MODEL:
e T Y +
2. MULTIPLIKATIVNI MODEL:

I T Y

3. MODEL LINEARNOG TRENDA:
t t t
e x Y + +

4. MODEL EKSPONENCIJALNOG TRENDA: t
x
t
t
Y
Primjer 1. Linearni trend
Model linearnog trenda identian je modelu jednostavne linearne regresije u kojemu je
vrijeme nezavisna varijabla. Prikladan je kada se vremenska pojava mijenja od razdoblja
do razdoblja za priblino isti apsolutni iznos, tj. kada su prve diferencije priblino
konstantne.
Stanovnitvo SAD-a u milijunima, stanje sredinom godine
godin
a
stanovnit
vo
prve
diferenci
je
varijab
la
vrijem
e
t t
y x
2
t
x
2
t
y
trend
vrijedno
sti
rezidualn
a
odstupanj
a
t
y
t
y
t
x
t
y
t
U
1992 255 - 1 255 1 65025 255.32 -0.32
1993 258 3 2 516 4 . 257.93 0.07
1994 261 3 3 . . . 260.53 0.47
1995 263 2 4 . . . 263.13 -0.13
1996 266 3 5 . . . 265.73 0.27
1997 268 2 6 . . . 268.33 -0.33
ukupn
o
1571 - 21 5544 91 41145
9
1571.00 0.00
a) Odredite vrijednosti prvih diferencija! to se zakljuuje na temelju grafa i prvih
diferencijacija?
1

t t t
Y Y Y
Ako su prve diferencije priblino konstantne radi se o linearnom trendu.
75
trenda od odstupanja slu I e
trenda komponente i vrijednost T
serije vremenske i vrijednost Y
. ,

parametri
odstupanja slu e
brojeva prirodnih n prvih
i vrijednost poprima dogovorno
koja vrijeme ijabla nezavisna x
t
t

,
.
var
Doc.dr.sc. Draenka izmi predavanja 2009.g.
b) Procijenite parametre modela linearnog trenda metodom najmanjih kvadrata!

t t
bx a Y +

Varijabla vrijeme koliko podataka imamo toliko brojeva poprima (1,.,n)



83 . 261
6
1571
5 . 3
6
21

n
y
y
n
x
x
t
t

716 . 252 5 . 3 604 . 2 83 . 261
604 . 2
5 . 3 6 91
83 . 261 5 . 3 6 5544
2 2 2

x b Y a
x n x
y x n y x
b
t
t t
jednadba linearnog trenda:
godina jedna je x za jedinica x
ovnika s milijun je y za jedinica x Y
1992 . 06 . 30 , 1
tan 604 . 2 716 . 252

+
Interpretacija:
a (konstantni lan) = 252.716
Vrijednost trenda broja stanovnika za godinu koja prethodi prvoj godini u nizu tj.za
1991. iznosi
252.716 milijuna.
b (koeficijent linearnog trenda) = 2.604
Pokazuje prosjenu linearnu pojavu razine pojave za jedinini porast vrijednostii
varijable vrijeme,
dakle broj stanovnika poveavao se u prosjeku linearno 2.604 milijuna godinje
c) Odredite trend vrijednosti!
Raunaju se uvrtavanjem varijable vrijeme u jednadbu trenda.
32 . 255 1 604 . 2 716 . 252

1
+ Y
Procjena broja stanovnika prema trendu za 1992. iznosi 255.32 milijuna.


t t
Y Y

d) Odredite rezidualna osdtupanja i protumaite im znaenje!

32 . 0 32 . 255 255

1


U
Y Y U
t t t

0
t
U
za malu decimalu se moe razlikovati od 0 zbog
zaokruivanja
Interpretacija:
Stvarni broj stanovnika zta 1992.g. iznosi 255 milijuna, a vrijednost trenda broja
stanovnika za tu
godinu 255.32 milijuna. Razlika predstavlja rezidualno odstupanje, tj. prema trendu
broj stanovnika je
precijenjen za 0.32 milijuna
e) Formulirajte tabelu ANOVA!

72 . 123
59 . 5 5544 604 . 2 1571 716 . 252 411459
31 . 129 83 , 261 6 411459
2
3 2 2



SR ST SP
y x b Y a Y SR
y n Y ST
t t t t
t

76
Doc.dr.sc. Draenka izmi predavanja 2009.g.
izvor
varijacije
stupnjev
i
slobode
zbroj
kvadrat
a
sredina
kvadrata
empirijski f-omjer
protumaen
modelom
k
1
SP
123.72
SP/k
123.72 ) 1 ( + k n SR
k SP

88.37
neprotumae
na
odstupanja
n-(k+1)
4
SR
5.59
SR/n-
(k+1)
1.40
/
ukupno n-1
5
ST
129.31
/ /
f) Izraunajte varijancu, standardnu devijaciju i koeficijent varijacije trenda! to su mjere
reprezentativnosti
trenda.
Interpretacija:
Prosjeno odstupanje stvarnog broja
stanovnika od
vrijednosti trenda iznosi 0.30 milijuna
ili relativno
0.11%. Na temelju ovih pokazatelja moe se
zakljuiti
da je reprezentativnost trenda velika.
Primjer 2. Eksponencijalni trend
Prikladan je kada se vremenska pojava mijenja od razdoblja do razdoblja za priblino isti
relativni iznos, tj. kada su verini indeksi priblino konstantni.
primjer eksponencijalnog trenda
x
ab Y


x b
n
Y
a
x n x
Y x Y x
b
b x a y
t
t
t t t
log
log
log
log log
log
log log log
2 2


Logaritamskom transformacijom model eksponencijalnog trenda svodi se na model
linearnog trenda. U linegriziranom modelu se umjesto originalnih vrijednosti koriste
njihovi logaritmi.
Interpretacija:
a (konstantni lan)
To je trend vrijednost za razdoblje prije prvoga.
b (koeficijent eksponencijalnog trenda)
Pokazuje za koliko e se puta promijeniti trend vrijednost ako se varijabla vrijeme povea
za 1.
77
( )
% 11 . 0 100
83 . 261
30 . 0
100
tan 30 . 0
93 . 0
6
59 . 5

2

2
2

y
V
ovnika s milijuna
n
SR
n
y Y
y
y
y y
t t
y

You might also like