Professional Documents
Culture Documents
Statistika Teorija PDF
Statistika Teorija PDF
hr
STATISTIKA
Doc.dr.sc.Draženka Čizmić
- predavanja 2009.g -
1
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
SADRŢAJ:
1. UVOD
Statistiĉki skup................................................................................... 4
Vrste i izvori statistiĉkih podataka.................................................... 4
2. UREĐIVANJE PODATAKA
Statistiĉki nizovi i tabele ................................................................... 5
Numeriĉki nizovi ................................................................................ 7
3. OSNOVNA ANALIZA VREMENSKIH NIZOVA
Grafiĉko prikazivanje vremenskih nizova ........................................ 10
Individualni indeksi ........................................................................... 10
4. SREDNJE VRIJEDNOSTI STATISTIĈKOG NIZA
Mod.................................................................................................... 12
Medijan............................................................................................. . 13
Aritmetiĉka sredina........................................................................... 15
Geometrijska sredina....................................................................... 17
Skupni indeksi.................................................................................. . 18
5. MJERE DISPERZIJE
Raspon varijacije, Interkvartil, Koeficijent kvartilne devijacije....... 19
Srednje apsolutno odstupanje (MAD).............................................. 22
Varijanca, Standardna devijacija, Koeficijent varijacije.................. 23
Standardizirana varijabla.................................................................. 25
6. MJERE ASIMETRIJE
Koeficijent asimetrije, Pearsonova mjera, Bowleyjeva mjera........ 26
7. MJERE ZAOBLJENOSTI
Koeficijent zaobljenosti.................................................................... 29
8. MJERE KONCENTRACIJE
Koncentracijski omjer, Ginijev koeficijent....................................... 31
9. OSNOVNI POJMOVI VJEROJATNOSTI
Definicije i svojstva vjerojatnosti...................................................... 32
Modeli distribucija vjerojatnosti....................................................... 34
10. OSNOVNI POJMOVI INFERENCIJALNE STATISTIKE
Plan uzorka....................................................................................... . 37
Sampling distribucija........................................................................ 38
11. PROCJENE PARAMETRA
Procjena aritmetiĉke sredine........................................................... 39
Procjena totala osnovnog skupa...................................................... 42
Procjena proporcije osnovnog skupa............................................. . 44
2
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
3
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
PREDAVANJE #1
STATISTIKA – znanstvena metoda koja se bavi prikupljanjem, uređivanjem, analizom i tumaĉenjem
podataka.
DESKRIPTIVNA – u okviru deskriptivne statistike zakljuĉci se donose na temelju svih
podataka. Ona obuhvaća postupke uređivanja, grupiranja, tabeliranja, grafiĉkog prikazivanja
te izraĉunavanja razliĉitih statistiĉko-analitiĉkih veliĉina
INFERENCIJALNA – u sklopu inferencijalne statistike zakljuĉci se dodose na temelju dijela
podataka (uzoraka). Temelji se na teoriji vjerojatnosti
STATISTIĈKI SKUP – ĉine jedinice koje su predmetom promatranja statistiĉkom metodom. Moţemo
promatrati osobe, poduzeća, zemlje, proizvode itd.
OPSEG SKUPA – broj jedinica. S obzirom na opseg statistiĉki skupovi se dijele na:
KONAĈNI STATISTIĈKI SKUP – studenti upisani na efzg
BESKONAĈNI STATISTIĈKI SKUP – bacanje novĉića ili proizvodnja
Statistiĉki skupovi definiraju se pojmovno, prostorno i vremenski.
OSNOVNI SKUP (POPULACIJA) – skup podataka o promatranom svojstvu za svaku jedinicu statistiĉkog
skupa.
UZORAK – podskup, dio osnovnog skupa. Dio podataka izdvojen iz cjelovite evidencije.
STATISTIĈKO OBILJEŢJE (VARIJABLA) – svojstvo koje stupnjem ili oblikom varira od jedinice do jedinice
statistiĉkog skupa.
4
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
IZVORI PODATAKA:
PRIMARNI – prikupljaju se u skladu s ciljem istraţivanja.
SEKUNDARNI – prikupljaju ih razne institucije (drţavni zavod za statistiku, banke, agencije
za istraţivanje trţišta, osiguravajući zavodi...)
PREDAVANJE #2
STATISTIĈKE TABELE:
JEDNOSTAVNA
Poljoprivredna površina po kategorijama u tisućama
hektara u RH, 2003.g
KATEGORIJE POVRŠINA
oranice i vrtovi 1460
voćnjaci 68
vinogradi 57
livade 396
pašnjaci 1156
izvor: SLJRH, 2004.g., str.250
SKUPNA – sadrţi barem dva niza koji su grupirani prema modalitetima istog obiljeţja
Izvoz i uvoz prema preteţnoj ekonomskoj namjeni u
milijunima am. $ u RH, 2003.g.
EKONOMSKA NAMJENA IZVOZ UVOZ
proizvodi za reprodukciju 2959 6583
proizvodi za investicije 1341 3316
proizvodi za široku potrošnju 1886 4311
izvor: SLJRH, 2004.g., str.386
5
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
NOMINALNI ILI REDOSLIJEDNI NIZ ĉine parovi razliĉitog oblika kvalitativne varijable oi i pripadajućih
frekvencija fi (oi, fi), i=1,2,....,k
i 1
fi
i 1
fi
6
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
NUMERIĈKI NIZOVI – nastaju uređenjem numeriĉkih podataka. Naĉin njihova uređivanja ovisi o tome
da li su podaci diskretni ili kontinuirani.
NAĈINI UREĐIVANJA:
1. mali broj podataka - uređuje se nizanjem po veliĉini. Pojedinaĉni numeriĉki podaci grafiĉki se
prikazuju dijagramom s toĉkama i dijagramom stablo-list (S-L dijagram)
Primjer 1.
Podaci o prodaji proizvoda A za 15 dana jednog razdoblja:
Xi: 8, 15, 9, 17, 20, 14, 34, 27, 30, 18, 10, 18, 24, 25, 29
Podaci uređeni po veliĉini:
Xi: 8, 9, 10, 14, 15, 17, 18, 18, 20, 24, 25, 27, 29, 30, 34
dijagram s točkama:
dijagram stablo-list:
0 8 9
1 0 4 5 7 8 8
2 0 4 5 7 9
3 0 4
O|8 predstavlja 8
2. diskretno obiljeţje - velik broj podataka i manji broj oblika – pristupa se grupiranju. Numeriĉki niz
odnosno distribucija frekvencija se sastoji od parova (xi, fi), i=1,2,....,k
xi – modaliteti numeriĉkog obiljeţja
fi – pripadajuće frekvencije
Primjer 2.
Dnevna prodaja garnitura sobnog namještaja
BROJ GARNITURA BROJ DANA
xi fi
1 1
2 5
3 8
4 26
5 19
6 12
ukupno 71
3. kontinuirano obiljeţje/ diskretno obiljeţje s većim brojem oblika – grupiranje se provodi na temelju
razreda. Svaki razred ima donju i gornju granicu.
frekvencija razreda – broj podataka omeđen donjom i gornjom granicom razreda
Numeriĉki niz odnosno distribucija frekvencija sastoji se od parova razreda i pripadajućih
frekvencija (Li1 ≤ xi ≤ Li2, fi), i= 1,2,....,k
Li1 – donja granica i-tog razreda; Li2 – gornja granica i-tog razreda; fi – frekvencija i-tog razreda
7
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
Primjer 3.
Radnici poduzeća A prema
starosti
STAROST BROJ RADNIKA
18 – 26 5
26 – 34 6
34 – 42 10
42 – 50 5
50 – 58 4
ukupno 30
Ako su razredi jednakih veliĉina, veliĉina im se aproksimira tako da se raspon varijacije podijeli sa
x max x min
brojem razreda: ii
k
Razredi jednakih veličina primjenjuju se kada su podaci simetriĉno raspoređeni.
Razredi različitih veličina primjenjuju se kada su podaci asimetriĉno raspoređeni.
Pri brojĉanoj analizi numeriĉkog niza potrebno je utvrditi da li su granice prave, a nakon toga
odrediti veliĉinu razreda i rezredne sredine.
GRANICE RAZREDA:
PRAVE – donja granica tekućeg razreda je jednaka gornjoj granici prethodnog razreda
NOMINALNE – pretvaraju se u prave tako da se svaka donja granica umanji za
polovicu jedinice, a svaka gornja se uveća za polovicu jedinice. To vrijedi za sve
sluĉajeve osim za navršene godine ţivota. Kod navršenih godina ţivota svaka se
gornja granica poveća za jedinicu.
VELIĈINA RAZREDA – određuje se kao razlika gornje i donje prave granice razreda
REZREDNA SREDINA i-tog razreda – određuje se kao poluzbroj gornje i donje prave granice razreda
8
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
Primjer 4.
Nepismeno stanovništvo staro 10.g. i više prema starosti u RH prema popisu iz 2001.g.
STAROST BROJ PRAVE RAZREDNA VELIĈINA KORIGIRANE
OSOBA GRANICE SREDINA REZREDA FREKVENCIJE
fi xi ii
1 2 3 4 5 6
10-19 1845 9.5-19.5 14.5 10 2768
20-34 3160 19.5-34.5 27 15 3160
35-49 4457 34.5-49.5 42 15 4457
50-64 11108 49.5-64.5 57 15 11108
65-(99) 49207 64.5-(99.5) 82 35 21089
UKUPNO 69777 - - - -
Prvi i posljednji razred mogu biti otvoreni razredi. Njihove se veliĉine procjenjuju i procjena se
stavlja u zagradu.
fi
f ci
i i - bazna veliĉina razreda (najĉešće se pojavljuje)
ib
IZVEDENI NIZOVI:
KUMULATIVNI NIZ – nastaje postupnim zbrajanjem apsolutnih ili relativnih frekvencija.
On se grafiĉki prikazuje kumulantom.
Primjer 5.
Stanovništvo prema starosti u RH u tisućama prema popisu iz 2001.g.
STAROST BROJ OSOBA PRAVE GRANICE KUMULATIVNI NIZ
0-14 758 -0.5 – 14.5 758
15-64 2983 14.5 – 64.5 3741
65-(99) 696 64.5 – (99.5) 4437
9
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
PREDAVANJE #3
VREMENSKI NIZ – skup kronološki uređenih vrijednosti koje predstavljaju neku pojavu (proizvodnja,
uvoz, izvoz).
ĈLANOVI NIZA – vrijednosti koje tvore niz
Radi lakšeg praćenja u grafikon se ucrtava mreţa. Prikaz je u pravokutnom koordinatnom sustavu s
aritmetiĉkim mjerilima na osima. Na osi apscisa je mjerilo za varijablu vrijeme, a na osi ordinata za
ĉlanove vremenskog niza.
OKOMITI PREKID GRAFIKONA – ako se ne raspolaţe podacima za dio razdoblja moguće je izostaviti dio
mjerila na osi apscisa.
VODORAVNI PREKID GRAFIKONA – ako neka pojava varira na velikim razinama moguće je izostaviti dio
mjerila osi ordinata.
Prekidaju se samo linijski grafikoni.
10
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
Primjer 1.
Indeks se interpretira kao postotna promjena u odnosu na 100. Ako je veći od 100
predstavlja postotno povećanje, a ako je manji od 100 predstavlja postotno smanjenje.
npr. Izvoz u RH u 2003.g. povećao se za 26.36% u odnosu na 2002.g.
indeksi na stalnoj bazi – njima se mjere promjene u odnosu na neko odabrano bazno
razdoblje. Izraĉunavaju se tako da se svaki ĉlan niza podijeli s vrijednošću baznog razdoblja
yt
te pomnoţi sa 100 I t 100
yb
BAZNO RAZDOBLJE – razdoblje u kojemu pojava nije bila izloţena nekim neuobiĉajenim
utjecajima (prirodne katastrofe, rat). Ponekad se uzima neka vrijednost izvan niza ili
nekakav prosjek.
Primjer 2.
GODINA IZVOZ BAZNI INDEKSI STOPA PROMJENE
1999 = 100
1999 4302 100,00 0,00
2000 4432 103,02 3,02
2001 4665 108,44 8,44
2002 4904 113,99 13,99
2003 6197 144,05 44,05
U 2003.g. izvoz se povećao za 44.05% u odnosu na baznu 1999.g.
11
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
Primjer 4.
Dnevna prodaja garnitura sobnog namještaja
BROJ GARNITURA BROJ DANA
xi fi
1 1 MOD distribucije dnevne prodaje garnitura
namještaja iznosi 4, tj. najĉešća dnevna prodaja
2 5
iznosila je 4 garniture
3 8
4 26
5 19
6 12
UKUPNO 71
Primjer 5.
12
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
MEDIJAN – srednja vrijednost koja numeriĉki niz uređen po veliĉini dijeli na dva jednakobrojna dijela
1. pojedinačni podaci (neparan broj) – MEDIJAN je jednak vrijednosti varijable središnjeg ĉlana u nizu
N
INT M e xr N
r INT 1
2 2
Primjer 6.
Podaci moraju biti uređeni po veliĉini
1 3 5 8 10 12 14 7/2 = 3.5 ; r =4 ; Me = x4 = 8
2. pojedinačni podaci (paran broj) – MEDIJAN je jednak poluzbroju vrijednosti varijable središnjih
dvaju ĉlanova niza uređenog po veliĉini N/2 = INT ; Me = (xr+Xr+1)/2 ; r = N/2
Primjer 7.
11 24 29 37 40 53 65 72 N=8 ; r=4 ; Me = (37+40)/2 = 38.5
N/2 = 896.5
Me = 24.5 + (896.5-216)/1152 * 25 = 39.27 god
Prvih 50% osoba imalo je 39 godina i manje, a preostalih 50% osoba bilo je starije od 39 godina
KVANTILI – numeriĉki niz uređen po veliĉini dijele na jednakobrojne dijelove. Medijan spada među kvantile
KVARTILI – niz uređen po veliĉini dijele na 4 jednakobrojna dijela
DECILI – niz uređen po veliĉini dijele na 10 jednakobrojnih dijelova
PERCENTILI – niz uređen po veliĉini dijele na 100 jednakobrojnih dijelova
Broj kvartila je za jedan manji od njihova reda, tj. 3 su kvartila, 9 decila i 99 percentila
PREDAVANJE #4
x
i 1
i
fixi
i 1
1. ponderi: APSOLUTNE FREKVENCIJE (fi) x
fi
k
pixi
2. ponderi: RELATIVNE FREKVENCIJE U VIDU POSTOTAKA (Pi) x
i 1
100
k
3. ponderi: RELATIVNE FREKVENCIJE U VIDU PROPORCIJA (pi) x pixi
i 1
14
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
306
x 4,31 4 garniture dnevno
71
71748,5
x 40,02 godina
1793
Prosjeĉna starost aktivnog stanovništva iznosila je ≈ 40.02 godina.
ARITMETIĈKA SREDINA ARITMETIĈKIH SREDINA – određuje se kao vagana sredina u kojoj se za pondere
uzima broj podataka za koje su pojedine sredine raĉunate ili tom broju proporcionalne veliĉine.
k
Nixi
i 1
X k
Ni
i 1
15
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
Primjer 4.
Odabrane kompanije zaposlenih i prosjeĉne mjeseĉne plaće u kn
KOMPANIJA BROJ PROSJEĈNA UKUPNA
ZAPOSLENIH PLAĆA PLAĆA Prosjeĉna plaća za sve kompanije:
Ni x Ni xi
3711000
ALFA 550 3500 1925000 X 3313,39
GAMA 320 2300 736000 1120
TRADE 250 4200 1050000
UKUPNO 1120 - 3711000
Ako se svaka individualna vrijednost numeriĉkog obiljeţja zamijeni aritmetiĉkom sredinom dobiva se
polazna veliĉina tj. total ili zbroj vrijednosti numeriĉkog obiljeţja.
ARITMETIĈKA SREDINA RELATIVNIH BROJEVA KOORDINACIJE – određuje se kao vagana sredina u kojoj su
k
BiRi
i 1
ponderi baze tih brojeva R k
Bi
i 1
RELATIVNI BROJEVI KOORDINACIJE – omjerni su brojevi koji nastaju diobom dviju koordinirajućih veliĉina
Vi
Ri
Bi
Grafiĉki se prikazuju na 2 naĉina:
1. jednostavnim stupcima
2. pravokutnicima ĉije su osnovice proporcionalne bazama tih brojeva, a visine samim relativnim
brojevima koordinacije
Primjer 5.
Najveće drţave svijeta, površina u km2 i broj stanovnika na km2
DRŢAVA POVRŠINA U km2 STANOVNIŠTVO/ km2 UKUPAN BROJ Prosjeĉan broj stanovnika
STANOVNIKA na km2 za sve navedene
Bi Ri Vi= Ri*Bi drţave:
RUSIJA 17075400 8 136603200 1929776010
R 35.22 35st. / km2
KANADA 9970610 3 29911830 54786277
SAD 9629091 30 288872730
KINA 9596961 135 1295589735
BRAZIL 8514215 21 178798515
UKUPNO 54786277 - 1929776010
16
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
G N f f f fk
Za grupirane podatke geometrijska sredina dana je izrazom: x1 1 x 2 2 .... x i i .... x k
Primjer 6. zadani su koeficijenti dinamike
GODINA 2000 2001 2002 2003 2004
Vt - 1,06 1,05 1,03 1,02
prosjeĉna stopa raĉunata pomoću geometrijske sredine:
S (G 1) 100
G n 1 V2V3 .....Vn
Promatrana pojava prosjeĉno se godišnje
G 4 1.06 1.05 1.03 1.02 1.03988 povećavala
S (1.03988 1) 100 3.99% za 3.99%.
N
negrupirani pojedinaĉni podaci H N
1
x
i 1 i
k
f
i 1
i
grupirani podaci H k
fi
x
i 1 i
Primjer 7.
Ugostiteljska poduzeća, ukupan promet (u tisućama kn) i promet po zaposlenom (u tisućama kn)
UGOSTITELJSKA PROMET PROMET PO ZAPOSLENI
PODUZEĆA ZAPOSLENOM
Vi Ri Vi/Ri = Bi
HOTELI 6272146 199 31518
KAMPOVI 272070 158 1722
RESTORANI 814160 178 4574
BAROVI 716065 131 5466
KANTINE 331094 137 2417
17
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
Ako nazivnici relativnih brojeva koordinacije nisu poznati, a brojnici jesu ili se lakše procjenjuju do sredine
će se doći pomoću izraza za vaganu ponderiranu harmonijsku sredinu:
k
V
i 1
i
R k
Vi
R
i 1 i
Ako imamo zadano Bi koristimo formulu za aritmetiĉku, a ako su nam zadane Vi koristimo harmonijsku
vaganu sredinu.
SKUPNI INDEKSI – njima se prati dinamika skupine pojava u vremenu npr.proizvodnja, uvoz, izvoz....
SKUPNI INDEKSI CIJENA
SKUPNI INDEKSI KOLIĈINA
SKUPNI INDEKS VRIJEDNOSTI
U pravilu se raĉunaju kao vagana aritmetiĉka sredina individualnih indeksa. Ponderi su obiĉno vrijednosti.
Uglavnom se izraĉunavaju:
LASPEYRESOV INDEKS CIJENA I KOLIĈINA
PAASCHEOV INDEKS CIJENA I KOLIĈINA
FISHEROV INDEKS CIJENA I KOLIĈINA
INDEKS VRIJEDNOSTI
Skupne indekse izraĉunavaju i objavljuju statistiĉki uredi. Obiĉno su Laspeyresova tipa: INDEKS
POTROŠAĈKIH CIJENA – mjera inflacije; INDEKS INDUSTRIJSKE PROIZVODNJE
Skupni indeksi cijena koriste se u postupku deflacioniranja tj. uklanjanja utjecaja promjena cijena na
vrijednosno izraţene pojave.
PREDAVANJE #5
MJERE DISPERZIJE
Reprezentativnost srednje vrijednosti ovisi o stupnju varijabilnosti podataka.Varijabilnost numeriĉkog
obiljeţja predoĉava se i pomoću grafiĉkih prikaza: dijagram s toĉkama i dijagram s pravokutnikom
Mjere za varijabilnost podataka su:
1. raspon varijacije
2. interkvartil
3. koeficijent kvartilne devijacije
4. varijanca
5. standardna devijacija
6. koeficijent varijacije
7. srednje apsolutno odstupanje (MAD)
18
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
1. RASPON VARIJACIJE
pojedinaĉni podaci – određuje se kao razlika između najveće i najmanje vrijednosti
Rx xmax xmin
distribucija frekvencija formirana na temelju pojedinaĉnih podataka – određuje se kao
razlika između posljednje i prve vrijednosti
R x x k x1
distribucija frekvencija s razredima – aproksimira se kao razlika između gornje granice
posljednjeg i donje granice prvog razreda ili kao razlika razrednih sredina posljednjeg i prvog
razreda.
Raspon varijacije je apsolutna (izraţena je u istim mjernim jedinicama kao i obiljeţje) i nepotpuna (dobiva
se iz samo dvije vrijednosti) mjera disperzije.
2. INTERKVARTIL
KVARTILI:
PRVI ILI DONJI KVARTIL (Q1) – vrijednost numeriĉke varijable koja ĉlanove niza dijeli u dvije
skupine. U prvoj je skupini 25% elemenata s vrijednostima varijable koja je jednaka ili manja od
donjeg kvartila, a u drugoj je skupini 75% elemenata s vrijednostima većim od donjeg kvartila.
DRUGI ILI MEDIJAN (Q2)
TREĆI ILI GORNJI KVARTIL (Q3) - vrijednost numeriĉke varijable koja ĉlanove niza dijeli u dvije
skupine. U prvoj je skupini 75% elemenata s vrijednostima varijable koja je jednaka ili manja od
gornjeg kvartila, a u drugoj je skupini 25% elemenata s vrijednostima većim od gornjeg kvartila.
19
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
IQ = Q3 – Q1 = 30 - 25=5 min
Raspon varijacije središnjih 50% studenata iznosio je 5 min, tj. njihova vremena bila su
između 25 i 30 min.
koeficijent kvartilne devijacije
VQ= (Q3-Q1)/(Q3+Q1) = (30-25)/(30+25) = 0.09
Raspon varijacije središnjih 50% studenata u relativnom iznosu je 0.09.
B-P dijagram
N/2 = 10/2 = 5 = INT , r=5
Me = (xr+Xr+1)/2 = (x5+x6)/2 = (28+28)/2 = 28
20
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
raspon varijacije
Rx = 30 – 10 = 20 min
Rx = 27.5 – 12.5 = 15 min
interkvartil
N/4 = 75/4 = 18.75
Kvartilni razred je razred ĉija kumulativna frekvencija prva ukljuĉuje vrijednost N/4
21
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
N
f1
Q1 L1 4 i 18.75 15
Q1 15 5 15.9 min
f k var 20
3N
f1
Q3 l1 4 i 56.25 35
f k var Q3 20 5 23.5 min
30
x
i 1
i x x i Me
pojedinaĉni podaci: MAD
i 1
MADMe
N N
za distiribuciju frekvencija apsolutne razlike ponderiraju se apsloutnim ili relativnim
frekvencijama
Primjer 4.
Dnevna prodaja hladnjaka u 10 prodavaonica iznosila je: 2 5 3 3 7 3 4 6 4 3
PRODAJA x
x 40 4 PRODAJA
N 10
xi x x xi xi M e
i
2 2 2 1,5
5 1 5 1,5
3 1 MAD = 12/10 = 1,2 3 0,5
3 1 3 0,5
2 3 3 3 3 4 4 5 6 7
7 3 7 3,5
3 1 N/2 = 5 = INT, r = 5 3 0,5
4 0 4 0,5
6 2 Me = (x5+x6)/2 = (3+4)/2 = 3.5 6 2,5
4 0 4 0,5
3 1 3 0,5
40 12 40 12,0
PREDAVANJE #6
5. VARIJANCA – aritmetiĉka sredina kvadrata odstupanja vrijednosti numeriĉke varijable od njezine
aritmetiĉke sredine. Varijanca je mjera disperzije u drugom stupnju koju je potrebno vratiti u prvi stupanj.
22
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
x
2
i x
negrupirani podaci
2 i 1
N
k
f (x i i x)2
grupirani podaci
2 i 1
k
f i 1
i
6. STANDARDNA DEVIJACIJA – pozitivni drugi korijen iz varijance. Potpuna i apsolutna mjera disperzije.
N
(x i x)2
negrupirani podaci
i 1
N
f (x i i x )2
grupirani podaci
i 1
k
f i 1
i
7. KOEFICIJENT VARIJACIJE – realtivna mjera disperzije. Određuje se kao omjer srtandardne devijacije i
aritmetiĉke sredine pomnoţen sa sto.
V 100
x
xi ( xi x )2
xi
278
x i 1
27.8 min
20 60.84 N 10
22 33.64
25 . N
27 . ( xi x ) 2
191.60
28 . 2 i 1 19.16
N 10
28 .
30 .
30 . 2 19.16 4.38 min
33 .
35 . 4.38
V 100 100 15.76%
UKUPNO 191.60 x 27.8
23
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
Interpretacija:
Prosjeĉno vrijeme rješavanja zadataka iznosilo je 27.8 minuta s prosjeĉnim odstupanjem od 4.38 minute
odnosno 15.76%.
ZADATAKA STUDENATA f i xi
785
x ki 1
2.80 zadataka
xi fi fixi f ( x x) 2
f
280
i i i
i 1
k
0 10 0 78.4 f i ( xi x ) 2
1 25 25 81.0 344.2
2 i 1
k
1.23
2 55 110 . f i
280
3 125 375 . i 1
Prosjeĉni broj rješenih zadataka iznosio je 2.80 zadatka. S prosjeĉnim odstupanjem od 1.11 zadataka
odnosno 39.64%.
Px i i
4007.5
x i 1
40 godina
100 100
k
P (x i i x) 2
14298.75
2 i 1
k
142.99 Interpretacija:
Pi
100
Prosjeĉna starost aktivnog stanovništva iznosila je 40
i 1
godina. S prosjeĉnim odstupanjem od 11.96 godina
2 142.99 11.96 godina odnosno 30%.
11.96
V 100 100 30%
x 40.00
24
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
3 2 1 x 1 2 3
Primjer 4.
Prosjeĉan broj bodova na 1. kolokviju iz statistike iznosi 15, a prosjeĉno odstupanje od prosjeka iznosi 5.
Na drugom kolokviju postignut je prosjeĉan broj bodova 17 s prosjeĉnim odstupanjem od prosjeka 4.
Student je na prvom kolokviju postigao 20, a na drugome 22 boda. Što se moţe zakljuĉiti o uspjehu
studenta na kolokvijima?
x1 15 x2 17
1 5 2 4
x1 20 x2 22
x1 x20 15
Vrijednost standardiziranog obiljeţja na prvom kolokviju: z 1 1.00
1 5
x x 22 17
Vrijednost standardiziranog obiljeţja na drugom kolkviju: z 2 2 1.25
2 4
Student je na oba kolokvija postigao iznad prosjeĉan rezultat. Bolji je na drugom kolokviju jer je
odstupanje od prosjeka na više 1.25 σ, a na prvome 1 σ.
Primjer 5.
Mjereno je vrijeme u minutama potrebno za rješavanje jednog zadatka iz statistike za 10 studenata.
Dobiveni su ovi rezultati: 20 22 25 27 28 28 30 30 33 35
Je li vrijeme rješavanja od 35 minuta netipiĉno?
Netipičan je podatak koji se nalazi izvan pojasa x 2 tj. ako od prosjeka odstupa za više od 2σ.
Ako se podaci raspoređuju po normalnoj distribuciji netipičan je podatak koji se nalazi izvan pojasa
x 3 tj. ako od prosjeka odstupa za više od 3σ.
25
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
x 27.8 min
4.38 min
Budući da se vrijeme od 35 minuta nalazi u pojasu x 2 ne moţe se
PREDAVANJE #7
MJERE ASIMETRIJE – njima se mjeri naĉin rasporeda podataka prema aritmetiĉkoj sredini ili nekoj
drugoj vrijednosti.Najvaţnije su:
1. Koeficijent asimetrije α3 - potpuna mjera
2. Pearsonova mjera nepotpune
3. Bowleyeva mjera mjere
1. KOEFICIJENT ASIMETRIJE α3
MOMENTI OKO SREDINE – aritmetiĉke sredine odstupanja vrijednosti numeriĉke varijable od
njezine aritmetiĉke sredine podignuti na neku potenciju
N
(x i x)
pojedinaĉni podaci r
i 1
N
k
f (x i i x)r
grupirani podaci r
i 1
k
fi 1
i
- s obzirom na veliĉinu r govori se o nultom, prvom, drugom, trećem ili ĉetvrtom momentu oko
sredine
- koeficijent asimetrije α3 je omjeru trećeg momenta oko sredine i standardne devijacije podignute
M3
na treću potenciju 3 3 obiĉno se kreće u intervalu ±z, a u određenim sluĉajevima moţe
biti izvan toga intervala:
α3 = 0 simetriĉna distribucija
α3 < 0 negativno asimetriĉna distribucija
α3 > 0 pozitivno asimetriĉna distribucija
simetriĉna distribucija
26
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
- Pearsonova mjera definira se kao standardizirano odstupanje vrijednosti medijana ili moda od
aritmetiĉke sredine:
3( x Me) ( x Mo)
St St kreće se u intervalu ±
St = 0 simetriĉna distribucija
St > 0 pozitivno asimetriĉna distribucija
St < 0 negativno asimetriĉna distribucija
simetriĉna distribucija
Me Q1 Q3 Me
Q1 Q3 2 Me 0
27
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
Q1 Q3 2 Me
S ka kreće se u intervalu ±1
Q3 Q1
Ska = 0 simetriĉna distribucija
Ska > 0 pozitivno asimetriĉna distribucija
Ska < 0 negativno asimetriĉna distribucija
1.koeficijent asimetrije
N
(x i x )3
36
3 i 1
3.6 2 3 1.73g
N 10
M3 3.6
3 0.69
N
(x i x)2
30 3
1.733
2 2 i 1
3
N 10
- α3 je pozitivan, distibucija je umjereno pozitivno asimetriĉna
28
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
x
f x 14875.5 19.83 min
i i
f i75
M3
f ( x x ) 1076.29 14.35
i i
3
f 75
i
M2
2 f ( x x ) 1716.67 22.87
i i
2
Mo 21.67 min
f 75 i
Me 20.42 min
Q1 15.94 min
2 22.89 4.78 min
Q3 23.54 min
M3 14.35
3 0.13
3 4.783
x Mo 19.83 21.67
Pearsonova mjera: S k 0.38
4.78
Q Q3 2Me 15.94 23.54 2 80.42
Bowleyjeva mjera: S ka 1 0.18
Q3 Q1 23.54 15.94
MJERA ZAOBLJENOSTI
KOEFICIJENT ZAOBLJENOSTI α4 – njime se mjeri zaobljenost modalnog vrha distribucije. Izraĉunava se kao
M
omjer ĉetvrtog momenta oko sredine i standardne devijacije podignute na 4. potenciju 4 44
N
(x i x )4
negrupirani podaci M 4 i 1
N
k
f i ( x i x )4
grupirani podaci M 4 i 1
k
fi 1
i
29
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
80024.41
1066.99
10-15 15 12.5 13 301.92 f i 75
15-20 20 17.5 . M4 1066.99
4 2.04
20-25 30 22.5 . 4
4.78 4
25-30 10 27.5 . K 4 3 2.04 3 0.96
UKUPNO 75 - 80 024.41
30
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
1. KONCENTRACIJSKI OMJER reda r se određuje tako da se zbroj r vrijednosti (od njih N) podijeli sa
zbrojem N vrijednosti. Pri tome se pretpostavlja da su podaci poredani od najvećeg prema
najmanjem.
r
x
i 1
i
1
Cr N
Cr 1
N
x
i 1
i
31
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
PREDAVANJE #8
DEFINICIJE VJEROJATNOSTI
SLUĈAJNI POKUS – pokus je sluĉajan ako se u definiranim uvjetima moţe ponavljati, ako postoje barem 2
razliĉita ishoda te ako se ishodi ne mogu predvidjeti sa sigurnošću.
PROSTOR UZORKA S – skup svih mogućih ishoda sluĉajnog pokusa
SLUĈAJNI DOGAĐAJ – jednoĉlani ili višeĉlani podskup skupa S te su sa događajima dopuštene skupovne
operacije.
1. KLASIĈNA DEFINICIJA (vjerojatnost a priori) – pretpostavlja se da se pokus ponavlja konaĉan broj puta,
pri ĉemu se vjerojatnost određuje kao omjer povoljnog broja ishoda m i ukupnog broja ishoda n
m
P ( A)
n
2. STATISTIĈKA VJEROJATNOST (vjerojatnost a posteriori) – broj ponavljanja pokusa je beskonaĉan, a
vjerojatnost se aproksimira relativnom frekvencijom, tj.omjerom apsolutne frekvencije opsega i opsega
statistiĉkog skupa.
3. SUBJEKTIVNA VJEROJATNOST – to je broj iz intervala [0,1] određen na temelju prosudbe okolnosti
relevantnih za nastup sluĉajnog događaja.
SVOJSTVA VJEROJATNOSTI:
1) vjerojatnost da događaj A neće nastupiti jednaka je P(Ā)=1-P(A)
2) vjerojatnost istodobnog nastupa događaja A1 i A2 jednaka je P(A1∩A2)
3) ako su događaji međusobno iskljuĉivi, vjerojatnost da će nastupiti događaj A1 ili A2 jednaka je
P(A1UA2)=P(A1)+P(A2)
4) ako događaji nisu međusobno iskljuĉivi, vjerojatnost nastupa barem jednog od njih jednaka je
P(A1UA2)=P(A1)+P(A2)-P(A1∩A2)
5) ponekad je potrebno odrediti vjerojatnost nastupa događaja A uz uvjet da se dogodio događaj B.
P( A B)
Takva se vjerojatnost naziva uvjetnom vjerojatnošću P( A | B)
P( B)
6) ako su događaji neovisni tada vrijedi da je P(A∩B)=P(A)P(B)
SLUĈAJNA VARIJABLA X – numeriĉka funkcija koja svakom ishodu sluĉajnog pokusa pridruţuje realan broj.
diskretna- ako poprima konaĉan broj vrijednosti
kontinuirana – moţe poprimiti bilo koju vrijednost iz nekog intervala
DISTRIBUCIJA VJEROJATNOSTI
diskretne sluĉajne varijable – skup uređenih parova razliĉitih vrijednosti sluĉajne varijable xi i
pripadajućih vjerojatnosti p(xi). Ima slijedeća svojstva:
- p(xi) ≥ 0
- ∑p(xi) = 1
Kumulativna funkcija ili funkcija distribucije F(xi) – pokazuje kolika je vjerojatnost da sluĉajna
varijabla x poprimi vrijednost xi ili manju.
32
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
Primjer 1.
KVALITETA PROIZVODA BROJ PROIZVODA UKUPNO
(KLASA) DOB A DOB B
I 20 10 30
II 10 10 20
III 30 20 50
UKUPNO 60 40 100
Primjer 2.
xi p(xi) xi p(xi) F(xi) a) Pokaţite da je navedena distribucija, distribucija vjerojatnosti!
0 0.1 0 0.1 1) p( xi ) 0
1 0.2 0.2 0.3 DA
2) p( xi ) 1
2 0.4 0.8 0.7
3 0.2 0.6 0.9 b) Odredite oĉekivanu vrijednost! F x xi p( xi ) 2.00
4 0.1 0.4 1.0 c) Odredite vrijednosti funkcije distribucije! (tablica)
UKUPNO 1.0 2.0 - d) Odredite vjerojatnost p(x≤2)! p( x 2) 0.1 0.2 0.4 0.7
33
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
Primjer 3.
Prema raspoloţivim podaciima banke u prosjeku 5 stranaka po satu zahtijeva usluge oroĉavanja depozita.
Pretpostavi li se da stranke prispjevaju u banku neovisno, po satima u random vremenu s itom
vjerojatnosti, kolika je vjerojatnost da se pred šelterom za oroĉavanje nađu: (broj stranaka koje u jednom
satu za radnog vremena dolaze neovisno i s istom vjerojatnosti diskretna je sluĉajna varijabla koja se
ravna prema Poissonovoj distribuciji s parametrom = 5.)
e 5
a) 3 stranke? P(3) 0.14037
3!
b) više od 1 stranke?
P( x 1) 1 p(0) p(1) 0.95957
e 5 5 0
p(0) 0.00674
0!
e 5 51
p(1) 0.03369
1!
34
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
PREDAVANJE #9
Distribucije vjerojatnosti kontinuirane sluĉajne varijable:
1. NORMALNA (GAUSSOVA)
2. STUDENTOVA (T-DISTRIBUCIJA)
3. 2 (HI-KVADRAT)
4. F-DISTRIBUCIJA
5. UNIFORMNA KONTINUIRANA
6. EKSPONENCIJALNA
Jediniĉna normalna distribucija je tabelirana. U poljima tabele nalaze se površine koje predstavljaju
vjerojatnosti. U pred-stupcu tabele su sve vrijednosti izraţene kao brojevi s jednom decimalom. Druga
decimala nalazi se u zaglavlju.Budući da je distribucija simetriĉna u tabeli su dane samo vrijednosti z.
Primjer 1.
Sluĉajna varijabla x distribuirana je po normalnoj distribuciji N ( μ,σ2 ). Odredite vjerojatnost da varijabla
poprimi vrijednost:
a) μ-σ < x < μ+σ
x
z 0
( z)
z 1
( z)
z 1
p( x ) p(1 z 1)
2 P( z 1.00) 2 0.3413 0.6826
Kaţemo da je 68.26% vjerojatno da će sluĉajna varijabla z zauzeti vrijednosti između -1 i 1 ili da će
sluĉajna varijabla x zauzeti vrijednost između μ-σ i μ+σ.
35
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
p( 2 x 2 )
p(2 z 2) 2 P( z 2.00)
2 0.4772 0.9544
2. STUDENTOVA DISTRIBUCIJA
- njen oblik je određen veliĉinom n
- za n>30 (veliki uzorak) distribucija se po obliku pribliţava normalnoj distribuciji
- za n<30 (mali uzorak) distribucija je više razvuĉena na obje strane uzduţ apscise
- i ona je zvonolika i simetriĉna te tabelirana
- u pred-stupcu tablice nalaze se stupnjevi slobode, u zaglavlju su vjerojatnosti. U poljima tabele su
kritiĉne vrijednosti.
Primjer 2.
Sluĉajna varijabla t distibuirana je po Studentovoj distribuciji s 8 stupnjeva slobode. Odredite slijedeće
vjerojatnosti:
a) P (t ≤ 1.397)
b) P (t ≤ -1.397)
36
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
PLAN UZORKA – plan izbora jedinica u uzorak. Osnovna svrha plana je izbor reprezentativnog uzorka, tj.
uzorak mora biti umanjena slika osnovnog skupa.
S obzirom na naĉin izbora jedinica uzorka razlikuju se namjerni i slučajni uzorci.
37
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
PREDAVANJE #10
SAMPLING DISTRIBUCIJA – teorijska distribucija vjerojatnosti procjenitelja parametra. Zasniva se na
konceptu ponovljenih izbora sluĉajnih uzoraka iz danog osnovnog skupa pri ĉemu razliĉiti uzorci dovode do
razliĉitih vrijednosti procjena.
Primjer 1.
Vrijednosti numeriĉke varijable x koje tvore osnovni skup su 1, 3 i 5. Iz skupa se izabiru uzorci veliĉine
n=2. Izbor je s jednakom vjerojatnošću svakog elementa skupa odnosno svakog uzorka.
x i
9
aritmetiĉka sredina osnovnog skupa (μ) i 1
3
N 3
Provest ćemo izbor s ponavljanjem – izbor u kojem se svaki izabrani element za uzorak nakon izbora vraća
u osnovni skup i tako sudjeluje u izboru sljedećeg elementa za uzorak.
Budući da je vjerojatnost izbora svakog sluĉajnog uzorka veliĉine n=2 jednaka, iznosi 1/9, distribucija je
sredina:
aritmetiĉka P ( xi ) xi P ( x i )
sredina uzorka xi
1 1/9 1/9
2 2/9 4/9
3 3/9 9/9 Ex xi p( xi ) 3
4 2/9 8/9
5 1/9 5/9
ukupno 1 27/9=3
sampling distribucija
Oĉekivana vrijednost sampling distribucije aritmetiĉkih sredina uzoraka jednaka je aritmetiĉkoj sredini
osnovnog skupa. Standardna devijacija sampling distribucije sredina prosjeĉno je odstupanje aritmetiĉkih
sredina od aritmetiĉke sredine osnovnog skupa. Ona izraţava pogrešku koja nastaje zbog primjene uzorka,
stoga se naziva standardnom pogreškom aritmetiĉke sredine.
38
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
Primjer 2.
Odredite vrijednost standardne pogreške procjene aritmetiĉke sredine osnovnog skupa za ove
sluĉajeve:
a) Procjenjuje se sredina konaĉnog skupa od 125 768 ĉlanova pomoću sluĉajnog uzorka veliĉine 1250
ĉlanova. Standardna devijacija osnovnog skupa iznosi 64.
N 125768 N-broj elemenata osnovnog skupa
n 1250 n-broj elemanata uzorka
n 1250
f 0.0099 ; f 0.05 Frakcija izbora (f) pokazuje da je u uzorak izabrano
N 125768
pribliţno 1% osnovnog skupa.
N n
, f 0.05
N 1 64
n
x 1.81019
x n 1250
, f 0.05
n
39
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
b) Sredina se procjenjuje pomoću sluĉajnog uzorka veliĉine 600 formiranog izborom svakog desetog ĉlana
konaĉnog osnovnog skupa, a varijanca skupa iznosi 100.
n 600 n 600
f 0.1, f 0.05
N N 6000
10 N 10 n 6000
n N n 10 6000 600
x 0.38733
100 10
2
n N 1 600 6000 1
d)
N 35679
n 2500 ˆ - nepristrani procjenitelj standardne devijacije populacije (osnovnog skupa)
ˆ 10
n 2500
ˆ N n f 0.07 , f 0.05
, f 0.05 N 35679
n N 1
x
ˆ ˆ N n 10 35679 2500
x 0.19287
, f 0.05 n N 1 2500 35679 1
n
e) Veliĉina je uzorka 256 i ĉini 2% osnovnog skupa, a standardna devijacija uzorka je 32.
s 32 s – standardna devijacija uzorka
n 256
256
2 100 N 12800
N
f 0.02 , f 0.05 n
ˆ 32.06268
ˆ s
n1 faktor korekcije
ˆ
x 2.00392
n
Primjer 3.
Tvrtka isporuĉuje vijke pakovanih po 100 komada. Kupac je primio pošiljku od 10000 pakovanja. Radi
kontrole izabran je sluĉajni uzorak od 60 pakovanja. Kontrolom je ustanovljen slijedeći broj neispravnih
60 60
vijaka po pakovanju: 4, 3, 3, 1, 3,…. Njihov zbroj je 117. xi 117 , x 293
2
i
i 1 i 1
Procjenite brojem i intervalom prosjeĉan broj neispravnih vijaka po pakovanju za cijelu pošiljku. Razina
povjerenja je 95%.
40
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
n 60 veliki uzorak
n 60
f 0.006 , f 0.05
N 10000
x
xi 117 1.95 2 procjena prosjeĉnog broja neispravnih vijaka po pakovanju
N 60
intervalni procjenitelj
P x z x x z x 1
2 2
0.95:2 = 0.4750
z(P=0.4750) = 1.96
Kako nije poznata standardna devijacija osnovnog skupa potrebno je izraĉunati njezinu procjenu pomoću
podataka iz uzorka.
1
293 117 2
xi
2 1
n
xi
2
ˆ 60
59
1.04840
ˆ ˆ 1.04840
n1 x 0.13535
n 60
Primjer 4.
Ispituje se prosjeĉno trajanje pozivnih telefonskih razgovora preko telefonske centrale poduzeća Market.
Trajanje u minutama 10 sluĉajno odabranih razgovora iz evidencije 8967 razgovora bilo je slijedeće:
xi : 2 1 1 2 3 4 2 1 1 3
Pretpostavlja se da je trajanje pozivnih razgovora na centrali normalno distribuirano s nepoznatom
aritmetiĉkom sredinom i nepoznatom standardnom devijacijom.
Odredite granice za koje se moţe oĉekivati da obuhvaćaju prosjeĉno trajanje razgovora za osnovni skup.
Pouzdanost procjene je 90%.
41
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
n 10 mali uzorak
P x t x x t x 1
2 2
x
xi 20 2 min
n 10
1 0.90
0.05
2
s.s. n 1 9
t0(.905) 1.833
xi n xi
1 2 20 2
50
2
ˆ 10 1.05409
n 1 9
ˆ 1.05409
x 0.33333
n 10 P2 1.833 0.33333 2 1.833 0.33333 0.90
n 10 P1.38901 2.61099 0.90
f 0.0011152 f 0.05
N 8967
S vjerojatnošću od 90% oĉekuje se da će se prosjeĉno trajanje razgovora za osnovni skup kretati između
1.38901 i 2.61099.
PREDAVANJE #11
x i
T
T N
N N
Zbog toga se postupak procjenjivanja totala svodi na postupak procjenjivanja aritmetiĉke sredine.
procjena totala brojem - Tˆ N x
- Tˆ N x
intervalna procjena za veliki uzorak - P Tˆ z Tˆ T Tˆ z Tˆ 1
2 2
42
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
z - koeficijent pouzdanosti
2
n , f 0.05
0 0
n frakcija: f0
n0
n N
0
, f o 0.05
1 f 0
Primjer 1.
U grafiĉkoj djelatnosti zaposlena su 9 754 zaposlenika. Koliko zaposlenika treba izabrati u uzorak pomoću
kojega se procjenjuje prosjeĉni radni staţ svih zaposlenika. Procjenjuje se s 95% pouzdanosti. Tolerira se
pogreška od najviše ±0.5 godine. Pretpostavlja se da je σ osnovnog skupa 6 godina.
z
2
n0 2
d
N 9754 n0 553
0.95 f0 0.05669 f 0 0.05
(1 ) 0.95 0.4750 1.96 6
2
N 9754
2 n0
d 0.5 0. 5 n0 553
z P 0.4750 1.96 n 523
6 n0 553 1 f 0 1 0.05669
m
procjenitelj procjene brojem: Pˆ m - broj elemenata s određenim modalitetom obiljeţja u uzorku
n
n - broj elemenata uzorka
Sampling distribucija proporcija uzoraka ima oblik binomne ili hipergeometrijske distribucije. Za dovoljno
veliki uzorak aproksimira se normalnom distribucijom.
intervalna procjena za veliki uzorak: P pˆ z pˆ p pˆ z pˆ 1
2 2
p-proporcija osnovnog skupa
STATISTIĈKI TESTOVI:
parametarski – polazi se od danog oblika numeriĉke varijable u osnovnom skupu
neparametarski
DVOSMJERNI TEST – nije ograniĉen smjer odstupanja. Pretpostavka je da je aritmetiĉka sredina jednaka
pretpostavljenoj. Pretpostavka se formulira kao nulta hipoteza.
H 0 ........... 0
H 1 ........... 0
Primjer 2.
Prema standardu prosjeĉna trajnost elektriĉnih ţarulja od 75W iznosi 2000 h s prosjeĉnim odstupanjem
250 h. Iz serije ţarulja izabran je, uz frakciju izbora manju od 5%, sluĉajni uzorak 64 ţarulje. Ispitivanjem
je ustanovljeno da je prosjeĉna trajnost ţarulja u uzorku 1935 h. Moţe li se prihvatiti pretpostavka da je
uzorak izabran iz osnovnog skupa kojemu je aritmetiĉka sredina prema standardu tj.2000 h. testirati na
razini znaĉajnosti 5%.
H 0 ........ 2000
veliki uzorak normalna distribucija
H1........ 2000
250
f 0.05
250
n 64 x 31.25
n 64
x 1935
5%
Koeficijent znaĉajnosti za danu razinu znaĉajnosti određuje se pomoću površina ispod normalne krivulje.
Postupak određivanja toga koeficijenta jednak je postupku određivanja koeficijenta povjerenja pri procjeni
parametra. Međutim koeficijent znaĉajnosti odraţava razinu znaĉajnosti tj. vjerojatnost pogreške tipa I., a
koeficijent povjerenja razinu povjerenja procjene.
zP 0.5 0.025 zP 0.4750) 1.96
ODLUKA:
C1 x C 2 H 0
x C1 H 1 1935 1938.75 H1
x C2 H1
45
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
Na danoj razini znaĉajnosti odbacuje se nulta hipoteza tj. ne prihvaća se pretpostavka da je uzorak
izabran iz skupa ţarulja s prosjeĉnom trajnošću 2000 h.
2. Z-test
test veliĉina ( empirijski z-omjer)
x 0 1935 2000
z 2.08
x 31.25
ODLUKA:
z z H 0
2
2.08 1.96 H1
z z H1
2
z 2.08
p vrijednost 2 P z z 2 Pz 2.08 20.5 0.4812 0.0376
ODLUKA:
p H0
p H1 0.0376 0.05 H1
Primjer 3.
Radi povećanja produktivnosti strojeva predloţena je njihova preinaka. Prema proraĉunima preinaka je
poslovno opravdana ako se postigne povećan broj operacija po satu i ako u prosjeku iznosi više od 120.
Na jednom stroju provedena je preinaka i evidentiran je broj operacija po satu 144 mjerenja. Prosjeĉan
broj operacija po satu iznosi je 125. Zbroj kvadrata vrijednosti mjerenja iznosi 2 307 600. Do kojeg se
zakljuĉka dolazi na temelju provedenog ispitivanja? Vjerojatnost odbacivanja istinite nulte hipoteze iznosi
5%.
H 0 ....... 120
H1....... 120
46
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
ˆ
x i nx 2
2307600 144 1252
20.06981
n 1 143
f 0.05 besk .skup
ˆ 20.06981
x 1.67248
n 144
z P 0.5 0.05 z P 0.4500 1.65
ODLUKA:
x C2 H 0
125 122.76 H1
x C2 H1
Odstupanje aritmetiĉke sredine uzorka na više znaĉajno je pa se prihvaća pretpostavka da je preinaka
strojeva opravdana.
2. Z-test
x 0 125 120
z 2.99
x 1.67248
ODLUKA:
z z H 0
2.99 1.65 H1
z z H 1
ODLUKA:
P H0
0.0014 0.05 H1
P H1
47
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
PREDAVANJE#12
Primjer 1.
Poslovodstvo banke odluĉilo je promijeniti programsku potporu šalterskog poslovanja kako bi se smanjio
prosjeĉni utrošak vremena obrade naloga stranaka i time skratilo vrijeme ĉekanja stranaka. Analizom je
utvrđeno da se promjena potpore isplati ako prosjeĉno vrijeme obrade iznosi najviše 30 sekundi po
nalogu. Razvojna sluţba banke izradila je programsku potporu koja se testira u odabranom broju
poslovnica. Na temelju podataka o trajanju obrade pomoću nove programske potpore za 453 sluĉajno
odabrana naloga izraĉunano je prosjeĉno utrošeno vrijeme po nalogu koje iznosi 28 sekundi s prosjeĉnim
odstupanjem 4 sekunde. Do kojeg se zakljuĉka dolazi na temelju provjere rada s novim programom?
Testirati na razini znaĉajnosti 2%.
H 0 ........ 30
Uzorak je velik pa koristimo normalnu distribuciju.
H1........ 30
n 453 n 453
ˆ s 4 4.0042
x 28 n 1 452 besk.skup f 0.05
s4 4.0042 z P 0.5 0.02 z P 0.4800 2.05
x 0.18814
2% 0.02 453
2. Z-test
test veliĉina (empirijski z-omjer) je:
x 0 28 30
z 10.630
x 0.18814
ODLUKA:
z z H 0
10.630 2.05 H1
z z H 1
Empirijski z-omjer manji je od teorijske vrijednosti pa se na danoj razini signifikantnosti odbacuje nulta
hipoteza.
48
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
Uzorci su zavisni ako se vrijednosti iz uzorka dobivaju ponovljenim opaţanjem odnosno mjerenjem
odabrane varijable na istim jedinicama u razliĉitim vremenskim terminima, npr. mjerenje efikasnosti rada
radnika u istoj tvornici prije i nakon provedenog programa struĉnog usavršavanja.
Primjer 2.
Pomoću uzorka se ispituje razlika u prosjeĉnoj mjeseĉnoj potrošnji mlijeka ĉetveroĉlanih kućanstava u dva
naselja. U naselju Lug je 2500 ĉetveroĉlanih kućanstava, a u naselju Gaj 2000. Kod ĉetveroĉlanih
kućanstava u naselju Lug izabrano je u uzorak svako 50. kućanstvo, a od ukupnog broja ĉetveroĉlanih
kućanstava u naselju Gaj u uzorak je izabrano 2% kućanstava. Na temelju podataka iz uzorka kućanstava
naselja Lug utvrđena je prosjeĉna mjeseĉna potrošnja po kućanstvu 53 litre s prosjeĉnim odstupanjem od
1 litre. Pomoću vrijednosti iz uzorka kućanstava iz naselja Gaj utvrđena je prosjeĉna mjeseĉna potrošnja
po kućanstvu 50 litara s prosjeĉnim odstupanjem od 1.41 litre. Moţe li se prihvatiti pretpostavka da se
prosjeĉna mjeseĉna potrošnja mlijeka ĉetveroĉlanih kućanstava u naseljima Lug i Gaj signifikantno ne
razlikuju? Razini signifikantnosti je 3%.
H 0 ........1 2 0
H1........1 2 0
n1 50 n2 40
0.03
x1 53 l x 2 50 l
z P 0.5 0.015 z P 0.4850 2.17
s1 1l s 2 1.41l
n1 50
ˆ 1 2 s1 2 12 1.02041
n1 1 43
n2 40
ˆ 2 2 s 2 2 1.412 2.03908
n2 1 39
ˆ 1 2 ˆ 2 2 1.02041 2.03908
standardna pogreška za velike uzorke: x1 x2 0.26719
n1 n2 50 40
49
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
ODLUKA:
C1 Dˆ C 2 H 0
Dˆ C H
1 1 3 0.57980 H1
Dˆ C 2 H 1
2. Z-test
test veliĉina (empirijski z-omjer)
x x2 53 50
z 1 11.22997
x1 x2 0.26719
ODLUKA:
z z H 0
2
11.22797 2.17 H1
z z H 1
2
Primjer 3.
Ispituje se pretpostavka da su prosjeĉni izdaci za odjeću poljoprivrednih kućanstava veći od prosjeĉnih
izdataka za odjeću nepoljoprivrednih kućanstava. U tu svrhu odabrani su sluĉajni uzorci od po 500
kućanstava. Promatrani su godišnji izdaci.
H 0 .......1 2 0
H1.......1 2 0
n1 500
ˆ 1 2 s1 2 520.30 2 271254,5992
0.01 n1 1 499
z P 0.5 0.01 z P 0.4900 2.33 n2 500
ˆ 2 2 s 2 2 480.50 2 231342.9359
n2 1 499
standardna pogreška za velike uzorke:
ˆ 1 2 ˆ 2 2 271254.5992 231342.9359
x x 31.7048
1 2
n1 n2 500 500
50
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
2. Z-test
test veliĉina (empirijski z-omjer)
x x2 5900.50 5830.70
z 1 2.20
x1 x2 31.7048
ODLUKA:
z z H 0
2.20 2.33 H 0
z z H 1
Primjer 4.
Ispituje se tvrdnja da su maloprodajne cijene prehrambenih proizvoda niţe u diskontima nego u klasiĉnim
prodavaonicama. U tu su svrhu odabrani sluĉajni uzorci od 50 maloprodajnih cijena u diskontima i 80
maloprodajnih cijena u klasiĉnim prodavaonicama. Uzorci cijena prikupljeni su u istom vremenskom
razdoblju i za isti prehrambeni proizvod.
51
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
H o ........1 2 0
H1........1 2 0
PREDAVANJE #13
REGRESIJSKA ANALIZA – njom se ispituje ovisnost jedne varijable o drugoj varijabli ili o više drugih
varijabli, npr.proizvodnja o broju zaposlenih, potrošnja o visini plaće
MODEL JEDNOSTAVNE LINEARNE REGRESIJE – njime se izraţava odnos među dvjema pojavama.
Model sadrţi jednu zavisnu i jednu nezavisnu varijablu. Primjenjuje se za varijable koje su u linearnom
statistiĉkom odnosu.
52
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
KONSTANTNI ĈLAN a - predstavlja vrijednost regresije u sluĉaju kada je nezavisna varijabla jednaka nuli
REGRESIJSKI KOEFICIJENT b - pokazuje za koliko se u prosjeku mijenja zavisna varijabla ako se nezavisna
varijabla poveća za jedinicu.
y y yˆ i y yi yˆ i
2 2 2
i
ST SP SR
n n
SR
Standardna devijacija regresije: yˆ
n
yˆ
Koeficijent varijacije regresije: V y 100
y
Standardna devijacija regresije interpretira se kao prosjeĉno odstupanje empirijskih vrijednosti od
regresijskih izraţeno apsolutno.
Koeficijent varijacije je to isto odstupanje izraţeno relativno.
y
2
ST i y
Regresija je to reprezentativnija što se koeficijent determinacije više pribliţava jedinici.
53
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
KORELACIJSKA ANALIZA – njome se određuju jakosti veze. Mjera jakosti veze je koeficijent korelacije.
Koeficijent korelacije drugi je korijen iz koeficijenta determinacije: r r
2
Primjer 1.
U 6 prodavaonica na podruĉju A registriran je slijedeći broj zaposlenih i ostvareni promet u tisućama kn.
broj promet xi
2
yi
2
xi y i
zaposlenih
xi yi
2 25 4 625 50
3 31 9 961 93
8 85 . . .
4 51 . . .
7 69 . . .
6 65 . . .
30 326 178 20 398 1900
x
x i
30
5
n 60
y
y i
326
54.33
n 6
54
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
b
xi yi nxy 1900 6 5 54.33 9.65 yˆ a bx
i
2 2 2
x nx 178 6 5
yˆ 6.08 9.65 x
a y bx 54.33 9.65 5 6.08
Interpretacija:
a (konstantni ĉlan) – Kada je broj zaposlenih jednak 0 regresijska vrijednost ukupnog prometa je 6.08
tisuća kuna.
b (regresijski koeficijent) – Ako se broj zaposlenih poveća za jednu osobu tada će se ukupan promet
povećati linearno i u prosjeku za 9.65 tisuća kuna.
yi yˆ i
Relativna rezidualna odstupanja definiraju se izrazom: ui ,rel 100
yi
25 25.38
u1,rel 100 1.52%
25
Interpretacija:
Prema regresiji za 2 zaposlena precijenjen je ukupan promet za 0.38 tisuća kuna ili 1,52%.
SR y i yˆ i
2
80.92
yˆ
2
13.49
n n 6
SR
yˆ 13.49 3.67 tis .kn
n
yˆ 3.67
V yˆ 100 100 6.76%
y 54.33
55
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
Prosjeĉno odstupanje empirijskih vrijednosti prometa od regresijskih vrijednosti iznosi 3.67 tisuća kuna
ili relativno 6.76%
g) Izraĉunajte vrijednosti ĉlanova u jednadţbi rašĉlambe zbroja kvadrata odstupanja vrijednosti zavisne
varijable od njezine aritmetiĉke sredine! (jednadţba analize varijance)
ST yi ny 20398 6 54.33 2 2687.51
2 2
PREDAVANJE #14
y yˆ i
2
i
n2
n
y yˆ i
2
i
n2
Primjer 1.
ˆ ˆ
Dana je regresijska jednadţba : yˆ 125 0.092
.03
x
ˆ
U kojim se granicama moţe oĉekivati da će se naći parametar β? Pouzdanost procjene je 95%, a n=25.
57
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
yˆ y
2
i
i 1
test veliĉina (empirijski f-omjer) : F
ˆ 2
Odluka se donosi usporedbom empirijskog f-omjera sa teorijskom vrijednošću
koja se oĉitava iz tablica.
2. T-TEST
ˆ
test veliĉina (empirijski t-omjer) : t
ˆ
Odluka se donosi usporedbom empirijskog t-omjera sa teorijskom vrijednošću
koja se oĉitava iz tablica.
Test se moţe provesti kao dvosmjerni ili jednosmjerni (na donju ili gornju
granicu). Ako je β<0 jednosmjerni test na donju granicu
Ako je β>0 jednosmjerni test na gornju granicu
Primjer 2.
ˆ ˆ
Dana je regresijska jednadţba: yˆ 125 0.92 x
0.03
ˆ
ODLUKA:
t t H o
2
30.667 2.069 H1
t t H1
2
Nezavisna varijabla x nije suvišna u modelu.
58
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
n k 1 n k 1 n k 1
INTERVALNE PROCJENE PARAMETARA - P ˆ j t ˆ j ˆ j t ˆ j 1
2 2
yˆ y
2
SP
2 i
KOEFICIJENT VIŠESTRUKE DETERMINACIJE - R opći pokazatelj kvalitete modela
y y
2
i
ST
Model je to reprezentativniji što je
koeficijent determinacije bliţe
jedinici.
59
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
PREDAVANJE #15
I s sezonska komponenta
opći oblik multiplikativnog modela: Y T I s I
I sluč . komponenta
60
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
a) Odredite vrijednosti prvih diferencija! Što se zakljuĉuje na temelju grafa i prvih diferencijacija?
Yt Yt Yt 1
Ako su prve diferencije pribliţno konstantne radi se o linearnom trendu.
x
xt 21 3.5 xt yt nxy 5544 6 3.5 261.83 2.604
n 6 b
xt nx 2 91 6 3.5 2
2
y
t 1571 261.83
y
a Y bx 261.83 2.604 3.5 252.716
n 6
61
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
Interpretacija:
a (konstantni ĉlan) = 252.716
Vrijednost trenda broja stanovnika za godinu koja prethodi prvoj godini u nizu tj.za 1991. iznosi
252.716 milijuna.
SP ST SR 123.72
62
Doc.dr.sc. Draţenka Ĉizmić – predavanja 2009.g. UPLOADANO NA: www.referada.hr
log b
x t log Yt x log Yt
x nx 2
2
t
log a
log Y
log bx
t
n
Logaritamskom transformacijom model eksponencijalnog trenda svodi se na model linearnog trenda. U
linegriziranom modelu se umjesto originalnih vrijednosti koriste njihovi logaritmi.
Interpretacija:
a (konstantni ĉlan)
To je trend vrijednost za razdoblje prije prvoga.
63