Professional Documents
Culture Documents
Predavanje 1
Hrvoje Stefancic
February 4, 2016
Sto?
osnovni koncepti teorije vjerojatnosti i statistike
osnove prakticne statisticke analize
upotreba racunala u statistickoj analizi (Excel)
Kako?
predavanja (teorija) i vjezbe (zadaci)
cilj je postizanje usvajanja teorijskih koncepata i operativnog vladanja
osnovnim postupcima statisticke obrade
naglasak na stjecanju prakticnih vjestina statisticke obrade - kako rijesiti
konkretne zadatke (olovka i papir ili pomocu racunala)
Po kojim pravilima (OBAVEZNO POGLEDAJTE)?
Izvedbeni plan
Pravilnik o studijima i studiranju
A zasto?
Kako od (najcesce) velikog broja podataka doci do malog broja korisnih brojeva
(korisnih u smislu da nam daju bitnu informaciju o cijelom skupu podataka)
Kako sa sto manje brojeva efikasno opisati podatke (umjesto da pamtimo sve
podatke, zapamtimo nekoliko brojeva) - efikasno sazimanje podataka
Primjeri:
aritmeticka sredina tjelesne temperature stotine odraslih zenskih osoba iste
starosti (mjera centralne tendencije)
standardna devijacija tjelesne tezine djecaka u sedmom razredu osnovne skole
(mjera varijabilnosti)
koeficijent korelacije vremena provedenog u proucavanju gradiva i uspjeha na
predmetu (metode procjene)
Statistika se temelji na teoriji vjerojatnosti
Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke
sestrinstva)metode Predavanje 1 February 4, 2016 7 / 60
Statistika
Eksperiment je bilo koji postupak na ciji ishod u nekoj mjeri utjece slucaj, tj.
njegov ishod nije u svakom ponavljanju isti
Dogadaj u nekom eksperimentu mozemo shvatiti kao skup svih povoljnih ishoda
eksperimenta (povoljnih po nekom kriteriju, a taj kriterij zapravo definira dogadaj)
Razine mjerenja
Deskriptivna statistika
Aritmeticka sredina
godina 1 2 3 4 5 6 7 8 9 10
T ( C) 5 2 3 11 15 1 3 7 1 5
Koliko iznosi desetogodisnja aritmeticka sredina temperature?
Ako se svaka pojedina vrijednost mjerenja pojavljuje vise puta, broj pojavljivanja
vrijednosti Xi nazivamo frekvencija vrijednosti Xi i oznacavamo s fi . Konkretno
imamo
X X1 X2 ... XN
f f1 f2 ... fN
Tezinski prosjek
Zadatak (utjecaj velicine uzorka) - Petz: Neka u nekom uzorku imamo sljedece
rezultate: 12, 17, 13, 14, 17, 14, 16, 13, 15, 16. Koliko se promijeni aritmeticka
sredina ako uzorku dodamo vrijednost 20? Ako imamo dvadeset puta veci uzorak
koji sadrzava po dvadeset puta svaki od rezultata iz prvog uzorka, koliko ce se
promijeniti aritmeticka sredina ako vecem uzorku dodamo vrijednost 20?
Aritmeticka sredina uzima u obzir sve rezultate iz distribucije. Ako je neki od tih
rezultata ekstremno velik ili ekstremno malen, tada taj rezultat znacajno utjece na
aritmeticku sredinu.
6, 5, 5, 5, 3, 4, 5, 7, 5, 5 X=5
6, 5, 5, 5, 3, 4, 5, 7, 5, 25 X=7
Medijan
Medijan ili centralna vrijednost: vrijednost koja je veca od 50 % rezultata i
manja od 50 % rezultata.
sortirani niz je
4, 6, 6, 7, 7, 7, 8, 8, 9, 9, 10
medijan je C = 7.
Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke
sestrinstva)metode Predavanje 1 February 4, 2016 23 / 60
Medijan
Medijan
4, 5, 5, 6, 8, 9,
5+6
medijan je C = 2 = 5.5.
3, 4, 5, 5, 5, 5, 5, 5, 6, 7
i
3, 4, 5, 5, 5, 5, 5, 6, 7, 25
5+5
imaju isti medijan C = 2 .
Mod
Broj djece 0 1 2 3 4 5 6 7 8 9 10 11 12
Broj bracnih parova 70 90 108 86 70 47 30 20 15 5 4 3 2
Medijan i mod
i 1 2 3 4 5 6 7
Xi 7 8 9 10 11 12 13
fi 5 11 34 81 62 18 2
Odredite medijan i mod ove distribucije.
Medijan i mod
i 1 2 3 4 5
Xi 0.5 1 1.5 2 2.5
fi 31 17 10 5 3
Odredite medijan i mod ove distribucije rezultata.
Mjere varijabilnosti
Mjere varijabilnosti
Raspon rezultata
Srednje odstupanje
Standardna devijacija i varijanca
Poluinterkvartilno rasprsenje
Koeficijent varijacije
Raspon rezultata
3, 4, 4, 2, 5, 5, 3, 2, 1, 3, 6, 3, 4 .
Odredite raspon rezultata za mjerenja velicine X.
Srednje odstupanje
Varijanca velicine X:
N
1 X
Var(X) = (Xi X)2 .
N 1 i
Standardna devijacija:
p
Standardna devijacija = Varijanca ,
odnosno
p
X = Var(X) .
v
u N
u 1 X
X =t (Xi X)2 .
N 1 i
Ako racunamo samo standardnu devijaciju skupa rezultata (ili racunamo s cijelom
populacijom), racunamo s N1 .
3.1, 4.2, 4.0, 3.7, 2.9, 2.5, 4.3, 3.7, 3.9, 4.7 .
Odredite varijancu i standardnu devijaciju iz rezultata (kao procjenitelje varijance i
standardne devijacije populacije).
Poluinterkvartilno rasprsenje
Poluinterkvartilno rasprsenje je
Q3 Q1
, Q=
2
gdje je Q1 prvi kvartil, a Q3 je treci kvartil.
1, 2, 4, 5, 1, 3, 3, 4, 2, 2, 6, 3 ,
odredite poluinterkvartilno rasprsenje.
Koeficijent varijabilnosti
Zadatak: Prvi skup mjerenja ima X 1 = 13.1 i X,1 = 3.0, dok drugi skup
mjerenja ima X 2 = 10.2 i X,2 = 1.7. Koji skup mjerenja pokazuje vecu
varijabilnost mjereno koeficijentom varijabilnosti?
Standardna devijacija
grofovija 1 2 3 4 5 6 7
porez 210 230 190 225 180 240 200
Odredite varijancu i standardnu devijaciju ovog skupa mjerenja (kao procjenu
varijance i standardne devijacije populacije).
Raspodjela podataka
p(x)x
je vjerojatnost da bude x X x + x.
Normalna raspodjela
= 0, = 1 .
= 0, = 1 i = 0, = 2 .
.
= 0, = 1 i = 5, = 1 .
.
Normalna raspodjela
3(X CX )
= .
X
Agregiranje podataka
11 11 12 12 13 16 17 17 19 20
21 21 22 23 26 26 27 28 28 29
29 30 30 31 31 32 33 33 36 37
38 38 39 39 39 40 42 42 44 47
48 48 49 49 51 52 52 53 54 55
56 59 59 61 61 62 63 64 64 65
67 67 68 69 70 73 77 78 78 78
80 80 81 82 82 84 85 87 87 89
90 90 92 93 96 97 97 98 98 99
stablo list
1 112236779
2 011236678899
3 00112336788999
4 022478899
5 122345699
6 11234457789
7 037888
8 0012245779
9 0023677889
Razredi sirine 10
razred 10 20 30 40 50 60 70 80 90
19.99 29.99 39.99 49.99 59.99 69.99 79.99 89.99 99.99
frekvencija 9 12 14 9 9 11 6 10 10
Histogrami
Poligoni frekvencija
Kumulativne frekvencije
Kumulativna frekvencija
i
X
Fi = fj .
j=1
razred 10 20 30 40 50 60 70 80 90
19.99 29.99 39.99 49.99 59.99 69.99 79.99 89.99 99.99
Fi 9 21 35 44 53 64 70 80 90
Gi 20 30 40 50 60 70 80 90 100
Kumulativne frekvencije
Relativne frekvencije
Relativne frekvencije
predstavljaju procjenu raspodjele vjerojatnosti
potrebno ih je koristiti pri usporedbi skupova rezultata razlicite velicine
18 19 21 21 25 26 28 30 33 34
34 34 35 35 36 37 38 38 39 40
40 41 42 42 42 43 43 43 43 44
44 45 45 46 48 49 50 51 53 53
55 57 59 63 67 68 69 72 75 81
odredite tablicu frekvencija s razredima sirine 10, zapisite podatke u obliku
stablo-lisce, nacrtajte histogram, te nacrtajte poligon frekvencija i kumulativne
frekvencije
Zanima nas koliko u grupi rezultata ima rezultata koji su manji (veci) od
izdvojenog pojedinacnog rezultata
z-vrijednosti
Xi X
zi = .
X
z-vrijednosti
Percentili i decili
Percentili i decili
Za grupu rezultata
1 1 2 2 2 3 4 6 8 8
11 11 12 12 13 16 17 17 19 20
21 21 22 23 26 26 27 28 28 29
29 30 30 31 31 32 33 33 36 37
38 38 39 39 39 40 42 42 44 47
48 48 49 49 51 52 52 53 54 55
56 59 59 61 61 62 63 64 64 65
67 67 68 69 70 73 77 78 78 78
80 80 81 82 82 84 85 87 87 89
90 90 92 93 96 97 97 98 98 99
odredite medijan, sve kvartile i decile te 37. i 65. percentil.
U slucaju da imamo mali broj podataka ili da broj podataka nije visekratnik od
100, za odredivanje percentila i decila potrebne su aproksimacije ili interpolacije.
Ponavljanje gradiva
Zadatak: U mjerenju velicine X dobiveni su sljedeci rezultati:
8 15 17 18 22 22 25 26 28 31
31 32 32 33 36 36 38 40 40 41
41 42 42 43 43 45 45 46 46 47
48 48 50 51 52 55 57 57 59 65
65 68 69 73 74 77 79 83 88 92
.
Za ovaj skup mjerenja odredite:
1 Broj rezultata
2 Tablicu frekvencija razreda sirine 10
3 Histogram rezultata
4 Poligon frekvencija i kumulativne frekvencije
5 Aritmeticku vrijednost
6 Medijan i mod (mod po razredima)
7 Standardnu devijaciju i varijancu (kao procjenu ovih velicina u populaciji)
8 Treci i sedmi decil
Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke
sestrinstva)metode Predavanje 1 February 4, 2016 60 / 60