You are on page 1of 60

Statisticke metode

Predavanje 1

Hrvoje Stefancic

Hrvatsko katolicko sveuciliste, Diplomski studij sestrinstva

February 4, 2016

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 1 / 60
Table of contents
1 Statisticke metode - PREDMET
2 Statistika
3 Osnovne matematicke operacije
4 Mjerenja i varijable
5 Deskriptivna statistika
6 Mjere centralne tendencije
7 Aritmeticka sredina
8 Medijan
9 Mod
10 Raspon rezultata
11 Srednje odstupanje
12 Standardna devijacija i varijanca
13 Poluinterkvartilno rasprsenje
14 Koeficijent varijabilnosti
15 Standardna devijacija
16 Raspodjela podataka
17 Agregiranje podataka
18 Stablo i lisce prikaz distribucije rezultata
19 Histogrami
Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke
sestrinstva)metode Predavanje 1 February 4, 2016 2 / 60
Statisticke metode - PREDMET

Sto i kako se uci u ovom predmetu?

Sto?
osnovni koncepti teorije vjerojatnosti i statistike
osnove prakticne statisticke analize
upotreba racunala u statistickoj analizi (Excel)
Kako?
predavanja (teorija) i vjezbe (zadaci)
cilj je postizanje usvajanja teorijskih koncepata i operativnog vladanja
osnovnim postupcima statisticke obrade
naglasak na stjecanju prakticnih vjestina statisticke obrade - kako rijesiti
konkretne zadatke (olovka i papir ili pomocu racunala)
Po kojim pravilima (OBAVEZNO POGLEDAJTE)?
Izvedbeni plan
Pravilnik o studijima i studiranju

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 3 / 60
Statisticke metode - PREDMET

Sto i kako se uci u ovom predmetu?

Nastavne teme (predavanja) - Izvedbeni plan


Uvodno upoznavanje s problematikom.
Mjere centralne tendencije - aritmeticka sredina
Mjere centralne tendencije - mod i medijan te ostale metode
Mjere varijabilnosti - raspon, standardna devijacija te koeficijent varijabilnosti
Raspodjela podataka - normalna razdioba te druge vrste razdiobe
Agregiranje podataka, histogrami
Polozaj pojedinog rezultata u grupi - percentil, kvartil
Metode procjene - koefijent korelacije
Metode procjene - regresijska analiza
Metode procjene - koeficijent determinacije
Indeksi s nepromjenjivom i promjenjivom bazom
Odredivanje uzoraka, uzorci i populacija, inferencijalna statistika
Statisticki testovi, testiranje hipoteza
t test, 2 test
Graficko prikazivanje rezultata
Statisticki principi u klinickim testiranjima

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 4 / 60
Statisticke metode - PREDMET

A zasto?

u znanstvenom radu u svim podrucjima znanosti, pa tako i u biomedicinskom


podrucju, statisticka obrada je sve vazniji, cesto i nezaobilazni element
u strucnoj literaturi u svim podrucjima znanosti, pa tako i u biomedicinskom
podrucju, se podrazumijeva poznavanje osnovnih, a sve cesce i naprednih
postupaka statisticke analize
biomedicinske znanosti pokazuju trend sve vise razine kvantitativnog opisa -
osnova za razumijevanje buducih metodoloskih pristupa
Kvantitativna znanja - opcenito sve kompetitivnija

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 5 / 60
Statisticke metode - PREDMET

Kvantitativne metode - gruba podjela

analiticke metode (matematicka analiza, linearna algebra, ...) - NE


racunalno modeliranje i numericka matematika (npr. simulacije) - MANJIM
DIJELOM - upotreba racunalnih programa za statistiku
statististicke metode - DA

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 6 / 60
Statistika

Sto je statistika i zasto se koristi


Statistika - obrada brojcanih podataka radi jasnijeg prikazivanja (Petz,
Kolesaric, Ivanec)

Kako od (najcesce) velikog broja podataka doci do malog broja korisnih brojeva
(korisnih u smislu da nam daju bitnu informaciju o cijelom skupu podataka)

Kako sa sto manje brojeva efikasno opisati podatke (umjesto da pamtimo sve
podatke, zapamtimo nekoliko brojeva) - efikasno sazimanje podataka

Primjeri:
aritmeticka sredina tjelesne temperature stotine odraslih zenskih osoba iste
starosti (mjera centralne tendencije)
standardna devijacija tjelesne tezine djecaka u sedmom razredu osnovne skole
(mjera varijabilnosti)
koeficijent korelacije vremena provedenog u proucavanju gradiva i uspjeha na
predmetu (metode procjene)
Statistika se temelji na teoriji vjerojatnosti
Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke
sestrinstva)metode Predavanje 1 February 4, 2016 7 / 60
Statistika

Teorija vjerojatnosti - obrisi najosnovnijih pojmova

Statistika (statisticki postupci, procedure i pravila) je najvecim dijelom temeljena


na primjeni teorije vjerojatnosti

Eksperiment je bilo koji postupak na ciji ishod u nekoj mjeri utjece slucaj, tj.
njegov ishod nije u svakom ponavljanju isti

Dogadaj u nekom eksperimentu mozemo shvatiti kao skup svih povoljnih ishoda
eksperimenta (povoljnih po nekom kriteriju, a taj kriterij zapravo definira dogadaj)

Sto je vjerojatnost nekog dogadaja? Najjednostavnija definicija je:

broj povoljnih ishoda eksperimenta


vjerojatnost dogadaja = P (dogadaj) =
ukupni broj ishoda eksperimenta

Teorija vjerojatnosti - stroga, vrlo razradena i vrlo primjenjiva matematicka


subdisciplina

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 8 / 60
Statistika

Ishod bacanja jedne kocke

Sa X oznacimo ishod bacanja jedne kocke (X je tzv. slucajna varijabla)


Moguci ishodi za X su: 1, 2, 3, 4, 5, 6
Ukupno ima 6 ishoda
1
P (X = 1) = 6
1
P (X = 2) = 6
1
P (X = 3) = 6
1
P (X = 4) = 6
1
P (X = 5) = 6
1
P (X = 6) = 6

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 9 / 60
Statistika

Zbroj ishoda bacanja dvije kocke

Sa Y oznacimo zbroj ishoda bacanja dvije kocke (Y je tzv. slucajna varijabla)


Moguci ishodi za Y su: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
ukupno ishoda ima 6 6 = 36. To su (1, 1), (1, 2), (1, 3), (1, 4), (1, 5),
(1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), (3, 2), (3, 3), (3, 4),
(3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3),
(5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6).
P (Y = 2) = 1/36 (samo ishod (1, 1))
P (Y = 3) = 2/36 = 1/18 (ishodi (1, 2) i (2, 1))
P (Y = 4) = 3/36 = 1/12 (ishodi (1, 3), (2, 2) i (3, 1))
P (Y = 5) = 4/36 = 1/9 (ishodi (1, 4), (2, 3), (3, 2) i (4, 1))
P (Y = 6) = 5/36 (ishodi (1, 5), (2, 4), (3, 3), (4, 2) i (5, 1))
P (Y = 7) = 6/36 = 1/6 ((1, 6), (2, 5), (3, 4), (4, 3), (5, 2) i (6, 1))
P (Y = 8) = 5/36 (ishodi (2, 6), (3, 5), (4, 4), (5, 3) i (6, 2))
P (Y = 9) = 4/36 = 1/9 (ishodi (3, 6), (4, 5), (5, 4) i (6, 3))
P (Y = 10) = 3/36 = 1/12 (ishodi (4, 6), (5, 5) i (6, 4))
P (Y = 11) = 2/36 = 1/18 (ishodi (5, 6) i (6, 5))
P (Y = 12) = 1/36 (samo ishod (6, 6))

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 10 / 60
Osnovne matematicke operacije

Osnovne matematicke operacije

Sto je potrebno od osnovnih matematickih operacija?

zbrajanje, oduzimanje, mnozenje, dijeljenje


potencije, korijenovanje
elementarne funkcije (eksponencijalna, logaritamska, ...)

Postoje brojni vrlo napredni i razradeni racunalni programi za statisticku obradu


(SPSS, SAS, STATA, R, ...)

Excel - siroko dostupan i u sirokoj upotrebi, razmjerno jednostavan za koristenje,


implementirano mnogo najvaznijih funkcija za statisticku obradu

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 11 / 60
Mjerenja i varijable

Razine mjerenja

Ishod mjerenja neke velicine - sadrzan u varijabli

Varijable mogu biti:


1 Nominalne (kategorijske)
Primjer: zanimanje ispitanika
2 Ordinalne - ne moze se utvrditi tocna razlika izmedu pojedinih vrijednosti
Primjer: strucna sprema ispitanika
3 Intervalne - moze se utvrditi tocna razlika izmedu pojedinih vrijednosti
kontinuirane (Primjer: osobni dohodak)
diskretne (Primjer: broj poduzeca u nekom gradu)

Populacija i uzorak (vise rijeci u kasnijim predavanjima)

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 12 / 60
Deskriptivna statistika

Deskriptivna statistika

skupina mjerenja (uzorak) - daje distribuciju (raspodjelu, razdiobu) rezultata


(vrijednosti)

Deskriptivna statistika govori (Feinstein, Thomas)


koje su centralne (najcesce, tipicne) vrijednosti u distribuciji
kolika je disperzija distribucije - koliko je distribucija rasirena
koji je oblik distribucije

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 13 / 60
Mjere centralne tendencije

Mjere centralne tendencije

Mjere centralne tendencije - Sredisnje vrijednosti - prosjek


koja srednja vrijednost najbolje reprezentira niz mjerenja velicine koju
promatramo?
kojom pojedinom brojcanom velicinom mozemo opisati niz mjerenja?
mjere centralne tendencije
aritmeticka sredina
centralna vrijednost (medijan)
dominantna vrijednost (mod)
geometrijska sredina
harmonijska sredina

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 14 / 60
Aritmeticka sredina

Aritmeticka sredina

Neka za neku velicinu oznacenu varijablom X imamo N mjerenja (vrijednosti):


X1 , X2 , . . . , XN . Aritmeticka sredina N promatranih mjerenja je definirana na
sljedeci nacin:
ZBROJ SVIH REZULTATA
ARITMETICKA SREDINA =
BROJ SVIH REZULTATA
odnosno
X1 + X2 + + XN X1 X2 XN
X= = + + + ,
N N N N
ili sazeto
PN
i=1 Xi
X= .
N

Aritmeticku sredinu mozemo izracunati za bilo koji skup numerickih vrijednosti


(brojeva) - pitanje je sto tako izracunata aritmeticka sredina znaci?

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 15 / 60
Aritmeticka sredina

Znacenje aritmeticke sredine


Aritmeticka sredina neke varijable na uzorku - nepristrani procjenitelj ocekivane
vrijednosti u populaciji
Sto se dobiva u mjerenjima?
prava vrijednost + nesistematski varijabilni faktori
nesistematski varijabilni faktori (ako ih ima puno i ako su nezavisni - zajedno daju
normalnu distribuciju - centralni granicni teorem)
aritmeticka sredina ce biti blizu prave vrijednosti ako (Petz, Kolesaric i Ivanec)
1 Rezultati moraju biti prave mjerene vrijednosti, dobivene barem na intervalnoj
ljestvici
2 Svi rezultati moraju biti rezultat istovrsnog mjerenja, dakle dobiveni u
jednakim uvjetima mjerenja
3 Odredivanje aritmeticke sredine zahtijeva dovoljan broj rezultata (najmanje
30)
4 Distribucija rezultata ne odstupa suvise od normalne distribucije

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 16 / 60
Aritmeticka sredina

Izracun aritmeticke sredine

Zadatak: Izracunajte aritmeticku sredinu sljedeceg niza mjerenja velicine X:

12.6, 13.1, 14.0, 12.9, 13.2, 12.8, 12.2, 13.0 .

Zadatak: Temperature izmjerene na dan 31. prosinca u 12h u nekom gradu


tijekom deset uzastopnih godina su:

godina 1 2 3 4 5 6 7 8 9 10
T ( C) 5 2 3 11 15 1 3 7 1 5
Koliko iznosi desetogodisnja aritmeticka sredina temperature?

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 17 / 60
Aritmeticka sredina

Aritmeticka sredina iz frekvencija

Ako se svaka pojedina vrijednost mjerenja pojavljuje vise puta, broj pojavljivanja
vrijednosti Xi nazivamo frekvencija vrijednosti Xi i oznacavamo s fi . Konkretno
imamo

X X1 X2 ... XN
f f1 f2 ... fN

Aritmeticka sredina iz uzorka s frekvencijama


PN
i=1 fi Xi f1 X1 + f2 X2 + . . . fN XN
X= PN
= .
i=1 fi f1 + f2 + + fN

Zadatak: Na trznici u nekom gradu jedne subote na 14 mjesta jabuke su kostale


4.5 kn, na 10 prodajnih mjesta 5 kn, na 18 prodajnih mjesta 5.5 kn, na 15
prodajnih mjesta 6 kn, a na 5 prodajnih mjesta 6.5 kn. Kolika je bila prosjecna
cijena jabuka na trznici te subote?

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 18 / 60
Aritmeticka sredina

Tezinski prosjek

Tezinski prosjek mjerenja Xi , i = 1, 2, . . . , N s tezinama wi , i = 1, 2, . . . , N je


PN
0
i=1 wi Xi w1 X1 + w2 X2 + + wN XN
X = PN
= .
i=1 wi w1 + w2 + + wN

Primjer: Aritmeticka sredina iz uzorka s frekvencijama - tezine su frekvencije

Primjer: Tezinski prosjek ocjena - tezine su brojevi ECTS bodova

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 19 / 60
Aritmeticka sredina

Utjecaj velicine uzorka i nesimetricnosti distribucije

Zadatak (utjecaj velicine uzorka) - Petz: Neka u nekom uzorku imamo sljedece
rezultate: 12, 17, 13, 14, 17, 14, 16, 13, 15, 16. Koliko se promijeni aritmeticka
sredina ako uzorku dodamo vrijednost 20? Ako imamo dvadeset puta veci uzorak
koji sadrzava po dvadeset puta svaki od rezultata iz prvog uzorka, koliko ce se
promijeniti aritmeticka sredina ako vecem uzorku dodamo vrijednost 20?

Zadatak (utjecaj nesimetricnosti distribucije): Neka na nekom vlastelinstvu


zive 100 seljaka, 20 obrtnika i 1 vlastelin. Neka u nekoj jedinici vremena svaki
seljak ima prihod od 1 zlatnika, svaki obrtnik prihod od 5 zlatnika, a vlastelin
prihod od 1000 zlatnika. Koliki je prosjecni osobni prihod u vlastelinstvu?

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 20 / 60
Aritmeticka sredina

Zajednicka aritmeticka sredina

Ako imamo nekoliko skupina mjerenja (npr. M ) neke velicine X i za svaku


i
skupinu mjerenja i je izracunata aritmeticka sredina X te je poznata velicina
skupine Ni , aritmeticka sredina svih mjerenja se moze odrediti po formuli
PM i
i=1 Ni X
X= PM .
i=1 Ni
Zadatak: Potrebno je izracunati aritmeticku sredinu ocjena svih studenata na
nekom preddiplomskom studiju matematike iz jednog predmeta prve godine.
Poznato nam je da aritmeticka sredina 45 studenata prve godine iznosi 4.13, da
aritmeticka sredina 41 studenta druge godine iznosi 4.32 te da aritmeticka sredina
36 studenata trece godine iznosi 3.72. Koliko iznosi trazena aritmeticka sredina?

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 21 / 60
Aritmeticka sredina

Osjetljivost aritmeticke sredine na ektremne rezultate

Aritmeticka sredina uzima u obzir sve rezultate iz distribucije. Ako je neki od tih
rezultata ekstremno velik ili ekstremno malen, tada taj rezultat znacajno utjece na
aritmeticku sredinu.

Primjer (Petz): dva skupa od po 10 mjerenja koja se razlikuju u samo jednom


mjerenju

6, 5, 5, 5, 3, 4, 5, 7, 5, 5 X=5

6, 5, 5, 5, 3, 4, 5, 7, 5, 25 X=7

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 22 / 60
Medijan

Medijan
Medijan ili centralna vrijednost: vrijednost koja je veca od 50 % rezultata i
manja od 50 % rezultata.

Kako izracunati medijan?


rezultati se sortiraju u uzlaznom poretku (od manjih prema vecima)
Ako je broj rezultata neparan (= 2n + 1), medijan je (n + 1)-va vrijednost u
sortiranom uzorku
Ako je broj rezultata paran (= 2n), medijan je aritmeticka sredina n-te i
(n + 1)-ve vrijednosti u sortiranom uzorku

Medijan je sredisnja vrijednost sortiranog skupa mjerenja

Primjer (Petz): ako imamo mjerenja


7, 9, 4, 7, 8, 7, 10, 6, 6, 9, 8

sortirani niz je
4, 6, 6, 7, 7, 7, 8, 8, 9, 9, 10

medijan je C = 7.
Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke
sestrinstva)metode Predavanje 1 February 4, 2016 23 / 60
Medijan

Medijan

Primjer: ako imamo mjerenja

4, 5, 5, 6, 8, 9,
5+6
medijan je C = 2 = 5.5.

Medijan nije osjetljiv na ekstremne vrijednosti, Uzorci

3, 4, 5, 5, 5, 5, 5, 5, 6, 7

i
3, 4, 5, 5, 5, 5, 5, 6, 7, 25
5+5
imaju isti medijan C = 2 .

Ako je distribucija rezultata znacajnije asimetricna ili u distribuciji postoje neke


ekstremne vrijednosti (ekstremno velike ili ekstremno male), aritmeticka sredina ne
reprezentira dobro distribuciju rezultata. U tom slucaju medijan je bolja mjera
centralne tendencije.
Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke
sestrinstva)metode Predavanje 1 February 4, 2016 24 / 60
Mod

Mod

Mod ili dominantna vrijednost = vrijednost koja se najcesce pojavljuje u


distribuciji, najcesca vrijednost

Mod je lokalni maksimum u distribuciji. Moguce je da postoji i vise od jednog


moda (npr. 2 u kojem slucaju imamo bimodalnu distribuciju)

Primjer (Petz): Broj djece po bracnom paru

Broj djece 0 1 2 3 4 5 6 7 8 9 10 11 12
Broj bracnih parova 70 90 108 86 70 47 30 20 15 5 4 3 2

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 25 / 60
Mod

Medijan i mod

Zadatak: Mjerenja neke velicine X rezultirala su sljedecim vrijednostima

i 1 2 3 4 5 6 7
Xi 7 8 9 10 11 12 13
fi 5 11 34 81 62 18 2
Odredite medijan i mod ove distribucije.

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 26 / 60
Mod

Medijan i mod

Zadatak: Mjerenja neke velicine X rezultirala su sljedecim vrijednostima

i 1 2 3 4 5
Xi 0.5 1 1.5 2 2.5
fi 31 17 10 5 3
Odredite medijan i mod ove distribucije rezultata.

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 27 / 60
Mod

Mjere varijabilnosti

Opisuju rasipanje rezultata oko sredisnje vrijednosti.


ako je rasprsenje malo, sredisnja vrijednost dobro opisuje skup rezultata
ako je rasprsenje veliko, sredisnja vrijednost ne opisuje dobro skup rezultata

Odreduju mjeru sirine distribucije rezultata

Mjere varijabilnosti
Raspon rezultata
Srednje odstupanje
Standardna devijacija i varijanca
Poluinterkvartilno rasprsenje
Koeficijent varijacije

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 28 / 60
Raspon rezultata

Raspon rezultata

Definicija: Raspon rezultata je razlika najveceg i najmanjeg rezultata u skupini


rezultata (uzorku).

Cesto se ne navodi samo raspon vec i obje ekstremne vrijednosti (najveca i


najmanja)

Raspon rezultata je osjetljiv na nedetektirane pogreske u mjerenju i moze dosta


odstupati od ostatka rezultata u uzorku.

Raspon rezultata je najsira mjera varijabilnosti, koja u nekim slucajevima ne


opisuje dobro ukupnu distribuciju rezultata

Zadatak: Mjerenja velicine X dala su sljedece rezultate:

3, 4, 4, 2, 5, 5, 3, 2, 1, 3, 6, 3, 4 .
Odredite raspon rezultata za mjerenja velicine X.

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 29 / 60
Srednje odstupanje

Srednje odstupanje

Srednje odstupanje opisuje prosjecno apsolutno odstupanje rezultata od


aritmeticke sredine.
N
1 X
Srednje odstupanje = |Xi X| .
N i

Srednje odstupanje se rijetko koristi.

Zadatak: U nekom gradu su tijekom jednog tjedna izmjerene temperature u 7 h


ujutro

dan pon uto sri cet pet sub ned


T ( C) 13.2 14.0 11.0 11.9 10.2 15.1 15.7
Koliko iznosi srednje odstupanje tijekom tjedna?

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 30 / 60
Standardna devijacija i varijanca

Standardna devijacija i varijanca


Varijanca = racuna se iz kvadrata odstupanja rezultata od aritmeticke sredine

Varijanca velicine X:
N
1 X
Var(X) = (Xi X)2 .
N 1 i

Standardna devijacija:
p
Standardna devijacija = Varijanca ,

odnosno
p
X = Var(X) .
v
u N
u 1 X
X =t (Xi X)2 .
N 1 i

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 31 / 60
Standardna devijacija i varijanca

Standardna devijacija i varijanca

Ako iz uzorka (raspolozivog skupa rezultata) zelimo procijeniti varijancu


(standardnu devijaciju) populacije, racunamo s N 11 .

Ako racunamo samo standardnu devijaciju skupa rezultata (ili racunamo s cijelom
populacijom), racunamo s N1 .

Ukoliko je N dovoljno velik, ova razlika nije bitna.

Standardna devijacija se koristi uz aritmeticku sredinu (velicine iz iste klase)

Alternativna formula za racunanje standardne devijacije


v
u
N N
!2
u 1 X 2 1 X
u
X = t Xi Xi .
N 1 i
N i

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 32 / 60
Standardna devijacija i varijanca

Standardna devijacija i varijanca

Zadatak: Mjerenjem neke velicine X dobiven je sljedeci skup rezultata:

3.1, 4.2, 4.0, 3.7, 2.9, 2.5, 4.3, 3.7, 3.9, 4.7 .
Odredite varijancu i standardnu devijaciju iz rezultata (kao procjenitelje varijance i
standardne devijacije populacije).

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 33 / 60
Poluinterkvartilno rasprsenje

Poluinterkvartilno rasprsenje

Poluinterkvartilno rasprsenje je
Q3 Q1
, Q=
2
gdje je Q1 prvi kvartil, a Q3 je treci kvartil.

Poluinterkvartilno rasprsenje se racuna uz medijan (medijan je drugi kvartil,


C = Q2 )

Zadatak: Za mjerenja velicine X

1, 2, 4, 5, 1, 3, 3, 4, 2, 2, 6, 3 ,
odredite poluinterkvartilno rasprsenje.

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 34 / 60
Koeficijent varijabilnosti

Koeficijent varijabilnosti

Koeficijent varijablinosti velicine X u postocima:


X
VX = 100 .
X

Koeficijent varijabilnosti omogucuje usporedbu mjere disperzije u distribucijama s


razlicitim aritmetickim sredinama i standardnim devijacijama.

Zadatak: Prvi skup mjerenja ima X 1 = 13.1 i X,1 = 3.0, dok drugi skup
mjerenja ima X 2 = 10.2 i X,2 = 1.7. Koji skup mjerenja pokazuje vecu
varijabilnost mjereno koeficijentom varijabilnosti?

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 35 / 60
Standardna devijacija

Standardna devijacija

Zadatak: Na uzorku od 7 grofovija u nekom kraljevstvu prikupljeni su sljedeci


iznosi poreza (u zlatnicima).

grofovija 1 2 3 4 5 6 7
porez 210 230 190 225 180 240 200
Odredite varijancu i standardnu devijaciju ovog skupa mjerenja (kao procjenu
varijance i standardne devijacije populacije).

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 36 / 60
Raspodjela podataka

Raspodjela podataka

Primjer: Bacanje 10 novcica. Zbrojimo ishode bacanja 10 novcica tako da pismo


doprinosi +1, a glava doprinosi 1.
Pribiljezimo ishode bacanja pojedinih novcica i izracunamo zbroj (ovo je
jedan niz bacanja).
Ponavljamo niz od 10 bacanja n puta (sto je n veci, to raspodjela podataka
ima pravilniji oblik u grafickom prikazu).
Prebrojimo broj pojavljivanja pojedine vrijednosti zbroja u n nizova mjerenja -
FREKVENCIJA REZULTATA.
Dijeljenjem frekvencije s n dobivamo procjenu vjerojatnosti pojavljivanja
pojedine vrijednosti zbroja (sto je n veci, to je procjena bolja)
Raspodjela za vrijednost zbroja - binomna raspodjela
Funkcija koja svakom rezultatu pridruzuje njegovu vjerojatnost - FUNKCIJA
VJEROJATNOSTI

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 37 / 60
Raspodjela podataka

Raspodjela podataka za kontinuirane varijable

Za kontinuirane slucajne varijable uvodimo - FUNKCIJU GUSTOCE


VJEROJATNOSTI p(x):

Funkcija gustoce vjerojatnosti daje vjerojatnost da slucajna varijabla X poprimi


vrijednost u intervalu [x , x + x]. Odnosno

p(x)x
je vjerojatnost da bude x X x + x.

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 38 / 60
Raspodjela podataka

Normalna raspodjela

Normalna (Gaussova) raspodjela - ima posebno mjesto medu raspodjelama

Centralni granicni teorem - mnogo nesistematskih slucajnih faktora zajedno vodi


na normalnu distribuciju

Normalna raspodjela je vezana uz kontinuiranu slucajnu varijablu

Funkcija gustoce normalne raspodjele ima oblik zvona i odredena je s dva


parametra: i i oznacava se N (, ).

Za normalnu raspodjelu vrijedi da su aritmeticka sredina, medijan i mod jednaki.

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 39 / 60
Raspodjela podataka

Svojstva normalne raspodjele - oblik raspodjele

= 0, = 1 .

Standardna normalna distribucija

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 40 / 60
Raspodjela podataka

Svojstva normalne raspodjele - ovisnost o parametru

= 0, = 1 i = 0, = 2 .
.

Parametar odreduje sirinu distribucije.


Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke
sestrinstva)metode Predavanje 1 February 4, 2016 41 / 60
Raspodjela podataka

Svojstva normalne raspodjele - ovisnost o parametru

= 0, = 1 i = 5, = 1 .
.

Parametar odreduje polozaj maksimuma distribucije.


Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke
sestrinstva)metode Predavanje 1 February 4, 2016 42 / 60
Raspodjela podataka

Normalna raspodjela

pravilo 1 - vjerojatnost da normalno raspodijeljena slucajna varijabla X


bude X + iznosi 68.26%
pravilo 2 - vjerojatnost da normalno raspodijeljena slucajna varijabla X
bude 2 X + 2 iznosi 95.44%
pravilo 3 - vjerojatnost da normalno raspodijeljena slucajna varijabla X
bude 3 X + 3 iznosi 99.73%

Standardna normalna raspodjela je N (0, 1).


X
Ako varijabla X ima funkciju gustoce raspodjele N (, ), tada varijabla ima
funkciju gustoce raspodjele N (0, 1)

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 43 / 60
Raspodjela podataka

Asimetricnost raspodjele i druge raspodjele

Mjera asimetricnosti raspodjele za velicinu X, Indeks asimetrije:

3(X CX )
= .
X

Osim binomne i normalne raspodjele,u teoriji vjerojatnosti susrecemo i Poissonovu,


geometrijsku, t, F , 2 i druge raspodjele.

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 44 / 60
Agregiranje podataka

Agregiranje podataka

Razdioba podataka - tablica frekvencija

Razredi - intervali podataka

potreba sazetog prikaza podataka

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 45 / 60
Stablo i lisce prikaz distribucije rezultata

Stablo i lisce prikaz distribucije rezultata

Imamo skup mjerenja

11 11 12 12 13 16 17 17 19 20
21 21 22 23 26 26 27 28 28 29
29 30 30 31 31 32 33 33 36 37
38 38 39 39 39 40 42 42 44 47
48 48 49 49 51 52 52 53 54 55
56 59 59 61 61 62 63 64 64 65
67 67 68 69 70 73 77 78 78 78
80 80 81 82 82 84 85 87 87 89
90 90 92 93 96 97 97 98 98 99

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 46 / 60
Stablo i lisce prikaz distribucije rezultata

Stablo i lisce prikaz distribucije rezultata

prva znamenka rezultata - stablo (stem)

druga znamenka rezultata - list (leaf)

stablo list
1 112236779
2 011236678899
3 00112336788999
4 022478899
5 122345699
6 11234457789
7 037888
8 0012245779
9 0023677889

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 47 / 60
Stablo i lisce prikaz distribucije rezultata

Tablica frekvencija po razredima

Razredi sirine 10

Tablica frekvencija po razredima

razred 10 20 30 40 50 60 70 80 90
19.99 29.99 39.99 49.99 59.99 69.99 79.99 89.99 99.99
frekvencija 9 12 14 9 9 11 6 10 10

Tocke frekvencija se ucrtavaju s apscisom na sredini intervala

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 48 / 60
Histogrami

Histogrami

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 49 / 60
Histogrami

Poligoni frekvencija

Na sredisnjoj vrijednosti razreda se ucrta frekvencija


Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke
sestrinstva)metode Predavanje 1 February 4, 2016 50 / 60
Histogrami

Kumulativne frekvencije

Kumulativna frekvencija
i
X
Fi = fj .
j=1

Tablica kumulativnih frekvencija

razred 10 20 30 40 50 60 70 80 90
19.99 29.99 39.99 49.99 59.99 69.99 79.99 89.99 99.99
Fi 9 21 35 44 53 64 70 80 90
Gi 20 30 40 50 60 70 80 90 100

gdje je Gi tzv. prava gornja granica razreda.

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 51 / 60
Histogrami

Kumulativne frekvencije

Tocke kumulativnih frekvencija se ucrtavaju s apscisom (x koordinatom) koja


odgovara pravoj gornoj granici razreda.
Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke
sestrinstva)metode Predavanje 1 February 4, 2016 52 / 60
Histogrami

Relativne frekvencije

Relativna frekvencija za neki se razred i se dobije kao omjer frekvencije tog


razreda i ukupnog broja rezultata, odnosno
fi
PR ,
j=1 fj
gdje je R ukupni broj razreda.

Relativne frekvencije
predstavljaju procjenu raspodjele vjerojatnosti
potrebno ih je koristiti pri usporedbi skupova rezultata razlicite velicine

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 53 / 60
Histogrami

Agregiranje podataka - primjer

Za skup mjerenja velicine X

18 19 21 21 25 26 28 30 33 34
34 34 35 35 36 37 38 38 39 40
40 41 42 42 42 43 43 43 43 44
44 45 45 46 48 49 50 51 53 53
55 57 59 63 67 68 69 72 75 81
odredite tablicu frekvencija s razredima sirine 10, zapisite podatke u obliku
stablo-lisce, nacrtajte histogram, te nacrtajte poligon frekvencija i kumulativne
frekvencije

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 54 / 60
Polozaj rezultata u grupi

Polozaj rezultata u grupi

Distribucija ostalih rezultata u grupi mjerenja nam omogucuje odrediti polozaj


pojedinacnog rezultata u grupi mjerenja

Zanima nas koliko u grupi rezultata ima rezultata koji su manji (veci) od
izdvojenog pojedinacnog rezultata

Kao mjere za odredivanje polozaja pojedinacnog rezultata u grupi rezultata


koristimo
z-vrijednosti - za normalno distribuirane rezultate
percentili

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 55 / 60
z-vrijednosti

z-vrijednosti

z vrijednost nekog rezultata - koliko standardnih devijacija je rezultat udaljen od


aritmeticke sredine

Za pojedinacni rezultat Xi pripadajuca z-vrijednost iznosi

Xi X
zi = .
X

z-vrijednosti se mogu racunati za pojedinacne rezultate u bilo kojoj grupi (skupu)


mjerenja. No, samo ukoliko mjerenja dolaze iz normalne distribucije, z vrijednost
omogucuje odredivanje polozaja pojedinacnog rezultata u cijeloj populaciji
(odnosno, koliko rezultata u populaciji je manje, a koliko vece od pojedinacnog
rezultata, gdje je rezultat smjesten u populaciji). U tom slucaju z vrijednost je
distribuirana po standardnoj normalnoj distribuciji.

Tablice i racunalni programi za svojstva standardne normalne distribucije

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 56 / 60
z-vrijednosti

z-vrijednosti

Primjer: Odredite z-vrijednost za rezultat X1 = 5 ako je X = 3.3 i X = 2.8.

Primjer: Ako z-vrijednost nekog rezultata iznosi -2.1, a rezultat pripada


populaciji iz prethodnog primjera, koliko iznosi spomenuti rezultat?

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 57 / 60
Percentili i decili

Percentili i decili

n-ti percentil - vrijednost u distribuciji od koje je manje n% rezultata i vece


(100 n)% rezultata.

n-ti decil - vrijednost u distribuciji od koje je manje 10n% rezultata i vece


10(10 n)% rezultata.

n-ti kvartil - vrijednost u distribuciji od koje je manje 25n% rezultata i vece


25(4 n)% rezultata.

Medijan je 50-ti percentil, peti decil i drugi kvartil

Prvi kvartil je 25-ti percentil

Treci kvartil je 75-ti percentil

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 58 / 60
Percentili i decili

Percentili i decili

Za grupu rezultata

1 1 2 2 2 3 4 6 8 8
11 11 12 12 13 16 17 17 19 20
21 21 22 23 26 26 27 28 28 29
29 30 30 31 31 32 33 33 36 37
38 38 39 39 39 40 42 42 44 47
48 48 49 49 51 52 52 53 54 55
56 59 59 61 61 62 63 64 64 65
67 67 68 69 70 73 77 78 78 78
80 80 81 82 82 84 85 87 87 89
90 90 92 93 96 97 97 98 98 99
odredite medijan, sve kvartile i decile te 37. i 65. percentil.

U slucaju da imamo mali broj podataka ili da broj podataka nije visekratnik od
100, za odredivanje percentila i decila potrebne su aproksimacije ili interpolacije.

Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke


sestrinstva)metode Predavanje 1 February 4, 2016 59 / 60
Ponavljanje gradiva

Ponavljanje gradiva
Zadatak: U mjerenju velicine X dobiveni su sljedeci rezultati:

8 15 17 18 22 22 25 26 28 31
31 32 32 33 36 36 38 40 40 41
41 42 42 43 43 45 45 46 46 47
48 48 50 51 52 55 57 57 59 65
65 68 69 73 74 77 79 83 88 92
.
Za ovaj skup mjerenja odredite:
1 Broj rezultata
2 Tablicu frekvencija razreda sirine 10
3 Histogram rezultata
4 Poligon frekvencija i kumulativne frekvencije
5 Aritmeticku vrijednost
6 Medijan i mod (mod po razredima)
7 Standardnu devijaciju i varijancu (kao procjenu ovih velicina u populaciji)
8 Treci i sedmi decil
Hrvoje Stefancic (Hrvatsko katolicko sveuciliste, Diplomski studij Statisticke
sestrinstva)metode Predavanje 1 February 4, 2016 60 / 60

You might also like