You are on page 1of 44

Statistiko zakljuivanje

Konani cilj istraivanja je


se donosi na temelju
dobivenoga statistikom analizom
koji daje odgovor na unaprijed postavljeno
U forenzici je to primjerice pitanje je li podudarnost izmeu otiska cipele osumnjienika i
otiska cipele naenoga na mjestu zloina sluajna ili nije?
Primjer. 1. Naen je otisak cipele broj 42 koji je ujedno najprodavanija veliina
cipele i to model Adidas 435, takoer najprodavaniji model cipele.
Primjer. 2. Naen je otisak cipele broj 48, i to model Querty 76 koji se proizvodio
prije 10 godina iskljuivo u Islandu.
Odabir varijable
VARIJABLA - bilo koja veliina koju
promatramo/mjerimo u istraivanju
Varijable:
- visina
- koncentracija glukoze u krvi
- boja oiju
- spol
Varijable
sve varijable istraivanja
to vie varijabli
pitanje kraja istraivanja
jednostavni sloeni (podatci)
mjerne ljestvice
PODATAK
Rezultat mjerenja
1. BROJ
2. RIJE
3. SLIKA
Podaci u tzv. sirovom obliku
Kako doi do zakljuka iz sirovih
podataka?
OBRADOM PODATAKA
Podaci u tzv. sirovom obliku
Promjer
krvne
mrlje
[mm]
Uspjean
RFLP
Uspjean
PCR
23 DA DA
34 DA NE
21 NE DA
15 DA DA
32 DA DA
14 NE DA
8 NE NE
8 NE NE

Podatci
Tablica sa sirovim podatcima
0
20
40
60
80
100
120
1 6 11 16 21 26 31 36
P
o
s
t
o
t
a
k

u
s
p
j
e

n
i
h

t
e
s
t
o
v
a

[
%
]
Promjer mrlje [mm]
Uspjenost krvnih testova s
obzirom na promjer mrlje
Uspjean RFLP
Uspjean PCR
Saeti podatci
Podatci - to dalje s njima?
Unos sirovih podataka u raunalo za daljnju obradu
Neformalni unos pomou programa za obradu teksta (Word,)
Formalizirani unos pomou programa za rad s proraunskim tablicama ili
programa za statistiku obradu podataka.
Kod ovakvog zapisa, mjesto na kojem se nalazi neki podatak unaprijed
je odreeno.
Tipino je zadavanje dvodimenzijske tablice (engl. spreadsheet) u
kojoj se redovima i stupcima odreuju polja mjesta na kojima se
nalazi neki podatak.
Podatci - to dalje s njima?
Raunalni program:
Excel 2007 (Microsoft Office paket)
Raunalni program:
SPSS (od engl. Statistical Package for Sotial
Sciences)
(Apache Software Foundation)
Zato statistika? - opis i analiza rezultata
161 168 158 158 155 155
151 162 156 161 153 150
164 157 160 155 159 157
148 167 145 164 154 163
164 158 161 148 157 147
159 153 146 160 164 162
164 169 150 152 145 151
158 156 169 152 154 167
148 147 163 158 151 165
Visine u cm zemlja X
167 174 174 199 173 200
190 156 190 176 193 197
184 204 167 161 156 205
173 187 190 157 191 169
201 182 167 167 164 179
198 208 191 194 189 194
192 193 189 164 175 207
196 199 178 187 203 157
191 176 198 185 194 173
Visine u cm zemlja Y
Koja od zemalja je Nizozemska, a koja Kina?
Visina najveeg broja ispitanika
Visina kojoj tei najvei broj rezultata
Minimalna i maksimalna visina
Koliko varira visina ispitanika
X Y
MOD 169 202
SREDNJA VRIJEDNOST 158 184
MINIMUM 145 157
MAKSIMUM 169 210
STANDARDNA DEVIJACIJA 7 16
Zato statistika? zakljuivanje iz
pojedinanoga na ope
U nekoj tvornici lijekova proizvedeno je 300 000 kutija
lijeka X za koji postoji sumnja da masa pojedinane
tablete varira za 10 mg od propisane koliine lijeka.
Zakljuivanje iz uzorka o populaciji
Pitanja: Koliko kutija lijeka moramo ispitati?
Kako uzimati kutije za test iz palete?
Kojom vagom mjeriti tablete?
to nam statistika kazuje?
Omoguava kvantificiranje dogaaja.
npr. koliko je vjerojatno da e pacijentica koja se operirala od raka
dojke s promjerom primarnog tumora 2 cm preivjeti barem 5
godina nakon operacije.
Omoguava da se mjere odnosi u podacima.
Je li uestalost surfanja internetom [h] povezana s poveanim BMI?
Omoguava smislenu usporedbu izmeu skupina.
Kako odrediti koja je doputena granica za koncentraciju alkohola u
krvi (usporedba trijeznih <0,5 i pijanih vozaa >=0,5)
Omoguava nam da izvodimo objektivne zakljuke iz podataka.

to je statistici potrebno?
Objekti (entiteti, jedinice) = studenti medicine 1. godine, pacijenti na
kardiovaskularnom odjelu,
Varijable (= obiljeja, znaajke, atributi) = visina, arterijski tlak,
+
MASOVNOST
U istraivanju aktivnosti frenikog ivca kod takora nakon iniciranja serotonina
ispitane su 3 ivotinje, od kojih je jedna uginula. Srednja vrijednost vrne
amplitude signala bila je 7,53,5V.
Primjer
Uzorak i populacija
Populacija skup svih moguih vrijednosti nekog opaanja ili mjerenja - ne
objekata!
Uzorak podskup populacije.
Populacija je opisana parametrima
na populaciju i oznaava se malimgrkim slovima (, ,
itd).
Statistika (ili procjenitelj) - procjena nekog parametra populacije na temelju
uzorka
Podjela STATISTIKE - prema nainima
stvaranja zakljuka
Deskriptivna
statistika
Deskriptivna statistika
omoguava nam da sumiramo
i opiemo nae podatke, ali
nam ne omoguava da
izvodimo zakljuke u svezi
nae hipoteze.
Variable
Distribucije
Inferencijalna statistika
Kao to i ime sugerira, ova
statistika pokuava izvesti
zakljuke o pdacima na
temelju uzorka (intervalne
procjene, testiranje hipoteza)
Populacije
Vjerojatnost
Uzorkovanje
Zato statistika? - opis i analiza rezultata
161 168 158 158 155 155
151 162 156 161 153 150
164 157 160 155 159 157
148 167 145 164 154 163
164 158 161 148 157 147
159 153 146 160 164 162
164 169 150 152 145 151
158 156 169 152 154 167
148 147 163 158 151 165
Visine u cm zemlja X
167 174 174 199 173 200
190 156 190 176 193 197
184 204 167 161 156 205
173 187 190 157 191 169
201 182 167 167 164 179
198 208 191 194 189 194
192 193 189 164 175 207
196 199 178 187 203 157
191 176 198 185 194 173
Visine u cm zemlja Y
Koja od zemalja je Nizozemska, a koja Kina?
Visina najveeg broja ispitanika
Visina kojoj tei najvei broj rezultata
Minimalna i maksimalna visina
Koliko varira visina ispitanika
X Y
MOD 169 202
SREDNJA VRIJEDNOST 158 184
MINIMUM 145 157
MAKSIMUM 169 210
STANDARDNA DEVIJACIJA 7 16
Slinosti vs razlike u statistikim
tendencijama
Statistika koja
pokazuje koliko su
razliite jedinice
sline.
Ova statistika se
esto naziva
mjerom statistike
tendencije.
Srednja vrijednost
Medijan
Mod
Statistika koja
pokazuje koliko se
razliite jedinice
razlikuju.
Ova se statistika
esto naziva
mjerom statistike
varijabilnosti
Varijanca
Standardna
devijacija
Raspon
Podjela STATISTIKE - prema nainima
stvaranja zakljuka
Deskriptivna
statistika
Deskriptivna statistika
omoguava nam da sumiramo
i opiemo nae podatke, ali
nam ne omoguava da
izvodimo zakljuke u svezi
nae hipoteze.
Variable
Distribucije
Inferencijalna statistika
Kao to i ime sugerira, ova
statistika pokuava izvesti
zakljuke o pdacima na
temelju uzorka (intervalne
procjene, testiranje hipoteza)
Populacije
Vjerojatnost
Uzorkovanje
Ljestvice mjerenja
OMJ ERNA
ORDINALNA
NOMINALNA
INTERVALNA
Neke varijable (obiljeja, atributi,
svojstva) , neka .
Spol
Brano stanje
Ovisno o pridruujemo im razliite
Visina
Koncentracija glukoze u krvi
Spol - mogue vrijednosti ove varijable: muko ili ensko. Kod
kodiranja ove vrijednosti prevode se u simbole M/ili pak brojeve
(npr. 1 za muko 2 za ensko).
Spol kao varijabla ne moe primiti niti jednu drugu vrijednost.
Stanje neke bolesti u trenutku promatranja moe biti pogorano,
nepromijenjeno ili poboljano. Pritom imamo tri kategorije ali se za
njih ne moe reci da predstavljaju skalu sreenog intenziteta.
Takva svojstva kao to su spol i spomenuti ishod bolesti zovemo
nominalno mjerenim svojstvima (lat. nomen, nominis = ime)
Primjer
Koje su vrijednosti nominalnih varijabli s kojima ste se do sada najvie
puta susreli u vaim istraivanjima?
Klasifikacijski sustav FBI-a
Loop
Plain Whorl
Double Loop
Arch
Central Pocket Whorl
Tented Arch
Intenzitet opeklina opisujemo u etiri stupnja.
Takovo svojstvo zovemo (lat. ordo,
ordinis = red, vrsta).
Uobiajeni sustav ocjena na ispitu (1-5) takoer je ordinalno mjereno
svojstvo.
Usporeujemo li s
, primjerice metrom, takvo svojstvo zovemo
intervalno mjerenim.
Intervalna skala mjerenja ima jedinicu intervala (primjerice kg, cm,
mmol/L, kPa, mmHg, stupnjevi temperature i slino). Istovrijedna je
na bilo kojem mjestu skale mjerenja.
Intervalne varijable pak mogu primiti kontinuiranu ili diskretnu
(diskontinuiranu) vrijednost.
Primjer
Kojoj se ljestvici mjerenja moe pridruiti broj djece u obitelji?
U obitelji primjerice moe biti jedno, dvoje, troje ili vie djece, ali ne
moe biti 1,7 djece
Spektar koji pokazuje koliinu olova i barija u ahuri metka
nemetrike,
nenumerike
metrike,
numerike
Statistika hipoteza
i. elementarna tvrdnja
ii. tona (istinita) ili netona (neistinita)
Jesu li mukarci vii od ena?
Ukoliko su mukarci vii od ena mogue je da se kod mukaraca hormon rasta
lui intenzivnije?
Postoji li znaajna razlika u visini izmeu mukaraca i ena?
i. provjera hipoteze traenje istine

Statistika hipoteza
iv. istina stvarno stanje
iv. U statistici:
istina vjerojatnost
iv. znaajno ono to se ostvaruje na svaki
drugi nain osim sluajno:
iskaz vjerojatnosti razina znaajnosti
Dokazivanje statistike hipoteze
Razlikuje li se miljenje o kakvoi hrane meu studentima?
(3 dana x 25 prvih na redu, N=75)
hrana studenti studenti
u kantini iz Zagreba izvan Zagreba
dobra 19 (25%) 21 (28%)
loa 8 (11%) 27 (36%)
ukupno 27 48
1. Postavljanje hipoteze
nulta H
0
-hipoteza: razlike nema!
Nema razlike u miljenju.
suprotna H
1
-hipoteza: razlike ima!
Razlika u miljenju postoji.
samo jedna moe biti istinita
samo jedna moe biti prihvaena, dok e
ona druga biti odbaena
Odabir testa
testovi dokazivanja statistikih hipoteza
ovisnost
osobine varijable mjerne ljestvice
osobine uzoraka
veliina
povezanost (zavisni/nezavisni)
osobine raspodjele
parametrijski
neparametrijski
broj obiljeja - uni/bi/multivarijatni testovi
KUHARICA - Shema izbora testa
1. Broj varijabli: jedna ili vie od jedne?
2. Odgovor na pitanje:
postoji li razlika;
postoji li povezanost;
3. Mjerenje:
ovisno ili neovisno?
4. Ljestvica mjerenja:
nominalna, ordinalna, kontinuirana?
5. Raspodjela:
(priblino) normalna ili ne?
Dodatni uvjet (npr. homogenost varijanci)?
6. Broj skupina: dvije ili vie od dvije?
7. Veliina uzorka?
(nastavak)
Ljestvica J edan uzorak Dva uzorka Tri i vie uzoraka
Ovisni Neovisni Ovisni Neovisni
Nominalna binomni test McNemara Cohran
hi-kvadrat Fisher hi-kvad
hi-kvadrat/
Ordinalna Kol/Smir. Wilcoxon Friedman
homologni MW p/medijan
Moses KW
Intervalna
Omjerna . . .
Odreivanje razine znaajnosti
Testiranje ne daje 100% sigurnost u ispravnost
odluke ve su pouzdanosti s kojim radimo 90, 95,
99%.
Naime, u postupku testiranja unaprijed zadajemo
(i time kontroliramo) pogreku (tj. rizik s kojim
radimo statistiki test) a to je vjerojatnost
odbacivanja istinite hipoteze.
Ta se vjerojatnost naziva nivo signifikantnosti
(razina znaajnosti) ili pogreka prvog reda i
oznaava se s .
Odreivanje razine znaajnosti
Statistiki test rauna tzv. p-vrijednost. To je vjerojatnost dobivanja
uoene ili jo vee razlike na sluajnim uzorcima koji se u
istraivanom obiljeju ne razlikuju.
Razini znaajnosti odgovara
vjerojatnost odbacivanja H
0
kad je ona stvarno tona i istinita
tzv. pogreka (pogreka I. vrste)
to manja!
uobiajene vrijednosti, npr. p<0,05
Ako je P < 0,05 odbacuje se nul-hipoteza tj. rezultati su znaajni na
5% znaajnosti
Ako je P>=0.05 prihvaa se nul-hipoteza.
(pogreke testiranja hipoteze)
PRAVO STANJE ZAKLJUENO
RAZLIKA RAZLIKA
POSTOJ I (H
1
) NE POSTOJ I (H
0
)
ISPRAVAN pogreka RAZLIKA
ZAKLJUAK (I. vrste) POSTOJ I
(H
0
odbac.)
pogreka ISPRAVAN RAZLIKE
(II. vrste) ZAKLJUAK NEMA
(H
0
prihvat.)
(nastavak)
zato upravo p<0,05?
POKUS
bacanje novia: pismo/glava
2x isto uzastopce = 0,5
3x = 0,25
4x = 0,125
5x = 0,063
6x = 0,031
7x = 0,016
8x = 0,008
...
4. Izraunavanje
matematiki raun

p = egzaktna vrijednost
(3 decimalna mjesta)
5. Zakljuivanje
mala vrijednost p = mala vjerojatnost da
odbacujemo istinito
zakljuivanje:
p <
vjerojatnost istinitosti H
0
je mala
odbacujemo (ne prihvaamo) nultu hipotezu
prihvaamo alternativnu, H
1
potvrdimo je, iskaemo je, uz p=...
(nastavak zakljuak)
hrana studenti studenti
u kantini iz Zagreba izvan Zagreba
dobra 19 (25%) 21 (28%)
loa 8 (11%) 27 (36%)
ukupno 27 48

2
=3,91, df=1, p=0,048
Uzorak i populacija
populacija mjereno obiljeje
uzorak statistika obrada
podataka
SPOZNAJ A O POPULACIJ I
UZORKOVANJ E
SPOZNAJ A O
UZORKU
PROCJ ENA
hrana studenti studenti
u kantini iz Zagreba izvan Zagreba
dobra 10 (13%) 31 (42%)
loa 15 (20%) 19 (25%)
ukupno 25 50

2
=2,43, df=1, p=0,126
Razlikuje li se miljenje o kakvoi hrane meu studentima?
(5 dana x 15 prvih na redu u omjeru 1:2)
Statistike zamke
Prosjeni ovjek ima jednu dojku i jedan testis.
Des McHale

You might also like