Professional Documents
Culture Documents
• Standardna devijacija
• Parametrijske i neparametrijske metode raspodjele
podataka
• Statistički testovi
• Statistička značajnost
Postupak planiranja faza istraživanja
Predmet istraživanja Hipoteza Cilj istraživanja
Učinak -/+
Statistička
raščlamba
Procjena uspjeha
ispitivanog postupka
M. Šolić: Uvod u znanstveni rad
Š ta je hipoteza ?
• Osnova na kojoj se temelji ideja o prirodnom procesu ili
predmetu istraživanja.
• Postavljanje hipoteze je definiranje privremenog i
najvjerojatnijeg rješenja problema.
• Objašnjenje očekivanog odnosa među varijablama u
određenoj populaciji (uzorku).
Statističke hipoteze
• Obuhvataju istraživačke hipoteze povezujući ih sa parametrima
populacije.
Mogu se podijeliti na :
- Polazna ili nulta hipoteza HO
- Suprotna ili alternativna hipoteza H
Polazna ili nulta hipoteza HO
• Podrazumjeva da u populaciji (uzorku) koji je obuhvaćen
istraživanjem nema odnosa ili značajnih razlika između grupa na
pojedinoj varijabli
• Uvijek se postavlja u obliku negacije “Ne postoji razlika” „ Nije u
vezi sa..“ između grupa na pojedinoj varijabli.
• Primjer HO: Istraživanjem će se dokazati da nema značajne razlike
u učincima određene terapije na pacijente u grupi A i B
Suprotna ili alternativna hipoteza H
Primjer:
1+2+2+3+3+3+4+4+5
9
1+2+2+2+2+3+3+4+8
9
1 2 3 4 8
Aritmetička sredina ( AS)
• Aritmetička sredina predstavlja sumu svih rezultata na nekoj
varijabli podijeljena sa brojem tih rezultata.
• Naziva se i prosječna vrijednost.
Vrste aritmetičke sredine:
• jednostavna aritmetička sredina (za negrupisani niz podataka),
• ponderirana aritmetička sredina (za distribuciju frekvencija).
Aritmetička sredina ( AS)
Primjer :
• Za 20 zaposlenih zdravstvene ustanove prikupljeni su podaci o
godinama starosti i uređeni po veličini.
• Podaci : 19 19 20 20 20 21 22 24 24 25 25 25 28 30 36 36 41 45 53 60
• Total iznosi: 19 + 19 + 20 + 20 + 20 + ... + 60= 593 godine (ukupni
broj navršenih godina starosti : ukupno 20 zaposlenih) dobijemo
da aritmetička sredina (AS), tj. prosječna starost radnika iznosi :
29.65 god.
Medijana (M)
• Označava vrijednost one jedinice skupa koja se u nizu vrijednosti
poredanih po veličini nalazi tačno u sredini i dijeli niz
izmjerenih vrijednosti na dva jednaka dijela, tako da je pola
jedinica skupa iznad, a pola ispod čini medijanu.
• Ako se u distribuciji podataka rezultata mjerenja nalazi neparan
broj, medijana je središnji rezultat.
• Ako se distribucija podataka rezultata mjerenja sastoji od parnog
broja, medijana je jednak prosječnoj vrijednosti dva središnja
rezultata.
Medijana ( M)
• Prvo poredati izmjerene vrijednosti varijable X : X1; X2; ... Xn, po
veličini (u rastućem odnosu , tj. od manjeg prema većem).
• Kada je neparan broj podataka, vrijednost koja je na srednjoj
poziciji u uređenom skupu podataka predstavlja medijan.
• Primjer podataka - vrijednosti 11 mjerenja poredane po veličini:
1; 1; 2; 2; 2; 2; 3; 5; 5; 6; 7
• S obzirom da rezultata mjerenja ima ukupno 11, medijana je
vrijednost koja je na šestoj poziciji u ovom nizu nizu, znači broj 2.
Medijana ( M)
• Prvo poredati izmjerene vrijednosti VARIJABLE X1; X2; ...Xn po veličini (u
rastućem odnosu, tj. od manjeg prema većem).
• Kada je rezultat mjerenja paran broj, onda ne postoji podatak koji je na
srednjoj poziciji jer srednju poziciju "zauzimaju" dva podatka.
• Medijanu predstavlja broj na polovini tog intervala, tj. aritmetičku sredinu.
• Primjer - rezultati 12 mjerenja poredani po veličini:
1; 1; 2; 2; 2; 2; 3; 3; 5; 5; 6; 7:
• S obzirom da ih ima 12, "sredinu" čine šesti i sedmi podatak, tj. brojevi 2 i 3.
• Medijana je aritmetička sredina ta dva broja, tj. medijan je (2 + 3):2 = 2,5.
• Primjer : Medijana niza 4, 5, 6, 7 : M = 5.5
Mod (Mo)
• Mod je vrijednost iz niza izmjerenih vrijednosti varijable X kojoj pripada
najveća frekvencija, tj. izmjerena je najviše puta.
• Predstavlja dominantnu vrijednost u nekoj varijabli.
• Moda ne mora nužno biti jedinstven.
• Može se dogoditi da barem dva modaliteta imaju jednake apsolutne
frekvencije, a da su apsolutne frekvencije svih ostalih modaliteta strogo manje
od njih.
• Primjer : izmjerene vrijednosti jedne varijable :
1; 2; 5; 6; 5; 1; 2; 7; 2; 2; 3; 3:
• Kako je vrijednost 2 izmjerena najviše puta (4 puta), 2 je Mod ovog skupa
podataka.
Mod (Mo)
Razlikuju se sljedeće podjele:
• unimodalne (podjela koja ima tačno
jedan mod),
• bimodalne (podjele koje imaju tačno
dva moda)
• multimodalne (podjele koje imaju
barem tri moda).
Raspon podatka
• Mjera koja pokazuje koliko su numerički podaci raspršeni.
• Definiše se i kao razlika najveće i najmanje vrijednosti u skupu
mjerenih vrijednosti varijable (tj. razlika maksimalne i minimalne
izmjerene vrijednosti varijable).
• Primjer : X1, X2... xn su izmjerene vrijednosti varijable, najmanja od
njih (minimum) je Xmin, a najveća (maksimum) je Xmax.
• Izmjerene vrijednosti jedne varijable :
1, 2, 5, 6, 5, 1, 2, 7, 2, 2, 3, 3.
• Vrijednost 1 je najmanja izmjerena vrijednost, a 7 najveća.
• Prema tome, raspon ovog skupa izmjerenih vrijednosti je 7 − 1 = 6.
Mjere varijacije (disperzije)podatka
• Predstavljaju pokazatelje odstupanja vrijednosti varijable od
prosječne vrijednosti varijable.
• Vrijednost mjera disperzije zavisi od disperzije podataka na
osnovu kojih se ona računa. Kada je veća disperzija podataka, veća
je vrijednost mjera disperzije i obrnuto.
• Mjere disperzije mogu biti:
- Apsolutne mjere disperzije
- Relativne mjere disperzije
Mjere varijacije (disperzije)podatka
Raspon varijacije
• Raspon varijacije predstavlja mjeru disperzije koja se dobija kao
razlika izmedu najveće i najmanje vrijednosti obilježja.
• To je nepotpuna mjera disperzije jer se pri njenom izračunavanju
koriste samo dvije krajnje vrijednosti niza.
• Te vrijednosti mogu biti netipične zbog čega je raspon varijacije
vrlo gruba mjera disperzije.
• Primjer : X1; X2; ... Xn su izmjerene vrijednosti varijable X,
najmanja od njih (minimum) je Xmin, a najveća je Xmax.
• Izračunavanje raspona varijacije : R = Xmax − Xmin
Raspon varijacije
• Primjer:izmjerene vrijednosti jedne varijable :
1; 2; 5; 6; 5; 1; 2; 7; 2; 2; 3; 3:
• Vrijednost 1 je najmanja izmjerena vrijednost, a 7 najveća.
• Izračunavanje raspona varijacije : R = Xmax − Xmin
• Prema tome, raspon ovog skupa izmjerenih vrijednosti je: 7 -1 = 6.
Standardna devijacija
• Svrstava se u red najvažnijih pokazatelja varijabiliteta ili
raspršenosti modaliteta kvantitativnih obilježja.
• U izračuvanju standardne devijacije, koriste se svi elementi
statističkog niza, zbog čega predstavlja potpunu mjeru disperzije.
• Standardna devijacija najčešće se obilježava sa SD ili σ (sigma).
• Standardna devijacija je pozitivna vrijednost drugog korjena
varijanse:
Zašto je važna raspodjela podataka ?
• Od raspodjele podataka ovisi metoda i tok analize.
• Normalna raspodjela omogućuje upotrebu parametrijskih metoda
analize.
• Odstupanje od normalne raspodjele ne omogućuje upotrebu
parametrijskih metoda.
• Analiza raspodjele omogućuje uočavanje mogućih pogrešaka u
podacima.
Raspodjela podataka
• Bitna činjenica za odabir statističkog testa !
Parametrijske metode
Neparametrijske metode
Parametrijske metode
• Analitičke metode koje se zasnivaju na pretpostavci
raspodjele podataka.
• IMA srednje vrijednosti i standardne devijacije.
Primjer : Srednje vrijednosti i standardne devijacije
Aritmetička
sredina 138.3
Medijan 135.0
Min 69.0
Max 230.0
Raspon 161.0
Interkvartilni
raspon 32.0
Aritmetička
sredina 5.69
Medjian 5.40
Min 2.30
Max 17.40
Raspon 15.10
Interkvartilni
raspon 1.10
Parametrijske metode
• Temelje se na parametrima iz uzorka/populacije
• Zahtijevaju normalnu raspodjelu podataka
Normalna raspodjela podataka
• “Gaussova”
• eng. bell shaped
• Srednja vrijednost
ista kao i medijan
• Standardna
devijacija određuje
širinu
Normalna raspodjela podataka
parametri
Normalna raspodjela podataka
Testiranje normalnog rasporeda podataka
http://studentski.hr/system/materials
Tumačenje P-vrijednosti (0.01) tj. 1%
P>0.01 P<0.01
Dobijene razlike između nekih osobina Dobijene razlike između nekih osobina
su statistički slučajne odnosno nisu slučajne , one su statistički
beznačajne. značajne.
P>0.05 P<0.05
Dobijene razlike između nekih osobina Dobijene razlike između nekih osobina
su statistički slučajne odnosno nisu slučajne , one su statistički
beznačajne. značajne.
( p=0,000<0,05)
Dinamika provjere kalorijske vrijednosti namirnica prilikom
kupovine među starijim osobama u KS, 2016
(p=0,093>0,05)
Procenat ispitanika sa potencijalnom hipertenzijom i/ili
koji su pod tretmanom antihipertenziva u FBiH, prema
spolu i starosti, %
80.9
72.6
45.3 47.2
42.1
38.9
27.8
14.2
5.5
(p=0,000)
Procenat ispitanika čija je vrijednost šećera u krvi =ili>6,1
mmol/l u FBiH prema mjestu stanovanja, spolu i starosti
42.2
35.4
16.0
7.4
4.8
FBiH Urbano Ruralno Žene Muškarci 18-24 25-34 35-44 45-54 55-64 65+
(p=0,000)