You are on page 1of 28

1. Šta je statistika?

• Statistika je naučna disciplina koja proučava metode sistematskog prikupljanja,


sređivanja, analize i tumačenja podataka. Potiče od latinske riječi status (država) – popis
stanovništva, prikupljanje poreza, regrutovanje vojnika

• Biostatistika – statistika primjenjena na biološke probleme

• Biometrika – biološka mjerenja

2. Statistički skup

• Statistički skup je skup stvari, jedinki, pojava ili drugih objekata čije osobine posmatramo ili
istražujemo primjenom statističkih metoda

• Obim/veličina statističkog skupa (N broj elemenata skupa, konačni i beskonačni skupovi)

• Statistički skup treba biti jednoznačno definiran pojmovno, prostorno i vremenski

3. Statistički skup (2)

• Pojmovno definiranje – određivanje općih svojstava (osobina, obilježja) koja se


izražavaju opisno, a imaju ih sve jedinice statističkog skupa;

• Prostorno definiranje – odrediti prostor (lokaciju) za koji su vezane sve jedinice


statističkog skupa;

• Vremensko definiranje – odrediti vrijeme za koje su vezane sve jedinice statističkog


skupa.

4. Statističko obilježje (varijabla)

• Statistiko obilježje (varijabla) je svojstvo koje je zajedničko svim jedinicama


statističkog skupa

• Statističke varijable mogu biti: –kvalitativne (izražavaju se riječima, opisno) –


kvantitativne (izražavaju se brojem)

Primjer: Studenti u BiH (2)

• Pojmovna definicija: Upisani student je svako lice upisano na visokoškolsku ustanovu.


Apsolventi su studenti koji su odslušali sva predavanja te u toku apsolventskog staža (koji
traje 12 mjeseci od isteka posljednje godine studija) polažu preostale ispite i brane diplomski
rad • Prostorna definicija: Bosna i Hercegovina • Vremenska definicija: akademska
2013./2014. godina • Obim skupa: N = 112 922 • Jedinica skupa je jedan student. Obilježje
skupa je spol i godina studija
5. Populacija i uzorak

• Populacija ili osnovni skup je skup svih subjekata čije osobine analiziramo. Predstavlja
skup podataka o posmatranom svojstvu (varijabli) za sve jedinice statističkog skupa, tj. skup
svih mogućih vrijednosti nekog statističkog obilježja

. • Uzorak je podskup posmatrane populacije (odabran određenom metodologijom).

6. Populacija i uzorak (2)

• Parametar je numerička karakteristika populacije

• Statistika je numeričko mjerenje koje opisuje karakteristiku uzorka

• Statistiku (uzorka) koristimo kako bismo izveli zaključke o parametru (populacije)

7. Tipovi podataka / obilježja (data types)

• tip(ovi) podataka prikupljeni u istraživanju u velikoj mjeri određuju tip statističke


analize koji će se koristiti, koje će se hipoteze testirati i koji model predviđanja ćemo
koristiti

• Izvori podataka: primarni (direktno opažanjem ili provedbom eksperimenta) i sekundarni


(javni podaci, Internet...)

• Dva osnovna tipa podataka: – kategorički (kvalitativni) podaci – kvantitativni


(numerički) podaci

8. Kategorički podaci

• mogu biti grupisani u kategorije bazirane na nekoj kvalitativnoj karakteristici

• dijele se na nominalne i ordinalne

• Nominalni – kada nema prirodnog uređenja kategorija (naziv, ime, kategorija), npr.
boja kose, spol, rasa, status pušenja – pušač ili nepušač), status bolesti (atributivna), mjesto
rođenja (geografsa). Nisu dopuštene nikakve računske operacije

• Ordinalni – kategorije mogu biti uređene (redosljed, intenzitet), kao npr. stepen boli
(nikako, malo, jako), visina prihoda (nizak, srednji, visok). Ne mogu se vršiti računske
operacije, ali se podaci mogu međusobno upoređivati
9. Kvantitativni podaci

• Kvantitativni podaci su numerička mjerenja pri čemu su brojevi povezani sa skalom


mjerenja • Dijele se na diskretne i neprekidne • Diskretni – uzimaju samo konačan ili
prebrojiv broj vrijednosti. Npr. broj poljoprivrednih domaćinstava, broj mačića u okotu i sl. •
Neprekidni – mogu poprimiti bilo koju realnu vrijednost. Npr. dužina, zapremina, masa,
vrijeme... Ograničenja postavljaju mjerni instrumenti

10. Mjerne skale

• Nominalna

• Ordinalna

• Intervalna

• Omjerna

11. Nominalna skala

• nisu skale u pravom smislu riječi jer nemaju slijed veličina i služe nam samo za
identifikaciju ili kategorizaciju

• označavamo istu stvar istim brojem ili simbolom ili imenom • od aritmetičkih operacija
dopušteno samo brojanje!

• Statistički postupci: Na nominalnim skalama dopušteno koristiti samo dominantnu


vrijednost, račun proporcija, x2 test, Φ, Cramerov Fi i koeficijent kontingencije.

12. Ordinalna skala

• služe za označavanje redoslijeda ili poretka

• tipičan primjer ordinalne skale je poredak igrača po uspješnosti na nekom takmičenju

• ordinalne skale određuju samo relativan položaj rezultata u grupi, odnosno određuju da li je
nešto manje ili veće, ali nepoznata je razlika među pojedinim jedinicama skale, odnosno
rangovima, i ona nije jednaka

• od aritmetičkih operacija operacija dopušteno: < >, • Statistički postupci: Na takvim je


skalama dopušteno koristiti statističke postupke kao i za nominalne skale, ali i centralnu
vrijednost, rang korelaciju ρ, Tau, Teta i koeficijent W
13. Intervalna skala

• Kod intervalnih skala, osim redoslijeda poznate su i razlike među brojevima na


skali, jer je u tim skalama neka definirana razlika jednaka na svakom dijelu skale. npr.
razlika od 1°C je uvijek jednaka, bez obzira radi li se o razlici među 0°C i 1°C, ili između
15°C i 16°C.

• te skale nemaju apsolutnu nulu (odsustvo kvantitete obilježja), već je nula relativna ili
proizvoljna (npr. ispitanik sa nula bodova na testu inteligencije – ne može se reći da mu je
inteligencija jednaka nuli).

• nemogućnost stavljanja brojeva u omjere: ne može se tvrditi npr. da je temperatura od


100 F dva puta veća od 50 F, jer je to 10° i 38 °C.

• Od aritmetičkih operacija dopušteno: +, ‐ • Statistički postupci: Na ovim je skalama


dopušteno koristiti sve statističke postupke kao za nominalne i ordinalne skale, ali i
aritmetičku sredinu, standardnu devijaciju, z‐ vrijednosti i koeficijent korelacije r,
multiplu i parcijalnu korelaciju.

14. Omjerna skala

• osim što imaju sve osobine intervalnih skala, imaju i svojstvo da jednaki brojčani
odnosi (omjeri) znače i jednake odnose u mjerenoj pojavi.

• to je zato jer te skale imaju apsolutnu nulu – apsolutna nula podrazumijeva odsustvo
pojave koja se mjeri.

• npr. dužina, težina, otpor itd (fizikalne jedinice). Tako možemo npr. utvrditi da je da je
dužina od 30 centimetara tri puta veća od dužina od 10 centimetara jer je to tako u svim
mjernim sistemima. • Od aritmetičkih operacija dopušteno: *, /

• Statistički postupci: osim statističkih postupaka za nominalne, ordinalne i intervalne


skale, dopušteno je koristiti i koeficijent varijabilnosti i geometrijsku sredinu

Vježba (rješenja)

• pripadnost znaku horoskopa NOM

• vrsta psa NOM

• procjena kvalitete hrane na skali od 1 do 3 ORD

• godišnji prihod u eurima OMJ • poredak konja na nekom takmičenju ORD

• pripadnost određenom spolu NOM


• bračni status NOM

• snaga stiska ruke na dinamometru OMJ

• rezultat na testu numeričkih sposobnosti INT

• masa planktona u kubnom metru mora u kg OMJ

• rezultat na standardiziranom testu inteligencije INT

• udaljenost u km OMJ • temperatura u stepenima C INT

• težina jabuka OMJ • brojevi na dresovima nogometaša NOM

• veličina odrasle amebe u μm OMJ

• vrste slonova po veličini na Zemlji NOM

15. Deskriptivna i inferencijalna statistika

• Statistika se dijeli na: –deskriptivnu (opisnu) – obuhvata postupke uređivanja, tabličnog i


grafičkog predstavljanja podataka, izračunavanje opisnih statističkih pokazatelja (srednja
vrijednost, standardna devijacija, modus, medijana...); –inferencijalnu (analitičku) – zasniva
se na teoriji vjerovatnoće i zakonu velikih brojeva i proučava metode (procjena parametara,
testiranje hipoteza, korištenje neparametarskih testova) kojima se pomoću dijela informacija
(uzorak) donose zaključci o cjelini (populacija).

16. Deskriptivna i inferencijalna statistika (2)

• Znanje o populaciji (osnovna razlika između deskriptivne i inferencijalne statistike)

• U deskriptivnoj statistici se pretpostavlja da analitičar posjeduje određena znanja o


populaciji koja je predmet istraživanja

• U inferencijalnoj statistici znanje o populaciji je ograničeno na podatke koji se mogu dobiti


iz uzorka. U takvim slučajevima jedini način da se stekne određena predstava o populaciji
svodi se na analizu uzoraka, te procjenu i testiranje hipoteza o pojedinim karakteristikama
populacije.

17. Uzorkovanje

• Postupak uzimanja uzorka iz skupa naziva se uzorkovanje (eng. sampling);

• U istraživanjima, koja se temelje na radu s uzorcima, cilj je pronaći i odrediti jačinu veze
između nekih vidljivih obilježja i nekih traženih ili manje vidljivih obilježja;
• Da bi zaključci bili validni, uzorak treba biti reprezentativan (ako je po svojim
osnovnim karakteristikama nalik na osnovni skup). Reprezentativnost uzorka postiže se
ispravnim izborom elemenata.

• Plan uzorkovanja

Uzorkovanje (2)

• Uzorkovanje sa ponavljanjem je procedura izbora elemenata u uzorak tako da se u


svakom pojedinom eksperimentu ne mijenjaju uslovi izbora, tj. ne mijenja se
vjerovatnoća izbora elemenata u uzorak. Nakon svakog izbora pojedinog elementa uzorka,
taj elemenat se ponovo vraća u osnovni skup prije izbora novog elementa.

• Uzorkovanje bez ponavljanja je procedura izbora elemenata u uzorak u kojoj se


jednom izabrani elemenat ne vraća ponovo u osnovni skup. To znači da se izbor svakog
novog elementa u uzorak vrši u promijenjenim uslovima, što dalje implicira da se prilikom
svakog pojedinog izvlačenja mijenja verovatnoća izbora elemenata u uzorak.

Uzorkovanje (3)

U praksi se najčešće koriste uzorci bez ponavljanja i to iz dva razloga: –uzorak se


najčešće uzima iz relativno velikih osnovnih skupova, zbog čega se promjene vjerovatnoća
izbora preostalih jedinica, izazvane prethodnim izborom elemenata, mogu ignorirati; –budući
da kod uzoraka bez ponavljanja nema ponovnog izbora istih elemenata, oni su efikasniji u
odnosu na uzorke sa ponavljanjem jer svaka novoizabrana jedinica pruža novu informaciju o
osnovnom skupu.

Uzorkovanje (4)

• Uzorci bazirani na teoriji vjerovatnoće (slučajni ili probabilistički uzorci, probability


samples) –svaka jedinica skupa ima poznatu vjerovatnoću, odnosno šansu da bude
izabrana u uzorak –istraživač ne mora poznavati obilježja osnovnog skupa iz kojeg uzima
uzorak, kao ni njihovu raspodjelu.

• Uzorci koji nisu bazirani na teoriji vjerovatnoće (neslučajni, namjerni ili


neprobabilistički uzorci, nonprobability samples) –jedinice skupa nemaju poznatu
vjerovatnoću izbora u uzorak, tj. elementi uzorka nisu birani slučajno.
18. Uzorci bazirani na vjerovatnoći

• JEDNOSTAVNI SLUČAJNI UZORAK (The Simple Random Sampl)

• STRATIFIKOVANI UZORAK (Stratified Sample)

• UZORAK GRUPA (Cluster Samples)

• SISTEMATSKI UZORAK (Systematic Sample)

• KOMBINOVANI TIPOVI UZORAKA (Multistage Samples)

19. Uzorci koji nisu bazirani na vjerovatnoći

• KVOTNI UZORAK (Quota samples),

• EKSPERTNI ‐ NAMJERNI UZORAK (Expert samples),

• UZORAK “GRUDVA” (Snowball Sample) i

• PRIGODNI UZORAK (Accidental Samples).

20. JEDNOSTAVNI SLUČAJNI UZORAK (The Simple Random Sample)

• značajne teorijske prednosti ali i praktični nedostci

• izbor se obavlja tako da svaki uzorak veličine n koji se može izabrati iz osnovnog skupa
koji ima N elemenata ima istu vjerovatnoću da bude izabran

• najčešći načini slučajnog izbora jedinica su: upotreba tablice slučajnih brojeva, izbor
jedinica u pravilnim intervalima s liste, izbor prema redovima u popisu, pomoću RNG
funkcije, pomoću screena, izvlačenjem brojeva iz kutije i drugi

• ovaj uzorak se rijetko može primijeniti u praktičnim istraživanjima i uzrokuje niz


organizacionih problema

21. STRATIFIKOVANI UZORAK (Stratified Sample)

• vrsta uzorka koji se temelji na podjeli osnovnoga skupa na slojeve ili stratume, a iz stratuma
se biraju manji jednostavni slučajni (pod)uzorci

• koristi se kada je populacija heterogena po određenim značajnim obilježjima, a broj jedinica


uzorka iz svakog stratuma određuje na osnovu proporcionalnosti ili na bazi ocjene o značaju
svakog stratuma
• voditi računa da razlike između stratuma budu što veće, a da masa unutar svakog stratuma
bude što homogenija i da se pri tome osigura najmanja greška ocjene neke karakteristike

22. UZORAK GRUPA (Cluster Samples)

• koristi u slučajevima kada ne postoji kompletna lista svih jedinica osnovnog skupa koja bi
služila kao osnov za formiranje uzorka ili u slučaju kada je izbor jedinica u uzorak povezan sa
problemima tehničke, organizacione i finansijske prirode

• ocjene karakteristika osnovnog skupa na osnovu uzorka grupa su preciznije ukoliko je


unutrašnji varijabilitet grupa veći, a vanjski varijabilitet manji.

23. SISTEMATSKI UZORAK (Systematic Sample)

• koristi se kada su elementi osnovnog skupa poredani nekim redom (npr. osobe popisane u
nekoj kartoteci ili popisu i sl.), ali može se koristiti i kada ne postoji popis jedinica osnovnog
skupa (uzimanje svake k‐te jedinice, npr. kod anketiranja)

• može se primijeniti sistematski način izbora elemenata za uzorak tako da se broje elementi
po redu u osnovnom skupu i da se u uzorak izabere, npr. svaki peti, deseti ili k‐ti element.
Redni broj elementa od kojeg počinje brojanje određuje se slučajnim izborom iz tablice
slučajnih brojeva, od brojeva između 1 i k.

• Kod ovog izbora postoji za svaku jedinicu u osnovnom skupu jednaka mogućnost da bude
izabrana za uzorak, ako je broj elemenata koji se bira tačan djelitelj broja elemenata osnovnog
skupa

24. KVOTNI UZORAK (Quota samples)

• po svojoj logici najpribližniji slučajnim uzorcima

• određena kombinacija stratifikovanog i namjernog uzorka, jer se u uzorak biraju jedinice


koje po procjeni istraživača najbolje odgovaraju cilju istraživanja

• kvotni uzorak čine različite podgrupe osnovnog skupa, prema njihovim važnim osobinama,
u okviru kojih dalju selekciju vrši sam istraživač

• nije baziran na vjerovatnoći i ne omogućava da se procjene standardne greške povežu sa


rezultatom iz uzorka

25. EKSPERTNI ‐ NAMJERNI UZORAK (Expert samples)

• ekspertni uzorak ima samo težnju da bude reprezentativan


• naziva se i namjerni uzorak jer stručnjaci odabiru one jedinice koje smatraju
“najtipičnijima” za populaciju koja se istražuje

• istraživanje pomoću ovog uzorka daje najbolje rezultate kada je osnovni skup veoma mali

• ne možemo objektivno ocijeniti veličinu greške jer se ne zasnivaju na principima


vjerovatnoće

26. UZORAK “GRUDVA” (Snowball Sample)

• zahtijeva od istraživača inicijalno identifikovanje jedne ili dvije jedinke koje imaju određenu
karakteristiku

• te jedinke su izabrane kao nosioci informacija jer se od njih traži da identifikuju druge
ispitanike koji imaju tražene kvalitete

27. PRIGODNI UZORAK (Accidental Samples)

• predstavlja niz slučajeva do kojih smo u nekom trenutku jedino mogli doći ili koji su nam se
slučajno našli na raspolaganju

• prigodni uzorci se često primjenjuju u panel istraživanjima, kod testiranja novih proizvoda i
slično

28. Prednosti i nedostaci metode uzoraka

Prednosti ( Nabrojati 3)

- veća brzina prikupljanja podataka i dobivanja rezultata,


- ‐ niži troškovi u odnosu na troškove popisa cjelokupne populacije,
- ‐ veća pouzdanost rezultata jer istraživanje vrše statističari i specijalno
pripremljeni anketari / kontrolori, čije je angažovanje opravdano zbog
smanjenog obima poslova,
- ‐ veća fleksibilnost u vidu različitih vrsta podataka koji se mogu prikupiti,
- ‐ moguće je optimizirati veličinu uzorka uz odgovarajući rizik koji su istraživači
spremni prihvatiti.
Nedostaci

-rezultati sadrže grešku uzorka (sampling error),

‐ neophodna je specijalna obuka kadrova i rukovođenje statističara, ‐ uzorak ne daje


podatak za svaku jedinicu posmatrane populacije.

‐ kod neprobabilističkih (neslučajnih) uzoraka ne mogu se donositi procjene


parametara populacije u strogo naučnom smislu.

29. Vrste grešaka

• Greške uzorka ‐ javlja se kao posljedica fluktuacije (slučajnog kolebanja) uzorka i uvijek je
prisutna prilikom uzorkovanja, jer, po pravilu, uzorak nije savršeno reprezentativan. Razlika
između vrijednosti parametra i statistike uzorka predstavlja uzoračku grešku.

• Greške izvan uzorka ‐ sve ostale greške koje nisu uzoračke greške označavaju se kao
neuzoračke ili greške izvan uzorka i mnogo su opasnije po statističko zaključivanje
(nepotpuni podaci (incomplete data), greške mjerenja (measurement errors), pristrasnost
istraživača i neinformiranost ispitanika, greške obrade (processing errors)).

30. Tačnost i preciznost

• Tačnost mjernog sistema je stepen bliskosti izmjerene količine njenoj stvarnoj


(pravoj) vrijednosti

• Preciznost mjernog sistema (reproducibilnost, ponovljivost) jeste stepen u kojem


ponovna mjerenja pod nepromjenjenim uslovima pokazuju isti rezultat • U kolokvijalnoj
upotrebi se uzima da riječi tačnost i precizost imaju isto značenje, međutim one imaju različita
značenja unaučnoj metodologiji • Greške uzrokovanje ljudskim faktorom ili greškama na
mjernim instrumentima

31. Šta je eksperiment?

• Eksperiment (ogled, opit, pokus, proba) je analitički postupak za proučavanje


uzročno-posljedičnih odnosa. To je metod naučnog istraživanja u kojem se namjerno i
sistematski mijenja neka pojava, radi izazivanja, a onda posmatranja i mjerenja neke druge
pojave (nezavisno-zavisna promenljiva), dok se ostali relevantni uslovi (promjenljive)
kontroliraju ili izoliraju.

• Laboratorijski i ogled u prirodnim uslovima.


• Organizovan postupak naučnog istraživanja tako da dobijeni rezultat nesumnjivo i
nedvosmisleno potvrđuje ili odbacuje postavljenu hipotezu (pretpostavku).

• U nauci se eksperiment smatra jednim od najobjektivnijih, najpouzdanijih i najegzaktnijih


metoda.

32. Šta je studija promatranja?

• Razlikuje se od eksperimenta (eksperimentalne studije)

• Naučnik ne kontrolira direktno primjenu uslova koji utiču na rezultat

• Koriste se npr. u ekologiji gdje je teško postaviti eksperiment uz zadržavanje prirodnih


staništa (npr. proučavanje razlika u populaciji kukaca koje borave na livadama sa i bez živice,
vrsta biljaka u živici može uticati na vrste i obilje prisutnih kukaca).

33. Zašto eskperiment?

• da bismo odredili osnovne uzorke varijacije u mjerenoj reakciji ili pojavi,

• da bismo našli uslove pod kojima se postiže maksimalna ili minimalna reakcija,

• da bismo uporedili reakcije/pojave koje se javljaju pod različitim okolnostima u


kojima se nalaze kontrolirane varijable,

• da bismo dobili matematički model kako bismo bili u stanju predvidjeti buduće
reakcije/pojave.

34. Šta proučavamo?

• Da li je bilo kakvo smanjenje u infekciji postignuto sa novim „rezistentnim“ varijetetom u


odnosu na standardni „kontrolni“ varijetet?

• Kako biljni metaboliti (npr. hormoni rasta, šećeri, pigmenti) reaguju na povećanje stresa
isušivanjem u različitim fazama razvoja biljke?

• Koje hemikalije, koje su predmet naše studije, su pokazale insekticidnu aktivnost?

• Kako je prinos povezan sa prostornim rasporedom biljaka i da li ova veza varira između
varijeteta?
35. Dizajn eksperimenta (1)

• ne komplicirati

• tretmani – skup različitih eksperimentalnih uslova koji se testiraju, kao što su varijeteti,
nivo nitrogena ili hemijskih jedinjenja, ili kombincija nekoliko takvih varijabli

• kontrolni tretmani – mogu biti pozitivni (standardni tretmani sa poznatim efektom) ili
negativni (bazni, tretman) – koriste se kao osnova, ili da bi potvrdili da eksperiment
funkcioniše kao što je očekivano,

Dizajn eksperimenta (2)

• Osnovne tehnike koje su fundamentalne za dizajn eksperimenta su:

• replikacija – proces primjene svakog tretmana na više od jedne eksperimentalne jedinice,


postoji razlika između replikacije i ponovljenih mjerenja

• blokovanje – identifikacija ili konstrukcija blokova eksperimentalnih jedinica za koje


očekujemo da imaju isto ponašanje u odsustvu bilo kakvih efekata tretmana

• randomizacija – slučajno dodjeljivanje (alociranje) tretmana eksperimentalnim jedinicama


koje se koristi da se osigura fer procjena tretmana bez predrasuda

36. Planiranje eksperimenta

Definirati ciljeve eksperimenta Identificirati sve moguće izvore varijacije, uključujući:

• Faktore tretmana i njihove nivoe

• Eksperimentalne jedinice

• Faktore blokovanja, faktore buke i sl. Izabrati pravilo po kojem će se eksperimentalne


jedinice pridruživati tretmanima Precizirati koja će se mjerenja izvršiti, eksp. procedure i
očekivane poteškoće Izvesti pilot-eksperiment Precizirati model Prikazati analizu (uključujući
hipoteze koje će se testirati i intervale povjerenja koji će se računati) Izračunati broj potrebnih
promatranja Pregledati gornje odluke. Revidirati ako je potrebno
37. Postavljanje hipoteza (1)

• Hipoteza je precizno formulisana verbalna tvrdnja tj. pretpostavka o karakteristici


(obilježju, varijabli) jednog skupa ili o odnosu vrijednosti posmatrane karakteristike u
više skupova zasnovana na određenim činjenicama (najčešće naučnim ili iskustvenim)

• U statističkim istraživanjima polazi se od dvije međusobno isključive, suprotne


pretpostavke o ishodu eksperimenta (ispitivanja):

• nulte H0 hipoteze

• alternativne (H1) hipoteze.

Postavljanje hipoteza (2)

• Nulta hipoteza () glasi: Između aritmetičkih sredina dva osnovna skupa, odnosno između
aritmetičkih sredina dva uzorka dobijena iz dva osnovna skupa ne postoji značajna razlika.
Ako razlika i postoji ona je slučajnog karaktera, odnosno nastala je pod djelovanjem slučajnih
faktora i uzorci se ponašaju kao da pripadaju istom osnovnom skupu.

• Alternativna hipoteza () se pridružuje nultoj hipotezi i tvrdi suprotno: Između aritmetičkih


sredina uzoraka postoji značajna razlika i ona nije slučajnog karaktera, već je nastala pod
djelovanjem sistemskih ili eksperimentalnih faktora.

Postavljanje hipoteza (3)

Pravila za formulisanje hipoteze:

• Kao H1 treba definirati onaj ishod za koji istraživač pretpostavlja da je tačan i istinit.

• H0 treba da sadrži pretpostavku koja je po istraživaču pogrešna i neistinita i koju on


primjenom testa treba da ospori, tj. odbaci.

• Prvo treba postaviti H1 , a zatim doći do H0


Dva glavna tipa hipoteza su:

• jednosmjerna (eng. one-tailed) hipoteza

• dvosmjerna (eng. two-tailed) hipoteza

38. Jednosmjerna hipoteza

Pretpostavimo da želimo testirati da li holštajn-frizijska rasa krava daje, u prosjeku, više od 50


kg mlijeka dnevno ili ne. Naša pretpostavka je da ta rasa daje više od 50 kg mlijeka dnevno,
što nas dovodi do sljedećih hipoteza:

pri čemu je µ prosječna količina mlijeka koju dnevno u kg daje holštajnfrizijska krava.

39. Dvosmjerna hipoteza

Fast-food restoran je promijenio dobavljača kečapa. Stari kečap je imao 25 kalorija po


obroku. Pošto žele da prema konzumentima ostave dojam restorana koji brine o zdravlju
svojih korisnika, konstantno prate sve nutritivne aspekte hrane koju serviraju. U slučaju
novog kečapa nemaju ideju da li on ima više ili manje kalorija od starog, pa žele da testiraju:

pri čemu je µ prosječna vrijednost kalorija u novom kečapu po obroku.


40. Testiranje hipoteza (1)

• Naučni metod, tj. postupak provjere pretpostavki predstavlja testiranje statistističkih


hipoteza.

• U istraživanjima se uvek polazi od pretpostavke da je nulta hipoteza istinita i da ,,razlika“


nije statistički signifikantna (lat. signifikans – znatan, značajan, karakterističan).

• Testira se isključivo nulta hipoteza, a alternativna se prihvata ili odbacuje posredno.

Testiranje hipoteza (2)

Postupak testiranja hipoteze se izvodi u nekoliko koraka:

1. Definiraju se nulta i alternativna hipoteza.

2. Vrši se izbor modela teorijskog rasporeda (normalni raspored, Studentov traspored,


F-raspored, binomni raspored,...).

3. Određuje se nivo značajnosti testa α odnosno vjerovatnoća (1 − α).

4. Definira se uzorak.

5. Izračunaju se statistike testa na osnovu uzorka.

6. Iz tablice teorijskog rasporeda očitava se tablična vrijednost (kriterij). 7. Upoređuju


se statistike testa sa tabličnom vrijednošću.

8. Odlučuje se o prihvatanju ili odbacivanju formulisane hipoteze

Testiranje hipoteza (3)

• Ako se odgovarajućim statističkim testom, za odgovarajuću vjerovatnoću i prag značajnosti,


dokaže istinitost nulte hipoteze ona se ne odbacuje, već se odbacuje alternativna hipoteza i
zaključuje se: pretpostavka istraživača, data kroz alternativnu hipotezu, nije tačna, jer
dobijena razlika između realizovane vrijednosti (vrijednosti dobijene poslije israživanja ili
poslije eksperimenta) parametra skupa i hipotetične vrednosti nije statistčki značajna
(signifikantna). Razlika je posljedica slučajnog karaktera i nastala je djelovanjem sporednih
faktora.

• Obrnuto, ako statistički test, za odgovarajuću vjerovatnoću i prag značajnosti, ne potvrdi


istinitost nulte hipoteze, onda je odbacujemo i automatski prihvatamo alternativnu hipotezu
kao istinitu i zaključujemo: razlika je statistički signifikantna i vjerovatno je nastala pod
uticajem sistemskih, odnosno eksperimentalnih faktora.
41. Greške pri testiranju nulte hipoteze (1)

• Greška tipa I – odbacivanje (neprihvatanje) nulte hipoteze kada je ona tačna.


Vjerovatnoća greške tipa I se označava sa α i još se zove nivo značajnosti testa. Što je manji
α , to je test konzervativniji

• Greška tipa II – neodbacivanje (prihvatanje) nulte hipoteze kada je ona pogrešna.


Vjerovatnoća greške tipa II se označava sa kao β. Vjerovatnoća 1−β je vjerovatnoća da se
odbaci porešna nulta hipoteza i predstavlja tzv. snagu statističkog testa

• Snaga testa raste sa veličinom uzorka (N) i sa veličinom razlike koju smatramo stvarno
značajnom, a opada sa nivoom značajnosti. Što je snaga testa veća, test je bolji.

• Istraživač ima luksuz unaprijed određivanja vrijednostiα , ali kontroliranje β je mnogo teže
(zahtjevnije).

Greške pri testiranju nulte hipoteze (2)

42. Testovi značajnosti (signifikantnosti)

• Parametarski (numerički testovi):

• Vrijednosti ispitivanog parametra (obilježja) su date numerički, tj. intervalnom ili


omjernom skalom

• podaci o pojavi koja se proučava ne odstupaju značajno od normalne raspodjele, a za velike


uzorke (veće od 30 jedinica) i bez obzira na njihov raspored

• Neparametarski testovi :
• Vrijednosti parametra (obilježja) su date opisno

• Ponekad za numerička obilježja, kada je uzorak mali (manji od 30 jedinica), a podaci su


nesimetrično raspoređeni (odstupanje od normalne raspodjele testira se posebnim testovima),
kada se varijable ne tretiraju kao brojevi sa kojima su moguće matematičke operacije, već kao
rangirani niz.

43. Parametarski testovi

• z-test

• t-test

• ANOVA

• regresiona analiza

44. Neparametarski testovi

• Pearsonov χ test

• test znakova

• test sume rangova (Wilcoxonov t-test, Mann-Whitney U-test)

• medijan test (Mood´s test)

• Kruskal-Wallis test

• Friedmanov test

• test homogenog niza (Run test, Wald-Wolfowitzov test)

• Siegel-Tukey test

(Neparametarski testovi imaju manju pouzdanost i manju snagu od parametarskih


testova.)

45. z-test (1)

• Koristi se ako je uzorak uzet iz normalne distribucije ili ako je dovoljno velik uzorak
(n ≥30) • Može se koristiti varijansa uzorka umjesto varijanse populacije

• Ako je uzorak uzet iz normalne distribucije sa poznatom varijansom populacije, onda je test
statistika data sa:
gdje je x srednja vrijednost uzorka, µ srednja vrijednost populacije, σ standardna
devijacija populacije i n veličina uzorka.

z-test (2)

• Ako nije poznata standardna devijacija populacije, ali je n ≥30, onda je test statistika data
sa:

gdje je S standardna devijacija populacije.

Kritično područje z-testa

Da bismo konstruirali kritični region veličine , prvo provjerimo svoju alternativnu hipotezu.
Ako je naša hipoteza jednosmjerna, kritično područje je ili Z ≥ Zα (ako je hipoteza desno
usmjerena) ili Z≤− Zα (ako je hipoteza lijevo usmjerena). Ako je naša hipoteza dvosmjerna,
tada je kritični region dat sa
46. t-test

• Koristi se ako je mali uzorak (n< 30) uzet iz normalne distribucije nepoznate varijanse.
Uzima se n−1 stepeni slobode.

• Test statistika je data sa:

Kritično područje t-testa

• Da bismo konstruirali kritični region veličine α , prvo provjerimo svoju alternativnu


hipotezu.
z- test i t- test- primjeri

z-test na bazi jednog uzorka za proporcije


Primjer 3. Pretpostavimo da želimo uporediti godišnji prihod u dva
susjedna grada A i B u jednoj izrazito poljoprivrednoj regiji. Iz
iskustva je poznato da varijanse u gradovima A i B iznose 40000 i
90000 redom. Uzet je uzorak od 20 domaćinstava iz grada A i
zabilježen je prosječan godišnji prihod od 47000, dok je za uzorak od
30 domaćinstava iz grada B zabilježen prosječan godišnji prihod od
52000. Na nivou značajnosti α=0,01 testirati da li postoje ili ne
postoje statistički značajne razlike u prosječnom godišnjem prihodu
između ova dva grada.

t-test na bazi dva nezavisna uzorka


Primjer 4. Vrtlar koristi određeno đubrivo za određenu vrstu biljke.
Iznenada je saznao za novu vrstu đubriva za koju se tvrdi da daje
poboljšanje rasta biljke. Preferiraju se više odrasle stabljike kod ove
vrste biljke. Proveden je eksperiment u kojem je 10 biljaka izloženo
djelovanju starog đubriva, a 8 biljaka djelovanju novog đubriva i
rezultati su prikazani u sljedećoj tabeli. Testirati na nivou značajnostiα
=0,05 da li novo đubrivo daje ili ne daje poboljšanje rasta biljaka.

You might also like