XIII. Osnovi Teorije Uzoraka

Sadržaj predavanja
 Definicija uzorka
Osnovi teorije uzorkovanja 

Cilj uzorkovanja
Greška uzorkovanja
 Vrste uzoraka
 Slučajni
Prof. dr Rabija Somun Kapetanović  Namjerni
Doc. dr Emina Resić  Procjena aritmetičke sredine populacije

 Procjena varijanse populacije
 Standardna greška
 Intervali povjerenja – opšti model
 Statistički testovi – opšti model
1 2
Nakon ovih predavanja moći

ćete... Zašto uzorak?
 Za analizu masovnih pojava koje su predmet statističkih
 Izabrati adekvatan način uzorkovanja. istraživanja mi smo do sada prezentirali statističke metode
kojima se analizira osnovni skup ili populacija.
 Odrediti veličinu i tip uzorka potrebnog u  Za primjenu metoda potrebno je prikupiti podatke o
osnovnom skupu.
konkretnom statističkom istraživanju.
 Kako statistički skupovi imaju vrlo veliki broj elemenata
potpuno prikupljanje podataka je veoma složen, dugotrajan
 Izvesti opšti model i objasniti sastavne elemente i skup posao.
za:  Zbog toga se taj postupak pojednostavljuje ispitivanjem
 Interval povjerenja za karakteristiku populacije osnovnog skupa metodom uzorka.
 Statistički test o karakteristici populacije  Pod uzorkom se podrazumijeva dio skupa na osnovu kojeg
istražujemo i analiziramo obilježja elemenata osnovnog
3 skupa. 4
Deskriptivna versus inferencijalna Kompletnost podataka:

statistika Populacija versus uzorak
 Kao i u deskriptivnoj statistici osnovno pitanje  Popis – svaki element populacije se uključuje u
inferencijalne statistike je: « Kako analizirati istraživanje.
Popis – populacija – parametar
podatke da bismo dobili korisnu 
informaciju? »
 Uzorak – samo dio elemenata populacije se
 Da bismo dobili informaciju o populaciji, uključuje u istraživanje.
inferencijalna statistika ima jednu dodatnu  Uzorak je dio osnovnog skupa i cilj izbora uzorka je
etapu čiji je cilj da odredi (inferira) polazeći da u što kraćem vremenu i uz što manje troškove
od posmatranih karakteristika na uzorku dobijemo informaciju o karakteristikama osnovnog
skupa iz kojeg smo odabrali uzorak
vjerovatnu (očekivanu) vrijednost tih  Uzorak – dio - statistika
karakteristika za ukupnu populaciju. 5 6
1
Metoda uzorkovanja Reprezentativnost uzorka
 Razlozi zbog kojih istraživanje vršimo na uzorku:  Da bi zaključci koje donosimo o
 Manje vremena - efikasnost karakteristikama osnovnog skupa na osnovu
 Manje troškova - ekonomičnost uzorka bili pouzdani uzorak mora biti
 Jednostavnije administrativno praćenje reprezentativan.
 Racionalnost
 Okvir uzorka – lista svih elemenata populacije
 Uzorak je reprezentativan ako je po svojoj
strukturi sličan osnovnom skupu, odnosno ako
Vrste uzoraka
predstavlja umanjenu sliku osnovnog skupa.

 Slučajni uzorak (probability sampling) - jedinice
populacije se slučajno biraju u uzorak  Reprezentativnost se postiže pravilnim
 Namjerni uzorak (nonprobability sampling) - odabran na izborom elemenata osnovnog skupa koji će
osnovu subjektivnih kriterija
7 predstavljati uzorak. 8
Cilj uzorkovanja Greška u statističkom istraživanju

 Ukupna greška procjene sadrži sistematsku i slučajnu grešku.
1. Da se na osnovu karakteristika uzorka dođe do  Slučajna greška
procjene karakteristika osnovnog skupa  predstavlja razliku između stvarne i ocijenjene vrijednosti parametra populacije.
nastaje zbog slučajnog izbora elemenata u uzorak i utiče na preciznost ocjene.
2. Da se statističkim metodama odrediti 
Slučajna greška se smanjuje i preciznost ocjene se povećava sa porastom

pouzdanost i preciznost te procjene.

veličine uzorka.
 Sistematske greške nastaju zbog više razloga i teško ih je kontrolisati.
Najčešći razlozi zbog kojih nastaju sistematske greške su:
 Na osnovu ciljeva definišemo zadatke  loše odabrana baza i okvir za izbor uzorka, nepravilna realizacija slučajnog izbora
uzorkovanja: 
elemenata u uzorak,
nepreciznosti upitnika,
 na osnovu uzorka izabranog iz osnovnog skupa  grešaka anketara,
procijeniti karakteristike osnovnog skupa.  tehničke greške prilikom obrade podataka, itd.
 na osnovu podataka dobivenih uzorkom donijeti  Veličina uzorka ne utiče na promjenu sistematske greške.
odluku o prihvatanju ili odbacivanju određene  Uzorak sa sistematskom greškom je pristrasan uzorak, a uzorak sa
hipoteze koja se odnosi na osnovni skup. slučajnom greškom je nepristrasan.
9
 Da bi se smanjila pristrasnost ocjene (sistematska greška) neophodno je 10
primijeniti objektivnu proceduru u izboru jedinica osnovnog skupa u uzorak.
Koraci za efikasnost u
uzorkovanju Slučajan i kontrolisani izbor
Neophodno je precizno i jasno definisati:  Kada su elementi izabrani slučajno tada tada se na
rezultate tog uzorka može primjeniti teorija vjerovatnoće,
 cilj istraživanja može se odrediti greška koja je nastala u procjeni
karakteristika osnovnog skupa ili u postupku testiranja
 populaciju koja se želi analizirati
hipoteza.
 jedinice populacije  Slučajni izbor se može izvršiti na više načina.
Najjednostavniji je onaj uzorak koji je jednostavno slučajno
 plan uzorka
izabran tako da svaki elemenat osnovnog skupa ima jednaku
 bazu uzorka vjerovatnoću da bude izabran za uzorak.
Kontrolisani slučajni uzorci pripadaju grupi uzoraka sa
 veličinu uzorka

ograničenjima. Polazi se od ograničenja da svaka jedinica
 odrediti nivo preciznosti ima poznatu vjerovatnoću izbora u uzorak, koja može ali ne
mora biti jednaka za sve jedinice.
11 12
2
Vrste slučajnih uzoraka Jednostavni slučajni uzorak
 Svaki elemenat u populaciji ima jednaku šansu (vjerovatnoću)
Slučajni
Slučajni uzorci
uzorci
da bude izabran u uzorak.
 Svaka kombinacija elemanata populacije ima također jednaku
vjerovatnoću da predstavlja uzorak.
Jedinice
 Najjednostavniji za primjenu i najčešće se koristi.
Jedinicese sebiraju
biraju uuuzorak
uzorakslučajno
slučajno
i i unaprijed
unaprijed je
izbora
je poznata
izborasvake
poznata vjerovatnoća
svake jedinice
vjerovatnoća
jediniceuu uzorak
uzorak
 Homogena populacija.
 Veći uzorak – veći nivo reprezentativnosti.
 Prednosti:
Sistematski
 Nema greške klasifikacije.
Jednostavni
Jednostavni slučajni
slučajni uzorak
uzorak Sistematski uzorak
uzorak Stratifikovani
Stratifikovani uzorak
uzorak Klaster
Klasteruzorak
uzorak
 Ne zahtijeva visok nivo poznavanja populacije.
 Osnovni nedostatak ovog tipa uzorka je moguća
nereprezentativnost ako je populacija heterogena.
Sa
Panel
Panel uzorak
uzorak Višeetapni
Višeetapni uzorak
uzorak
 Tablica slučajnih brojeva ili Excel – Data analysis - Sampling
Saponavljanjem
ponavljanjem Bez
Bez ponavljanja
ponavljanja
13 14
Jednostavni slučajni uzorak - Jednostavni slučajni uzorak –

Excel Excel, cont.
Imamo informacije  Konvertujemo bazu u Excel (jedna kolona)
za 60 proizvoda o
sljedećim  U Tools opciji izaberemo Data Analysis -
karakteristikama: Sampling
 Cijena
 Kalorijski sadržaj
 Porijeklo
Želimo napraviti
uzorak od 10
proizvoda. 15 16
Jednostavni slučajni uzorak – Broj jednostavnih slučajnih

Excel, cont. uzoraka
 Zadamo niz sa  Jednostavni slučajni uzorak veličine n
orginalnim elemenata dobijamo iz skupa od N
podacima kao elemenata ako se izbor obavlja tako da svaki
Input range
 Biramo Random
uzorak veličine n koji se može slučajno
kao slučajan izabrati iz osvovnog skupa ima istu
uzorak i vjerovatnoću da bude izabran.
zadajemo
veličinu uzorka  Pitanje:
(10) U koloni F dobićemo Koliko se uzoraka veličine n može izabrati iz
Output range – redne brojeve

zadajemo prazne proizvoda slučajno konačnog osnovnog skupa veličine N ako se
ćelije za rezultat
odabranih u naš
uzorak.
izbor vrši bez ponavljanja?
17 18
3
Broj jednostavnih slučajnih
uzoraka, cont. Primjer 1
Odgovor:

 Iz osnovnog skupa od N=30 elemenata
Onoliko koliko ima
mogućih kombinacija N N! možemo odabrati:
od n različitih C Nn    
elemenata iz ukupno  n  n !  N  n  ! C305 
30!

26  27  28  29  30
 142506
N elemenata: 5! 30  5! 120
uzoraka od n=5 elementa

 Vjerovatnoća za svaku
1
kombinaciju ili uzorak  Za svaki od 142 506 uzoraka vjerovatnoća
od n elemenata da N
bude izabrana je   da upravo on bude izabran je 1/142 506.
jednaka:
n 
19 20
Broj jednostavnih slučajnih

uzoraka sa ponavljanjem Sistematski uzorak
 Prost slučajan uzorak može biti i sa ponavljanjem.  Slučajan uzorak u kojem izbor elemenata u uzorak vršimo po
 U tom slučaju svaki element može biti izabran u nekom sistematskom redu odabirući slučajno početak.
uzorak više puta. Broj mogućih uzoraka je  Podrazumjeva izbor svakog k-tog elementa iz okvira uzorka,
gdje se k izračunava kao:
kN n
k = veličina populacije (N) / veličina uzorka (n)
i vjerovatnoća izbora za svaku kombinaciju ili uzorak  Svaki element populacije ima istu vjerovatnoću izbora.
od n elemenata je jednaka  Na slučaj se bira početna tačka.
1/ k  1/ N n 

Prednost - jednostavnost izbora uzorka.
Nedostatak - nereprezentativnost u slučajevima kada postoji
 Ovim načinom izbora je obezbjeđena međusobna određeni način prema kojem je populacija upisana u listu i ako
nezavisnost uzastopnih izbora elemenata u uzorak. se taj način poklapa sa intervalom uzorka.
21 22
Stratifikovani
Primjer 2 uzorak
Primjer sistematskog uzorka: Iz ulice kojoj ima  Stratifikacija (tipski izbor) - proces grupisanja jedinica
120 kuća trebamo u uzorak izabrati 8 kuća. populacije u podpopulacije (stratume) koje su unutar
sebe homogene a između sebe heterogene.
Prvo određujemo k:  Heterogena populacija – mogu se generisati stratumi
120/8=15, dakle biramo svaku 15-tu kuću počev (npr. studenti I, II ili III godine Fakulteta)
od slučajno odabrane tačke.  Prednosti:
 Osigurava zastupljenost jedinica iz svakog stratuma.
 Povećava efikasnost i preciznost jer omogućava kontrolu strukture
Npr: Ako je slučajno odabrana tačka 11, trebamo u uzorka.
uzorak uzeti kuće sa rednim brojevima 11, 26, 41,  Kod proporcionalnog izbora važi sljedeće 
56, 71, 86, 101 i 116. Proporcija:
Veličina populacije : Veličina stratuma k =
23
Veličina uzorka : Veličina poduzorka uzetog iz stratuma k 24
4
Primjer 3 Primjer 3, cont.
Struktura zaposlenih u jednoj kompaniji je: Prvi korak jeste da izračunamo % zastupljenost svake
 Muški spol, stalni radni odnos: 90 od kategorija u ukupnoj populaciji svih 180 zaposlenih:
 Muški spol, do pola radnog vremena: 18
 Ženski spol, stalni radni odnos: 9
 % Muški spol, stalni radni odnos = (90/180) x 100 = 50%
 Ženski spol, do pola radnog vremena: 63
 % Muški spol, do pola radnog vremena = (18/180) x100 =
 Ukupno zaposlenih: 180
10%
 % Ženski spol, stalni radni odnos = (9/180) x 100 = 5%
Trebamo kreirati uzorak od 40 zaposlenih,  % Ženski spol, do pola radnog vremena = (63/180) x 100 =
stratifikovan prema zadanim kategorijama. 35%.
25 26
Primjer 3, cont. Klaster uzorak – uzorak skupina

Prema tome ako želimo sačuvati istu proporciju u  Procedura uzorkovanja za klaster uzorak:
uzorku kao u populaciji, trebamo odabrati od svake 1. Populacija se dijeli na skupine.
kategorije po: 2. Bira se slučajno određeni broj skupina (klastera) koje predstavljaju
populaciju.
3. U uzorak se uključuju sve jedinice koje se nalaze u izabranim
 50% treba biti Muški spol, stalni radni odnos (50% od 40 skupinama (klasterima)
je 20).
 Korisno je primjeniti klaster uzorak kada:
 10% treba biti Muški spol, do pola radnog vremena (10%
ne raspolažemo listom svih jedinica, odnosno odgovarajućom bazom
od 40 je 4). 
uzorka ili
 5% treba biti Ženski spol, stalni radni odnos (5% od 40 je je osnovni skup velik i sastavljen od jedinica koje su npr. prostorno
2).

vrlo udaljene tada troškovi ankete mogu biti vrlo veliki.
 35% treba biti Ženski spol, do pola radnog vremena  Manja efikasnost nego u slučaju jednostavnog slučajnog
(35% od 40 je 14). uzorka.
27 28
Panel uzorak Višeetapni uzorak

 Koristi se:  Populacija se podijeli na podskupove
da bi se istražile promjene karakteristika populacije u

vremenu,
prema hijerarhijskom principu
 da se kontinuirano prate neke pojave,  Postepeno, po etapama izbora:
 u istraživanju tržišta, praćenju troškova života, itd.  prva etapa - biramo jedinice prvog
 Izabrani potrošači odgovaraju na povremene stepena.
ankete.
 druga etapa - iz svake jedinice prvog
 Promjena ispitivanih jedinica kao i promjena pojave
stepena biramo jedinice drugog stepena...
su značajni nedostaci ovog tipa uzorka.
 Primjena panel uzorka je ograničena na prethodna  posljednja etapa – formira se uzorak
istraživanja u primjeni ankete. 29 30
5
Vrste namjernih uzoraka Kvota uzorak
 U skladu sa specifičnim kriterijem i ciljem istraživanja
Namjerni uzorci izaberu se podpopulacije iz kojih se mora anketirati
određeni broj jedinica prema zadanoj kvoti i to je jedini
uslov kod ovog tipa uzorkovanja.
 U okviru datih podpopulacija selekciju u uzorak vrši
Jedinice se biraju
istraživač.
Kvota je unaprijed zadana (recimo 65% žena) i istraživač
bez poznavanja
i respektovanja vjerovatnoće 
njihovog izbora u uzorak
jedino mora zadovoljiti tu kvotu te ne mora uvažavati
princip slučajnog izbora.
 Nije skup, jednostavno se realizuje i poštuje kroz zadanu
Prigodan uzorak – uzimamo u
uzorak elemente koji
Ekspertni uzorak –
u uzorak se biraju jedinice
Dobrovoljan uzorak –
u uzorak uzimamo osobe
kvotu proporcije u populaciji.
Kvota uzorak
Često se primjenjuje u ispitivanju javnog mijenja.
su nam na “dohvat ruke” (npr. koje su izrazile spremnost
tipične za populaciju
uzorak koji pravi profesor da budu dio našeg uzorka 
koja se istražuje
od svojih studenata) (npr testiranje lijekova)
31 32
Karakteristika (statistika) iz
Pitanje uzorka
Uzorak trgovačkih firmi prema mjestu gdje se nalaze dao je  Iz osnovnog skupa od N elemenata možemo
sljedeće rezultate: Trgovačke Veličina Prosječan Standardna N 
izabrati  n  različitih uzoraka veličine n.
firme uzorka promet po devijacija
2
m u uzorku u uzorku Za svaki od tih uzoraka možemo izračunati
Centar 37 60 6 određenu karakteristiku ˆ pomoću koje
Širi centar 52 48 4
možemo procijeniti karakteristiku osnovnog
Prigradska 16 42 3
naselja skupa.
Kako nazivamo uzorak formiran na ovaj način?  Ova karakteristika je:
 Jednostavan • različita od iste karakteristike osnovnog
 Panel
 Stratifikovani
skupa i
 Višefazni 33 • različita za svaki od uzoraka. 34
Raspored karakteristika
(Ne)pristrasan uzorak (statistika) iz uzorka
Uzorci izabrani slučajno, vrijednosti karakteristike ˆ
Nepristrasan uzorak daje oblik


su slučajne  slučajna varijabla.
distribucije frekvencija sličan onom kod  Vrijednosti ove varijable su slučajno raspoređene
populacije. prema nekoj distribuciji vjerovatnoće.
 Dakle, nepristrasan uzorak je  Ako možemo odrediti distribuciju vjerovatnoće ove
reprezentativan. varijable onda možemo odrediti vjerovatnoću sa
 Sa nepristrasnim uzorkom možemo sa kojom će ˆ imati vrijednost manju ili jednaku od
nekog realnog broja ako je riječ o prekidnoj varijabli ili
zadanim nivoom pouzdanosti vršiti
vjerovatnoću da će se nalaziti u nekom intervalu
predviđanja za populaciju. realnih brojeva ako je riječ o kontinuiranoj varijabli.
 Za datu distribuciju možemo odrediti očekivanu
35 vrijednost, varijansu i standardnu devijaciju. 36
6
Interval povjerenja Opšti model intervala povjerenja
Procjenu karakteristike osnovnog skupa 
P (ˆ  h    ˆ  h)  1  

pomoću izračunate karakteristike iz uzorka 

ˆ
ćemo vršiti pomoću intervalne procjene. gdje je:

 ˆ- vrijednost parametra u uzorku
 Izračunava se donja i gornja granica intervala
 - vrijednost parametra u populaciji
u kojem se sa određenom vjerovatnoćom

h – okolina (greška procjene)

nalazi karakteristika osnovnog skupa .

  - sigurnost (pouzdanost, signifikantnost)

 Taj interval izražavamo na sljedeći način:   - greška prve vrste
ˆ  greška procjene    ˆ  greška procjene

37 38
Aritmetička sredina distribucije

Nepristrasna ocjena aritmetičkih sredina
 Ako iz osnovnog skupa N izvučemo k
Ocjena parametra  osnovnog skupa pomoću uzoraka veličine n i za svaki od tih 1 n
odgovarajuće statistike iz uzorka će biti
nepristrasna ako je očekivana vrijednost ˆ
uzoraka izračunamo aritmetičku sredinu
 dobićemo onoliko aritmetičkih
xi   xi
n i 1
sredina koliko imamo uzoraka.
(aritmetička sredina) statistika iz uzorka
jednaka vrijednosti parametra iz osnovnog skupa.  Kako su uzorci izabrani slučajno
aritmetička sredina uzoraka je slučajna

varijabla za koju možemo izračunati
aritmetičku sredinu.
E ˆ    Aritmetička sredina distribucije

aritmetičkih sredina je jednaka:
1 k
X   xi
39
k i 1 40
Aritmetička sredina distribucije

aritmetičkih sredina, cont. Centralna granična teorema
 Očekivanu vrijednost (aritmetičku sredinu) aritmetičkih U beskonačnoj populaciji (bilo kakav
sredina uzoraka možemo posmatrati kao očekivanu
vrijednost aritmetičke sredine uzorka: raspored da populacija ima), raspored
1 n  aritmetičkih sredina uzoraka teži da zauzme
E( X )  E(xi )  E  xi   normalan raspored
 n i1 
1 n 1 n 1
 E(xi )     n      2 
n i1 n i1 n N   X ,  X2  
 Time se dokazuje da je aritmetička sredina aritmetičkih  n 
sredina uzorka jednaka aritmetičkoj sredini osnovnog
skupa. kada veličina uzorka raste neograničeno
 Slijedi da je ovaj parametar procjene nepristrasan. (n>30).
41 42
7
Varijansa aritmetičke sredine Standardna greška procjene
uzoraka sa ponavljanjem aritmetičke sredine osnovnog skupa
 Kako su varijable Xi nezavisne možemo
odrediti i varijansu aritmetičke sredine uzoraka Drugi korijen iz varijanse distribucije aritmetičkih
sa ponavljanjem: sredina uzoraka daje standardnu devijaciju distribucije
sredina uzoraka koja se zove standard error ili
1 n  1 n 2 1 2 
2
x2 2(xi ) 2 i 2  n2
x  
n i1  n i1
  n 
n
standardna greška procjene aritmetičke sredine
osnovnog skupa.
 Ovaj parametar služi za mjerenje disperzije
aritmetičkih sredina oko aritmetičke sredine 
osnovnog skupa što omogućava mjerenje  x   ( xi ) 
greške uzorka. 43
n 44
Procjena varijanse osnovnog

Procjena varijanse osnovnog skupa skupa, cont.
Za dobijanje 2
1 n
 Ako varijansa osnovnog skupa nije poznata
njenu procjenu ne možemo vršiti na osnovu
nepristrasne ocjene
varijanse
ˆ 2   xi  x 
n  1 i 1
varijanse uzorka. se koristi izraz:
 Varijabilitet u uzorcima je manji od varijabiliteta

Ovaj izraz
u osnovnom skupu i u tom slučaju procjena
možemo napisati 1 n
2
varijanse bi bila pristrasna ako bismo koristili
izraz:
u slijedećem ˆ2   xi x  n  n i2
n 2
n1 i1 n n1
xi x
1 obliku i naziva se
i2  i korigovana
n i1 45
varijansa: 46
Procjena varijanse osnovnog Standardna greška procjene

skupa, cont. aritmetičke sredine
 Predhodno prezentirani izraz je nepristrasna ocjena Kada varijansa osnovnog skupa nije poznata
varijanse osnovnog skupa u kojoj je izraz n/(n-1) standardna greška za procjenu aritmetičke sredine
faktor korekcije pristrasnosti ocjene. izračunava se iz podataka za uzorak na slijedeći
način:
 Za velike uzorke n≥30 faktor korekcije se približava Za uzorke  i
jedinici pa se u praktičnim izračunavanjima može i sa ponavljanjem:
 x 
zanemariti. n 1
 Standardnu devijaciju osnovnog skupa treba Za uzorke i N n

zamijeniti izrazom za korigovanu standardnu devijaciju. bez ponavljanja: x  
47 n 1 N 1 48
8
Standardna greška procjene
aritmetičke sredine, cont. Testiranje hipoteza
 Ako je frakcija izbora manja od
 Informacije iz uzorka koristimo da bismo ispitali
0,05 (0,03) i za uzorke s
ponavljanjem biće: i neke pretpostavke o karakteristikama i
x  parametrima osnovnog skupa.
n1 Statistička hipoteza - precizno formulisana tvrdnja
 Smanjenje varijanse se postiže 
povećanjem veličine uzorka do te ili pretpostavka o osobinama osnovnog skupa

mjere da varijansa teži nuli.  Testiranje statističke hipoteze - naučni metod
kojim provjeravamo prihvatljivost prethodno
 Za ocjenu koja se izvodi sa definisane tvrdnje ili pretpostavke.
povećanjem uzorka kažemo da je
konzistentna ocjena. 49 50
Testiranje hipoteza, cont. Testiranje statističke hipoteze

 Formuliše se nulta hipoteza (H0) koja se može
odnositi na: 1. Pretpostavimo da neka karakteristika osnovnog
 Zamišljenu vrijednost nekog parametra na nivou
skupa ima određenu vrijednost
populacije; 2. Na osnovu uzorka odabranog iz tog skupa
 Oblik teorijskog rasporeda koji odgovara toj populaciji izračunamo tu karakteristiku
vezano za određenu karakteristiku procesa; 3. Uporedimo tako izračunatu karakteristiku sa
 Nepostojanje razlike između nekog parametra procesa za njenom pretpostavljenom vrijednošću
dvije različite populacije. 4. Ako razlika nije velika može se smatrati
 Alternativna hipoteza (H1) je negacija nulte hipoteze. slučajnom i pretpostavka mogućom, u suprotnom
pretpostavka se odbacuje jer nije moguća.
 Zatim se, na bazi podataka iz uzorka, vrši testiranje
postavljene nulte/alternativne hipoteze. 51 52
Odbijanje ili neodbijanje nulte

hipoteze Različite vrste greški
 Greška I vrste nastaje ako se odbaci nulta hipoteza H0
koja je tačna. Vjerovatnoća nastanka greške prve
vrste je .
 Greška II vrste nastaje ako se ne odbaci nulta
hipoteza H0 koja nije tačna. Vjerovatnoća nastanka
greške prve vrste je .
 Koeficijent pouzdanosti (1-) je vjerovatnoća da nulta
hipoteza H0 koja je tačna neće biti odbačena.
 Jačina testa (1-) je vjerovatnoća da će nulta hipoteza
53
H0 koja nije tačna biti odbačena. 54
9
Uobičajeno je da se izabere
Rizik u procesu kontrola  i da se definiše
pravilo odbacivanja hipoteze
donošenja odluka koje će rezultirati da  bude
što je moguće manja. Greška II vrste
Odluka Stvarna situacija Vrijednost greške  je određena slijedećim

faktorima:
H0 tačno H0 netačno
Ne odbiti H0 Ispravna odluka Greška II vrste  stvarnom vrijednošću testiranog parametra

Pouzdanost=(1-) p(greške II vrste)=
 nivoom značajnosti testa 
Odbiti H0 Greška I vrste Ispravna odluka  veličinom uzorka
p(greške I vrste)= Jačina testa=(1- )
 oblikom testa
55 56
Proces provođenja statističkog

Pitanje testa
Šta smo napravili ukoliko prihvatimo 1. Formulisanje nulte i alternativne hipoteze
neistinitu (neispravnu) nultu hipotezu? 2. Teorijska vrijednost se određuje na osnovu
odgovarajućeg teorijskog rasporeda uz zadani
nivo pouzdanosti. Izbor rasporeda zavisi od
1. Grešku prve vrste parametra koji se testira i veličine uzorka.
2. Grešku druge vrste 3. Izračunata vrijednost se određuje na bazi
3. Korektnu odluku parametara iz uzorka.
4. Ispravnu odluku 4. Upoređivanjem teorijske i izračunate vrijednosti
donosi se odluka o neodbacivanju ili
odbacivanju nulte hipoteze.
57 58
Formulisanje hipoteza Formulisanje hipoteza, cont.

 Nulta i alternativna hipoteza - dvije međusobno  Testiramo samo nultu hipotezu polazeći od
isključive tvrdnje o osobinama osnovnog skupa koje pretpostavke da je istinita i cilj je da je odbacimo.
su izražene vrijednostima parametara osnovnog  Za testiranje hipoteza mogu se koristiti dvosmjerni i
skupa. jednosmjerni testovi.
 Nulta hipoteza - tvrdnja o vrijednosti parametra  Češće se koriste dvosmjerni testovi kojima se želi
osnovnog skupa koju testiranjem nastojimo osporiti. utvrditi da li postoji statistički značajna razlika
 Nultom hipotezom tvrdimo da je parametar osnovnog između pretpostavljene i stvarne karakteristike
skupa jednak nekoj pretpostavljenoj vrijednosti. osnovnog skupa bez obzira na smjer razlike.
 Svakoj nultoj hipotezi se pridružuje alternativna ili  Kod dvosmjernog testa oblast odbacivanja nulte
istraživačka hipoteza. hipoteze se nalazi simetrično na oba kraja
 Pretpostavku koju smatramo tačnom i koju tokom distribucije.
testiranja želimo da potvrdimo izražavamo  Kod jednosmjernih testova oblast odbacivanja se
alternativnom hipotezom. 59 nalazi na jednom kraju distribucije. 60
10
Dvosmjerni test Dvosmjerni test, cont.
 Hipoteza koju treba testirati je nulta Neka je: • θ = parametar iz osnovnog skupa
hipoteza da je parametar osnovnog skupa • θ0 = pretpostavljena vrijednost θ
jednak pretpostavljenoj vrijednosti: • H0 = nulta hipoteza
• H1 = alternativna hipoteza
H 0 :  0 Tada je: H0 : θ = θ0
H1 : θ ≠ θ0 H0
 Alternativna hipoteza je da je parametar H1

H1
osnovnog skupa različit od pretpostavljene α/2 α/2
vrijednosti: α/2 1 – α/2

H1 :    0 61 62
Jednosmjerni test GG Jednosmjerni test GG, cont.
 Za jednosmjerni test na gornju granicu nulta θ = parametar iz osnovnog skupa

Neka je:
i alternativna hipoteza su formulisane na θ0 = pretpostavljena vrijednost θ
H0 = nulta hipoteza
slijedeći način: H1 = alternativna hipoteza
H 0 :    0  H1 :    0 Tada je: H0 : θ ≤ θ0
H1 : θ > θ0
H0
 Kritična oblast se nalazi na desnom kraju - prihvatanje H1
distribucije nulte hipoteze
α
1-α
63
Interval povjerenja 64
Jednosmjerni test DG Jednosmjerni test DG, cont.

 Za jednosmjerni test na donju granicu nulta i
Neka je: θ = parametar iz osnovnog skupa
alternativna hipoteza su formulisane na θ0 = pretpostavljena vrijednost θ
slijedeći način: H0 = nulta hipoteza
H1 = alternativna hipoteza
H 0 :    0  H1 :    0 Tada je: H0 : θ ≥ θ0
H1 : θ < θ0
H0 - prihvatanje
 Kritična oblast se nalazi na lijevom kraju H1 nulte hipoteze
distribucije
α
Rizik
65 66
11
Izbor statistike testa i određivanje Empirijski nivo značajnosti
rasporeda vjerovatnoće p-vrijednost
 U statističkim programima se sve više umjesto teorijskog nivoa značajnosti koji je
sastavni dio svakog testa izračunava p-vrijednost kao:
Empirijski nivo značajnosti koji se izračunava pomoću podataka iz uzorka pomoću
Statistika testa - kriterij na osnovu kojeg

 empirijskih z ili t vrijednosti.
najmanji nivo značajnosti uz koji se nulta hipoteza može odbaciti na osnovu podataka iz
vršimo testiranje.

uzorka.
 realizovani nivo značajnosti.
 Najčešće koristimo nepristrasnu ocjenu  Postupak donošenja odluke na osnovu p - vrijednosti se zasniva na poređenju ove
vrijednosti sa teorijskim nivoom značajnosti:
parametra ili odgovarajuću transformaciju. 

Ako je p-vrijednost manja od α odbacuje se nulta hipoteza.
Ako je p-vrijednost veća od α prihvata se nulta hipoteza.
Manja p-vrijednost znači manju empirijski utvrđenu vjerovatnoću odbacivanja istinite
Od realizovane vrijednosti statistike testa

 nulte hipoteze.
U postupku testiranja hipoteza o aritmetičkoj sredini baza za izračunavanje p-
zavisi da li ćemo odbaciti ili prihvatiti nultu

vrijednosti je empirijska z ili t vrijednost u zavisnosti od toga da li se radi o velikom
ili malom uzorku.
hipotezu.  Ukoliko je nulta hipoteza istinita Z varijabla se ponaša po standardizovanoj
normalnoj distribuciji i u tom slučaju p-vrijednost predstavlja vjerovatnoću da
varijabla Z uzme vrijednost veću od vrijednosti izračunate na osnovu datog uzorka
67 68
Izvori
 R. Somun-Kapetanović, “Statistika u
ekonomiji i menadžmentu”, Ekonomski
fakultet u Sarajevu, Sarajevo 2006.
Hvala na pažnji!
 Curwin J. and Slater R., Quantitative
Methods for Business Decisions,
Thomson Learning – fifth edition 2002.
69 70
12

XIII. Osnovi Teorije Uzoraka

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

XIII. Osnovi Teorije Uzoraka

Uploaded by

Copyright:

Available Formats

Sadržaj predavanja

Doc. dr Emina Resić  Procjena aritmetičke sredine populacije

Nakon ovih predavanja moći

Deskriptivna versus inferencijalna Kompletnost podataka:

Cilj uzorkovanja Greška u statističkom istraživanju

Slučajna greška se smanjuje i preciznost ocjene se povećava sa porastom

Jednostavni slučajni uzorak - Jednostavni slučajni uzorak –

Jednostavni slučajni uzorak – Broj jednostavnih slučajnih

uzoraka od n=5 elementa

Broj jednostavnih slučajnih

Primjer 3, cont. Klaster uzorak – uzorak skupina

Panel uzorak Višeetapni uzorak

pomoću izračunate karakteristike iz uzorka 

ćemo vršiti pomoću intervalne procjene. gdje je:

h – okolina (greška procjene)

  - sigurnost (pouzdanost, signifikantnost)

ˆ  greška procjene    ˆ  greška procjene

Aritmetička sredina distribucije

E ˆ    Aritmetička sredina distribucije

Aritmetička sredina distribucije

Procjena varijanse osnovnog

 Varijabilitet u uzorcima je manji od varijabiliteta

Procjena varijanse osnovnog Standardna greška procjene

 Standardnu devijaciju osnovnog skupa treba Za uzorke i N n

povećanjem veličine uzorka do te ili pretpostavka o osobinama osnovnog skupa

Testiranje hipoteza, cont. Testiranje statističke hipoteze

Odbijanje ili neodbijanje nulte

Odluka Stvarna situacija Vrijednost greške  je određena slijedećim

Ne odbiti H0 Ispravna odluka Greška II vrste  stvarnom vrijednošću testiranog parametra

Proces provođenja statističkog

Formulisanje hipoteza Formulisanje hipoteza, cont.

 Alternativna hipoteza je da je parametar H1

vrijednosti: α/2 1 – α/2

Jednosmjerni test GG Jednosmjerni test GG, cont.

 Za jednosmjerni test na gornju granicu nulta θ = parametar iz osnovnog skupa

Jednosmjerni test DG Jednosmjerni test DG, cont.

You might also like