Professional Documents
Culture Documents
Definicija uzorka
Osnovi teorije uzorkovanja
Cilj uzorkovanja
Greška uzorkovanja
Vrste uzoraka
Slučajni
Prof. dr Rabija Somun Kapetanović Namjerni
informaciju? »
Uzorak – samo dio elemenata populacije se
Da bismo dobili informaciju o populaciji, uključuje u istraživanje.
inferencijalna statistika ima jednu dodatnu Uzorak je dio osnovnog skupa i cilj izbora uzorka je
etapu čiji je cilj da odredi (inferira) polazeći da u što kraćem vremenu i uz što manje troškove
od posmatranih karakteristika na uzorku dobijemo informaciju o karakteristikama osnovnog
skupa iz kojeg smo odabrali uzorak
vjerovatnu (očekivanu) vrijednost tih Uzorak – dio - statistika
karakteristika za ukupnu populaciju. 5 6
1
Metoda uzorkovanja Reprezentativnost uzorka
Razlozi zbog kojih istraživanje vršimo na uzorku: Da bi zaključci koje donosimo o
Manje vremena - efikasnost karakteristikama osnovnog skupa na osnovu
Manje troškova - ekonomičnost uzorka bili pouzdani uzorak mora biti
Jednostavnije administrativno praćenje reprezentativan.
Racionalnost
Okvir uzorka – lista svih elemenata populacije
Uzorak je reprezentativan ako je po svojoj
strukturi sličan osnovnom skupu, odnosno ako
Vrste uzoraka
predstavlja umanjenu sliku osnovnog skupa.
Slučajni uzorak (probability sampling) - jedinice
populacije se slučajno biraju u uzorak Reprezentativnost se postiže pravilnim
Namjerni uzorak (nonprobability sampling) - odabran na izborom elemenata osnovnog skupa koji će
osnovu subjektivnih kriterija
7 predstavljati uzorak. 8
Koraci za efikasnost u
uzorkovanju Slučajan i kontrolisani izbor
Neophodno je precizno i jasno definisati: Kada su elementi izabrani slučajno tada tada se na
rezultate tog uzorka može primjeniti teorija vjerovatnoće,
cilj istraživanja može se odrediti greška koja je nastala u procjeni
karakteristika osnovnog skupa ili u postupku testiranja
populaciju koja se želi analizirati
hipoteza.
jedinice populacije Slučajni izbor se može izvršiti na više načina.
Najjednostavniji je onaj uzorak koji je jednostavno slučajno
plan uzorka
izabran tako da svaki elemenat osnovnog skupa ima jednaku
bazu uzorka vjerovatnoću da bude izabran za uzorak.
Kontrolisani slučajni uzorci pripadaju grupi uzoraka sa
veličinu uzorka
ograničenjima. Polazi se od ograničenja da svaka jedinica
odrediti nivo preciznosti ima poznatu vjerovatnoću izbora u uzorak, koja može ali ne
mora biti jednaka za sve jedinice.
11 12
2
Vrste slučajnih uzoraka Jednostavni slučajni uzorak
Svaki elemenat u populaciji ima jednaku šansu (vjerovatnoću)
Slučajni
Slučajni uzorci
uzorci
da bude izabran u uzorak.
Svaka kombinacija elemanata populacije ima također jednaku
vjerovatnoću da predstavlja uzorak.
Jedinice
Najjednostavniji za primjenu i najčešće se koristi.
Jedinicese sebiraju
biraju uuuzorak
uzorakslučajno
slučajno
i i unaprijed
unaprijed je
izbora
je poznata
izborasvake
poznata vjerovatnoća
svake jedinice
vjerovatnoća
jediniceuu uzorak
uzorak
Homogena populacija.
Veći uzorak – veći nivo reprezentativnosti.
Prednosti:
Sistematski
Nema greške klasifikacije.
Jednostavni
Jednostavni slučajni
slučajni uzorak
uzorak Sistematski uzorak
uzorak Stratifikovani
Stratifikovani uzorak
uzorak Klaster
Klasteruzorak
uzorak
Ne zahtijeva visok nivo poznavanja populacije.
Osnovni nedostatak ovog tipa uzorka je moguća
nereprezentativnost ako je populacija heterogena.
Sa
Panel
Panel uzorak
uzorak Višeetapni
Višeetapni uzorak
uzorak
Tablica slučajnih brojeva ili Excel – Data analysis - Sampling
Saponavljanjem
ponavljanjem Bez
Bez ponavljanja
ponavljanja
13 14
Želimo napraviti
uzorak od 10
proizvoda. 15 16
3
Broj jednostavnih slučajnih
uzoraka, cont. Primjer 1
Odgovor:
Iz osnovnog skupa od N=30 elemenata
Onoliko koliko ima
mogućih kombinacija N N! možemo odabrati:
od n različitih C Nn
elemenata iz ukupno n n ! N n ! C305
30!
26 27 28 29 30
142506
N elemenata: 5! 30 5! 120
Prednost - jednostavnost izbora uzorka.
Nedostatak - nereprezentativnost u slučajevima kada postoji
Ovim načinom izbora je obezbjeđena međusobna određeni način prema kojem je populacija upisana u listu i ako
nezavisnost uzastopnih izbora elemenata u uzorak. se taj način poklapa sa intervalom uzorka.
21 22
Stratifikovani
Primjer 2 uzorak
Primjer sistematskog uzorka: Iz ulice kojoj ima Stratifikacija (tipski izbor) - proces grupisanja jedinica
120 kuća trebamo u uzorak izabrati 8 kuća. populacije u podpopulacije (stratume) koje su unutar
sebe homogene a između sebe heterogene.
Prvo određujemo k: Heterogena populacija – mogu se generisati stratumi
120/8=15, dakle biramo svaku 15-tu kuću počev (npr. studenti I, II ili III godine Fakulteta)
od slučajno odabrane tačke. Prednosti:
Osigurava zastupljenost jedinica iz svakog stratuma.
Povećava efikasnost i preciznost jer omogućava kontrolu strukture
Npr: Ako je slučajno odabrana tačka 11, trebamo u uzorka.
uzorak uzeti kuće sa rednim brojevima 11, 26, 41, Kod proporcionalnog izbora važi sljedeće
56, 71, 86, 101 i 116. Proporcija:
Veličina populacije : Veličina stratuma k =
23
Veličina uzorka : Veličina poduzorka uzetog iz stratuma k 24
4
Primjer 3 Primjer 3, cont.
Struktura zaposlenih u jednoj kompaniji je: Prvi korak jeste da izračunamo % zastupljenost svake
Muški spol, stalni radni odnos: 90 od kategorija u ukupnoj populaciji svih 180 zaposlenih:
Muški spol, do pola radnog vremena: 18
Ženski spol, stalni radni odnos: 9
% Muški spol, stalni radni odnos = (90/180) x 100 = 50%
Ženski spol, do pola radnog vremena: 63
% Muški spol, do pola radnog vremena = (18/180) x100 =
Ukupno zaposlenih: 180
10%
% Ženski spol, stalni radni odnos = (9/180) x 100 = 5%
Trebamo kreirati uzorak od 40 zaposlenih, % Ženski spol, do pola radnog vremena = (63/180) x 100 =
stratifikovan prema zadanim kategorijama. 35%.
25 26
5
Vrste namjernih uzoraka Kvota uzorak
U skladu sa specifičnim kriterijem i ciljem istraživanja
Namjerni uzorci izaberu se podpopulacije iz kojih se mora anketirati
određeni broj jedinica prema zadanoj kvoti i to je jedini
uslov kod ovog tipa uzorkovanja.
U okviru datih podpopulacija selekciju u uzorak vrši
Jedinice se biraju
istraživač.
Kvota je unaprijed zadana (recimo 65% žena) i istraživač
bez poznavanja
i respektovanja vjerovatnoće
njihovog izbora u uzorak
jedino mora zadovoljiti tu kvotu te ne mora uvažavati
princip slučajnog izbora.
Nije skup, jednostavno se realizuje i poštuje kroz zadanu
Prigodan uzorak – uzimamo u
uzorak elemente koji
Ekspertni uzorak –
u uzorak se biraju jedinice
Dobrovoljan uzorak –
u uzorak uzimamo osobe
kvotu proporcije u populaciji.
Kvota uzorak
Često se primjenjuje u ispitivanju javnog mijenja.
su nam na “dohvat ruke” (npr. koje su izrazile spremnost
tipične za populaciju
uzorak koji pravi profesor da budu dio našeg uzorka
koja se istražuje
od svojih studenata) (npr testiranje lijekova)
31 32
Karakteristika (statistika) iz
Pitanje uzorka
Uzorak trgovačkih firmi prema mjestu gdje se nalaze dao je Iz osnovnog skupa od N elemenata možemo
sljedeće rezultate: Trgovačke Veličina Prosječan Standardna N
izabrati n različitih uzoraka veličine n.
firme uzorka promet po devijacija
2
m u uzorku u uzorku Za svaki od tih uzoraka možemo izračunati
Centar 37 60 6 određenu karakteristiku ˆ pomoću koje
Širi centar 52 48 4
možemo procijeniti karakteristiku osnovnog
Prigradska 16 42 3
naselja skupa.
Kako nazivamo uzorak formiran na ovaj način? Ova karakteristika je:
Jednostavan • različita od iste karakteristike osnovnog
Panel
Stratifikovani
skupa i
Višefazni 33 • različita za svaki od uzoraka. 34
Raspored karakteristika
(Ne)pristrasan uzorak (statistika) iz uzorka
Uzorci izabrani slučajno, vrijednosti karakteristike ˆ
Nepristrasan uzorak daje oblik
su slučajne slučajna varijabla.
distribucije frekvencija sličan onom kod Vrijednosti ove varijable su slučajno raspoređene
populacije. prema nekoj distribuciji vjerovatnoće.
Dakle, nepristrasan uzorak je Ako možemo odrediti distribuciju vjerovatnoće ove
reprezentativan. varijable onda možemo odrediti vjerovatnoću sa
Sa nepristrasnim uzorkom možemo sa kojom će ˆ imati vrijednost manju ili jednaku od
nekog realnog broja ako je riječ o prekidnoj varijabli ili
zadanim nivoom pouzdanosti vršiti
vjerovatnoću da će se nalaziti u nekom intervalu
predviđanja za populaciju. realnih brojeva ako je riječ o kontinuiranoj varijabli.
Za datu distribuciju možemo odrediti očekivanu
35 vrijednost, varijansu i standardnu devijaciju. 36
6
Interval povjerenja Opšti model intervala povjerenja
Procjenu karakteristike osnovnog skupa
P (ˆ h ˆ h) 1
varijabla za koju možemo izračunati
aritmetičku sredinu.
7
Varijansa aritmetičke sredine Standardna greška procjene
uzoraka sa ponavljanjem aritmetičke sredine osnovnog skupa
Kako su varijable Xi nezavisne možemo
odrediti i varijansu aritmetičke sredine uzoraka Drugi korijen iz varijanse distribucije aritmetičkih
sa ponavljanjem: sredina uzoraka daje standardnu devijaciju distribucije
sredina uzoraka koja se zove standard error ili
1 n 1 n 2 1 2
2
x2 2(xi ) 2 i 2 n2
x
n i1 n i1
n
n
standardna greška procjene aritmetičke sredine
osnovnog skupa.
Ovaj parametar služi za mjerenje disperzije
aritmetičkih sredina oko aritmetičke sredine
osnovnog skupa što omogućava mjerenje x ( xi )
greške uzorka. 43
n 44
8
Standardna greška procjene
aritmetičke sredine, cont. Testiranje hipoteza
Ako je frakcija izbora manja od
Informacije iz uzorka koristimo da bismo ispitali
0,05 (0,03) i za uzorke s
ponavljanjem biće: i neke pretpostavke o karakteristikama i
x parametrima osnovnog skupa.
n1 Statistička hipoteza - precizno formulisana tvrdnja
Smanjenje varijanse se postiže
9
Uobičajeno je da se izabere
Rizik u procesu kontrola i da se definiše
pravilo odbacivanja hipoteze
donošenja odluka koje će rezultirati da bude
što je moguće manja. Greška II vrste
10
Dvosmjerni test Dvosmjerni test, cont.
Hipoteza koju treba testirati je nulta Neka je: • θ = parametar iz osnovnog skupa
hipoteza da je parametar osnovnog skupa • θ0 = pretpostavljena vrijednost θ
jednak pretpostavljenoj vrijednosti: • H0 = nulta hipoteza
• H1 = alternativna hipoteza
H 0 : 0 Tada je: H0 : θ = θ0
H1 : θ ≠ θ0 H0
H 0 : 0 H1 : 0 Tada je: H0 : θ ≤ θ0
H1 : θ > θ0
H0
Kritična oblast se nalazi na desnom kraju - prihvatanje H1
distribucije nulte hipoteze
α
1-α
63
Interval povjerenja 64
H 0 : 0 H1 : 0 Tada je: H0 : θ ≥ θ0
H1 : θ < θ0
H0 - prihvatanje
Kritična oblast se nalazi na lijevom kraju H1 nulte hipoteze
distribucije
α
Rizik
65 66
11
Izbor statistike testa i određivanje Empirijski nivo značajnosti
rasporeda vjerovatnoće p-vrijednost
U statističkim programima se sve više umjesto teorijskog nivoa značajnosti koji je
sastavni dio svakog testa izračunava p-vrijednost kao:
Empirijski nivo značajnosti koji se izračunava pomoću podataka iz uzorka pomoću
Statistika testa - kriterij na osnovu kojeg
empirijskih z ili t vrijednosti.
najmanji nivo značajnosti uz koji se nulta hipoteza može odbaciti na osnovu podataka iz
vršimo testiranje.
uzorka.
realizovani nivo značajnosti.
Najčešće koristimo nepristrasnu ocjenu Postupak donošenja odluke na osnovu p - vrijednosti se zasniva na poređenju ove
vrijednosti sa teorijskim nivoom značajnosti:
parametra ili odgovarajuću transformaciju.
Ako je p-vrijednost manja od α odbacuje se nulta hipoteza.
Ako je p-vrijednost veća od α prihvata se nulta hipoteza.
Manja p-vrijednost znači manju empirijski utvrđenu vjerovatnoću odbacivanja istinite
Od realizovane vrijednosti statistike testa
nulte hipoteze.
U postupku testiranja hipoteza o aritmetičkoj sredini baza za izračunavanje p-
zavisi da li ćemo odbaciti ili prihvatiti nultu
vrijednosti je empirijska z ili t vrijednost u zavisnosti od toga da li se radi o velikom
ili malom uzorku.
hipotezu. Ukoliko je nulta hipoteza istinita Z varijabla se ponaša po standardizovanoj
normalnoj distribuciji i u tom slučaju p-vrijednost predstavlja vjerovatnoću da
varijabla Z uzme vrijednost veću od vrijednosti izračunate na osnovu datog uzorka
67 68
Izvori
R. Somun-Kapetanović, “Statistika u
ekonomiji i menadžmentu”, Ekonomski
fakultet u Sarajevu, Sarajevo 2006.
Hvala na pažnji!
Curwin J. and Slater R., Quantitative
Methods for Business Decisions,
Thomson Learning – fifth edition 2002.
69 70
12