You are on page 1of 14

IZBOR UZORKA

CILJEVI POGLAVLJA

5. glava
Nakon čitanja ove glave bićete u stanju da:

1. shvatite zašto je u mnogim situacijama uzorkovanje bolje od popisa


2. razumete smisao i značaj Zakona velikih brojeva
3. razumete razliku između slučajnih i neslučajnih uzoraka
4. navedete osobine najvažnijih neslučajnih i slučajnih uzoraka
5. razlikujete izbor elemenata prostog slučajnog uzorka sa i bez ponavljanja
6. izaberete slučajan uzorak pomoću nekog statističkog softvera

Vrednosti parametara skupa određuju se u cilju spoznaje njegovih


karakteristika i kvantitativne i kvalitativne deskripcije. Određivanje vrednosti
parametara osnovnih skupova može se izvesti na dva načina:
- prvi podrazumeva celovito posmatranje populacije (popis), odnosno
određivanje vrednosti posmatrane karakteristike za svaki elemenat
osnovnog skupa,
- drugi način podrazumeva da se vrednost parametara osnovnog skupa
određuje na osnovu ispitivanja samo jednog dela osnovnog skupa, koji
se naziva uzorak.

Postupak uzimanja uzorka iz skupa naziva se uzorkovanje (eng. sampling).

Preciznu (egzaktnu) informaciju o parametrima osnovnog skupa možemo dobiti


samo na osnovu podataka dobijenih popisom. Ali, kao što smo već naveli, u stati-
stičkoj praksi dominira primena metoda u kojima zaključke o parametrima skupa
zasnivamo na informacijama iz uzorka. Postoji nekoliko važnih razloga zbog
kojih je analiza na osnovu uzorka pogodnija u odnosu na celovito posmatranje
skupa:
1. Uzorkovanje omogućuje da se do informacija o parametrima osnovnog
skupa dođe uz znatno niže troškove.
2. Uzorkovanjem se znatno brže dolazi do informacija o osnovnom skupu,
posebno u slučajevima velikih osnovnih skupova.
110 OSNOVI STATISTIKE

3. S obzirom na raspoložive izvore, kako u finansijskom, tako i u pogledu


dostupnosti elemenata populacije, uzorak može biti jedini način
postizanja ciljeva istraživanja.
4. Istraživački proces često podrazumeva oštećenja ili uništavanje
proizvoda, tako da bi popis u tom slučaju bio besmislen.
5. Ako je obuhvatanje celog skupa nije moguće (zbog toga što ima
beskonačan broj elemenata ili je praktično nemoguće ispitati sve jedinice
skupa), tada je zaključivanje na osnovu uzorka jedino moguće rešenje.
6. Uzorak često može biti mnogo informativniji od popisa. S obzirom na to da
obuhvatamo samo deo skupa, istraživač je u mogućnosti da prikupi podat-
ke o velikom broju karakteristikama izabranih jedinica do kojih popisom ni-
je moguće doći u razumnom vremenu.
7. Uzorak često daje tačnije rezultate od popisa. Iako na prvi pogled izgleda
nelogično da je deo skupa pouzdanija osnova za zaključivanje u odnosu na
skup u celini, praksa je potvrdila da su podaci prikupljeni uzorkom često
kvalitetniji. Razlog mogu biti razne teškoće koje se javljaju kod popisa
stanovništva, kao što su neobučenost anketara, mobilnost stanovništva, pri-
sustvo ilegalnih emigranata, i slično.
PRIMER 5.1 Iskustvo sa popisom stanovništva u SAD jasno ilustruje ovu vr-
stu problema. Smatra se da je popis iz 1990. godine prikazao čak 8 miliona
stanovnika manje, a da je u 2000. godini popisom precenjen broj stanovnika
za 1,3 miliona. Iako su mnogi američki statističari sugerisali da se 2000.-te
umesto popisa koristi uzorak, Kongres je ipak doneo odluku da se mora
sprovesti popis.
Kao što smo prethodno naglasili na osnovu uzorka nikada ne možemo doći do
100% tačne vrednosti nepoznatih karakteristika skupa. Ono što intuitivno
izgleda jasno jeste da se sa porastom veličine uzorka informacija dobijena na
osnovu njega postaje sve pouzdanija. Ovo je i teorijski dokazano i predstavlja
osnovu jednog od najpoznatijih stavova u statistici – Zakona velikih brojeva.
Zakon velikih brojeva
Sa povećanjem veličine uzorka njegova aritmetička sredina i proporcija
težiće aritmetičkoj sredini i proporciji osnovnog skupa, respektivno1.

1 Ovo je neformalna definicija. Formalnu je prvi postavio i dokazao, nakon 20


godina rada, Jakob Bernuli, 1713. godine, ali ona prevazilazi okvire ove knjige.
Fraza "zakon velikih brojeva" se često u nestatističkom smislu koristi kako bi
označila da će se i malo verovatan događaj konačno ostvariti ako se posmatra
dovoljan broj slučajeva. Važno je naglasiti da ne postoji "zakon malih brojeva", koji
je povezan sa kockarskim zabludama da neki događaj mora da se ostvari (na primer
da na ruletu se kuglica zaustavi na crvenoj boji) ukoliko se njemu suprotan
realizovao veći broj puta uzastopno (ako se kuglica više puta uzastopno zaustavi na
crnoj boji).
POGLAVLJE 5 – Izbor uzorka 111

Ovaj zakon je našao izuzetnu primenu u mnogim oblastima, na primer u


osiguranju. Odgovor na ključno pitanje: koliko veliki uzorak moramo uzeti iz
skupa da bismo dobili relativno pouzdanu informaciju o parametru skupa,
daćemo u sledećem poglavlju.

5.1. UZORKOVANJE SA I BEZ PONAVLJANJA

Uzorkovanje može da se izvede sa i bez ponavljanja elemenata iz skupa.


Razlikovanje je veoma značajno za dalje tokove statističkog zaključivanja, pa je
potrebno detaljnije objašnjenje.
Uzorkovanje sa ponavljanjem je procedura izbora elemenata u uzorak
tako da se u svakom pojedinom opitu (pojedinačno izabiranje elementa u
uzorak) ne menjaju uslovi izbora. To znači da tokom čitave procedure izbora
svakog pojedinog elementa u uzorak, svi elementi populacije mogu da budu
izabrani u uzorak. U praktičnim postupcima to znači da se nakon svakog izbora
pojedinog elementa uzorka, taj elemenat ponovo vraća u osnovni skup pre
izbora novog elementa. Ovo je veoma značajno sa stanovišta verovatnoće izbora
pojedinog elementa u uzorak i podrazumeva da se prilikom svakog pojedinog
izvlačenja ne menja verovatnoća izbora elemenata u uzorak. Tako, na primer,
ako se izvlači 5 karata iz špila, uzorkovanje sa ponavljanja podrazumeva sledeći
postupak: izvuče se na slučaj prva karta, evidentira se koja je karta izvučena i
ponovo se vraća u špil; zatim se izvlači druga karta, evidentira se koja je druga
izvučena karta i ponovo se vraća u špil. I tako dok se ne izvuče svih pet karata.
Uzorkovanje bez ponavljanja je procedura izbora elemenata u uzorak u
kojoj se jednom izabrani elemenat ne vraća ponovo u osnovni skup. To znači da
se izbor svakog novog elementa u uzorak vrši u promenjenim uslovima, što
dalje implicira da se prilikom svakog pojedinog izvlačenja menja
verovatnoća izbora elemenata u uzorak. Što je osnovni skup sa konačnim
brojem elemenata manji, to su ove razlike veće. Zbog toga se u metodima
statističkog zaključivanja vodi računa o tome da li je izbor sa ili bez ponavljanja.
PRIMER 5.2 Iz skupa od 10 proizvoda na slučajan način treba izabrati
uzorak bez ponavljanja od 3 proizvoda, radi ispitivanja njihove ispravnosti.
Verovatnoća izbora prvog proizvoda je 1/10. Pošto se izabrani proizvod ne
vraća, verovatnoća izbora drugog proizvoda je 1/9, a trećeg 1/8. Uočljiva je
promena u uslovima izbora.
PRIMER 5.3 Potrebno je na slučajan način izabrati u uzorak 10 studenata,
radi provođenja anketnog istraživanja o uslovima studiranja. Izbor se vrši iz
osnovnog skupa od 2000 studenata jednog fakulteta. Ovo je primer u kojem
je izbor bez ponavljanja prirodna posledica uslova formiranja uzorka. Kada
bi se izbor vršio sa ponavljanjem, tada bi jedan student mogao biti izabran
više puta, pa bi uzorak izgubio smisao, jer u njemu ne bi bilo 10 studenata.
Verovatnoća izbora prvog studenta je 1/2000, drugog 1/1999, trećeg 1/1998
itd. Kao što se vidi, verovatnoća izbora se menja, ali su razlike između
112 OSNOVI STATISTIKE

pojedinih verovatnoća veoma male, a kod jako velikih i beskonačnih


skupova, razlika praktično nema.
I pored navedene prednosti uzoraka sa ponavljanjem, u praksi se najčešće ko-
riste uzorci bez ponavljanja i to iz dva razloga.
a) Uzorak se najčešće uzima iz relativno velikih osnovnih skupova, zbog čega se
promene verovatnoća izbora preostalih jedinica, izazvane prethodnim izborom
elemenata, mogu ignorisati.
b) Budući da kod uzoraka bez ponavljanja nema ponovnog izbora istih eleme-
nata, oni su efikasniji u odnosu na uzorke sa ponavljanjem. Drugačije rečeno,
svaka novoizabrana jedinica pruža novu informaciju o skupu. Usled toga u
nastavku ćemo se prvenstveno baviti uzorcima bez ponavljanja, koje ćemo bira-
ti iz velikih osnovnih skupova.

5.2 NESLUČAJNI I SLUČAJNI UZORCI

U zavisnosti od izabranog postupka uzorkovanja razlikujemo dve osnovne


grupe uzoraka:
ƒ neslučajne (neprobabilističke ili namerne) uzorke, i
ƒ slučajne (probabilističke) uzorke.
U neslučajnom uzorkovanju jedinice skupa nemaju poznatu vero-
vatnoću izbora u uzorak. To znači da elementi uzorka nisu birani slučajno, što
podrazumeva da namera njihovog izbora u uzorak može biti posledica različi-
tih okolnosti, počev od toga da se radi o jedinicama koje su na "pravom mestu u
pravo vreme", ili su poznate rukovodiocima istraživanja, ili je u pitanju nešto
drugo.
Kod slučajnog izbora svaka jedinica skupa ima poznatu verovatnoću,
odnosno šansu da bude izabrana u uzorak. Slučajno uzorkovanje podrazu-
meva da se verovatnoća izbora uzima u obzir prilikom selekcije.
Statistički metodi i modeli, izloženi u ovoj knjizi, bazirani su na pretpo-
stavci o slučajnom uzorkovanju. U najvećem broju statističkih istraživanja nije
problem da se ispuni ova pretpostavka. S druge strane, neslučajan, odnosno
nameran izbor elemenata u uzorak uvek može da dovede do manje ili veće pri-
strasnosti prilikom formiranja uzorka, a na taj način i do pristrasnosti u
dobijenim vrednostima parametara, kao i u zaključivanju.
Svaki od pomenutih načina ima svoje prednosti i nedostatke. Neke su
tehnike jednostavnije za provođenje, dok se drugim tehnikama efikasnije
smanjuju greške. U mnogim istraživanjima mora se voditi računa o vremenu
trajanja izbora, kao i sredstvima koja su potrebna da se uzorkovanje provede.
Nažalost, ograničenja na planu vremena i finansijskih sredstava često su
presudni, pa im se uzorkovanje mora povinovati, bez obzira na zahteve
statističke metodologije.
POGLAVLJE 5 – Izbor uzorka 113

Na Slici 5.1 je prikazana klasifikacija uzoraka koji su predmet razmatranja u


ovoj knjizi.

Slika 5.1 Vrste uzoraka

5.3 NESLUČAJNI (NAMERNI) UZORCI


Zajednička karakteristika neslučajnih metoda izbora elemenata u uzorak je da
istraživač na određen utiče na odabir jedinica iz osnovnog skupa. Otuda repre-
zentativnost uzorka zavisi od stručnosti lica koja planiraju proceduru izbora,
kao i od nepristrasnosti anketara prilikom izbora elemenata iz skupa u uzorak.
Svi neslučajni uzorci imaju jedno ozbiljno ograničenje: ne postoji način da od-
redimo rizik da smo pri oceni parametra skupa pogrešili, i samim tim, ne zna-
mo pouzdanost zaključaka koje smo na osnovu njih izveli. Zbog toga ove
tehnike nisu poželjne za prikupljanje podataka koji će biti predmet analiza
inferencijalne statistike, koja čini suštinski deo pristupa u ovoj knjizi. Ipak, kao
što smo naveli, u praksi su istraživači često prisiljeni, zbog raznih okolnosti, da
koriste ovakav vid izbora uzorka.

Pogodan uzorak

Ovde se elementi u uzorak biraju na način koji pogoduje istraživaču. Ovo znači
da istraživač u uzorak bira one elemente koji su, na neki način, lakše dostupni
Iskustvo istraživača i ekspertski nivo poznavanja populacije u ovim
slučajevima presudno utiču na dalje tokove analize u pozitivnom ili
negativnom smeru. Tako, na primer, u provođenju intervjua "vrata-do-vrata"
pogodno uzorkovanje uključuje domaćinstva kod kojih su ljudi kod kuće, kuće
114 OSNOVI STATISTIKE

su blizu ulice, stanove koji su na nižim spratovima, domaćinstva sa ljubaznim


ljudima itd.

Uzorak zasnovan na subjektivnom sudu


Ova vrsta uzorka se javlja u onim slučajevima kada se elementi uzorka biraju na
osnovu suda – procene istraživača. Ovo se često javlja u situacijama kada
istraživač veruje da može da dobije reprezentativan uzorak na osnovu svog
suda i izbora, koji treba da uštedi novac i vreme. Iako ponekad mogu biti u
pravu, ni kod ove vrste uzorkovanja nije moguće izračunati verovatnoću izbora
pojedinog elementa u uzorak.

Kvota uzorak

Kod ove vrste uzorka struktura uzorka mora da odgovara cilju istraživanja, ali
i da odražava strukturu skupa. Zato se elementi skupa svrstavaju u nekoliko
grupa, prema jednom ili više obeležja: polu, starosnoj grupi, geografskoj regiji i
dr. Nakon toga se određuje broj elemenata (kvote) koje će biti izabrani iz svake
grupe. Kvote se određuju na različite načine, a najčešće na osnovu proporcija
pojedinih podgrupa elemenata u osnovnom skupu. Izbor jedinica iz svake
kvote se prepušta slobodnom izboru anketara. Zbog subjektivnog izbora ele-
menata iz pojedinih grupa, kod kvota uzorka je uvek prisutna opasnost od
pristrasnog izbora. Međutim, ona ipak manja nego kod ostalih neslučajnih
uzoraka i prvenstveno zavisi od stručnosti i savesnosti anketara.
Kvote se najčešće popunjavaju sa dostupnim elementima skupa. Na
primer, umesto da se slučajnim izborom dobije određeni broj studenata u
uzorku, anketar može da ode na mesta gde su mu studenti najlakše dostupni
(studentski domovi, klubovi, fakulteti i sl.) i tamo sprovede intervjuisanje
dok se ne popuni željena kvota odgovora ove grupe. U kvota uzorkovanju
anketari postavljaju tzv. filter pitanja, pa ako ispitanici pripadaju kvotama
koje su već popunjene, intervju se prekida i traži se novi ispitanik.

Uzorak dobrovoljnih odgovora

U poslednje vreme sve su prisutnije emisije na televiziji, radiju, sajtovi na In-


ternetu, u kojima se organizuju ankete na koje se može odgovoriti SMS ili e-
mail porukama, direktno na sajtu, ili telefonom. Budući da se u ovakvim
anketama dobrovoljno učestvuje, ovako odabran uzorak se naziva uzorak
dobrovoljnih odgovora. Praksa je pokazala da ovakav uzorak skoro nikada
nije reprezentativan i da odgovori „samoizabranih“ elemenata skupa ne od-
ražavaju stvarno mišljenje u karakteristici skupa. Kako, na primer, da
mišljenje onih koji učestvuju u anketi na Internetu može da verno odrazi
stavove svih građana u Srbiji, ako Internet koristi manje od 25%
POGLAVLJE 5 – Izbor uzorka 115

domaćinstava2? Takođe, u navedenim anketama se najčešće oglašavaju lica


sa ekstremnim stavovima, pozitivnim ili negativnim, zbog čega su i dobijeni
rezultati najčešće pogrešni. Konačno, neka osoba može da učestvuje više
puta, ili da se po određenim osnovama organizuje višestruko slanje
odgovora sa ciljem uticaja na javno mnjenje.
Zbog svih navedenih slabosti neslučajnih uzoraka, mi se u nastavku
knjige njima nećemo baviti, i pod pojmom podrazumevaćemo isključivo slu-
čajan uzorak

5.4 SLUČAJNI UZORCI

Slučajan izbor jedinica u uzorak podrazumeva da svaki element skupa


ima unapred poznatu verovatnoću da bude izabran u uzorak, kao i da
je ta verovatnoća veća od nule.

Osnovna ideja slučajnog izbora je u tome da se svakom elementu skupa


pruži šansa da bude izabran u uzorak i time u potpunosti eliminiše uticaj
subjektivnosti na strukturu uzorka. Na taj način se značajno povećavaju
šanse da izabrani uzorak bude reprezentativan. Odmah napomenimo da ne
mora svaki slučajno izabrani uzorak da verno odražava karakteristike sku-
pa, i ovde postoji objektivna mogućnost da se napravi greška. Međutim,
njihova ključna prednost u odnosu na namerne uzorke je u tome što mo-
žemo da odredimo pouzdanost svakog donesenog zaključka primenom
metoda statističkog zaključivanja.
U ovoj grupi postoji više različitih vrsta uzoraka, od kojih ćemo se ov-
de upoznati sa najpoznatijim, koji su prikazani na Slici 5.1.

5.4.1 Prost slučajan uzorak

Ovo je, svakako, najčešći način u okviru slučajnog uzorkovanja. Prost slučajan
uzorak (eng. simple random sample) služi i kao osnova za ostale tehnike
slučajnog uzorkovanja.
Ako se iz osnovnog skupa izvlači uzorak tako da svaki mogući uzorak
iste veličine, n, ima istu verovatnoću da bude izabran iz skupa, onda
se takav uzorak naziva prost slučajan uzorak.
Na koji način se sprovodi postupak uzimanja prostog slučajnog uzorka i kako
se obezbeđuje slučajan izbor elemenata iz skupa? Prost slučajan uzorak se
formira u dve etape:

2 Dato na osnovu saopštenja Republičkog zavoda za statistiku, Upotreba


informaciono-komunikacionih tehnologija u Republici Srbiji, 2006.
116 OSNOVI STATISTIKE

1) U prvoj etapi mora da se formira i numeriše lista svih elemenata u skupu, od


1 do N.
2) U drugoj etapi se iz liste, na neki nepristrasan način, vrši izbor n elemenata u
uzorak. U prošlosti su se u početku najčešće koristile različite lutrijske tehnike,
kao što su izvlačenje ceduljica iz šešira ili kuglica iz bubnja. Zatim su se, 30-tih
godina prošlog veka, pojavile tzv. tablice slučajnih brojeva. Danas se u praksi
skoro isključivo primenjuju, uz pomoć statističkih softvera, kompjuterski
generatori slučajnih brojeva. Osnovna osobina koju svaki generator mora da
poseduje je da se elementi iz skupa na nezavisan način, jedan od drugoga,
biraju u uzorak.
Prikažimo kako se u
Minitabu i EduStatu
generiše slučajan uzo-
rak.
U Minitabu se nakon
unosa podataka za
čitavu populaciju u
jednu kolonu, slučajan
uzorak generiše tako
što se sa menija Calc
bira opcija Random
data i zatim Samples
from Columns kao na
Slici 5.2a. Nakon toga
se određuje veličina
uzorka, da li je uzorak
sa ili bez ponavljanja i
Slika 5.2.a i b Izbor prostog slučajnog uzorka u kolona u koju će se
Minitabu generisati podaci kao
na Slici 5.2.b.
U EduStatu se nakon
formiranja liste sa po-
dacima za čitav skup,
sa menija Simulacija
bira opcija "Prost slu-
čajan uzorak iz
kolone", kao na slici
5.3.a. Nakon toga se,
kao u Minitabu speci-
fikuje veličina željenog
uzorka, i donosi od-
luka da li izabrati
POGLAVLJE 5 – Izbor uzorka 117

uzorak sa ili bez ponavljanja.

Slika 5.2.a i b Izbor prostog slučajnog uzorka u EduStatu


Tablica slučajnih brojeva su tako konstruisana da sve cifre i brojevi u njoj imaju
jednaku i među sobom nezavisnu verovatnoću javljanja. Time se svakoj jedinici
skupa obezbedila ista mogućnost da bude izabrana u uzorak, a izbori jedinica u
uzorak bi bili među sobom nezavisni. Radi jasnoće, cifre su najčešće svrstane u
grupe od po pet redova i pet kolona, pa prazan prostor između grupa prilikom
upotrebe zanemarujemo. Budući da se ove tablice danas mogu slobodno
smatrati zastarelim (najverovatnije ih osim studenata niko drugi na svetu više
ne koristi), na njima se nećemo zadržavati.

5.4.2 Kontrolisani slučajni uzorci


Ukoliko se osnovni skup najpre podeli na među sobom jasno razgraničene pod-
skupova, a nakon toga se bira uzorak, govorimo o kontrolisanim uzorcima.
Njihova zajednička osobina je da svaki element skupa ima poznatu, ali ne i
obavezno jednaku verovatnoću izbora u uzorak. U kontrolisane uzorke se
ubrajaju stratifikovani uzorak, klaster uzorak, sistematski uzorak i višeetapni
uzorak.
118 OSNOVI STATISTIKE

Stratifikovani uzorak
Prost slučajan uzorak u principu daje preciznu ocenu karakteristike skupa u
slučaju kada se elementi među sobom relativno malo razlikuju po posmat-
ranom obeležju, odnosno ako je varijabilitet u skupu relativno mali.
Međutim, u slučajevima kada je skup veoma heterogen zaključci dobijeni
na osnovu prostog slučajnog uzorka neće biti dovoljno precizni. Da bi se
prevazišao ovaj nedostatak, iz takvog skupa se bira stratifikovani uzorak.
Izbor stratifikovanog uzorka se sprovodi u dve etape.
1. U prvoj etapi se osnovni skup deli u više jasno razgraničenih, što
sličnijih (homogenijih), podskupova koji se nazivaju stratumi, a sam postupak
se naziva stratifikacija. Cilj stratifikacije je da formiramo podskupove unutar
kojih se jedinice među sobom relativno malo razlikuju po posmatranom ob-
eležju, a da se istovremeno jedinice koje pripadaju različitim stratumima
među sobom što više razlikuju.
2. Iz svakog stratuma bira se po jedan prost slučajan uzorak. Unija svih
tih prostih slučajnih uzoraka naziva se stratifikovani uzorak.
Osnovna prednost stratifikovanog u odnosu na prost slučajan uzorak je
što je reprezentativniji i samim tim daje preciznije informacije o parametru
skupa. S druge strane, stratifikovano slučajno uzorkovanje je obično skuplje,
jer svaka jedinica osnovnog skupa mora biti dodeljena nekom stratumu pre
nego što se pristupi prostom slučajnom uzorkovanju.
Stratifikovano slučajno uzorkovanje se najčešće proporcionalnim
metodom alokacije elemenata skupa. To podrazumeva da je veličina uzorka
uzetog iz svakog stratuma proporcionalan procentu sa kojim svaki stratum
učestvuje u osnovnom skupu. Pretpostavimo da u strukturi preduzeća jedne
države ima 10% velikih, 30% srednjih i 60% malih. Proporcionalan pristup
stratifikovanom slučajnom uzorkovanju u ovom slučaju bi podrazumevao da u
uzorku od 50 preduzeća bude 5 velikih, 15 srednjih i 30 malih. Ukoliko
srazmera u uzorku nije ovakva, tada je u pitanju neproporcionalno
stratifikovano slučajno uzorkovanje.

Klaster uzorak
Ako je osnovni skup veoma veliki, ili spisak svih jedinica osnovnog skupa nije
dostupan, izbor uzorka ne možemo da izvršimo do sada objašnjenim
postupcima. U ovakvim slučajevima umesto da direktno biramo pojedine ele-
mente osnovnog skupa u uzorak, najpre biramo grupe elemenata, tzv. klastere.
Za razliku od stratifikovanog uzorka gde su stratumi homogeni, među sobom
različiti, delovi populacije, kod klaster uzorka se formiraju takve grupe, koje
svaka za sebe treba da što vernije reprezentuje osnovni skup. Zbog toga su
klasteri heterogeni. Primeri klastera su gradovi, kompanije, domaćinstva,
delovi grada, blokovi zgrada, geografske regije itd.
POGLAVLJE 5 – Izbor uzorka 119

Nakon grupisanja skupa u klastere, klaster uzorak formiramo tako što iz skupa
svih raspoloživih klastera slučajnim putem izaberemo nekoliko klastera.
Konačno, obuhvatamo sve jedinice u izabranim klasterima (dakle vrši se
praktično popis unutar izabranih klastera).
PRIMER 5.4 Pretpostavimo da nas interesuje mišljenje studenata prve
godine ekonomskog fakulteta o kvalitetu nastave. Umesto slučajnog izbora
pojedinih studenata sa cele prve godine, slučajnim putem ćemo izabrati, na -
primer, 3 od 9 grupa za vežbe i anketirati sve studente u njima; uzorak, dak-
le, obuhvata 3 klastera.
Ukoliko klasteri sadrže veoma veliki broj elemenata, onda uzorkom ne
obuhvatamo sve elemente izabranih klastera, već iz svakog od njih slučajnim
putem biramo po jedan prost slučajan uzorak. Na taj način formiramo tzv.
dvoetapni uzorak. Tako, na primer, u Primeru 5.4 umesto da ispitamo iz
svake grupe vežbi sve studente, izabrali bismo po jedan prost slučajan
uzorak veličine n (na primer 20 studenata i njih anketirali).

Sistematski uzorak

Sistematski uzorak je takav slučajan uzorak gde se izbor elemenata vrši po


određenom sistematskom redosledu, polazeći od slučajno izabranog početka.
Da bi se izabrao sistematski uzorak veličine n, iz konačnog osnovnog skupa
veličine N, potrebno je da raspolažemo numerisanom listom svih jedinica
skupa. Drugim rečima, svakom elementu skupa pripisuje se jedan redni broj
(od 1 do N). Nakon toga se lista svih jedinica skupa deli na n jednakih
intervala širine k = N/n, i iz svakog se bira po jedan element. Pri tome sa-
mo se iz prvog intervala na slučajan način bira prvi element, označimo
njegov redni broj na listi sa d. Svi ostali elementi sistematskog uzorka
dobijaju se sukcesivnim nalaženjem svake k-te jedinice sa liste. Dakle ostali
elementi uzorka imaće sledeće redne brojeve sa liste: d+k, d+2k, d+3k, itd.

PRIMER 5.4 Od 7000 firmi na jednom području, koje su uređene u


jedinstven registar, potrebno je u uzorak izabrati 5%, odnosno 350 firmi
za potrebe nekog istraživanja. Sistematski uzorak podrazumeva da se u
uzorak izabere svaka 20-ta firma (k = 7000/350 = 20). Postavlja se sada
pitanje odakle da se počne, preciznije, koju firmu od prvih dvadeset sa
uređene liste izabrati kao prvi element uzorka? Ovo se rešava
jednostavno, bilo pomoću tablice slučajnih brojeva ili statističkog
softvera; recimo da smo izabrali firmu broj 7 na listi. Sada je lako odrediti
sve ostale elemente sistematskog uzorka: 7+20=27, 27+20=47, 47+20=67
itd.
120 OSNOVI STATISTIKE

5..5 Greške pri izboru uzorka


Na osnovu pregleda svih navedenih tehnika uzorkovanja jasno je da nijedna od
njih unapred ne garantuje da će se izabrati reprezentativan uzorak. Razlog je
krajnje jednostavan – uzorak uvek predstavlja samo deo skupa. Zato primena
uzorka nužno podrazumeva prisustvo greške koju nikada ne možemo u
potpunosti otkloniti. Takva greška može biti relativno mala i u tom slučaju
neće uticati na validnost zaključka, ili toliko velika da će uticati na
formulisanje pogrešnog zaključka.
Generalno, greške koje se čine pri uzorkovanju delimo u dve grupe: (1)
uzoračke (slučajne) i (2) neuzoračke (sistematske).

Uzoračka greška
Uzoračka greška javlja se kao posledica fluktuacije (slučajnog kolebanja)
uzorka i uvek je prisutna prilikom uzorkovanja. Ovo zbog toga što uzorak, po
pravilu, a to znači u najvećem broju uzoraka izabranih iz neke populacije, nije
savršeno reprezentativan. Kada bi se slučajnim izborom uvek dobijao savršeno
reprezentativan uzorak, tada bi se statističko zaključivanje svodilo na merenje
elemenata jednog uzorka, izračunavanje željenih vrednosti i njihovo
proglašavanje vrednostima parametara populacije.
Iz neke populacije moguće je izabrati manji ili veći broj uzoraka, u
zavisnosti od toga da li se izbor vrši sa ponavljanjem ili bez ponavljanja
elemenata, da li uzorak sadrži dva, tri ili više elemenata, a posebno u zavisnosti
od toga da li je broj elemenata populacije manji ili veći. Kod relativno velikih
populacija, broj mogućih uzoraka je veoma veliki, tako da je i prisutna
fluktuacija veoma velika. Iz sledećeg pregleda to se jasno vidi:
Veličina Broj mogućih uzoraka bez
Veličina populacije
uzorka ponavljanja*
30 5 142506
300 5 19582837560
* Broj mogućih uzoraka bez ponavljanja izračunat je kao broj kombinacija od n
⎛n⎞ n!
elemenata r-te klase, prema izrazu C rn = ⎜ ⎟ =
r
⎝ ⎠ r !( n − r )!
Zbog toga što najveći broj uzoraka nije savršeno reprezentativan, statistika koja
se izračunava na osnovu vrednosti iz uzorka skoro nikada nije potpuno
precizna ocena parametra populacije, odnosno razlikuje se od njega. Upravo ta
razlika između vrednosti parametra i statistike uzorka predstavlja uzoračku
grešku. Na primer, ako proporcija svih devojaka na nekom ekonomskom
fakultetu iznosi 60%, slučajan uzorak, od recimo 50 studenata, skoro nikada
neće dati tu proporciju, već će pokazivati manja ili veća odstupanja, odnosno
fluktuacije. Ako smo, na primer, u jednom uzorku dobili da proporcija devojaka
iznosi 55%, tada bi njegova uzoračka greška iznosila: Parametar – statistika
uzorka = 60% - 50% = 5%.
POGLAVLJE 5 – Izbor uzorka 121

Kada se koriste tehnike slučajnog uzorkovanja za izbor elemenata u uzorak,


uzoračka greška javlja se sa određenom verovatnoćom, i njen nivo se može
kontrolisati.

Neuzoračke greške
Sve ostale greške koje nisu uzoračke greške označavaju se kao neuzoračke i
mnogo su opasnije po statističko zaključivanje. One su najčešće proizvod
ljudskog faktora. Mnoštvo mogućih neuzoračkih grešaka uključuje nedostajuće
podatke, greške u zapisivanju, greške prilikom unosa podataka u računar, kao i
analitičke greške. Uz to, neuzoračke greške se pojavljuju i kao posledica instru-
menata merenja, greške nejasnog definisanja, nepodesnih i pogrešnih pitanja u
upitnicima, kao i nejasnog koncepta istraživanja. Greške u odgovorima uzro-
kuju neuzoračke greške u slučajevima kada ispitanici ne žele da odgovore, kada
ne znaju odgovor ili pređu okvir dozvoljenog u odgovoru (od ponuđena tri od-
govora zaokruže sva tri, bez obzira što je moguće dati samo jedan odgovor).

REZIME
Uzorak je deo osnovnog skupa na osnovu kojeg donosimo zaključke o
parametrima, odnosno karakteristikama skupa u celini. Da bismo došli do va-
lidnih zaključaka o karakteristikama osnovnog skupa, uzorak treba da bude
reprezentativan. Pored toga što se može brže sprovesti i uz niže troškove od
popisa, uzorak često može davati preciznije informacije. Prema načinu izbora
razlikujemo neslučajne uzorke (kod kojih istraživač utiče na izbor jedinica iz
skupa) i slučajne (kada sve jedinice skupa imaju mogućnost da budu izabrane
uzorak).
Prednost slučajnih u odnosu na neslučajne uzorke je što se samo na njima
može validno primeniti metodi statističkog zaključivanja, i pružaju informacije
o mogućem riziku greške zbog eventualnog izbora nereprezentativnog uzorka.
Najjednostavniji slučajan uzorak je prost slučajan uzorak. Kod njega se svi
elementi skupa prvo moraju numerisati a zatim se vrši izbor pomoću tablica
slučajnih brojeva ili putem kompjuterskih generatora slučajnih brojeva. Na taj
način se bez pristrasnosti svakom elementu skupa pruža šansa da bude izabran.
Kontrolisani uzorci su slučajni uzorci kod kojih svaki element skupa ima
poznatu, ali ne nužno jednaku, verovatnoću izbora u uzorak. U ovu grupu spa-
daju stratifikovani uzorak, klaster uzorak, višeetapni i sistematski uzorak
Prilikom slučajnog izbora elemenata u uzorak mogu se javiti greške koje
ugrožavaju reprezentativnost uzorka. Uzoračke (slučajne) greške se javljaju
zbog postojanja razlike između strukture skupa i strukture uzorka i nemoguće
ih je otkloniti. Ipak, ako se primenjuju slučajni uzorci tada se ove greške mogu
kontrolisati. Neuzoračke greške su proizvod ljudskog faktora i mnogo su opa-
snije po statističko zaključivanje.
122 OSNOVI STATISTIKE

KLJUČNI NOVI POJMOVI


Zakon velikih brojeva Kontrolisani uzorci
Uzorak sa ponavljanjem Stratifikovani uzorak
Uzorak bez ponavljanja Generatori slučajnih brojeva
Pogodan uzorak Tablice slučajnih brojeva
Uzorak zasnovan na subjektivnom sudu Stratifikacija skupa
istraživača Stratum
Kvota uzorak Klaster uzorak
Uzorak dobrovoljnih odgovora Sistematski uzorak
Prost slučajan uzorak

KONTROLNA PITANJA I ZADACI


1. Prednosti uzorka u odnosu na popis.
2. Objasnite razliku između slučajnih i neslučajnih uzoraka.
3. Vrste neslučajnih uzoraka i njihova primena.
4. Prost slučajan uzorak.
5. Objasnite razliku između prostog slučajnog uzorka i grupe kontrolisanih
slučajnih uzoraka.
6. Stratifikovani uzorak, način formiranja i prednosti u odnosu na prost slučajan
uzorak.
7. Uporedite klaster i stratifikovani uzorak.
8. Objasnite kako se iz osnovnog skupa veličine N=200 elemenata bira sistematski
uzorak veličine n=20.
9. Uzoračke i neuzoračke greške pri izboru uzorka (objasnite uzroke njihovog ja-
vljanja).
10. Raspolažemo sledećim podacima o dužini radnog staža 18 nastavnika na
ekonomskom fakultetu.

J. K. M. L. J. B. G. R. A. Ž. M. M. V. L. K. M. D. M.
29 20 38 33 28 10 14 18 25

B. D. S. K. J. R. D. Đ. D. P. T. R. D. A. O. K. B. D.
10 12 19 28 29 11 8 21 20
Unesite podatke o dužini radnog staža u izabrani statistički softver. Tretirajući ove
podatke kao osnovni skup, generišite 10 slučajnih uzoraka od po 5 jedinica iz njega.
Izračunajte zatim aritmetičku sredinu skupa i aritmetičku sredinu svakog
pojedinačnog uzorka. Uporedite najpre aritmetičke sredine uzoraka. Da li se javljaju
fluktuacije uzoraka? Zatim ih uporedite sa aritmetičkom sredinom skupa. Koliko
iznose uzoračke greške u svakom od uzoraka?

You might also like