You are on page 1of 36

Populacija i uzorak

Sadržaj predavanja
• Šta je populacija, šta je uzorak a šta uzorkovanje?
• Statističko zaključivanje
• Klasifikacija uzoraka: sa i bez verovatnoće, sa i bez
zamenjivanja
• Uzoračke raspodele verovatnoća
– Uzoračka raspodela aritmetičkih sredina uzoraka,
Centralna granična teorema
– Uzoračka raspodela proporcija uzoraka
– Uzoračka raspodela varijansi uzoraka
Šta je populacija?
Populacija Ciljna/uzoračka populacija
• skup svih istovrsnih • Ciljna populacija: skup
elemenata (jedinica elemenata za koji želimo
posmatranja: ljudi, da generalizujemo
objekata, dogadjaja) koji zaključak.
imaju neku zajedničku • Uzoračka populacija:
karakteristiku od interesa populacija koja je
dostupna i koja
predstavlja ciljnu
populaciju (blisko koliko
je to moguće), i iz koje
potiče uzorak .
Šta je uzorak?

UZORAČKA POPULACIJA

Uzorak –
UZORAK
podskup osnovnog skupa
(izabran na neki način)

CILJNA POPULACIJA

Cilj i primena u statistici:


ispitivanje određene osobine i generalizacija zaključka na populaciju
Šta je uzorkovanje?
Uzorkovanje Reprezentativnost
• Proces odabira • Reprezentativan uzorak
poseduje karakteristike slične
reprezentativnog dela cele onima u populaciji.
populacije. • Preduslovi reprezentativnosti:
1. Način izbora statističkih jedinica
• Sastavni deo istraživačke u uzorak mora biti nezavisan od
vrednosti posmatranog obeležja.
metodologije. 2. Verovatnoća statističkih jedinica
da uđu u uzorak mora biti
Element, jedinica posmatranja unapred poznata.

• Osnovna jedinica o kojoj se • Pristrasan uzorak – izabran na


informacije sakupljaju. takav način da su neke jedinice
iz uzoračke populacije imale
veću verovatnoću da uđu u
uzorak.
Tehnike uzorkovanja
• Sa verovatnoćom
(slučajni)
• Bez verovatnoće
(neslučajni)
Slučajni/ Neslučajni uzorak
Slučajni uzorak Neslučajni uzorak
• Slučajna selekcija • Nije slučajna selekcija
jedinica. jedinica.
• Svaka jedinica u • Nije poznata verovatnoća
populaciji ima poznatu jedinica posmatranja u
(jednaku i nezavisnu) osnovnom skupu da budu
verovatnoću (šansu) da izabrane za uzorak.
uđe u uzorak.
Prost slučajni uzorak
1. Jedinice posmatranja imaju • Uzorkovanje sa zamenom –
podjednaku verovatnoću da nakon što je element izabran,
uđu u uzorak. zamenjuje se i slučajno se odabira
2. Uključuje definisanje populacije i drugi element. Ovo može dovesti
identifikaciju uzoračkog okvira. do toga da isti element bude
3. Vremenski je zahtevno. izabran više puta.
4. Moze biti i nemoguće dobiti • Češće se primenjuje uzorkovanje
kompletnu listu uzoračke bez zamene. Obezbeđuje da, na
populacije. svakom koraku, svaki element koji
je preostao u populaciji ima istu
5. Izbor jedinica iz uzoračkog okvira verovatnoću da će biti izabran.
može se uraditi uz pomoć
kompjuterski generisanog
procesa odabiranja ili tablice
slučajnih brojeva.
Zaključci o populaciji se mogu doneti...
...odabirom reprezentativnog uzorka iz populacije
Sistematski uzorak
• Jedinice posmatranja se biraju sa liste
uzoračke populacije izborom svake K-te
jedinice.
• K – korak izbora (uzorački interval),
zavisi od veličine liste I željene veličine
uzorka.
• K = N / n, gde je N veličina uzoračke
populacije, a n veličina uzorka
• Nakon što je prva jedinica odabrana
(slučajni početak) automatski se biraju
ostale.
• Može dati korisne informacije ako kod
jedinica u uzoračkoj populaciji postoji
uređenost po intenzitetu posmatrane
karakteristike.
• Nije pogodan ako postoje ciklične
varijacije posmatrane karakteristike.
Stratifikovani uzorak
• Primenjuje se kod
heterogenih populacija u
odnosu na neku varijablu
npr. starosna grupa, pol,
geografska lokacija
(stratifikujuća varijabla).
• Populacija se deli na
stratume iz kojih se bira
slučajni uzorak.
• Osigurava da je svaka
subpopulacija
odgovarajuće zastupljena
u uzorku.
Klaster uzorak
• podela populacije na
klastere (grupe)
• zatim se na slučajan način
biraju klasteri koji ulaze u
uzorak (tako da se na
slučajan način biraju
grupe - klasteri, a ne
individue)
• koristan kada je
populacija velika ili
geofraski široko
rasprostranjena
Uzorkovanje bez verovatnoće
Karakteristike uzorkovanja Generalizacija zaključaka
• Elementi uzorka su odabrani • Valjanost generalizacije
na bazi sopstvene procene zaključaka sa neslučajnih
istraživača. uzoraka na osnovni skup
• Rezultati sprovođenja ovih ostaje nepoznata.
tehnika su pristrasni.
• Nedostaje objektivnost u
odabiru uzoraka.
• Uzorci nisu pouzdani.
• Ove tehnike su pogodne i
ekonomične za korišćenje.
Tipovi uzoraka bez verovatnoće
Prigodni uzorak Namerni uzorak
• Izbor lako dostupnih • Istraživač bira one jedinice
jedinica posmatranja. posmatranja za koje smatra
da reprezentuju osnovni
Kvota uzorak skup.
Podela populacije na • Koristan za pilot studije.
kategorije, npr. po polu, i
neslučajan odabir ispitanika iz
tih kategorija prema unapred
utvrđenom broju (kvota).
Proces uzorkovanja
Definisati Populaciju

Odrediti uzorački okvir

Izabrati način uzorkovanja

Uzorci sa verovatnoćom Uzorci bez verovatnoće

Odrediti veličinu uzorka

Pristupiti realizaciji
Parametri, statistike
tj. parametri populacije i uzoračke statistike
• Parametri populacije su nepoznati 1. Parametar – statistička mera
i nepristupačni za merenje. date varijable u populaciji
– Npr, prosečna visina muškaraca u 2. Uzoračka statistika – statistička
Srbiji (18+) je nepoznata i mera date varijable u uzorku
nemerljiva
• Zbog toga računamo uzoračku Statistička Parametri Uzoračke
statistiku koja se odnosi na mera populacije statistike
parametar od interesa, i Aritmetička
donosimo zaključak.  x
sredina

Varijansa 2 sd2

Standardna
 sd
devijacija

Proporcija  p
Uzoračke raspodele verovatnoća
• Uzoračka raspodela verovatnoća je
raspodela verovatnoća neke statistike.
• Uzoračka raspodela verovatnoća dobija
se na osnovu raspodele svih mogućih
vrednosti iste statistike kreiranih u svim
mogućim slučajnim uzorcima iste veličine
koji su izabrani na isti način iz iste
populacije.
Uzoračke raspodele verovatnoća

Uzoračka Uzoračka Uzoračka


raspodela raspodela raspodela
uzoračkih uzoračkih uzoračkih
aritmetičkih proporcija varijansi
sredina

Uzoračka raspodela aritmetičkih sredina, proporcija, varijansi svih uzoraka iste


veličine izabranih na isti način iz iste populacije.
Kreiranje uzoračke raspodele

• Podaci o populaciji …
D
• Veličina populacije N=4 A B C

• Slučajna promenljiva, X,
je starost osobe
• Vrednosti X su:
18, 20, 22, 24 (godina)
Kreiranje uzoračke raspodele
(nastavak)

Parametri, zbirne mere, populacione raspodele:

1
μ  i X i
N
18  20  22  24
  21
4

1
σ
N
i
( X i  μ) 2
 2.236
Kreiranje uzoračke raspodele
(nastavak)
Formirajmo sve moguće uzorke veličine n = 2
va ga
1 2 Opservacija
16 uzoračkih
Ops 18 20 22 24 aritmetičkih
sredina
18 18,18 18,20 18,22 18,24
20 20,18 20,20 20,22 20,24 1ca 2ga Opservacija
Ops 18 20 22 24
22 22,18 22,20 22,22 22,24
18 18 19 20 21
24 24,18 24,20 24,22 24,24 20 19 20 21 22
16 mogućih uzoraka 22 20 21 22 23
(uzorkovanje sa
vraćanjem) 24 21 22 23 24
Kreiranje uzoračke raspodele
(nastavak)

Uzoračka raspodela svih uzoračkih aritmetičkih sredina


16 uzoračkih aritmetičkih sredina
Raspodela uzoračkih
aritmetičkih sredina

1va 2ga Opservacija _


Ops 18 20 22 24 P(X)
.3
18 18 19 20 21
.2
20 19 20 21 22
.1
22 20 21 22 23
0 _
24 21 22 23 24 18 19 20 21 22 23 24 X
Kreiranje uzoračke raspodele
(nastavak)

Zbirne mere uzoračke raspodele:

1 18  19  21    24
E(X)   Xi   21  μ
N 16

1
σX 
N
 ( X i  μ) 2

(18 - 21) 2  (19 - 21) 2    (24 - 21) 2


  1.58
16
Poređenje populacije sa uzoračkom
raspodelom
Populacija Uzoračka raspodela aritmetičkih sredina; n =
N=4 2
μ σ μX  σX 
_
p(X) p(X)
.3 .3

.2 .2

.1 .1

0
18 20 22 24 X
0
18 19 20 21 22 23 24
_
X
A B C D
• x   21 = 21


x  1, 58 =
2, 236 2, 236 2, 236
n
=
2
=
1, 41
=1, 58
n
s X = SE
• STANDARDNA GREŠKA (ARITMETIČKE SREDINE)
(standardna devijacija uzoračke raspodele svih
mogućih aritmetičkih sredina kreiranih u uzorcima
koji su na isti način i iste veličine slučajno izabrani
iz iste populacije)
Uopštavamo
• Ako je
Normalna
populacija populaciona
normalno raspodela
raspodeljena
μ x
Normalna uzoračka
raspodela sa istom
aritmetičkom sredinom

μx
x
Uopštavamo – centralna granična
teorema
• Ako populacija Populaciona
nije normalno raspodela
raspodeljena a
uzorak je dovoljne
veličine - n ≥ 30
μ x
(centralna
Uzoračka raspodela
granična teorema) (postaje normalna sa porastom n)
Veća
Manja veličina veličina
uzorka uzorka

μx x
Centralna granična teorema

Uzoračka
Kada je n↑
raspodela
veličina
postaje
uzorka
normalna bez
dovoljno
obzira kakva je
velika…
raspodela
populacije.

x
Uopštavamo - Studentova t-raspodela

• Ako populaciona • Mali uzorci a populacija je


varijansa nije poznata u normalno raspodeljena (ili
prethodno navedenim bar simetrično)
situacijama • William Gosset, 1908 g.,
pseudonim Student
x-m
t= • tipična kada je populaciona
sd / n varijansa nepoznata pa se
N
ocenjuje na osnovu
1
å ( )
2
sd =
2
xi - x uzoračkih podataka
n -1 i=1
Studentova t - raspodela
Normalna raspodela
t raspodela, n=2, df=1
t raspodela, n=10, df=9
t raspodela, n=30, df=29
Jedan uzorak ili mnogi?
• Da li uvek imamo sve moguće uzorke iste veličine
izabrane na isti način iz iste populacije? – NE, imamo po
pravilu samo JEDAN uzorak i jasno nam je da će
izračunata statistika verovatno biti različita da smo
izabrali neki drugi uzorak.
• U tom jednom uzorku uvek smo sigurni da je SE
(standardna greška) mera odstupanja/variranja
aritmetičke sredine tog uzorka od aritmetičke sredine
populacije.
• Dakle, ne trebaju nam svi mogući uzorci, dovoljan je
samo jedan da bi donosili zaključke o populaciji iz koje
taj uzorak potiče.
Uzoračka raspodela proporcija
• p je populaciona
proporcija a p je uzoračka p=
x
proporcija n
• Raspodela svih mogućih
uzoračkih proporcija ima
binomnu raspodelu koja
može da se aproksimira mp = p
normalnom (CGT) kada je:
np(1 – p) > 9 p (1- p )
s =
2
p
(ili: np≥5 i n(1-p)≥5) n
Uzoračka raspodela varijansi
n
1
• Uzoračka varijansa je: s2   i
n  1 i1
(x  x) 2

• Uzoračka raspodela varijansi (s2


ima aritmetičku sredinu σ2 ms = s
2
2

• Ako je populaciona distribucija 2s 4


normalna tada je s s22 =
• Ako je populaciona distribucija n -1
normalna tada promenljiva
(n - 1)s2
ima 2 distribuciju sa n – 1 σ2
stepena slobode
2 (hi-kvadrat) raspodela
• uzoračka raspodela varijanse
n=9
n=29
n=99
p(2)

0 50 100 150
2
Inferencijalna statistika – statistika
zaključivanja
• Zaključujemo o parametrima
populacije (na osnovu uzoračkih
statistika, a sada znamo kako se one
raspodeljuju i koliko jedan uzorak
odstupa od populacije iz koje
potiče).
• Kakav tip zaključaka donosimo?

You might also like