You are on page 1of 14

Statistika

Prof.dr.sc. Diana imi


Diana.Simic@foi.hr

Procjena proporcije i interval pouzdanosti

Procjena proporcije u populaciji na temelju uzorka


Tokovna procjena
Intervalna procjena

Preduvjeti za primjenu modela normalne razdiobe


Procjena potrebne veliine uzorka

Diana imi

Izvori prihoda kuanstava


S obzirom na visoku stopu nezaposlenosti i velik udio umirovljenika
u populaciji, socijalna sluba eljela bi znati u koliko domainstava
u Hrvatskoj je mirovina glavni izvor prihoda.
Dravni zavod za statistiku proveo je u 2011. godini anketno
istraivanje na sluajnom uzorku 2335 domainstava.
U 593 domainstva (25,4%) su izjavili da je glavni izvor prihoda
domainstva mirovina.
to moemo zakljuiti na temelju ovog istraivanja o udjelu
domainstava kojima je glavni izvor prihoda mirovina u Hrvatskoj ?
Imamo proporciju na uzorku =

593
2335

= 0,2539

Moemo pretpostaviti da je opaena proporcija slina


populacijskom parametru .
Ali znamo i da smo uzeli neki drugi uzorak dobili bismo neku drugu
vrijednost proporcije.
Diana imi

to moemo rei o populacijskoj proporciji ?


Sjetimo se modela razdiobe uzorkovanja.
Znamo da (uz odgovarajue pretpostavke) razdiobu uzorkovanja proporcije
moemo modelirati normalnom razdiobom.
Ako bismo znali populacijski parametar (proporciju) , mogli bismo izraunati
aritmetiku sredinu i standardnu devijaciju razdiobe uzorkovanja.
S obzirom na to da NE ZNAMO populacijski parametar, najbolje to moemo
napraviti je da upotrijebimo proporciju na uzorku i izraunamo standardnu
greku procjene:
=

0,2539 0,7461
= 0,009 = 0,9%
2335

Sad moemo nacrtati razdiobu uzorkovanja

p-0,027

p-0,018

p-0,009

p+0,009

p+0,018

p+0,027

Diana imi

Interval pouzdanosti

p-0,027

p-0,018

p-0,009

p+0,009

p+0,018

p+0,027

S obzirom na to da je razdioba normalna, znamo da e za 68%


sluajnih uzoraka (svaki po 2335 domainstava u Hrvatskoj)
proporcija domainstava u uzorku biti na 1 SE od populacijskog
parametra. Oko 95% takvih uzoraka bi imalo unutar 2.
Gdje je naa proporcija 0,254 na ovoj slici? Koliki je ? Ne znamo!
Pogledajmo ovo iz perspektive naeg . 95% uzoraka e imati
udaljen ne vie od 2SE od . Ako napravim interval oko tako da
granice stavim lijevo i desno na 2SE od , imam ansu 95% da u
pokriti populacijski parametar.
S 95% pouzdanosti moemo tvrditi da interval od 23,6% do 27,2%
sadri populacijski parametar.
Diana imi

Standardna greka procjene


Standardna devijacija i oekivanje razdiobe uzorkovanja statistike
odreene su parametrima populacije i veliinom uzorka
Ako ne znamo potrebne parametre populacije (skoro uvijek!)
koristimo njihove procjene iz uzorka
Standardna greka procjene statistike (SE) na uzorku je
procjena standardne devijacije razdiobe uzorkovanja te statistike
(na skupu svih moguih uzoraka iste veliine)
Standardna greka je vea ako je varijabilnost promatrane
varijable vea
Standardna greka se smanjuje proporcionalno korijenu iz veliine
uzorka
Moemo zakljuiti da veliinu uzorka ne treba definirati kao
proporciju populacije, jer standardna greka ovisi o apsolutnoj, a
ne relativnoj veliini uzorka.
Diana imi

Interval pouzdanosti
Interval pouzdanosti je interval procijenjen na sluajnom
uzorku na takav nain da je vjerojatnost da interval sadri
nepoznatu vrijednost parametra populacije unaprijed poznata. Pri
tom je sluajna veliina interval. Vrijednost parametra je nama
nepoznata, ali nije sluajna.
Interval pouzdanosti dobivamo tako da procjeni parametra
dodamo i oduzmemo neku vrijednost tu vrijednost zovemo
margina greke.
Za 95% interval pouzdanosti kad je razdioba uzorkovanja
normalna margina greke je 1,96 SE. Broj 1,96 je kvantil
standardne normalne distribucije koji odgovara percentilu od
0,975.
Da smo umjesto 95% intervala pouzdanosti htjeli izraunati 90% imali bismo drugaiju marginu greke (1,64 SE). Broj kojim
treba mnoiti SE da bismo dobili odgovarajuu marginu greke
zove se kritina vrijednost.
Diana imi

Interval pouzdanosti za
normalni model razdiobe uzorkovanja

Preduvjeti:

Nezavisnost opservacija
Sluajan izbor uzorka
Uzorak ne smije biti prevelik u odnosu na populaciju (<10%)
Uzorak mora biti dovoljno velik da vrijedi sredinji granini
teorem (za svaki mogui ishod kvalitativne varijable mora
sadravati najmanje 10 opservacija s tom vrijednou)

Diana imi

Koliko veliki uzorak nam treba?

Koliko veliki uzorak bismo trebali prikupiti da procijenimo proporciju


domainstava kojima je glavni izvor prihoda mirovina s marginom greke
manjom od 0,01 uz razinu pouzdanosti od 95%?
Za razinu pouzdanosti od 95% margina greke je zadana s 1,96 SE. (1,96
je kvantil standardne normalne razdiobe koji odgovara percentilu 0,975)
1,96 SE 1,96

p(1 p)

0,01
n
p(1 p)
0,012

n
1,96 2
p(1 p) 0,000026031n

0,52
0,000026031n
0,25
0,000026031n
9603,94
n

Izraz s lijeve strane je najvei kad je p=0,5. Ako nemamo procjenu za p,


uvrtavamo 0,5 (kao gore desno). Konani rezultat zaokruujemo na gore,
dakle potrebna nam je veliina uzorka od 9604 domainstva.
Podsjetimo se uzorak veliine 2335 dao je marginu greke od 0,018!

Diana imi

Kolika je kritina vrijednost?

Margina pogreke rauna se kao umnoak kritine vrijednosti i


standardne greke procjene SE.
Za 95% interval pouzdanosti elimo da povrina ispod standardne
normalne krivulje izmeu i bude jednaka 0,95.
To znai da je kvantil standardne normalne razdiobe koji
odgovara percentilu 0,975.

Diana imi

10

A za 90% interval pouzdanosti?

Za 90% interval pouzdanosti elimo da povrina ispod standardne


normalne krivulje izmeu i bude jednaka 0,90.
To znai da je kvantil standardne normalne razdiobe koji
odgovara percentilu 0,95.

Diana imi

11

Smijemo li rei?
Za 25,4% domainstava u Hrvatskoj mirovina je glavni izvor
prihoda.
NE! To vrijedi za na uzorak, a ne i za cijelu Hrvatsku.
Vjerojatno je za 25,4% domainstava u Hrvatskoj mirovina glavni
izvor prihoda.
NE! Moemo biti prilino sigurni da kolika god bila proporcija
domainstava u Hrvatskoj kojima je mirovina glavni izvor prihoda
taj broj nije tono 25,4%.
Ne znamo tono kojoj proporciji domainstava u Hrvatskoj je
mirovina glavni izvor prihoda, ali znamo da je ta proporcija unutar
intervala 25,4% 1,960,9%, tj. izmeu 23,6% i 27,2%.
NE! Ne moemo biti sigurni da je populacijski parametar unutar
tog ili bilo kojeg drugog intervala.
S pouzdanou 95% moemo tvrditi da se proporcija domainstava
u Hrvatskoj kojima je glavni prihod mirovina nalazi izmeu 23,6% i
27,2%.
DA!
Diana imi

12

95% interval pouzdanosti

95% pouzdanost
0.35
0.30
0.25
0.20
0.15
0

10

20

30

40

50

Uzorak

Pod pojmom 95% interval pouzdanosti podrazumijevamo da bi od jako


puno sluajnih uzoraka iste populacije interval pouzdanosti izraunat na
ovakav nain u 95% sluajeva uspio pokriti populacijski parametar. To
znai da oko 5% intervala ne bi sadravalo populacijski parametar!
Na gornjoj slici od 50 uzoraka njih 4 imaju 95% interval pouzdanosti koji
ne sadri populacijski parametar (oznaen horizontalnom crtom).

Diana imi

13

Ponavljanje

Interval pouzdanosti
Standardna greka procjene
Margina greke
Kritina vrijednost

Pazite da pri interpretaciji ne sugerirate da je populacijski


parametar sluajna (promjenjiva) vrijednost. Interval je sluajan i
za svaki uzorak razliit, a ne populacijski parametar.

Diana imi

14

You might also like