You are on page 1of 9

STATISTIČKO ZAKLJUČIVANJE:

OCENJIVANJE ARITMETIČKE SREDINE I PROPORCIJE OSNOVNOG SKUPA


VEŽBE - PETA NEDELJA
___________________________________________________________________________
Najpre pročitajte teorijski deo iz školske knjige (str 79-86). Obratite pažnju na
reprezentativnost i statističke greške (zbog teorijskih pitanja). Zadatke iz ove oblasti
(ocenjivanje), IMATE i na ispitu i na domaćem zadatku (kolokvijumu) i odnose se na sledeće
uže celine:
1. Ocenjivanje aritmetičke sredine osnovnog skupa na bazi velikog uzorka kada je
varijansa osnovnog skupa nepoznata
2. Ocenjivanje aritmetičke sredine osnovnog skupa na bazi malog uzorka kada je
varijansa osnovnog skupa nepoznata
3. Ocenjivanje proporcije osnovnog skupa
__________________________________________________________________________________

Najpre da razgraničimo neke stvari. Sve do ovih vežbi izračunavali smo aritmetičku sredinu,
varijansu i standardnu devijaciju OSNOVNOG SKUPA (obeležavali smo ih sa , σ 2, σ ). Počev
od ovih vežbi, izračunavamo aritmetičku sredinu, varijansu i standardnu devijaciju UZORKA
(sada ih obeležavamo sa m, Sn2, Sn). Ove mere, koje izračunavamo na osnovu uzorka,
koristimo kako bi ocenili nepoznate parametre osnovnog skupa (arimetičku sredinu i
proporciju). Jednačine za izračunavanje aritmetičke sredine, varijanse i standardne devijacije
uzorka su identične jednačinama za izračunavanje aritmetičke sredine, varijanse i
standardne devijacije osnovnog skupa. Razlika je samo u obeležavanju (umesto kod uzorka
koristimo m, umesto σ 2 koristimo Sn2, umesto σ koristimo Sn).

Uzorak je deo skupa. Npr. svi studenti koji slušaju statistiku na prvoj godini, recimo njih 300,
predstavljaju osnovni skup. Uzorak bi bio studenti prve godine, njih 40, koji slušaju statistiku
u grupi A1 (jer postoje i druge grupe za statistiku A2, A3 itd).

Jednačine (levo osnovni skup, desno uzorak):

OSNOVNI SKUP UZORAK

Prosta distributivna frekvencija - aritmetička sredina:

¿
∑ f i∗xi m=
∑ f i∗x i
∑ fi ∑ fi
Intervalna serija - aritmetička sredina:

¿
∑ f i∗x s m=
∑ f i∗x s
∑ fi ∑ fi
Prosta distributivna frekvencija - varijansa
2
2 ∑ f i∗x i 2 ∑2f i∗x 2i
σ = −❑ S= n −m2
∑ fi ∑ fi
Intervalna serija - varijansa
2
2 ∑ f i∗x s 2 2 ∑ f i∗x 2s
σ = −❑ S=
n −m2
∑ fi ∑ fi

Prosta distributivna frekvencija – standardna devijacija


2
∑ f i∗x ∑ f i∗x 2i −m2
σ=
√ ∑ fi
i
−❑ 2
Sn=
√ ∑ fi
Intervalna serija – standardna devijacija

∑ f i∗x 2s −❑2 ∑ f i∗x 2s −m2


σ=
√ ∑ fi
Sn=
√ ∑ fi

Pre nego što krenemo sa zadatkom, potrebno je da znate sledeće:

1. Kada kažemo veliki uzorak, mislimo na uzorak koji ima 30 ili više elemenata
(podataka). U tom slučaju koristimo normalan Z raspored. Mali uzorak je onaj koji
ima manje od 30 elemenata i tada koristimo studentov t raspored. Pročitajte
karakteristike ovih rasporeda iz knjige. Važni su. Isto važi i za hi kvadrat raspored o
čemu će biti više reči na narednim vežbama
2. Uvek pažljivo pročitajte zadatak. U tekstu zadatka na ispitu obično piše ocenite nešto
ili testirajte neku hipotezu. Mi na ovim vežbama radimo ocenjivanje (testiranje
hipoteza radimo sledeće nedelje). Vrlo često na ispitu u samom zadatku piše ocenite,
a vi uporno vršite testiranje hipoteze što se od vas uopšte ne traži, niti to možete da
uradite jer nemate dovoljno podataka. Mešate ove dve oblasti. Vodite o ovome
računa.
3. Prepoznajte na osnovu teksta zadatka šta se od vas traži da ocenite (aritmetičku
sredinu ili proporciju). Ako u tekstu zadatka piše ocenite PROSEČNU potrošnju,
PROSEČNI prihod, PROSEČNU proizvodnju itd. od vas se traži da ocenite aritmetičku
sredinu osnovnog skupa (jer aritmetička sredina predstavlja prosek nečega). Ako se
od vas u zadatku traži da ocenite UČEŠĆE ILI UDEO ILI PROCENAT nečega u nečemu
(npr. učešće domaćinstava koji imaju prihod manji od 25000 RSD), onda se od vas
traži da ocenite PROPORCIJU osnovnog skupa (jer proporcija predstavlja učešće ili
udeo nečega u nečemu).
___________________________________________________________________________

Ocenjivanje aritmetičke sredine osnovnog skupa na bazi velikog


uzorka kada je varijansa osnovnog skupa nepoznata:
Zadatak (kakav možete imati na ispitu ili na drugom domaćem):
Dati su podaci o mesečnom prihodu 30 domaćinstava u 000 RSD (zadatak sa prvih vežbi):

6 7 8 9 10 10 10 11 12 12 13 14 15 14 14 14 13 6 7 8 16 17 14 15 16 17 16 17 13 12

Uz rizik greške 0,05 i uz pomoć proste distribucije frekvencija, ocenite prosečni mesečni prihod svih
domaćinstava.

Prvo, prepoznajte na osnovu teksta zadatka da se radi o uzorku koji ima 30 elemenata (podataka).
Dakle, radi se o velikom uzorku (koristimo Z raspored). Ukoliko vam u samom zadatku nije data
veličina uzorka, izbrojite podatke kako bi utvrdili da li se radi o velikom ili malom uzorku.

Napomena*: U samom tekstu zadatka ne piše eksplicitno da se radi o uzorku. Ali, ako pročitate šta se
od vas traži (da nešto ocenite kod svih domaćinstava, a znate da sva domaćinstva koliko god ih ima
predstavljaju osnovni skup), onda postaje jasno da ovih 30 podataka predstavlja uzorak, odnosno deo
skupa.

Drugo, od vas se traži da nešto ocenite, a ne da testirate.

Treće, od vas se traži da ocenite aritmetičku sredinu (ne proporciju) jer treba da ocenite prosek
nečega (u ovom slučaju prosečni prihod).

Četvrto, pre nego što krenete sa ocenjivanjem, od vas se traži da najpre formirate prostu distribuciju
frekvencija. (ovo smo radili na prvim vežbama i neću posebno objašnjavati)

xi fi
6 2
7 2
8 2
9 1
10 3
11 1
12 3
13 3
14 5
15 2
16 3
17 3
Σ 30
Interval poverenja aritmetičke sredine osnovnog skupa na bazi velikog uzorka kada je
varijansa osnovnog skupa nepoznata izgleda ovako:
Z 1−α /2∗Sn Z ∗Sn
m− ≤ ≤ m+ 1−α /2
√ n−1 √ n−1
m je aritmetička sredina uzorka koju možemo da izračunamo na bazi datih podataka
(formula je gore).
Sn je standardna devijacija uzorka koju možemo da izračunamo na bazi datih podataka
(formula je gore).
Z1-α/2 je vrednost iz tablica koju treba da nađete na osnovu rizika greške koja je data u samom
zadatku.

n je veličina uzorka (broj podataka 30). Uvek n=∑ f i. N je veličina osnovnog skupa i ona nije
data u zadatku, a nije nam ni potrebna da bi ocenili nešto.
je nepoznata aritmetička sredina osnovnog skupa koju ocenjujemo.

m=
∑ f i∗x i = 366 =12,2
∑ f i 30
∑ f i∗x 2i −m2=
Sn=
√ ∑ fi √ 4804
30
−12,22=3,36

xi fi xi*fi xi2 fi *xi2


6 2 12 36 72
7 2 14 49 98
8 2 16 64 128
9 1 9 81 81
10 3 30 100 300
11 1 11 121 121
12 3 36 144 432
13 3 39 169 507
14 5 70 196 980
15 2 30 225 450
16 3 48 256 768
17 3 51 289 867
Σ 30 366 - 4804

α je rizik greške, u ovom slučaju iznosi 0,05 (ili 5% kada 0,05 pomnožimo sa 100 i iskažemo u
procentima). Razlika do 1 (ili 100%) iznosi 0,95 (ili 95%) i predstavlja nivo pouzdanosti,
obeležava se sa β (naziva se još i nivo verovatnoće). U zadacima vam je data α ili β. Kad znate
jednu, lako možete da odredite drugu veličinu. Vodite računa šta vam je dato u zadatku.
Z1-α/2 nalazite pomoću tablice normalnog rasporeda koju imate na kraju školske knjige (str
291).
Z1−α /2=Z 1−0,05/ 2=Z1−0,025 =Z 0,975

0,975 ili 97,5% predstavlja verovatnoću. Teorija iz knjige koja je išla pre oblasti ocenjivanja.
Vrednost od 0,975 (ili 0,9750) treba da nađete u tablici na 291. strani knjige kako bi ste
pročitali Z1−α /2. 0,9750 se nalazi u preseku 22. reda i 8. kolone u tablici (zbog veće
preglednosti u tablici su sve vrednosti date bez nule i zareza, odnosno date su samo četiri
decimale koje idu posle nule). Sada se vratite na prvu kolonu. Pronađite u prvoj koloni 22 red
i pročitajte iznos (1,9). Dalje, vratite se na prvi red. U prvom redu pronađite osmu kolonu i
pročitajte iznos (0,06). Sada možete da kompletirate Z1−α /2. To je 1,96. Šesticu koju smo našli
u drugom koraku (0,06) smo upisali kao drugu decimalu na broj 1,9 koji smo pronašli u
prvom koraku.
Tek sada možemo da kompletiramo interval poverenja za ocenu aritmetičke sredine:
Z 1−α /2∗Sn Z ∗Sn
m− ≤ ≤ m+ 1−α /2
√ n−1 √ n−1
1,96∗3,36 1,96∗3,36
12,2− ≤ ≤12,2+
√ 30−1 √30−1
12,2−1,96∗0,62 ≤≤ 12,2+1,96∗0,62
12,2−1,22 ≤≤ 12,2+1,22
10,98 ≤≤ 13,42
Komentar/ekonomsko tumačenje: Na nivou pouzdanosti od 95% tvrdimo da se prosečni
mesečni prihod svih domaćinstava kreće u intervalu od 10,98 do 13,42 odnosno od 10980
RSD do 13420 RSD.
___________________________________________________________________________

Ocenjivanje aritmetičke sredine osnovnog skupa na bazi malog


uzorka kada je varijansa osnovnog skupa nepoznata:

Dati su podaci o mesečnom prihodu 26 domaćinstava u 000 RSD:

6 7 8 9 10 10 11 12 12 13 15 14 14 14 13 6 8 17 14 15 16 17 16 17 13 12

Uz rizik greške 0,05 i uz pomoć proste distribucije frekvencija, ocenite prosečni mesečni prihod svih
domaćinstava.

Interval poverenja aritmetičke sredine osnovnog skupa na bazi malog uzorka kada je
varijansa osnovnog skupa nepoznata izgleda ovako:
t n−1; α /2∗Sn t ∗Sn
m− ≤≤ m+ n−1 ;α / 2
√n−1 √ n−1
Najpre, prepoznajte na osnovu teksta i broja podataka da se radi o malom uzorku koji ima 26
elemenata (podataka). Namerno su izbačena 4 podatka iz prethodnog zadatka kako bi se radilo o
malom uzorku. U ovom slučaju koristimo studentov t raspored. Sve napomene koje su važile u
prethodnom zadatku, važe i ovde.

Potrebno je da prvo izračunamo aritmetičku sredinu i standardnu devijaciju uzorka (slično


prethodnom zadatku)

xi fi xi*fi xi2 fi *xi2


6 2 12 36 72
7 1 7 49 49
8 2 16 64 128
9 1 9 81 81
10 2 20 100 200
11 1 11 121 121
12 3 36 144 432
13 3 39 169 507
14 4 56 196 784
15 2 30 225 450
16 2 32 256 512
17 3 51 289 867
Σ 26 319 - 4203

m=
∑ f i∗x i = 319 =12,27
∑ f i 26
∑ f i∗x 2i −m2=
Sn=
√ ∑ fi √ 4203
26
−12,272=3,33

t n−1; α / 2 pronalazite u tablicama t rasporeda (školska knjiga, str. 298)

n-1 je broj stepeni slobode kod t rasporeda, samo n je broj podataka u uzorku. 26 – 1 = 25
stepeni slobode u našem slučaju. α je rizik greške i data je u zadatku 0,05; odnosno α/2
iznosi 0,025.
Broj stepeni slobode se nalazi u prvoj koloni tablice t rasporeda na str. 298 (pronađite red u
prvoj koloni u kome piše 25). U prvom redu tablice se nalazi rizik greške (nama treba četvrta
kolona u prvom redu jer koristimo 0,025). t n−1; α / 2 , odnosno t 25; 0,025 pronalazite direktno u
tablici kao presek broja stepeni slobode (25) i rizika greške (0,025) i iznosi u ovom slučaju
2,0595.
2,0595∗3,33 2,0595∗3,33
12,27− ≤ ≤12,27 +
√ 26−1 √ 26−1
10,89 ≤≤ 13,64
Komentar/ekonomsko tumačenje: Na nivou pouzdanosti od 95% tvrdimo da se prosečni
mesečni prihod svih domaćinstava kreće u intervalu od 10,89 do 13,64 odnosno od 10890
RSD do 13640 RSD.
___________________________________________________________________________
Ocenjivanje proporcije osnovnog skupa na bazi uzorka:
Zadatak:
U preduzeću sa 220 zaposlenih praćena je produktivnost rada za 30 zaposlenih. Oni su za
jedan čas proizveli sledeći broj košulja:
9 10 12 11 13 28 15 11 19 29 33 25 22 29 26 28
35 36 40 39 34 33 17 16 30 37 32 28 26 24
Na nivou pouzdanosti od 95% oceni učešće zaposlenih čija je produktivnost veća od 29.
Primetite sledeće:
Raspolažete podatkom o veličini osnovnog skupa (u tekstu zadatka je rečeno da preduzeće
ima 220 zaposlenih radnika – to je osnovni skup). Takođe, raspolažete podatkom o veličini
uzorka (jer je praćena produktivnost rada za 30 od 220 zaposlenih radnika). 30 je veličina
uzorka.
Od vas se traži da nešto ocenite.
Od vas se traži da ocenite učešće nečega (u ovom slučaju zaposlenih koji imaju produktivnost
veću od 29) u nečemu (u ukupnom broju zaposlenih). Dakle, radi se o ocenjivanju proporcije,
ne o ocenjivanju aritmetičke sredine.
Dalje, veličina uzorka je 30 (radi se o velikom uzorku), što znači da koristimo Z raspored.
U zadatku je dat nivo pouzdanosti 95% (ili 0,95 i obeležavamo ga sa β). Vama treba rizik
greške (α) kako bi ste pronašli tabličnu vrednost Z rasporeda. Znamo da α+β=1 (ili 100%).
Odavde sledi da α=0,05 (ili 5%).
Podaci koji su vam dati u zadatku su nesređeni (negrupisani) i od vas se ne traži da sredite
ove podatke (da napravite prostu ili intervalnu distribuciju frekvencija).
Interval poverenja proporcije osnovnog skupa na bazi velikog uzorka izgleda ovako:

p∗( 1− p ) p∗(1−p )
p−Z
1−
α
2 √

n 1−√
≤ P ≤ p+ Z α ∗
2 n

p je proporcija uzorka. Izračunavamo je na osnovu podataka datih u uzorku i na osnovu


teksta zadatka. P je nepoznata proporcija osnovnog skupa koju treba da ocenimo
intervalnom ocenom. n je veličina uzorka (30). Z1− α je tablična vrednost. Pronalazimo je na
2
isti način kao i kod ocenjivanja aritmetičke sredine (objašnjenje je dato u prvom zadatku).
broj podataka kojiispunjavaju kriterijum postavljen utekstu zadatka
p=
n
broj podataka kojiispunjavaju kriterijum postavljen utekstu zadatka = u ovom slučaju to su
radnici čija je produktivnost veća od 29, odnosno koji su za jedan čas proizveli više od 29
košulja (jer tako glasi tekst vašeg zadatka). Koliko ima takvih radnika? Pa prebrojite ih (to su
radnici koji su proizveli 33 košulja, zatim 35, 36, 40, 39, 34, 33, 30, 37, 32; dakle takvih
radnika ima 10 od 30 koliko ima radnika u uzorku). Odavde sledi da:
10
p= =0,33 je proporcija uzorka
30

0,33∗( 1−0,33 ) 0,33∗( 1−0,33 )


0,33−1,96∗
√ 30
≤ P ≤0,33+1,96∗

30

0,33∗0,67 0,33∗0,67
0,33−1,96∗
√ 30
≤ P≤ 0,33+1,96∗
30 √
0,33−1,96∗ √0,0074 ≤ P ≤0,33+ 1,96∗ √0,0074
0,33−1,96∗0,086≤ P ≤ 0,33+ 1,96∗0,086
0,33−0,17 ≤ P ≤ 0,33+0,17
0,16 ≤ P≤ 0,5
Komentar/ekonomsko tumačenje: Na nivou pouzdanosti od 95% tvrdimo da se učešće
radnika čija je produktivnost veća od 29 u ukupnom broju radnika nalazi u intervalu od 0,16
do 0,5 (odnosno kreće se u rasponu od 16% do 50%).
_____________________________________________________________________________________________________

Da smo u prethodnom zadatku raspolagali uzorkom koja ima manje od 30 elemenata


(recimo 22 elementa), koristili bi interval poverenja proporcije osnovnog skupa na bazi
malog uzorka koji izgleda ovako:

p∗( 1− p ) p∗( 1− p )

p−t n−1 ;α /2∗
n √
≤ P ≤ p+ t n−1 ;α /2∗
n
Jedina razlika je u rasporedu koji bi smo koristili. Kod malog uzorka koristimo t raspored, pa
bi u jednačini za interval poverenja umesto Z α trebali da nađemo tabličnu vrednost za
1−
2
t n−1; α / 2 (što je objašnjeno na primeru drugog zadatka). Preostali postupak bi bio isti.

___________________________________________________________________________
Zadaci za samostalnu vežbu (ne treba da mi ih šaljete na mejl, oni su urađeni postupno u
školskoj zbirci, predlažem da probate sami da ih rešite pa da vaše rešenje upredite sa onim u
zbirci:
BILO KOJI ZADATAK U ŠKOLSKOJ ZBIRCI NA STR. 37-44. Imate različite varijante i
provežbajte ih sve. Neki zadaci su vezani za ocenjivanje aritmetičke sredine, drugi za
ocenjivanje proporcije. Neki koriste Z raspored, drugi koriste t raspored. Neki se oslanjaju na
prostu distribuciju frekvencija, neki na intervalnu, a neki koriste nesređene podatke. Bilo koji
od ovih zadataka možete imati na ispitu ili drugom domaćem zadatku (isti tekst zadatka,
samo druge brojke). Srećno vežbanje.

You might also like