You are on page 1of 112

Intervali povjerenja

STATISTIKA

Prirodoslovno-matematicki fakultet

doc.dr.sc. Nikola Koceic Bilan

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 1 / 50


Metoda uzoraka
Neka je S populacija i X : S ! O = fo1 , ..., ok g R numericka varijabla
koja svakom clanu si populacije (statistickog skupa) S = fs1 , s2 , ..., sN g
pridruzuje neko numericko obiljezje X (si ). Primijetimo da X mozemo
promatrati kao slucajnu varijablu X : ! O, pri cemu je prostor
elementarnih dogaaja = f 1 , ..., k g gdje je i dogaaj da neki clan
populacije ima obiljezje oi 2 O, tj. X ( i ) = oi , s vjerojatnocu p ( i )
jednakoj relatinoj frekvenciji pi = Nfi obiljezja oi . Ako je populacija
beskonacna, onda je prikladnije govoriti o slucajnoj varijabli, buduci da
pojam relativne frekvencije obiljezja u tom slucaju nema smisla vec pojam
vjerojatnosti da varijabla poprimi to obiljezje. Tada nam je, u statistickom
istrazivanju, za izracun parametara ove varijable: ocekivanja slucajne
varijable (isto to i aritmeticka sredina numericke varijable), varijance
2 , koji brojcano iskazuju osobitost populacije, ili za izracun proporcije p
(relativne frekvencije ili vjerojatnosti) pojedinog obiljezja, potrebno imati
sve vrijednosti varijable X , odnosno treba biti dostupno numericko
obiljezje svakog clana populacije, tj. treba biti dostupna vjerojatnost
(relativna frekvencija) svakog obiljezja.
STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 2 / 50
Ako je varijabla X nenumericka, tj. svakom clanu populacije se pridruzuje
neko nenumericko obiljezje, tada se pripadna slucajna varijabla dobije
kodiranjem. Primjerice dogaaju i da neki clan populacije ima obiljezje
oi slucajna varijabla X pridruzi broj i. Tako nenumericku varijablu koja
biljezi ishod svakog moguceg bacanja novcica mozemo promatrati kao
slucajnu varijablu koja svakom dogaaju "palo je pismo" pridruzi broj 0 a
dogaaju "pala je glava" pridruzi 1, ili varijablu koja svakom ispitaniku iz
populacije pridruzuje odgovor na postavljeno pitanje "DA" ili "NE"
mozemo promatrati kao slucajnu varijablu koja dogaaju "ispitanik je
odgovorio DA" pridruzuje broj 1, odnosno "ispitanik je odgovorio NE"
pridruzi 0. U tom slucaju vjerojatnost da slucajna varijabla poprimi
vrijednost 1 (O) je jednaka proporciji obiljezja "DA" ("NE"). Takoer, i
ovom slucaju, u statistickom istrazivanju, za izracun proporcije (relativne
frekvencije) ili vjerojatnosti pojedinog obiljezja potrebno je imati sve
vrijednosti varijable X , odnosno treba biti dostupno numericko obiljezje
svakog clana populacije, tj. treba biti dostupna vjerojatnost (relativna
frekvencija) svakog obiljezja.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 3 / 50



Cesto puta je nemoguce prikupiti sve podatke, odnosno obiljezja svakog
elementa populacije zbog raznih razloga: zbog prevelikog ili beskonacnog
opsega populacije (N), slozenosti istrazivanja, previsokih nancijskih
trokova takvog istrazivanja, nadalje ako se istrazivanjem uniatavaju
elementi populacije (ispitivanje biometrijskih karakteristika ljudi, testiranje
tehnickih proizvoda, kemijska analiza prehrambenih konzervi, stavovi ljudi
neke regije o najvecim politickim strankama, njihovim liderima,
programima i do sada ostvarenim, a obecanim ciljevima...).
Tada se moramo zadovoljiti dijelom podataka, odnosno vrijednostima
varijable na uzorku (podskupu S0 populacije S). U tom slucaju zelimo
donijeti to kvalitetniji zakljucak o cijeloj populaciji temeljem podataka na
uzorku. Naravno, svaki takav zakljucak, osim ako uzorak nije jednak
citavoj populaciji, sadrzi greku, pa zakljucke mozemo donijeti s nekom
razinom pouzdanosti (vjerojatnosti da je zakljucak o osobitosti cijele
populacije tocan). S ciljem dobivanja to reprezentativnijih,
vjerodostojnijih zakljucaka o cijeloj populaciji moramo se pobrinuti da
prikupljeni podaci budu na reprezentativnom uzorku.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 4 / 50


Najreprezentativniji uzorak je slucajni uzorak koji se formira na nacin da
svaki element populacije ima jednaku vjerojatnost da bude izabran u
uzorak. Najbolji nacin sastavljanja slucajnog uzorka, a da pri tom
eliminiramo nesvjesno psiholoko-prakticno preferiranje pojedinih
elemenata, jest da se elementi numeriraju i onda nasumce, racunalnim
programom, biraju brojevi. Naravno, postoji mogucnost i da slucajni
uzorak ne bude reprezentativan, tj. da bude pristran, na to uastalom
upucuje i cinjenica da svaki zakljucak temeljen na uzorku ima odreenu
razinu (ne)pouzdanosti.
Jednako reprezentativan je i sistemski uzorak u kojem se odabere
nasumce pri clan uzorka iz numerirane populacije, a nakon njega u uzorak
ulazi svaki n-ti clan populacije.
Straticirani uzorak je u mnogim slucajevima reprezentativniji nego li
slucajni uzorak. Kod njegovog formiranja se populacija prvo podijeli,
prema nekim karakteristikama, u slojeve (stratume), a potom se iz svakog
sloja uzima slucajni uzorak tako da njegova velicina u odnosu na velicinu
cijelog uzorka bude proprcionalna velicini sloja u odnosu na velicinu cijele
populacije.
STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 5 / 50
Klaster uzorak je loija varijanta slucajnog uzorka, a koristi se u velikim
ekonomskim, politickim ili trzinim istrazivanjima. Formira se na nacin da
se cijela populacija podijeli u vie manjih blokova (primjerice grad se
podijeli na vie kvartova ili podkvartova), pa se nasumce odabere jedan od
tih blokova koji onda predstavlja klaster uzorak. Ovaj uzorak je praktican
jer su anketari koncentrirani na jednom podrucju.
Kvotni uzorak se formira na nacin da organizator istrazivanja,
poznavajuci strukturu stanovnitva obzirom na predmet istrazivanja,
unaprijed odredi broj ljudi iz svakog pojedinog stratuma, a anketar sam
odabire te ljude dok ne ispuni kvotu. Ovakav uzorak cesto nije
reprezentativan, jer anketar sam, hodajuci gradom ili jednom ulicom, po
svojim anitetima i atrakcijama, odabire ispitanike.
Prigodni uzorak je uzorak koji nam je jedini dostupan i moze biti
ekstremno pristran.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 6 / 50


Procjenitelj parametra

Na svakom uzorku parametar izracunat pomocu vrijednosti obiljezja


clanova uzorka nazivamo procjeniteljem tog istoga parametra
izracunatog na cijeloj populaciji. Procjenitelj mozemo promatrati kao
varijablu koja svakom uzorku fsi1 , si2 , ..., sin g velicine n < N
(podskupu bilo konacne populacije S = fs1 , s2 , ..., sN g bilo beskonacne)
pridruzuje parametar (si1 , si2 , ..., sin ) . Oznacimo li sa Pn skup svih
uzoraka velicine n, tj. svih n-clanih podskupova od S, onda je procjenitelj
varijabla : Pn ! R. Svaki procjenitelj mozemo tretirati kao slucajnu
varijablu (na gore opisan nacin) koja dogaaju da n-uzorak ima parametar
pridruzi upravo taj broj. Sampling distribucija je distribucija te slucajne
varijable. Primjerice x je procjenitelj aritmeticke sredine koji svakom
uzorku fsi1 , si2 , ..., sin g velicine n pridruzuje njegovu aritmeticku sredinu
s +s + +s in
x (fsi1 , si2 , ..., sin g) = i1 i2 n .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 7 / 50


Ako je populacija konacna ili prebrojiva (najceci slucaj kod drutvenih
istrazivanja) onda uzoraka ksne velicine ima konacno ili prebrojivo pa je
procjenitelj diskretna slucajna varijabla. U slucaju kada je populacija
neprebrojiva onda i uzoraka ima neprebrojivo a procjenitelj je neprekidna
slucajna varijabla. To mozemo prepoznati kod ispitivanja nekih
kontinuiranih procesa, primjerice mjerenje temperature zraka u jednom
danu, gdje temperatura poprima vrijednost u svakom dijelicu vremena a mi
raspolazemo s podacima na uzorku koji se sastoji od n mjerenja. Strogo
govoreci elementi uzorka su ovdje mali intervali vremena.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 8 / 50


Primjer
Neka populacija S = fA, B, C , D g ima sljedeca obiljezja
s A B C D
. Skup uzoraka velicine 2 je
X (s ) 1 5 3 7
P2 = ffA, B g , fA, C g , fA, D g , fB, C g , fB, D g , fC , D gg. Vrijednosti
procjenitelja x : P2 ! R su
uzorak u A, B A, C A, D B, C B, D C , D
.
x (u ) 3 2 4 4 6 5
Sampling distribucija diskretne slucajne varijable x je zadana vrijednostima
(xi , pi ), gdje je xi vrijednost arit. sredine, a pi vjerojatnost (relativna
frekvencija) da 2-uzorak ima arit. sredinu jednaku xi .
xi 3 2 4 6 5
p (xi ) 16 16 26 16 16
Ocekivanje slucajne varijable x jednako je
E [x ] = 3 16 + 2 61 + 4 26 + 6 16 + 5 16 = 4, to je jednako aritmetickoj sredini
cijele populacije = 1 +5 +4 3 +7 = 4.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 9 / 50


Denicija
Kazemo da je procjenitelj parametra nepristran ako je ocekivanje
slucajne varijable jednako parametru cijele populacije, tj. E = .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 10 / 50


Denicija
Kazemo da je procjenitelj parametra nepristran ako je ocekivanje
slucajne varijable jednako parametru cijele populacije, tj. E = .

Teorem
Varijabla x koja svakom n-uzorku pridruzuje njegovu aritmeticku sredinu je
nepristran procjenitelj aritmeticke sredine (ili ocekivanja) populacije, tj.
vrijedi E [x ] = .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 10 / 50


Neka na konacnoj populaciji S = fs1 , s2 , ..., sN g M elemenata ima
isto obiljezje o, tada je proporcija (relativna frekvencija) toga obiljezja
jednaka p = M N . U slucaju beskonacne populacije oznacimo jednako
sa p vjerojatnost dogaaja da element ima obiljezje o. Oznacimo sa p
procjenitelja proporcije koji svakom uzorku fsi1 , si2 , ..., sin g velicine n
pridruzuje proporciju obiljezja o tj. p (fsi1 , si2 , ..., sin g) = mn , gdje je m
broj elemenata uzorka koji imaju obiljezje o.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 11 / 50


Neka na konacnoj populaciji S = fs1 , s2 , ..., sN g M elemenata ima
isto obiljezje o, tada je proporcija (relativna frekvencija) toga obiljezja
jednaka p = M N . U slucaju beskonacne populacije oznacimo jednako
sa p vjerojatnost dogaaja da element ima obiljezje o. Oznacimo sa p
procjenitelja proporcije koji svakom uzorku fsi1 , si2 , ..., sin g velicine n
pridruzuje proporciju obiljezja o tj. p (fsi1 , si2 , ..., sin g) = mn , gdje je m
broj elemenata uzorka koji imaju obiljezje o.
Teorem
Varijabla p : Pn ! R je nepristrani procjenitelj proporcije (vjerojatnosti) p
nekog obiljezja na cijeloj populaciji, tj E [p ] = p.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 11 / 50


Primjer
Populacija se sastoji od 5 glasaca koji odgovaraju na referendumsko
pitanje sa DA (=1) ili NE (=0). Rezultati glasovanja su
glasac A B C D E
. Proporcija odgovora DA je
odgovor DA NE NE DA NE
p=M 2
N = 5 = 0.4. Svih uzoraka velicine 2 ima 10, a proporcije uzoraka su
Glasaci u uzorku odgovori mi pi = mni
A,B 1,0 1 0.5
A,C 1,0 1 0.5
A,D 1,1 2 1
A,E 1,0 1 0.5
B,C 0,0 0 0 .
B,D 0,1 1 0.5
B,E 0,0 0 0
C,D 0,1 1 0.5
C,E 0,0 0 0
D,E 1,0 1 0.5

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 12 / 50


Primjer (Nastavak)
Sampling distribucija varijable p je
pi 0 0.5 1
3 6 1 .
p (pi ) 10 10 10
Ocekivanje od p je E [p ] = 0.3 0 + 0.6 0.5 + 0.1 1 = 0.4 to je jednako
proporciji p odgovora DA na cijeloj populaciji.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 13 / 50


Oznacimo sa 2 procjenitelja varijance 2 koji uzorku fsi1 , si2 , ..., sin g
velicine n uzetom iz konacne populacije velicine N pridruzuje broj
2 (fsi1 , si2 , ..., sin g) = s 2 n n 1 NN 1 , gdje je s 2 varijanca uzorka. Ako je
populacija beskonacna onda procjenitelja varijance deniramo sa
2
(si x ) + +(sin x )2
2 (fsi1 , si2 , ..., sin g) = s 2 n n 1 . U tom slucaju je 2 = 1 n 1 ,
gdje je x arit. sred. uzorka.
Teorem
Varijabla 2 : Pn ! R je nepristrani procjenitelj varijance 2 cijele
populacije, tj E 2 = 2 .
N 1
U praksi se najcece zanemaruje faktor N za dovoljno velike populacije,
jer vrijedi lim NN 1 = 1.
N !

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 14 / 50


Sampling distribucije procjenitelja
Procjenjuje li se parametar samo brojem, nije moguce donijeti sud o
preciznosti procjene niti o razini pouzdanosti kojom mozemo upotrijebiti tu
procjenu. Zato su nam potrebne informacije o sampling distribucijama
procjenitelja.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 15 / 50


Ako slucajni uzorak potjece iz normalno distribuirane populacije
N (, ) onda je sampling distribucija aritmetickih sredina x takoer
normalno distribuirana i to sa ocekivanjem x = i standardnom
devijacijom (jo se kaze standardna greka sredine) x .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 16 / 50


Ako slucajni uzorak potjece iz normalno distribuirane populacije
N (, ) onda je sampling distribucija aritmetickih sredina x takoer
normalno distribuirana i to sa ocekivanjem x = i standardnom
devijacijom (jo se kaze standardna greka sredine) x .
Ako je slucajni uzorak izabran iz proizvoljno distribuirane populacije
onda je, u slucaju da je uzorak dovoljno velik, to se kaze za uzorke
cija je velicina n > 30, onda je sampling distribucija aritmetickih
sredina priblizno normalno distribuirana s ocekivanjem x = i
standardnom devijacijom x . Ovo je posljedica Centralnog granicnog
teorema koji tvrdi da sampling distribucije teze ka normalnoj
distribuciji N (, x ) kad velicina uzorka n tezi u beskonacno.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 16 / 50


Ako slucajni uzorak potjece iz normalno distribuirane populacije
N (, ) onda je sampling distribucija aritmetickih sredina x takoer
normalno distribuirana i to sa ocekivanjem x = i standardnom
devijacijom (jo se kaze standardna greka sredine) x .
Ako je slucajni uzorak izabran iz proizvoljno distribuirane populacije
onda je, u slucaju da je uzorak dovoljno velik, to se kaze za uzorke
cija je velicina n > 30, onda je sampling distribucija aritmetickih
sredina priblizno normalno distribuirana s ocekivanjem x = i
standardnom devijacijom x . Ovo je posljedica Centralnog granicnog
teorema koji tvrdi da sampling distribucije teze ka normalnoj
distribuciji N (, x ) kad velicina uzorka n tezi u beskonacno.
q
Standardna devijacija procjenitelja x je jednaka x = pn N n
N 1 , ako
je populacija konacna velicine N, odnosno x = pn ako je poulacija
q
beskonacna. U praksi se faktor N n
N 1 izostavlja i za konacne
populacije ako je Nn < 0.05 (populacije cija je velicina puno veca od
velicine uzorka).

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 16 / 50


Primjer
s A B C D
Populaciji S = fA, B, C , D g s obiljezjima
X (s ) 1 5 3 7
vrijednost sredina 2-uzoraka procjenitelja su
uzorak u A, B A, C A, D B, C B, D C , D
, a sampling
x (u ) 3 2 4 4 6 5
distribucija je dana sa
xi 3 2 4 6 5
.
p (xi ) 16 16 26 16 16
Aritmeticka sredina (ocekivanje) varijable X na cijeloj populaciji jednaka je
=q 4. Standardna devijacija varijable X je
(1 4 )2 +(5 4 )2 +(3 4 )2 +(7 4 )2 p
= 4 = 5.
Ocekivanje
q varijable x je E [x ] = 4, a standardna devijacija je
q
(3 4 )2 +(2 4 )2 +2 (4 4 )2 +(6 4 )2 +(5 4 )2
x = 6 = 53 to je jednako
q p q
p N n p5 4 2
n N 1 = 2 4 1.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 17 / 50


Sampling distribucija proporcija p uzoraka velicine n uzetih iz konacnog
skupa velicine N je hipergeometrijska s ocekivanjem jednakim
q stvarnoj
Np (1 p ) n
proporciji p i standardnom devijacijom jednakoj p = n N 1 .
Ako je populacija beskonacna onda je binomna
q s ocekivanjem p i
p (1 p )
standardnom devijacijom jednakoj p = n . U praksi se faktor
q
N n n
N 1 izostavlja i za konacne populacije ako je N < 0.05. Ako je uzorak
dovoljno velik tj. ako je np > 5 i n (1 p ) > 5 onda jequ oba slucaja
p (1 p )
sampling distribucija priblizno normalna N (p, p ), p = n .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 18 / 50


Sampling distribucija vrijanci 2 , ako slucajni uzorak velicine n potjece iz
normalno distribuirane populacije, ima oblik 2 -distribucije. Preciznije,
(n 1 )2
varijabla 2 ima 2 -distribuciju s n 1 stupnjeva slobode.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 19 / 50


Intervali povjerenja

Kvalitetnija procjena parametra populacije nego li je to tockasta


procjena (procjenitelj ) je intervalna procjena koja se sastoji u
odreivanju intervala ha, b i za kojeg mozemo tvrditi s vjerojatnocu 1
da sadrzi parametar , tj. p ( 2 ha, b i) = 1 , tako da granice a i b
ovise o vrijednostima na uzorku. Vjerojatnost 1 nazivamo razinom
pouzdanosti procjene koji se obicno izrazava postotkom (1 ) 100% i
uzima 90%, 95%, 99%. irinu intervala nazivamo preciznocu procjene, a
sam interval intervalom povjerenja.
Razina pouzdanosti i preciznost procjene su obrnuto proporcionalni. Uzi
interval, odnosno veca preciznost se moze postici uz smanjenje
pouzdanosti, odnosno, veca pouzdanost rezultira smanjenjem preciznosti,
odnosno irim intervalom.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 20 / 50


Procjena aritmeticke sredine

Neka je uzorak uzet iz proizvoljno distribuirane populacije,


nepoznatog ocekivanja , dovoljno velik (n > 30), tada je sampling
distribucija aritmetickih sredina x normalna N (, x ). Tada, se u
intervalu z/2 x , + z/2 x nalazi (1 ) 100% aritmetickih
sredina uzoraka, odnosno vjerojatnost da aritmeticka sredina x nekog
uzorka bude u ovom intervalu je 1 . Broj z/2 je vrijednost
standardizirane normalne varijable Z koja ima svojstvo
p Z > z/2 = /2.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 21 / 50


Procjena aritmeticke sredine

Neka je uzorak uzet iz proizvoljno distribuirane populacije,


nepoznatog ocekivanja , dovoljno velik (n > 30), tada je sampling
distribucija aritmetickih sredina x normalna N (, x ). Tada, se u
intervalu z/2 x , + z/2 x nalazi (1 ) 100% aritmetickih
sredina uzoraka, odnosno vjerojatnost da aritmeticka sredina x nekog
uzorka bude u ovom intervalu je 1 . Broj z/2 je vrijednost
standardizirane normalne varijable Z koja ima svojstvo
p Z > z/2 = /2.
No, to znaci da je vjerojatnost da aritmeticka sredina populacije
bude u intervalu x z/2 x , x + z/2 x takoer 1 .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 21 / 50


Procjena aritmeticke sredine

Neka je uzorak uzet iz proizvoljno distribuirane populacije,


nepoznatog ocekivanja , dovoljno velik (n > 30), tada je sampling
distribucija aritmetickih sredina x normalna N (, x ). Tada, se u
intervalu z/2 x , + z/2 x nalazi (1 ) 100% aritmetickih
sredina uzoraka, odnosno vjerojatnost da aritmeticka sredina x nekog
uzorka bude u ovom intervalu je 1 . Broj z/2 je vrijednost
standardizirane normalne varijable Z koja ima svojstvo
p Z > z/2 = /2.
No, to znaci da je vjerojatnost da aritmeticka sredina populacije
bude u intervalu x z/2 x , x + z/2 x takoer 1 .
Interval x z/2 x , x + z/2 x
nazivamo intervalom povjerenja aritmeticke sredine za velike
uzorke s razinom pouzdanosti 1 .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 21 / 50


Interval interpretiramo na nacin da se s vjerojatnocu 1 ocekuje
da nepoznata aritmeticka sredina populacije bude veca od donje a
manja od gornje granice intervala.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 22 / 50


Interval interpretiramo na nacin da se s vjerojatnocu 1 ocekuje
da nepoznata aritmeticka sredina populacije bude veca od donje a
manja od gornje granice intervala.
Buduci x u slucaju i konacne i beskonacne populacije ovisi o st. dev.
populacije koja je najcece nepoznata to
q je u formuli smijemoq
zamijeniti s njezinim procjeniteljom = s 2 n n 1 NN 1 ili = s2 n n 1
izracunatim na uzorku, ako je uzorak velik.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 22 / 50


Interval interpretiramo na nacin da se s vjerojatnocu 1 ocekuje
da nepoznata aritmeticka sredina populacije bude veca od donje a
manja od gornje granice intervala.
Buduci x u slucaju i konacne i beskonacne populacije ovisi o st. dev.
populacije koja je najcece nepoznata to
q je u formuli smijemoq
zamijeniti s njezinim procjeniteljom = s 2 n n 1 NN 1 ili = s2 n n 1
izracunatim na uzorku, ako je uzorak velik.
Ovaj interval mozemo primijenjivati i na male uzorke (n 30) ako je
populacija iz koje je uzorak uzet normalna i ako joj je poznata st.
devijacija .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 22 / 50


Primjer
Ako su vrijednosti populacije 6 s frekvencijom 50, 10 s frekvencijom 20 i
30 s frekvencijom 10, onda jeparitmeticka sredina populacije = 10 a
standardna devijacija je = 60. Standardna
q devijacija
p q
aritmetickih
sredina x uzoraka velicine 31 je x = pn N n p60 49
N 1 = 31 79 1.095. Ako
iz populacije odaberemo uzorak velicine 31 koji se sastoji od elemenata
populacije koji imaju obiljezje 6, onda je aritmeticka sredina uzorka x = 6
a odgovarajuci interval povjerenja s razinom pouzdanosti 90% je
x z/2 x , x + z/2 x . Buduci je 1 = 0.9, to je /2 = 0.05 i
z0.05 = 1.645, pa je interval jednak
h6 1.645 1.095, 6 + 1.645 1.095i = h4.1987, 7.8013i. Ocito je da
= 10 ne pripada ovom intervalu. Za ovakav uzorak niti povecanje razine
pouzdanosti na 99% ne bi dalo zadovaljavajuci interval. Naime u tom
slucaju je /2 = 0.005 i z0.005 = 2.58, pa interval ocekivanja
h6 2.58 1.095, 6 + 2.58 1.095i = h3.1749, 8.825 1i takoer ne sadrzi .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 23 / 50


Primjer (Nastavak)
No, uzmemo li primjerice uzorak koji se sastoji od 29 elemenata s
obiljezjem 6 i 2 s vrijednocu 30 onda je aritmeticka sredina uzorka
x = 7.54 a pripadni interval ocekivanja s 99% razine pouzdanosti je
h7.54 2.58 1.095, 7.54 + 2.58 1.095i = h4.714 9, 10.365i i daje
reprezentativnu informaciju o aritmetickoj sredini. Prvi uzorak spada meu
1% uzoraka za koje interval povjerenja razine pouzdanosti 99% nece
sadrzavati .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 24 / 50


Zadatak
U slucajnom uzorku od 64 naloga izdana na terminalu neke banke
zabiljezeni su podaci o vremenu potrebnom za obradu tih naloga.
Prosjecno vrijeme toga uzorka je x = 9.70906 minuta, a standardna
devijacija uzorka je s = 3.04569. Odredite granice u kojima se moze
ocekivati prosjecno trajanje obrade naloga komitenata te banke?
Razina pouzdanosti procjene neka je 95%.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 25 / 50


Zadatak
U slucajnom uzorku od 64 naloga izdana na terminalu neke banke
zabiljezeni su podaci o vremenu potrebnom za obradu tih naloga.
Prosjecno vrijeme toga uzorka je x = 9.70906 minuta, a standardna
devijacija uzorka je s = 3.04569. Odredite granice u kojima se moze
ocekivati prosjecno trajanje obrade naloga komitenata te banke?
Razina pouzdanosti procjene neka je 95%.
Buduci je n = 64 > 30 u pitanju je veliki uzorak. Buduci je N
nepoznat, a mozemo pretpostaviti da je dovoljno velik tj. da uzorak
cini manje od 5% svih naloga, to uzimamo x = pn (izostavljamo
q
faktor N n
N 1 ). No, buduci je st.dev. populacije nepoznata smijemo
q q
umjesto uzeti procjenitelja = s n n 1 = 3.04569 64
63 = 3.06977
q
(izostavljamo faktor NN 1 ).

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 25 / 50


Zadatak
U slucajnom uzorku od 64 naloga izdana na terminalu neke banke
zabiljezeni su podaci o vremenu potrebnom za obradu tih naloga.
Prosjecno vrijeme toga uzorka je x = 9.70906 minuta, a standardna
devijacija uzorka je s = 3.04569. Odredite granice u kojima se moze
ocekivati prosjecno trajanje obrade naloga komitenata te banke?
Razina pouzdanosti procjene neka je 95%.
Buduci je n = 64 > 30 u pitanju je veliki uzorak. Buduci je N
nepoznat, a mozemo pretpostaviti da je dovoljno velik tj. da uzorak
cini manje od 5% svih naloga, to uzimamo x = pn (izostavljamo
q
faktor N n
N 1 ). No, buduci je st.dev. populacije nepoznata smijemo
q q
umjesto uzeti procjenitelja = s n n 1 = 3.04569 64
63 = 3.06977
q
(izostavljamo faktor NN 1 ).
1 = 0.95 ) /2 = 0.025 ) z0.025 = 1.96

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 25 / 50


Zadatak
U slucajnom uzorku od 64 naloga izdana na terminalu neke banke
zabiljezeni su podaci o vremenu potrebnom za obradu tih naloga.
Prosjecno vrijeme toga uzorka je x = 9.70906 minuta, a standardna
devijacija uzorka je s = 3.04569. Odredite granice u kojima se moze
ocekivati prosjecno trajanje obrade naloga komitenata te banke?
Razina pouzdanosti procjene neka je 95%.
Buduci je n = 64 > 30 u pitanju je veliki uzorak. Buduci je N
nepoznat, a mozemo pretpostaviti da je dovoljno velik tj. da uzorak
cini manje od 5% svih naloga, to uzimamo x = pn (izostavljamo
q
faktor N n
N 1 ). No, buduci je st.dev. populacije nepoznata smijemo
q q
umjesto uzeti procjenitelja = s n n 1 = 3.04569 64
63 = 3.06977
q
(izostavljamo faktor NN 1 ).
1 = 0.95 ) /2 = 0.025 ) z0.025 = 1.96
3.06977
Granice trazenog intervala su 9.70906 1.96 p
64
, pa je interval
h8.957, 10.461i .
STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 25 / 50
Ako je slucajni uzorak mali (n 30) i ako je izabran iz populacije
cija distribucija je normalna, ali sa nepoznatim parametrima ( i )
onda interval x t/2 x , x + t/2 x sadrzi s vjerojatnocu
1 . Broj t/2 je vrijednost t-distribuirane varijable s n 1
stupnjeva slobode koja ima svojstvo p t > t/2 = /2. Buduci da
je nepoznat to u formuli za x umjesto uvrtavamo procjenitelja
izracunatog na uzorku.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 26 / 50


Ako je slucajni uzorak mali (n 30) i ako je izabran iz populacije
cija distribucija je normalna, ali sa nepoznatim parametrima ( i )
onda interval x t/2 x , x + t/2 x sadrzi s vjerojatnocu
1 . Broj t/2 je vrijednost t-distribuirane varijable s n 1
stupnjeva slobode koja ima svojstvo p t > t/2 = /2. Buduci da
je nepoznat to u formuli za x umjesto uvrtavamo procjenitelja
izracunatog na uzorku.
Interval
x t/2 x , x + t/2 x nazivamo intervalom povjerenja
aritmeticke sredine za male uzorke s razinom pouzdanosti 1 .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 26 / 50


Zadatak
Iz evidencije od 8967 telefonskih razgovora ispituje se prosjecno
trajanje razgovara temeljem slucajnog uzorku o trajanju 10 razgovara:
2,1,1,2,3,4,2,1,1,3. Ako pretpostavimo da je trajanje razgovora
normalno distribuirano odredite granice za koje se moze ocekivati s
pouzdanocu 95% da obuhvacaju prosjecno trajanje razgovora.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 27 / 50


Zadatak
Iz evidencije od 8967 telefonskih razgovora ispituje se prosjecno
trajanje razgovara temeljem slucajnog uzorku o trajanju 10 razgovara:
2,1,1,2,3,4,2,1,1,3. Ako pretpostavimo da je trajanje razgovora
normalno distribuirano odredite granice za koje se moze ocekivati s
pouzdanocu 95% da obuhvacaju prosjecno trajanje razgovora.
n = 10 )stupnjevi slobode= 9,
1 = 0.95 ) /2 = 0.025 ) t0.025 (9) = 2.262

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 27 / 50


Zadatak
Iz evidencije od 8967 telefonskih razgovora ispituje se prosjecno
trajanje razgovara temeljem slucajnog uzorku o trajanju 10 razgovara:
2,1,1,2,3,4,2,1,1,3. Ako pretpostavimo da je trajanje razgovora
normalno distribuirano odredite granice za koje se moze ocekivati s
pouzdanocu 95% da obuhvacaju prosjecno trajanje razgovora.
n = 10 )stupnjevi slobode= 9,
1 = 0.95 ) /2 = 0.025 ) t0.025 (9) = 2.262
x 1 + +x n 2 +1 + +3
x= = 2 min,
q n 10 q 2 p
(x1 2 ) + +(xn 2 )2
2
x1 + +xn2 nx 2 10
= n 1 = n 1 = 3

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 27 / 50


Zadatak
Iz evidencije od 8967 telefonskih razgovora ispituje se prosjecno
trajanje razgovara temeljem slucajnog uzorku o trajanju 10 razgovara:
2,1,1,2,3,4,2,1,1,3. Ako pretpostavimo da je trajanje razgovora
normalno distribuirano odredite granice za koje se moze ocekivati s
pouzdanocu 95% da obuhvacaju prosjecno trajanje razgovora.
n = 10 )stupnjevi slobode= 9,
1 = 0.95 ) /2 = 0.025 ) t0.025 (9) = 2.262
x 1 + +x n 2 +1 + +3
x= = 2 min,
q n 10 q 2 p
(x1 2 ) + +(xn 2 )2
2
x1 + +xn2 nx 2 10
= n 1 = n 1 = 3
q
p 1 n N n
x = n
= 3 (buduci je N < 0.05 smijemo izostaviti faktor N 1)

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 27 / 50


Zadatak
Iz evidencije od 8967 telefonskih razgovora ispituje se prosjecno
trajanje razgovara temeljem slucajnog uzorku o trajanju 10 razgovara:
2,1,1,2,3,4,2,1,1,3. Ako pretpostavimo da je trajanje razgovora
normalno distribuirano odredite granice za koje se moze ocekivati s
pouzdanocu 95% da obuhvacaju prosjecno trajanje razgovora.
n = 10 )stupnjevi slobode= 9,
1 = 0.95 ) /2 = 0.025 ) t0.025 (9) = 2.262
x 1 + +x n 2 +1 + +3
x= = 2 min,
q n 10 q 2 p
(x1 2 ) + +(xn 2 )2
2
x1 + +xn2 nx 2 10
= n 1 = n 1 = 3
q
p 1 n N n
x = n
= 3 (buduci je N < 0.05 smijemo izostaviti faktor N 1)
1 1
trazeni interval je 2 2.262 3 , 2 + 2.262 3 = h1.246, 2.754i

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 27 / 50


Procjena proporcije
Procjenitelj p proporcije p nekog obiljezja populacije je proporcija
uzorka p = mn , gdje je m broj clanova uzorka s odreenim obiljezjem,
a n je velicina uzorka. Ako slucajni uzorak potjece iz beskonacnog
skupa onda je sampling distribucija proporcija p binomna
q s
p (1 p )
ocekivanjem E [p ] = p i stand. dev. jednakoj p = n . Ako je
populacija konacna velicine N tada je sampling distribucija proporcija
hipergeometrijska
q s ocekivanjem p i stand. devijacijom jednakoj
p (1 p ) N n
p = n N 1 .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 28 / 50


Procjena proporcije
Procjenitelj p proporcije p nekog obiljezja populacije je proporcija
uzorka p = mn , gdje je m broj clanova uzorka s odreenim obiljezjem,
a n je velicina uzorka. Ako slucajni uzorak potjece iz beskonacnog
skupa onda je sampling distribucija proporcija p binomna
q s
p (1 p )
ocekivanjem E [p ] = p i stand. dev. jednakoj p = n . Ako je
populacija konacna velicine N tada je sampling distribucija proporcija
hipergeometrijska
q s ocekivanjem p i stand. devijacijom jednakoj
p (1 p )N n
p = n N 1 .
Buduci da obje distribucije teze normalnoj distribuciji, u oba slucaja
se kao prakticno pravilo uzima, da je sampling distribucije proporcija
p aproksimativno normalno distribuirana N (p, p ) ako je np > 5 i
n (1 p ) > 5.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 28 / 50


Procjena proporcije
Procjenitelj p proporcije p nekog obiljezja populacije je proporcija
uzorka p = mn , gdje je m broj clanova uzorka s odreenim obiljezjem,
a n je velicina uzorka. Ako slucajni uzorak potjece iz beskonacnog
skupa onda je sampling distribucija proporcija p binomna
q s
p (1 p )
ocekivanjem E [p ] = p i stand. dev. jednakoj p = n . Ako je
populacija konacna velicine N tada je sampling distribucija proporcija
hipergeometrijska
q s ocekivanjem p i stand. devijacijom jednakoj
p (1 p ) N n
p = n N 1 .
Buduci da obje distribucije teze normalnoj distribuciji, u oba slucaja
se kao prakticno pravilo uzima, da je sampling distribucije proporcija
p aproksimativno normalno distribuirana N (p, p ) ako je np > 5 i
n (1 p ) > 5.
U tom slucaju koristeci svojstva normalne distribucije interval
p z/2 p , p + z/2 p sadrzi pravu proporciju p s vjerojatnocu
1 . Taj interval nazivamo intervalom povjerenja proporcije s
razinom pouzdanosti 1 .
STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 28 / 50
Buduci nam je u formuli za izracun granica intervala povjerenja
proporcije potrebna proporcija p, koja nam nije dostupna i koju
p (1 p )
procjenjujemo tim istim intervalom, smijemo izraz n zamijeniti
p (1 p ) n
izrazom n 1 . Takoer u slucaju konacne populacije i N < 0.05
faktor N
N
n
1 izostavljamo.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 29 / 50


Buduci nam je u formuli za izracun granica intervala povjerenja
proporcije potrebna proporcija p, koja nam nije dostupna i koju
p (1 p )
procjenjujemo tim istim intervalom, smijemo izraz n zamijeniti
p (1 p ) n
izrazom n 1 . Takoer u slucaju konacne populacije i N < 0.05
faktor N
N
n
1 izostavljamo.
Nadalje, buduci je interval povjerenja proporcije dobiven
aproksimacijom binomne i hipergeometrijske razdiobe s normalnom i
aproksimacijom standard. devijacije p pomocu gornjeg izraza, to je
potrebna dodatna provjera je li je postupak tj. aproksimacija
zadovoljavajuci. Rezultate mozemo prihvatiti kao relevantne ako je
gornja granica intervala strogo manja od 1.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 29 / 50


Primjer
Od 6432 osiguranika neke osiguravajuce kuce u uzorku od 400
osiguranika njih 320 nije sudjelovalo u prometnoj nezgodi u
prethodnoj godini. Odredite interval povjerenja proporcije osiguranika
koji su bili sudionici prometne nezgode u proloj godini s razinom
pouzdanosti 95%.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 30 / 50


Primjer
Od 6432 osiguranika neke osiguravajuce kuce u uzorku od 400
osiguranika njih 320 nije sudjelovalo u prometnoj nezgodi u
prethodnoj godini. Odredite interval povjerenja proporcije osiguranika
koji su bili sudionici prometne nezgode u proloj godini s razinom
pouzdanosti 95%.
m
N = 6432, n = 400, m = 80, p = n = 0.2.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 30 / 50


Primjer
Od 6432 osiguranika neke osiguravajuce kuce u uzorku od 400
osiguranika njih 320 nije sudjelovalo u prometnoj nezgodi u
prethodnoj godini. Odredite interval povjerenja proporcije osiguranika
koji su bili sudionici prometne nezgode u proloj godini s razinom
pouzdanosti 95%.
m
N = 6432, n = 400, m = 80, p = = 0.2.
n
1 = 0.95 ) /2 = 0.025 ) z0.025 = 1.96

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 30 / 50


Primjer
Od 6432 osiguranika neke osiguravajuce kuce u uzorku od 400
osiguranika njih 320 nije sudjelovalo u prometnoj nezgodi u
prethodnoj godini. Odredite interval povjerenja proporcije osiguranika
koji su bili sudionici prometne nezgode u proloj godini s razinom
pouzdanosti 95%.
m
N = 6432, n = 400, m = 80, p = n = 0.2.
1 = 0.95 ) /2 = 0.025 ) z0.025 = 1.96
q
p (1 p ) N n n
p = n 1 N 1 = 0.01939 (buduci je N = 0.062 > 0.05
faktor N n
N 1 ne zanemarujemo)

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 30 / 50


Primjer
Od 6432 osiguranika neke osiguravajuce kuce u uzorku od 400
osiguranika njih 320 nije sudjelovalo u prometnoj nezgodi u
prethodnoj godini. Odredite interval povjerenja proporcije osiguranika
koji su bili sudionici prometne nezgode u proloj godini s razinom
pouzdanosti 95%.
m
N = 6432, n = 400, m = 80, p = n = 0.2.
1 = 0.95 ) /2 = 0.025 ) z0.025 = 1.96
q
p (1 p ) N n n
p = n 1 N 1 = 0.01939 (buduci je N = 0.062 > 0.05
faktor N n
N 1 ne zanemarujemo)
Interval pouzdanosti je
h0.2 1.96 0.01939, 0.2 + 1.96 0.01939i = h0.162, 0.238i , pa s
95% sigurnosti mozemo reci da je izmeu 16.2% i 23.8% osiguranika
imalo prometnu nezgodu u proloj godini.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 30 / 50


Primjer
Od 6432 osiguranika neke osiguravajuce kuce u uzorku od 400
osiguranika njih 320 nije sudjelovalo u prometnoj nezgodi u
prethodnoj godini. Odredite interval povjerenja proporcije osiguranika
koji su bili sudionici prometne nezgode u proloj godini s razinom
pouzdanosti 95%.
m
N = 6432, n = 400, m = 80, p = n = 0.2.
1 = 0.95 ) /2 = 0.025 ) z0.025 = 1.96
q
p (1 p ) N n n
p = n 1 N 1 = 0.01939 (buduci je N = 0.062 > 0.05
faktor N n
N 1 ne zanemarujemo)
Interval pouzdanosti je
h0.2 1.96 0.01939, 0.2 + 1.96 0.01939i = h0.162, 0.238i , pa s
95% sigurnosti mozemo reci da je izmeu 16.2% i 23.8% osiguranika
imalo prometnu nezgodu u proloj godini.
Mozemo prihvatiti ove granice jer je gornja granica manja od 1 i
np np = 80 i n (1 p ) n (1 p ) = 320 to je vece od 5, pa je
implementacija ove procedure prihvatljiva
STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 30 / 50
Zadatak
Na uzorku od 576 dobitnika lutrije u SAD-u u zadnjih 10 godina u
iznosu preko 100 000 $ samo je 63 dalo otkaz na poslu. Procjenite
proporciju ljudi koji su dobitnici iznosa vecega od 100 000$ na lutriji u
SAD-u u zadnjih 10 godina a koji su nakon dobitka dali otkaz i to s
razinom pouzdanosti 95%.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 31 / 50


Zadatak
Na uzorku od 576 dobitnika lutrije u SAD-u u zadnjih 10 godina u
iznosu preko 100 000 $ samo je 63 dalo otkaz na poslu. Procjenite
proporciju ljudi koji su dobitnici iznosa vecega od 100 000$ na lutriji u
SAD-u u zadnjih 10 godina a koji su nakon dobitka dali otkaz i to s
razinom pouzdanosti 95%.
63
n = 576, m = 63, p = 576 = 0.11, /2 = 0.025 ) z0.025 = 1.96

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 31 / 50


Zadatak
Na uzorku od 576 dobitnika lutrije u SAD-u u zadnjih 10 godina u
iznosu preko 100 000 $ samo je 63 dalo otkaz na poslu. Procjenite
proporciju ljudi koji su dobitnici iznosa vecega od 100 000$ na lutriji u
SAD-u u zadnjih 10 godina a koji su nakon dobitka dali otkaz i to s
razinom pouzdanosti 95%.
63
n = 576, m = 63, p = 576 = 0.11, /2 = 0.025 ) z0.025 = 1.96
q
p (1 p ) N n
p = n 1 = 0.013 (ovdje moramo zanemariti faktor N 1 , jer je
N nepoznat, odnosno pretpostavljamo da je dovoljno velik)

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 31 / 50


Zadatak
Na uzorku od 576 dobitnika lutrije u SAD-u u zadnjih 10 godina u
iznosu preko 100 000 $ samo je 63 dalo otkaz na poslu. Procjenite
proporciju ljudi koji su dobitnici iznosa vecega od 100 000$ na lutriji u
SAD-u u zadnjih 10 godina a koji su nakon dobitka dali otkaz i to s
razinom pouzdanosti 95%.
63
n = 576, m = 63, p = 576 = 0.11, /2 = 0.025 ) z0.025 = 1.96
q
p (1 p ) N n
p = n 1 = 0.013 (ovdje moramo zanemariti faktor N 1 , jer je
N nepoznat, odnosno pretpostavljamo da je dovoljno velik)
Trazena proporcija p se nalazi u intervalu
h0.11 1.96 0.013, 0.11 + 1.96 0.013i = h0.084, 0.135i s 95%
vjerojatnosti, tj. sigurni smo s vjerojatnoscu 95% da je izmeu 8.4%
i 13.5% ljudi napustilo posao nakon ovakvog dobitka.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 31 / 50


Procjena varijance

Ako je uzorak velicine n uzet iz normalno distribuirane populacije


varijance 2 , a 2 je njezin nepristrani procjenitelj, onda su vrijednosti
(n 1 )2
2
distribuirane po 2 -distribuciji s n 1 stunjeva slobode.
(n 1 )2
Tada, s vjerojatnocu 1 smijemo tvrditi da se 2 nalazi u
D E
intervalu 2(1 /2 );n 1 , 2/2;n 1 , gdje su brojevi 2(1 /2 );n 1 i
2/2;n 1 vrijednosti 2 -distribuirane varijable s n 1 stupnjeva
slobode koje imaju svojstvo p 2 > 21 /2;n 1 =1 /2
odnosno p 2 > 2/2;n 1 = /2.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 32 / 50


Procjena varijance

Ako je uzorak velicine n uzet iz normalno distribuirane populacije


varijance 2 , a 2 je njezin nepristrani procjenitelj, onda su vrijednosti
(n 1 )2
2
distribuirane po 2 -distribuciji s n 1 stunjeva slobode.
(n 1 )2
Tada, s vjerojatnocu 1 smijemo tvrditi da se 2 nalazi u
D E
intervalu 2(1 /2 );n 1 , 2/2;n 1 , gdje su brojevi 2(1 /2 );n 1 i
2/2;n 1 vrijednosti 2 -distribuirane varijable s n 1 stupnjeva
slobode koje imaju svojstvo p 2 > 21 /2;n 1 =1 /2
odnosno p 2 > 2/2;n 1 = /2.
2
Tada se, s istom vjerojatnocu, vrijednost (n 1 )2
nalazi u intervalu
1 1
2/2;n
, 2 .
1 (1 /2 );n 1

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 32 / 50


Napokon, s vjerojatnocu 1 varijanca populacije 2 pripada
(n 1 )2 (n 1 )2
intervalu ,
2/2;n 1 2(1 /2 );n 1

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 33 / 50


Napokon, s vjerojatnocu 1 varijanca populacije 2 pripada
(n 1 )2 (n 1 )2
intervalu ,
2/2;n 1 2(1 /2 );n 1

Ovaj interval nazivamo intervalom povjerenja varijance s razinom


pouzdanosti 1 .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 33 / 50


Napokon, s vjerojatnocu 1 varijanca populacije 2 pripada
(n 1 )2 (n 1 )2
intervalu ,
2/2;n 1 2(1 /2 );n 1

Ovaj interval nazivamo intervalom povjerenja varijance s razinom


pouzdanosti 1 .
Interval
*p povjerenja standardne
+ devijacije je
p
(n 1 ) (n 1 )
q
2
,q 2
/2;n 1
(1 /2 );n 1

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 33 / 50


Zadatak
Procijenite disperziju trajnosti zarulja odreenog tipa s razinom
pouzdanosti 95% ako je pomocu uzorka od 21 zarulja izracunata
21
velicina (xi x )2 = 208080 sati.
i =1

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 34 / 50


Zadatak
Procijenite disperziju trajnosti zarulja odreenog tipa s razinom
pouzdanosti 95% ako je pomocu uzorka od 21 zarulja izracunata
21
velicina (xi x )2 = 208080 sati.
i =1
21
(x i x )2
2
= n 1 = 208080
i =1
20 = 10404 ) = 102 (faktor N 1
N je
izostavljen, tj. uzimamo da je N jako velik)

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 34 / 50


Zadatak
Procijenite disperziju trajnosti zarulja odreenog tipa s razinom
pouzdanosti 95% ako je pomocu uzorka od 21 zarulja izracunata
21
velicina (xi x )2 = 208080 sati.
i =1
21
(x i x )2
2
= n 1 = 208080
i =1
20 = 10404 ) = 102 (faktor N 1
N je
izostavljen, tj. uzimamo da je N jako velik)
1 = 0.95 ) /2 = 0.025 ) 1 /2 = 0.975, stupnjevi
slobode=20, 20.025;20 = 34.1696, 20.975;20 = 9.59083

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 34 / 50


Zadatak
Procijenite disperziju trajnosti zarulja odreenog tipa s razinom
pouzdanosti 95% ako je pomocu uzorka od 21 zarulja izracunata
21
velicina (xi x )2 = 208080 sati.
i =1
21
(x i x )2
2
= n 1 = 208080
i =1
20 = 10404 ) = 102 (faktor N 1
N je
izostavljen, tj. uzimamo da je N jako velik)
1 = 0.95 ) /2 = 0.025 ) 1 /2 = 0.975, stupnjevi
slobode=20, 20.025;20 = 34.1696, 20.975;20 = 9.59083
D p p E
20102 p 20102
Trazeni interval je p34.1696 , 9.59083 = h78.036, 147.294i i kazemo
da se na razini pouzdanosti od 95% ocekuje da je prosjecno
odstupanje trajnosti zarulje od njihove prosjecne trajnosti izmeu 78 i
147 sati, uz opravdanu pretpostavku da je distribucija trajnosti zarulja
priblizno normalna.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 34 / 50


Procjena razlike sredina pomocu neovisnih uzoraka

Neka vrijednosti x11 , x21 , ..., xn1 1 tvore uzorak velicine n1 iz populacije S1 s
arit. sredinom 1 i st. dev. 1 , te vrijednosti x12 , x22 , ..., xn2 2 neka tvore
uzorak velicine n2 iz populacije S2 s arit. sredinom 2 i st. dev. 2 .
Procjenitelj razlike D = 1 2 aritmetickih sredina populacija je razlika
D = x1 x2 izmeu aritmetickih sredina x1 i x2 neovisnih uzoraka. Ovaj
procjenitelj je nepristran, tj. E [x1 x2 ] = 1 2 = D. Ako su uzorci
uzeti iz populacija veliki i neovisni onda je pripadna q sampling distribucija
21 22
priblizno nornalna a st. devijacija joj je x1 x2 = n1 + n2 .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 35 / 50


Ako su uzorci uzeti iz populacija veliki i neovisni onda interval
D z/2 x1 x2 , D + z/2 x1 x2 nazivamo intervalom povjerenja
za razliku aritmetickih sredina dvaju populacija za velike i
neovisne uzorke s razinom pouzdanosti 1 , i on sadrzi razliku
D = 1 2 s vjerojatnocu 1 .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 36 / 50


Ako su uzorci uzeti iz populacija veliki i neovisni onda interval
D z/2 x1 x2 , D + z/2 x1 x2 nazivamo intervalom povjerenja
za razliku aritmetickih sredina dvaju populacija za velike i
neovisne uzorke s razinom pouzdanosti 1 , i on sadrzi razliku
D = 1 2 s vjerojatnocu 1 .
U formuli za granice ovog intervala smijemo zamijeniti (najcece
nepoznate) varijance populacija 21 i 22 s njihovim procjeniteljima 21 i
22 .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 36 / 50


Ako se razlika sredina procjenjuje pomocu malih uzoraka izabranih iz
normalno distribuiranih populacija razlicitih sredina i jednakih,
poznatih, varijanci 1 = 2 = , onda je odgovarajuci interval
povjerenja q
D t/2 x1 x2 , D + t/2 x1 x2 , gdje je x1 x2 = nn1 1+nn2 2 , a broj
t/2 je odgovarajuca vrijednost t-distribuirane varijable s n1 + n2 2
stupnjeva slobode.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 37 / 50


Ako se razlika sredina procjenjuje pomocu malih uzoraka izabranih iz
normalno distribuiranih populacija razlicitih sredina i jednakih,
poznatih, varijanci 1 = 2 = , onda je odgovarajuci interval
povjerenja q
D t/2 x1 x2 , D + t/2 x1 x2 , gdje je x1 x2 = nn1 1+nn2 2 , a broj
t/2 je odgovarajuca vrijednost t-distribuirane varijable s n1 + n2 2
stupnjeva slobode.
Ako je zajedni
r cka varijanca nepoznata, onda se koristi izraz
(n 1 1 )21 +(n 2 1 )22 n 1 +n 2
x1 x2 = n 1 +n 2 2 n1 n2

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 37 / 50


Ako se razlika sredina procjenjuje pomocu malih uzoraka izabranih iz
normalno distribuiranih populacija razlicitih sredina i jednakih,
poznatih, varijanci 1 = 2 = , onda je odgovarajuci interval
povjerenja q
D t/2 x1 x2 , D + t/2 x1 x2 , gdje je x1 x2 = nn1 1+nn2 2 , a broj
t/2 je odgovarajuca vrijednost t-distribuirane varijable s n1 + n2 2
stupnjeva slobode.
Ako je zajedni
r cka varijanca nepoznata, onda se koristi izraz
(n 1 1 )21 +(n 2 1 )22 n 1 +n 2
x1 x2 = n 1 +n 2 2 n1 n2

Ako se prethodno utvrdiq da su varijance populacija razlicite onda se


2 2
koristi izraz x1 x2 = n11 + n22 a broj stupnjeva slobode kojeg
koristimo za izracun vrijednosti t/2 je jednak
2 0 2 2 2 2
13
1 2
2
21 22 n1 n2
s.s. = Int 4 n1 + n2
@
n1 1 + n2 1
A5 , gdje Int oznacuje

najvece cijelo decimalnog broja (odbacuju se decimale)


STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 37 / 50
Zadatak
Aritmeticka sredina brzine otpremanja stranke sluzbenice A u uzorku
od 40 stranki je 503 sekunde s prosjecnim odstupanjem 145.
Aritmeticka sredina brzine otpremanja stranke sluzbenice B u uzorku
od 52 stranke je 407 sekundi s prosjecnim odstupanjem 132.
Procijenite razliku prosjecnih vremena potrebnih za otpremanje
stranke kod sluzbenice A i sluzbenice B s razinom pouzdanosti 94%.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 38 / 50


Zadatak
Aritmeticka sredina brzine otpremanja stranke sluzbenice A u uzorku
od 40 stranki je 503 sekunde s prosjecnim odstupanjem 145.
Aritmeticka sredina brzine otpremanja stranke sluzbenice B u uzorku
od 52 stranke je 407 sekundi s prosjecnim odstupanjem 132.
Procijenite razliku prosjecnih vremena potrebnih za otpremanje
stranke kod sluzbenice A i sluzbenice B s razinom pouzdanosti 94%.
x1 = 503, s1 = 145, n1 = 40, x2 = 407, s2 = 132, n2 = 52,
D = x1 x2 = 96

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 38 / 50


Zadatak
Aritmeticka sredina brzine otpremanja stranke sluzbenice A u uzorku
od 40 stranki je 503 sekunde s prosjecnim odstupanjem 145.
Aritmeticka sredina brzine otpremanja stranke sluzbenice B u uzorku
od 52 stranke je 407 sekundi s prosjecnim odstupanjem 132.
Procijenite razliku prosjecnih vremena potrebnih za otpremanje
stranke kod sluzbenice A i sluzbenice B s razinom pouzdanosti 94%.
x1 = 503, s1 = 145, n1 = 40, x2 = 407, s2 = 132, n2 = 52,
D = x1 x2 = 96
1 = 0.94 ) /2 = 0.03 ) z0.03 = 1.88

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 38 / 50


Zadatak
Aritmeticka sredina brzine otpremanja stranke sluzbenice A u uzorku
od 40 stranki je 503 sekunde s prosjecnim odstupanjem 145.
Aritmeticka sredina brzine otpremanja stranke sluzbenice B u uzorku
od 52 stranke je 407 sekundi s prosjecnim odstupanjem 132.
Procijenite razliku prosjecnih vremena potrebnih za otpremanje
stranke kod sluzbenice A i sluzbenice B s razinom pouzdanosti 94%.
x1 = 503, s1 = 145, n1 = 40, x2 = 407, s2 = 132, n2 = 52,
D = x1 x2 = 96
1 = 0.94 ) /2 = 0.03 ) z0.03 = 1.88
r
q 2 n
s12 n 1 1
n
s22 n 2 1
1 22 1 2
x1 x2 = n1 + n2 = n1 + n2 = 29.67743

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 38 / 50


Zadatak
Aritmeticka sredina brzine otpremanja stranke sluzbenice A u uzorku
od 40 stranki je 503 sekunde s prosjecnim odstupanjem 145.
Aritmeticka sredina brzine otpremanja stranke sluzbenice B u uzorku
od 52 stranke je 407 sekundi s prosjecnim odstupanjem 132.
Procijenite razliku prosjecnih vremena potrebnih za otpremanje
stranke kod sluzbenice A i sluzbenice B s razinom pouzdanosti 94%.
x1 = 503, s1 = 145, n1 = 40, x2 = 407, s2 = 132, n2 = 52,
D = x1 x2 = 96
1 = 0.94 ) /2 = 0.03 ) z0.03 = 1.88
r
q 2 n
s12 n 1 1
n
s22 n 2 1
1 22 1 2
x1 x2 = n1 + n2 = n1 + n2 = 29.67743
Trazeni interval je
h96 1.88 29.67743, 96 + 1.88 29.67743i = h40.206, 151.793i

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 38 / 50


Zadatak
Aritmeticka sredina brzine otpremanja stranke sluzbenice A u uzorku
od 40 stranki je 503 sekunde s prosjecnim odstupanjem 145.
Aritmeticka sredina brzine otpremanja stranke sluzbenice B u uzorku
od 52 stranke je 407 sekundi s prosjecnim odstupanjem 132.
Procijenite razliku prosjecnih vremena potrebnih za otpremanje
stranke kod sluzbenice A i sluzbenice B s razinom pouzdanosti 94%.
x1 = 503, s1 = 145, n1 = 40, x2 = 407, s2 = 132, n2 = 52,
D = x1 x2 = 96
1 = 0.94 ) /2 = 0.03 ) z0.03 = 1.88
r
q 2 n
s12 n 1 1
n
s22 n 2 1
1 22 1 2
x1 x2 = n1 + n2 = n1 + n2 = 29.67743
Trazeni interval je
h96 1.88 29.67743, 96 + 1.88 29.67743i = h40.206, 151.793i
Razlika prosjecnih vremena potrebnih za otpremanje stranke kod
sluzbenice A i sluzbenice B s razinom pouzdanosti 94% je izmeu 40 i
151 sekundu.
STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 38 / 50
Procjena razlike sredina pomocu ovisnih (uparenih) uzoraka

Procjenjivanje razlike aritmetickih sredina dvaju populacija zavisnim


uzorcima obicno se provodi pomocu razlike vrijednosti parova,
pogotovo ako se populacije sastoje od istih clanova s razlicita dva
numericka obiljezja. Primjerice, promatramo li populaciju ljudi koji su
poceli primijenjivat dijetu a istoj osobi biljezimo tezinu prije i poslije
dijete, ili promatramo li uspjehe ucenika istog razreda kod dva
razlicita nastavnika, ili proizvodnost populacije radnika prije i poslije
strucnog usavravanja.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 39 / 50


Procjena razlike sredina pomocu ovisnih (uparenih) uzoraka

Procjenjivanje razlike aritmetickih sredina dvaju populacija zavisnim


uzorcima obicno se provodi pomocu razlike vrijednosti parova,
pogotovo ako se populacije sastoje od istih clanova s razlicita dva
numericka obiljezja. Primjerice, promatramo li populaciju ljudi koji su
poceli primijenjivat dijetu a istoj osobi biljezimo tezinu prije i poslije
dijete, ili promatramo li uspjehe ucenika istog razreda kod dva
razlicita nastavnika, ili proizvodnost populacije radnika prije i poslije
strucnog usavravanja.
Kod ovakvih primjera zapravo radimo s istom populacijom fs1 , ..., sN g
na kojoj operira varijabla X1 i X2 . No, onda se moze formirati
jedinstvena varijabla razlika d = X1 X2 koja djeluje na istoj
populaciji. Ta varijabla ima ocekivanje
d = E [d ] = E [X1 X2 ] = 1 2 i st. devijaciju d .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 39 / 50


Uzorak fdi1 , ..., din g, velicine n, kojeg uzimamo iz ovakve populacije
razlika je zapravo par meusobno ovisnih uzoraka fxi1 , ..., xin g i
fyi1 , ..., yin g jednake velicine vrijednosti kojih promatramo u parovima,
odnosno za i-ti clan promatramo par (xi , yi ) cija razlika je
di = xi yi . Varijablu koja svakom takvom uzorku fd1 , ..., dn g ,
razlike parova, pridruzi aritmeticku sredinu d = d1 + n +dn je
nepristrani procjenitelj aritmeticke sredine d pa onda i razlike
aritmetickih sredina prve i druge populacije 1 2 = d , tj vrijedi
E d = 1 2 .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 40 / 50


Za velike uzorke sampling distribucija varijable aritmetickih sredina
d
razlika uzoraka d je priblizno normalna N (d , d ), gdje je d = p n

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 41 / 50


Za velike uzorke sampling distribucija varijable aritmetickih sredina
d
razlika uzoraka d je priblizno normalna N (d , d ), gdje je d = p n
Tada je vjerojatnost da razlika aritmetickih sredina d = 1 2
populacija (isto to aritmeticka sredina razlika) bude u intervalu
d z/2 d , x + z/2 d jednaka 1 .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 41 / 50


Za velike uzorke sampling distribucija varijable aritmetickih sredina
d
razlika uzoraka d je priblizno normalna N (d , d ), gdje je d = p n
Tada je vjerojatnost da razlika aritmetickih sredina d = 1 2
populacija (isto to aritmeticka sredina razlika) bude u intervalu
d z/2 d , x + z/2 d jednaka 1 .
Interval d z/2 d , d + z/2 d
nazivamo intervalom povjerenja razlike aritmeticke sredine za
velike uzorke na temelju ovisnih (uparenih) uzoraka s razinom
pouzdanosti 1 .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 41 / 50


Za velike uzorke sampling distribucija varijable aritmetickih sredina
d
razlika uzoraka d je priblizno normalna N (d , d ), gdje je d = p n
Tada je vjerojatnost da razlika aritmetickih sredina d = 1 2
populacija (isto to aritmeticka sredina razlika) bude u intervalu
d z/2 d , x + z/2 d jednaka 1 .
Interval d z/2 d , d + z/2 d
nazivamo intervalom povjerenja razlike aritmeticke sredine za
velike uzorke na temelju ovisnih (uparenih) uzoraka s razinom
pouzdanosti 1 .
U izrazu za granice intervala u d smijemo umjesto (obicno
nepoznate) st. devijacijeq varijable razlika d uvrtavati njezin
procjenitelj d = sd n n 1 , gdje je sd standardna devijacija uzorka
r
2 2
(d 1 d ) + + (d n d )
razlika fd1 , ..., dn g tj. sd = n .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 41 / 50


Za velike uzorke sampling distribucija varijable aritmetickih sredina
d
razlika uzoraka d je priblizno normalna N (d , d ), gdje je d = p n
Tada je vjerojatnost da razlika aritmetickih sredina d = 1 2
populacija (isto to aritmeticka sredina razlika) bude u intervalu
d z/2 d , x + z/2 d jednaka 1 .
Interval d z/2 d , d + z/2 d
nazivamo intervalom povjerenja razlike aritmeticke sredine za
velike uzorke na temelju ovisnih (uparenih) uzoraka s razinom
pouzdanosti 1 .
U izrazu za granice intervala u d smijemo umjesto (obicno
nepoznate) st. devijacijeq varijable razlika d uvrtavati njezin
procjenitelj d = sd n n 1 , gdje je sd standardna devijacija uzorka
r
2 2
(d 1 d ) + + (d n d )
razlika fd1 , ..., dn g tj. sd = n .
Ako je uzorak mali, a populacije normalno distribuirane tada u
izrazima za granice intervale umjesto z/2 treba staviti vrijednost t/2
s n 1 stupnjeva slobode.
STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 41 / 50
Zadatak
Zadana je tablica s tezinama 5 proizvoljno odabranih ljudi koji su se
podvrgli odreenoj dijeti i to neposredno prije pocetka dijete i mjesec
dana kasnije. Napravite interval povjerenja s 95% razinom
pouzdanosti za razliku izmeu prosjecne tezine svih ljudi koji su
prihvatili program prije pocetka dijete i mjesec dana nakon (isto to i
prosjecna razlika u tezinama prije i poslije). Koje pretpostavke trebaju
biti ispunjene da bismo mogli prihvatiti te
Osoba Tezina prije Tezina poslije
A 150 143
B 195 190
rezultate?
C 188 185
D 197 191
E 204 200

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 42 / 50


Zadatak (Nastavak)
Osoba Razlike d
A 7
B 5
C 3
D 6
E 4
n = 5, d = 7 + 5 +4 = 5
r q
q (d 1
2
d ) + + (d n d )
2
2 2
d = sd n n 1 = n 1 = (7 5 ) + 4 +(4 5 ) = 1.58
1 = 0.95 ) /2 D = 0.025, stupnjevi slobode=4 E ) t0.025 = 2.776
1.58 1.58
Trazeni interval je 5 2.776 5 , 5 + 2.776 5 = h3.04, 6.96i , koji
p p

mozemo prihvatiti jedino uz (opravdanu) pretpostavku da su tezine svih


ljudi u programu prije dijete i poslije normalno distribuirane.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 43 / 50


Procjena razlike proporcija

Neka su n1 i n2 velicine uzoraka uzetih iz populacija kojima su p1 i p2


proporcije nekog obiljezja, redom. Ako u prvom uzorku ima m1
elemenata s promatranim obiljezjem, a u drugom m2 , onda su
p1 = mn11 i p2 = mn22 proporcije uzoraka s promatranim obiljezjem
redom. Razlika p1 p2 je nepristrani procjenitelj prave razlike
populacijskih proporcija p1 p2 . Nadalje, ako su uzorci dovoljno
veliki (kao kod procjene proporcije) sampling distribucija razlika
proprcija pq1 p2 je priblizno normalna N (p1 p2 , p1 p2 ) , gdje je
(n 1 p 1 +n 2 p 2 )(n 1 (1 p 1 )+n 2 (1 p 2 ))
p1 p 2 (n 1 +n 2 )n 1 n 2
.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 44 / 50


Procjena razlike proporcija

Neka su n1 i n2 velicine uzoraka uzetih iz populacija kojima su p1 i p2


proporcije nekog obiljezja, redom. Ako u prvom uzorku ima m1
elemenata s promatranim obiljezjem, a u drugom m2 , onda su
p1 = mn11 i p2 = mn22 proporcije uzoraka s promatranim obiljezjem
redom. Razlika p1 p2 je nepristrani procjenitelj prave razlike
populacijskih proporcija p1 p2 . Nadalje, ako su uzorci dovoljno
veliki (kao kod procjene proporcije) sampling distribucija razlika
proprcija pq1 p2 je priblizno normalna N (p1 p2 , p1 p2 ) , gdje je
(n 1 p 1 +n 2 p 2 )(n 1 (1 p 1 )+n 2 (1 p 2 ))
p1 p 2 (n 1 +n 2 )n 1 n 2
.
Tada je vjerojatnost da razlika populacijskih proprcija p1 p2 bude u
intervalu p1 p2 z/2 p1 p2 , p1 p2 + z/2 p1 p2 jednaka
1 .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 44 / 50


Procjena razlike proporcija

Neka su n1 i n2 velicine uzoraka uzetih iz populacija kojima su p1 i p2


proporcije nekog obiljezja, redom. Ako u prvom uzorku ima m1
elemenata s promatranim obiljezjem, a u drugom m2 , onda su
p1 = mn11 i p2 = mn22 proporcije uzoraka s promatranim obiljezjem
redom. Razlika p1 p2 je nepristrani procjenitelj prave razlike
populacijskih proporcija p1 p2 . Nadalje, ako su uzorci dovoljno
veliki (kao kod procjene proporcije) sampling distribucija razlika
proprcija pq1 p2 je priblizno normalna N (p1 p2 , p1 p2 ) , gdje je
(n 1 p 1 +n 2 p 2 )(n 1 (1 p 1 )+n 2 (1 p 2 ))
p1 p 2 (n 1 +n 2 )n 1 n 2
.
Tada je vjerojatnost da razlika populacijskih proprcija p1 p2 bude u
intervalu p1 p2 z/2 p1 p2 , p1 p2 + z/2 p1 p2 jednaka
1 .
Interval p1 p2 z/2 p1 p2 , p1 p2 + z/2 p1 p2
nazivamo intervalom povjerenja razlike populacijskih proporcija s
razinom pouzdanosti 1 .
STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 44 / 50
Zadatak
Od 100 splitskih domacinstava odabranih u uzorak, 50 je na bar jednoj
televiziji pratilo svecanost povodom 100 godinjice Hajduka, dok je od
200 Zagrebackih domacinstava odabranih u uzorak njih 75 pratilo na
TV-u isti dogaaj. Procijenite 95% intervalom razliku proporcija.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 45 / 50


Zadatak
Od 100 splitskih domacinstava odabranih u uzorak, 50 je na bar jednoj
televiziji pratilo svecanost povodom 100 godinjice Hajduka, dok je od
200 Zagrebackih domacinstava odabranih u uzorak njih 75 pratilo na
TV-u isti dogaaj. Procijenite 95% intervalom razliku proporcija.
n1 = 100, m1 = 50, p1 = mn11 = 0.5, n2 = 200, m2 = 75,
75
p2 = 200 = 0.375, p1 p2 = 0.125

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 45 / 50


Zadatak
Od 100 splitskih domacinstava odabranih u uzorak, 50 je na bar jednoj
televiziji pratilo svecanost povodom 100 godinjice Hajduka, dok je od
200 Zagrebackih domacinstava odabranih u uzorak njih 75 pratilo na
TV-u isti dogaaj. Procijenite 95% intervalom razliku proporcija.
n1 = 100, m1 = 50, p1 = mn11 = 0.5, n2 = 200, m2 = 75,
75
p2 = 200 = 0.375, p1 p2 = 0.125
q
(n 1 p 1 +n 2 p 2 )(n 1 (1 p 1 )+n 2 (1 p 2 ))
p1 p2 = (n 1 +n 2 )n 1 n 2
= 0.06038, z/2 = z0.025

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 45 / 50


Zadatak
Od 100 splitskih domacinstava odabranih u uzorak, 50 je na bar jednoj
televiziji pratilo svecanost povodom 100 godinjice Hajduka, dok je od
200 Zagrebackih domacinstava odabranih u uzorak njih 75 pratilo na
TV-u isti dogaaj. Procijenite 95% intervalom razliku proporcija.
n1 = 100, m1 = 50, p1 = mn11 = 0.5, n2 = 200, m2 = 75,
75
p2 = 200 = 0.375, p1 p2 = 0.125
q
(n 1 p 1 +n 2 p 2 )(n 1 (1 p 1 )+n 2 (1 p 2 ))
p1 p2 = (n 1 +n 2 )n 1 n 2
= 0.06038, z/2 = z0.025
Trazeni interval je
h0.125 1.96 0.06038, 0.125 + 1.96 0.06038i = h0.0066, 0.243i

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 45 / 50


Odreivanje velicine uzorka za procjenu parametra

Velicina slucajnog uzorka uzetog iz populacije za procjenu parametra


ovisi izmeu ostalog o zeljenoj preciznosti procjene i razini pouzdanosti
procjene. Naravno, da veci uzorak implicira vecu i preciznost i vecu
pouzdanost, no cesto puta i povecava trokove istrazivnja. Stoga je
uputno na pocetku istrazivanja, prije uzimanja uzorka, iskazati zeljenu
preciznost i razinu pouzdanosti, te temeljem toga izracunati potrebnu
velicinu uzorka da bi se ostvarili postavljeni ciljevi. Ako je interval
povjerenja do kojeg zelimo doci simetrican d, + d tada brojem 2d
iskazujemo preciznost procjene tj. najvecu doputenu greku d (izmeu i
) u apsolutnom iznosu ili u relativnom iznosu d (u jedinicama
procjenjenog parametra ). Velicina uzorka n se izracunava iz formula za
granice intervala povjerenja i to za zadani d i 1-.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 46 / 50


Ako zelimo naciniti interval povjerenja hx d, x + d i za procjenu
sredine populacije s razinom pouzdanosti 1 , onda, za
beskonacne populacije, iz
z /2 2
d = z/2 pn slijedi n = d .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 47 / 50


Ako zelimo naciniti interval povjerenja hx d, x + d i za procjenu
sredine populacije s razinom pouzdanosti 1 , onda, za
beskonacne populacije, iz
z /2 2
d = z/2 pn slijedi n = d .
U postupku odreivanja velicine uzorka n, treba nam, osim preciznosti
d i pouzdanosti 1 , i standardna devijacija populacije koja je
redovito nepoznata. No, se kao planska velicina prosuuje pomocu
pilot istrazivnja ili se uzima kao iskustveno pravilo da je raspon cijele

populacije priblizno 6 (Cebi ev teorem).

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 47 / 50


Ako zelimo naciniti interval povjerenja hx d, x + d i za procjenu
sredine populacije s razinom pouzdanosti 1 , onda, za
beskonacne populacije, iz
z /2 2
d = z/2 pn slijedi n = d .
U postupku odreivanja velicine uzorka n, treba nam, osim preciznosti
d i pouzdanosti 1 , i standardna devijacija populacije koja je
redovito nepoznata. No, se kao planska velicina prosuuje pomocu
pilot istrazivnja ili se uzima kao iskustveno pravilo da je raspon cijele

populacije priblizno 6 (Cebi ev teorem).
Ako se pogreka izrazava relativno (koliki postatak vrijednosti sredine
2
z /2
toleriramo za greku) onda je n = d .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 47 / 50


Ako zelimo naciniti interval povjerenja hx d, x + d i za procjenu
sredine populacije s razinom pouzdanosti 1 , onda, za
beskonacne populacije, iz
z /2 2
d = z/2 pn slijedi n = d .
U postupku odreivanja velicine uzorka n, treba nam, osim preciznosti
d i pouzdanosti 1 , i standardna devijacija populacije koja je
redovito nepoznata. No, se kao planska velicina prosuuje pomocu
pilot istrazivnja ili se uzima kao iskustveno pravilo da je raspon cijele

populacije priblizno 6 (Cebi ev teorem).
Ako se pogreka izrazava relativno (koliki postatak vrijednosti sredine
2
z /2
toleriramo za greku) onda je n = d .

Ako je populacija
q konacna onda se n nae iz jednadzbe
n0
d = z/2 pn N
n
N 1 , i to samo u slucaju kad je N < 0.05, gdje
2
z /2
n0 = d .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 47 / 50


Zadatak
Restoran s dostavom zeli ispitati srednje vrijeme dostave koje traje od
narudzbe do urucivanja na adresu. Ako menadzment restorana zeli
procjenu s toleriranom grekom od 5 minuta i razinom pouzdanosti
od 95% koliku velicinu uzorka moraju promatrati ako se zna da je
priblizno najbrza dostava bila 10 minuta, a najsporija 100.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 48 / 50


Zadatak
Restoran s dostavom zeli ispitati srednje vrijeme dostave koje traje od
narudzbe do urucivanja na adresu. Ako menadzment restorana zeli
procjenu s toleriranom grekom od 5 minuta i razinom pouzdanosti
od 95% koliku velicinu uzorka moraju promatrati ako se zna da je
priblizno najbrza dostava bila 10 minuta, a najsporija 100.
90
d = 5, z/2 = z0.025 = 1.96, 6 100 10 = 90 ) 6 = 15

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 48 / 50


Zadatak
Restoran s dostavom zeli ispitati srednje vrijeme dostave koje traje od
narudzbe do urucivanja na adresu. Ako menadzment restorana zeli
procjenu s toleriranom grekom od 5 minuta i razinom pouzdanosti
od 95% koliku velicinu uzorka moraju promatrati ako se zna da je
priblizno najbrza dostava bila 10 minuta, a najsporija 100.
90
d = 5, z/2 = z0.025 = 1.96, 6 100 10 = 90 ) 6 = 15
z 2 2
n = /2 d = 15 51.96 = 34.574. Potrebno je, dakle, uzeti u
uzorak (barem) 35 dostava da bi zakljucak bio trazene preciznosti i
pouzdanosti.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 48 / 50


Ako zelimo naciniti interval povjerenja hp d, p + d i za procjenu
proporcije p nekog obiljezja populacije s razinom pouzdanosti, onda,
za beskona
qcne populacije, iz
p (1 p ) z /2 2
d = z/2 n slijedi n = d p (1 p) .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 49 / 50


Ako zelimo naciniti interval povjerenja hp d, p + d i za procjenu
proporcije p nekog obiljezja populacije s razinom pouzdanosti, onda,
za beskona
qcne populacije, iz
p (1 p ) z /2 2
d = z/2 n slijedi n = d p (1 p) .
U postupku odreivanja velicine uzorka n, treba nam, osim preciznosti
d i pouzdanosti 1 , i proporcija p koju procjenjujemo. Za nju
uzimamo plansku, pribliznu velicinu. No, ako nema pouzdane osnove
za plansku velicinu, onda se uzima najnepovoljniji slucaj, tj. da je
p (1 p ) maksimalno, a to ce biti za p = 0.5.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 49 / 50


Ako zelimo naciniti interval povjerenja hp d, p + d i za procjenu
proporcije p nekog obiljezja populacije s razinom pouzdanosti, onda,
za beskona
qcne populacije, iz
p (1 p ) z /2 2
d = z/2 n slijedi n = d p (1 p) .
U postupku odreivanja velicine uzorka n, treba nam, osim preciznosti
d i pouzdanosti 1 , i proporcija p koju procjenjujemo. Za nju
uzimamo plansku, pribliznu velicinu. No, ako nema pouzdane osnove
za plansku velicinu, onda se uzima najnepovoljniji slucaj, tj. da je
p (1 p ) maksimalno, a to ce biti za p = 0.5.
Ako je populacija
q konacna onda se n nae iz jednadzbe
p (1 p ) N n n0
d = z/2 n N 1 , i to samo u slucaju kad je N < 0.05, gdje
z /2 2
n0 = d p (1 p) .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 49 / 50


Ako zelimo naciniti interval povjerenja hp d, p + d i za procjenu
proporcije p nekog obiljezja populacije s razinom pouzdanosti, onda,
za beskona
qcne populacije, iz
p (1 p ) z /2 2
d = z/2 n slijedi n = d p (1 p) .
U postupku odreivanja velicine uzorka n, treba nam, osim preciznosti
d i pouzdanosti 1 , i proporcija p koju procjenjujemo. Za nju
uzimamo plansku, pribliznu velicinu. No, ako nema pouzdane osnove
za plansku velicinu, onda se uzima najnepovoljniji slucaj, tj. da je
p (1 p ) maksimalno, a to ce biti za p = 0.5.
Ako je populacija
q konacna onda se n nae iz jednadzbe
p (1 p ) N n n0
d = z/2 n N 1 , i to samo u slucaju kad je N < 0.05, gdje
z /2 2
n0 = d p (1 p) .
Na slican nacin se odreuju velicine n1 i n2 uzoraka koje treba uzeti iz
dviju populacija za procjenu razlike sredina 1 2 i razlike
proporcija p1 p2 . U izracunu se uzima da je n1 = n2 .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 49 / 50


Zadatak
Koliko dobitnika lutrije u iznosu od preko 100000 $ u zadnjih 10
godina treba ukljuciti u istrazivanje o postotku onih dobitnika koji su
napustili posao nakon takvog dobitka, ako zelimo preciznost od 0.02 i
razinu pouzdaosti 90%.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 50 / 50


Zadatak
Koliko dobitnika lutrije u iznosu od preko 100000 $ u zadnjih 10
godina treba ukljuciti u istrazivanje o postotku onih dobitnika koji su
napustili posao nakon takvog dobitka, ako zelimo preciznost od 0.02 i
razinu pouzdaosti 90%.
2d = 0.02 ) d = 0.01, 1 = 0.9 ) z/2 = z0.05 = 1.645

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 50 / 50


Zadatak
Koliko dobitnika lutrije u iznosu od preko 100000 $ u zadnjih 10
godina treba ukljuciti u istrazivanje o postotku onih dobitnika koji su
napustili posao nakon takvog dobitka, ako zelimo preciznost od 0.02 i
razinu pouzdaosti 90%.
2d = 0.02 ) d = 0.01, 1 = 0.9 ) z/2 = z0.05 = 1.645
za p mozemo uzeti 0.11 proporciju pilot uzorka od 576 clanova (u
slucaju da nemamo ovaj podatak od prije morali bismo staviti
p = 0.5)

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 50 / 50


Zadatak
Koliko dobitnika lutrije u iznosu od preko 100000 $ u zadnjih 10
godina treba ukljuciti u istrazivanje o postotku onih dobitnika koji su
napustili posao nakon takvog dobitka, ako zelimo preciznost od 0.02 i
razinu pouzdaosti 90%.
2d = 0.02 ) d = 0.01, 1 = 0.9 ) z/2 = z0.05 = 1.645
za p mozemo uzeti 0.11 proporciju pilot uzorka od 576 clanova (u
slucaju da nemamo ovaj podatak od prije morali bismo staviti
p = 0.5)
z 2 2
n = /2
d p (1 p ) = 1.645
0.01 0.11 0.89 = 2649.2. Potrebno je
promatrati uzorak od (barem) 2650 dobitnika.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 50 / 50

You might also like