Professional Documents
Culture Documents
Uvod iv
1 Deskriptivna statistika 1
1.1 Populacije i varijable . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Frekvencija i proporcija . . . . . . . . . . . . . . . . . . . . . 4
1.1.2 Ure†ivanje kvalitativnih podataka . . . . . . . . . . . . . . . 6
1.1.3 Ure†ivanje numeriµckih podataka . . . . . . . . . . . . . . . . 8
1.2 Populacijski parametri . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2.1 Aritmetiµcka sredina . . . . . . . . . . . . . . . . . . . . . . . 13
1.2.2 Standardna devijacija i varijanca . . . . . . . . . . . . . . . 16
1.2.3 Standardizirana varijabla . . . . . . . . . . . . . . . . . . . . 18
1.2.4 Geometrijska sredina . . . . . . . . . . . . . . . . . . . . . . 21
1.2.5 Harmonijska sredina . . . . . . . . . . . . . . . . . . . . . . 21
1.2.6 Momenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2.7 Mod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.2.8 Medijan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.2.9 Kvantili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.2.10 Nepotpune mjere disperzije . . . . . . . . . . . . . . . . . . 29
1.2.11 Mjere asimetrije i zaobljenosti . . . . . . . . . . . . . . . . . 30
2 Vjerojatnost 32
2.1 Doga†aji sluµcajnog pokusa . . . . . . . . . . . . . . . . . . . . . . . 32
2.1.1 Operacije s doga†ajima . . . . . . . . . . . . . . . . . . . . . 33
2.2 Vjerojatnost doga†aja . . . . . . . . . . . . . . . . . . . . . . . . . 34
i
µ
SADRZAJ ii
3 Sluµcajna varijabla 54
3.1 Diskretna sluµcajna varijabla . . . . . . . . . . . . . . . . . . . . . . 54
3.1.1 Bernoullijev pokus i binomna razdioba . . . . . . . . . . . . 58
3.1.2 Poissonova razdioba . . . . . . . . . . . . . . . . . . . . . . 60
3.1.3 Hipergeometrijska razdioba . . . . . . . . . . . . . . . . . . 62
3.1.4 Geometrijska razdioba . . . . . . . . . . . . . . . . . . . . . 63
3.1.5 Pascalova razdioba . . . . . . . . . . . . . . . . . . . . . . . 64
3.1.6 Jednolika distribucija . . . . . . . . . . . . . . . . . . . . . . 64
3.2 Sluµcajna i kontinuirana varijabla . . . . . . . . . . . . . . . . . . . . 65
3.2.1 Kontinuirana sluµcajna varijabla . . . . . . . . . . . . . . . . 65
3.2.2 Oµcekivanje . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.3 Modeli kontinuiranih sluµcajnih varijabli . . . . . . . . . . . . . . . . 67
3.3.1 Normalno distribuirana sluµcajna varijabla . . . . . . . . . . 69
3.4 Primjene sluµcajnih varijabli . . . . . . . . . . . . . . . . . . . . . . 71
5 Intervali povjerenja 84
5.1 Metoda uzoraka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.2 Procjenitelj parametra . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.2.1 Sampling distribucije procjenitelja . . . . . . . . . . . . . . . 90
5.3 Intervali povjerenja . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.3.1 Procjena aritmetiµcke sredine . . . . . . . . . . . . . . . . . . 92
5.3.2 Procjena proporcije . . . . . . . . . . . . . . . . . . . . . . . 95
5.3.3 Procjena varijance . . . . . . . . . . . . . . . . . . . . . . . 96
5.3.4 Procjena razlike sredina pomoću neovisnih uzoraka . . . . . 97
5.3.5 Procjena razlike sredina pomoću ovisnih (uparenih) uzoraka 99
5.3.6 Procjena razlike proporcija . . . . . . . . . . . . . . . . . . . 101
5.4 Odre†ivanje veliµcine uzorka za procjenu parametra . . . . . . . . . 102
iv
UVOD v
Deskriptivna statistika
1
POGLAVLJE 1. DESKRIPTIVNA STATISTIKA 2
Primjer 1.1 Broj svih pravnih osoba u Republici Hrvatskoj na dan 31.03.2001. je
bio 189 576. Ako svakoj pravnoj osobi ispitujemo broj zaposlenika na taj dan de…ni-
rali smo jednu diskretnu numeriµcku omjernu varijablu X : S ! N; gdje je popu-
lacija S konaµcan skup svih pravnih osoba na odre†eni dan. Ako svakoj pravnoj osobi
ispitujemo najmanju ispla´cenu pla´cu za taj mjesec de…nirali smo drugu diskretnu
numeriµcku omjernu varijablu X 0 : S ! R: Ako pak svakoj pravnoj osobi pridruµzimo
njezino sjedište, de…niramo jednu kvalitativnu nominalnu varijablu, dok bi mjesta
na rang listi HGK-e po godišnjoj bilanci de…nirala jednu ordinalnu varijablu.
Više razliµcitih varijabli koje djeluju na istoj populaciji moµzemo promatrati kao
jednu višedimenzionalnu varijablu koju je najprikladnije prikazati matriµcno. Na
primjer, ako je X = (X1 ; :::; Xk ) ; gdje su Xi ; i = 1; :::; k, statistiµcke varijable
POGLAVLJE 1. DESKRIPTIVNA STATISTIKA 3
1
De…nicija 1.2 Broj elemenata skupa X (xi ), i = 1; :::; k; odnosno broj svih
µclanova populacije koji imaju isto obiljeµzje xi nazivamo frekvencijom obiljeµzja
fi
xi i oznaµcujemo sa fi ; a broj pi = N
nazivamo njegovom relativnom frekvenci-
jom ili proporcijom.
P
k P
k
fi
Oµcito vrijedi N = fi i pi = 1; pi = P
k :
i=1 i=1 fi
i=1
Primjerice, ako osobe s1 ; s2 ; :::; s10 tvore neku promatranu populaciju i imaju re-
dom 20; 18; 18; 30; 25; 20; 20; 18; 25; 20 godina, onda obiljeµzja (godine) 18; 20; 25 i
30 imaju redom frekvencije 3; 4; 2; 1.
Primjer 1.3
ili strukturnog kruga. Pripadni kut kruµznog isjeµcka u strukturnom krugu koji
fi
odgovara frekvenciji fi iznosi N
3600 :
Primjer 1.5 U tablici su dani podaci o rastavljenim brakovima prema dobi muµza
u R.H.1999.
Poligon frekvencija je poligonalna crta koju tvore duµzine koje spajaju toµcke µcije
apscise su jednake razrednim sredinama, a ordinate su im (korigirane) frekvencije.
Kumulativne frekvencije razreda tj. vrijednosti kumulativnog niza raµcunamo
pomo´cu originalnih frekvencija. Naime, te vrijednosti se odnose na zbroj frekven-
cija svih obiljeµzja (godina) do godine s kojom završava taj razred: za 1. razred
F (24:5) = f1 = 105; za 2. razred F (29:5) = f1 + f2 = 544; za 3. razred
F (34:5) = f1 + f2 + f3 = 1206... za 9. razred F (79:5) = f1 + + f9 = 3714 = N:
Kumulanta distribucije je poligonalna crta koju tvore duµzine koje spajaju toµcke
µcije apscise su jednake gornjim granicama razreda, a ordinate su im vrijednosti ku-
mulativnog niza. Poµcetna toµcka ima apscisu jednaku donjoj granici prvoga razreda
i ordinatu 0.
POGLAVLJE 1. DESKRIPTIVNA STATISTIKA 13
P
k
f i xi
i=1
= :
N
Ako je numeriµcka varijabla X zadana statistiµckim nizom y1 ; :::; yN , onda je njezina
aritmetiµcka sredina oµcigledno jednaka
P
N
yi
i=1
(y1 ; :::; yN ) = :
N
Ako je distribucija numeriµcke varijable grupirana u (prave) razrede, tada se µcitav
razred identi…cira s razrednom sredinom, tj. xi fi predstavlja umnoµzak frekvencije
L1i +L2i
fi razreda [L1i ; L2i i i razredne sredine xi = 2
: Takvu aritmetiµcku sredinu
nazivamo vaganom.
Primjer 1.8 Dana je distribucija broja dana prema broju odsutnih zaposlenika
nekog poduze´ca u …ksnom periodu:
Broj dana 0 1 2 3 4 5 6 7 8 9 10
Broj odsutnih 4 10 20 27 17 8 8 6 5 3 2 .
Aritmetiµcka sredina numeriµcke varijable koja svakom zaposleniku pridruµzuje broj
4 0+10 1+ +3 9+2 10
dana u kojima je izostao s posla u …ksnom periodu je = 4+10+ +2
=
416
110
= 3:78182:
P
k
i Ni
3115 28:3+3430 2:7+ +4560 23:3 290123:3
Rješenje: = i=1
Pk = 79:5
= 79:5
= 3649:35
Ni
i=1
Zadatak 1.10 Odredite prosjeµcan promet trgovina ako su zadani sljede´ci podaci:
Rješenje:
P
7
xi f i
i=1 3585
= ==
50 50
71:7 tisu´ca kuna
2
De…nicija 1.12 Varijanca numeriµcke varijable X zadane na konaµcnoj pop-
ulaciji je zbroj svih umnoµzaka izme†u kvadrata razlike vrijednosti obiljeµzja xi i ar-
itmetiµcke sredine te varijable i frekvencije fi toga obiljeµzja podijeljen s opsegom
populacije, tj.
Pk
fi (xi )2
2 i=1
= P
k .
fi
i=1
P
k
fi (xi a)2
i=1
Varijanca je minimum svih srednjih vrijednosti kvadratnih odstupanja P
k
fi
i=1
od nekog broja a:
Lako se pokaµze da vrijedi i sljedeća formula za varijancu
2
P
k
1
P
k
f i xi 2 N
f i xi
2 i=1 i=1
= :
N
De…nicija 1.13 Standardna devijacija je drugi korijen iz varijance tj.
v =
uP
u k f (x )2
u i i
u i=1 :
t P k
fi
i=1
P
7
fi x i
175708
Vrijedi: = i=1
P7 = 4712;3
= 37; 29 godine je bila prosjeµcna starost stanovništva
fi
s i=1
P
7
fi (xi )2 q
i=1 2224367:07
i = 4712;3
= 4712:3
21:7 je prosjeµcno odstupanje od te vrijednosti.
POGLAVLJE 1. DESKRIPTIVNA STATISTIKA 18
µ
Teorem 1.15 (Cebišev) Neka su i aritmetiµcka sredina i standardna devi-
jacija bilo koje numeriµcke varijable X : S ! R zadane na konaµcnoj populaciji
1
S, te k 2 R, k > 1. Tada barem 1 k2
100% µclanova ima obiljeµzje koje se
nalazi u intervalu h k ; + k i, tj. zbroj relativnih frekvencija svih obiljeµzja
1
koji pripadaju tom intervalu je najmanje 1 k2
.
µ
Posljedica Cebiševa teorema je da barem 75% elemenata populacije ima numer-
iµcko obiljeµzje u intervalu h 2 ; + 2 i ; barem 89% elemenata je u intervalu
h 3 ; + 3 i ; a barem 93% elemenata je u intervalu h 4 ; + 4 i.
Outlieri su ekstremne vrijednosti varijable koje znatno više od ostalih vri-
jednosti varijable odstupaju od prosjeka. Obiµcno je outlier ona vrijednost koja
µ
odstupa od za više od 4 : Cesto se takve vrijednosti izuzimaju iz analize skupa
prikupljenih podataka jer nisu reprezentativne i mogu biti pogrešne.
P
k
2
Pk
fi (xi ) fi (xi 22:5)2
2 i=1 i=1
Primjer 1.16 U Primjeru 1.11 varijanca je = P
k = 12
=
fi
i=1
2 2 2
1 (10 22:5) +2 (15 22:5) + +1 (40 22:5) 775
12
= 12
= 64:58, a standardna devijacija je =
p
64:58 = 8:04: Primijetimo da svi djelatnici osim jednoga, dakle 91:67% njih,
imaju obiljeµzje u intervalu h 2 ; + 2 i = h6:42; 38:58i. Bez poznavanje poje-
µ
dinaµcnih obiljeµzja, po Cebiševom teoremu, moµzemo samo zakljuµciti da se u istom
intervalu nalazi barem 75% podataka.
Zadatak 1.21 Teµcaj jedne dionice zabiljeµzen u $ na jednoj burzi 25 dana uza-
stopno je: 125; 127; 132; 127; 122; 129; 121; 124; 128; 132; 126; 125; 129; 128; 132; 122;
121; 120; 125; 133; 127; 125; 127; 134; 134. Jedan broker predvi†a da ´ce u vremenu
predvi†enom za prodaju dionica teµcaj iznositi 139 $, a drugi da ´ce u tom istom
vremenu iznositi 133 $. Prosudite rizik procjene za oba brokera.
Rješenje: Moramo pretpostaviti da je trµzište stabilno tj. da je kretanje teµcaja
"normalno", isto kao i za zabiljeµzenih 25 dana. Prosjeµcna cijena za navedeno
3175 416
razdoblje je 25
= 127 $, a standardna devijacija je 45
= 4:079 $. Prog-
139 127
nozirani teµcaj od 139 $ odstupa od prosjeka za 4:079
= 2:94 standardne devi-
jacije, a teµcaj od 133 odstupa 1:47 . To znaµci da prva prognoza nije u intervalu
h127 2:94 ; 127 + 2:94 i što povlaµci (sve uz pretpostavku da je kretanje teµcaja
1
uobiµcajno) da ta cijena nije i ne´ce biti me†u 1 2:942
100% = 88; 43 % svih (i
budu´cih) cijena dionica.Druga cijena nije u intervalu h127 1:47 ; 127 + 1:47 i,
1
tj. nije i ne´ce biti me†u 1 1:472
100% = 53; 7% svih cijena dionica. Oµcito je da
prvi broker više riskira.
ne pripada intervalu h µ
3 ; + 3 i u kojemu se, po Cebiševom teoremu, nalazi
barem 89% pla´ca. Dakle, moµze se re´ci da je ta osoba diskriminirana, jer njezina
pla´ca spada u najviše 11% najlošijih i najboljih pla´ca. Toµcnije, za k = 3:09615; in-
terval h 3:09615 ; + 3:09615 i ; kojemu ne pripada promatrana pla´ca, sadrµzi
1
1 k2
100% pla´ca, što je 89; 57% ukupnih pla´ca.
q
xf11 xfkk :
N
G=
Primijetimo da vrijedi
f1 fk
G = x1N xkN = xp11 xpkk ;
Primijetimo da vrijedi
1 1 1
H= f1 fk = f1 fk = p1 pk ;
+ +
x1
+ + xk N
x1
+ + N
xk
x1 xk
N N
Ova veliµcina se primjenjuje kao adekvatna srednja vrijednost nekih srednjih vri-
jednosti, tj. omjera istih brojnika.
Primjerice ako se vozimo prosjeµcnom brzinom 100 km/h u jednom smjeru, i
2
50 km/h u drugom, prosjeµcna brzina nije 75 km/h već H = 1 1
+ 50
= 66:7 km/h
100
1 1
(razlomke 100
i 50
shvaćamo kao vremena potrebna za prevaliti jediniµcni dio puta,
tj. 1 km, pri brzini 100 km/h odnosno 50 km/h).
Ili, ako domaćinstvu A litra mlijeka prosjeµcno traje 5 dana, domaćinstvu B 10 dana,
a domaćinstvu C 15 dana, onda prosjeµcno trajanje litre mlijeka u ta 3 domaćinstva
3
nije 10 dana, već H = 1 1
+ 10 1
+ 15
= 8:2 (razlomke 51 ; 1
10
i 1
15
shvaćamo kao dio litre
5
mlijeka u domaćinstvima A, B i C redom, koja se potroši za 1 dan).
Primjer 1.23 Ako su zadani prosjeµcni dnevni prometi (u stotinama kuna) u lancu
supermarketa po regijama i struktura vrijednosti prometa u regijama u odnosu na
cijelo podruµcje, izraµcunajte prosjeµcni dnevni promet za cijelo podruµcje.
i-ta regija xi pi 100%
1. sjever 490 35%
2. jug 494 25%
3. središnja regija 500 40%
Kad bi ovi postotci predstavljali ukupan udio broja supermarketa ni i-te regije
ni
u njihovom ukupnom broju N = n1 + n2 + n3 , tj. pi = N
, onda bi ukupan prosjeµcni
POGLAVLJE 1. DESKRIPTIVNA STATISTIKA 23
dnevni promet bio x1 p1 + x2 p2 + x3 p3 = 490 0:35 + 494 0:25 + 500 0:4: No, postotci
Pn1
(1) P (2) P (3)
n2 n3
predstavljaju udio prometa xk ; xk ; xk svih n1 ; n2 ; n3 supermarketa 1.,
k=1 k=1 k=1
P
N P
n1
(1) P
n2
(2) P
n3
(3)
2. odnosno 3. regije redom, u ukupnom prometu xk = xk + xk + xk
k=1 k=1 k=1 k=1
P
ni
(i)
xk
svih supermarketa. Dakle vrijedi pi = k=1
P
N ; i = 1; 2; 3: Stoga je prosjek jednak
xk
k=1
P
n1
(1)
Pn2
(2)
P
n3
(3)
P
N
xk + xk + xk xk
k=1 k=1 k=1 k=1 1
N
= N
= n1 +n2 +n3 =
NP
xk
k=1
1 1 1 1
n1
+
n2
+
n3 = P
n1 P
n2 P
n3 = p1 p p
+ x2 + x3
= 0:35
+ 0:25 + 0:40
= H =
PN P
N P
N
x1 x2 x3
x1 2 3 490 494 500
xk xk xk k k k
k=1 k=1 k=1
k=1 k=1 k=1 PN PN PN
xk xk xk
k=1
+ k=1 + k=1
Pn1 Pn2 Pn3
x1 x2 x3
k k k
k=1 k=1 k=1
n1 n2 n3
494:96:
1.2.6 Momenti
Neka je X : S ! X (S) = fx1 ; x2 ; :::; xk g R numeriµcka varijabla zadana na
konaµcnom skupu, opsega N , s vrijednostima y1 ; :::; yN ; distribucijom
P
k P
N
fi xri yir
i=1 i=1
Sliµcno, r-ti pomoćni moment oko nule de…niramo kao: mr = P k = N
:
fi
i=1
Primijetimo da je m1 = .
1.2.7 Mod
Mod, u oznaci Mo , je ono obiljeµzje statistiµcke varijable koje ima najveću frekven-
ciju. Moµzemo reći da je to obiljeµzje koje se najµcešće javlja. Odre†uje se za kvali-
tativna i kvantitativna obiljeµzja.
Ako je distribucija numeriµcke varijable grupirana u (prave) razrede, onda se
razred s najvećom korigiranom frekvencijom b naziva modalni razred. Ako je
L1 donja granica toga razreda, a l njegova veµcina, te a frekvencija razreda koji
prethodi modalnom, a c frekvencija razreda koji slijedi iza modalnoga, onda se
(b a)
mod aproksimira formulom Mo = L1 + (b a)+(b c)
l:
Primijetimo da mod općenito nije jedinstven, odnosno više razliµcitih vrijednosti
neke statistiµcke varijable µcije frekvencije su maksimalne i me†usobno jednake mogu
biti njezin mod.
Zadatak 1.24 U tablici su zadani podaci o dobi majki µzivoro†ene djece u Republici
Hrvatskoj u 1999. godini. Odredite mod (dob majki s najve´cim brojem µzivoro†ene
djece).
1.2.8 Medijan
Neka je y1 ; :::; yN grupirani statistiµcki niz, tj. neka su to sve vrijednosti numeriµcke
varijable za svih N µclanova populacije poredane po ure†aju y1 6 6 yN . Neka je
N
r = Int 2
+ 1; gdje Int oznaµcuje cijelu vrijednost broja bez decimala (primjerice
Int 6:9 = 6). U sluµcaju da je N neparan, medijan M e de…niramo kao vrijednost
yr središnjeg (r-tog) µclana niza . U sluµcaju da je N paran medijan de…niramo
yr 1 +yr
kao poluzbroj vrijednosti središnjih µclanova, tj. Me = 2
: Medijan ima smisla
raµcunati i za ordinalne varijable.
Medijan ima svojstvo da je zbroj apsolutnih odstupanja svih vrijednosti vari-
jable od nekog …ksnog broja minimalan upravo za medijan. U nizu od 100 bro-
jeva s vrijednošću 10 i jednog broja 20 medijan je 10. Iz njegovog tumaµcenja
da prva polovica µclanova niza ima vrijednost 6 10 a druga polovica vrijednosti
> 10 uoµcavamo manjkavosti poloµzajnih srednjih vrijednosti. U ovom primjeru je
Mo = 10, a = 10:099:
Aritmetiµcku sredinu smijemo zamišljati kao teµzište poligona frekvencija, mod kao
toµcku u bazi u kojoj je poligon najviši, a medijan kao toµcku u bazi u kojoj okomiti
pravac dijeli poligon frekvencija na dva dijela jednakih površina.
POGLAVLJE 1. DESKRIPTIVNA STATISTIKA 26
N
Rješenje: Budu´ci je N = 341730; a 2
= 170865, to je razred (25 30) s
kumulativnom frekvencijom 235471 medijalni razred. Stoga je L1 = 25; fmed =
N
F (25)
119819; l = 5 i F (25) = 115652. Slijedi da je medijan Me = L1 + 2
fmed
l =
27:304. Zakljuµcujemo da je dob prve polovice osoba prijavljenih na HZZ-e iznosila
27 ili manje godina, a druga polovica prijavljenih osoba je bila starija od 27 godina.
1.2.9 Kvantili
Neka je y1 ; :::; yN grupirani statistiµcki niz tj. neka su to sve vrijednosti numer-
iµcke varijable za svih N µclanova populacije poredane po ure†aju y1 6 6 yN .
Oznaµcimo r = Int j Nn + 1. Kvantili reda n su vrijednosti K1 ; :::; Kn 1 koje
raµcunamo po formuli
(
yr ; j Nn 2=N
Kj = yr 1 +yr N
; j = 1; :::; n 1:
2
; j n
2 N
j Nn F (L1 )
Kj = L1 + l: (1)
fkvant
Primjer 1.29 U donjoj tablici su zadani podaci o pla´cama zaposlenika jednoga
poduze´ca u eurima grupirani po platnim razredima.
Primijetimo da umjesto (kumulativnih) frekvenija fi smijemo promatrati (kumala-
fi
tivne) postotke pi 100 = N
100: Stoga, mnoµze´ci brojnik i nazivnik razlomka iz for-
100
mule (1) sa N
dobivamo formulu
F (L1 ) F (L1 )
j Nn 100
N N
100 j 100
n N
100
Kj = L1 + fkvant
l = L1 + l;
N
100 pkvant 100
gdje je pkvant proporcija j-tog kvantilnog razreda reda n, tj. proporcija prvog po
redu razreda µciji je kumulativni postotak ve´ci ili jednak j 100
n
: Iz N
4
= 25; 2 N4 = 50;
3 N4 = 75 proizlazi da je 1: kvartilni razred 1500:5 1700:5, medijalni razred je
1700:5 1900:5, a 3: kvartilni razred je 1900:5 2100:5. Nadalje, vrijedi Q1 =
1500:5 + 2516:5
21:7
200 = 1540:5; Me = 1700:5 + 5023:8
38:2
200 = 1799:7; Q3 = 1900:5 +
75 62
14:9
200 = 2075: Moµzemo zakljuµciti da do µcetvrtine zaposlenika ima pla´cu manju
od 1540:5 e, do polovine zaposlenika ima pla´cu manju od 1799:7 e, dok do µcetvrtine
POGLAVLJE 1. DESKRIPTIVNA STATISTIKA 29
Vjerojatnost
De…nicija 2.1 Skup kojega tvore svi mogu´ci ishodi nekog pokusa nazivamo pros-
torom elementarnih doga†aja toga pokusa i oznaµcujemo sa : Doga†aj je
neki odre†eni podskup prostora elementarnih doga†aja . Jednoµclani doga†aj f!g
nazivamo elementarnim doga†ajem tj. to je svaki doga†aj koji se ne moµze
32
POGLAVLJE 2. VJEROJATNOST 33
iskljuµcivi ako je A \ B = ;.
Neka neki sluµcajni pokus ponovimo n puta i neka se pri tome doga†aj A dogodi
nA
nA puta. Tada broj fn (A) = n
nazivamo relativnom frekvencijom doga†aja
A u n ponavljanja pokusa. Pri malom broju ponavljanja pokusa relativna
frekvencija doga†aja nosi u sebi sluµcajni karakter i moµze se znaµcajno mijenjati od
jedne do druge serije pokusa. Ako pri uvećanju broja ponavljanja pokusa relativna
frekvencija sve više gubi sluµcajni karakter i sve više se grupira oko odre†enog broja
onda taj broj nazivamo statistiµcka ili a posteriori vjerojatnost doga†aja A
i oznaµcujemo ga sa p (A) : Dakle vrijedi p (A) = lim fn (A) : U praksi statistiµcku
n!1
vjerojatnost koristimo ako nije moguće doći do matematiµcke vjerojatnosti (a priori)
i obiµcno ju aproksimiramo relativnom frekvencijom fn (A) koja je to bolja što je n
(broj ponavljanja pokusa) veći.
Ako su A i B me†usobno iskljuµcivi doga†aji, onda je nA[B = nA + nB ; pa iz
nA[B nA nB
fn (A [ B) = n
= n
+ n
= fn (A) + fn (B) zakljuµcujemo da je
nAc n nA nA
Nadalje, iz nAc = n nA slijedi fn (Ac ) = n
= n
=1 n
=1 fn (A) ; pa
zakljuµcujemo da je
Primjer 2.5 Ako je u tijeku jedne godine proizvedeno 500 000 komada nekog ure-
†aja, od kojih je 5 000 bilo odmah neispravno, a 1 000 se pokvarilo tijekom pr-
voga tjedna, i ako pretpostavimo da se proizvodnja nastavlja u nepromijenjenim
POGLAVLJE 2. VJEROJATNOST 36
Zadatak 2.8 U sijeµcnju 1992. je u R.H. ostvareno 191 018 no´cenja i to: gostiju iz
R.H. 137 921, iz republika ex. SFRJ (bez R.H.) 29 191 i iz ostalih stranih zemalja
23 906. Kolika je vjerojatnost da je sluµcajno odabrano no´cenje ostvarila osoba koja
nije iz R.H.?
POGLAVLJE 2. VJEROJATNOST 37
Rješenje: Ishod ovoga sluµcajnoga odabira moµze biti bilo koje od 191 018 no-
1
´cenja s jednakom vjerojatnoš́cu 191018
: Ako je A doga†aj da je no´cenje ostvarila
osoba koja je iz neke republike ex. SFRJ, a B osoba iz neke druge strane zemlje,
29191 23906
onda je p (A) = 191018
= 0:15282; p (B) = 191018
= 0:12515; pa je p (A [ B) =
137921
p (A) + p (B) = 0:27797: Primijetimo da je p (A [ B) = 1 191018
:
Primjer 2.9 De Mere je biljeµzio rezultate igre koja se sastojala od bacanja 3 ra-
zliµcite kocke. Promatrao je doga†aj A1 da je ukupan zbroj brojeva na 3 kocke
jednak 11 i doga†aj A2 da je ukupan zbroj brojeva na kockama jednak 12. De Mere
je ustanovio da se doga†aj A1 pojavljuje µceš́ce nego A2 , a smatrao je da bi se ta
dva doga†aja trebali pojavljivati podjednako µcesto. Naime, doga†aj A1 se sastoji
od 6 mogu´cnosti pojavljivanja brojeva u jednom bacanju, tj. od 6 kombinacija:
6; 4; 1; 6; 3; 2; 5; 5; 1; 5; 4; 2; 5; 3; 3; 4; 4; 3 i doga†aj A2 se sastoji od 6 kombinacija:
6; 5; 1; 6; 4; 2; 6; 3; 3; 5; 5; 2; 5; 4; 3; 4; 4; 4. Grešku u zakljuµcivanju je našao Pascal
koji je dokazao da ishodi koje je naveo De Mere nisu jednako vjerojatni. Naime,
prostor elementarnih doga†aja za ovaj pokus je = f(i; j; k) j i; j; k = 1; :::; 6g.
1 1
Svi elementarni doga†aji su jednako vjerojatni i vjerojatnost im je 63
= 216
: Do-
ga†aj da su se na kockama pojavili brojevi 6, 4 i 1 se moµze rastaviti na sljede´ce
ishode: (1; 4; 6) ; (1; 6; 4) ; (4; 1; 6) ; (4; 6; 1) ; (6; 1; 4) i (6; 4; 1) ; pa je odgovaraju´ca
6
vjerojatnost jednaka 216
: Doga†aj da se na kockama pojave brojevi 4; 4; 4 se samo
1
sastoji od ishoda (4; 4; 4), pa je njegova vjerojatnost jednaka 216
. Doga†aj da se
na kockama pojave brojevi 6; 3; 3 se sastoji od ishoda: (6; 3; 3) ; (3; 6; 3) ; (3; 3; 6),
3
pa je odgovaraju´ca vjerojatnost jednaka 216
. Zbrajanjem odgovaraju´cih doga†aja
27 25
dobijemo p (A1 ) = 216
i p (A2 ) = 216
.
pluteni zid pred nama, kojemu je površina 10, u metu istaknutu na tomu zidu
površine 2. Vjerojatnost pogotka mete je jednak kvocijentu površina (mjera) tih
2
dvaju skupova (zida i mete) tj. 10
= 0:2: Vjerojatnost pogotka bilo kojega dijela
ciljanog zida µcija je površina jednaka 0 je ništiµcna. Primjerice, vjerojatnost da se
pogodi unaprijed odre†ena toµcka na zidu ili duµzina (ovi objekti su 0-dimenzionalni,
odnosno 1-dimenzionalni, pa su površine 0) jednaka je 0: Iako ovi doga†aji nisu
nemogući (razlikuju se od ;), njihova vjerojatnost je 0, što se donekle opire našoj
percepciji vjerojatnosti.
; 2 F;
POGLAVLJE 2. VJEROJATNOST 39
A 2 F ) Ac 2 F;
S
1
Ai 2 F; i 2 N ) Ai 2 F.
i=1
A B ) p (A) p (B) ;
p (AnB) = p (A) p (A \ B) :
p ( ) = p (f! 1 g [ f! 2 g [ f! 3 g) = p (! 1 ) + p (! 2 ) + p (! 3 ) = 1:1;
Primjer 2.13 U nekom mjestu ima 4111 stanovnika. Od toga su 3998 hrvatski
drµzavljani, a njih 750 ima strano drµzavljanstvo. Kolika je vjerojatnost da sluµcajno
odabrani stanovnik toga mjesta ima uz hrvatsko, drµzavljanstvo barem još jedne
zemlje?
Prostor elementarnih doga†aja ovog sluµcajnog pokusa se sastoji od svih stanovnika
mjesta, tj. elementarni doga†aj je da je odabran jedan stanovnik od njih 4111. Do-
ga†aj A je da odabrani stanovnik ima hrvatsko drµzavljanstvo, doga†aj B je da ima
strano drµzavljanstvo, a doga†aj A \ B je da ima i hrvatsko i neko strano drµzavl-
janstvo. Tada je
3998 750
1 = p ( ) = p (A) + p (B) p (A \ B) = 4111
+ 4111 p (A \ B) ) p (A \ B) =
0:9725 + 0:1824 1 = 0:154 9:
Primjer 2.15 Pokus se sastoji od uzastopnog bacanja jednog novµci´ca. Ishod pokusa
je broj bacanja do prvog nastupa pisma. Pripadni vjerojatnosni prostor se sastoji od
POGLAVLJE 2. VJEROJATNOST 41
Broj p (ha; bi) odgovara površini izme†u intervala ha; bi na osi x i krivulje y = f (x) :
Vjerojatnost doga†aja fag (bilo kojeg jednoµclanog, a onda i konaµcnog skupa) je
uvijek nula tj. p (fag) = 0 (površina štapića x = a).
POGLAVLJE 2. VJEROJATNOST 43
Zadatak 2.19 Ako vjerojatnost ima standardnu normalnu razdiobu, odredite vjero-
jatnost da je broj z upao u interval h0; 1:61i ; h 2; 2i, h 2; 0:5i, h0; 1i, h1:11; 1i
i h 1; 3:075i :
Rješenje: p (h0; 1:61i) = 0:4463; p (h 2; 2i) = 2p (h0; 2i) = 2 0:4772 = 0:954 4;
p (h 2; 0:5i) = p (h 2; 0i)+p (h0; 0:5i) = p (h0; 2i)+p (h0; 0:5i) = 0:4772+0:1915 =
0:668 7;
p (h0; 1i) = 0:5; p (h1:11; 1i) = p (h0; 1i) p (h1:11; 1i) = 0:5 0:3665 = 0:133 5;
p (h 1; 3:075i) = p (h3:075; 1i) = p (h0; 1i) p (h0; 3:075i) = 0:5 0:49895 =
0:001 05:
POGLAVLJE 2. VJEROJATNOST 44
Zadatak 2.20 Ako vjerojatnost ima standardnu normalnu razdiobu, odredite vri-
jednost z takvu da je p (h z; zi) = 0:9. Odredite vrijednost z > 0 takvu da je
p (hz; 1i) = 0:005 i takvu da je p (h 1; zi) = 0:975.
Rješenje: p (h z; zi) = 0:9 ) p (h0; zi) = 0:45 2 h0:4495; 0:4505i ) z 1:645;
p (hz; 1i) = 0:005 ) p (h0; zi) = 0; 495 2 h2:57; 2:58i ) z 2:575;
p (h 1; zi) = 0:975 ) p (h 1; 0i) + p (h0; zi) = 0:975 ) p (h0; zi) = 0:475 )
z = 1:96.
POGLAVLJE 2. VJEROJATNOST 45
Zadatak 2.21 Ako vjerojatnost ima Studentovu razdiobu s 12, odnosno 13 stupn-
jeva slobode, odredite t > 0 takav da je p (h t; ti) = 0:95: Posebno odredite t takav
da je p (h 1; ti) = 0:995:
Rješenje:
= p (ht; 1i) t
12 (1 0:95) =2 = 0:025 2:179
12 1 0:995 = 0:005 3:055
13 0:025 2:160
13 0:005 3:012
POGLAVLJE 2. VJEROJATNOST 46
2
Kaµzemo da vjerojatnost kojoj je gustoća -funkcija s stupnjeva slobode ima
2
-razdiobu s v stupnjeva slobode.
2
U donjoj tablici su prikazane vjerojatnosti = p (h ; 1i) ; tj. površine ispod
2 2
-krivulje, izme†u pravca x = i osi x.
2
Zadatak 2.22 Ako vjerojatnost ima -razdiobu s 10 stupnjeva slobode, odredite
2 2 2 2
1; 2 > 0 takav da je p (h0; 1 i) = 0:05 = p (h 2 ; 1i) :
2
Rješenje: p (h0; 1 i) = 0:05 ) p (h0; 1i) p (h 21 ; 1i) = 0:05 ) p (h 2
1 ; 1i) =
1 0:05 = 0:95
2 2
) 1 = 3:94; 2 = 18:31:
POGLAVLJE 2. VJEROJATNOST 48
Zadatak 2.28 Od 5 kljuµceva samo jedan otvara vrata. Odredite vjerojatnost do-
ga†aja da su potrebna 3 pokušaja da se otvore vrata.
Rješenje: Ako je Ai doga†aj da ´ce se vrata otvoriti u i-tom pokušaju, onda
je traµzeni doga†aj Ac1 \ Ac2 \ A3 ; pa je
431 1
p (Ac1 \ Ac2 \ A3 ) = p (Ac1 ) p (Ac2 jAc1 ) p (A3 j (Ac1 \ Ac2 )) = = :
543 5
Primjer 2.29 Izvodimo pokus bacanja dviju kocki. Ispitajte neovisnost doga†aja:
na prvoj kocki je pao broj 1, a na drugoj broj 2. Nadalje, ako doga†aj A predstavlja
da je na 1: kocki palo 2; 3 ili 4, doga†aj B predstavlja da je na 2: kocki palo 4; 5 ili 6,
a doga†aj C predstavlja da je ukupan zbroj 10, ispitajte neovisnost ovih doga†aja.
Prostor elementarnih doga†aja je = f(i; j) j i; j = 1; :::; 6g pa je p (f(i; j)g) =
1
36
. Budu´ci da doga†aji da je na 1: kocki pao broj i, a na drugoj broj j imaju
6 1 6 6
vjerojatnost 36
, to iz 36
= 36 36
zakljuµcujemo da su oni neovisni. Doga†aji A i B
imaju po 18 povoljnih ishoda, dok je C = f(4; 6) ; (6; 4) ; (5; 5)g : Vrijedi
9
p (A \ B) = 36
= 41 = p (A) p (B) = 18 18
36 36
; p (A \ C) = 1
36
6= p (A) p (C) = 18 3
36 36
;
3
p (B \ C) = 36 6= p (B) p (C) = 18 3
36 36
;
1
p (A \ B \ C) = 36 6= p (A) p (B) p (C) :
Rješenje:
3098 + 5309
p (B2 \ (A3 [ A2 )) = = 0:1189;
70703
1614
p (B1 \ A3 ) 70703
p (B1 jA3 ) = = 4712 = 0:3425:
p (A3 ) 70703
1132
Budu´ci je p (A1 \ B1 ) = 70703
= 0:016;
2907 37618
a p (A1 ) p (B1 ) = 70703 70703
= 0:0219, to su ovi doga†aji ovisni.
je pao broj 2" i tumaµcimo ga kao doga†aj: "na kocki je pao paran broj i pao je broj 1
ili 2". S druge strane doga†aj H1 jA se tako†er sastoji od istoga ishoda a tumaµcimo
kao doga†aj: "na kocki je pao broj 1 ili 2 uz uvjet da znamo da je pao paran broj".
Skupovno su doga†aji A\H1 i H1 jA jednaki, no razliku uoµcavamo tek promatraju´ci
ih kao doga†aje vjerojatnosnih prostora ( ; F; p) i (A; FA = fA \ X j X g ; pA )
1
redom. Vjerojatnost prvog doga†aja je p (A \ H1 ) = 6
; a (uvjetna) vjerojatnost
1
1 p(A\H1 )
drugog doga†aja je pA (H1A ) = 3
što je jednako p (H1 jA) = p(A)
= 61 :
2
Primjer 2.33 Sijalica moµze pripadati trima raznim serijama S1 ; S2 i S3 , pri µcemu
su p1 = 0:25; p2 = 0:5 i p3 = 0:25 vjerojatnost da sijalica pripada seriji S1 ; S2 i
S3 ; redom. Vjerojatnost da ´ce sijalica iz S1 sijati barem 1000 sati je 0:1, iz S2 je
0:2; a iz S3 je 0:4: Odredite vjerojatnost doga†aja da ´ce sluµcajno izabrana sijalica
sijati barem 1000 sati. Nadalje, ako je poznato da je sijalica sijala barem 1000 sati
odredite vjerojatnost da je ona iz tre´ce serije.
Ako je A doga†aj da je sluµcajno odabrana sijalica sijala barem 1000 sati, a
Hi doga†aj da sijalica pripada seriji Si , i = 1; 2; 3; onda vrijedi A = (A \ H1 ) [
(A \ H2 ) [ (A \ H3 ) i H1 ; H2 i H3 µcine sistem potpunih doga†aja. Stoga vrijedi
p (A) = p (A \ H1 ) + p (A \ H2 ) + p (A \ H3 ) )
p (A) = p (H1 ) p (AjH1 ) + p (H2 ) p (AjH2 ) + p (H3 ) p (AjH3 ) =
0:25 0:1 + 0:5 0:2 + 0:25 0:4 = 0:225:
Napokon, vjerojatnost da sluµcajno odabrana sijalica iz skupa onih koji ´ce sijati
barem 1000 sati bude iz serije S3 je p (H3 jA) = p(H3 )p(AjH3 ) = 0:25 0:4 = 0:4:
p(A)
_
0:225
Zadatak 2.34 Na ispit je izašlo 70% studenata koji polaµzu prvi put. Na prethod-
nom roku od 100 studenata koji su izašli prvi put prošlo ih je 50, a od 50 studenata
koji su i prije izlazili na ispit prošlo je njih 20. Odredite vjerojatnost da ´ce sluµcajno
odabrani student na novom roku pro´ci ispit, te vjerojatnost da je sluµcajno odabrani
iz skupine studenata koji su ve´c polagali taj ispit, ako znamo da je taj student
poloµzio ispit .
POGLAVLJE 2. VJEROJATNOST 53
Sluµcajna varijabla
54
µ
POGLAVLJE 3. SLUCAJNA VARIJABLA 55
Vrijedi 2
= E (X )2 = (x1 )2 p1 + (x2 )2 p2 + :
Primjer 3.5 Neka se pokus sastoji u bacanju novµci´ca 3 puta zaredom i neka sluµca-
jna varijabla biljeµzi koliko puta je palo pismo. Ova sluµcajna varijabla X je de…ni-
rana na vjerojatnosnom prostoru ( ; P (X) ; p) gdje je =
f(i; j; k) j i; j; k = 0; 1g : Prostor elementarnih doga†aja se sastoji od ishoda ! 1 =
(0; 0; 0) (niti jednom nije palo pismo), ! 2 = (0; 0; 1) (samo jednom, u tre´cem ba-
canju je palo pismo), ! 3 = (0; 1; 0) ; ! 4 = (0; 1; 1) ; ! 5 = (1; 0; 0) ; ! 6 = (1; 0; 1),
! 7 = (1; 1; 0) ! 8 = (1; 1; 1) : Sluµcajna varijabla poprima ove vrijednosti X (! 1 ) = 0;
X (! 2 ) = X (! 3 ) = X (! 5 ) = 1; X (! 4 ) = X (! 6 ) = X (! 7 ) = 2 i X (! 8 ) = 3; a
pripadne vjerojatnosti su
1 3
p (X = 0) = = p (X = 3) ; p (X = 1) = = p (X = 2) ;
8 !
8
0 1 2 3
što kratko zapisujemo kao X = 1 3 3 1
:
8 8 8 8
Primjerice, doga†aj da sluµcajna varijabla poprima vrijednost ve´cu od 1 pišemo
3 1
(X > 1) = (X = 2) [ (X = 3) i on ima vjerojatnost p (X > 1) = 8
+8
= 0:5:
Oµcekivanje ove sluµcajne varijable je E [X] = 0+ 38 1
8
1+ 382+ 18 3= 12
8
= 3
2
= 1:5:
Varijanca je 2
= 1
8
(0 1:5)2 + 83 (1 1:5)2 + 83 (2 1:5)2 + 81 (3 1:5)2 = 0:75:
Svaku diskretnu sluµcajnu varijablu koja poprima vrijednosti iz skupa f0; 1; :::; ng ;
a za koju postoje p i n takvi da joj je distribucija B fn; pg nazivamo binomnom
sluµcajnom varijablom.
Broj p (k) oznaµcuje vjerojatnost da se u n ponavljanja pokusa doga†aj A dogodi
toµcno k puta.
Primjerice, vjerojatnost da u 5 bacanja kocke 2 puta padne broj 6 je p (X = 2) =
5! 1 2 5 3 625
2!3! 6 6
= 3888
0:16:
Na slici su prikazane binomne distribucije B f5; 0:5g ; B f5; 0:25g i B f5; 0:1g :
Primjer 3.9 Iz kutije koja sadrµzi 4 bijele i 6 crnih kuglica izvlaµcimo 5 puta za
redom po jednu kuglicu i vra´camo ju u kutiju. Kolika je vjerojatnost da smo toµcno
3 puta, odnosno najviše 3 puta, izvukli bijelu kuglicu? Koje je oµcekivanje sluµcajne
varijable koja registrira broj povoljnih ishoda u 5 izvlaµcenja?
4
Ova sluµcajna varijabla je binomna s distribucijom B 5; 10 . Traµzene vjerojat-
5! 4 3 6 2 144
nosti su p (X = 3) = 3! 2! 10 10
= 625
= 0; 2304;
5! 4 4 6 1
p (X 3) = 1 p (x > 3) = 1 p (X = 4) p (X = 5) = 1 4! 1! 10 10
5! 4 5 6 0 2853
5! 0! 10 10
= 3125
0:913.
Oµcekivanje je E [X] = np = 2:
Zadatak 3.11 Ako se bacaju dvije kocke istovremeno 30 puta, odredite oµcekivani
broj dobitka broja 3 i 4 u istom bacanju.
2 1
Rješenje: Vjerojatnost da padnu 3 i 4 u istom bacanju je p = 36 = 18 =
_ Sluµcajna varijabla koja registrira broj dobitka para 3 i 4 u 30 bacanja je
0:05.
binomna s distribucijom B 30; 0:05_ : Distribucija je zadana formulom
30! 30 k
p (X = k) = 0:05_ k 1 0:05_ :
k! (30 k)!
gripe u nekom …ksnom periodu, broj autobusa koji do†u na stajalište u nekom
…ksnom vremenu, broj meteora vidljivih kroz neko …ksno vrijeme, broj gledatelja
odre†ene utakmice, broj umrlih stanica u dijelu organizma u nekom …ksnom vre-
menu, broj µcestica nastalih u nekom …zikalnom eksperimentu...
Kod navedenih primjera parametar Poissonove razdiobe se u svakom pojedi-
nom sluµcaju odre†uje eksperimentalno u ovisnosti o promatranom uzorku (izjed-
naµcimo oµcekivanje = s aritmetiµckom sredinom uzorka).
Na slici su prikazane Poissonave distribucije za parametre = = 1; 2; 3; 4:
Primjer 3.14 Ako je srednja vrijednost dolazaka autobusa na istu stanicu u odre-
†enom vremenskom intervalu u nekoliko tjedana promatranja jednaka 3, odredite
vjerojatnost da u tom razdoblju ne do†e niti jedan autobus, da ih do†e 3, te da ih
do†e 4.
µ
POGLAVLJE 3. SLUCAJNA VARIJABLA 62
Varijabla koja biljeµzi koliko je bacanja dviju kocki potrebno dok ne padnu
_
istovremeno dvije šestice je geometrijska sluµcajna varijabla s p = 1 = 0:027: 36
_ p (X = 2) = 0:027_ 1 0:027_
Primjerice p (X = 1) = 0:027; 0:0262;
2 3
p (X = 3) = 0:027_ 1 0:027_ 0:255; p (X = 4) = 0:027_ 1 0:027_
0:0248;
9
p (X = 10) = 0:027_ 1 0:027_ 0:0211:
35
Oµcekivanje je =1+ 36
1 = 36.
36
Primjer 3.19 Izraµcunajte oµcekivani broj bacanja kocke dok se šestica ne pojavi 3
puta, te vjerojatnost da je bilo potrebno najviše 4 bacanja za to.
5
Poznato je: n = 3; p = 16 = 0:16. _ Stoga je E [X] = 3 1 + 6
1 = 18;
6
p (X 4) = p (X = 3) + p (X = 4) 0:1673 + 3 0:1673 (1 0:167) = 0:016296.
a isto tako da je diskretna ona koja moµze poprimiti samo konaµcno ili prebrojivo
mnogo vrijednosti. U nastavku ćemo pod sluµcajnom varijablom podrazumijevati
diskretnu ili kontinuiranu sluµcajnu varijablu.
Funkcija distribucije neprekidne sluµcajne varijable X gustoće f je dana sa
Rx0
FX (x0 ) = f (x) dx:
1
R1 Rx0
Vrijedi 1 = p (X 2 R) = f (x) dx i p (X = x0 ) = 0 = f (x) dx.
1 x0
3.2.2 Oµcekivanje
De…nicija 3.24 Oµcekivanjem neprekidne sluµcajne varijable X gusto´ce f nazi-
R1
vamo broj (ako postoji) = E [X] = xf (x) dx; a odgovaraju´com standard-
1 s
R1
nom devijacijom nazivamo broj = D [X] = (x )2 f (x) dx, odnosno
1
2
varijancom broj = V ar [X] :
µ
Teorem 3.26 (Cebišev) Neka je X sluµcajna varijabla s oµcekivanjem i stan-
dardnom devijacijom ; te k 2 R; k > 1: Tada je p (X 2 h k ; + k i) >
1
1 k2
.
Primjer 3.27 Ako sluµcajna varijabla trajnosti auto guma nekog proizvo†aµca ima
oµcekivanje 40000 km i devijaciju 4000; kolika je najmanja vjerojatnost da ´ce gume
trajati izme†u 34000 i 46000 km?
34000 40000
Na†imo najprije standardizirane vrijednosti z1 = 4000
= 1:5 i
46000 40000
z2 = 4000
= 1:5: Traµzena vjerojatnost je
µ
i ona je, po Cebiševom teoremu, ve´ca od 1 1 _
= 0:5:
1:52
2 2
-funkcija s
stupnjeva slobode. Za takvu varijablu kaµzemo da je -
p
distribuirana, njezino oµcekivanje je = , a devijacija je = 2 ;
Primjer 3.28 Neki stroj neprekidno puni butelje µcija zapremina moµze biti bilo
koja vrijednost izme†u 0:7 i 0:755 dcl. Ako pretpostavimo da su te vrijednosti
neprekidno uniformno distribuirane, onda je oµcekivana vrijednost sluµcajne varijable
a+b
koja biljeµzi zapreminu = 2
= 0:725 dcl. Vjerojatnost da je zapremina sluµcajno
odabrane boce ve´ca od 0:75 je
R
0:755
1 1 0:755 0:75 0:005
p (X > 0:75) = 0:755 0:7
dx = xj0:755
0:055 0:75
= 0:055
= 0:055
0:09:
0:75
Glavna krakteristika ovoga modela sluµcajne varijable koja opisuje navedeni proizvodni
proces jest da je vjerojatnost da napunjena boca ima zapremninu iz nekog intervala
širine d uvijek ista, za svaki interval širine d; tj.
p (t < X < t + d) = p (t0 < X < t0 + d) ; za svaki t 2 [0:75; 0:7] ; d 2 R:
Primjer 3.29 Vrijeme posluµzivanja neke stranke na jednom šalteru banke u pros-
jeku iznosi 10 minuta. Ako je utrošak vremena po stranci na tom šalteru ekspo-
1 1
nencijalno distribuirana sluµcajna varijabla, onda (stavljaju´ci da je = = 10
)
je vjerojatnost da usluµzivanje sluµcajno prispjele stranke bude do 6 minuta jednaka
R6 1 1 1
p (X < 6) = 10 e 10 x dx = e 10 x j60 = e 0:6 + 1 0:451:
0
Glavna krakteristika ovoga modela sluµcajne varijable koja opisuje navedenu situaciju
jest da je vjerojatnost da vrijeme opsluµzivanja stranke bude iz nekog intervala
[a; a + d] uvijek ve´ca od vjerojatnosti da vrijeme opsluµzivanja stranke bude iz nekog
intervala [b + d; b + d] ; za svaki a < b; d 2 R.
2
Primjer 3.30 Sluµcajna varijabla koja je -distribuirana s 20 stupnjeva slobode
p
ima oµcekivanje = 20; a devijaciju jednaku = 2 10. Vjerojatnost da je vrijed-
nost sluµcajne varijable manja od 39.9968 je p (X < 39:9968) = 1 p (X > 39:9968) =
1 0:005 = 0:995; a vjerojatnost da je izme†u 34.1696 i 39.9968 je
p (X 2 h34:1696; 39:9968i) = p (X > 34:1696) p (X > 39:9968) = 0:025 0:005 =
µ
POGLAVLJE 3. SLUCAJNA VARIJABLA 69
0:02:
µ
Zadatak 3.31 Caj se pakira u vre´cice nominalne mase 50 g. Masa vre´cica je
normalno distribuirana sluµcajna varijabla s oµcekivanjem jednakim nominalnoj masi
i devijacijom od 2 g. Ako se sluµcajno odabere vre´cica, kolika je vjerojatnost da je
njezina masa manja od 51 g, te izme†u 48 i 49 g?
µ
POGLAVLJE 3. SLUCAJNA VARIJABLA 70
51 50
Rješenje: p (X < 51) = p Z < 2
= p (Z < 0:5) = p (Z < 0) +
p (0 Z < 0:5) = 0:5 + 0:1915 = 0:6915
p (48 < X < 49) = p ( 1 < Z < 0:5) = p ( 1 < Z < 0) p ( 0:5 < Z < 0) =
p (0 < Z < 1) p (0 < Z < 0:5) = 0:3413 0:1915 = 0:149 8:
µ
Primjedba 3.33 Cesto puta se neprecizno i za diskretnu sluµcajnu varijablu X
kaµze da je distribuirana razdiobom neke kontinuirane sluµcajne varijable µcija je gus-
to´ca f , primjerice, da je normalno distribuirana. No, to zapravo podrazumijeva da
se skup toµcaka f(x1 ; p1 ) ; (x2 ; p2 ) ; :::g distribucije te sluµcajne varijable X nalazi na
grafu funkcije gusto´ce f i da ove dvije varijable imaju jednaka (ili pribliµzno jed-
naka) oµcekivanja i varijance. Napose, svaku statistiµcku numeriµcku varijablu zadanu
na konaµcnom skupu, ili op´cenitije svaku diskretnu statistiµcku numeriµcku varijablu,
moµzemo konvertirati u diskretnu sluµcajnu varijablu kao što je opisano u Primjedbi
3.3, pa ako za nju moµzemo re´ci da je distribuirana razdiobom neke kontinuirane
sluµcajne varijable, onda to isto kaµzemo i za poµcetnu statistiµcku varijablu. Zbog toga
moµzemo tolerirati izjave: duljina µzivotnog vijeka (broj napunjenih godina µzivota)
Hrvata je normalno distribuirana, uspjeh studenata na ispitu iz nekog kolegija je
normalno distribuiran...
jna varijabla modelira gore opisane pokuse i odnosi se na bilo koji izvedeni pokus
odre†ene vrste.
Pri izboru sluµcajne varijable za opis pojedinog procesa moµzemo reći da će ona
biti diskretna ako moµze poprimiti konaµcno mnogo ili najviše prebrojivo mnogo
(ne nuµzno cjelobrojnih) vrijednosti. Izabrati ćemo konkretan model diskretne
sluµcajne varijable ako su u tom sluµcajnom pokusu ispunjene temeljne znaµcajke
toga modela do µcega dolazimo iskustvenim saznanjima ili teorijskim razmatran-
jem. Primjerice, budući da teoretski svako slobodno bacanje odre†enog igraµca ima
jednaku vjerojatnost za koš, to pokus sa slobodnim bacanjima opisujemo s bi-
nomnom sluµcajnom varijablom s binomnom B f30; pg distribucijom pri µcemu za p
moµzemo uzeti postotak šuta iz slobodnih bacanja promatranog igraµca. Spomenuti
pokus koji ispituje broj automobila koji µcekaju da se upali zeleno svjetlo na toµcno
odre†enom semaforu iskustveno vjerojatno najbolje modelira sluµcajna varijabla s
Poissonovom distribucijom, pri µcemu za uzimamo srednju vrijednost automobila
u prethodnom promatranom razdoblju. Ako iz …ksne populacije svih automobila
s hrvatskim tablicama sluµcajnim odabirom iz registra odaberemo 100 automobila
me†u kojima brojimo one koji imaju zadarske tablice onda je ovaj pokus opisan
hipergeometrijskom varijablom gdje je N broj registriranih automobila u R.H., M
je broj automobila sa zadarskim registarskim oznakama i n = 100:
Ne tako matematiµcki strogo, moµzemo reći da će sluµcajna varijabla koja opisuje
odre†eni pokus biti kontinuirana ako ona moµze poprimiti bilo koju realnu vrijed-
nost (neprebrojivo mnogo vrijednosti), odnosno ne moµzemo se ograniµciti na pre-
brojivo mnogo vrijednosti koje ta sluµcajna varijabla moµze poprimiti. Primjerice,
istraµzivanje visine svih Dalmatinaca moramo opisati kontinuiranom sluµcajnom var-
ijablom (vjerojatno normalno distribuiranom). Naime, iako u ovom trenutku ima
samo konaµcno mnogo brojeva koji predstavljaju visine svih trenutno µzivećih Dal-
matinaca (pa µcak i onih koji su umrli) ne moµzemo biti sigurni da će visina nekih
Dalmatinaca u budućnosti biti na tom popisu visina, odnosno ta visina u cm moµze
biti bilo koji realni broj (broj iz intervala h0; 300i). Nadalje, toµcna temperatura
zraka izmjerena na odre†enom mjestu u odre†eno vrijeme, rezultat trµcanja na 100
metara uµcenika drugih razreda šibenskih srednjih škola su primjeri pokusa koji se
µ
POGLAVLJE 3. SLUCAJNA VARIJABLA 73
Dvodimenzionalna sluµcajna
varijabla. Korelacija
74
µ
POGLAVLJE 4. DVODIMENZIONALNA SLUCAJNA VARIJABLA. KORELACIJA75
XnY y1 y2 yj
x1 p11 p12 p1j
x2 p21 p22 p2j
.. .. .. .. .. ..
. . . . . .
xi pi1 pi2 pij
.. .. .. .. .. ..
. . . . . .
P
Primijetimo da je pij = p11 + p12 + + p21 + + pij + = 1.
i;j
Primjer 4.3 Kod istovremenog bacanja novµci´ca i kocke ure†eni par (x; y) pridruµzu-
jemo doga†aju da se novµci´cu pojavilo x 2 f0; 1g (0-pismo, 1-glava), a na kocki
y 2 f1; :::; 6g : Dvodimenzionalna varijabla (X; Y ) moµze poprimiti 12 razliµcitih vri-
jednosti, a vjerojatnost doga†aja da varijabla poprimi bilo koju od tih vrijednosti
1
je 12
: Distribucija te varijable je prikazana tablicom
XnY 1 2 3 4 5 6
1 1 1 1 1 1 :
0 12 12 12 12 12 12
1 1 1 1 1 1
1 12 12 12 12 12 12
µ
POGLAVLJE 4. DVODIMENZIONALNA SLUCAJNA VARIJABLA. KORELACIJA76
Primjer 4.4 Dvije trake proizvode odre†eni artikl. U jedinici vremena, kapacitet
proizvodnje prve trake je 4, a druge 3 artikla. Neka (X; Y ) predstavlja broj proizve-
denih artikala prve i druge trake, uz pretpostavku da je proizvodnja sluµcajna. Neka
je distribucija te varijable dana tablicom:
XnY 0 1 2 3
0 0.01 0.02 0.02 0.02
1 0.02 0.04 0.04 0.04
:
2 0.04 0.06 0.07 0.05
3 0.06 0.06 0.07 0.08
4 0.08 0.07 0.07 0.08
jne varijable Y:
P
XnY y1 y2 yj
x1 p11 p12 p1j p1
x2 p21 p22 p2j p2
.. .. .. .. .. .. ..
. . . . . . .
xi pi1 pi2 pij p3
.. .. .. .. .. .. ..
. . . . . . .
P
p1 p2 pj 1
U Primjeru 4.4 moµzemo odrediti sluµcajnu varijablu X koja predstavlja proizvod-
nju na prvoj traci i moµze poprimiti vrijednosti 0; 1; 2; 3; 4; te sluµcajnu varijablu Y
koja predstavlja proizvodnju na drugoj traci, a koja moµze poprimiti vrijednosti
0; 1; 2; 3: Marginalne distribucije ovih varijabli su dane tablicama:
xi 0 1 2 3 4
pi 0:07 0:14 0:22 0:27 0:30
Npr. p0 = p00 + p01 + p02 + p03 = 0:1 + 0:2 + 0:2 + 0:2 = 0:7::::
yj 0 1 2 3
pj 0:21 0:25 0:27 0:27
Npr. p 3 = p03 + p13 + p23 + p33 + p43 = 0:02 + 0:04 + 0:05 + 0:08 + 0:08 = 0:27:
xi 0 1 2 3 4
pi1 0;02 0;04 0:06 0:06 0:07
:
p (ij1) = p1 0;25
= 0; 08 0;25
= 0; 16 0:25
= 0; 24 0:25
= 0; 24 0:25
= 0; 28
yj 0 1 2 3
p0j 0;01 0;02 0;02 0:02
:
p (jj0) = p0 0;07
= 0; 142 0;07
= 0; 285 0;07
= 0; 285 0:07
= 0; 285
Primjer 4.5 Distribucija varijable (X; Y ) koja biljeµzi ishode istovremenog bacanja
novµci´ca i kocke je dana u tablici kontigencije zajedno s marginalnim distribucijama:
XnY 1 2 3 4 5 6 pi
1 1 1 1 1 1 1
0 12 12 12 12 12 12 2
1 1 1 1 1 1 1
:
1 12 12 12 12 12 12 2
1 1 1 1 1 1
pj 6 6 6 6 6 6
1
PP
Za diskretne varijable vrijedi cov (X; Y ) = pij xi yj X Y:
i j
Kovarijanca mjeri stupanj linearne povezanosti varijabli X i Y (ona je i najµcešća
u prirodi). Ako su varijable neovisne onda je njihova kovarijanca jednaka 0. No,
ako im je kovarijanca jednaka 0, varijable ne moraju biti neovisne (mogu biti
nelinearno povezane).
Kao mjera stupnja linearne povezanosti još se koristi koe…cijent korelacije
cov(X;Y )
r (X; Y ) = (X; Y ) = = X Y
:
Koe…cijent korelacije je broj sa svojstvom 1 1. Prikaµzemo li u pra-
vokutnom koordinatnom sustavu toµcke (x; y) = (X (!) ; Y (!)), dobivamo tzv.
dijagram rasipanja. Koe…cijent je bliµzi 1 ili -1 što taj dijagram uspješnije
moµzemo aproksimirati pravcem.
µ
POGLAVLJE 4. DVODIMENZIONALNA SLUCAJNA VARIJABLA. KORELACIJA80
Ako je 0:7 j j < 1; onda su varijable vrlo visoko linearno povezane. Prim-
jerice, visina i teµzina ljudi ( > 0:7) ili stupanj utreniranosti i puls u prvoj minuti
oporavka nakon vjeµzbe ( 0:7)
Ako je 0:4 j j < 0:7 tada su varijable znaµcajno korelirane. Ako je 0:2
j j < 0:4 tada su varijable slabo korelirane. Ako je 0 < j j < 0:2 tada su var-
ijable neznatno korelirane, odnosno ako je (X; Y ) = 0 kaµzemo da su varijable
nekorelirane. Varijable su nekorelirane ako i samo ako je cov (X; Y ) = 0.
µ
POGLAVLJE 4. DVODIMENZIONALNA SLUCAJNA VARIJABLA. KORELACIJA81
xi nyi 0 1 pi
1 1
1 0 3 3
1 1 :
2 3
0 3
1 1
3 0 3 3
1 2
pj 3 3
1
1
Sluµcajne varijable X i Y nisu neovisne jer je p00 = 0 6= 9
= p0 p 0 :::; a varijable
nisu ni korelirane jer je cov (X; Y ) = 0. Zaista,
P3 P1
E [XY ] = i j pij = 1 0 0 + 1 1 31 + 2 0 1
3
+2 1 0+3 0 0+3 1 1
3
= 43 ;
i=1 j=0
µ
POGLAVLJE 4. DVODIMENZIONALNA SLUCAJNA VARIJABLA. KORELACIJA83
P
3
1 1 1
E [X] = i pi = 1 3
+2 3
+3 3
= 2;
i=1
P1
1 2
E [Y ] = j pj = 0 3
+1 3
= 23 ;
j=0
4 2
cov (X; Y ) = E [XY ] E [X] E [Y ] = 3
2 3
= 0:
2 1 2
X Y
Intervali povjerenja
84
POGLAVLJE 5. INTERVALI POVJERENJA 85
broj pokusa koje tada smatramo uzorkom na kojemu moµzemo izraµcunati relativne
frekvencije pojedinih ishoda kojima ćemo procijeniti njihove vjerojatnosti (broj
posjetitelja negog ka…ća subotom, broj toµcnih odgovora sudionika nekog kviza...).
Najreprezentativniji uzorak je sluµcajni uzorak koji se formira na naµcin da
svaki element populacije ima jednaku vjerojatnost da bude izabran u uzorak. Na-
jbolji naµcin sastavljanja sluµcajnog uzorka, a da pri tomu eliminiramo nesvjesno
psihološko-praktiµcno preferiranje pojedinih elemenata, jest da se elementi numeri-
raju i onda nasumce, raµcunalnim programom, izabiru brojevi. Naravno, postoji
mogućnost i da sluµcajni uzorak ne bude reprezentativan, tj. da bude pristran,
na što uostalom upućuje i µcinjenica da svaki zakljuµcak temeljen na uzorku ima
odre†enu razinu (ne)pouzdanosti.
Jednako reprezentativan je i sistemski uzorak u kojem se odabere nasumce
prvi µclan uzorka iz numerirane populacije, a nakon njega u uzorak ulazi svaki n-ti
µclan populacije.
Strati…cirani uzorak je u mnogim sluµcajevima reprezentativniji nego li sluµca-
jni uzorak. Kod njegovog formiranja se populacija prvo podijeli, prema nekim
karakteristikama, u slojeve (stratume), a potom se iz svakog sloja uzima sluµcajni
uzorak tako da njegova veliµcina u odnosu na veliµcinu cijelog uzorka bude propor-
cionalna veliµcini sloja u odnosu na veliµcinu cijele populacije.
Klaster uzorak je lošija varijanta sluµcajnog uzorka, a koristi se u velikim
ekonomskim, politiµckim ili trµzišnim istraµzivanjima. Formira se na naµcin da se
cijela populacija podijeli u više manjih blokova (primjerice grad se podijeli na
više kvartova ili blokova), pa se nasumce odabere jedan od tih blokova koji onda
predstavlja klaster uzorak. Ovaj uzorak je praktiµcan jer su anketari koncentrirani
na jednom podruµcju.
Kvotni uzorak se formira na naµcin da organizator istraµzivanja, poznajući
strukturu stanovništva obzirom na predmet istraµzivanja, unaprijed odredi broj
ljudi iz svakog pojedinog stratuma, a anketar sam odabire te ljude dok ne ispuni
kvotu. Ovakav uzorak µcesto nije reprezentativan, jer anketar sam, hodajući gradom
ili jednom ulicom, po svojim a…nitetima i atrakcijama, odabire ispitanike.
Prigodni uzorak je uzorak koji nam je, u datim oklolnostima, jedini dostupan
POGLAVLJE 5. INTERVALI POVJERENJA 87
glasaµc A B C D E M
. Proporcija odgovora DA je p = N
=
odgovor DA NE NE DA NE
2
5
= 0:4: Svih uzoraka veliµcine 2 ima 10, a proporcije uzoraka su
mi
Glasaµci u uzorku odgovori mi p^i = 2
A,B 1; 0 1 0:5
A,C 1; 0 1 0:5
A,D 1; 1 2 1
A,E 1; 0 1 0:5
B,C 0; 0 0 0 .
B,D 0; 1 1 0:5
B,E 0; 0 0 0
C,D 0; 1 1 0:5
C,E 0; 0 0 0
D,E 1; 0 1 0:5
Sampling distribucija varijable p^ je
p^i 0 0:5 1
3 6 1
:
p (^
pi ) 10 10 10
Oµcekivanje od p^ je E [^
p] = 0:3 0 + 0:6 0:5 + 0:1 1 = 0:4 što je jednako proporciji
p odgovora DA na cijeloj populaciji.
n N 1
^ 2 (fsi1 ; si2 ; :::; sin g) = s2
;
n 1 N
gdje je s2 varijanca uzorka. Ako je populacija beskonaµcna, onda procjenitelja
varijance de…niramo sa
n
^ 2 (fsi1 ; si2 ; :::; sin g) = s2 :
n 1
2
(si1 x) + +(sin x)2
Pokaµze se da u tom sluµcaju vrijedi ^ 2 = n 1
; gdje je x aritmetiµcka
sredina uzorka.
POGLAVLJE 5. INTERVALI POVJERENJA 90
N 1
U praksi se najµcešće zanemaruje faktor N
za dovoljno velike populacije jer je
N 1
lim N
= 1.
N !1
x z =2 x ; x +z =2 x
x t =2 x ; x +t =2 x
Budući da obje distribucije teµze normalnoj distribuciji, u oba sluµcaja se kao prak-
tiµcno pravilo uzima da je sampling distribucija proporcija p^ aproksimativno nor-
malno distribuirana N (p; p^) ako je np > 5 i n (1 p) > 5: U tom sluµcaju, koristeći
svojstva normalne distribucije, interval
p^ z =2 p^; p
^+ z =2 p^
Primjer 5.11 Od 6432 osiguranika neke osiguravaju´ce ku´ce u uzorku od 400 osig-
uranika njih 320 nije sudjelovalo u prometnoj nezgodi u prethodnoj godini. Odredite
POGLAVLJE 5. INTERVALI POVJERENJA 96
2
2 2
p > =2;n 1 = =2. Tada se, s istom vjerojatnošću, vrijednost (n 1)^ 2
nalazi
1 1
u intervalu 2 ; 2 : Napokon, s vjerojatnošću 1 varijanca pop-
=2;n 1 (1 =2);n 1
2 (n 1)^ 2 (n 1)^ 2
ulacije pripada intervalu 2 ; 2 . Ovaj interval nazivamo inter-
=2;n 1 (1 =2);n 1
q
n1 +n2
gdje je x1 x2 = n1 n2
; a broj t =2 je odgovarajuća vrijednost t-distribuirane
varijable s n1 + n2 2 stupnjeva slobode.
Ako je zajedniµcka varijanca nepoznata, onda se koristi izraz
s
(n1 1) ^ 21 + (n2 1) ^ 22 n1 + n2
x1 x2 = :
n1 + n2 2 n1 n2
Ako se prethodno
q 2 utvrdi da su varijance populacija razliµcite onda se koristi izraz
^1 ^ 22
x1 x2 = n1
+ n2 , a broj stupnjeva slobode kojeg koristimo za izraµcun vrijednosti
t =2 je jednak
2 0 2 2
13
2 ^ 21 ^ 22
6 ^ 21 ^ 22 B n1 n2 C7
s:s: = Int 4 + @ + A5 ;
n1 n2 n1 1 n2 1
gdje Int oznaµcuje najveće cijelo decimalnog broja (broju se odbacuju decimale).
POGLAVLJE 5. INTERVALI POVJERENJA 99
Uzorak fdi1 ; :::; din g veliµcine n, kojeg uzimamo iz ovakve populacije razlika, je za-
pravo par me†usobno ovisnih uzoraka fxi1 ; :::; xin g i fyi1 ; :::; yin g jednake veliµcine
vrijednosti kojih promatramo u parovima, odnosno za i-ti µclan promatramo par
(xi ; yi ) µcija je razlika di = xi yi : Varijablu koja svakom takvom uzorku fd1 ; :::; dn g
d1 + +dn
razlike parova pridruµzi aritmetiµcku sredinu d = n
je nepristrani procjenitelj
POGLAVLJE 5. INTERVALI POVJERENJA 100
d z =2 d ; d +z =2 d
Osoba Razlike d
A 7
B 5
Rješenje: Formirajmo tablicu razlika . Vrijedi: n = 5;
C 3
D 6
E 4
r q
7+ +4
p n (d1 d)
2
+ +(dn d)
2
(7 5)2 + +(4 5)2
d= 5
= 5; ^ d = sd n 1
= n 1
= 4
= 1:58;
1 D ) =2 = 0:025; stupnjevi
= 0:95 E slobode= 4 ) t0:025 = 2:776. Traµzeni
1:58 1:58
interval je 5 2:776 p5 ; 5 + 2:776 p5 = h3:04; 6:96i ; koji moµzemo prihvatiti
jedino uz (opravdanu) pretpostavku da su teµzine svih ljudi u programu prije dijete
i poslije normalno distribuirane.
jednaka 1 .
Interval p^1 p^2 z =2 p^1 p^2 ; p
^1 p^2 + z =2 p^1 p^2 nazivamo intervalom pov-
jerenja razlike populacijskih proporcija s razinom pouzdanosti 1 :
z 2
=2
za grešku) onda je n = d
: Ako je populacija konaµcna, onda se n na†e
q
N n n0
iz jednadµzbe d = z =2 pn N 1
; i to samo u sluµcaju kada je N
> 0:05; gdje je
z 2
=2
n0 = d
. U protivnom je n = n0 :
Zadatak 5.17 Restoran s dostavom µzeli ispitati srednje vrijeme dostave koje traje
od narudµzbe do uruµcivanja na adresu. Ako menadµzment restorana µzeli procjenu
s toleriranom greškom od 5 minuta i razinom pouzdanosti od 95% koliku veliµcinu
uzorka moraju promatrati ako se zna da je pribliµzno najbrµza dostava bila 10 minuta,
a najsporija 100.
Rješenje: Vrijedi: d = 5; z =2 = z0:025 = 1:96; 6 100 10 = 90 )
90 z =2 2 15 1:96 2
6
= 15: Stoga je n = d
= 5
= 34:574: Potrebno je, dakle, uzeti u
uzorak (barem) 35 dostava da bi zakljuµcak bio traµzene preciznosti i pouzdanosti.
z =2 2
n= p (1 p) :
d
U postupku odre†ivanja veliµcine uzorka n; treba nam, osim preciznosti d i pouz-
danosti 1 ; i proporcija p koju procjenjujemo. Za nju uzimamo plansku, pribliµznu
veliµcinu. No, ako nema pouzdane osnove za plansku veliµcinu, onda se uzima na-
jnepovoljniji sluµcaj, tj. kada je p (1 p) maksimalan, a to će biti za p = 0:5: Ako
je populacija konaµcna, onda se n na†e iz jednadµzbe
s
p (1 p) N n
d = z =2 ;
n N 1
n0 z =2 2
i to samo u sluµcaju kada je N
> 0:05; gdje je n0 = d
p (1 p). U protivnom
je n = n0 :
Na sliµcan naµcin se odre†uju veliµcine n1 i n2 uzoraka koje treba uzeti iz dviju
populacija za procjenu razlike sredina 1 2 i razlike proporcija p1 p2 : U izraµcunu
se uzima da je n1 = n2 :
POGLAVLJE 5. INTERVALI POVJERENJA 104
Primjer 5.18 Koliko dobitnika lutrije u iznosu od preko 100 000 $ u zadnjih 10
godina treba ukljuµciti u istraµzivanje o postotku onih dobitnika koji su napustili posao
nakon takvog dobitka, ako µzelimo preciznost od 0:02 i razinu pouzdanosti 90%.
Vrijedi: 2d = 0:02 ) d = 0:01; 1 = 0:9 ) z =2 = z0:05 = 1:645. Za p
moµzemo uzeti 0:11 proporciju iz Primjera 5.12 kojega moµzemo tretirati kao pilot
uzorak od 576 µclanova (u sluµcaju da nemamo ovaj podatak od prije morali bismo
z =2 2 1:645 2
staviti p = 0:5). Sada je n = d
p (1 p) = 0:01
0:11 0:89 = 2649:2:
Zakljuµcujemo da je potrebno promatrati uzorak od barem 2650 dobitnika.
Poglavlje 6
Testiranje hipoteza
H0 je istinita H0 je laµzna
H0 je prihvaćena (tj. nije odbaµcena) ispravno pogreška tipa II.
H0 je odbaµcena pogreška tipa I. ispravno
105
POGLAVLJE 6. TESTIRANJE HIPOTEZA 106
6.1.1 Z i t test
Ako se za zadanu razinu pouzdanosti 1 E moµ ^
D Dze pomoću vrijednostiE naµciniti
interval povjerenja ^ ^
^ z =2 ; + ^ z =2 ili ^ ^
^ t =2 ; + ^ t =2 , onda ako
Primjer 6.1 Radi pove´canja prometa lanac trgovina razmišlja o uvo†enju mogu-
´cnosti pla´canja karticom ako prosjeµcni mjeseµcni promet bude ve´ci od 300 000 e.
Uvedeno je pokusno pla´canje u 15 trgovina (manje od 5% ukupnog broja trgovina).
Ako je prosjeµcni mjeseµcni promet u uzorku bio 317 543 e, a prosjeµcno odstupanje
4768, kakvu odluku treba donijeti s razinom signi…kantnosti 5%? Pretpostavlja se
da je mjeseµcni promet po prodavaonicama normalno distribuiran.
Treba testirati aritmetiµcku sredinu u odnosu na 0 = 300 000: H0 :::
300 000; H1 ::: > 300 000, pri µcemu je zadano x = 317 543; s = 4768; n = 15:
Budu´ci je uzorak mali, to provodimo t-test: t = x x 0 = sp
x 0
n = 13:767; stupnjevi
n 1
p
n
slobode su 14, a t = t0:05 = 1:761 povlaµci t > t : Rezultat testa upu´cuje da je,
na razini signi…kantnosti 5%, opravdano zakljuµciti da je prosjeµcan mjeseµcni promet
nakon uvo†enja kartiµcnog pla´canja statistiµcki znaµcajno ve´ci od 300 000 e.
Zadatak 6.2 Direktor farme pili´ca razmišlja o uvo†enju novog prehrambenog sred-
stva za pili´ce koje bi se jedino isplatilo ako bi tim sredstvom hranjeni pili´ci bili
barem 500 g teµzi. U kontrolnom uzorku od 400 pili´ca hranjenih standardnom hra-
nom prosjeµcna teµzina jednaka je 2350 g, a prosjeµcno odstupanje je 200 g. U
eksperimentalnom uzorku od 361 pili´ca prosjeµcna teµzina je 3040 g, a prosjeµcno
odstupanje je 220 g. Odluku treba donijeti s 1% znaµcajnosti.
Rješenje: Treba testirati razliku aritmetiµckih sredina 2 1 teµzina popu-
lacije pili´ca hranjenih standardno i hranjenih novim sredstvom, tj. H0 ::: 1 2 >
500; H1 ::: 2 1 < 500; gdje je zadano x1 = 2350; s1 = 200; n1 = 400; x2 = 3040;
x2 x1 500
s2 = 220; n2 = 361. Budu´ci su uzorci veliki provodimo z-test: z = x1 x2
=
s x2 x1 500 = p 690
= 2:940 0; a z = z0:01 = 2:33 implicira z > z :
s2
n1
s2
n2 100:25+134:44
1 n1 1 2n 1
n1
+ n2
2
POGLAVLJE 6. TESTIRANJE HIPOTEZA 109
Zadatak 6.4 Na referendum je izašlo 1 000 000 biraµca. Do 22.00 sata prebrojeno
je 900 000 glasaµcih listi´ca od kojih je 55% zaokruµzilo odgovor NE na referendumsko
pitanje. Testirajte hipotezu da ´ce nakon prebrojavanja svih listi´ca konaµcna odluka
gra†ana na referendumsko pitanje biti negativna i to s 99% sigurnosti. Moµze li ova
hipoteza biti prihva´cena s 100% sigurnosti?
Rješenje: Potrebno je testirati proporciju p biraµca koji su se negativno izrazili
na referendumsko pitanje, tj. H0 :::p 0:5; H1 :::p > 0:5. Zadano je = 0:01,
p^ p0 p^ 0:5
N = 1 000 000; n = 900 000 i p^ = 0:55: Iz z = = 301:51 i
= q
p
^ (1 p)
^
( NN n1 ) p
^
n
z0:01 = 2:33 slijedi z > z što nas upu´cuje na prihva´canje alternativne hipoteze
p > 0:05 s vjerojatnoš́cu 0:01 da je nulta hipoteza p 0:5 istinita. Ipak, teorijski
ne moµzemo biti u potpunosti sigurni u ishod referenduma temeljem prebrojanih
listi´ca. Naime, ako bi svih preostalih 100 000 listi´ca bilo s pozitivnim odgovorom
m mn m n
onda bi proporcija negativnih odgovora bila p = N
= N n
= n N
= p^Nn gdje je
n veliµcina uzorka i m broj glasaµckih listi´ca u uzorku s odgovorom NE. Tada bi
slijedilo p = 0:55 0:9 = 0:495; odnosno konaµcni odgovor na referendumsko pitanje
bi bio pozitivan. Da bismo temeljem uzorka veliµcine n s proporcijom p^ > 0:5 (ili
p^ < 0:5) bili sigurni u ishod refernduma treba biti p^Nn > 0:5 (ili p^Nn < 0:5).
POGLAVLJE 6. TESTIRANJE HIPOTEZA 110
i c2 = 0 +z =2 ^
, onda je vjerojatnost prihvaćanja hipoteze, unatoµc tome što je
pravi parametar jednak = 1, jednaka površini što ju odsijeca interval hc1 ; c2 i
ispod normalne krivulje N ( 1 ; ^) :
c1 c2
1 > c2 =p ^
1
<z<0 p ^
1
<z<0
c2 c1
1 < c1 =p 0<z< ^
1
p 0<z< ^
1
:
c1 c2
c1 < 1 < c2 =p ^
1
<z <0 +p 0<z < ^
1
c2
1 > c2 = 0:5 p ^
1
<z<0
:
c2
1 < c2 = 0:5 + p 0 < z < ^
1
Vjerojatnost prihvaćanja hipoteze H0 ::: > 0, unatoµc tome što je pravi parametar
jednak = 1 < 0, jednaka je površini što ju odsijeca interval hc1 ; 1i ispod
normalne krivulje N ( 1 ; ^) :
c1
1 < c1 = 0:5 p 0<z< ^
1
:
c1
1 > c1 = 0:5 + p ^
1
<z<0
Primjer 6.5 Broker koji trguje dionicama prosu†uje stabilnost, tj. varijabilnost
teµcaja odre†ene dionice. On pretpostavlja da je prosjeµcno odstupanje teµcaja od
prosjeka dionica u desetogodišnjem razdoblju 38 centi. Moµze li se prihvatiti ta
hipoteza na razini signi…kantnosti od 5%, ako je iz baze podataka o kotacijama
burze izabran uzorak od 10 dnevnih cijena dionica µcija je aritmetiµcka sredina x =
450; a procjenitelj varijance je ^ 2 = 2 n
n 1
= 36 (faktor N 1
N
je zanemaren), uz
pretpostavku da su cijene normalno distribuirane?
2 2
Testiramo hipotezu H0 ::: = 38; H1 ::: 6= 38 uz poznate podatke: n =
2 2
10; = 0:05: Vrijednosti proµcitane iz tablice su 1 =2;n 1 = 0:975;9 = 2:70039;
(n 1)^ 2
2
=2;n 1 = 2
0:025;9 = 19:0228; a testna veliµcina je 2
= 2 = 93836 = 9:52632:
0
Budu´ci se testna veliµcina nalazi unutar granica prihva´canja nulte hipoteze, na razni
znaµcajnosti od 5% se prihva´ca H0 :
POGLAVLJE 6. TESTIRANJE HIPOTEZA 112
Primjer 6.6 Broker prosu†uje rizik trgovanja dionicama dviju …rmi temeljem pro-
matranja varijanci dnevnih zakljuµcnih cijena. Prosjeµcno odstupanje od prosjeka
POGLAVLJE 6. TESTIRANJE HIPOTEZA 115
dnevnih cijena prve vrste dionica u uzorku od 21 dana je 20 centi, a kod druge
vrste dionica prosjeµcno odstupanje od prosjeka dnevnih cijena u uzorku od 26 dana
je 15 centi. Moµze li se prihvatiti pretpostavka da je poslovanje dionicama obiju
…rmi jednako riziµcno, uz razinu signi…kantnosti 10%.
2 2
Testiramo sljede´cu hipotezu H0 ::: 1
2 = 1 H1 ::: 1
2 6= 1: Za implementaciju
2 2
F -testa moramo pretpostaviti da su zakljuµcne dnevne cijene dionica normalno dis-
tribuirane. Zadani podaci su n1 = 21; s1 = 20, što povlaµci ^ 21 = s21 n1n1 1 = 420;
te n2 = 26; s2 = 15, iz µcega slijedi ^ 22 = s22 n2n2 1 = 234: Tabelarna vrijednost je
^ 21 420
F =2;[n1 1;n2 1] = F0:05;[20;25] = 2:01; testna vrijednost je F = ^ 22
= 234
= 1:79 <
2:01; pa na danoj razini znaµcajnosti prihva´camo da je poslovanje dionicama jednako
riziµcno.
P nj
K P P
K P nj
K P
SST = (xij x)2 = nj (xj x)2 + (xij xj )2 :
j=1 i=1 j=1 j=1 i=1
Izraz
P
K
nj (xj x)2
j=1
Primjer 6.8 Proizvo†aµc igraµcaka µzelio je ustanoviti ima li boja igraµcke utjecaj na
njezinu atraktivnost pa je na 4 uzorka od po 10-ero djece mjerio minute koliko se
pojedino dijete zadrµzalo u igri s tom igraµckom:
crveni 1 2 5 7 6 1 2 2 4 4
µzuti 2 3 6 3 2 8 7 5 6 8
:
zeleni 2 4 2 1 2 3 4 1 3 2
modri 5 3 1 2 1 3 4 2 3 1
2. Oµcekivane frekvencije nisu suviše male, tj. sve ei moraju biti > 2; a 50%
oµcekivanih frekvencija mora biti > 5.
POGLAVLJE 6. TESTIRANJE HIPOTEZA 120
(fi ei )2
xi (broj nezgoda) fi (broj dana) pi = p (xi ) ei = 100pi ei
0 44 0:4066 40:66 0:2744
1 37 0:3659 36:59 0:0046
2 15 0:1647 16:47 0:1312
3 3 0:0494 4:94 + 1:34 0:8278
4 1 0:0134 (1:34)
2
100 1:00 100 = 1:237
2
su (k g 1) = (4 0 1) = 2; a teorijska vrijednost je jednaka 0:01 = 11:344:
Stoga na danoj razini znaµcajnosti prihva´camo hipotezu.
Zadatak 6.11 Ako je od 200 studenata njih 40 palo na ispitu kod nekog profesora,
110 dobilo ocjenu manju od 5, a njih 50 dobilo ocjenu 5, moµzemo li re´ci da ovaj
rezultat odstupa od "normalne" raspore†enosti uspjeha po kojoj je 50% prosjeµcnih
i po 25% loših i izvrsnih.
Rješenje: Zadane podatke prikaµzimo tabelarno
(fi ei )2
fi ei fi ei (fi ei )2 ei
40 50 10 100 2
:
110 100 10 100 1
50 50 0 0 0
2
Vrijedi = 3; k = 3; n = 200: Stupnjevi slobode su (k g 1) = 2; pa je za
2 2 2
= 0:05 0:05 = 5:991: Budu´ci je < 0:05 to zakljuµcujemo da ova distribucija
ne odstupa statistiµcki znaµcajno od "normalne".
Broj zastoja 0 1 2 3 4 5 6
:
Broj smjena 35 115 130 75 30 10 5
(fi ei )2
xi fi p (xi ) ei ei
0 35 0:0878 35:12 0:00041
1 115 0:2634 105:36 0:88202
2 130 0:3292 131:68 0:02143
3 75 0:2195 87:80 1:86606
4 30 0:0823 32:92 0:259
5 10 0:0165 6:60 + 0:52 = 7:12 9:72112
6 5 0:0013 (0:52)
400 1:00 400 11:75004
2
-test rabimo i za testiranje hipoteze o jednakosti proporcija triju ili više
populacija:
H0 :::p1 = = pk = p; H1 ::pi 6= pj ; za neke i; j = 1; :::; k:
Neka u k uzoraka veliµcine n1 ; :::; nk , redom, uzetih iz k razliµcitih populacija,
m1 ; :::; mk elemenata u tim populacijama ima traµzeno obiljeµzje. Ispitujemo hipotezu
da je proporcija traµzenog obiljeµzja u svim populacijama me†usobno jednaka i iznosi
p.
m1 + +mk 2
Ako proporcija p nije zadana uzima se p^ = n1 + +nk
: Test veliµcina je =
P
k
(fi ei )2 2
ei
; pri µcemu je fi = mi , a ei = ni p ili ei = ni p^: Teorijsku vrijednost
i=1
2 2
uzimamo na razini signi…kantnosti i sa k 1 stupnjeva slobode. Ako je ,
onda prihvaćamo hipotezu da se proporcije statistiµcki znaµcajno ne razlikuju.
2 2
Testna veliµcina je = 3:173: Stupnjevi slobode su k 1 = 3; pa je 0:05 = 7:81473:
2 2
Budu´ci je < to moµzemo prihvatiti da se proporcija kupaca kave odre†ene
marke u sva 3 grada statistiµcki znaµcajno ne razlikuje, s razinom signi…kantnosti
5%.
XnY y1 y2 yj
x1 p11 p12 p1j
x2 p21 p22 p2j
.. .. .. .. .. ..
. . . . . .
xi pi1 pi2 pij
.. .. .. .. .. ..
. . . . . .
µ
Zelimo testirati hipotezu o neovisnosti doga†aja X = xi i Y = yj ; tj. obiljeµzja xi
i yj ; odnosno o jednakostima pij = pi p j ; za svaki i = 1; :::; r; j = 1; :::; c, gdje su
pi i p j marginalne vjerojatnosti.
H0 :::pij = pi p j ; 8 i = 1; :::; r; j = 1; :::; c
H1 :::9i 2 f1; :::; rg 9j 2 f1; :::; cg pij 6= pi p j
Pr Pc
(fij eij )2 n n ni n j
Test veliµcina je 2 = eij
pij = n in2 j =
; gdje je eij = n^ n
oµcekivana
i=1 j=1
frekvencija. Ako je 2
6 2
; gdje je razina signi…kantnosti testa, a 2
vrijednost
2
distribucije sa (r 1) (c 1) stupnjeva slobode, onda se prihvaća hipoteza o
me†usobnoj neovisnosti svih obiljeµzja xi i yj .
Primjer 6.14 Na uzorku od 900 potrošaµca istraµzuje se ovisnost izme†u visine mje-
seµcne pla´ce i sklonosti kupovine odre†enog proizvoda s razinom signi…kantnosti od
5%. Dobiveni su sljede´ci rezultati:
sklonost potrošnji
pla´can stalni kupac povremeno ne kupuje ukupno
< 1000 e 70 17 21 108
1000 1500 165 56 28 249 :
1500 2500 195 85 26 306
> 2500 170 42 25 237
ukupno 600 200 100 900
ni n j
Oµcekivane frekvencije raµcunamo prema formuli eij = n
; i = 1; :::; 4; j = 1; 2; 3;
n1 n 1 n1 n 2
pa je e11 = 900
= 108 600
900
= 72; e12 = 900
= 108 200
900
= 24; :::; e43 = n4900n3
=
POGLAVLJE 6. TESTIRANJE HIPOTEZA 127
237 100 2
P
4 P
3
(fij eij )2 (70 72)2 (17 24)2
900
= 26:33: Testna veliµcina je = eij
= 72
+ 24
+
i=1 j=1
(25 26:33)2
+ 26:33
= 18:633: Stupnjevi slobode su: (4 1) (3 1) = 6, pa teorijska
2 2
vrijednost distribucije s 6 stupnjeva slobode za = 0:05 iznosi 0:05 = 12:5916:
2 2
Budu´ci je > 0:05 to, na danoj razini znaµcajnosti, ne prihva´camo pretpostavku
da je sklonost kupovini nekog proizvoda neovisna o pla´ci.
Bibliogra…ja
128