You are on page 1of 142

Sveučilište u Zagrebu

Tekstilno-tehnološki fakultet

Kristina Krulić Himmelreich i Ksenija Smoljak

Statistika

Fakultetski udžbenik u elektroničkom obliku

Zagreb, 2013.
Sadržaj

Predgovor 1

1 Kombinatorika 3
1.1 Motivacijska pitanja . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Princip uzastopnog prebrojavanja . . . . . . . . . . . . . . . . 3
1.3 Kartezijev umnožak skupova . . . . . . . . . . . . . . . . . . . 4
1.4 Varijacije s ponavljanjem . . . . . . . . . . . . . . . . . . . . . 4
1.5 Varijacije bez ponavljanja . . . . . . . . . . . . . . . . . . . . 5
1.6 Zadaci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.7 Permutacije bez ponavljanja . . . . . . . . . . . . . . . . . . . 9
1.8 Permutacije s ponavljanjem . . . . . . . . . . . . . . . . . . . 10
1.9 Kombinacije bez ponavljanja . . . . . . . . . . . . . . . . . . . 11
1.10 Kombinacije s ponavljanjem . . . . . . . . . . . . . . . . . . . 13
1.11 Zadaci za vježbu . . . . . . . . . . . . . . . . . . . . . . . . . 13

2 Vjerojatnost 17
2.1 Dogadaji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.1 Usporedivanje dogadaja . . . . . . . . . . . . . . . . . 18
2.2 Svojstva vjerojatnosti . . . . . . . . . . . . . . . . . . . . . . . 20
2.2.1 Konačni vjerojatnosni prostor . . . . . . . . . . . . . . 20
2.3 Geometrijska vjerojatnost . . . . . . . . . . . . . . . . . . . . 23
2.4 Uvjetna vjerojatnost . . . . . . . . . . . . . . . . . . . . . . . 25
2.4.1 Nezavisni dogadaji . . . . . . . . . . . . . . . . . . . . 28
2.5 Formula potpune vjerojatnosti. Bayesova formula . . . . . . . 28
2.6 Zadaci za vježbu . . . . . . . . . . . . . . . . . . . . . . . . . 31

3 Deskriptivna statistika 33
3.1 Prikazivanje statističkih podataka . . . . . . . . . . . . . . . . 33
3.1.1 Zadaci za vježbu . . . . . . . . . . . . . . . . . . . . . 40
3.2 Parametri niza statističkih podataka (uzorka) . . . . . . . . . 41
3.2.1 Aritmetička sredina uzorka . . . . . . . . . . . . . . . . 41

i
3.2.2 Medijan uzorka . . . . . . . . . . . . . . . . . . . . . . 42
3.2.3 Mod . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.3 Mjere raspršenosti (disperzije)
Uzoračka varijanca i uzoračka standardna devijacija . . . . . . 46
3.4 Zadaci za vježbu . . . . . . . . . . . . . . . . . . . . . . . . . 49

4 Statistički podaci o dvodimenzionalnom obilježju 51


4.1 Uvod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.2 Linearna regresija . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.2.1 Pravci regresije, koeficijent korelacije . . . . . . . . . . 55
4.3 Zadaci za vježbu . . . . . . . . . . . . . . . . . . . . . . . . . 61

5 Osnovne razdiobe 63
5.1 Diskretne slučajne varijable . . . . . . . . . . . . . . . . . . . 63
5.1.1 Binomna razdioba . . . . . . . . . . . . . . . . . . . . 66
5.1.2 Hipergeometrijska razdioba . . . . . . . . . . . . . . . 69
5.1.3 Poissonova razdioba . . . . . . . . . . . . . . . . . . . 71
5.2 Neprekidne slučajne varijable . . . . . . . . . . . . . . . . . . 72
5.2.1 Normalna razdioba . . . . . . . . . . . . . . . . . . . . 77
5.2.2 Uniformna razdioba . . . . . . . . . . . . . . . . . . . . 86
5.2.3 Gama razdioba . . . . . . . . . . . . . . . . . . . . . . 87
5.2.4 Eksponencijalna razdioba . . . . . . . . . . . . . . . . 87
5.2.5 χ2 -razdioba . . . . . . . . . . . . . . . . . . . . . . . . 88
5.2.6 Studentova t razdioba . . . . . . . . . . . . . . . . . . 89
5.2.7 Fisherova razdioba . . . . . . . . . . . . . . . . . . . . 90
5.3 Zadaci za vježbu . . . . . . . . . . . . . . . . . . . . . . . . . 91

6 Procjene parametara (točkovne i intervalne) 93


6.1 Točkovne procjene . . . . . . . . . . . . . . . . . . . . . . . . 93
6.2 Intervalne procjene . . . . . . . . . . . . . . . . . . . . . . . . 95
6.3 Zadaci za vježbu . . . . . . . . . . . . . . . . . . . . . . . . . 100

7 Testiranje statističkih hipoteza 103


7.1 Parametarski testovi . . . . . . . . . . . . . . . . . . . . . . . 106
7.1.1 Testovi o parametrima normalne razdiobe N (µ, σ 2 ) . . 106
7.1.2 Test o proporciji (vjerojatnosti) . . . . . . . . . . . . . 109
7.1.3 Usporedba varijanci dviju normalno distribuiranih pop-
ulacija (F-test) . . . . . . . . . . . . . . . . . . . . . . 110
7.1.4 Usporedba očekivanja dviju normalno distribuiranih
populacija (t-test) . . . . . . . . . . . . . . . . . . . . . 111
2
7.2 χ -test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

ii
7.2.1 χ2 - test o prilagodbi modela podacima . . . . . . . . . 115
7.2.2 χ2 - test nezavisnosti dviju varijabli . . . . . . . . . . . 125
7.3 Zadaci za vježbu . . . . . . . . . . . . . . . . . . . . . . . . . 127

Statističke tablice 130

Bibliografija 137

iii
iv
Predgovor

Ovi nastavni materijali prate nastavni plan i program kolegija Statistika koji
se održava na prvoj godini preddiplomskog studija Tekstilna tehnologija i
inženjerstvo (TTI) na Tekstilno-tehnološkom fakultetu u Zagrebu, te kolegija
Statistika koji se održava na drugoj godini stručnog studija u Varaždinu,
ali su namijenjeni i studentima srodnih fakulteta. Takoder ovi nastavni
materijali su podsjetnik za studente poslijediplomskog studija Tekstilna
znanost i tehnologija na Tekstilno-tehnološkom fakultetu u Zagrebu za kolegij
Odabrana poglavlja iz Matematike.
Sadržaj je podijeljen u 7 cjelina: Kombinatorika, Vjerojatnost, Deskriptivna
statistika, Statistički podaci o dvodimenzionalnom obilježju, Osnovne raz-
diobe, Procjene parametara i Testiranje statističkih hipoteza. Na kraju nas-
tavnih materijala dane su statističke tablice koje se koriste u materijalima.
Zbog predznanja studenata trudile smo se gradivu pristupiti na što pris-
tupačniji način. U svakoj cjelini ukratko je objašnjena teorija te je riješeno
dosta primjera i zadataka kako bi studenti i samostalno mogli savladati nave-
deno gradivo.
Posebno se zahvaljujemo akademiku Josipu Pečariću i prof. dr. sc. Vidosavi
Šimić čija pomoć i savjeti su pridonijeli nastanku ovih nastavnih materijala.

Svima koji uoče pogreške ili druge propuste unaprijed zahvaljujemo.

1
2
Poglavlje 1

Kombinatorika

1.1 Motivacijska pitanja


Koliko se može napisati različitih peteroznamenkastih brojeva? Koliko pos-
toji različitih registracijskih pločica ako svaka sadrži 3 slova i 4 znamenke?
Na koliko se načina može izvući 7 brojeva od 39 u igri LOTO?

Kombinatorika je grana matematike koja se bavi prebrojavanjem konačnih


skupova.

1.2 Princip uzastopnog prebrojavanja


Primjer 1. Koliko ima prirodnih brojeva manjih od 20 koji su ili parni ili
prosti?

Rješenje. Prost broj je broj koji je djeljiv samo sa 1 i sa samim sobom (1


nije ni prost, ni složen broj). Paran broj je broj djeljiv sa 2.
Želimo prebrojati brojeve koji su manji od 20, parni ili prosti.
Prirodni brojevi manji od 20 su 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19.
Neka je A skup koji sadrži tražene brojeve.

A = {2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 16, 17, 18, 19}

card(A)=k(A)=16 (k(A) je broj elemenata skupa A).


Dakle, prirodnih brojeva manjih od 20 koji su ili parni ili prosti ima 16.

Primjer 2. Ekipni susreti u stolnom tenisu igraju se tako da svaki igrač iz


jedne ekipe igra protiv svakog igrača druge ekipe. Ako se svaka ekipa sastoji
od tri igrača, koliki je ukupni broj igara?

3
Rješenje. Svaki igrač prve ekipe odigrat će tri meča (po jedan meč protiv
svih igrača druge ekipe). Isti broj igara odigrat će i preostala dva igrača iz
prve ekipe. Dakle, ukupni broj igara je 3 · 3 = 9.

1.3 Kartezijev umnožak skupova


Neka su A, B neprazni skupovi. Kartezijev umnožak skupova A i B je skup
A × B čiji su elementi uredeni parovi (a, b), pri čemu je a ∈ A, b ∈ B.
Pišemo A × B = {(a, b) : a ∈ A, b ∈ B}.
Broj elemenata Kartezijeva umnoška: Ako skup A ima p elemenata, a
skup B t elemenata, onda Kartezijev umnožak A × B ima p · t elemenata.
Pišemo k(A × B) = k(A) · k(B).

Neka su S1 , S2 , . . . , Sn neprazni skupovi. Kartezijev umnožak tih skupova


je skup S1 ×S2 ×· · ·×Sn čiji su elementi uredene n-torke (s1 , s2 , . . . , sn ) takve
da je si ∈ Si , i = 1, . . . , n.
Broj elemenata u Kartezijevom umnošku n skupova je

k(S1 × S2 × ...Sn ) = k(S1 ) · k(S2 ) · · · k(Sn ).

Primjer 3. Koliko postoji različitih četveroznamenkastih brojeva?


Rješenje. To su brojevi od 1000 do 9999 i njih je 9000.
2. način: četveroznamenkasti brojevi: 9 10 10 10. Ukupno: 9·10·10·10 =
9000.
Ovdje se radi o umnošku 4 skupa. S1 = {1, 2, . . . , 9} iz kojeg biramo 1.
znamenku, te S2 = S3 = S4 = {0, 1, 2, . . . , 9} iz kojeg biramo 2., 3. i 4.
znamenku.
Sada možemo definirati princip uzastopnog prebrojavanja.
Ako element s1 iz skupa S1 možemo izabrati na n1 načina, nakon toga (bez
obzira koji smo element već izabrali) element s2 iz skupa S2 na n2 načina,
zatim element s3 iz skupa S3 na n3 načina itd., onda je ukupan broj načina
izbora niza s1 , s2 , . . . , sk jednak N = n1 · n2 · · · · · nk .

1.4 Varijacije s ponavljanjem


Neka je S = {a1 , a2 , . . . , an } zadani skup. Biramo k elemenata skupa S
pazeći na njihov poredak s time da se elementi mogu ponavljati. Riječ je
o broju elemenata u Kartezijevom umnošku k istovjetnih skupova. Njihov
broj je nk .

4
Primjer 4. Jedan test ima 20 pitanja na koje se odgovara s DA ili NE. Koliko
je mogućnosti popunjavanja testa?

Rješenje. 2 2 2 . . . 2 na svako pitanje možemo odgovoriti s dvije mogućnosti.


Neka je N broj mogućnosti ispunjavanja testa. Tada je N = 220 = 1048576.

Primjer 5. Sportska prognoza ima 13 redaka. U svakom retku treba prekrižiti


jedan od tri znaka: 0,1 ili 2. Na koliko se načina to može učiniti?

Rješenje. Svaki redak možemo ispuniti na tri različita načina. Ukupan broj
načina ispunavanja sportske prognoze je 313 = 1594323.

1.5 Varijacije bez ponavljanja


Uredena k-torka različitih elemenata istog skupa S = {a1 , a2 , . . . , an } naziva
se varijacija k-tog razreda u skupu od n elemenata (k ≤ n).
Broj varijacija N = n · (n − 1) · · · · · (n − k + 1).
(prvi element biramo na n načina, nakon toga drugi možemo odabrati na n−1
način jer mora biti različit od prvog, . . . , k−ti element možemo odabrati na
n − k + 1 način jer mora biti različit od prethodno odabranih.)
Primjer 6. Na koliko različitih načina možemo podijeliti 4 različita poklona
izmedu 5 osoba tako da svaka osoba dobije najviše jedan poklon?

Rješenje. To možemo učiniti na 5 · 4 · 3 · 2 = 120 načina. Prvi poklon možemo


dati bilo kojoj od 5 osoba, drugi jednoj od 4 osobe, treći jednoj od 3 osobe i
zadnji jednoj od preostale 2 osobe.

1.6 Zadaci
1. Koliko različitih telefonskih brojeva postoji ako su brojevi šesterozna-
menkasti, a prva znamenka nije jednaka nuli?

Rješenje. Tražimo broj šesteroznamenkastih brojeva. Njih ima 9 · 10 ·


10 · 10 · 10 · 10 = 900000 jer prvu znamenku biramo iz skupa {1, 2, ..., 9},
a preostale znamenke iz skupa {0, 1, 2, ..., 9}.

2. Koliko ima troznamenkastih brojeva čije su sve znamenke različite?

5
Rješenje. Troznamenkastih brojeva s različitim znamenkama ima
9 · 9 · 8 = 648,
jer prvu znamenku biramo iz skupa {1, 2, ..., 9} (9 mogućnosti),
drugu iz skupa svih znamenki različitih od prve (9 mogućnosti), a
treću znamenku iz skupa svih znamenki različitih od prve dvije (8
mogućnosti).

3. Koliko ima peteroznamenkastih brojeva čije su proizvoljne dvije sus-


jedne znamenke različite?

Rješenje. Napišimo nekoliko peteroznamenkastih brojeva koji zado-


voljavaju uvjet zadatka: 13536, 23232, 12345 i nekoliko peterozna-
menkastih brojeva koji ne zadovoljavaju uvjet zadatka: 11235, 14551.
Vidimo da brojeva koje mi tražimo ima:
9 · 9 · 9 · 9 · 9 = 95 = 59049,
jer prvu znamenku biramo iz skupa {1, 2, ..., 9} (9 mogućnosti), drugu iz
skupa svih znamenki različitih od prve (9 mogućnosti), treću znamenku
iz skupa svih znamenki različitih od druge (9 mogućnosti) itd.

4. Koliko se različitih registracijskih pločica može sastaviti ako svaka


sadrži 4 slova pa onda 2 znamenke? (uzimamo u obzir 22 slova abecede)

Rješenje. Registracijska pločica odredena je uredenom šestorkom u ko-


joj se prve 4 komponente biraju iz skupa od 22 slova, a preostale dvije
iz skupa od 10 znamenaka. Ukupni broj je:
22 · 22 · 22 · 22 · 10 · 10 = 23425600.

5. Satničar treba staviti u satnicu jedan sat matematike svaki radni dan
u tjednu. Ako razred ima ponedjeljkom i srijedom 7 sati, utorkom
i četvrtkom 6, a petkom 5 na koliko se načina to može učiniti?
Izračunajte na koliko se načina može staviti jedan sat matematike u
raspored svaki radni dan u tjednu ako matematika ne može biti prvi
sat ponedjeljkom i zadnja dva sata petkom?

Rješenje. Mogućih rasporeda kada matematika može biti bilo koji sat
tijekom dana je: 7 · 6 · 7 · 6 · 5 = 8820, a kad imamo ograničenje poned-
jeljkom i petkom: 6 · 6 · 7 · 6 · 3 = 4536.

6
6. Školska knjižnica sadrži 24 knjige iz matematike, 15 iz fizike, 11 iz
kemije i 18 iz biologije. Na koliko načina učenik može uzeti po jednu
knjigu iz ta četiri predmeta?

Rješenje. Učenik može uzeti knjige na 24·15·11·18 = 71280 načina.

7. Test na razredbenom postupku ima 40 zadataka. Pristupnik u svakom


zadatku može zaokružiti jedan od 4 ponudena odgovora ili ostaviti za-
datak neodgovorenim. Na koliko se različitih načina može odgovoriti
na zadani test?

Rješenje. Na svaki zadatak se može odgovoriti na pet različitih načina.


Ukupan broj različitih odgovora je 540 = 9 · 1028 .

8. Koliko se peteroznamenkastih brojeva može zapisati znamenkama 0, 1,


2, 4, 5, 7, 8 ako se nula ne smije naći na prvom, niti na posljednjem
mjestu, a sve znamenke moraju biti različite?

Rješenje. Najprije ćemo prebrojati peteroznamenkaste brojeve kod ko-


jih nula nije na prvom mjestu, a sastoje se od znamenaka 0, 1, 2, 4, 5,
7, 8 i sve znamenke su različite. Takvih ima 6 · 6 · 5 · 4 · 3 = 2160 (prva
znamenka ne smije biti nula, druga znamenka može biti bilo koja od
preostalih itd.) Neki od ovih brojeva imaju nulu na posljednjem mjestu.
Takvih ima 6 · 5 · 4 · 3 · 1 = 360 (prvu znamenku biramo na 6 načina (sve
osim nule), drugu na 5 (sve osim nule i one koja je na prvom mjestu),
treću na 4 te četvrtu na 3 načina). Prema tome 2160 − 360 = 1800
brojeva zadovoljava oba uvjeta.
Zadatak možemo riješiti i na drugi način: 0 ne smije biti na prvom i
na posljednjem mjestu, pa se 0 može nalaziti na preostala tri mjesta
(drugo, treće ili četvrto) ili je uopće nema. Sad ćemo prebrojati koliko
ima brojeva koji se sastoje od navedenih znamenaka koje su sve ra-
zličite i imaju 0 na drugom mjestu, trećem ili četvrtom mjestu. Takvih
je 3 · (6 · 1 · 5 · 4 · 3) = 3 · 360 = 1080. Ostaje još prebrojati koliko ima
traženih brojeva koji nemaju 0, a sastoje se od traženih znamenaka
koje su sve različite. Takvih je 6 · 5 · 4 · 3 · 2 = 720.
Dakle, traženih brojeva ima 1080 + 720 = 1800.

9. Koliko dijagonala ima n-terokut?

7
Rješenje. Podsjetimo se što je dijagonala n-terokuta. To je dužina koja
spaja dva nesusjedna vrha mnogokuta pa uočimo da je odredena s dva
nesusjedna vrha n-terokuta. Prvi vrh možemo odabrati na n načina.
Nakon toga za drugi vrh imamo na raspolaganju n − 3 nesusjedna vrha
(svaki vrh ima dva susjedna vrha i ovdje ne gledamo vrh koji smo već
odabrali za prvi). Ukupan broj uredenih parova je n·(n−3), no ukupan
broj dijagonala je n·(n−3)
2
jer smo svaku dijagonalu brojili dva puta, npr.
par (A,C) odreduje dijagonalu AC kao i par (C,A).

10. Na koliko se načina može podijeliti zlatna, srebrna i brončana medalja


izmedu 10 natjecatelja?

Rješenje. Zlatnu medalju možemo podijeliti na 10 načina, nakon toga


srebrnu na 9 (izmedu preostalih 9 natjecatelja), a brončanu na 8 načina
(izmedu preostalih 8 natjecatelja). Ukupan broj načina za dodjelu
medalja je 10 · 9 · 8 = 720.

11. Koliko šesteroznamenkastih brojeva postoji kojima je:

a) prva znamenka paran broj


b) druga i posljednja znamenka neparan broj?

Rješenje. (a) Parne znamenke su: 0, 2, 4, 6, 8, a neparne 1, 3, 5, 7, 9.


Traženih brojeva ima: 4 · 10 · 10 · 10 · 10 · 10 = 400000.
(b) Traženih brojeva ima: 9 · 5 · 10 · 10 · 10 · 5 = 225000.

12. Koliko različitih peteroznamenkastih brojeva postoji koji:

a) ne sadrže znamenku 2
b) sadrže točno jednu znamenku 2
c) sadrže barem jednu znamenku 2?

Rješenje. (a) Takvih brojeva ima 8 · 9 · 9 · 9 · 9 = 52488.


(b) Znamenka 2 može biti na prvom, drugom, trećem, četvrtom ili
petom mjestu.
Ako je znamenka 2 na prvom mjestu, onda traženih brojeva ima
1 · 9 · 9 · 9 · 9 = 6561 (prvu znamenku biramo na jedan način, a ostale
na 9 načina (sve znamenke osim 2)). Ako je znamenka 2 na drugom
mjestu, onda traženih brojeva ima 8 · 1 · 9 · 9 · 9 = 5832 (prvu znamenku
biramo na 8 načina (sve osim 0 i 2), drugu na jedan način, a ostale na

8
9 načina.
Ako je znamenka na trećem, četvrtom ili petom mjestu, traženih bro-
jeva ima isto kao u drugom slučaju pa zaključujemo da je rješenje ovog
zadatka 6561 + 4 · 5832 = 29889.
(c) Broj peteroznamenkastih brojeva koji sadrže barem jednu zna-
menku 2 izračunat ćemo tako da prebrojimo koliko ima ukupno peteroz-
namenkastih brojeva i koliko ima onih koji ne sadrže znamenku 2. Tada
je rješenje zadatka razlika izmedu ta dva broja, tj. 90000 − 52488 =
37512.

1.7 Permutacije bez ponavljanja


Permutacija skupa S = {a1 , a2 , . . . , an } od n različitih elemenata je uredena
n-torka njegovih članova.
Broj različitih permutacija s n elemenata označavamo s Pn .

Pn = n · (n − 1) · (n − 2) · · · · · 2 · 1 = n!

(prvi element možemo izabrati na n načina, drugi element možemo nakon


toga izabrati na n − 1 način,. . . , posljednji element možemo izabrati samo
na jedan način jer je jedini preostao.)
Primjer 7. Neka je S = {1, 2, 3}. Koliko ima permutacija tog skupa i koje
su to permutacije?
Rješenje. Prvi element možemo izabrati na 3 načina, nakon toga drugi ele-
ment na 2 načina, dok je za izbor trećeg elementa ostao samo jedan način.
Dakle, ukupan broj permutacija skupa S jednak je 3 · 2 · 1 = 3! = 6. Ispišimo
ih: 123, 132, 213, 231, 312, 321.
Radi jednostavnosti pisanja uredenu trojku (1,2,3) pišemo kao 123.

Primjer 8. Koliko se različitih (smislenih i besmislenih) riječi može sastaviti


od svih slova riječi POVIJEST ako

a) slova možemo postavljati po volji

b) suglasnici dolaze na prvo, treće, peto, sedmo i osmo mjesto (kao i u


početnoj riječi)?

Rješenje. (a) Ukupno imamo 8 različitih slova. Svaki raspored slova odreduje
jednu permutaciju pa ima ukupno 8! = 40320 različitih smislenih i besmis-
lenih riječi koje se mogu sastaviti od slova riječi POVIJEST.

9
(b) Svaki suglasnih može doći na jedno od 5 mjesta pa je broj mogućih ras-
poreda suglasnika 5! = 120. Samoglasnici mogu doći na preostala 3 mjesta
pa je broj njihovih razmještaja 3! = 6. Po principu uzastopnog prebrojavanja
ukupni broj riječi je 120 · 6 = 720.

Primjer 9. Na koliko se načina deset različitih predmeta može podijeliti


izmedu 10 osoba?
Rješenje. Ukupan broj načina je 10! = 3628800 jer prva osoba može birati
izmedu 10 predmeta, druga nakon nje izmedu 9, treća izmedu 8 itd.

Primjer 10. Na jednu predstavu dolazi pet bračnih parova. Na koliko ra-
zličitih načina oni mogu sjesti na 10 stolica u istom redu ako
a) mogu sjediti po svojoj volji

b) svaki bračni par mora sjediti jedan do drugoga

c) jedna do druge ne smiju sjediti dvije osobe istog spola?


Rješenje. (a) Dolazi 10 osoba koje imaju na raspolaganju 10 mjesta pa je
broj različitih rasporeda 10! = 3628800.
(b) Ako bračni par mora sjediti jedan do drugoga, onda najprije rasporedimo
bračne parove na 5! = 120 načina. Unutar svaka dva mjesta odredena za
jedan par imamo još dvije mogućnosti za razmještaj samog para. Ukupni
broj rasporeda sjedenja u ovom slučaju je 120 · 25 = 3840.
(c) Na predstavu dolazi 5 muškaraca i 5 žena. Broj rasporeda žena je 5! = 120
i broj rasporeda muškaraca je 5! = 120 pa je ukupno rješenje 120 · 120 · 2 =
28800 (na prvo mjesto može sjesti ili muškarac ili žena).

1.8 Permutacije s ponavljanjem


Neka u nizu s1 , s2 , . . . , sn postoji prva skupina od k1 identičnih elemenata,
druga skupina od k2 identičnih elemenata,. . . , r-ta skupina od kr identičnih
elemenata, k1 + k2 + · · · + kr = n.
Bilo koji razmještaj elemenata takvog niza nazivamo permutacijom s pon-
avljanjem.
n!
Njihov ukupni broj označavamo Pnk1 ,...,kr =
k1 ! · k2 ! · · · · · kr !
Primjer 11. Koliko se različitih riječi može napisati od slova riječi MATEM-
ATIKA?

10
Rješenje. Ovdje je riječ o nizu slova: M,M,A,A,A,T,T,E,I,K. Vidimo da na
raspolaganju imamo 10 slova, ali se neka ponavljaju pa je ukupan broj ra-
10!
zličitih riječi koje možemo napisati jednak = 151200.
3! 2! 2!

Primjer 12. Koliko 8-znamenkastih brojeva možemo napisati pomoću bro-


jeva 1, 1, 1, 3, 3, 3, 7, 7?
8!
Rješenje. Traženih brojeva ima = 560.
3! 3! 2!

1.9 Kombinacije bez ponavljanja


U mnogim problemima prebrojavanja poredak izabranih elemenata nije
bitan.
Na koliko se načina može izvući k elemenata iz skupa S od n elemenata ne
pazeći na njihov poredak?
Označimo taj broj s Cnk .
Cnk je jednak broju različitih podskupova s k elemenata uzetih iz skupa S
od n elemenata. Svaki podskup od k različitih elemenata skupa S nazivamo
kombinacijom u skupu S.  
k n n!
Broj različitih kombinacija jednak je Cn = = .
k k! · (n − k)!
Primjer 13. Na koliko se načina u igri LOTO može izvući 7 brojeva i jedan
dopunski broj od 39 zadanih?

Rješenje. Najprije izvlačimo 7 brojeva od 39 što možemo učiniti na


 
39 39!
= = 15380937 načina.
7 7! 32!

Nakon toga biramo dopunski broj na 32 načina   jer je ostalo još 32 broja.
39
Ukupan broj različitih načina izbora je 32 · = 492189984.
7
Zadatak možemo riješiti i na drugi način. Ukupan broj različitih načina
izbora je
39 · 38 · 37 · 36 · 35 · 34 · 33
· 32 = 492189984
7!
jer prvi broj biramo po volji pa imamo 39 mogućnosti, drugi biramo izmedu
njih 38 jer nam ih je ostalo 38 itd. Umnožak dijelimo sa 7! jer poredak prvih
7 brojeva nije bitan, a 7! je ukupan broj permutacija 7 brojeva.

11
Primjer 14. Košarkaški tim raspolaže s 3 centra, 4 krila i 5 braniča. Igru
započinje jedan centar, dva krila i dva braniča. Na koliko načina trener može
izabrati početnu petorku?
Rješenje. Centar
  možemo izabrati na tri načina (od
 3 centra biramo jedan),
4 5
dva krila na = 6 načina, a dva braniča na = 10 načina. Ukupan
2 2
broj različitih početnih postava je
   
4 5
3· · = 3 · 6 · 10 = 180.
2 2

Primjer 15. Na zaslonu računala pojavljuju se brojevi zapisani s 8 znamenaka


(a mogu počinjati s nulama). Koliko različitih brojeva postoji koji
a) sadrže točno tri znamenke 6
b) sadrže tri znamenke 6, tri znamenke 1 i dvije znamenke 8
c) sadrže točno tri jednake znamenke, a preostalih 5 su medusobno su
različite?
Rješenje. (a) Najprije moramo izabrati mjesta na kojima se nalaze šestice.
 
8
Od 8 mjesta biram 3 na kojima su šestice, a to možemo napraviti na
3
načina. Na ostala mjesta možemo staviti bilo koju od preostalih 9 znamenaka
što možemo učiniti na 95 načina. Ukupan broj traženih brojeva je
 
8
· 95 = 3306744.
3
(b) Traženih brojeva ima koliko i permutacija niza 6,6,6,1,1,1,8,8. Rješenje
8!
je = 560.
3! 3! 2!
(c) Brojevi sadrže točno tri jednake znamenke. Znamenku koja se ponavlja
možemo izabrati na 10 načina. Zatim biramo mjesta na  kojima
 se nalaze
8
znamenke koje se ponavljaju, a to možemo napraviti na načina. Na
3
preostala mjesta stavljamo znamenke koje se ne ponavljaju pa to možemo
napraviti na 9 · 8 · 7 · 6 · 5 načina. Ukupan broj traženih brojeva je
 
8
10 · · 9 · 8 · 7 · 6 · 5 = 8467200.
3

12
1.10 Kombinacije s ponavljanjem
Neka je S = {a1 , a2 , . . . , an } zadani skup. Svaki r−člani podskup skupa
S u kojem se elementi mogu i ponavljati, a pritom redoslijed elemenata u
r−torci nije bitan, naziva se kombinacija s ponavljanjem r−tog razreda od
n elemenata.  
r n+r−1
Broj različitih kombinacija s ponavljanjem jednak je C n = =
r
(n + r − 1)!
.
r! · (n − 1)!
Primjer 16. Neka je S = {1, 2, 3}. Koliko ima kombinacija s ponavljanjem
drugog razreda tog skupa i koje su to kombinacije?

Rješenje. Kombinacije s ponavljanjem drugog razreda skupaS su: {1,1},


2 3+2−1
{1, 2}, {1, 3}, {2, 2}, {2, 3}, {3, 3}. Tih kombinacija ima C 3 = =
  2
4
= 6.
2

Primjer 17. Na koliko načina možemo rasporediti 4 kuglice iste boje u 7


kutija?

Rješenje. Raspored 4 kuglice iste boje u 7 kutija je kombinacija s ponavljan-


jem 4−tog razreda od 7 elemenata.
 Dakle,
 4 kuglice
 iste boje možemo ras-
4 7 + 4 − 1 10 10!
porediti u 7 kutija na C 7 = = = = 210 načina.
4 4 4! · 6!

1.11 Zadaci za vježbu


1. Registarska tablica na vozilima sastoji se nakon oznake mjesta od tri ili
četiri brojke, te jednog ili dva slova abecede (uzima se 22 slova). Koliko
ima takvih tablica za odredeno mjesto?

2. Koliko ima različitih troznamenkastih brojeva koji u svom zapisu ne


sadrže znamenku 6?

3. Koliko različitih šesteroznamenkastih brojeva postoji koji sadrže točno


jednu znamenku 4?

13
4. Koliko ima neparnih četveroznamenkastih brojeva kojima je zbroj zna-
menaka jedinica i desetica jednak četiri i sve znamenke su medusobno
različite?

5. Koji mnogokut ima 135 dijagonala?

6. Treba složiti 6 bijelih i 5 crnih kuglica u niz tako da alterniraju bijela


- crna - bijela - crna - ... Na koliko načina je to moguće? (Napomena:
razlikujemo kuglice iste boje)

7. Na koliko se načina u igri LOTO 6 od 45 može izvući 6 brojeva i jedan


dopunski broj?

8. Na koliko se načina u igri Super sedmica može izvući 7 brojeva i jedno


dopunsko slovo ako znamo da se u bubnju nalazi 39 različitih brojeva
i ako imamo 2 različita slova?

9. Izbornik rukometne reprezentacije mora od 14 rukometaša izabrati njih


7, ali za tri svoja favorita već je odlučio. Na koliko načina može izabrati
momčad?

10. Od 10 atletičara 2 su bacača, 3 skakači, a ostali su trkači. Na koliko se


načina može izabrati momčad sa 6 atletičara u kojoj bi bio barem po
jedan atletičar iz svakog područja?

11. Koliko se različitih željezničkih kompozicija može sastaviti od loko-


motive, 3 jednaka putnička i 3 jednaka teretna vagona? (Napomena:
lokomotiva se treba nalaziti na prvom mjestu i u kompoziciji se moraju
nalaziti svi vagoni)

12. Snop se sastoji od 52 karte i to 13 karata različite jakosti u svakoj od


4 boje. Na koliko se načina mogu odabrati:

a) dvije karte iste boje


b) dvije karte različitih boja
c) dvije karte iste jakosti
d) dvije karte različitih jakosti?

14
13. Na koliko načina možemo rasporediti 6 plavih kuglica u 10 kutija?

15
16
Poglavlje 2

Vjerojatnost

Teorija vjerojatnosti je grana matematike koja se bavi opisom različitih


modela u kojima se pojavljuje neizvjesnost, a koje se mogu primijeniti na
svakidašnje situacije. Dogadaju za koji bismo rekli da je ”sto posto sigu-
ran” pridjeljujemo vjerojatnost 1. Što je dogadaj izvjesniji, to će njegova
vjerojatnost biti bliže 1. Takoder, što je dogadaj neizvjesniji, odnosno nev-
jerojatniji, imat će vjerojatnost bliže 0. Osnovni pojmovi teorije vjerojatnosti
su dogadaj i vjerojatnost dogadaja.

2.1 Dogadaji
Navedimo najprije oznake i pojmove koje ćemo koristiti. Svaki pokus čiji je
ishod unaprijed odreden nazivamo stohastički pokus. Ishod pokusa ovisi
o nama nepredvidivim okolnostima i stoga je slučajan. Ako bacimo ispravnu
kocku, ona će pasti na jedan od brojeva od 1 do 6 - unaprijed ne znamo na
koji.
Ishod takvog pokusa zovemo elementarni dogadaj i označavamo slovom
ω.
Skup svih elementarnih dogadaja označavamo s Ω. Elementarnih dogadaja
može biti konačno ili beskonačno mnogo.
Dogadaj je podskup skupa Ω. Dogadaje označavamo velikim slovima npr.
A, B, C,. . .
Ω je i sam dogadaj, on se ostvaruje pri svakom ishodu pokusa. Stoga ga
nazivamo siguran dogadaj. Njegova suprotnost je nemoguć dogadaj
(oznaka: ∅).
Primjer 18. Novčić je bačen tri puta. U svakom bacanju bilježimo da li
se pojavilo pismo (P) ili glava (G). Odredite Ω, elementarne dogadaje, te
nekoliko dogadaja vezanih uz ovaj pokus.

17
Rješenje. Elementarnih dogadaja ima 8 (= 23 ). To su:
ω1 = GGG, ω2 = GGP , ω3 = GP G, ω4 = P GG,
ω5 = GP P , ω6 = P GP , ω7 = P P G, ω8 = P P P
Ω = {ω1 , ω2 , ω3 , . . . , ω8 }
Ukupan broj dogadaja vezanih uz ovaj pokus je 28 = 256.
Primjeri dogadaja vezanih uz pokus su:
A = {pismo se pojavilo u prvom bacanju} = {ω4 , ω6 , ω7 , ω8 }
B = {glava se pojavila dvaput} = {ω1 , ω2 , ω3 , ω4 }
C = {pojavilo se barem jedno pismo i barem jedna glava}
= {ω2 , ω3 , ω4 , ω5 , ω6 , ω7 }
Uobičajeno je dogadaje prikazivati Euler-Vennovim dijagramima. Sigu-
ran dogadaj Ω skiciramo obično u obliku nekog pravokutnika.
Ponovimo:
Operacije sa skupovima:

A ∪ B = {x : x ∈ A ∨ x ∈ B} (unija skupova)

A ∩ B = {x : x ∈ A ∧ x ∈ B} (presjek skupova)

A \ B = {x : x ∈ A ∧ x ∈
/ B} (razlika skupova)

Ā = Ac = Ω \ A za A ⊂ Ω (komplement skupa)

2.1.1 Usporedivanje dogadaja


Kažemo da dogadaj A povlači dogadaj B ako realizacija dogadaja A povlači
realizaciju dogadaja B. To znači da B sadrži sve elementarne dogadaje koji
ulaze u A. Pišemo: A ⊆ B
Govorimo još: A je specijalni slučaj dogadaja B, A je sadržan u B.
Primjer 19. Bacamo dvije kocke. Označimo dogadaje:

A = {oba broja su manja od 3}

B = {zbroj brojeva na kockama je manji od 6}

Vrijedi: A ⇒ B jer je zbroj brojeva koji su manji od 3 sigurno manji od 6.


Obrat nije ispunjen, jer zbroj brojeva može bit manji od 6 i kad jedna kocka
padne na 1, a druga na 4. Tada se ostvario dogadaj B, ali ne i A.
Ukoliko vrijedi A ⊂ B i B ⊂ A, onda kažemo da su A i B ekvivalentni
dogadaji i pišemo A = B. Ekvivalentni dogadaji se sastoje od istih elemen-
tarnih dogadaja.

18
Dogadaji A i B su disjunktni ako se istovremeno ne mogu ostvariti i jedan
i drugi. Kažemo da se A i B medusobno isključuju.
Primjer 20. Bacamo kocku. Neka je

A = {pao je paran broj}

B = {pao je broj 5}

Tada su A i B disjunktni.

Algebra dogadaja
Familiju svih dogadaja koji se pojavljuju u nekom pokusu označavat ćemo
s F i zvati algebra dogadaja (na dogadajima ćemo moći raditi operacije
nalik na algebarske).
Unija dogadaja - dogadaj koji se ostvaruje ako se ostvario barem jedan od
dogadaja A ili B, oznaka: A ∪ B ili A + B
Presjek dogadaja - dogadaj koji se ostvaruje ako su se ostvarila oba
dogadaja A i B, oznaka: A ∩ B ili AB
Razlika dogadaja - dogadaj koji se ostvaruje ako se ostvari dogadaj A, a
da se ne ostvari dogadaj B, oznaka: A \ B ili A − B
Komplement ili suprotni dogadaj dogadaja A je dogadaj Ω \ A, oznaka:
A ili Ac
Primjer 21. Bacamo jednu kocku. Neka je

A = {pao je neparan broj}

B = {pao je broj manji od 3}.

Odredite uniju i presjek ta dva dogadaja.


Rješenje. Vrijedi:

A = {pao je neparan broj} = {1, 3, 5}

B = {pao je broj manji od 3} = {1, 2}

A ∪ B = {pao je neparan broj ili broj manji od 3} = {1, 2, 3, 5}

A ∩ B = {pao je neparan broj i broj manji od 3} = {1}.

19
2.2 Svojstva vjerojatnosti
Vjerojatnost je preslikavanje P : F → [0, 1] definirano na algebri dogadaja
F, koje ima svojstva:

1) P (Ω) = 1, P (∅) = 0 (normiranost)

2) ako je A ⊆ B, onda vrijedi P (A) ≤ P (B) (monotonost)

3) ako su A i B disjunktni dogadaji (A · B = ∅), onda je P (A + B) =


P (A) + P (B) (aditivnost).

Broj P (A) nazivamo vjerojatnost dogadaja A.

• 0 ≤ P (A) ≤ 1, za sve dogadaje A

• za svaki dogadaj A vrijedi P (A) = 1 − P (A), gdje je A komplement


(suprotni dogadaj) od A

• za bilo koja dva dogadaja A i B vrijedi P (A + B) = P (A) + P (B) −


P (AB) gdje P (A+B) označava vjerojatnost dogadaja A ili B, tj. vjero-
jatnost njihove unije, a P (AB) označava vjerojatnost da se dogodio i
dogadaj A i B (vjerojatost presjeka dogadaja A i B) .

2.2.1 Konačni vjerojatnosni prostor


Vjerojatnosni prostor Ω koji ima samo konačno mnogo elementarnih dogadaja
nazivamo konačni vjerojatnostni prostor.
Ω = {ω1 , . . . , ωn }
Dogadaj je svaki podskup od Ω.
Vjerojatnost bilo kojeg dogadaja možemo odrediti ako znamo vjerojatnosti
elementarnih dogadaja, tj. ako znamo brojeve p1 = P ({ω1 }), . . . , pn =
P ({ωn }).
Ovi brojevi imaju svojstvo p1 > 0, . . . , pn > 0, p1 + · · · + pn = 1.
Neka je A ∈ F bilo koji dogadaj. On se sastoji od nekoliko elementarnih
dogadaja: A = {ωi1 , ωi2 , . . . , ωim }. Vjerojatnost dogadaja A računamo tako
da zbrojimo vjerojatnosti tih elementarnih dogadaja P (A) = pi1 + pi2 + · · · +
pim .
Promatramo pokus koji ima konačno mnogo ishoda i u kojem je razumno
pretpostaviti da su svi elementarni dogadaji jednako vjerojatni.
Neka je Ω = {ω1 , . . . , ωn } skup svih elementarnih dogadaja i p1 , . . . , pn pri-
padne vjerojatnosti. Kako su svi ti brojevi jednaki, a njihov je zbroj jednak
1, vrijedi pi = P ({ωi }) = n1 , i = 1, . . . , n.

20
Ovakav vjerojatnosni prostor nazivamo klasični vjerojatnosni prostor.
Neka je A bilo koji dogadaj. Da bismo izračunali vjerojatnost dogadaja A,
dovoljno nam je samo znati koliko on elementarnih dogadaja sadrži. Ako je
A = {ωi1 , . . . , ωim }, onda je P (A) = pi1 + · · · + pim = m
n
.
(n je broj svih mogućih ishoda, a m je broj svih povoljnih ishoda)
U klasičnom vjerojatnosnom prostoru vjerojatnost dogadaja računa se
formulom
m broj povoljnih ishoda
P (A) = = .
n broj mogućih ishoda
De Morganovi zakoni

P (A B) = P (A + B)
P (A + B) = P (AB)

Primjer 22. Neka su A i B dogadaji za koje vrijedi


P (A) = 0.4, P (B) = 0.5, P (AB) = 0.2.
Odredite
P (A + B), P (A), P (B), P (A B), P (A + B), P (AB), P (AB).
Rješenje:
P (A) = 1 − P (A) = 1 − 0.4 = 0.6
P (B) = 1 − P (B) = 1 − 0.5 = 0.5
P (A + B) = P (A) + P (B) − P (AB) = 0.4 + 0.5 − 0.2 = 0.7
P (A B) = P (A + B) = 1 − P (A + B) = 1 − 0.7 = 0.3
P (A + B) = P (AB) = 1 − P (AB) = 1 − 0.2 = 0.8
P (AB) = P (A\B) = P (A) − P (AB) = 0.4 − 0.2 = 0.2
P (AB) = P (B\A) = P (B) − P (AB) = 0.5 − 0.2 = 0.3

Primjer 23. Za dogadaje A i B vrijedi A + B = Ω. Ako je P (A) = 0.6 i


P (B) = 0.7, kolika je vjerojatnost P (AB)?
Rješenje: S obzirom da za dogadaje A i B vrijedi A + B = Ω, onda je
P (A + B) = 1 (siguran dogadaj).
Vrijedi: P (A + B) = P (A) + P (B) − P (AB). Dakle, P (AB) = P (A) +
P (B) − P (A + B) = 0.6 + 0.7 − 1 = 0.3.

21
Primjer 24. Bacamo malo neobičnu kocku, koja na svojim stranama ima
zapisane brojeve 2, 3, 3, 4, 4, 6. Kolika je vjerojatnost sljedećih dogadaja?

A = {pojavio se paran broj}

B = {pojavio se broj veći od 2}

C = {pojavio se broj 5}

Rješenje. Skup svih elementarnih dogadaja Ω = {2, 3, 3, 4, 4, 6}, pa je k(Ω) =


6. Dogadaj A je pojavio se paran broj, dakle A = {2, 4, 4, 6}. Znači imamo
4 povoljna ishoda od njih 6, odnosno k(A) = 4, pa je vjerojatnost P (A) =
k(A) 4 2
= = .
k(Ω) 6 3
Dogadaj B je pojavio se broj veći od 2, a to su brojevi 3, 4 i 6, pa je
5
B = {3, 3, 4, 4, 6}. Dakle, P (B) = .
6
Dogadaj C je pojavio se broj 5, a kao što vidimo broj 5 nije zapisan niti na
jednoj strani kocke, pa je to nemoguć dogadaj, tj. C = ∅. Dakle, P (C) = 0.

Primjer 25. Bacamo dvije ispravne kocke. Kolike su vjerojatnosti sljedećih


dogadaja?

A = {pojavile su se dvije šestice}

B = {pojavila se jedna jedinica i jedna dvojka}

C = {pojavila su se dva jednaka broja}

D = {zbroj brojeva jednak je 5}

E = {pojavio se broj veći od 2}

Rješenje. Skup svih elementarnih dogadaja je

Ω = {(1, 1), (1, 2), (1, 3), . . . (6, 4), (6, 5), (6, 6)},

pa je k(Ω) = 36. Dogadaj A je pojavile su se dvije šestice, pa je A = {(6, 6)},


1
odnosno k(A) = 1. Dakle, P (A) = .
36
Dogadaj B je pojavila se jedna jedinica i jedna dvojka, odnosno B =
2 1
{(1, 2), (2, 1)}, pa je k(B) = 2. Dakle, P (B) = = .
36 18
Dogadaj C = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}, pa je k(C) = 6. Dakle,
6 1
P (C) = = .
36 6
22
Dogadaj D = {(1, 4), (2, 3), (4, 1), (3, 2)}, pa je k(C) = 4. Dakle, P (D) =
4 1
= .
36 9
Vjerojatnost dogadaja E ćemo lakše izračunati preko vjerojatnosti njemu
suprotnog dogadaja, a to je dogadaj E.
E = {oba broja su manja ili jednaka 2} = {(1, 1), (1, 2), (2, 1), (2, 2)}, pa je
4 1 1 8
P (E) = = . Dakle, P (E) = 1 − P (E) = 1 − = .
36 9 9 9
Primjer 26. U kutiji se nalazi 10 kuglica, 6 plavih i 4 crvene. Biramo na
sreću tri kuglice. Odredimo vjerojatnosti sljedećih dogadaja:

A = {sve tri kuglice su plave}

B = {sve tri kuglice su iste boje}

C = {dvije kuglice su plave, jedna je crvena}

Rješenje. Tri kuglice iz skupa od 10 kuglica možemo izabrati na N = 10



3
načina. Dakle, broj mogućih ishoda je N . Tri kuglice iz skupa od šest plavih
6

kuglica možemo izabrati na 3 načina, pa povoljnih dogadaja za dogadaj A
imamo MA = 63 . Dakle,
6

MA 3 1
P (A) = = 10
 = .
N 3
6

Promotrimo sada dogadaj B. Možemo izabrati sve tri plave kuglice ili sve tri
crvene kuglice, pa povoljnih dogadaja za dogadaj B imamo MB = 63 + 43 .


Dakle,
6
+ 43
 
MB 3 1
P (B) = = 10
 = .
N 3
5
Dvije plave kuglice možemo izabrati na 62 načina, a jednu crvenu na 41
 

načina, pa je broj povoljnih dogadaja za dogadaj C jednak MC = 62 41 .


Dakle,
6 4
 
1
P (C) = 2 101 = .
3
2

2.3 Geometrijska vjerojatnost


Neka je Ω ograničeni podskup ravnine i m(Ω) njegova površina, te neka je
A podskup od Ω. Na sreću biramo točku unutar skupa Ω. Vjerojatnost da

23
točka bude izabrana unutar podskupa A jednaka je

m(A)
P (A) = .
m(Ω)

Ovako definiranu vjerojatnost nazivamo geometrijska vjerojatnost.


Primjer 27. Unutar intervala [0, 1] biraju se na sreću dva broja x i y.
Odredite vjerojatnost dogadaja A = {(x, y) ∈ [0, 1] × [0, 1] : x > y},
B = {(x, y) : x + y < 32 }.
Rješenje. Izbor dva broja iz intervala [0, 1] odgovara izboru jedne točke (x, y)
unutar jediničnog kvadrata [0, 1] × [0, 1]. Taj kvadrat predstavlja skup svih
elementarnih dogadaja, označimo ga s Ω. Površina skupa Ω je m(Ω) = 1.
1.2

1.0 y=x

0.8

0.6

0.4

0.2
A
0.2 0.4 0.6 0.8 1.0 1.2

Slika 2.1: A = {(x, y) ∈ [0, 1] × [0, 1] : x > y}

2.0

1.5 3
y= -x
2

1.0

0.5
B
0.2 0.4 0.6 0.8 1.0 1.2

Slika 2.2: B = {(x, y) ∈ [0, 1] × [0, 1] : x + y < 32 }

1·1
Površina skupa A je m(A) = 2
, pa je vjerojatnost dogadaja A
1
m(A) 1
P (A) = = 2 = .
m(Ω) 1 2

24
Površinu skupa B možemo izračunati tako da od površine skupa Ω oduzmemo
površinu pravokutnog trokuta s katetama 12 i 21 (vidi Sliku 2.2), pa je
1
2
· 12 7 m(B) 7
7
m(B) = 1 − = , pa je P (B) = = 8 = .
2 8 m(Ω) 1 8

2.4 Uvjetna vjerojatnost


Uvjetna vjerojatnost dogadaja A, ako je poznato da se ostvario dogadaj
B takav da je P (B) > 0, je broj P (A|B) definiran s:
P (AB)
P (A|B) := .
P (B)

Primjer 28. U kutiji se nalazi 6 bijelih i 4 crne kuglice. Kolika je vjerojatnost


da će prve dvije kuglice koje izvučemo biti bijele?
Rješenje. Zamislimo da kuglice izvlačimo jednu po jednu. Neka su A i B
dogadaji
A = {prva izvučena kuglica je bijele boje},
B = {druga izvučena kuglica je bijele boje}.
Tada je AB = {prva i druga kuglica su bijele boje} dogadaj čiju vjerojat-
nost tražimo. Znamo:
6 3
P (A) = = .
10 5
Nakon što smo izvukli prvu kuglicu, u kutiji je preostalo 9 kuglica, od kojih
je 5 bijelih pa je
5
P (B|A) = .
9
Tada je tražena vjerojatnost dogadaja AB:
3 5 1
P (AB) = P (A) · P (B|A) = · = .
5 9 3
Primjer možemo riješiti i na drugi
 način: Dvije kuglice iz skupa od 10 kuglica
10
možemo odabrati na N = 2 načina. Dakle, broj mogućih ishoda  je N .
6
Dvije kuglice iz skupa od šest bijelih kuglica možemo izabrati na 2 načina,
pa povoljnih dogadaja za dogadaj AB imamo MAB = 62 .


6

2 1
P (AB) = 10 = .
2
3

25
Primjer 29. U kutiji se nalazi 6 bijelih i 4 crne kuglice. Izvlačimo jednu po
jednu dvije kuglice.

1. Kolika je vjerojatnost da će druga kuglica biti bijela ako je prva kuglica
bila bijela?

2. Kolika je ta vjerojatnost ako je prva kuglica bila crna?

Izračunajte obje vjerojatnosti u sljedeće dvije situacije:

a) prva se kuglica nakon izvlačenja ne vraća u kutiju

b) prva se kuglica nakon izvlačenja vraća u kutiju.

Rješenje. Neka su A i B dogadaji

A = {prva izvučena kuglica je bijele boje},

B = {druga izvučena kuglica je bijele boje}.


Izračunajmo najprije vjerojatnosti dogadaja A i A. Dobivamo da je P (A) =
6 3 2
= , P (A) = .
10 5 5
1.a) Već smo izvukli jednu bijelu kuglicu koju nismo vratili u kutiju tako
da sad u kutiji imamo 5 bijelih i 4 crne kuglice. Vjerojatnost da ćemo
5 5
izvući bijelu je . Dakle, P (B|A) = .
9 9
2.a) Već smo izvukli jednu crnu kuglicu koju nismo vratili u kutiju tako da
sad u kutiji imamo 6 bijelih i 3 crne kuglice. Vjerojatnost da ćemo
6 2
izvući bijelu je . Dakle, P (B|A) = .
9 3
1.b) Već smo izvukli jednu bijelu kuglicu, ali smo ju vratili u kutiju tako da
opet u kutiji imamo 6 bijelih i 4 crne kuglice. Vjerojatnost da ćemo
6 3
izvući bijelu je . Dakle, P (B|A) = .
10 5
2.b) Već smo izvukli jednu crnu kuglicu, ali smo ju vratili u kutiju tako da
opet u kutiji imamo 6 bijelih i 4 crne kuglice. Vjerojatnost da ćemo
6 3
izvući bijelu je . Dakle, P (B|A) = .
10 5
Vidimo da u slučaju kad izvučenu kuglicu vratimo u kutiju, vjerojatnost
dogadaja A ne utječe na vjerojatnost dogadaja B.

26
Primjer 30. Dva broja x i y biramo na sreću unutar intervala [0, 2]. Kolika
je vjerojatnost da je x > 1 ako je poznato da vrijedi x + y > 2?
Rješenje. Neka su A i B dogadaji

A = {(x, y) ∈ [0, 2] × [0, 2] : x > 1},

B = {(x, y) ∈ [0, 2] × [0, 2] : x + y > 2}.


Skup svih elementarnih dogadaja je Ω = [0, 2] × [0, 2]. Dakle, m(Ω) = 4.
Izračunajmo najprije P (B) i P (AB).
2.0

1.5

1.0 B
y=2-x
0.5

0.5 1.0 1.5 2.0

Slika 2.3: B = {(x, y) ∈ [0, 2] × [0, 2] : x + y > 2}

2.0

1.5

y=2-x
1.0
AB
0.5

0.5 1.0 1.5 2.0

Slika 2.4: AB = {(x, y) ∈ [0, 2] × [0, 2] : x + y > 2, x > 1}

2·2 m(B) 2 1
Površina skupa B je m(B) = 2
= 2, pa je P (B) =
= = .
m(Ω) 4 2
Površinu skupa AB možemo izračunati kao zbroj površine kvadrata
[1, 2] × [1, 2] i površine pravokutnog trokuta (vidi Sliku 2.4), pa je m(AB) =
1·1 3 m(AB) 3
1·1+ = . Dakle, P (AB) = = . Tražena vjerojatnost je
2 2 m(Ω) 8
P (AB) 3
P (A|B) = = .
P (B) 4

27
2.4.1 Nezavisni dogadaji
Dogadaji A i B su nezavisni ako vrijedi P (A|B) = P (A) ili P (B|A) = P (B).
Nužan i dovoljan uvjet za nezavisnost je da vrijedi:
P (AB) = P (A) · P (B).

Primjer 31. Bacamo dvije kocke. Kolika je vjerojatnost da broj na prvoj


kocki bude paran, a na drugoj kocki manji od 3?
Rješenje. Neka su A i B dogadaji
A = {na prvoj kocki je pao paran broj},
B = {na drugoj kocki je pao broj manji od 3}.
3
Izračunajmo najprije vjerojatnosti dogadaja A i B. Dobivamo: P (A) = =
6
1 2 1
, P (B) = = . Dogadaji A i B su nezavisni (broj na drugoj kocki ne ovisi
2 6 3
1 1 1
o broju koji je pao na prvoj kocki) pa je P (AB) = P (A) · P (B) = · = .
2 3 6
Primjer 32. Proizvodnja nekog proizvoda organizirana je na traci koja se
sastoji od n dijelova, od kojih svaki radi neovisno o ostalima. Ako barem
jedan od dijelova prestane s radom, prestaje i cjelina. Vjerojatnost da j-ti
dio neće otkazati tijekom dana jednaka je rj . Kolika je vjerojatnost da će
čitava traka raditi isprvno u tom danu?
Rješenje. Neka su A i Aj dogadaji
A = {traka će taj dan raditi ispravno},
Aj = {j − ti dio je ispravan}, j = 1, . . . , n.
Vidimo da je A = A1 · A2 · · · · · An . Kako svaki dio radi neovisno o ostalima
imamo da su dogadaji Aj nezavisni pa je P (A) = P (A1 )·P (A2 )·· · ··P (An ) =
r1 · r2 · · · · · rn .

2.5 Formula potpune vjerojatnosti. Bayesova


formula
FormulaSnpotpune vjerojatnosti
Neka je i=1 Hi = Ω i Hi ∩ Hj = ∅, ∀i 6= j. Za svaki dogadaj A ⊂ Ω vrijedi
n
X
P (A) = P (Hi ) · P (A|Hi ).
i=1

28
Bayesova formula

P (Hi ) · P (A|Hi )
P (Hi |A) = Pn
j=1 P (Hj ) · P (A|Hj )

Primjer 33. U prvoj kutiji nalaze se 3 crvene i 2 plave kuglice, a u drugoj 4


crvene i 2 plave. Odaberemo na sreću jednu kuglicu iz prve kutije i prebacimo
je u drugu. Kolika je vjerojatnost da će kuglica nakon toga izvučena na sreću
iz druge kutije biti plava?
Rješenje. Neka su H1 , H2 i A dogadaji

H1 = {prebacili smo crvenu kuglicu},

H2 = {prebacili smo plavu kuglicu},


A = {iz druge kutije smo izvukli plavu kuglicu}.
Izračunajmo najprije P (H1 ) i P (H2 ). U prvoj kutiji imamo 3 crvene kuglice
3
pa je vjerojatnost da smo prebacili crvenu kuglicu P (H1 ) = . Analogno,
5
2
P (H2 ) = . Ako smo iz prve kutije prebacili crvenu kuglicu, onda će u
5
drugoj kutiji biti 5 crvenih i 2 plave kuglice pa je vjerojatnost da izvučemo
2
plavu kuglicu P (A|H1 ) = . Ako smo iz prve kutije prebacili plavu kuglicu,
7
onda će u drugoj kutiji biti 4 crvene i 3 plave kuglice pa je vjerojatnost
3
da izvučemo plavu kuglicu P (A|H2 ) = . Konačno, korištenjem formule
7
P (A) = ni=1 P (Hi ) · P (A|Hi ) dobivamo
P

3 2 2 3 12
P (A) = · + · = .
5 7 5 7 35

Primjer 34. Ptica slijeće u slučajno izabrano gnijezdo od ukupno tri gnijezda
koja su joj na raspolaganju. Svako gnijezdo sadrži dva jaja i to: u prvom
gnijezdu su oba jaja zdrava, u drugom je jedno zdravo i jedan mućak, a u
trećem su oba jaja mućak. Nadite vjerojatnost da ptica sjedi na mućku. Ako
je sjela na mućak, kolika je vjerojatnost da sjedi u drugom gnijezdu?
Rješenje. Neka su H1 , H2 , H3 i A dogadaji

H1 = {ptica slijeće u prvo gnijezdo},

H2 = {ptica slijeće u drugo gnijezdo},

29
H3 = {ptica slijeće u treće gnijezdo},
A = {ptica sjedi na mućku}.
Vjerojatnosti da ptica sleti u prvo, drugo ili treće gnijezdo su iste pa je
1
P (H1 ) = P (H2 ) = P (H3 ) = . U prvom gnijezdu su oba jaja zdrava
3
pa je vjerojatnost da sjedi na mućku jednaka 0, to jest P (A|H1 ) = 0. U
drugom gnijezdu je jedno jaje zdravo, a drugo je mućak pa je vjerojatnost
1 1
da sjedi na mućku jednaka , to jest P (A|H2 ) = . U trećem gnijezdu
2 2
su oba jaja mućak pa je vjerojatnost da sjedi na mućku jednaka 1, to jest
P (A|H2 ) = 1. Vjerojatnost
Pn da ptica sjedi na mućku dobivamo korištenjem
formule P (A) = i=1 P (Hi ) · P (A|Hi ), dakle
1 1 1 1 1
P (A) = ·0+ · + ·1= .
3 3 2 3 2
Još treba izračunati kolika je vjerojatnost da sjedi u drugom gnijezdu ako je
sjela na mućak, to jest treba izračunati P (H2 |A).
1 1
P (H2 ) · P (A|H2 ) 3
· 2 1
P (H2 |A) = = 1 = .
P (A) 2
3

Primjer 35. U dvije od tri jednake pregrade nalaze se 2 crne i 2 bijele kuglice,
a u trećoj 1 crna i 5 bijelih. Iz slučajno odabrane pregrade izvučena je bijela
kuglica. Kolika je vjerojatnost da je ona izvučena iz treće pregrade?
Rješenje. Neka su H1 , H2 , H3 i A dogadaji
Hi = {kuglica je izvučena iz i − te pregrade}, i = 1, 2, 3
A = {izvučena je bijela kuglica}.
Vjerojatnosti izbora pregrade su jednake pa je P (H1 ) = P (H2 ) = P (H3 ) =
1
. U prvoj i drugoj pregradi su dvije crne i dvije bijele kuglice pa je vjerojat-
3
1 1
nost da izvučemo bijelu kuglicu jednaka , to jest P (A|H1 ) = P (A|H2 ) = .
2 2
U trećoj pregradi je jedna crna kuglica i pet bijelih kuglica pa je vjerojatnost
5 5
da izvučemo bijelu kuglicu jednaka , to jest P (A|H3 ) = . Izračunajmo
6 6
najprije vjerojatnost dogadaja A:
1 1 1 1 1 5 11
P (A) = · + · + · = .
3 2 3 2 3 6 18
Sada možemo izračunati vjerojatnost da je kuglica izvučena iz treće pregrade:
1 5
P (H3 ) · P (A|H3 ) 3
· 6 5
P (H3 |A) = = 11 = = 0.45.
P (A) 18
11

30
Primjer 36. U tvornici se proizvode proizvodi X i Y . Poznato je da se
proizvodi 25% loših proizvoda X i 10% loših proizvoda Y . Proizvodi Y
iznose 60% ukupne proizvodnje. Ako se nasumce uzme loš proizvod, kolika
je vjerojatnost da je to proizvod Y ?
Rješenje. Neka su H1 , H2 i A dogadaji

H1 = {izabran je proizvod X},

H2 = {izabran je proizvod Y },

A = {proizvod je loš}.
Proizvodi X iznose 40% ukupne proizvodnje, pa je P (H1 ) = 0.4. Analogno,
proizvodi Y iznose 60% ukupne proizvodnje, pa je P (H2 ) = 0.6 Proizvodi
se 25% loših proizvoda X, pa je P (A|H1 ) = 0.25. Analogno, proizvodi se
10% loših proizvoda Y , pa je P (A|H2 ) = 0.1. Treba izračunati P (H2 |A).
Korištenjem formule

P (Hi ) · P (A|Hi )
P (Hi |A) = Pn
j=1 P (Hj ) · P (A|Hj )

dobivamo
0.6 · 0.1
P (H2 |A) = = 0.375.
0.4 · 0.25 + 0.6 · 0.1

2.6 Zadaci za vježbu


1. Istovremeno se bacaju novčić i kocka. Neka A označava dogadaj da je
novčić pao na pismo, a B dogadaj da se na kocki pojavio paran broj.
Riječima opisati dogadaje:

A, B, AB, AB, AB, A + B.

Izračunati vjerojatnosti dogadaja.

2. Student polaže ispite iz matematike, statistike i računarstva. Vjero-


jatnost da će položiti matematiku je 0.6, vjerojatnost da će položiti
statistiku je 0.8, a vjerojatnost da će položiti računarstvo je 0.7. Ko-
lika je vjerojatnost da će položiti barem jedan od ta tri ispita?

31
3. Pretpostavimo da tenisač uvijek servira negdje unutar protivničkog
polja, kolika je vjerojatnost da je pogodio polje servisa? (Napomena:
dimenzije protivničkog polja su: 11.89m x 8.23m, a dimenzije polja
servisa su 6.4m x 4.115m.)

4. Bacamo dvije kocke. Nadite vjerojatnost da je suma dobivenih brojeva


paran broj uz uvjet da se pojave različiti brojevi.

5. U kutiji se nalazi 15 kuglica, 7 plavih, 6 žutih i 2 crvene. Biramo na


sreću šest kuglica. Odredite vjerojatnosti sljedećih dogadaja:

A = {sve kuglice su plave}


B = {tri kuglice su plave, dvije žute i jedna kuglica je crvena}.

6. Trgovina nabavlja procesore od tri različita proizvodača: 25% od


proizvodača A, 40% od B i 35% od C. Pokazalo se da je postotak neis-
pravnosti procesora redom 3%, 1% i 4%. Ako je kupac vratio procesor
zbog neispravnosti, kolika je vjerojatnost da je procesor od proizvodača
C?

7. Trgovina odjeće prodaje odjeću u tri različite veličine: 52% veličine S,


28% veličine M i 20% veličine L. Pokazalo se da je postotak odjeće s
greškom redom 4%, 2% i 3%. Ako je trgovina ustanovila da je odjevni
predmet loš, kolika je vjerojatnost da je taj odjevni predmet veličine
S?

8. Neki vojni cilj se gada iz 3 topa. Topovi pogadaju cilj nezavisno


jedan od drugoga s vjerojatnošću 0.4. Ako jedan top pogodi cilj on ga
uništava s vjerojatnošću 0.3, ako ga pogode dva topa uništavaju ga s
vjerojatnošću 0.7, ako ga pogode tri topa uništavaju ga s vjerojatnošću
0.9. Kolika je vjerojatnost da će cilj biti uništen?

32
Poglavlje 3

Deskriptivna statistika

Prilikom opažanja ili eksperimentiranja, promatramo jednu ili više veličina.


Ako se promatra samo jedna veličina, označimo ju s X, onda je rezultat
jednog eksperimenta jedan realan broj x. Višestrukim ponavljanjem mjerenja
(opažanja) veličine X dobiva se konačni niz brojeva x1 , x2 , . . . , xn kao rezul-
tat n ponovljenih mjerenja (opažanja). Veličinu X nazivamo statističko
obilježje, a dobiveni niz brojeva x1 , x2 , . . . , xn statistički podaci o proma-
tranom statističkom obilježju X.

3.1 Prikazivanje statističkih podataka


Skup svih vrijednosti koje statističko obilježje X može poprimiti označavamo
RX = {a1 , a2 , a3 , . . . }.
Ako je RX diskretan skup, kažemo da je X diskretno obilježje, a ako je RX
kontinuiran skup, kažemo da je X neprekidno (kontinuirano) obilježje.
Svakom elementu ai ∈ RX možemo pridružiti broj fi koji nazivamo
frekvencija (učestalost pojavljivanja) elementa ai u nizu podataka.
Takoder, možemo promatrati u kojem postotku se pojavljuje koja vrijed-
nost. Neka je n broj mjerenja (opažanja). Broj

fi
fri =
n

nazivamo relativna frekvencija elementa ai .


Za prikazivanje statističkih podataka, uz primjenu pojma frekvencije i
relativne frekvencije, najčešće se upotrebljava tablica frekvencija.

33
vrijednost frekvencija relativna frekvencija
a1 f1 fr1
a2 f2 fr2
.. .. ..
. . .
am fm frm
Σ n ≈1

Uočimo: zbroj svih frekvencija iznosi n, tj. jednak je broju izvršenih


mjerenja, dok je zbroj svih relativnih frekvencija jednak približno 1.
Zapisujemo:
m
X
fi = n,
i=1
m
X
fri = 1, 0 ≤ fri ≤ 1, i = 1, 2, ..., m.
i=1

Primjer 37. Ispitu iz Matematike pristupilo je 30 studenata. Dobivene su


ocjene:

1, 4, 2, 3, 1, 1, 2, 4, 2, 3, 4, 5, 3, 2, 2, 2, 5, 3, 2, 2, 3, 3, 4, 2, 3, 2, 3, 3, 3, 3.

Analizirajte dane podatke.


Rješenje. Statističko obilježje X = ”ocjena iz matematike”. Skup svih vri-
jednosti koje X može poprimiti je RX = {1, 2, 3, 4, 5}, to je diskretan, tj.
konačan skup, pa kažemo da je X diskretno obilježje.
Svakom elementu ai ∈ RX možemo pridružiti odgovarajuću frekvenciju.
U našem primjeru tri studenta imaju ocjenu 1 pa pišemo f1 = 3, deset stu-
denata ima ocjenu 2, f2 = 10, jedanaest studenata ima ocjenu 3, f3 = 11,
četiri studenta imaju ocjenu 4, f4 = 4 i dva studenta imaju ocjenu 5, f5 = 2.
3
Računanjem relativnih frekvencija za svaku ocjenu dobivamo fr1 = 30 =
1 10 1 11 4 2 2 1
10
, f r2 = 30
= 3
, f r3 = 30
, f r4 = 30
= 15
i f r5 = 30
= 15
.
Prikažimo podatke u tablici frekvencija.

ocjena frekvencija relativna frekvencija


1
1 3 10
= 0.1
1
2 10 3
= 0.33
11
3 11 30
= 0.37
2
4 4 15
= 0.13
1
5 2 15
= 0.07
Σ 30 1

34
Grafikon frekvencija
Na temelju tabličnog prikaza statističkih podataka izraduju se različiti
grafički prikazi.
Grafikon frekvencija: na os apscisa nanesemo podatke, a na os ordinata
odgovarajuće frekvencije
Grafikon relativnih frekvencija: na os apscisa nanesemo podatke, a na
os ordinata odgovarajuće relativne frekvencije.
Spajanjem tih točaka dobije se poligon (relativnih) frekvencija.

Grafikon frekvencija

12
11
10 10
broj studenata

4 4
3
2 2

0
1 2 3 4 5
ocjene

Stupčasti dijagram (Bar chart)

Prikaz ocjena

12 11
10
10
broj studenata

6
4
4 3
2
2

0
1 2 3 4 5
ocjene

35
Strukturni krug (Pie chart)
Ako imamo relativno malo različitih vrijednosti koje statističko obilježje može
poprimiti, onda statističke podatke možemo prikazati pomoću strukturnog
kruga.

Prikaz ocjena

7% 10%
13%

1
2
3
33%
4
5

37%

Grupiranje podataka u razrede


Kada je broj podataka relativno velik podatke grupiramo u razrede (inter-
vale). Razredi ne moraju biti jednake duljine, ali u praksi najčešće jesu.
U praksi razrede odredujemo na sljedeći način:

1. odredimo xmin i xmax

2. izračunamo raspon podataka R = xmax − xmin



3. izaberemo odgovarajući broj razreda (okvirno: k ≈ n)

4. odredimo zajedničku širinu razreda:

R
c=
k
(uvijek zaokružujemo na više!)

5. odredimo razrede (tj. lijevi prag razreda): I1 , ..., Ik


pritom I1 ∪ I2 ∪ ... ∪ Ik mora obuhvaćati sve podatke

36
Napomena: Širinu razreda možemo računati i po formuli:
R
c= .
1 + 3.22 log n
R
Tada je broj razreda jednak k = .
c
Primjer 38. Na pismenom ispitu iz statistike dobiveni su sljedeći podaci (broj
bodova):
68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
65 80 73 57 88 78 62 76 53 74
(a) Izvršite grupiranje podataka u razrede te napravite tablicu frekvencija
i relativnih frekvencija.
(b) Nacrtajte histogram.
(c) Analizirajte podatke: najmanji broj bodova, najveći broj bodova, ko-
liko studenata ima više od 86 bodova, itd.
Rješenje. Najprije odredimo najmanji i najveći podatak. Dobivamo xmin =
53 i xmax = 93. Stoga je raspon
√ R = 40. Uočimo da imamo 30 podataka,
pa je n = 30, odnosno k ≈ 30 = 5.48. Dakle, zaokruživanjem na više
dobivamo da je broj razreda k = 6. Zajednička širina razreda
R 40
c= = = 6.7.
k 6
Preostaje nam odrediti razrede. Ako želimo osigurati da nijedan od danih
podataka nije rubni u nekom razredu, lijevi prag prvog razreda odredimo tako
da od xmin oduzmemo 0.05. Dakle, lijevi prag prvog razreda je 52.95, dok
desni prag prvog razreda dobivamo tako da lijevom dodamo širinu razreda
6.7, odnosno dobivamo 59.65. Analogno dobivamo lijeve i desne pragove
preostalih pet razreda.
Sada možemo napraviti tablicu frekvencija i relativnih frekvencija.
Razredi Frekvencije Relativne frekvencije Sredine razreda
I1 = h52.95, 59.65i 3 0.1 56.3
I2 = h59.65, 66.35i 4 0.13 63
I3 = h66.35, 73.05i 6 0.2 69.7
I4 = h73.05, 79.75i 7 0.23 76.4
I5 = h79.75, 86.45i 4 0.13 83.1
I6 = h86.45, 93.15i 6 0.2 89.8
Σ 30 0.99

37
Možemo analizirati podatke: najmanji broj bodova je 53, dok je najveći 93,
više od 86 bodova ima šest studenata.
Nacrtajmo histogram za ove podatke.

Histogram
8

5
frekvencije

0
56,3 63 69,7 76,4 83,1 89,8
Broj bodova

Primjer 39. Mjerenjem kontinuiranog obilježja dobiveni su sljedeći podaci:

4.69 5.25 5.11 2.23 4.26 3.71 2.81 3.79


3.11 2.95 3.52 4.94 4.51 3.83 3.71 2.81
4.95 2.09 4.72 3.89 4.27 4.75 2.80 5.36
3.05 3.20 3.29 3.82 3.34 5.00 4.31 5.48
3.46 4.49 1.82 1.95 3.96 3.89 2.06 5.01
4.47 3.25 3.78 3.87 3.94 3.43 3.60 4.60

(a) Izvršite grupiranje podataka, napravite tablicu frekvencija i relativnih


frekvencija.

(b) Nacrtajte histogram za dane podatke.

Rješenje. Statističko obilježje X je kontinuirano (neprekidno), odnosno


poprima vrijednosti iz nekog intervala. Podatke trebamo svrstati u razrede
pa odredimo najmanji i najveći podatak, x √min = 1.82, xmax = 5.48. Sad
odredimo odgovarajući broj razreda: k ≈ 48, zaokružimo na više i dobi-
jemo k = 7 i zajedničku širinu razreda:
xmax − xmin 5.48 − 1.82
c= = = 0.5228.
k 7
38
Zaokružujemo na više i dobijemo c = 0.53. Još moramo odrediti razrede.
Lijevi prag prvog razreda odredimo tako da od xmin oduzmemo 0.005 (time
osiguravamo da nijedan od danih podataka nije rubni u nekom razredu).
Stoga je 1.815 lijevi prag prvog razreda, dok je desni prag prvog razreda
1.815 + 0.53 = 2.345 (lijevom pragu dodamo širinu razreda). Lijevi prag dru-
gog razreda je desni prag prvog, odnosno 2.345, a desni prag drugog razreda
je 2.345 + 0.53 = 2.875. Analogno dobijemo lijevi i desni prag svakih ostalih
razreda. Sad možemo napraviti tablicu frekvencija i relativnih frekvencija.

RAZREDI SREDINE RAZREDA fi fri = fni


I1 = h1.815, 2.345i 2.08 5 0.1041
I2 = h2.345, 2.875i 2.61 3 0.0625
I3 = h2.875, 3.405i 3.14 7 0.1458
I4 = h3.405, 3.935i 3.67 13 0.2708
I5 = h3.935, 4.465i 4.20 5 0.1041
I6 = h4.465, 4.995i 4.73 9 0.1875
I7 = h4.995, 5.525i 5.26 6 0.125
Σ 48 ≈1

Ostaje još nacrtati histogram za dane podatke. Širina stupića nije proizvoljna
(sada je jednaka širini razreda, tj. c=0.53). Na osi apscisa označimo sredine
razreda.

Histogram

Histogram

14
12
10
frekvencija

8
6
4
2
0
2,08 2,61 3,14 3,67 4,2 4,73 5,26
podaci

39
3.1.1 Zadaci za vježbu
1. Rezultati mjerenja neke veličine su:

138 164 150 132 144 125 149 159 146 158
140 147 136 148 152 144 168 126 138 176
163 119 154 165 146 173 142 147 135 153
140 135 161 145 135 142 150 156 145 128

(a) Izvršite grupiranje podataka, napravite tablicu frekvencija i rela-


tivnih frekvencija.
(b) Nacrtajte histogram za dane podatke.

2. Od 50 slučajno izabranih osoba dobiveni su sljedeći podaci o broju


poslanih sms poruka u mjesec dana:

40 44 37 70 63 45 48 51 53 66
58 62 62 60 48 50 53 67 75 64
48 66 52 55 62 28 57 59 45 67
72 48 50 60 46 60 47 61 28 55
83 34 29 76 61 43 52 75 62 48

(a) Izvršite grupiranje podataka, napravite tablicu frekvencija i rela-


tivnih frekvencija.
(b) Nacrtajte histogram za dane podatke.

3. U jednom poduzeću plaće zaposlenika iznose:

Plaća/ kn Broj zaposlenika


2500-2999.99 8
3000-3499.99 10
3500-3999.99 16
4000-4499.99 14
4500-4999.99 10
5000-5499.99 5
5500-5999.99 2

Odredite:

40
a) donju granicu 6. razreda, gornju granicu 2.razreda
b) veličinu 3. razreda
c) postotak zaposlenika koji zaraduju više od 3500 kn
d) postotak zaposlenika koji zaraduju više od 3000 kn, a manje od
5000 kn
e) nacrtajte histogram frekvencija

4. Površine kontinenata na Zemlji iznose:

kontinent Površina /milijuni km2


Afrika 30.4
Europa 10.0
Sjeverna Amerika 24.0
Južna Amerika 18.0
Australija 7.6
Antarktika 12.2
Azija 44.7

a) Nacrtajte strukturni krug


b) Analizirajte podatke (najveći, najmanji kontinent, koliki postotak
zauzima Australija i Antarktika, . . . )

3.2 Parametri niza statističkih podataka (uzorka)


3.2.1 Aritmetička sredina uzorka
Aritmetička sredina uzorka je broj
1
x̄ := (x1 + x2 + . . . + xn ).
n
Ako je X = {a1 , a2 , . . . , ak } i pritom se ai u uzroku ponavlja fi puta, onda
vrijedi
k k
1X X
x̄ = f i · ai , n = fi .
n i=1 i=1

Napomena. Aritmetička sredina ima smisla samo za numeričke podatke.


Primjer 40. Izračunajte aritmetičku sredinu brojeva 1,4,2,3,7,8,5.
Rješenje. x̄ := 17 (1 + 4 + 2 + 3 + 7 + 8 + 5) = 30
7
= 4.29

41
Primjer 41. Izračunajte aritmetičku sredinu brojeva 3, 3, 3, 3 i 1, 7, 1.
Rješenje. x̄1 := 41 (3 + 3 + 3 + 3) = 3, x̄2 := 13 (1 + 7 + 1) = 3.
Uočimo da ova dva niza imaju istu aritmetičku sredinu, no takoder je vidljivo
da su članovi prvog niza skoncentrirani u jednoj točki, dok su članovi drugog
niza raspršeni u odnosu na srednju vrijednost. Zaključujemo da na srednju
vrijednost utječu ekstremne vrijednosti.
Primjer 42. U jednom privatnom poduzeću zaposleno je 7 zaposlenika. Nji-
hove plaće iznose redom: 2200kn, 2750kn, 3560kn, 2100kn, 10300kn, 3010kn,
2050kn. Izračunajte prosječnu plaću u tom poduzeću.
Rješenje.
2200 + 2750 + 3560 + 2100 + 10300 + 3010 + 2050 25970
x̄ := = = 3710kn
7 7
Uočavamo da samo zaposlenik s najvećom plaćom ima plaću veću od
prosjeka, dok svi ostali imaju plaće manje od prosjeka.
Svojstva aritmetičke sredine:

1. Σni=1 (xi − x̄) = 0 suma svih odstupanja od x̄ jednaka je nuli

2. Σni=1 (xi − c)2 ≤ Σni=1 (xi − x̄)2 , c ∈ R zbroj kvadrata odstupanja od x̄


je najmanji

Osim aritmetičke sredine definiraju se i drugi parametri koji odredu mjeru


položaja.

3.2.2 Medijan uzorka


Medijan u oznaci m polazi od statističkog niza poredanog po veličini, x(1) ≤
x(2) ≤ . . . ≤ x(n) i definiran je na sljedeći način:
Ako je broj podataka neparan, tj. n = 2k − 1, k ∈ N, onda je m = x(k) .
Za paran broj podataka, tj. n = 2k k ∈ N, vrijedi
x(k) + x(k+1)
m= .
2
Napomena. Medijan ima smisla samo za numeričke podatke.
Primjer 43. Nadite medijan te aritmetičku sredinu niza

(a) 84, 91, 72, 68, 87, 78

(b) 3, 4, 4, 5, 6, 8, 8, 8, 10

42
(c) 5, 5, 7, 9, 11, 12, 15, 180

Rješenje. (a) Sortiramo podatke po veličini:

68 ≤ 72 ≤ 78 ≤ 84 ≤ 87 ≤ 91
n=6=2·3
x(3) + x(4) 78 + 84
m= = = 81
2 2
68 + 72 + 78 + 84 + 87 + 91 480
aritmetička sredina: x̄ = = = 80
6 6
(b) niz je sortiran po veličini i ima 9 članova

n=9=2·5−1
m = x5 = 6
3 + 4 + 4 + 5 + 6 + 8 + 8 + 8 + 10 56
aritmetička sredina: x̄ = = = 6.22
9 9
(c) niz je sortiran po veličini i ima 8 članova

n=8=2·4
x4 + x5 9 + 11
m= = = 10
2 2
5 + 5 + 7 + 9 + 11 + 12 + 15 + 180
aritmetička sredina: x̄ = = 30.5
8
Primijetimo da na medijan utječu samo središnji elementi iz statističkog niza
za razliku od x̄ na kojeg utječu svi podaci. Lijevo i desno od medijana
nalazi se isti broj podataka, odnosno medijan dijeli niz podataka na dva
jednakobrojna dijela.
Medijan uzorka je broj za koji vrijedi da je 50% svih podataka manje od
ili jednako njemu i 50% svih podataka veće od ili jednako njemu.

3.2.3 Mod
Mod je ona vrijednost statističkog obilježja koja se u uzorku javlja s na-
jvećom frekvencijom.

UNIMODALNI UZORAK: uzorak u kojem postoji samo jedan mod

BIMODALNI UZORAK: uzorak u kojem postoje 2 vrijednosti s na-


jvećom frekvencijom

43
Ako svi podaci imaju istu frekvenciju pojavljivanja u uzorku, onda
uzorak nema mod.

Mod je koristan kod statističkih obilježja koja nisu numerička, pa nemaju


aritmetičku sredinu i medijan.
Primjer 44. Odredite mod sljedećih nizova

(a) 2, 2, 5, 7, 9, 9, 9, 10, 10, 12, 19

(b) 3, 5, 8, 10, 12, 15, 16

(c) 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9

Rješenje. (a) mod = 9.

(b) Nema moda.

(c) mod = 4 i mod = 7 (bimodalni uzorak).


Primjer 45. Promatranjem boje automobila koji su prošli ulicom u odredenom
vremenskom razdoblju dobiven je sljedeći niz boja:
plava, crvena, plava, zelena, žuta, crvena, bijela, crna, crvena, bijela, crvena,
siva, crvena, zelena, crna, crvena, plava, crna.
Odredite mod tog niza.
Rješenje. Vidimo da se u nizu crvena boja pojavljuje 6 puta, plava 3 puta,
crna 3 puta zelena 2 puta, bijela 2 puta, žuta 1 put i siva 1 put. Prema tome,
mod danog niza boja je crvena.

Zadaci
1. Nadite aritmetičku sredinu, medijan i mod niza brojeva:

(a) 7, 4, 10, 9, 15, 12, 7, 9, 7


(b) 8, 11, 4, 3, 2, 5, 10, 6, 4, 1, 10, 8, 12, 6, 5, 7
Rješenje. (a) Sortirajmo podatke po veličini:

4 ≤ 7 ≤ 7 ≤ 7 ≤ 9 ≤ 9 ≤ 10 ≤ 12 ≤ 15

n = 9, m = x(5) = 9.
mod = 7
4 + 7 · 3 + 2 · 9 + 10 + 12 + 15 80
x̄ = = = 8.9
9 9
44
(b) Sortirajmo podatke po veličini:

1 ≤ 2 ≤ 3 ≤ 4 ≤ 4 ≤ 5 ≤ 5 ≤ 6 ≤ 6 ≤ 7 ≤ 8 ≤ 8 ≤ 10 ≤ 10 ≤ 11 ≤ 12

x(8) + x(9) 6+6


n = 16, m= = = 6.
2 2
Ovaj niz nema mod.

1 + 2 + 3 + 2 · 4 + 2 · 5 + 2 · 6 + 7 + 2 · 8 + 2 · 10 + 11 + 12
x̄ =
16
= 6.375.

2. Odredite srednju vrijednost mase (u kg) za 100 zaposlenika osigu-


ravajuće kuće za podatke iz tablice:

masa (kg) frekvencija


60 − 62 5
63 − 65 18
66 − 68 42
69 − 71 27
72 − 74 8

Rješenje. Izračunajmo sredine razreda te fi x̄i i nadopunimo tablicu:

masa (kg) frekvencija - fi x̄i (kg) fi x̄i (kg)


60 − 62 5 61 305
63 − 65 18 64 1152
66 − 68 42 67 2814
69 − 71 27 70 1890
72 − 74 8 73 584
Σ 100 Σfi x̄i = 6745

Aritmetička sredina:

Σni=1 fi x̄i 6745


x̄ = = = 67.45 kg
n 100

45
3.3 Mjere raspršenosti (disperzije)
Uzoračka varijanca i uzoračka standardna
devijacija
Uzorci s istim srednjim vrijednostima mogu biti posve različiti, stoga nas
zanima i Praspršenost podataka.
Kako je ni=1 (xi − x̄) = 0 kao mjeru raspršenosti ne možemo uzeti mjeru
odstupanja od srednjeP vrijednosti. Možemo promatrati i prosječno apso-
lutno odsutpanje n1 ni=1 |xi − x̄|. To nam daje mjeru odstupanja, ali otežava
računanje zbog apsolutne vrijednosti. P Takoder možemo zbrojiti kvadrate
odstupanja, to jest promatrati s = n−1 ni=1 (xi − x̄)2 .
2 1

Uzoračka varijanca:
n
2 1 X
s = (xi − x̄)2
n − 1 i=1

Uzoračka standardna devijacija:



s = + s2

Vrijedi:
n n
2 1 X 1 X 2
s = (xi − x̄)2 = (x − 2xi x̄ + x̄2 )
n − 1 i=1 n − 1 i=1 i
n n n
! n
!
1 X X X 1 X
= x2 − 2x̄ xi + x̄2 = x2i − 2nx̄2 + nx̄2
n − 1 i=1 i i=1 i=1
n − 1 i=1
n
!
1 X
= x2 − nx̄2
n − 1 i=1 i

Time smo dobili puno praktičniju formulu za računanje uzoračke varijance,


tj. !
n
1 X
s2 = x2 − nx̄2 .
n − 1 i=1 i
Ako se u uzroku x1 , x2 , . . . , xn vrijednosti a1 , a2 , . . . , ak pojavljuju s frekven-
cijama f1 , f2 , . . . , fk , onda vrijedi:
k k
!
1 X 1 X
s2 = fi · (ai − x̄)2 = fi · a2i − nx̄2
n − 1 i=1 n − 1 i=1

46
Koeficijent varijacije:
s
v= (obično se iskazuje u postotcima)

Standardna pogreška:
s
sx̄ = √
n
Primjer 46. Mjerenjem mase 20 čokolada dobiveni su ovi rezultati u gramima
97 99 98 96 98 101 98 95 97 99
98 96 97 98 98 100 99 97 101 98
Odredite prosječnu masu čokolade, varijancu, standardnu devijaciju, stan-
dardnu pogrešku i koeficijent varijacije.
Rješenje. Napišimo najprije tablicu frekvencija:
xi fi xi − x̄
95 1 -3
96 2 -2
97 4 -1
98 7 0
99 3 1
100 1 2
101 2 3
Σ 20
Prosječna masa:
95 + 2 · 96 + 4 · 97 + 7 · 98 + 3 · 99 + 100 + 2 · 101 1960
x̄ = = = 98 g
20 20
Varijanca:
7
1 X
s2 = fi (xi − x̄)2
n − 1 i=1
1
= (1 · 9 + 2 · 4 + 4 · 1 + 7 · 0 + 3 · 1 + 1 · 4 + 2 · 9)
19
46
= = 2.421 g2
19

Standardna devijacija: s = s2 = 1.56 g.
Koeficijent varijacije:
1.56 g
v= = 0.016 = 1.6%.
98 g

47
Standardna pogreška:
s 1.56
sx̄ = √ = √ = 0.35 g.
n 20
Primjer 47. Odredite srednju vrijednost mase (u kg) za 100 zaposlenika os-
iguravajuće kuće za podatke iz tablice:

masa (kg) frekvencija


60 − 62 5
63 − 65 18
66 − 68 42
69 − 71 27
72 − 74 8
Odredite standardnu devijaciju, standardnu pogrešku i koeficijent varijacije.
Rješenje. Aritmetičku sredinu, odnosno srednju vrijednost mase smo već
izračunali:
Σn fi x̄i 6745
x̄ = i=1 = = 67.45 kg
n 100
masa (kg) frekvencija x̄i (kg) fi x̄2i (kg)
60 − 62 5 61 18605
63 − 65 18 64 73728
66 − 68 42 67 188538
69 − 71 27 70 132300
72 − 74 8 73 42632
Σ 100 Σfi x̄2i = 455803
Varijanca:
5
!
1 X 455803 − 100 · 67.452
s2 = fi x̄2i − nx̄2 =
n−1 i=1
99
2
= 8.61 kg

Standardna devijacija: s = s2 = 2.93 kg.
Koeficijent varijacije:
2.93 kg
v= = 0.04 = 4%.
67.45 kg
Standardna pogreška:
s 2.93
sx̄ = √ = √ = 0.29kg.
n 100

48
3.4 Zadaci za vježbu
1. Prikupljeni su podaci o broju golova koje je hokejaški tim postigao
igrajući kod kuće tijekom sezone 2006. − 2007.

4 5 2 4 6 5 3 7 1 2 10 5 8 4 3 5 9 3 5 4
8 6 4 8 7 6 5 6 4 4 6 5 3 5 4 3 4 5 5 1

(a) Nacrtajte stupčasti dijagram za ove podatke


(b) Izračunajte aritmetičku sredinu, varijancu, standardnu devijaciju,
standardnu pogrešku i koeficijent varijacije.

2. Skup statističkih podataka prikazan je tablicom:

razredi frekvencija
1−5 10
6−9 20
10 − 13 50
14 − 17 12
18 − 21 8

(a) Odredite aritmetičku sredinu za dane podatke, varijancu, stan-


dardnu devijaciju, standardnu pogrešku i koeficijent varijacije
(b) Nacrtajte stupčasti dijagram.

3. Ispitivanjem kapaciteta 12 slučajno odabranih memorijskih kartica kon-


trolor je dobio rezultate:

kapacitet (GB) 3.8 3.9 4.0 4.1 4.2


broj kartica 1 4 4 2 1

Odredite aritmetičku sredinu za dane podatke, varijancu, standardnu


devijaciju, standardnu pogrešku i koeficijent varijacije.

4. Dani su sljedeći podaci:

25, 51, 32, 40, 33, 35, 25, 48, 23, 21, 25, 36, 28, 36, 27, 32, 41, 31.

a) Izračunajte srednju vrijednost, mod i medijan za dane podatke.

b) Izračunajte varijancu i standardnu devijaciju, standardnu pogrešku i


koeficijent varijacije za dane podatke.

49
5. Anketirano je 80 radnika o udaljenosti koju prelaze na putu do posla.
Rezultati su dani u sljedećoj tablici:

udaljenost (u km) [0, 10i [10, 20i [20, 30i [30, 40i [40, 50i
broj radnika 38 23 5 6 8

a) Izračunajte prosječnu udaljenost, standardnu devijaciju te vari-


jancu.
b) Nacrtajte histogram.

50
Poglavlje 4

Statistički podaci o
dvodimenzionalnom obilježju

4.1 Uvod

Istovremeno promatramo dva statistička obilježja. Označimo ih sa X i Y .


Ponavljanjem mjerenja, odnosno opažanja, dotične pojave, dobiva se niz
uredenih parova (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ).

Parametri statističkih nizova X i Y :


n
1X
x= xi aritmetička sredina (srednja vrijednost) od X
n i=1
n
1X
y= yi aritmetička sredina (srednja vrijednost) od Y
n i=1
Varijance statističkih nizova X i Y :
n n
!
1 X 1 X
s2x = (xi − x)2 = x2i − nx2
n − 1 i=1 n−1 i=1

n n
!
1 X 1 X
s2y = (yi − y)2 = yi2 − ny 2 .
n − 1 i=1 n−1 i=1
Ukupno odstupanje od srednje vrijednosti:
n n
!
1 X 1 X
sxy = (xi − x)(yi − y) = xi yi − nx · y .
n − 1 i=1 n−1 i=1

51
Primjer 48. U jednom razredu od 30 učenika promatra se ocjena iz matem-
atike X i ocjena iz fizike Y , kao dvodimenzionalno statističko obilježje (X, Y ).
Uvidom u imenik dobiveni su sljedeći rezultati:
(1, 3), (4, 3), (2, 2), (3, 2), (1, 2), (1, 1), (2, 2), (4, 4), (2, 2), (3, 3)
(4, 4), (5, 5), (3, 5), (2, 1), (2, 3), (2, 2), (5, 5), (3, 3), (2, 2), (2, 2)
(3, 3), (3, 2), (4, 4), (2, 2), (3, 3), (2, 1), (3, 2), (3, 2), (3, 2), (2, 2).

Rješenje. Vidi se da prvi učenik ima x1 = 1 iz matematike i y1 = 3 iz fizike,


drugi učenik ima x2 = 4 iz matematike i y2 = 3 iz fizike, itd.
Iz danog niza statističkih podataka (uredenih parova) vidljivo je da se
odredeni uredeni parovi pojavljuju u tom nizu i više puta.
Uredenom paru (2, 2) pripada frekvencija 8 (pojavljuje se 8 puta), odnosno
8
relativna frekvencija 30 ≈ 0.27.
Da bi dobili jasniji i pregledniji uvid u dani niz statističkih podataka napravit
ćemo tablicu frekvencija i tablicu relativnih frekvencija za dane podatke.

Tablica frekvencija
P
X/Y 1 2 3 4 5
1 1 1 1 − − 3
2 2 8 1 − − 11
3 − 5 4 − 1 10
4 − − 1 3 − 4
5
P − − − − 2 2
3 14 7 3 3 30

Tablica relativnih frekvencija


P
X/Y 1 2 3 4 5
1 1 1 1
1 30 30 30
− − 10
1 4 1 11
2 15 15 30
− − 30
1 2 1 1
3 − 6 15 − 30 3
1 1 2
4 − − 30 10 − 15
1 1
5 − − − − 15 15
1 7 7 1 1
P
10 15 30 10 10
1

Ako je općenito riječ o dva diskretna statistička obilježja X i Y , pri


čemu obilježje X poprima vrijednosti iz diskretnog skupa A, a obilježje Y iz
diskretnog skupa B, onda se prilikom simulatnog promatranja tih obilježja
kao rezultat dobivaju elementi skupa A × B.
To znači da se za svaki ureden par (a, b) ∈ A × B može govoriti o njegovoj

52
frekvenciji f (a, b) u nizu statističkih podataka.
Za svaki niz statističkih podataka možemo formirati pripadnu tablicu
frekvencija koja se obično naziva kontigencijska tablica.
P
X/Y b1 b2 ... bk ... bs
a1 f11 f12 ... f1k ... f1s f1
a2 f21 f22 ... f2k ... f2s f2
.. .. .. .. .. ..
. . . . . .
aj fj1 fj2 ... fjk ... fjs fj
.. .. .. .. .. ..
. . . . . .
ar
P fr1 fr2 ... frk ... frs fr
g1 g2 ... gk ... gs n

Neka je A = {a1 , a2 , . . . , ar }, B = {b1 , b2 , . . . , bs }. Tada vrijedi:


s
X r
X
fi = fij , gj = fij
j=1 i=1
r s
1 X 1X
x= f i ai , y= g j bj
n i=1
n j=1
r r
!
1 X 1 X
s2x = fi (ai − x)2 = fi a2i − nx2
n − 1 i=1 n−1 i=1
s s
!
1 X 1 X
s2y = gj (bj − y)2 = gj b2j − ny 2 .
n−1 j=1
n−1 j=1

Uvodimo još i ukupno odstupanje od srednje vrijednosti u oznaci sxy


s r s X
r
!
1 XX 1 X
sxy = (ai − x)(bj − y)fij = fij ai bj − nx · y .
n − 1 j=1 i=1 n−1 j=1 i=1

Nastavak primjera. Možemo izračunati prosječnu ocjenu iz matematike i


prosječnu ocjenu iz fizike. Da bismo izračunali prosjek za matematiku pro-
matramo samo prvi i zadnji stupac kontigencijske tablice, dok za prosjek iz
fizike promatramo samo prvi i zadnji redak tablice pa dobijemo sljedecće
tablice frekvencija jednodimenzionalnog obilježja:

ai 1 2 3 4 5 bj 1 2 3 4 5
fi 3 11 10 4 2 gj 3 14 7 3 3

53
1 · 3 + 2 · 11 + 3 · 10 + 4 · 4 + 5 · 2
x= = 2.7
30
1 · 3 + 2 · 14 + 3 · 7 + 4 · 3 + 5 · 3
y= = 2.63
30
5
!
1 X
s2x = fi · a2i − n · x2 = 1.11
29 i=1
5
!
1 X
s2y = gj · bj − n · y 2 = 1.29
29 j=1
5 5
!
1 XX
sxy = fij ai bj − n · x · y = 0.9.
29 i=1 j=1

Svaki unutarnji redak ili stupac može se shvatiti tako kao da je njime
definirana odredena jednodimenzionalna razdioba frekvencija.
Ako izdvojimo treći redak iz prve tablice dobivamo razdiobu frekvencija

vrijednost obilježja Y 1 2 3 4 5
X=3
frekvencija 0 5 4 0 1

10 učenika ima 3 iz matematike, s time da od tih 10 iz fizike nitko nema 1,


ocjenu 2 ima 5 učenika, ocjenu 3 ima 4 učenika i ocjenu 5 ima 1 učenik.
Prosječna ocjena iz fizike za tih 10 učenika iznosi:
1
y(3) = 10
(0 · 1 + 5 · 2 + 4 · 3 + 0 · 4 + 1 · 5) = 2.7
Na sličan način dobijemo:
y(1) = 13 (1 · 1 + 2 · 1 + 3 · 1) = 2
21
y(2) = 11
= 1.91
y(4) = 3.75
y(5) = 5
No X i Y mogu zamijeniti uloge, tj. možemo računati prosječnu ocjenu iz
matematike za učenike koji iz fizike imaju 1, 2, 3, 4 ili 5.
x(1) = 13 (1 · 1 + 2 · 2) = 5
3
= 1.67
1 32
x(2) = 14
(1 · 1 + 8 · 2 + 3 · 5) = 14 = 2.29
1
x(3) = 7
(1 · 1 + 1 · 2 + 3 · 4 + 4 · 1) = 19
7
= 2.71
1
x(4) = 3
(3 · 4) = 4

54
x(5) = 13 (1 · 3 + 2 · 5+) = 13
3
= 4.33
Dobivene vrijednosti prikažemo grafički i dobijemo krivulje regresije.

5 y

x
0
0 1 2 3 4 5

Slika 4.1: Krivulje regresije

Puna linija pokazuje kako se mijenja prosječna ocjena iz fizike u zavis-


nosti o ocjeni iz matematike, dok isprekidana linija pokazuje kako se mijenja
prosječna ocjena iz matematike u zavisnosti o ocjeni iz fizike.

4.2 Linearna regresija


4.2.1 Pravci regresije, koeficijent korelacije
Prirodno se nameće ideja da se izlomljene linije iz krivulja regresije zamijene
pravcima.
Pretpostavimo da imamo uredeni par vrijednosti (x, y) izmjerenih na
svakom od n ispitanika u našem uzorku. Možemo nacrtati pripadajuće točke
svakog pojedinačnog para vrijednosti u dvodimenzionalnom točkastom dija-
gramu ili dijagramu raspršenja. Na horizontalnoj osi je x, a na vertikalnoj y
varijabla. Crtanjem točaka za tih n ispitanika, dobijemo njihov razmještaj
koji može sugerirati povezanost dvije varijable.
Na Slici 4.2 je dan dijagram raspršenja za 6 ispitanika, te pravac koji
najbolje aproksimira pripadajuće točke.
Nas zanima da li možemo dobiti prikaz kao y = f (x) ili x = g(y) (y =
Ax + B ili x = Cy + D).
Možemo problemu pristupiti ovako: ŷi = Axi + B te je ideja da ŷi − yi = εi
bude minimalan (želimo da greška bude najmanja moguća).

55
4
y

x
0
0 1 2 3 4

Slika 4.2: Dijagram raspršenja

Metoda najmanjih kvadrata:


n
X n
X
2
F (A, B) = (ŷi − yi ) = (Axi + B − yi )2 ,
i=1 i=1

nužni uvjeti su ∂F
∂A
∂F
= 0, ∂B = 0 (parcijalne derivacije).
Rješavanjem ovih jednadžbi dobijemo:
sxy sxy
A = 2 , B = y − 2 x.
sx sx
Jednadžba pravca, koja u smislu metode najmanjih kvadrata najbolje
aproksimira krivulju regresije y = y(aj ), glasi: y = Ax + B, odnosno
sxy sxy
y= 2
x + y − 2 x.
sx sx
Dakle, jednadžba pravca glasi
sxy
y − y = 2 (x − x) (pravac prolazi kroz točku(x, y)).
sx
Na analogan način možemo dobiti i parametre C i D. Pa je druga jednadžba
pravca
sxy
x − x = 2 (y − y).
sy
Ovi pravci nazivaju se pravci regresije. Oba pravca prolaze točkom (x, y).
Kut ϕ koji zatvaraju ti pravci računamo po formuli:
kp1 − kp2
tg ϕ = ,
1 + kp1 kp2

56
gdje je kp1 koeficijent smjera prvog pravca, a kp2 koeficijent smjera drugog
pravca.
Uvodimo oznaku:
sxy
r= , −1 ≤ r ≤ 1.
sx sy
r nazivamo koeficijent korelacije.
Sada kut koji zatvaraju pravci regresije možemo računati po formuli:
1 − r 2 sx sy
tg ϕ = .
r s2x + s2y
Ako je r2 = 1, tj. r = 1 ili r = −1, onda se pravci regresije poklapaju, što
znači da se statistički podaci (x1 , y1 ), (x2 , y2 ), . . . ,(xn , yn ) nalaze na jednom
pravcu. To znači da su podaci o obilježju y linearno zavisni o podacima o
obilježju x.
Ako je r = 0, onda je sxy = 0, pa bi pravci bili y = y i x = x, odnosno
okomiti. U tom slučaju kažemo da su podaci (xi , yi ) linearno nekorelirani.
Općenito,
ako je |r| < 0.5 kažemo da su podaci slabo korelirani
ako je |r| ≥ 0.5 kažemo da su podaci značajno korelirani.
Za r > 0 govorimo o pozitivnoj korelaciji, a za r < 0 o negativnoj
korelaciji.
Napomena 1. Ako je r = 0, onda nema linearne korelacije (povezanosti x i y),
no time nije utvrdeno da ne postoji nikakva statistička povezanost izmedu x i
y. Ta povezanost može biti eksponencijalna, logaritamska, u obliku potencija,
itd.
Primjer 49. Odredite i nacrtajte pravce regresije za ocjene iz matematike i
fizike. Izračunajte i koeficijent korelacije, te kut izmedu pravaca regresije.
Rješenje. Već smo izračunali sve potrebno: x = 2.7, y = 2.63, s2x = 1.11,
s2y = 1.29, sx = 1.05, sy = 1.14, sxy = 0.9.
Stoga su pravci regresije:
y − y = ssxy2 (x − x) x − x = ssxy2 (y − y)
x y
y − 2.63 = 0.81(x − 2.7) x − 2.7 = 0.70(y − 2.63)
y = 0.81x + 0.44 x = 0.70y + 0.86
Koeficijent korelacije:
0.9
r= = 0.75.
1.05 · 1.14
Dakle, podaci su pozitivno i značajno korelirani.
Kut koji zatvaraju ti pravci:
1 − 0.752 1.05 · 1.14
tg ϕ = · = 0.29.
0.75 1.11 + 1.29

57
Dakle, ϕ = 16o 100 2000 .
Na Slici 4.3 su prikazani odredeni pravci regresije.

5
y

x
1 2 3 4 5 6

Slika 4.3: Pravci regresije

Promatramo n parova podataka (xi , yi ), i = 1, 3, . . . , n. Želimo odrediti


vezu izmedu nezavisne varijable x (nju možemo kontrolirati) i zavisne vari-
jable y. Tada odredujemo pravac regresije y − y = ssxy2 (x − x).
x

1. Ispituje se utjecaj temperature na neki kemijski proces. Dobiveni su


sljedeći rezultati:
x (o C) 100 110 120 130 140 150 160 170 180 190
y (%) 45 51 54 61 66 70 74 78 85 89
Izračunajte koeficijent korelacije i odredite jednadžbu pravca regresije.
Rješenje. Računamo prosječnu temperaturu x te prosječnu iskoristivost
procesa y. Dobivamo: x = 145, y = 67.3. Zatim računamo varijance:
s2x = 916.7, s2y = 214.68, te standardne devijacije: sx = 30.28, sy =
14.65. Ukupno odstupanje od srednje vrijednosti
n
!
1 X
sxy = xi · yi − n · x · y = 442.78.
n − 1 i=1

sxy
Koeficijent korelacije: r = = 0.998, pa su podaci pozitivno i
sx sy
značajno korelirani.
Jednadžba pravca regresije glasi:
442.78
y − 67.3 = (x − 145).
916.7
58
Odnosno,
y = 0.48x − 2.74.
Na Slici 4.4 prikazan je odredeni pravac regresije.

Pravac regresije
100
Iskoristivost procesa

90
y = 0,483x - 2,739
80
70
60
50
40
90 110 130 150 170 190 210
temperatura

Slika 4.4: Pravac regresije

2. Istraživan je odnos izmedu ocjene (X) iz matematike u završnom


razredu srednje škole i ocjene (Y) na fakultetskom ispitu iz matem-
atike. Ispitano je 172 studenta i rezultati su prikazani ovom tablicom:
P
X/Y 1 2 3 4 5
2 3 2 − 1 − 6
3 6 28 10 − 1 45
4 2 1 10 48 10 71
5
P 1 − 7 12 30 50
12 31 27 61 41 172

a) Odredite koeficijent korelacije.

59
b) Odredite i nacrtajte pravce regresije, te kut izmedu pravaca regre-
sije.
c) Nacrtajte krivulje regresije.
Rješenje. Računamo prosječnu ocjenu iz matematike u završnom
razredu srednje škole i prosječnu ocjenu iz matematike na fakultetskom
ispitu iz matematike. Dobivamo: x = 3.96, y = 3.51.
Zatim računamo varijance, te ukupno odstupanje od srednje vrijed-
nosti. Dobivamo: s2x = 0.69, s2y = 1.53, sxy = 0.74.
sxy
Koeficijent korelacije: r = = 0.72, pa su podaci pozitivno i
sx sy
značajno korelirani.
Imamo,
1 − r 2 sx sy
tg ϕ = = 0.31.
r s2x + s2y
Dakle, kut izmedu pravaca regresije je ϕ = 17o 130 2400 .
Jednadžbe pravaca regresije:

y = 1.07x − 0.74

x = 0.48y + 2.26
Pravci regresije:

y
4 φ

x
1 2 3 4 5

-1

Slika 4.5: Pravci regresije

Da bi mogli nacrtati krivulje regresije najprije računamo prosječnu oc-


jenu na fakultetskom ispitu iz matematike za studente koji u završnom

60
razredu srednje škole iz matematike imaju 2, 3, 4 ili 5. Dobivamo:
y(2) = 1.83, y(3) = 2.16, y(4) = 3.89, y(5) = 4.4
Zatim računamo prosječnu ocjenu iz matematike u završnom razredu
srednje škole za studente koji na fakultetskom ispitu iz matematike
imaju 1, 2, 3, 4 ili 5.
x(1) = 3.08, x(2) = 2.97, x(3) = 3.89, x(4) = 4.16, x(5) = 4.71.

5 y

x
0
1 2 3 4 5

Slika 4.6: Krivulje regresije

4.3 Zadaci za vježbu


1. Dvije kocke bačene su 40 puta. Kocke se medusobno razlikuju i prvi
član (X) uredenog para odnosi se na prvu kocku, a drugi član (Y ) na
drugu kocku. Dobiveni su ovi rezultati:
(6, 1), (4, 4), (6, 2), (5, 6), (6, 3), (1, 1), (3, 3), (2, 2), (2, 2), (5, 1)
(1, 5), (3, 6), (4, 3), (6, 3), (4, 4), (1, 3), (2, 1), (3, 4), (4, 5), (1, 1)
(5, 4), (3, 4), (4, 5), (1, 2), (6, 1), (6, 3), (4, 3), (2, 5), (3, 2), (6, 3)
(2, 6), (4, 5), (2, 4), (5, 3), (2, 1), (3, 1), (4, 4), (2, 3), (3, 2), (3, 3)

a) Prikažite podatke u kontingencijskoj tablici


b) Odredite pravce regresije, te kut izmedu njih.
c) Izračunajte koeficijent korelacije.
d) Skicirajte u koordinatnom sustavu funkcije i pravce regresije.

61
2. Podaci o veličini poljoprivrednog zemljišta i godišnjem prihodu za 8
seoskih gospodarstava dani su u sljedećoj tablici:

površina (ha) 1 2 3 4 5 6 7 8
prihod (000 kn) 40 45 68 92 112 132 135 140

a) Ispitajte da li postoji linearna korelacija izmedu veličine poljoprivrednog


zemljišta i godišnjeg prihoda.

b) Na osnovi podataka danih u tablici procjenite i nacrtajte pravac regre-


sije.

3. Usporedeni su troškovi po jedinici proizvoda i ukupna godišnja dobit u


8 istovrsnih tvornica. Rezultati su dani tablicom:

Troškovi (kn) 4 4, 5 5 5, 5 6 6, 5 7 7, 5
Dobit (kn) 75, 3 66, 0 57, 1 52, 0 48, 5 45, 2 42, 5 38, 0

a) Izračunajte koeficijent korelacije. Komentirajte njegovu vrijednost.

b) Na osnovi podataka danih u tablici procjenite i nacrtajte pravac regre-


sije.

62
Poglavlje 5

Osnovne razdiobe

Slučajna varijabla je funkcija X koja elementarnim dogadajima pridružuje


realne brojeve. Dakle,
X : Ω → R.
Slučajne varijable dijelimo na:

1. Diskretne slučajne varijable

2. Neprekidne (kontinuirane) slučajne varijable

5.1 Diskretne slučajne varijable


Označimo s RX skup svih različitih vrijednosti koje slučajna varijabla X može
poprimiti. Kažemo da je zadan zakon razdiobe ili distribucija slučajne
varijable X ako je zadan skup RX = {a1 , a2 , a3 , . . .}, te niz brojeva pi ≥ 0
takav da vrijedi

1) pi = P (X = ai )

X
2) pi = 1
i=1

Zakon razdiobe zapisujemo u obliku tablice:


 
a1 a2 a3 . . .
X∼
p1 p2 p3 . . .

Budući da je skup svih vrijednosti koje slučajna varijabla X može poprim-


iti RX = {a1 , a2 , a3 , . . .} diskretan (konačan ili prebrojiv) skup, kažemo da
je X diskretna slučajna varijabla.

63
Neka je X : Ω → R slučajna varijabla. Funkcija vjerojatnosti od X je
funkcija f : RX → [0, 1] definirana s
f (ai ) := P (X = ai ) = pi
Funkcija distribucije slučajne varijable X je funkcija F : R → [0, 1]
definirana s
F (x) := P (X ≤ x), x ∈ R.
Vrijedi X
F (x) = f (ai ).
ai ≤x

Matematičko očekivanje diskretne slučajne varijable je broj E[X]


definiran s X
E[X] = ai · f (ai )
ai ∈RX

Broj
V[X] := E[X 2 ] − (E[X])2
zove se varijanca diskretne slučajne varijable X.
Standardna devijacija slučajne varijable X je broj
p
σX := + V[X]

1. Pokažite da je funkcija f dana tablicom funkcija vjerojatnosti neke


slučajne varijable X. Izračunajte E[X] i V [X].

xi 1 2 3 4 5
1 5 1 3 1
f (xi ) 12 24 6 8 6

Rješenje. Funkcija f je funkcija vjerojatnosti neke slučajne varijable


5
1 5
+ 16 + 38 + 16 = 1, funkcija
P
X ako je f (xi ) = 1. Kako je 12 + 24
i=1
f je funkcija vjerojatnosti. Izračunajmo sada očekivanje i varijancu
slučajne varijable X sa zakonom razdiobe:
 
1 2 3 4 5
X∼ 1 5 1 3 1 .
12 24 6 8 6

1 5 1 3 1 10
E[X] = 1 · +2· +3· +4· +5· = .
12 24 6 8 6 3
Zakon razdiobe slučajne varijable X 2 dan je s:
 
2 1 4 9 16 25
X ∼ 1 5 1 3 1 .
12 24 6 8 6

64
1 5 1 3 1 151
E[X 2 ] = 1 · +4· + 9 · + 16 · + 25 · = .
12 24 6 8 6 12
 2
2 2 151 10 53
V[X] = E[X ] − (E[X]) = − = .
12 3 36
2. Odredite konstantu a tako da funkcija f dana tablicom bude funkcija
vjerojatnosti slučajne varijable X. Izračunajte E[X] i V [X].

xi −1 0 1 2 3
a a a a a
f (xi ) 2 10 5 4 20

Rješenje. Funkcija f je funkcija vjerojatnosti slučajne varijable X ako


5
P
je f (xi ) = 1. Dakle, da bi f bila funkcija vjerojatnosti mora vrijediti
i=1

a a a a a
+ + + + = 1,
2 10 5 4 20
10
to jest a = 11
.
Izračunajmo sada očekivanje i varijancu slučajne varijable X sa za-
konom razdiobe:
 
−1 0 1 2 3
X∼ 5 1 2 5 1 .
11 11 11 22 22

5 1 2 5 1 7
E[X] = −1 · +0· +1· +2· +3· = .
11 11 11 22 22 22
Zakon razdiobe slučajne varijable X 2 dan je s:
 
2 0 1 4 9
X ∼ 1 7 5 1 .
11 11 22 22

1 7 5 1 43
E[X 2 ] = 0 · +1· +4· +9· = .
11 11 22 22 22
 2
43 7 897
V[X] = E[X 2 ] − (E[X])2 = − = .
22 22 484
3. Za slučajnu varijablu X sa zakonom razdiobe
 
1 2 3 4
X∼ 1 1 1 1
4 4 4 4

napišite funkciju distribucije.

65
Rješenje. Za funkciju distribucije vrijedi
X
F (x) = P (X ≤ x) = f (ai ), x ∈ R.
ai ≤x

Dakle, 
0,


x<1
1
4, 1≤x<2



F (x) = 21 , 2≤x<3
 3
, 3≤x<4




 4
1, x ≥ 4.

4. Za slučajnu varijablu X sa zakonom razdiobe


 
−2 −1 0 1 2
X∼ 1 1 3 1 1
5 10 10 5 5

napišite funkciju distribucije.


Rješenje. Za funkciju distribucije vrijedi
X
F (x) = P (X ≤ x) = f (ai ), x ∈ R.
ai ≤x

Dakle, 

0, x < −2
1

, −2 ≤ x < −1



 5
 3 , −1 ≤ x < 0

F (x) = 10
3


 5
, 0≤x<1
4
, 1≤x<2


5



1, x ≥ 2.

5.1.1 Binomna razdioba


Osnovna svojstva koja opisuju binomnu razdiobu (distribuciju):
1. Izvodimo pokus koji ima dva moguća ishoda. Jedan ishod ćemo zvati
”uspjeh”, a drugi ”neuspjeh”.

2. Vjerojatnost ”uspjeha” jednaka je p. Vjerojatnost ”neuspjeha” je tada


q = 1 − p.

3. Pokus ponavljamo n puta. Pokusi su medusobno nezavisni.

66
4. Binomna slučajna varijabla broji broj ”uspjeha” k u tih n pokusa.
Slučajna varijabla X ima binomnu razdiobu ili distribuciju s parametrima
n i p ako X poprima vrijednosti iz skupa {0, 1, 2, . . . , n} s vjerojatnostima
 
n k n−k
P (X = k) = p · q , 0 ≤ k ≤ n,
k
gdje je q = 1 − p. Slučajnu varijablu X koja ima binomnu razdiobu
označavamo s:
X ∼ B(n, p).
Očekivanje binomne razdiobe je E [X] = np.
Varijanca binomne razdiobe je V [X] = npq.

1. Ispravnu kocku bacamo 10 puta. Izračunajte vjerojatnost da se

(a) pet puta pojavi broj 6,


(b) barem jednom pojavi broj 6,
(c) sedam puta pojavi neparan broj.
(d) Koji je očekivani broj pojavljivanja broja većeg od 4?
Rješenje. Kocku bacamo 10 puta pa je n = 10.

(a) Vjerojatnost da se pojavi broj 6 jednaka je 16 , to jest, p = 16 . Pa


je vjerojatnost “neuspjeha”, tj. vjerojatnost da se ne pojavi broj
6 je q = 1 − p = 56 . Neka slučajna varijabla X označava broj po-
javljivanja broja 6, tada X ima binomnu razdiobu X ∼ B(10, 16 ).
Stoga je vjerojatnost da se pet puta pojavi broj 6 jednaka
   5  5
10 1 5
P (X = 5) = · = 0.013.
5 6 6

(b) Neka kao u (a) dijelu zadatka slučajna varijabla X označava broj
pojavljivanja broja 6. Tada X ima binomnu razdiobu X ∼
B(10, 61 ). Dogadaj da se barem jednom pojavi broj 6 uključuje
dogadaje da se broj 6 pojavi jednom, dvaput, . . . , deset puta.
Umjesto da računamo P (X ≥ 1) kao P (X = 1) + P (X =
2) + · · · + P (X = 10) jednostavnije je izračunati vjerojatnost
suprotnog dogadaja. Tada je
   0  10
10 1 5
P (X ≥ 1) = 1 − P (X = 0) = 1 − · = 0.838.
0 6 6

67
(c) Neka slučajna varijabla X označava broj pojavljivanja neparnog
broja. Vjerojatnost da se pojavi neparan broj jednaka je 12 , pa
je p = 21 . Odnosno, q = 1 − p = 12 . Dakle, X ima binomnu
razdiobu X ∼ B(10, 12 ). Stoga je vjerojatnost da se sedam puta
pojavi neparan broj jednaka
   7  3
10 1 1
P (X = 7) = · = 0.117.
7 2 2

(d) Neka slučajna varijabla X označava broj pojavljivanja broja većeg


od 4, tj. broja 5 ili 6. Vjerojatnost da se pojavi broj 5 ili 6 jednaka
je 13 , pa je p = 13 . Dakle, X ima binomnu razdiobu X ∼ B(10, 13 ).
Stoga je očekivani broj pojavljivanja broja većeg od 4 jednak
1
E[X] = n · p = 10 · = 3.33.
3

2. U skladištu je 1000 proizvoda medu kojima je 50 neispravnih. Izvlačimo


na sreću 5 proizvoda s vraćanjem. Izračunajte vjerojatnost da je od
tih 5 proizvoda

(a) točno 1 neispravan,


(b) najviše 1 neispravan
(c) barem 1 neispravan.
Rješenje. Neka slučajna varijabla X označava broj neispravnih proizvoda.
RX = {0, 1, 2, 3, 4, 5}. Vjerojatnost da je proizvod neispravan je
50
p = 1000 = 0.05. Pa je q = 1 − p = 0.95.

(a)  
5
P (X = 1) = 0.05 · 0.954 = 0.204.
1
(b)
 
5
P (X ≤ 1) = P (X = 0)+P (X = 1) = 0.050 ·0.955 +0.204 = 0.977.
0

(c)
 
5
P (X ≥ 1) = 1 − P (X = 0) = 1 − 0.050 · 0.955 = 0.226.
0

68
5.1.2 Hipergeometrijska razdioba
Osnovna svojstva koja opisuju hipergeometrijsku razdiobu:

1. U skupu od N elemenata njih M ima neko svojstvo, dok preostalih


N − M nema to svojstvo

2. Pokus se sastoji od slučajnog izvlačenja, bez vraćanja, n elemenata iz


skupa od N elemenata

3. Hipergeometrijska slučajna varijabla broji broj ”uspjeha” (odnosno el-


emenata koji imaju neko svojstvo) k u izvlačenju ukupno n elemenata.

Slučajna varijabla X ima hipergeometrijsku razdiobu ili distribuciju u


oznaci X ∼ Hg(M, N, n) ako je funkcija vjerojatnosti te slučajne varijable
zadana s:
M N −M
 
k n−k
P (X = k) = N
 , max{0, n − (N − M )} ≤ k ≤ min{M, n}.
n

nM
Očekivanje hipergeometrijske razdiobe je E [X] = .
N
Napomena. Za dovoljno velike n vrijedi Hg(M, N, n) ≈ B(n, p).

1. Riješite prethodni zadatak uz uvjet da se proizvodi ne vraćaju.


Rješenje. Neka slučajna varijabla X označava broj neispravnih proizvoda.
U skladištu je 1000 proizvoda, pa je N = 1000. Od toga je 50 neis-
pravnih, pa je M = 50. Promatramo uzorak od n = 5 proizvoda
izvučenih iz skladišta. Dakle, X ∼ Hg(50, 1000, 5).

(a)
50 950
 
1 4
P (X = 1) = 1000
 = 0.204.
5

(b)
50 950
 
0 5
P (X ≤ 1) = P (X = 0) + P (X = 1) = 1000
 + 0.204 = 0.977.
5

(c)
50 950
 
0 5
P (X ≥ 1) = 1 − P (X = 0) = 1 − 1000
 = 0.226.
5

69
2. Odredite očekivani broj dječaka u obitelji s 8 djece pod pretpostavkom
da je spol djeteta jednakovjerojatan. Kolika je vjerojatnost da će se
ostvariti očekivani broj dječaka?
Rješenje. Neka slučajna varijabla X označava broj dječaka. Budući
da je spol djeteta jednakovjerojatan imamo da je p = 12 . Dakle, X ∼
B(8, 12 ). Stoga je očekivani broj dječaka u obitelji jednak

1
E[X] = n · p = 8 · = 4.
2

Vjerojatnost da će se dogoditi očekivani broj dječaka jednaka je


   4  4
8 1 1
P (X = 4) = = 0.27.
4 2 2

3. Vjerojatnost da je proizvod proizveden u tvornici neispravan je 0.02.


Pošiljka od 10000 proizvoda poslana je u prodaju. Nadite očekivanje i
standardnu devijaciju broja neispravnih proizvoda.
Rješenje. Neka slučajna varijabla X označava broj neispravnih proizvoda.
Tada je X ∼ B(10000, 0.02). Dakle, očekivani broj neispravnih
proizvoda je
E[X] = n · p = 10000 · 0.02 = 200.

Kako je q = 1 − p = 1 − 0.02 = 0.98, dobivamo da je standardna


devijacija broja neispravnih proizvoda jednaka
p √ √
σ = + V [X] = npq = 10000 · 0.02 · 0.98 = 14.

4. Vjerojatnost da strijelac pogodi cilj je 0.25. Ako strijelac 7 puta gada


cilj, izračunajte vjerojatnost da pogodi cilj barem dvaput.
Rješenje. Neka slučajna varijabla X označava broj pogodaka cilja.
Tada je X ∼ B(7, 0.25), te q = 1 − p = 0.75. Vjerojatnost da stri-
jelac pogodi cilj barem dvaput jednaka je

P (X ≥ 2) = 1 − P (X = 0) − P (X = 1)
   
7 0 7 7
=1− 0.25 · 0.75 − 0.25 · 0.756 = 0.55.
0 1

70
5.1.3 Poissonova razdioba
Slučajna varijabla X ima Poissonovu razdiobu ili distribuciju s parametrom
λ > 0 ako je funkcija vjerojatnosti te slučajne varijable zadana formulom:
λk −λ
P (X = k) = e , k = 0, 1, 2, 3, . . .
k!
Slučajnu varijablu X koja ima Poissonovu razdiobu označavamo s:
X ∼ P(λ).

Očekivanje Poissonove razdiobe je E [X] = λ.


Varijanca Poissonove razdiobe je V [X] = λ.
Binomna razdioba B(n, p) može se aproksimirati Poissonovom razdiobom
P(np), to jest λ = np. Aproksimacija je to bolja što je parametar n veći, a
parametar p manji.
1. Vjerojatnost da je proizvod neispravan iznosi 1%. Iz skladišta uzimamo
paket od 100 proizvoda. Kolika je vjerojatnost da od tih 100 proizvoda
(a) je 5 neispravnih, (b) broj neispravnih nije veći od 10?
Rješenje. Neka slučajna varijabla X označava broj neispravnih proizvoda.
Tada je X ∼ B(100, 0.01). Kako je parametar n velik, a p mali, možemo
X aproksimirati Poissonovom razdiobom P(1) (np = 1).
(a)
15 −1
P (X = 5) ≈ · e = 0.0031.
5!
(b)
10
1k
 
X
−1 −1 1 1 1 1
P (X ≤ 10) ≈ ·e =e + + + ··· + = 0.99.
k=0
k! 0! 1! 2! 10!

2. Ako je vjerojatnost da je jedna osoba alergična na pelud 0.002, odredite


vjerojatnost da su od 4000 osoba na pelud
(a) alergične 4 osobe (b) alergično više od dvije osobe.
Rješenje. Neka slučajna varijabla X označava broj alergičnih osoba.
Tada je X ∼ B(4000, 0.002). Kako je parametar n velik, a p mali,
možemo X aproksimirati Poissonovom razdiobom P(8) (np = 8).
(a)
84 −8
P (X = 4) ≈ · e = 0.057.
4!

71
(b)

P (X > 2) = 1 − P (X = 0) − P (X = 1) − P (X = 2)
80 −8 81 −8 82 −8
=1− ·e − ·e − ·e
0! 1! 2!
= 1 − e−8 (1 + 8 + 32) = 0.9862.

3. Pretpostavimo da je 2% proizvoda neke tvornice neispravno. Nadite


vjerojatnost da u uzorku od 100 proizvoda postoje 3 neispravna.
Rješenje. Neka slučajna varijabla X označava broj neispravnih proizvoda.
Tada je X ∼ B(100, 0.02). Kako je parametar n velik, a p mali, možemo
X aproksimirati Poissonovom razdiobom P(2) (np = 2). Vjerojatnost
da postoje tri neispravna proizvoda jednaka je

23 −2
P (X = 3) ≈ · e = 0.1804.
3!

5.2 Neprekidne slučajne varijable


Za slučajnu varijablu X kažemo da je neprekidna ako vrijedi sljedeće:

(i) RX je interval ili unija intervala u R

(ii) postoji nenegativna funkcija f : R → R tako da za svaka dva broja


a, b (a < b) vrijedi
Z b
P (a ≤ X ≤ b) = f (t)dt.
a

Funkciju f zovemo funkcija gustoće vjerojatnosti slučajne varijable X.


Dakle, vjerojatnost da vrijednost slučajne varijable X upadne u interval [a, b]
jednaka je površini ispod grafa funkcije gustoće vjerojatnosti na tom inter-
valu.
Funkcija distribucije F slučajne varijable X definirana je s:
Z x
F (x) := P (X ≤ x) = f (t)dt.
−∞

Vrijedi:
P (a ≤ X ≤ b) = F (b) − F (a).
Svojstva neprekidne slučajne varijable:

72
(1) Za svaki broj a ∈ R je P (X = a) = 0. Stoga vrijedi

P (a ≤ X ≤ b) = P (a < X ≤ b) = P (a ≤ X < b) = P (a < X < b).

(2)
Z ∞
f (t)dt = P (−∞ < X < ∞) = 1
−∞

što znači da je ukupna površina ispod grafa funkcije gustoće jednaka 1.

Matematičko očekivanje od X definirano je s:


Z ∞
E[X] = t · f (t)dt,
−∞

a za varijancu vrijedi relacija kao i kod diskretnih slučajnih varijabli

V [X] = E[X 2 ] − (E[X])2

gdje je sada Z ∞
2
E[X ] = t2 · f (t)dt.
−∞

1. Dokažite da je funkcija

(a)
(
2 4
9
x − 9
za x ∈ [2, 5]
f (x) =
0 za x ∈
/ [2, 5]

(b)

2
x
 za x ∈ [0, 1]
2
f (x) = za x ∈ [1, 2]
3
0 za x ∈
/ [0, 2]

(c)
(
cos x za x ∈ [0, π2 ]
f (x) =
0 / [0, π2 ]
za x ∈

funkcija gustoće vjerojatnosti neke slučajne varijable X. Nacrtajte graf


funkcije f . Napišite funkciju distribucije F , te izračunajte E[X].

73
Rješenje. (a) Funkcija Rf je funkcija gustoće vjerojatnosti neke slučajne

varijable X ako je −∞ f (x)dx = 1. Kako je
Z ∞ Z 2  Z ∞
Z 5 
2 4
f (x)dx = 0 dx + x− dx + 0 dx
−∞ −∞ 2 9 9 5
2 x2 4
   
5 25 20 4 8
= · − x 2 = − − − = 1,
9 2 9 9 9 9 9

funkcija f je funkcija gustoće vjerojatnosti. Graf funkcije f dan


je na Slici 5.1.
0.7

0.6

0.5

0.4

0.3

0.2

0.1

2 4 6 8

Slika 5.1:

Za funkciju distribucije vrijedi


Z x
F (x) := P (X ≤ x) = f (t)dt.
−∞

Dakle, za x ≤ 2 imamo
Z x Z x
F (x) = f (t)dt = 0dt = 0
−∞ −∞

za 2 ≤ x ≤ 5 imamo
Z x 2 x
2 t2 4
Z Z    
2 4
F (x) = f (t)dt = 0dt + t− dt = − |x2
−∞ −∞ 2 9 9 92 9
1
= (x2 − 4x + 4)
9
za x ≥ 5 imamo
Z x Z 2 Z 5   Z x
2 4
F (x) = f (t)dt = 0dt + t− dt + 0dt = 1,
−∞ −∞ 2 9 9 5

74
odnosno 
0,
 x≤2
F (x) = 19 (x2 − 4x + 4), 2 ≤ x ≤ 5

1, x ≥ 5.

Izračunajmo sada očekivanje slučajne varijable X:


Z ∞ Z 2 Z 5   Z ∞
2 4
E[X] = xf (x)dx = 0 dx + x x− dx + 0 dx
−∞ −∞ 2 9 9 5
2 x3 4 x2 5
 
2 4
= · − · 2 = (125 − 8) − (25 − 4) = 4.
9 3 9 2 27 18

(b)
Z ∞ Z 0 Z 1 Z 2 Z ∞
2 2
f (x)dx = 0 dx + x dx + dx + 0 dx
−∞ −∞ 0 1 3 2
1 2 1 2
= x3 10 + x 21 = + (2 − 1) = 1
3 3 3 3
pa je f funkcija gustoće vjerojatnosti. Graf funkcije f dan je na
Slici 5.2.
1.2

1.0

0.8

0.6

0.4

0.2

-1 1 2 3

Slika 5.2:

Izračunajmo funkciju distribucije:


za x ≤ 0 imamo
Z x Z x
F (x) = f (t)dt = 0dt = 0
−∞ −∞

za 0 ≤ x ≤ 1 imamo
Z x 0 x
t3 x x3
Z Z
F (x) = f (t)dt = 0dt + t2 dt = | =
−∞ −∞ 0 3 0 3

75
za 1 ≤ x ≤ 2 imamo
Z x 0 1 x
t3
Z Z Z
2 2 2
F (x) = f (t)dt = 0dt + t dt + dt = |10 + t|x1
−∞ −∞ 0 1 3 3 3
1 2 2 2 1
= + x− = x−
3 3 3 3 3
za x ≥ 2 imamo
Z x Z 0 Z 1 Z 2 Z x
2 2
F (x) = f (t)dt = 0dt + t dt + dt + 0dt = 1,
−∞ −∞ 0 1 3 2

odnosno 

 0,
x<0
 x3 ,

0≤x≤1
F (x) = 23 1
 x − 3, 1 ≤ x ≤ 2
3


1, x ≥ 2.
Izračunajmo sada očekivanje slučajne varijable X:
Z ∞ Z 0 Z 1 Z 2 Z ∞
3 2
E[X] = xf (x)dx = 0 dx + x dx + x dx + 0 dx
−∞ −∞ 0 1 3 2
1 2 x2 2 1 5
= x4 10 + · 1 = +1= .
4 3 2 4 4
(c) Kako je
π
Z ∞ Z 0 Z
2
Z ∞
f (x)dx = 0 dx + cos x dx + 0 dx
π
−∞ −∞ 0 2
π π
= sin x 0 = sin − sin 0 = 1,
2
2
funkcija f je funkcija gustoće vjerojatnosti. Graf funkcije f dan
je na Slici 5.3.
Izračunajmo funkciju distribucije:
za x ≤ 0 imamo
Z x Z x
F (x) = f (t)dt = 0dt = 0
−∞ −∞
π
za 0 ≤ x ≤ 2
imamo
Z x Z 0 Z x
F (x) = f (t)dt = 0dt + cos tdt = sin t|x0 = sin x
−∞ −∞ 0

76
1.2

1.0

0.8

0.6

0.4

0.2

-2 -1 1 2 3 4

Slika 5.3:

π
za x ≥ 2
imamo
Z x π
Z 0 Z
2
Z x
F (x) = f (t)dt = 0dt + cos tdt + 0dt = 1,
π
−∞ −∞ 0 2

odnosno 
0,
 x≤0
π
F (x) = sin x, 0 ≤ x ≤ 2

1, x ≥ π2 .

Izračunajmo sada očekivanje slučajne varijable X:


Z ∞ Z 0 Z π Z ∞
2
E[X] = xf (x)dx = 0 dx + x cos x dx + 0 dx
π
−∞ −∞ 0 2
π π
= (cos x + x sin x) 02 = − 1.

2

5.2.1 Normalna razdioba


Kažemo da je slučajna varijabla X normalno distribuirana, ako je ona kon-
tinuirana, RX = R, i ako je funkcija gustoće vjerojatnosti dana formulom
1 1 x−µ 2
f (x) = √ e− 2 ( σ )
σ 2π
gdje su µ i σ > 0 proizvoljne konstante.
Pišemo: X ∼ N (µ, σ 2 ).

Vrijedi: E[X] = µ, V [X] = σ 2 .

Graf funkcije gustoće vjerojatnosti normalne razdiobe dan je na Slici 5.4.

77
Μ-Σ Μ Μ+Σ

Slika 5.4:

Krivulja tog tipa zove se Gaussova zvonolika krivulja pa se normalna


razdioba ponked naziva Gaussova razdioba.
Posebno je važna normalna razdioba s parametrima µ = 0 i σ 2 = 1, tj.
normalna razdioba N (0, 1). Ta razdioba se naziva standardna normalna
razdioba, X ∼ N (0, 1).
Standardna normalna funkcija gustoće vjerojatnosti dana je s
1 1 2
ϕ(x) = √ e− 2 x ,

a standardna normalna funkcija distribucije dana je s
Z z
1 1 2
Φ(z) = √ e− 2 t dt.
2π −∞

Vrijednosti standardne normalne funkcije distribucije Φ(z) dane su u tablici


u Dodatku. Na Slici 5.5 dan je njen graf funkcije gustoće vjerojatnosti.

FHxL

Slika 5.5:

Napomena. Vrijedi: Φ(−z) = 1 − Φ(z).

78
Veza izmedu N (µ, σ 2 ) i N (0, 1) distribucije
Ako u funkciji f (x) gustoće vjerojatnosti distribucije N (µ, σ 2 ) uzmemo sup-
stituciju z = x−µσ
, onda dobivamo funkciju gustoće vjerojatnosti ϕ(z) dis-
tribucije N (0, 1). Dakle, ako X ima N (µ, σ 2 ) distribuciju, onda X ∗ = X−µ

ima N (0, 1) distribuciju. Stoga je P (a ≤ X ≤ b) = P a−µ σ
≤ X ∗
≤ b−µ
σ
=
b−µ a−µ
 
Φ σ −Φ σ .

Pravilo “3 sigma”
U primjenama najvažnije svojstvo normalne razdiobe je to da je 99.74%
svih vrijednosti slučajne varijable udaljeno od očekivanja (µ) za najviše tri
standardne devijacije (3σ). Stoga možemo smatrati da je dogadaj gotovo
nemoguć ako je za više od 3σ udaljen od očekivanja.

Μ-3Σ Μ Μ+3Σ

Slika 5.6: “3 sigma”

Neka X ∼ N (µ, σ 2 ), te neka je X ∗ = X−µ


σ
. Tada X ∗ ima standardnu nor-
malnu razdiobu, pa vrijedi
 
µ − 3σ − µ ∗ µ + 3σ − µ
P (µ − 3σ ≤ X ≤ µ + 3σ) = P ≤X ≤
σ σ

= P (−3 ≤ X ≤ 3) = Φ(3) − Φ(−3) = 0.9987 − 0.0013 = 0.9974.

Takoder vrijedi

P (µ − 2σ ≤ X ≤ µ + 2σ) = Φ(2) − Φ(−2) = 0.9772 − 0.0228 = 0.9544

P (µ − σ ≤ X ≤ µ + σ) = Φ(1) − Φ(−1) = 0.8413 − 0.1587 = 0.6826.


Dakle, 95.44% svih vrijednosti slučajne varijable udaljeno je od očekivanja
za najviše 2σ, a 68.26% svih vrijednosti slučajne varijable udaljeno je od
očekivanja za najviše σ.

79
Μ-3Σ Μ-2Σ Μ-Σ Μ Μ+Σ Μ+2Σ Μ+3Σ

Slika 5.7:

Primjer 50. Pretpostavimo da je visina studenata nekog sveučilišta slučajna


varijabla, normalno distribuirana, X ∼ N (172, 7.52 ). Nadite vjerojatnost da
je:

a) visina slučajno odabranog studenta izmedu 175 cm i 185 cm

b) slučajno odabrani student niži od 170 cm

c) slučajno odabrani student viši od 160 cm

d) visina slučajno odabranog studenta izmedu 165 cm i 180 cm

e) Koliki je očekivani broj studenata viših od 195 cm, ako ima ukupno
3000 studenata?

Rješenje. Kako je X ∼ N (172, 7.52 ), imamo da je očekivana visina µ = 172


cm, a standardna devijacija σ = 7.5 cm. Neka je X ∗ = X−µ σ
. Tada X ∗ ima
standardnu normalnu razdiobu, to jest X ∗ ∼ N (0, 1).

(a)
 
175 − 172 ∗ 185 − 172
P (175 ≤ X ≤ 185) = P ≤X ≤
7.5 7.5

= P (0.4 ≤ X ≤ 1.73) = Φ(1.73) − Φ(0.4)
= 0.9582 − 0.6554 = 0.3028.

(b)
 
∗ 170 − 172
P (X < 170) = P X <
7.5

= P (−∞ ≤ X < −0.27) = Φ(−0.27) = 0.3936.

80
(c)
 
∗160 − 172
P (X > 160) = P X >
7.5

= P (−1.6 < X ≤ ∞)
= 1 − Φ(−1.6) = 1 − 0.0548 = 0.9452.

(d)
 
165 − 172 ∗ 180 − 172
P (165 ≤ X ≤ 180) = P ≤X ≤
7.5 7.5

= P (−0.93 ≤ X ≤ 1.07) = Φ(1.07) − Φ(−0.93)
= 0.8577 − 0.1762 = 0.6815.

(e) Očekivani broj studenata viših od 195 cm dobit ćemo tako da ukupan
broj studenata pomnožimo s vjerojatnošću da je pojedini student viši
od 195 cm.
 
∗ 195 − 172
P (X > 195) = P X >
7.5

= P (3.07 < X ≤ ∞) = 1 − Φ(3.07) = 1 − 0.9989 = 0.0011.

Stoga je očekivani broj jednak n·P (X ≥ 195) = 3000·0.0011 = 3.3 ≈ 3.

Napomena. Pomoću normalne razdiobe može se aproksimirati binomna


razdioba ako je n velik, a p nije blizu broja 0 ili 1. U praksi se aproksimacija
koristi kad je np ≥ 10.
B(n, p) ≈ N (np, npq).
X−np
Ako je X ∼ B(n, p), onda je X ∗ = √
npq
≈ N (0, 1).

1. U jednom skladištu od 1000 proizvoda je 20% proizvoda prve klase.


Zbog kontrole kvalitete 100 puta je uziman jedan proizvod uz vraćanje.
Nadite vjerojatnost da je broj proizvoda prve klase:

a) manji od 16
b) najmanje 30

81
Rješenje. Neka slučajna varijabla X označava broj proizvoda prve
klase. Budući da je u skladištu od 1000 proizvoda 20% proizvoda prve
klase, vjerojatnost da je proizvod prve klase je 0.2. 100 puta uzimamo
jedan proizvod pa je n = 100. Dakle, X ∼ B(100, 0.2).
Kako je np = 20, slučajnu varijablu X možemo aproksimirati normal-
nom razdiobom N (20, 16) (σ 2 = npq = 100 · 0.2 · 0.8 = 16). Neka
je X ∗ = X−µσ
. Tada X ∗ ima standardnu normalnu razdiobu, to jest

X ∼ N (0, 1).

(a)
 
0 − 20 ∗ 15 − 20
P (0 ≤ X ≤ 15) = P ≤X ≤
4 4

= P (−5 ≤ X ≤ −1.25)
= Φ(−1.25) − Φ(−5) = 0.1056 − 0 = 0.1056.

(b)
 
30 − 20 100 − 20
P (X ≥ 30) = P (30 ≤ X ≤ 100) = P ≤ X∗ ≤
4 4

= P (2.5 ≤ X ≤ 20) = Φ(20) − Φ(2.5)
= 1 − 0.9938 = 0.0062.

2. Neka je X slučajna varijabla sa standardnom normalnom distribucijom


N (0, 1). Izračunajte:

a) P (X ≤ 1.42)
b) P (−1.37 ≤ X ≤ 2.01)
c) P (X ≥ 1.13)
d) P (|X| ≤ 0.5)
e) P (0.65 ≤ |X|)
Rješenje. (a)
P (X ≤ 1.42) = Φ(1.42) = 0.9222.
(b)

P (−1.37 ≤ X ≤ 2.01) = Φ(2.01)−Φ(−1.37) = 0.9778−0.0853 = 0.8925.

(c)

P (X ≥ 1.13) = P (1.13 ≤ X ≤ ∞) = 1−Φ(1.13) = 1−0.8708 = 0.1292.

82
(d)

P (|X| ≤ 0.5) = P (−0.5 ≤ X ≤ 0.5) = Φ(0.5) − Φ(−0.5)


= 0.6915 − 0.3085 = 0.3830.

(e)

P (0.65 ≤ |X|) = 1 − P (|X| < 0.65) = 1 − P (−0.65 < X < 0.65)


= 1 − Φ(0.65) + Φ(−0.65) = 1 − 0.7422 + 0.2578
= 0.5156

3. Neka je X slučajna varijabla sa standardnom normalnom distribucijom


N (0, 1). Odredite t ako je:

a) P (0 ≤ X ≤ t) = 0.4236
b) P (X ≤ t) = 0.7967
c) P (t ≤ X ≤ 2) = 0.1000
Rješenje. (a) P (0 ≤ X ≤ t) = Φ(t)−Φ(0) = Φ(t)−0.5 a to je iz uvjeta
zadatka jednako 0.4236. Dakle, Φ(t) = 0.4236 + 0.5 = 0.9236.
Odnosno, t = Φ−1 (0.9236) = 1.43.
(b) P (X ≤ t) = Φ(t) = 0.7967. Dakle, t = Φ−1 (0.7967) = 0.83.
(c) P (t ≤ X ≤ 2) = Φ(2) − Φ(t) = 0.9772 − Φ(t) = 0.1000. Dakle,
Φ(t) = 0.8772. Odnosno, t = Φ−1 (0.8772) = 1.16.

4. Ako je X ∼ N (8, 42 ), skicirajte graf funkcije gustoće i odredite t tako


da vrijedi:

(a) P (X ≤ t) = 0.14
(b) P (X ≥ t) = 0.975
(c) P (|X − 8| ≤ t) = 0.9
Rješenje. Neka je X ∗ = X−µσ
, gdje je µ = 8, σ = 4. Tada je X ∗ ∼
N (0, 1). Graf funkcije gustoće dan je na Slici 5.8.

(a) P (X ≤ t) = P X ∗ ≤ t−8 t
= 0.14. To jest 4t − 2
 
4
= Φ 4
− 2 =
−1
Φ (0.14) = −1.08. Dakle, t = 3.68.
t−8 ∗

(b) P (X ≥ t) = P (t ≤ X ≤ ∞) = P 4
≤ X ≤ ∞ = 1 −
t t t

Φ 4 − 2 = 0.975. To jest Φ 4 − 2 = 0.025. Pa je 4 − 2 =
Φ−1 (0.025) = −1.96. Dakle, t = 0.16.

83
4 8 12

Slika 5.8:

(c)

P (|X − 8| ≤ t) = P (−t ≤ X − 8 ≤ t) = P (−t + 8 ≤ X ≤ t + 8)


 
−t + 8 − 8 ∗ t+8−8
=P ≤X ≤
4 4
   
t −t
=Φ −Φ = 0.9.
4 4

Kako je Φ −t = 1 − Φ 4t dobivamo 2Φ 4t − 1 = 0.9, odnosno


  
4
t
4
= Φ−1 (0.95) = 1.64. Dakle, t = 6.56.

5. Pretpostavimo da je temperatura T u mjesecu lipnju normalno dis-


tribuirana s očekivanjem 20o C i standardnom devijacijom 3o C. Nadite
vjerojatnost da je temperatura 15. lipnja izmedu 21o C i 27o C.
Rješenje. T je normalno distribuirana, µ = 20o , σ = 3o , to jest T ∼
N (20, 32 ). Neka je T ∗ = T −µ
σ
. Tada je T ∗ ∼ N (0, 1).
 
21 − 20 ∗ 27 − 20
P (21 ≤ T ≤ 27) = P ≤T ≤
3 3

= P (0.33 ≤ T ≤ 2.33)
= Φ(2.33) − Φ(0.33) = 0.9901 − 0.6293 = 0.3608.

6. Pretpostavimo da je na populaciji od 800 stanovnika slučajna varijabla


visina V normalno distribuirana s očekivanjem 170cm i standardnom
devijacijom 12.7cm. Nadite očekivani broj stanovnika s visinom:

(a) izmedu 165.1cm i 177.8cm


(b) većom ili jednakom 182.88cm

84
Rješenje. V je normalno distribuirana, µ = 170cm, σ = 12.7cm, to
jest V ∼ N (170, 12.72 ). Neka je V ∗ = V σ−µ . Tada je V ∗ ∼ N (0, 1).
Očekivani broj stanovnika s odredenom visinom ćemo dobiti tako da
broj stanovnika pomnožimo s vjerojatnošću da je pojedini stanovnik
odredene visine.
(a)
 
165.1 − 170 177.8 − 170
P (165.1 ≤ V ≤ 177.8) = P ≤V∗ ≤
12.7 12.7

= P (−0.39 ≤ V ≤ 0.61)
= Φ(0.61) − Φ(−0.39)
= 0.7291 − 0.3483 = 0.3808.
Očekivani broj stanovnika s visinom izmedu 165.1cm i 177.8cm je
800 · 0.3808 = 304.64 ≈ 305.
(b)
 
182.88 − 170 ∗
P (V ≥ 182.88) = P ≤V ≤∞
12.7
= P (1.01 ≤ V ∗ ≤ ∞) = 1 − Φ(1.01)
= 1 − 0.8438 = 0.1562.
Očekivani broj stanovnika viših od 182.88cm je 800 · 0.1562 =
124.96 ≈ 125.
7. Prema izvješću Auto kluba očekivano vrijeme izmedu poziva i dolaska
do mjesta nesreće je 25 minuta. Pretpostavimo da se radi o nor-
malno distribuiranoj slučajnoj varijabli sa standardnom devijacijom
4.5 minute. Ako slučajno izaberemo 80 poziva, koliki je očekivani broj
poziva na koje će biti reagirano u roku manjem od 15 minuta?
Rješenje. Neka slučajna varijabla T označava vrijeme izmedu poziva i
dolaska do mjesta nesreće. Imamo da je µ = 25min, σ = 4.5min. T
je normalno distribuirana pa je T ∼ N (25, 4.52 ). Neka je T ∗ = T −µσ
.

Tada je T ∼ N (0, 1). Vjerojatnost da je na poziv reagirano u roku
manjem od 15 minuta jednaka je
 
0 − 25 ∗ 15 − 25
P (T < 15) = P (0 < T < 15) = P ≤T ≤
4.5 4.5

= P (−5.56 ≤ T ≤ −2.22) = Φ(−2.22) − Φ(−5.56) = 0.0132.
Očekivani broj poziva na koje će biti reagirano u roku manjem od 15
minuta je 80 · P (T < 15) = 80 · 0.0132 = 1.056 ≈ 1.

85
5.2.2 Uniformna razdioba
Kažemo da je slučajna varijabla X uniformno distribuirana, ako je ona kon-
tinuirana, RX = R, i ako je funkcija gustoće vjerojatnosti dana formulom
(
1
b−a
, za a ≤ x ≤ b;
f (x) =
0, inače,

gdje su a, b ∈ R.
Pišemo: X ∼ U(a, b).

a+b (b−a)2
Vrijedi: E[X] = 2
, V [X] = 12
.

Funkcija distribucije vjerojatnosti uniformne razdiobe je



0,
 za x < a
x−a
F (x) = P (X ≤ x) = , za a ≤ x ≤ b;
 b−a
1, za x > b.

Napomena. Svojstvo uniformne razdiobe je da su vjerojatnosti podintervala


iste duljine jednake.
Zadatak 1. Vrijeme izmedu dolaska tramvaja u jutarnjim satima na Trgu
bana Josipa Jelačića je uniformno distribuirano izmedu 0 i 25s.

(a) Izračunajte vjerojatnost da tramvaj dode za manje od 15s.

(b) Koliko je prosječno vrijeme čekanja izmedu dolaska dva tramvaja?

Rješenje. Neka je X slučajna varijabla koja označava vrijeme izmedu


dolazaka tramvaja u jutarnjim satima na Trgu bana Josipa Jelačića. Tada
je X ∼ U(0, 25).

(a) Dogadaj ”tramvaj je došao za manje od 15s” možemo zapisati kao


{X ≤ 15}. Računamo vjerojatnost tog dogadaja:

15 − 0
P (X ≤ 15) = = 0.6
25 − 0

25
(b) Prosječno vrijeme čekanja izmedu dolaska dva tramvaja je E[X] = 2
=
12.5s.

86
5.2.3 Gama razdioba
Kažemo da slučajna varijabla X ima gama razdiobu, ako je ona kontinuirana,
RX = R, i ako je funkcija gustoće vjerojatnosti dana formulom
( b
a
xb−1 e−ax , za x > 0;
f (x) = Γ(b)
0, za x ≤ 0.
R∞
gdje je a > 0, b > 0, Γ(b) = 0 tb−1 e−t dt gama funkcija.
Pišemo: X ∼ Γ(b, 1/a).

Vrijedi: E[X] = ab , V [X] = b


a2
.

5.2.4 Eksponencijalna razdioba


Vrijeme izmedu dvaju kvarova na nekom stroju nije egzaktno odredeno već je
slučajno. Vrijeme izmedu poziva na nekom telefonskom broju ili slanja sms
poruka takoder je slučajno. Govorimo o slučajnoj varijabli koja registrira
vrijeme izmedu dvaju kvarova, zatim ispravnog rada nekog uredaja i sl.
Kažemo da je slučajna varijabla X eksponencijalno distribuirana, ako je ona
kontinuirana, RX = R, i ako je funkcija gustoće vjerojatnosti dana formulom
(
ae−ax , za x > 0;
f (x) =
0, za x ≤ 0.

gdje je a > 0.
Pišemo: X ∼ E(a).

Vrijedi: E[X] = a1 , V [X] = 1


a2
.

Funkcija distribucije vjerojatnosti eksponencijalne razdiobe je


(
1 − e−ax , za x > 0;
F (x) = P (X ≤ x) =
0, inače .

Napomena. Eksponencijalna distribucija je specijalni slučaj gama distribucije


kada je parametar b = 1.
Zadatak 2. Prosječno vrijeme izmedu dva poziva na telefonskim informaci-
jama je 70s. Odredite vjerojatnost:
(a) da vrijeme izmedu dva poziva bude najmanje 70s,

87
(b) da poziv stigne izmedu 40-te i 80-te s,

(c) da se poziv uspostavi za manje od 50s.


Rješenje. Da bismo riješili ovaj problem pretpostavimo da je vrijeme izmedu
dva poziva na telefonskim informacijama eksponencijalno distribuirano.
Neka je X slučajna varijabla koja registrira to vrijeme. Prosječno vrijeme
izmedu dva poziva na telefonskim informacijama je 70s, a to je očekivanje
slučajne varijable X, odnosno E[X] = 70s. Vrijedi:
1 1
E[X] = = 70 ⇒ a =
a 70
(a) Dogadaj ”vrijeme izmedu dva poziva je najmanje 70s” možemo zapisati
kao {X ≥ 70}. Računamo vjerojatnost tog dogadaja:
70
P (X ≥ 70) = 1 − P (X ≤ 70) = 1 − (1 − e− 70 ) = e−1 = 0.3679

(b) Dogadaj ”poziv je stigao izmedu 40-te i 80-te s” možemo zapisati kao
{40 ≤ X ≤ 80}. Računamo vjerojatnost tog dogadaja:
80 40 4 8
P (40 ≤ X ≤ 80) = 1 − e− 70 − (1 − e− 70 ) = e− 7 − e− 7 = 0.2458

(c) Dogadaj ”poziv je uspostavljen za manje od 50s” možemo zapisati kao


{X ≤ 50}. Računamo vjerojatnost tog dogadaja:
50
P (X ≤ 50) = 1 − e− 70 = 0.5105

5.2.5 χ2 -razdioba
Kažemo da slučajna varijabla X ima χ2 -razdiobu s n stupnjeva slobode, ako
je ona kontinuirana, RX = R, i ako je funkcija gustoće vjerojatnosti dana
formulom  n
 ( 21 ) 2 n2 −1 − 12 x
x e , za x ≥ 0;
f (x) = Γ( n2 )
0, za x < 0,

gdje je n ∈ N.
Oznaka za χ2 -razdiobu s n stupnjeva slobode je χ2 (n), gdje je n ∈ N.
Vrijedi: E[X] = n, V [X] = 2n.
Napomena. Ako je X ∼ Γ n2 , 2 , onda je X ∼ χ2 (n). Takoder, primjetimo


da je χ2 (2) = E 12 .
Za n > 30 vrijedi X ∼ χ2 (n) ≈ N (n, 2n).

88
Zadatak 3. Neka je X slučajna varijabla sa χ2 -razdiobom.
(a) Ako je n = 20, za koji x vrijedi P (X > x) = 0.1?

(b) Ako je n = 5, za koji x vrijedi P (X < x) = 0.95?

(c) Ako je n = 32, za koji x vrijedi P (X < x) = 0.9345?


Rješenje. (a) U tablici pročitamo za n = 20 i P (X > x) = α = 0.1 da je
x = 28.41.

(b) Ovdje je zadano P (X < x) = 0.95 pa je P (X > x) = 1 − P (X <


x) = 1 − 0.95 = 0.05. U tablici pročitamo za n = 5 i α = 0.05 da je
x = 11.07.

(c) S obzirom da je n = 32 > 30, X ∼ χ2 (32) ≈ N (32, 82 ). Neka je


X ∗ = X−µ
σ
. Tada vrijedi
   
∗ x − 32 x − 32
P (X < x) = P X ≤ =Φ = 0.9345.
8 8
Stoga je
x − 32
= Φ−1 (0.9345) = 1.51.
8
Dakle, x = 44.08.

5.2.6 Studentova t razdioba


Neka su X i Y nezavisne slučajne varijable takvep da je X ∼ N (0, 1) i Y ∼
χ2 (n). Tada se razdioba slučajne varijable Z = X Yn , n = 1, 2, 3, . . . naziva
Studentova t razdioba s n stupnjeva slobode.
Oznaka za Studentovu t razdiobu s n stupnjeva slobode je t(n), gdje je n ∈ N.
Funkcija gustoće vjerojatnosti dana je formulom

1 Γ n+1

2 1
f (x) = √ n n+1
nπ Γ 2 2
1 + xn 2

gdje je x ∈ R.
Za n > 1 t-razdioba ima matematičko očekivanje E[X] = 0, a za n > 2 ima
n
i varijancu V [X] = n−2 .
Napomena. Za velike n (npr. n > 100) Studentova t razdioba je gotovo
istovjetna sa standardnom normalnom razdiobom.
Zadatak 4. Neka je X slučajna varijabla sa Studentovom razdiobom.

89
(a) Ako je n = 11, za koji x vrijedi P (X > x) = 0.25?

(b) Ako je n = 4, za koji x vrijedi P (X < x) = 0.75?

(c) Ako je n = 20, za koji x vrijedi P (X < x) = 0.995?

Rješenje. (a) U tablici pročitamo za n = 11 i P (X > x) = α = 0.25 da je


x = 0.697.

(b) Ovdje je zadano P (X < x) = 0.75 pa je P (X > x) = 1 − P (X <


x) = 1 − 0.75 = 0.25. U tablici pročitamo za n = 4 i α = 0.25 da je
x = 0.741.

(c) Ovdje je zadano P (X < x) = 0.995 pa je P (X > x) = 1 − P (X <


x) = 1 − 0.995 = 0.005. U tablici pročitamo za n = 20 i α = 0.005 da
je x = 2.845.

5.2.7 Fisherova razdioba


Neka su X i Y nezavisne slučajne varijable takve da je X ∼ χ2 (r) i Y ∼ χ2 (s),
r, s ∈ N. Tada se razdioba slučajne varijable Z = sX rY
naziva Fisherova ili
F-razdioba s parametrima r i s (stupnjevi slobode).
Oznaka za Fisherovu razdiobu s parametrima r i s je F (r, s).
Funkcija gustoće vjerojatnosti dana je formulom
 r+s
 Γ( 2 ) r r2 s 2s x r2 −1 , za x > 0;
r s r+s
f (x) = Γ( 2 )Γ( 2 ) (rx+s) 2
0, za x ≤ 0.
s
Za s > 2 F -razdioba ima matematičko očekivanje E[X] = s−2
, a za s > 4
2s2 (r+s−2)
ima i varijancu V [X] = r(s−2)2 (s−4)
.
1
Napomena. Ako X ∼ F (r, s), onda X
∼ F (s, r).
Zadatak 5. Neka je X slučajna varijabla s Fisherovom razdiobom.

(a) Ako je r = s = 9, za koji x vrijedi P (X > x) = 0.01?

(b) Ako je r = 12, s = 8, za koji x vrijedi P (X > x) = 0.05?

Rješenje. (a) U tablici pročitamo za r = s = 9 i P (X > x) = α = 0.01 da


je x = 5.35.

(b) U tablici pročitamo za r = 12, s = 8 i P (X > x) = α = 0.05 da je


x = 3.28.

90
5.3 Zadaci za vježbu
1. Odredite konstantu a tako da funkcija f dana tablicom

xi −5 −3 −1 1 3 5
f (xi ) 17 8
49
a
49
2
7
2
49
1
7

bude funkcija vjerojatnosti neke slučajne varijable X. Izračunajte E[X]


i V [X].

2. Dokažite da je funkcija f
(
1 1
2
x + 2
za x ∈ [−1, 1]
f (x) =
0 za x ∈
/ [−1, 1]

funkcija gustoće vjerojatnosti neke slučajne varijable X. Nacrtajte graf


funkcije f , te izračunajte očekivanje i varijancu slučajne varijable X.

3. Odredite konstantu a tako da funkcija f


(
ax − 49 za x ∈ [2, 5]
f (x) =
0 za x ∈
/ [2, 5]

bude funkcija gustoće vjerojatnosti neke slučajne varijable X. Nacrta-


jte graf funkcije f , te odredite P (3 < X < 4).

4. Vjerojatnost da je osoba alergična na sintetiku iznosi 3%. Nadite vjero-


jatnost da je od 250 osoba alergično manje od 5 osoba.

5. Pošiljka od 5000 mobitela poslana je u prodaju. Vjerojatnost da mobi-


tel ima grešku iznosi 1.35%. Nadite očekivanje i standardnu devijaciju
broja neispravnih mobitela te vjerojatnost da se u toj pošiljci nalazi
točno 65 neispravnih mobitela.

6. Slučajna varijabla X ima normalnu razdiobu N (13, 5). Izračunajte


P (8 ≤ X ≤ 15) i grafički interpretirajte dobiveni rezultat.

7. Pretpostavimo da je visina studenata normalno distribuirana s očekivanjem


171.2 cm i standardnom devijacijom 5.6 cm. Ako ima 250 studenata,
koliki je očekivani broj studenata koji su viši od 173 cm?

8. Vrijeme popravka klima uredaja je uniformno distribuirano izmedu 2 i


4 sata.

91
(a) Izračunajte vjerojatnost da slučajno odabrani klima uredaj bude
popravljen za manje od 2.5h.
(b) Izračunajte vjerojatnost da slučajno odabrani klima uredaj bude
popravljen za više od 3h.
(c) Koliko je prosječno vrijeme popravka klima uredaja?

9. Vrijeme trajanja standardne žarulje je slučajna varijabla koja ima ek-


sponencijalnu distribuciju s parametrom a. U uzorku 4% žarulja traje
do 110 sati.

(a) Odredite parametar a.


(b) Kolika je vjerojatnost da će slučajno odabrana žarulja trajati duže
od 150 sati?

10. Vrijeme ispravnog rada mobitela je slučajna varijabla koja ima ekspo-
nencijalnu distribuciju s očekivanjem 2 godine. Kolika je vjerojatnost
da će se mobitel pokvariti

(a) tokom prve godine korištenja,


(b) tokom druge godine korištenja?

11. Neka je X slučajna varijabla sa χ2 -razdiobom.

(a) Ako je n = 15, za koji x vrijedi P (X > x) = 0.05?


(b) Ako je n = 11, za koji x vrijedi P (X < x) = 0.99?
(c) Ako je n = 72, za koji x vrijedi P (X < x) = 0.9573?

12. Neka je X slučajna varijabla sa Studentovom razdiobom.

(a) Ako je n = 9, za koji x vrijedi P (X > x) = 0.1?


(b) Ako je n = 17, za koji x vrijedi P (X < x) = 0.975?
(c) Ako je n = 25, za koji x vrijedi P (X < x) = 0.99?

13. Neka je X slučajna varijabla s Fisherovom razdiobom.

(a) Ako je r = 20, s = 8, za koji x vrijedi P (X > x) = 0.01?


(b) Ako je r = 3, s = 7, za koji x vrijedi P (X > x) = 0.05?

92
Poglavlje 6

Procjene parametara (točkovne


i intervalne)

Ako je X promatrano statističko obilježje i X1 , X2 , ..., Xn nezavisne slučajne


varijable s istom razdiobom kao slučajna varijabla X, onda je (X1 , X2 , ..., Xn )
slučajni uzorak opsega n. Realizirani uzorak je (x1 , x2 , ..., xn ), ako je
xi ∈ RXi , gdje je RXi skup vrijednosti slučajne varijable Xi .
Funkciju slučajnog uzorka f (X1 , X2 , ..., Xn ) nazivamo statistika (to je
slučajna varijabla).
Ako iz realiziranog uzorka možemo naslutiti kakvu razdiobu ima statističko
obilježje, susrećemo se s problemom procjene parametara o kojima ovisi ta
razdioba. Procjene parametara mogu biti točkovne i intervalne.

6.1 Točkovne procjene


Statistika koja ima za cilj procijeniti odredeni parametar je točkovni proc-
jenitelj ili samo procjenitelj parametra. Označimo s θ nepoznati parametar,
a njegov procjenitelj s θ̂ = f (X1 , X2 , ..., Xn ). Ovako definiran procjenitelj je
bilo koja funkcija slučajnog uzorka, ali cilj nam je dobiti što bolju procjenu
nepoznatog parametra. Postoje metode (npr. metoda maksimalne vjerojat-
nosti, metoda momenata) za odredivanje najefikasnijeg procjenitelja, za koji
varijanca nije veća od varijance bilo kojeg drugog procjenitelja.
 
θ̂ je nepristran procjenitelj ako je E θ̂ = θ, a konzistentan ako
   2 
V θ̂ = E θ̂ − E[θ̂] → 0, kada n → ∞.
 
Za procjenitelj očekivanja E X iz slučajnog uzorka (X1 , X2 , . . . , Xn ) ko-

93
ristimo uzoračku aritmetičku sredinu:

1
X= (X1 + · · · + Xn ) ,
n

koja je nepristran i konzistentan procjenitelj što ćemo i dokazati. Koristeći


svojstvo linearnosti očekivanja i činjenicu da su Xi jednako distribuirane kao
X dobivamo:

1
E[X] = (E[X1 ] + . . . + E[Xn ])
n
1    
= nE X =E X .
n

Dakle, X je nepristran procjenitelj. Dokažimo da je i konzistentan.

1
V [X] = V [X1 + . . . + Xn ]
n2
1
= (V [X1 ] + . . . + V [Xn ])
n2
1 V [X]
= 2
n V [X] = .
n n

V [X]
Kako V [X] = n
→ 0, kada n → ∞, zaključujemo da je X konzinstentan
procjenitelj.

Na sličan način se dokazuje da je

n
2 1 X
S = (Xi − X)2 ,
n − 1 i=1

nepristran i konzistentan procjenitelj za varijancu V [X] statističkog obilježja


X(uz pretpostavku da je varijanca konačna).
U tablici koja slijedi prikazani su procjenitelji za parametre osnovnih
razdioba, kao i njihova svojstva.

94
Pretpostavljena Oznaka Parametar Procjenitelj Svojstva
razdioba procjenitelja

X
Binomna B(n, p) p p̂ = n
=X Nepristran,
konzistentan

Poissonova P(λ) λ λ̂ = X Nepristran,


konzistentan

Normalna N (µ, σ 2 ) µ µ̂ = X Nepristran,


konzistentan

Normalna N (µ, σ 2 ) σ2 σb2 = S 2 Nepristran,


konzistentan

6.2 Intervalne procjene


Neka su θ̂1 = f1 (X
 1 , X2 , ..., Xn ) i θ̂2 = f1 (X1 , X2 , ..., Xn ) funkcije slučajnog
uzorka. Interval θ̂1 , θ̂2 je 100 · (1 − α) % pouzdan interval za parametar
θ ako je P (θ̂1 ≤ θ ≤ θ̂2 ) ≥ 1 − α, α ∈ (0, 1).
Za odredivanje rubova intervala iz slučajnog uzorka koristimo statistike ko-
jima znamo razdiobe, kao i aproksimacije nekih razdioba kod velikih uzoraka.
X−µ
• Ako X ∼ N (µ, σ 2 ) onda Z = σ
∼ N (0, 1);
2 X−µ
• Ako X ∼ N (µ, σ 2 ) onda X ∼ N (µ, σn ) i Z = √σ
∼ N (0, 1);
n

X−µ
• Slučajna varijabla T = S

ima Studentovu razdiobu (t-razdiobu) s
n
(n − 1) stupnjeva slobode, tj. T ∼ t(n − 1);

Razdioba Oznaka Parametar Interval pouzdanosti Primjedba


(1 − α) · 100%
 
Normalna N (µ, σ 2 ) µ X − ε, X + ε σ 2 nepoznato
ε = tα/2 (n − 1) √Sn
 
Normalna N (µ, σ 2 ) µ X − ε, X + ε σ 2 poznato
ε = zα/2 √σn

95
Pokažimo kako se odreduju pouzdani intervali kada nemamo pretpostavku
o normalnoj razdiobi.

• Za dovoljno veliko n (npr. n > 30), bez obzira kakvu razdiobu ima
slučajna varijabla X, srednja vrijednost X ima približno normalnu
2
σX
razdiobu s parametrima E[X] = E[X] = µX i V [X] = V [X] n
= n
,
X−µX
tj. Z = σ√X ≈ N (0, 1) (jedna verzija centralnog graničnog teo-
n
rema).

Kao primjere navodimo aproksimacije binomne i Poissonove razdiobe:

(1) Ako slučajna varijabla X ima binomnu B(n, p) razdiobu onda X ≈


X−p √
N (p, p(1−p)
n
), tj. Z = √ n ≈ N (0, 1).
p(1−p)
(2) Ako slučajna varijabla X ima Poissonovu razdiobu P(λ) onda X ≈

N (λ, nλ ), tj. Z = X−λ

λ
n ≈ N (0, 1).
U tablici koja slijedi dani su intervali za parametre tih razdiobi.

Razdioba Oznaka Parametar Interval pouzdanosti Primjedba


(1 − α) · 100%
 
Binomna B(n, p) p X − ε, X + ε n ≥ 40 q
X(1−X)
ε = zα/2 n

 
Poissonova P(λ) λ X − ε, X + ε n ≥ 30 q
ε = zα/2 Xn

Vrijednosti: zα/2 = Φ−1 (1 − α2 ); tα/2 (n − 1) čitamo iz tablica, gdje je


(n − 1) broj stupnjeva slobode. Za n − 1 ≥ 30 studentovu razdiobu možemo
aproksimirati standardnom normalnom razdiobom, tj. tα/2 ≈ zα/2 .

Zadaci
1. Mjerimo visinu studenata TTF-a. Poznato je da visina studenata TTF-
a ima normalnu razdiobu s varijancom 64cm2 , ali je parametar srednje
vrijednosti nepoznat. Na slučajan način odabrano je 100 studenata
TTF-a i izmjerena im je visina. Zbroj svih dobivenih visina iznosi

96
16910 cm. Kolika je procjena za µ? Procijenite 95% pouzdani interval
za parametar µ na osnovi zadanog uzorka.
Rješenje. Slučajna varijabla X mjeri visinu studenata TTF-a i znamo
da je X ∼ N (µ, 82P ). µ procjenjujemo aritmetičkom
P100 sredinom uzorka
1 n
pa je µ̂ = X = n i=1 xi , gdje je n = 100, a i=1 xi = 16910 cm.
Stoga je µ̂ = 16910
100
= 169.10 cm.
Procijenimo sada 95% pouzdani interval za parametar µ:
α = 1 − 0.95 = 0.05, pa je α/2 = 0.025
σ 2 je poznato (σ = 8) pa koristimo formulu ε = zα/2 √σn .
Iz tablica pročitamo vrijednost zα/2 :
Φ(z0.025 ) = 1 − α2 = 1 − 0.025 = 0.975, pa je z0.025 = 1.96.
8
Uvrstimo dobivene podatke u formulu za ε i dobivamo ε = 1.96 · 10 =
1.57.
U prvom dijelu zadatka smo izračunali da je X = 169.10 pa sad možemo
izračunati 95% pouzdani interval. Dakle,

µ ∈ [X − ε, X + ε] = [169.10 − 1.57, 169.10 + 1.57] = [167.53, 170.67].

2. Izmjerena je količina toksičnih tvari (u miligramima ) u 9 uzoraka vode.


Dobiveni su rezultati:

1.2, 0.8, 0.6, 1.1, 1.2, 0.9, 1.5, 0.9, 1.0.

Pretpostavimo da mjereno obilježje ima normalnu razdiobu. Procijen-


ite

(a) 98% (b) 95% (c) 90%

pouzdani interval za očekivanu količinu toksičnih tvari.


Rješenje. Znamo da je n = 9, a iz dobivenih mjerenja možemo
izračunati X i S 2 :
1
X = (1.2 + 0.8 + 0.6 + 1.1 + 1.2 + 0.9 + 1.5 + 0.9 + 1.0) = 1.02 mg,
9

1
S 2 = (1.22 +0.82 +0.62 +1.12 +1.22 +0.92 +1.52 +0.92 +12 −9 · 1.022 )
8
= 0.0746 mg2 .

Dakle, S = 0.27 mg.


(a) α = 1 − 0.98 = 0.02, pa je α/2 = 0.01.

97
σ 2 je nepoznato pa koristimo formulu ε = tα/2 (n − 1) √Sn .
Iz tablice pročitamo da je tα/2 (n − 1) = t0.01 (8) = 2.896. Sada imamo
sve potrebno za izračunati ε, pa je ε = 2.896 · 0.27
3
= 0.26 mg. Dakle,

µ ∈ [1.02 − 0.26, 1.02 + 0.26] = [0.76, 1.28].

(b) α = 1 − 0.95 = 0.05, pa je α/2 = 0.025.


σ 2 je nepoznato pa koristimo formulu ε = tα/2 (n − 1) √Sn .
Iz tablice pročitamo da je tα/2 (n − 1) = t0.025 (8) = 2.306. Sada imamo
sve potrebno za izračunati ε, pa je ε = 2.306 · 0.273
= 0.21 mg. Dakle,

µ ∈ [1.02 − 0.21, 1.02 + 0.21] = [0.81, 1.23].

(c) α = 1 − 0.90 = 0.10, pa je α/2 = 0.05.


σ 2 je nepoznato pa koristimo formulu ε = tα/2 (n − 1) √Sn .
Iz tablice pročitamo da je tα/2 (n − 1) = t0.05 (8) = 1.860. Sada imamo
sve potrebno za izračunati ε, pa je ε = 1.860 · 0.27
3
= 0.17 mg. Dakle,

µ ∈ [1.02 − 0.17, 1.02 + 0.17] = [0.85, 1.19].

3. Na osnovi 70 podataka o duljini godišnjeg odmora izračunato je


prosječno vrijeme trajanja godišnjeg odmora od 15 dana uz standardnu
devijaciju od 3 dana. Procijenite 90% pouzdani interval za očekivano
vrijeme trajanja godišnjeg odmora.
Rješenje. Slučajna varijabla X označava vrijeme trajanja godišnjeg
odmora. E[X] = µ. U zadatku nije dana razdioba slučajne vari-
jable X, ali znamo da za dovoljno velike n (n > 30) bez obzira na
to kakvu razdiobu ima slučajna varijabla X, srednja vrijednost X ima
približno normalnu razdiobu. Znamo da je n = 70, pa možemo uzeti

da je X−µσ
n ≈ N (0, 1). U zadatku nam je još zadano da je X = 15 i
σ = 3 i znamo da je α = 1 − 0.9 = 0.1, odnosno α/2 = 0.05. Dakle, σ 2
je poznato, pa koristimo formulu ε = zα/2 √σn .
Iz tablica pročitamo vrijednost zα/2 :
Φ(z0.05 ) = 1 − α2 = 1 − 0.05 = 0.95, pa je z0.05 = 1.65.
Uvrstimo dobivene podatke u formulu za ε i dobivamo ε = 1.65 · √370 =
0.59.
Dakle, 90% pouzdani interval je:

[X − ε, X + ε] = [15 − 0.59, 15 + 0.59] = [14.41, 15.59].

98
4. Zanima nas postotak pušača u populaciji 18−godišnjaka. Na slučajan
način odabran je uzorak duljine 7383 iz te populacije. U uzorku je bilo
32.8% pušača. Procijenite 95% pouzdani interval za postotak pušača u
toj populaciji.
Rješenje. Slučajna varijabla X označava postotak pušača u populaciji
18−godišnjaka i vrijedi X ∼qB(n, p). Imamo n = 7383 > 40, pa ε
računamo po formuli ε = zα/2 X(1−X) n
. U uzorku je bilo 32.8% pušača,
pa je X = 0.328.
α = 1 − 0.95 = 0.05, odnosno α/2 = 0.025.
Iz tablica pročitamo vrijednost zα/2 :
Φ(z0.025 ) = 1 − α2 = 1 − 0.025 = 0.975, pa je z0.025 = 1.96.
Uvrstimo dobivene podatke u formulu za ε i dobivamo
r
0.328 · (1 − 0.328)
ε = 1.96 · = 0.011.
7383
Dakle, 95% pouzdani interval je:

[X − ε, X + ε] = [0.328 − 0.011, 0.328 + 0.011] = [0.317, 0.339].

5. Nakon 26 nezavisnih mjerenja jedne veličine dobivene su vrijednosti:


X = 3.52, S 2 = 0.04. Odredite 95% pouzdani interval za matematičko
očekivanje uz pretpostavku da slučajna varijabla ima normalnu raz-
diobu.
Rješenje. Zadano je: n = 26, X = 3.52 i S 2 = 0.04. Imamo pret-
postavku X ∼ N (µ, σ 2 ). Dakle, σ 2 je nepoznato pa koristimo formulu
ε = tα/2 (n − 1) √Sn .
α = 1 − 0.95 = 0.05, pa je α/2 = 0.025.
Iz tablice pročitamo da je tα/2 (n − 1) = t0.025 (25) = 2.060. Sada imamo
sve potrebno za izračunati ε, pa je ε = 2.060 · √0.2 26
= 0.08. Dakle,

µ ∈ [3.52 − 0.08, 3.52 + 0.08] = [3.44, 3.60].

6. Statističko obilježje X ima normalnu razdiobu s parametrima µ i 32


(X ∼ N (µ, 32 )). Koliki opseg uzorka treba planirati da duljina 99%
pozdanog intervala ne bude veća od 1.16?
Rješenje. Duljina intervala [X − ε, X + ε] je 2ε, pa mora vrijediti 2ε ≤
1.16, odnosno ε ≤ 0.58.
σ 2 je poznato pa koristimo formulu ε = zα/2 √σn .
α = 1 − 0.99 = 0.01, odnosno α/2 = 0.005.

99
Iz tablica pročitamo vrijednost zα/2 :
Φ(z0.005 ) = 1 − α2 = 1 − 0.005 = 0.995, pa je z0.005 = 2.58.
Znamo da je σ = 3, a za ε uzmemo najveći dozvoljeni ε, pa možemo
izračunati
√ n.
n = zα/2 σε = 2.58 · 0.583
= 13.34. Pa je n = 178.08. Dakle, treba
planirati uzorak veći ili jednak 179.
7. Inženjer želi procijeniti prosječno vrijeme potrebno za sastavljanje neke
elektroničke komponente. Koliki uzorak treba uzeti da bi mogao biti
95% siguran da je greška u procjeni srednjeg vremena manja od 0.25
minuta? Standardna devijacija vremena sastavljanja je 0.45 minuta.
Rješenje. Da bi greška u procjeni srednjeg vremena bila manja od 0.25
minuta mora vrijediti da je duljina intervala [X − ε, X + ε] manja od
0.25, odnosno 2ε < 0.25. Dakle, ε < 0.125.
σ 2 je poznato (σ = 0.45) pa koristimo formulu ε = zα/2 √σn .
α = 1 − 0.95 = 0.05, pa je α/2 = 0.025.
Iz tablica pročitamo vrijednost zα/2 :
Φ(z0.025 ) = 1 − α2 = 1 − 0.025 = 0.975, pa je z0.025 = 1.96.
Za
√ ε uzmemo ε = 0.125, pa možemo izračunati n.
σ 0.45
n = zα/2 ε = 1.96 · 0.125 = 7.057. Pa je n = 49.79. Dakle, inženjer
treba uzeti uzorak veći ili jednak od 50.

6.3 Zadaci za vježbu


1. Nakon 30 nezavisnih mjerenja jedne veličine dobivene su vrijednosti:
x = 5.73, s2 = 0.09. Odredite 99% pouzdani interval za matematičko
očekivanje uz pretpostavku da slučajna varijabla ima normalnu raz-
diobu.
2. Statističko obilježje X ima normalnu razdiobu N (µ, 9). Koliki opseg
uzorka treba uzeti da duljina 99% pouzdanog intervala ne bude veća
od 1.4?
3. Tvornica sladoleda ima 10 prodavaonica razmještenih po raznim di-
jelovima grada. Promatrana je prodaja obiteljskog pakiranja sladoleda
od 2L unutar jednog dana. Tvornica tvrdi da je broj prodanih sladoleda
u njenim prodavaonicama 30 komada po danu. Promatranjem smo do-
bili da je broj prodanih sladoleda u prodavaonicama redom: 32, 45, 26,
34, 41, 29, 37, 40, 28, 39 komada.
a) Procijenite 99% pouzdani interval za pravi broj prodanih sladoleda
u jednom danu.

100
b) Uz razinu značajnosti α = 0.05 testirajte hipotezu da je tvrdnja
proizvodača istinita.

101
102
Poglavlje 7

Testiranje statističkih hipoteza

Osnovna zadaća Statistike je na temelju uzorka ocijeniti kakvu razdiobu ima


promatrano (populacijsko) statističko obilježje X. Svaka pretpostavka koja
se odnosi na tu razdiobu je (statistička) hipoteza, a provjera istinitosti te
hipoteze je testiranje (statistički test). Hipotezu koju testiramo zovemo
nulta hipoteza ili nul-hipoteza i obilježavamo s H0 , a njoj alterna-
tivnu hipotezu obilježavamo s H1 . Ako se testira hipoteza koja se odnosi
na parametar pretpostavljene razdiobe, onda govorimo o parametarskom
testu, a ako se hipoteza odnosi na tip razdiobe govorimo o neparam-
etarskom testu. Hipoteza je jednostavna ako jednoznačno odreduje raz-
diobu statističkog obilježja X, u protivnom je složena. Približimo navedene
pojmove primjerima.

Primjer 51. Proizvodač nekog uredaja tvrdi da je uvodenjem nove tehnologije


prosječno vrijeme potrebno za izradu uredaja smanjeno u odnosu na
dotadašnje, koje je bilo 10 sati.

U ovom primjeru promatrano statističko obilježje je X ≡ vrijeme izrade


uredaja. Pretpostavimo da vrijeme izrade svih uredaja proizvedenih uz
odredenu tehnologiju ima normalnu razdiobu.
Moguće hipoteze su : ”Proizvodač je u pravu” ili ”Proizvodač nije u pravu”.
Hipoteze su alternativne, tj. točnost jedne povlači netočnost druge i obratno.
Pretpostavimo da je hipoteza ”Proizvodač nije u pravu” točna. Dakle, nulta
hipoteza je H0 : µX = 10 sati, a alternativna H1 : µX < 10 sati, gdje je
µX populacijsko očekivanje. Prema tome radi se o parametarskom testu.
Hipoteza H0 je jednostavna hipoteza jer jednoznačno odreduje vrijednost
parametra µX , a time i pretpostavljenu razdiobu (ako je varijanca poznata),
dok je hipoteza H1 složena jer jednoznačno ne odreduje razdiobu.

103
Primjer 52. Kocka se baca 60 puta. Rezultati su dani u tablici:

Broj na kocki 1 2 3 4 5 6
Broj pojavljivanja 13 19 11 8 5 4

Da li je kocka ispravna?

U ovom primjeru su moguće dvije hipoteze: ”Kocka je ispravna” i njoj


alternativna ”Kocka nije ispravna.”
Za nultu hipotezu se najčešće uzima suprotno od onoga što želimo dokazati.
Iz tablice naslućujemo da kocka nije ispravna, pa hipoteze definiramo ovako:
H0 : ”kocka je ispravna” i
H1 : ”kocka nije ispravna”.
Statističko obiljezje je X ≡ broj na kocki. Prirodno je ispitati da li se iz
tablice frekvencija može zaključiti da empirijska razdioba bitno ne odstupa
od teorijske diskretne uniformne razdiobe (vjerojatnosti pojavljivanja svakog
broja na kocki su jednake, tj. broj pojavljivanja -frekvencija svakog broja u
60 bacanja je 10). Stoga definiramo hipoteze:
H0 : X ima diskretnu uniformnu razdiobu i
H1 : X nema diskretnu uniformnu razdiobu.
Dakle, treba testirati hipotezu o tipu razdiobe, što spada u neparametarske
testove.
U oba primjera treba na temelju uzorka donijeti odluku o prihvaćanju
ili odbacivanju nulte hipoteze. Teorijski gledano, riječ je o tome da se iz n
mjerenja slučajne varijable X, odnosno na temelju vrijednosti (x1 , . . . , xn )
slučajnog uzorka (X1 , . . . , Xn ), donese odluka o prihvaćanju ili odbacivanju
odredene hipoteze. Kako niti jedan statistički zaključak o populaciji na bazi
uzorka nije stopostotno siguran, tako i prihvaćnje neke hipoteze na temelju
uzorka ne znači da je ta hipoteza točna. Stoga je umjesto ”hipotezu pri-
hvaćamo” ispravnije reći ” na osnovi uzorka ne postoji razlog za odbacivanje
hipoteze”. Prilikom donošenja odluke o istinitosti hipoteze postoje dvije vrste
mogućih pogrešaka :
pogreška 1. vrste: odbacili smo nultu hipotezu ako je ona istinita
pogreška 2. vrste: prihvatili smo nultu hipotezu ako je ona neistinita.
Moguće situacije su prikazane tablicom:

H0 je točna H0 je netočna

prihvaćamo H0 pogreška 2. vrste

odbacujemo H0 pogreška 1. vrste

104
Vjerojatnosti tih pogrešaka označavamo s:
α = P(pogreška 1. vrste)= P(odbacujemo H0 | H0 točna) i
β = P(pogreška 2. vrste)= P(prihvaćamo H0 | H0 netočna).
Sljedeća tablica prikazuje vjerojatnosti mogućih situacija

H0 je točna H0 je netočna
prihvaćamo H0 1−α β
odbacujemo H0 α 1−β

α je nivo signifikantnosti ili razina značajnosti, a 1-β=P(odbacujemo


H0 | H0 netočna) snaga testa. Pitanje da li je neki test najbolji u smislu
da su vjerojatnosti pogrešaka minimalne ćemo izostaviti! Naime, smanjenje
vjerojatnosti jedne pogreške ima za posljedicu povećanje vjerojatnosti druge.
Najčešće se problem rješava tako da se zada vjerojatnost pogreške prve vrste
α ∈ h0, 1i (najčešće 0.01 i 0.05, ali to nije pravilo!) U tom slučaju u mnogim
testovima je moguće postići da vjerojatnost pogreške 2. vrste bude mini-
malna. Opseg uzorka utječe na vjerojatnosti pogrešaka. Naime, povećanjem
veličine uzorka smanjuju se vjerojatnosti pogrešaka.
Za testiranje hipoteze treba:

(1 ) Definirati H0 i H1 ;

(2 ) Definirati test-statistiku na osnovi čijih vrijednosti se donose odluke;

(3 ) Za zadanu razinu značajnosti α odrediti kritično područje - skup svih


mogućih vrijednosti test-statistike za koje se odbacuje nulta hipoteza
u korist alternativne;

(4 ) Ispitati da li se vrijednost test-statistike izračunate iz uzorka nalazi u


kritičnom području;

(5 ) Zaključiti: Ako je izračunata vrijednost test-statistike u kritičnom po-


dručju hipoteza H0 se odbacuje u korist alternativne hipoteze H1 . U
suprotnom se H0 prihvaća, tj. na osnovi uzorka hipotezu ne možemo
odbaciti.

Napomena. U pravilu, za nul-hipoteze se uzimaju jednostavne hipoteze.

105
7.1 Parametarski testovi
Neka je θ nepoznati parametar o kojemu ovisi pretpostavljena razdioba. Tada
možemo testirati slijedeće hipoteze:
(i) H : θ = θ0 (ii) H : θ 6= θ0 (iii) H : θ > θ0 (iv) H : θ < θ0
Uz svaku od od navedenih hipoteza definiramo alternativnu iz iste skupine,
ovisno o zadatku koji rješavamo. Ako je hipoteza tipa (ii) govorimo o dvos-
tranoj hipotezi tj. o dvostranom testu, a za slučajeve (iii), (iv) o jed-
nostranoj hipotezi tj. o jednostranom testu.

7.1.1 Testovi o parametrima normalne razdiobe N (µ, σ 2 )


Nulta hipoteza Test statistika Alternativna Kritično područje
hipoteza
H1 : µ 6= µ0 C0 = h−∞, −z α2 ] ∪ [z α2 , ∞i

H0 : µ = µ0 Z = X̄−µ
σ
n
σ 2 poznato Z ∼ N (0, 1) H1 : µ > µ0 C0 = [zα , ∞i

H1 : µ < µ0 C0 = h−∞, −zα ]


H1 : µ 6= µ0 C0 = h−∞, −t α2 ] ∪ [t α2 , ∞i

H0 : µ = µ0 T = X̄−µ
S
n
2
σ nije poznato T ∼ t(n − 1) H1 : µ > µ0 C0 = [tα , ∞i

H1 : µ < µ0 C0 = h−∞, −tα ]


H1 : σ 2 6= σ02 C0 = [0, χ21− α ] ∪ [χ2α , ∞i
2 2
H0 : σ 2 = σ02 U = n−1
σ2
S2
σ02 > 0 2
U ∼ χ (n − 1) H1 : σ 2 > σ02 C0 = [χ2α , ∞i

H1 : σ 2 < σ02 C0 = [0, χ21−α ]

1. Promatramo obilježje X koje ima normalnu razdiobu N (µ, 100). Na


slučajan način odabran je uzorak od 105 elemenata. Uz razinu
značajnosti α = 0.01 testirajte hipotezu H0 : µ = 30 prema hipotezi
H1 : µ = 38.
Rješenje. X ∼ N (µ, 102 ), n = 105
Postavljamo hipoteze:

H0 : µ = 30
H1 : µ = 38 > 30

106

Računamo vrijednost test-statistike prema formuli Z = X̄−µ σ
n.
Imamo µ = 30, σ = 10, n = 105, X̄ = 38. Dakle, Z = 8.1976.
Iz tablice za normalnu razdiobu čitamo zα = z0.01 = Φ−1 (1 − 0.01) =
Φ−1 (0.99) = 2.33, pa je kritično područje C0 = [2.33, ∞i. Budući da
je Z ∈ C0 odbacujemo nultu hipotezu u korist alternativne.

2. Prema standardima prosječan broj nedostataka po 1m2 tkanine ne


smije biti veći od 5. Na slučajan način odabrano je 100m2 tkanine
i na njima izbrojan broj nedostataka. Dobiveni su rezultati:

broj nedostataka 1 2 3 4 5 6 7 8 9 10
broj m2 tkanine 15 12 15 22 15 8 5 3 3 2

Ako znamo da broj nedostataka na tkanini ima normalnu razdiobu


s varijancom jednakom 4, uz razinu značajnosti α = 0.01 testirajte
hipotezu da ova vrsta tkanine zadovoljava uvjete standarda.
Rješenje. Neka je X slučajna varijabla koja označava broj nedostataka
po 1m2 tkanine. Imamo X ∼ N (µ, 4), n = 100.
Postavljamo hipoteze:

H0 : µ = 5
H1 : µ < 5

Kad bi za alternativnu hipotezu postavili H1 : µ 6= 5, onda bi u slučaju


odbacivanja nulte hipoteze mogli zaključiti da broj nedostataka na
tkanini nije 5, ali to znači da broj nedostataka na tkanini može biti
veći ili manji od 5. Izračunajmo vrijednost test-statistike:

1 · 15 + 2 · 12 + 3 · 15 + 4 · 22 + 5 · 15 + 6 · 8 + 7 · 5 + 8 · 3 + 9 · 3 + 10 · 2
x̄ =
100
= 4.01

pa je vrijednost test-statistike Z = 4.01−52
100 = −4.95
Iz tablice za normalnu razdiobu čitamo zα = z0.01 = Φ−1 (1 − 0.01) =
Φ−1 (0.99) = 2.33, pa je kritično područje C0 = h−∞, −2.33]. Budući
da je Z ∈ C0 odbacujemo nultu hipotezu u korist alternativne, tj. za-
ključujemo da ova vrsta tkanine zadovoljava uvjete standarda uz razinu
značajnosti 0.01 jer je u uzorku broj nedostataka po 1m2 tkanine manji
od 5.

107
3. Proizvodač tvrdi da je dimenzija serijski radenog proizvoda 35mm.
Mjerenjem 20 slučajno odabranih proizvoda dobiveni su rezultati:

dimenzija (mm) 34.8 34.9 35.0 35.1 35.3


broj proizvoda 2 3 4 6 5

Uz razinu značajnosti α = 0.05 testirajte hipotezu H0 : µ = 35 uz


alternativnu hipotezu H1 : µ 6= 35 (pretpostavljamo da promatrana
dimenzija ima normalnu razdiobu te je varijanca nepoznata).
Rješenje. Neka je X slučajna varijabla koja označava dimenziju serijski
radenog proizvoda. Imamo X ∼ N (µ, σ 2 ), n = 20.
Postavljamo hipoteze:
H0 : µ = 35
H1 : µ 6= 35
Izračunajmo vrijednost test-statistike:

34.8 · 2 + 34.9 · 3 + 35.0 · 4 + 35.1 · 6 + 35.3 · 5


x̄ =
20
= 35.07

34.82 · 2 + 34.92 · 3 + 35.02 · 4 + 35.12 · 6 + 35.32 · 5 − 20 · 35.072


s2 =
19
= 0.0273

s = 0.167,

pa je vrijednost test-statistike T = 35.07−35
0.167
20 = 1.897.
Iz tablice za studentovu razdiobu čitamo t 2 (n−1) = t0.025 (19) = 2.093,
α

pa je kritično područje C0 = h−∞, −2.093] ∪ [2.093, ∞i. Budući da


vrijednost test-statistike nije u kritičnom području, nema razloga da
ne prihvatimo nultu hipotezu uz razinu značajnosti 0.05, tj. uz razinu
značajnosti 0.05 nema razloga da odbacimo tvrdnju proizvodača.

4. Tvornica tvrdi da je prosječan vijek trajanja proizvoda iz te tvornice


21.5 sati. Na slučajnom uzorku od 6 proizvoda iz te tvornice laboratori-
jskim mjerenjima vijeka trajanja dobivene su vrijednosti od 19, 18, 22,
20, 16, 25 sati. S razinom značajosti α = 0.05, testirajte da li dobiveni
uzorak indicira kraći prosječan vijek trajanja proizvoda (pretpostavl-
jamo da prosječan vijek trajanja proizvoda ima normalnu razdiobu).

108
Rješenje. Neka je X slučajna varijabla koja označava prosječan vijek
trajanja proizvoda. Imamo X ∼ N (µ, σ 2 ), n = 6.
Postavljamo hipoteze:

H0 : µ = 21.5
H1 : µ < 21.5

Izračunajmo vrijednost test-statistike:

19 + 18 + 22 + 20 + 16 + 25
x̄ = = 20
6

192 + 182 + 222 + 202 + 162 + 252 − 6 · 202


s2 = = 10 ⇒ s = 3.16
5

pa je vrijednost test-statistike T = 20−21.5
3.16
6 = −1.162.
Iz tablice za studentovu razdiobu čitamo tα (n − 1) = t0.05 (5) = 2.015,
pa je kritično područje C0 = h−∞, −2.015]. Budući da vrijednost test-
statistike nije u kritičnom području, nema razloga da odbacimo nultu
hipotezu uz razinu značajnosti 0.05, tj. dobiveni uzorak ne indicira
kraći prosječan vijek trajanja.

7.1.2 Test o proporciji (vjerojatnosti)


Kao što smo već rekli, bez obzira kakvu razdiobu ima statističko obilježje,
aritmetička sredina X, za dovoljno velike uzorke, ima približno normalnu
razdiobu. Promatramo statističko obilježje koje ima binomnu razdiobu :
X ∼ B(n, p). Testiramo hipotezu H0 : p = p0 . Za alternativnu uzimamo
jednu od H1 : p 6= p0 ili H1 : p > p0 ili H1 : p < p0 . U sva tri slučaja
koristimo test- statistiku:

X − p0 √
Z=p n ≈ N (0, 1).
p0 (1 − p0 )

Nulta hipoteza Alternativna hipoteza Kritično područje


H1 : p 6= p0 C0 = h−∞, −z α2 ] ∪ [z α2 , ∞i
H0 : p = p0
H1 : p > p0 C0 = [zα , ∞i
H1 : p < p0 C0 = h−∞, −zα ]

109
1. Proizvodač tvrdi da njegove pošiljke sadrže najviše 5% neispravnih
proizvoda. Uzet je slučajni uzorak od 300 komada iz jedne pošiljke
i bilo je 16 neispravnih. Da li možemo prihvatiti tvrdnju proizvodača
uz razinu značajnosti 0.05?
Rješenje. Neka je X slučajna varijabla koja označava postotak neis-
pravnih proizvoda. Imamo X ∼ B(300, p). Postavljamo hipoteze:
H0 : p = 0.05
H1 : p < 0.05
Kada bi za alternativnu hipotezu postavili H1 : p 6= 0.05, u slučaju
odbacivanja nulte hipoteze mogli bi zaključiti samo da proporcija neis-
pravnih nije 0.05, a to može značiti da je veća, ali i da je manja od te
vrijednosti što je još bolje.
Odredimo kritično područje:

zα = z0.05 = (tablice) = 1.65 =⇒ C0 = h−∞, −1.65]


Izračunajmo vrijednost odgovarajuće test-statistike:
16 0.0533 − 0.05 √
x̄ = p̂ = = 0.0533 =⇒ Z = √ 300 = 0.262.
300 0.05 · 0.95
Kako izračunata vrijednost nije u kritičnom području tj. Z > −z0.05
nultu hipotezu H0 ne možemo odbaciti, tj. ne možemo prihvatiti
tvrdnju proizvodača da njegove pošiljke sadrže najviše 5% neispravnih
proizvoda.

7.1.3 Usporedba varijanci dviju normalno distribuiranih


populacija (F-test)
Promatramo statističko obilježje X na dvije različite populacije. Uz to pret-
postavimo da u obje populacije promatrano obilježje ima normalnu razdiobu.
Ako s X1 i X2 označimo obilježje na prvoj, odnosno drugoj populaciji, onda
su pretpostavke:
X1 ∼ N (µ1 , σ12 ) i X2 ∼ N (µ2 , σ22 ).
Neka su realizirani uzorci uzeti iz prve, odnosno druge populacije opsega n1
i n2 redom. Testiramo hipotezu
H0 : σ12 = σ22
u odnosu na jednu od alternativnih:
H1 : σ12 6= σ22 , H1 : σ12 > σ22 , H1 : σ12 < σ22 .

110
Test statistika je:
S12
F =
S22

koja ima F (Fisherovu) razdiobu s n1 − 1, n2 − 1 stupnjeva slobode.

Nulta hipoteza Alternativna hipoteza Kritično područje


H1 : σ12 6= σ22 C0 = h0, f1− α2 (n1 − 1, n2 − 1)]∪
H0 : σ12 = σ22 [f α2 (n1 − 1, n2 − 1), ∞i
2 2
H1 : σ1 > σ2 C0 = [fα (n1 − 1, n2 − 1) ∞i
H1 : σ12 < σ22 C0 = h0, f1−α (n1 − 1, n2 − 1)]
f1− α2 (n1 − 1, n2 − 1) računamo na sljedeći način:

1
f1− α2 (n1 − 1, n2 − 1) = .
f (n2 − 1, n1 − 1)
α
2

7.1.4 Usporedba očekivanja dviju normalno distribuiranih


populacija (t-test)
Promatramo statističko obilježje X na dvije različite populacije. Uz to pret-
postavimo da u obje populacije promatrano obilježje ima normalnu razdiobu.
Ako s X1 i X2 označimo obilježje na prvoj, odnosno drugoj populaciji, onda
su pretpostavke:
X1 ∼ N (µ1 , σ12 ) i X2 ∼ N (µ2 , σ22 ).

Neka su realizirani uzorci uzeti iz prve, odnosno druge populacije opsega n1


i n2 redom. Testiramo hipotezu

H0 : µ1 = µ2

u odnosu na jednu od alternativnih:

H1 : µ1 6= µ2 , H1 : µ1 > µ2 , H1 : µ1 < µ2 .

Ovisno o tome da li su varijance poznate i jednake ili ne imamo različite test


statistike, što je prikazano u tablici:

111
Nulta hipoteza Test statistika Alternativna Kritično područje
hipoteza
H1 : µ1 6= µ2 C0 = h−∞, −z α2 ]∪
X̄1 −X̄2
H0 : µ1 = µ2 Z= r
2
σ1 σ2
[z α2 , ∞i
n1
+ n2
2
σ12 i σ22 Z ∼ N (0, 1) H1 : µ1 > µ2 C0 = [zα , ∞i
poznato
H1 : µ1 < µ2 C0 = h−∞, −zα ]
H1 : µ1 6= µ2 C0 = h−∞, −t α2 (n1 + n2 − 2)]
X̄1 −X̄2
H0 : µ1 = µ2 T = q
1
∪[t α2 (n1 + n2 − 2), ∞i
S· n
+ n1
1 2
(n1 −1)S12 +(n2 −1)S22
σ12 = σ22 = σ 2 S2 = n1 +n2 −2
H1 : µ1 > µ2 C0 = [tα (n1 + n2 − 2), ∞i
nije poznato
T ∼ t(n1 + n2 − 2) H1 : µ1 < µ2 C0 = h−∞, −tα (n1 + n2 − 2)]

1. Pomoću dvije različite metode mjerena je jedna te ista veličina. Rezul-


tati mjerenja dani su u tablici:

1. metoda 9.4 10.0 9.8 10.2


2. metoda 10.4 9.7 10.0 10.3

Može li se uz α = 0.1 zaključiti da obje metode daju istu točnost?


Rješenje. Najprije provodimo F -test, odnosno usporedbu varijanci.
Postavljamo hipoteze:

H0 : σ12 = σ22
H1 : σ12 6= σ22

Imamo n1 = n2 = 4. Računanjem dobivamo sljedeće: X̄1 = 9.85, X̄2 =


10.1, S12 = 0.117, S22 = 0.1. Sada računamo vrijednost test-statistike:
S2
F = S12 = 1.1667
2

Iz tablice za Fisherovu razdiobu čitamo f0.05 (3, 3) = 9.28 i f0.95 (3, 3) =


1
f0.05 (3,3)
= 0.11 pa je kritično područje C0 = h0, 0.11] ∪ [9.28, ∞i
Budući da F ∈ / C0 nema razloga da odbacimo nultu hipotezu uz razinu
značajnosti α = 0.1.
Sad provodimo t-test, odnosno usporedbu očekivanja.
Postavljamo hipoteze:

H0 : µ1 = µ2
H1 : µ1 6= µ2

112
Najprije izračunamo S 2 = 0.108. Zatim računamo vrijednost test-
X̄1 −X̄2
statistike: T = q 1 1
= −1.075.
S· n1
+n
2
Iz tablice za studentovu razdiobu čitamo t0.05 (6) = 1.943 pa je kritično
područje C0 = h−∞, −1.943] ∪ [1.943, ∞i. Budući da T ∈ / C0 nema
razloga da odbacimo nultu hipotezu uz razinu značajnosti α = 0.1.
Zaključujemo da obje metode daju istu točnost uz razinu značajnosti
α = 0.1.

2. Iz dva četvrta razreda neke škole izabrano je na slučajan način po 10


učenika i izmjerena je njihova masa (masa je normalno distribuirana), a
podaci su dani u tablici. Uz razinu značajnosti 0.02 testirajte hipotezu
da su varijance jednake.

4.a 57 60 63 59 62 60 58 56 54 62
4.b 58 62 60 56 63 58 61 57 53 61

Rješenje. Provodimo F -test, odnosno usporedbu varijanci.


Postavljamo hipoteze:

H0 : σ12 = σ22
H1 : σ12 6= σ22

Imamo n1 = n2 = 10. Računanjem dobivamo: X̄1 = 59.1, X̄2 =


58.9, S12 = 8.322, S22 = 9.433. Računamo vrijednost test-statistike:

S12
F = = 0.8822.
S22

Iz tablice za Fisherovu razdiobu čitamo f0.01 (9, 9) = 5.35 i f0.99 (9, 9) =


1
f0.01 (9,9)
= 0.19 pa je kritično područje C0 = h0, 0.19] ∪ [5.35, ∞i.
Budući da F ∈ / C0 nema razloga da odbacimo nultu hipotezu uz razinu
značajnosti α = 0.02, odnosno zaključujemo da su varijance jednake uz
razinu značajnosti 0.02.

3. Psiholog je testirao dvije grupe učenika. Grupu A od 7 učenika i grupu


B od 6 učenika. Broj bodova je:

A grupa 70 75 80 80 85 90 85
B grupa 75 90 95 100 80 85

113
Da li se uz razinu značajnosti 0.1 može smatrati da je uspjeh u obje
grupe isti?
Rješenje. Najprije provodimo F -test, odnosno usporedbu varijanci.
Postavljamo hipoteze:
H0 : σ12 = σ22
H1 : σ12 6= σ22
Imamo n1 = 7, n2 = 6. Računanjem dobivamo sljedeće: X̄1 =
80.71, X̄2 = 87.5, S12 = 46.05, S22 = 87.5. Računamo vrijednost test-
S2
statistike: F = S12 = 0.517.
2
Iz tablice za Fisherovu razdiobu čitamo f0.05 (6, 5) = 4.95 i f0.95 (6, 5) =
1 1
f0.05 (5,6)
= 4.39 = 0.228 pa je kritično područje C0 = h0, 0.228] ∪
[4.95, ∞i. Budući da F ∈ / C0 nema razloga da odbacimo nultu hipotezu
uz razinu značajnosti α = 0.1.
Sad provodimo t-test, odnosno usporedbu očekivanja.
Postavljamo hipoteze:
H0 : µ1 = µ2
H1 : µ1 6= µ2
Računamo S 2 = 64.89 odnosno S = 8.06. Zatim računamo vrijednost
X̄1 −X̄2
test-statistike: T = q 1 1
= −1.514.
S· n1
+n
2
Iz tablice za studentovu razdiobu čitamo t0.05 (11) = 1.796 pa je kritično
područje C0 = h−∞, −1.796] ∪ [1.796, ∞i. Budući da T ∈ / C0 nema
razloga da odbacimo nultu hipotezu uz razinu značajnosti α = 0.1.
Zaključujemo da uz razinu značajnosti α = 0.1 možemo smatrati da je
uspjeh u obje grupe isti.

7.2 χ2 -test
Jedan od prvih statističkih testova je χ2 -test. Predložio ga je K. Pearson
1900. godine, pa je poznat i pod nazivom Pearsonov test. χ2 − test je
neparametarski test. Pomoću χ2 -testa testiramo nultu hipotezu da obilježje
X ima odredenu (teorijsku) razdiobu protiv alternativne da nema tu raz-
diobu. Isto tako pomoću χ2 -testa ispitujemo nezavisnost dva statistička
obilježja, kao i homogenost populacija. Za sve navedeno test-statistika je
(općenito):
k
X (fi − fti )2
H=
i=1
fti

114
gdje su fi eksperimentalne, a fti teorijske frekvencije.
Ako je za neki i očekivana (teorijska) frekvencija fti < 5 združimo
taj razred sa susjednim(a) razredom(ima) tako da novodobiveni
razred zadovoljava uvjet da mu je očekivana frekvencija barem 5.
Uz pretpostavku da je H0 točna hipoteza za velike n (n → ∞)

H ≈ χ2 (r − l − 1)

gdje χ2 (r − l − 1) označava χ2 −razdiobu s (r − l − 1) stupnjeva slobode. r je


(konačan) broj razreda u uzorku, a l broj nepoznatih parametara. Za zadanu
pogrešku prve vrste α, kritično područje odredujemo iz uvjeta

P (H > χ2 (r − l − 1)|H0 ) = α.

Dakle, kritično područje je:

C0 = [χ2α (r − l − 1), ∞i

χ2α (r − l − 1) čitamo iz tablica. Ako s h označimo vrijednost test statistike


izračunate iz uzorka, onda nultu hipotezu odbacujemo ako

h ∈ C0 tj. h ≥ χ2α (r − l − 1).

7.2.1 χ2 - test o prilagodbi modela podacima


Neka je X statističko obilježje koje promatramo. Iz podataka u uzorku
najčešće mozemo naslutiti kakva je populacijska razdioba. U ovom slučaju
nulta hipoteza je:
H0 : X ima pretpostavljenu razdiobu,
a alternativna:
H1 : X nema pretpostavljenu razdiobu.

Primjer 53. Kocka se baca 60 puta. Rezultati su dani u tablici:

Broj na kocki 1 2 3 4 5 6
Broj pojavljivanja 13 19 11 8 5 4

Da li je kocka ispravna uz razinu značajnosti 0.01?


Rješenje. U ovom slučaju hipoteze su:
H0 : ”kocka je ispravna” i
H1 : ”kocka nije ispravna”.

115
Statističko obilježje je X ≡ broj na kocki. Prirodno je ispitati da li se iz
tablice frekvencija može zaključiti da empirijska razdioba bitno ne odstupa
od teorijske diskretne uniformne razdiobe (vjerojatnosti pojavljivanja svakog
broja na kocki su jednake, tj. broj pojavljivanja -frekvencija svakog broja u
60 bacanja je 10). Stoga definiramo hipoteze:
H0 : X ima diskretnu uniformnu razdiobu i
H1 : X nema diskretnu uniformnu razdiobu.
Ako je H0 istinita hipoteza onda bi funkcija vjerojatnosti obilježja X bila:
 
1 2 3 4 5 6
X∼ 1 1 1 1 1 1 .
6 6 6 6 6 6

Kako bismo izračunali vrijednost odgovarajuće test-statistike trebaju nam


teorijske frekvencije. Njih računamo po formuli fti = npi gdje je pi odgo-
varajuća vjerojatnost, odnosno u ovom slučaju odgovarajuća proporcija.
Kako je pi = 61 , za svaki i, to je fti = 60 · 61 = 10. Formirajmo tablicu:

(fi −fti )2
fi fti fti
13 10 0.9
19 10 8.1
11 10 0.1
8 10 0.4
5 10 2.5
P 4 10 3.6
60 60 15.6

Vrijednost test statistike je h = 15.6, broj razreda r = 6, broj nepoznatih


parametara l = 0. Iz tablica čitamo χ2α (r − l − 1) = χ20.01 (5) = 15.086, pa
je kritično područje C0 = [15.086, ∞i. Vrijednost test statistike h = 15.6
pripada kritičnom području, pa nultu hipotezu odbacujemo i prihvaćamo
alternativnu, tj. uz razinu značajnosti 0.01 možemo zaključiti da kocka nije
ispravna.

1. Proizvodač tvrdi da je 5% njegovih proizvoda prve klase, 92% druge


i 3% treće klase. U slučajnom uzorku od 500 proizvoda nadeno je 40
proizvoda prve, 432 druge i 28 treće klase. Uz razinu značajnosti 0.05,
testirajte hipotezu da je proizvodač u pravu.
Rješenje. Proizvodač tvrdi da njegovi proizvodi imaju neku distribu-
ciju. Istinitost te tvdnje provjeravamo χ2 -testom. Najprije postavimo
hipoteze.

116
H0 : ” Proizvodač je u pravu” i
H1 : ” Proizvodač nije u pravu”.
Kako bismo izračunali vrijednost odgovarajuće test-statistike trebaju
nam teorijske frekvencije. Njih računamo po formuli fti = npi gdje je
pi odgovarajuća vjerojatnost. Formirajmo tablicu:

(fi −fti )2
fi fti ft i
40 25 9
432 460 1.704
P 28 15 11.267
500 500 21.971

Vrijednost test statistike je h = 21.971, broj razreda r = 3, broj nepoz-


natih parametara l = 0 (nije bilo ni jednog nepoznatog parametra). Iz
tablica čitamo χ2α (r − l − 1) = χ20.05 (2) = 5.99, pa je kritično područje
C0 = [5.99, ∞i. Vrijednost test statistike h pripada kritičnom području,
pa odbacujemo nultu hipotezu, uz razinu značajnosti α = 0.05, tj.
proizvodač nije u pravu.
2. Iz intervala [0, 1] generirano je 200 slučajnih brojeva koji su razvrstani
u 5 podintervala:

interval [0, 0.2) [0.2, 0.4) [0.4, 0.6) [0.6, 0.8) [0.8, 1]
broj br. 32 44 38 42 44

Da li su frekvencije ravnomjerno rasporedene po intervalima uz razinu


značajnosti α = 0.01?
Rješenje. U ovom slučaju hipoteze su:
H0 :” frekvencije su ravnomjerno rasporedene” i
H1 : ”frekvencije nisu ravnomjerno rasporedene”.
Statističko obilježje je X ≡ interval u koji je broj razvrstan. Testiramo
hipotezu da je u svakom intervalu jednak broj brojeva pa stoga testi-
ramo hipoteze:
H0 : X ima kontinuiranu uniformnu razdiobu i
H1 : X nema kontinuiranu uniformnu razdiobu.
Kako bismo izračunali vrijednosti odgovarajuće test-statistike trebaju
nam teorijske frekvencije. Njih računamo po formuli fti = npi gdje
je pi odgovarajuća vjerojatnost. Kako je pi = 15 , za svaki i, to je
fti = 200 · 51 = 40. Formirajmo tablicu:

117
(fi −fti )2
fi fti ft i
32 40 1.6
44 40 0.4
38 40 0.1
42 40 0.1
P 44 40 0.4
200 200 2.6

Vrijednost test statistike je h = 2.6, broj razreda r = 5, broj nepoznatih


parametara l = 0. Iz tablica čitamo χ2α (r − l − 1) = χ20.01 (4) = 13.28,
pa je kritično područje C0 = [13.28, ∞i.
Vrijednost test statistike h = 2.6 ne pripada kritičnom području, pa
nema razloga da odbacimo nultu hipotezu, tj. frekvencije su ravnom-
jerno rasporedene po intervalima uz razinu značajnosti α = 0.01.
3. Anketirano je 100 radnika neke tvornice o udaljenosti od kuće do posla.

udaljenost (km) [0, 2i [2, 4i [4, 6i [6, 8i [8, 10i [10, 12i [12, 14i
broj radnika 5 10 20 33 18 10 4

Uz razinu značajnosti 0.05, testirajte hipotezu da se radi o uzorku iz


populacije s normalnom distribucijom.
Rješenje. Normalna distribucija ima 2 parametra - očekivanje µ i var-
ijancu σ 2 . Kako nijedan od njih nije zadan, moramo ih procijeniti, pa
odmah slijedi da je l = 2.
Procjenitelj za očekivanje je µ̂ = x̄ a za varijancu σ̂ 2 = s2 .
U tablici su dani grupirani podaci. Računamo prosječnu udaljenost do
posla te varijancu:
k
1X
µ̂ = x̄ = xi · f i
n i=1
1 · 5 + 3 · 10 + 5 · 20 + 7 · 33 + 9 · 18 + 11 · 10 + 13 · 4
=
100
= 6.9
k
!
1 X
σ̂ 2 = s2 = x̄2i · fi − n · x̄2
n − 1 i=1
12 · 5 + 32 · 10 + · · · + 112 · 10 + 132 · 4 − 100 · 6.92
=
99
= 8.03

118
Postavljamo (nultu) hipotezu da slučajna varijabla X koja mjeri udal-
jenost od kuće do posla ima distribuciju X ∼ N (6.9, 8.03), odnosno
alternativnu hipotezu da X nema distribuciju X 6∼ N (6.9, 8.03).
Sljedeći korak je odrediti teorijske frekvencije fti = n · pi , gdje je
n = 100. Neka je Z = X−µσ
. Tada je

 
0 − 6.9 2 − 6.9
p1 = P (0 ≤ X < 2) = P √ ≤Z< √
8.03 8.03
= Φ(−1.73) − Φ(−2.43) = 0.0418 − 0.0075
= 0.0343 ≈ 0.03 ⇒ ft1 = n · p1 = 100 · 0.03 = 3
 
2 − 6.9 4 − 6.9
p2 = P (2 ≤ X < 4) = P √ ≤Z< √
8.03 8.03
= Φ(−1.02) − Φ(−1.73) = 0.1539 − 0.0418 = 0.1121 ≈ 0.11
⇒ ft2 = 11
p3 = P (4 ≤ X < 6) = P (−1.02 ≤ Z < −0.32)
= Φ(−0.32) − Φ(−1.02) = 0.2206 ≈ 0.22 ⇒ ft3 = 22
p4 = P (6 ≤ X < 8) = P (−0.32 ≤ Z < 0.39)
= Φ(0.39) − Φ(−0.32) = 0.2772 ≈ 0.28 ⇒ ft4 = 28
p5 = P (8 ≤ X < 10) = P (0.39 ≤ Z < 1.09)
= Φ(1.09) − Φ(0.39) = 0.2104 ≈ 0.21 ⇒ ft5 = 21
p6 = P (10 ≤ X < 12) = P (1.09 ≤ Z < 1.8)
= Φ(1.8) − Φ(1.09) = 0.102 ≈ 0.10 ⇒ ft6 = 10
p7 = P (12 ≤ X < 14) = P (1.8 ≤ Z < 2.51)
= Φ(2.51) − Φ(1.8) = 0.0299 ≈ 0.03 ⇒ ft7 = 3

Budući je ft1 < 5 i ft7 < 5, spojit ćemo prva dva i posljednja dva
razreda, pa će tako ostati ukupno 5 razreda. Dakle, r = 5. Formiramo
tablicu:

(fi −fti )2
fi fti fti
15 14 0.071
20 22 0.182
33 28 0.893
18 21 0.429
P 14 13 0.077
100 ≈ 100 1.652

119
Vrijednost test-statistike je prema tome
5
X (fi − fti )2
h= = 1.652,
i=1
fti

a
χ2α (r − l − 1) = χ20.05 (2) = 5.99,
pa kako je h < χ20.05 (2), nultu hipotezu ne možemo odbaciti, odnosno
zaključujemo da se radi o uzorku iz normalno distribuirane populacije.

4. U cilju ispitivanja nekog svojstva pamučnih vlakana mjerena je njihova


duljina i dobiveni su sljedeći rezultati:

duljina (u cm) [2, 4i [4, 6i [6, 8i [8, 10i [10, 12i


broj vlakana 10 47 63 30 20

Testirajte hipotezu o normalnoj distribuciji uz razinu značajnosti 0.05.


Rješenje. Normalna distribucija ima 2 parametra - očekivanje µ i var-
ijancu σ 2 koje moramo procijeniti, pa odmah slijedi da je l = 2. Proc-
jenitelj za očekivanje je µ̂ = x̄ a za varijancu σ̂ 2 = s2 .
U tablici su dani grupirani podaci. Računamo prosječnu duljinu
pamučnih vlakana:
k
1X
µ̂ = x̄ = xi · f i
n i=1
3 · 10 + 5 · 47 + 7 · 63 + 9 · 30 + 11 · 20
= = 7.04
170

k
!
1 X
σ̂ 2 = s2 = x̄2i · fi − n · x̄2
n−1 i=1
32 · 10 + 52 · 47 + 72 · 63 + 92 · 30 + 112 · 20 − 170 · 7.042
=
169
= 4.6

Postavljamo (nultu) hipotezu da slučajna varijabla X koja mjeri duljinu


pamučnih vlakana ima distribuciju

X ∼ N (7.04, 4.6)

120
dok je alternativna da X nema distribuciju N (7.04, 4.6). Sljedeći korak
je odrediti teorijske frekvencije fti = 170 · pi . Neka je Z = X−µ
σ
. Tada
je
 
2 − 7.04 4 − 7.04
p1 = P (2 ≤ X < 4) = P √ ≤Z< √
4.6 4.6
= Φ(−1.42) − Φ(−2.35) = 0.0778 − 0.0094 = 0.0684 ≈ 0.07
⇒ ft1 = 170 · 0.07 = 11.9
p2 = P (4 ≤ X < 6) = P (−1.42 ≤ Z < −0.48)
= Φ(−0.48) − Φ(−1.42) = 0.2378 ≈ 0.24 ⇒ ft2 = 40.8
p3 = P (6 ≤ X < 8) = P (−0.48 ≤ Z < 0.45)
= Φ(0.45) − Φ(−0.48) = 0.358 ≈ 0.36 ⇒ ft3 = 61.2
p4 = P (8 ≤ X < 10) = P (0.45 ≤ Z < 1.38)
= Φ(1.38) − Φ(0.45) = 0.2426 ≈ 0.24 ⇒ ft4 = 40.8
p5 = P (10 ≤ X < 12) = P (1.38 ≤ Z < 2.31)
= Φ(2.31) − Φ(1.38) = 0.0734 ≈ 0.07 ⇒ ft5 = 11.9

Formiramo tablicu:

(fi −fti )2
fi fti fti
10 11.9 0.303
47 40.8 0.942
63 61.2 0.053
30 40.8 2.859
P 20 11.9 5.513
170 ≈ 170 9.67

Vrijednost test-statistike je prema tome


5
X (fi − fti )2
h= = 9.67,
i=1
f ti

a
χ2α (r − l − 1) = χ20.05 (2) = 5.99,
pa kako je h > χ20.05 (2), nultu hipotezu odbacujemo, odnosno za-
ključujemo da se ne radi o uzorku iz populacije s normalnom distribu-
cijom uz razinu značajnosti 0.05.

121
5. U jednom trgovačkom centru 200 puta je registriran broj kupaca u 10
sekundi.
Dobiveni su rezultati:

broj kupaca 0 1 2 3 4
broj mjerenja 109 65 22 3 1

Testirajte hipotezu da se radi o Poissonovoj razdiobi s vjerojatnošću


0.9.
Rješenje. Poissonova distribucija ima 1 parametar λ koji moramo pro-
cijeniti, pa odmah slijedi da je l = 1. Procjenitelj za λ je λ̂ = x̄. U
tablici su dani sortirani podaci.
k
1X
λ̂ = x̄ = x i · fi
n i=1
1 · 65 + 2 · 22 + 3 · 3 + 4 · 1
= = 0.61
200
Postavljamo (nultu) hipotezu da slučajna varijabla X broj kupaca u
trgovačkom centru ima distribuciju
X ∼ P(0.61)
dok je alternativna da X nema distribuciju P(0.61). Sljedeći korak je
odrediti teorijske frekvencije fti = 200 · pi .
0.610 −0.61
p0 = P (X = 0) = e = 0.543
0!
⇒ ft0 = 200 · 0.543 = 108.6
0.611 −0.61
p1 = P (X = 1) = e = 0.331
1!
⇒ ft1 = 200 · 0.331 = 66.2
0.612 −0.61
p2 = P (X = 2) = e = 0.101
2!
⇒ ft2 = 200 · 0.101 = 20.2
0.613 −0.61
p3 = P (X = 3) = e = 0.021
3!
⇒ ft3 = 200 · 0.021 = 4.2
0.614 −0.61
p4 = P (X = 4) = e = 0.003
4!
⇒ ft4 = 200 · 0.003 = 0.6

122
Budući je ft3 < 5 i ft4 < 5, a i ft3 + ft4 < 5, spojit ćemo zadnja tri
razreda, pa će tako ostati ukupno 3 razreda. Dakle, r = 3. Formiramo
tablicu:
(fi −fti )2
fi fti fti
109 108.6 0.001
65 66.2 0.022
P 26 25 0.04
200 ≈ 200 0.063

Vrijednost test-statistike je prema tome


3
X (fi − fti )2
h= = 0.063,
i=1
f ti

a
χ2α (r − l − 1) = χ20.1 (1) = 2.71,
pa kako je h < χ20.1 (1), pa nema razloga da ne prihvatimo nultu
hipotezu, odnosno zaključujemo da se radi o uzorku iz populacije s
Poissonovom distribucijom uz razinu značajnosti 0.1, odnosno s vjero-
jatnošću 0.9.

6. Provjerite da li se empirijska razdioba dana tablicom:

xi 0 1 2 3 4
fi 116 56 22 14 2

podudara s Poissonovom razdiobom, s pouzdanošću 95%.


Rješenje. Postupamo analogno prethodnom zadatku. Poissonova dis-
tribucija ima 1 parametar λ koji moramo procijeniti, pa odmah slijedi
da je l = 1. Procjenitelj za λ je λ̂ = x̄. U tablici su dani sortirani
podaci.
k
1X
λ̂ = x̄ = xi · f i
n i=1
1 · 56 + 2 · 22 + 3 · 14 + 4 · 2
= = 0.714
210
Postavljamo (nultu) hipotezu da slučajna varijabla X ima distribuciju

X ∼ P(0.714)

123
dok je alternativna da X nema distribuciju P(0.714). Sljedeći korak je
odrediti teorijske frekvencije fti = 210 · pi .

0.7140 −0.714
p0 = P (X = 0) = e = 0.4897
0!
⇒ ft0 = 102.84
0.7141 −0.714
p1 = P (X = 1) = e = 0.3496
1!
⇒ ft1 = 73.42
0.7142 −0.714
p2 = P (X = 2) = e = 0.1248
2!
⇒ ft2 = 26.21
0.7143 −0.714
p3 = P (X = 3) = e = 0.0297
3!
⇒ ft3 = 6.24
0.7144 −0.714
p4 = P (X = 4) = e = 5.30 · 10−3
4!
⇒ ft4 = 1.11

Budući je ft4 < 5, spojit ćemo zadnja dva razreda, pa će tako ostati
ukupno 4 razreda. Dakle, r = 4. Formiramo tablicu:

(fi −fti )2
fi fti fti
116 102.84 1.684
56 73.42 4.133
22 26.21 0.676
P 16 7.35 10.18
210 ≈ 210 16.673

Vrijednost test-statistike je prema tome


4
X (fi − fti )2
h= = 16.673,
i=1
fti

a
χ2α (r − l − 1) = χ20.05 (2) = 5.99,
pa kako je h > χ20.05 (2), pa odbacujemo nultu hipotezu, odnosno za-
ključujemo da se ne radi o uzorku iz populacije s Poissonovom distribu-
cijom uz razinu značajnosti 0.05, odnosno s pouzdanošću 95%.

124
7.2.2 χ2 - test nezavisnosti dviju varijabli
Neka je (X1 , Y1 ), (X2 , Y2 ), . . . (Xn , Yn ) slučajni uzorak za dvodimenzionalno
diskretno statističko obilježje (X, Y ) i neka je pritom:
Skup vrijednosti obilježja X :

RX = {a1 , . . . , ar };

Skup vrijednosti obilježja Y :

RY = {b1 , . . . , bs };

Skup vrijednosti obilježja (X, Y ) :

R(X,Y ) = {(ai , bj ) : 1 ≤ i ≤ r, 1 ≤ j ≤ s}.

Nadalje,
fij : frekvencija od (ai , bj ) u uzorku
fi : (marginalna) frekvencija od ai u uzorku
gj : (marginalna) frekvencija od bj u uzorku

Vrijedi:
s
X r
X
fi = fij , gj = fij
j=1 i=1

Kontingencijska frekvencijska tablica:


-
X Y b1 b2 ... bs Σ

a1 f11 f12 . . . f1s f1


a2 f21 f22 . . . f2s f2
.. .. .. .. .. ..
. . . . . .
ar fr1 fr2 . . . frs fr
Σ g1 g2 . . . gs n

Označimo:

pij = P (X = ai , Y = bj )
pi = P (X = ai )
qj = P (Y = bj )

Hipoteze su:
H0 : X i Y su nezavisna obilježja i

125
H1 : X i Y su zavisna obilježja, tj.
H0 : pij = pi · qj za sve i i j, a
H1 : postoje i, j takvi da pij 6= pi · qj
Uz pretpostavku da je H0 točna hipoteza , procjene za pi i qj su:
fi gj
p̂i = , qˆj =
n n
Očekivane (teorijske) vrijednosti ftij od fij uz H0 su:
fi gj f i · gj
ftij = n p̂i qˆj = n · · =
n n n
Test-statistika je:
r X s
X (fij − ftij )2
H=
i=1 j=1
ftij
Ako je H0 istinita, onda za n → ∞:
H ≈ χ2 ((r − 1) · (s − 1)),
gdje χ2 ((r − 1) · (s − 1)) označava χ2 −razdiobu s ((r − 1) · (s − 1)) stupnjeva
slobode.
Za zadanu pogrešku prve vrste α, kritično područje odredujemo iz uvjeta
P (H > χ2 ((r − 1) · (s − 1))|H0 ) = α.
Dakle, kritično područje je:
C0 = [χ2α ((r − 1) · (s − 1)), ∞i,
gdje χ2α ((r − 1) · (s − 1)) čitamo iz tablica. Ako s h označimo vrijednost test
statistike izračunate iz uzorka, onda nultu hipotezu odbacujemo ako
h ∈ C0 tj. h ≥ χ2α ((r − 1) · (s − 1)).
1. U cilju ispitivanja uspješnosti na kolokvijima iz statistike interesira
nas da li prolaznost na drugom kolokviju ovisi o prolaznosti na prvom
kolokviju. Za slučajno odabranih 120 studenata dobiveni su podaci
dani u tablici. Možete li na osnovu ovih podataka zaključiti da uspjeh
na drugom kolokviju ovisi o uspjehu na prvom kolokviju, uz razinu
značajnosti 0.01?
P
1. kolokvij/ 2. kolokvij Položili Pali
Položili 45 25 70
Pali
P 20 30 50
65 55 120

126
Rješenje. Neka je X = prolaznost na prvom kolokviju, a Y = pro-
laznost na drugom kolokviju.
RX = RY = {”položio”, ”pao”}
Testiramo:
H0 : X i Y su nezavisna obilježja,
uz alternativnu
H1 : X i Y su zavisna obilježja.
Test statistika je:

H ≈ χ2 ((2 − 1) · (2 − 1)) = χ2 (1).

Uz razinu značajnosti α = 0.01 , χ20.01 (1) = (tablice) = 6.63, pa je


kritično područje: C0 = [6.63, ∞i .
Očekivane(teorijske) frekvencije su:
P
1. kolokvij/ 2. kolokvij Položili Pali
Položili 37.92 32.08 70
Pali
P 27.08 22.92 50
65 55 120

Vrijednost test statistike je:

(45 − 37.92)2 (25 − 32.08)2 (20 − 27.08)2 (30 − 22.92)2


h= + + + = 6.92.
37.92 32.08 27.08 22.92
Kako h = 6.92 pripada kritičnom području, tj. h > 6.63, uz rizik od 1%
odbacujemo hipotezu nezavisnosti. Dakle, uspjeh na drugom kolokviju
ovisi o uspjehu na prvom kolokviju.

7.3 Zadaci za vježbu


1. Proizvodač tvrdi da je 7% njegovih proizvoda prve klase, 89% druge
i 4% treće klase. U slučajnom uzorku od 420 proizvoda nadeno je 30
proizvoda prve, 372 druge i 18 treće klase. Uz razinu značajnosti 0.05,
testirajte hipotezu da je proizvodač u pravu.

2. Plivačka ekipa Mladosti podijeljena je u dvije grupe. Mjereno je vrijeme


(u sekundama) koje je potrebno da preplivaju bazen duljine 100 m.
Rezultati su dani u tablici:

1. grupa 54.35 55.67 55.34 53.78 57.01 56.52 54.09


2. grupa 56.41 53.99 55.56 54.72 55.12 56.73

127
Može li se uz razinu značajnosti α = 0.1 zaključiti da su obje ekipe
jednako brze?

3. Iz intervala [0, 5] generirano je 450 slučajnih brojeva koji su razvrstani


u 5 podintervala:

interval [0, 1) [1, 2) [2, 3) [3, 4) [4, 5]


broj br. 92 86 89 90 93

Da li su frekvencije ravnomjerno rasporedene po intervalima uz razinu


značajnosti α = 0.01 i α = 0.05?

4. U trgovini odjeće anketirali su kupce o preferiranom materijalu odjeće.


Zanima ih da li postoji razlika u odabiru vrste materijala ovisno o dobi.
Dobiveni rezultati su dani u tablici:
P
vrsta materijala/ dob mladi stariji
svila 49 53 102
lan
P 51 44 95
100 97 197

Možete li na osnovu ovih podataka zaključiti da izbor materijala ovisi


o dobi, uz razinu značajnosti 0.005?

5. Anketiranjem 125 osoba dobiveni su sljedeći podaci o vremenu prove-


denom na internetu tokom jednog dana:

provedeni sati [0, 1i [1, 2i [2, 3i [3, 4i [4, 5i [5, 6i


broj osoba 7 34 50 23 9 2

a) Nacrtajte histogram za dobivene podatke, te izračunajte prosječno


vrijeme provedeno na internetu, standardnu devijaciju te vari-
jancu.
b) Koristeći χ2 test sa pragom značajnosti α = 0.01 provjerite
hipotezu o normalnoj razdiobi vremena provedenog na internetu.

6. U cilju ispitivanja nekog svojstva pamučnih vlakana mjerena je njihova


duljina. Podaci su dani u tablici:

duljina u cm [0, 3i [3, 6i [6, 9i [9, 12i [12, 15i


broj vlakana 10 45 61 35 9

128
a) Nacrtajte histogram za dobivene podatke, te izračunajte prosječnu
duljinu vlakana, standardnu devijaciju te varijancu.
b) Uz razinu značajnosti α = 0.01 provjerite hipotezu o normalnoj
razdiobi duljine vlakana.

129
Statističke tablice
Normalna razdioba
Studentova t-razdioba
Hi-kvadrat razdioba (χ2 razdioba)
Fisherova razdioba (F −razdioba)
136
Bibliografija

[1] G. K. Bhattacharyya, R. A. Johnson, Statistical Concepts and Methods,


Wiley, New York, 1977.

[2] B. Dakić, N. Elezović: Matematika 4, Element, Zagreb

[3] F. Daly, D. J. Hand, M. C. Jones, A. D. Lunn, K. J. McConway,Elements


of Statistics, Addison Wesley, Wokingham, England, 1995.

[4] I. Pavlić, Statistička teorija i primjena, Tehnička knjiga, Zagreb,1985.

[5] Ž. Pauše, Uvod u matematičku statistiku, Školska knjiga, Zagreb, 1993.

[6] M. R. Spiegel, L. J. Stephens, Statistics, 3rd Edition, Schaum’s Outli-


neSeries, McGrow-Hill, New York, 1999.

[7] http://www.statsoft.com/textbook/stathome.html

137

You might also like