Professional Documents
Culture Documents
Statistika e Udzbenik
Statistika e Udzbenik
Tekstilno-tehnološki fakultet
Statistika
Zagreb, 2013.
Sadržaj
Predgovor 1
1 Kombinatorika 3
1.1 Motivacijska pitanja . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Princip uzastopnog prebrojavanja . . . . . . . . . . . . . . . . 3
1.3 Kartezijev umnožak skupova . . . . . . . . . . . . . . . . . . . 4
1.4 Varijacije s ponavljanjem . . . . . . . . . . . . . . . . . . . . . 4
1.5 Varijacije bez ponavljanja . . . . . . . . . . . . . . . . . . . . 5
1.6 Zadaci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.7 Permutacije bez ponavljanja . . . . . . . . . . . . . . . . . . . 9
1.8 Permutacije s ponavljanjem . . . . . . . . . . . . . . . . . . . 10
1.9 Kombinacije bez ponavljanja . . . . . . . . . . . . . . . . . . . 11
1.10 Kombinacije s ponavljanjem . . . . . . . . . . . . . . . . . . . 13
1.11 Zadaci za vježbu . . . . . . . . . . . . . . . . . . . . . . . . . 13
2 Vjerojatnost 17
2.1 Dogadaji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.1 Usporedivanje dogadaja . . . . . . . . . . . . . . . . . 18
2.2 Svojstva vjerojatnosti . . . . . . . . . . . . . . . . . . . . . . . 20
2.2.1 Konačni vjerojatnosni prostor . . . . . . . . . . . . . . 20
2.3 Geometrijska vjerojatnost . . . . . . . . . . . . . . . . . . . . 23
2.4 Uvjetna vjerojatnost . . . . . . . . . . . . . . . . . . . . . . . 25
2.4.1 Nezavisni dogadaji . . . . . . . . . . . . . . . . . . . . 28
2.5 Formula potpune vjerojatnosti. Bayesova formula . . . . . . . 28
2.6 Zadaci za vježbu . . . . . . . . . . . . . . . . . . . . . . . . . 31
3 Deskriptivna statistika 33
3.1 Prikazivanje statističkih podataka . . . . . . . . . . . . . . . . 33
3.1.1 Zadaci za vježbu . . . . . . . . . . . . . . . . . . . . . 40
3.2 Parametri niza statističkih podataka (uzorka) . . . . . . . . . 41
3.2.1 Aritmetička sredina uzorka . . . . . . . . . . . . . . . . 41
i
3.2.2 Medijan uzorka . . . . . . . . . . . . . . . . . . . . . . 42
3.2.3 Mod . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.3 Mjere raspršenosti (disperzije)
Uzoračka varijanca i uzoračka standardna devijacija . . . . . . 46
3.4 Zadaci za vježbu . . . . . . . . . . . . . . . . . . . . . . . . . 49
5 Osnovne razdiobe 63
5.1 Diskretne slučajne varijable . . . . . . . . . . . . . . . . . . . 63
5.1.1 Binomna razdioba . . . . . . . . . . . . . . . . . . . . 66
5.1.2 Hipergeometrijska razdioba . . . . . . . . . . . . . . . 69
5.1.3 Poissonova razdioba . . . . . . . . . . . . . . . . . . . 71
5.2 Neprekidne slučajne varijable . . . . . . . . . . . . . . . . . . 72
5.2.1 Normalna razdioba . . . . . . . . . . . . . . . . . . . . 77
5.2.2 Uniformna razdioba . . . . . . . . . . . . . . . . . . . . 86
5.2.3 Gama razdioba . . . . . . . . . . . . . . . . . . . . . . 87
5.2.4 Eksponencijalna razdioba . . . . . . . . . . . . . . . . 87
5.2.5 χ2 -razdioba . . . . . . . . . . . . . . . . . . . . . . . . 88
5.2.6 Studentova t razdioba . . . . . . . . . . . . . . . . . . 89
5.2.7 Fisherova razdioba . . . . . . . . . . . . . . . . . . . . 90
5.3 Zadaci za vježbu . . . . . . . . . . . . . . . . . . . . . . . . . 91
ii
7.2.1 χ2 - test o prilagodbi modela podacima . . . . . . . . . 115
7.2.2 χ2 - test nezavisnosti dviju varijabli . . . . . . . . . . . 125
7.3 Zadaci za vježbu . . . . . . . . . . . . . . . . . . . . . . . . . 127
Bibliografija 137
iii
iv
Predgovor
Ovi nastavni materijali prate nastavni plan i program kolegija Statistika koji
se održava na prvoj godini preddiplomskog studija Tekstilna tehnologija i
inženjerstvo (TTI) na Tekstilno-tehnološkom fakultetu u Zagrebu, te kolegija
Statistika koji se održava na drugoj godini stručnog studija u Varaždinu,
ali su namijenjeni i studentima srodnih fakulteta. Takoder ovi nastavni
materijali su podsjetnik za studente poslijediplomskog studija Tekstilna
znanost i tehnologija na Tekstilno-tehnološkom fakultetu u Zagrebu za kolegij
Odabrana poglavlja iz Matematike.
Sadržaj je podijeljen u 7 cjelina: Kombinatorika, Vjerojatnost, Deskriptivna
statistika, Statistički podaci o dvodimenzionalnom obilježju, Osnovne raz-
diobe, Procjene parametara i Testiranje statističkih hipoteza. Na kraju nas-
tavnih materijala dane su statističke tablice koje se koriste u materijalima.
Zbog predznanja studenata trudile smo se gradivu pristupiti na što pris-
tupačniji način. U svakoj cjelini ukratko je objašnjena teorija te je riješeno
dosta primjera i zadataka kako bi studenti i samostalno mogli savladati nave-
deno gradivo.
Posebno se zahvaljujemo akademiku Josipu Pečariću i prof. dr. sc. Vidosavi
Šimić čija pomoć i savjeti su pridonijeli nastanku ovih nastavnih materijala.
1
2
Poglavlje 1
Kombinatorika
A = {2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 16, 17, 18, 19}
3
Rješenje. Svaki igrač prve ekipe odigrat će tri meča (po jedan meč protiv
svih igrača druge ekipe). Isti broj igara odigrat će i preostala dva igrača iz
prve ekipe. Dakle, ukupni broj igara je 3 · 3 = 9.
4
Primjer 4. Jedan test ima 20 pitanja na koje se odgovara s DA ili NE. Koliko
je mogućnosti popunjavanja testa?
Rješenje. Svaki redak možemo ispuniti na tri različita načina. Ukupan broj
načina ispunavanja sportske prognoze je 313 = 1594323.
1.6 Zadaci
1. Koliko različitih telefonskih brojeva postoji ako su brojevi šesterozna-
menkasti, a prva znamenka nije jednaka nuli?
5
Rješenje. Troznamenkastih brojeva s različitim znamenkama ima
9 · 9 · 8 = 648,
jer prvu znamenku biramo iz skupa {1, 2, ..., 9} (9 mogućnosti),
drugu iz skupa svih znamenki različitih od prve (9 mogućnosti), a
treću znamenku iz skupa svih znamenki različitih od prve dvije (8
mogućnosti).
5. Satničar treba staviti u satnicu jedan sat matematike svaki radni dan
u tjednu. Ako razred ima ponedjeljkom i srijedom 7 sati, utorkom
i četvrtkom 6, a petkom 5 na koliko se načina to može učiniti?
Izračunajte na koliko se načina može staviti jedan sat matematike u
raspored svaki radni dan u tjednu ako matematika ne može biti prvi
sat ponedjeljkom i zadnja dva sata petkom?
Rješenje. Mogućih rasporeda kada matematika može biti bilo koji sat
tijekom dana je: 7 · 6 · 7 · 6 · 5 = 8820, a kad imamo ograničenje poned-
jeljkom i petkom: 6 · 6 · 7 · 6 · 3 = 4536.
6
6. Školska knjižnica sadrži 24 knjige iz matematike, 15 iz fizike, 11 iz
kemije i 18 iz biologije. Na koliko načina učenik može uzeti po jednu
knjigu iz ta četiri predmeta?
7
Rješenje. Podsjetimo se što je dijagonala n-terokuta. To je dužina koja
spaja dva nesusjedna vrha mnogokuta pa uočimo da je odredena s dva
nesusjedna vrha n-terokuta. Prvi vrh možemo odabrati na n načina.
Nakon toga za drugi vrh imamo na raspolaganju n − 3 nesusjedna vrha
(svaki vrh ima dva susjedna vrha i ovdje ne gledamo vrh koji smo već
odabrali za prvi). Ukupan broj uredenih parova je n·(n−3), no ukupan
broj dijagonala je n·(n−3)
2
jer smo svaku dijagonalu brojili dva puta, npr.
par (A,C) odreduje dijagonalu AC kao i par (C,A).
a) ne sadrže znamenku 2
b) sadrže točno jednu znamenku 2
c) sadrže barem jednu znamenku 2?
8
9 načina.
Ako je znamenka na trećem, četvrtom ili petom mjestu, traženih bro-
jeva ima isto kao u drugom slučaju pa zaključujemo da je rješenje ovog
zadatka 6561 + 4 · 5832 = 29889.
(c) Broj peteroznamenkastih brojeva koji sadrže barem jednu zna-
menku 2 izračunat ćemo tako da prebrojimo koliko ima ukupno peteroz-
namenkastih brojeva i koliko ima onih koji ne sadrže znamenku 2. Tada
je rješenje zadatka razlika izmedu ta dva broja, tj. 90000 − 52488 =
37512.
Pn = n · (n − 1) · (n − 2) · · · · · 2 · 1 = n!
Rješenje. (a) Ukupno imamo 8 različitih slova. Svaki raspored slova odreduje
jednu permutaciju pa ima ukupno 8! = 40320 različitih smislenih i besmis-
lenih riječi koje se mogu sastaviti od slova riječi POVIJEST.
9
(b) Svaki suglasnih može doći na jedno od 5 mjesta pa je broj mogućih ras-
poreda suglasnika 5! = 120. Samoglasnici mogu doći na preostala 3 mjesta
pa je broj njihovih razmještaja 3! = 6. Po principu uzastopnog prebrojavanja
ukupni broj riječi je 120 · 6 = 720.
Primjer 10. Na jednu predstavu dolazi pet bračnih parova. Na koliko ra-
zličitih načina oni mogu sjesti na 10 stolica u istom redu ako
a) mogu sjediti po svojoj volji
10
Rješenje. Ovdje je riječ o nizu slova: M,M,A,A,A,T,T,E,I,K. Vidimo da na
raspolaganju imamo 10 slova, ali se neka ponavljaju pa je ukupan broj ra-
10!
zličitih riječi koje možemo napisati jednak = 151200.
3! 2! 2!
Nakon toga biramo dopunski broj na 32 načina jer je ostalo još 32 broja.
39
Ukupan broj različitih načina izbora je 32 · = 492189984.
7
Zadatak možemo riješiti i na drugi način. Ukupan broj različitih načina
izbora je
39 · 38 · 37 · 36 · 35 · 34 · 33
· 32 = 492189984
7!
jer prvi broj biramo po volji pa imamo 39 mogućnosti, drugi biramo izmedu
njih 38 jer nam ih je ostalo 38 itd. Umnožak dijelimo sa 7! jer poredak prvih
7 brojeva nije bitan, a 7! je ukupan broj permutacija 7 brojeva.
11
Primjer 14. Košarkaški tim raspolaže s 3 centra, 4 krila i 5 braniča. Igru
započinje jedan centar, dva krila i dva braniča. Na koliko načina trener može
izabrati početnu petorku?
Rješenje. Centar
možemo izabrati na tri načina (od
3 centra biramo jedan),
4 5
dva krila na = 6 načina, a dva braniča na = 10 načina. Ukupan
2 2
broj različitih početnih postava je
4 5
3· · = 3 · 6 · 10 = 180.
2 2
12
1.10 Kombinacije s ponavljanjem
Neka je S = {a1 , a2 , . . . , an } zadani skup. Svaki r−člani podskup skupa
S u kojem se elementi mogu i ponavljati, a pritom redoslijed elemenata u
r−torci nije bitan, naziva se kombinacija s ponavljanjem r−tog razreda od
n elemenata.
r n+r−1
Broj različitih kombinacija s ponavljanjem jednak je C n = =
r
(n + r − 1)!
.
r! · (n − 1)!
Primjer 16. Neka je S = {1, 2, 3}. Koliko ima kombinacija s ponavljanjem
drugog razreda tog skupa i koje su to kombinacije?
13
4. Koliko ima neparnih četveroznamenkastih brojeva kojima je zbroj zna-
menaka jedinica i desetica jednak četiri i sve znamenke su medusobno
različite?
14
13. Na koliko načina možemo rasporediti 6 plavih kuglica u 10 kutija?
15
16
Poglavlje 2
Vjerojatnost
2.1 Dogadaji
Navedimo najprije oznake i pojmove koje ćemo koristiti. Svaki pokus čiji je
ishod unaprijed odreden nazivamo stohastički pokus. Ishod pokusa ovisi
o nama nepredvidivim okolnostima i stoga je slučajan. Ako bacimo ispravnu
kocku, ona će pasti na jedan od brojeva od 1 do 6 - unaprijed ne znamo na
koji.
Ishod takvog pokusa zovemo elementarni dogadaj i označavamo slovom
ω.
Skup svih elementarnih dogadaja označavamo s Ω. Elementarnih dogadaja
može biti konačno ili beskonačno mnogo.
Dogadaj je podskup skupa Ω. Dogadaje označavamo velikim slovima npr.
A, B, C,. . .
Ω je i sam dogadaj, on se ostvaruje pri svakom ishodu pokusa. Stoga ga
nazivamo siguran dogadaj. Njegova suprotnost je nemoguć dogadaj
(oznaka: ∅).
Primjer 18. Novčić je bačen tri puta. U svakom bacanju bilježimo da li
se pojavilo pismo (P) ili glava (G). Odredite Ω, elementarne dogadaje, te
nekoliko dogadaja vezanih uz ovaj pokus.
17
Rješenje. Elementarnih dogadaja ima 8 (= 23 ). To su:
ω1 = GGG, ω2 = GGP , ω3 = GP G, ω4 = P GG,
ω5 = GP P , ω6 = P GP , ω7 = P P G, ω8 = P P P
Ω = {ω1 , ω2 , ω3 , . . . , ω8 }
Ukupan broj dogadaja vezanih uz ovaj pokus je 28 = 256.
Primjeri dogadaja vezanih uz pokus su:
A = {pismo se pojavilo u prvom bacanju} = {ω4 , ω6 , ω7 , ω8 }
B = {glava se pojavila dvaput} = {ω1 , ω2 , ω3 , ω4 }
C = {pojavilo se barem jedno pismo i barem jedna glava}
= {ω2 , ω3 , ω4 , ω5 , ω6 , ω7 }
Uobičajeno je dogadaje prikazivati Euler-Vennovim dijagramima. Sigu-
ran dogadaj Ω skiciramo obično u obliku nekog pravokutnika.
Ponovimo:
Operacije sa skupovima:
A ∪ B = {x : x ∈ A ∨ x ∈ B} (unija skupova)
A ∩ B = {x : x ∈ A ∧ x ∈ B} (presjek skupova)
A \ B = {x : x ∈ A ∧ x ∈
/ B} (razlika skupova)
Ā = Ac = Ω \ A za A ⊂ Ω (komplement skupa)
18
Dogadaji A i B su disjunktni ako se istovremeno ne mogu ostvariti i jedan
i drugi. Kažemo da se A i B medusobno isključuju.
Primjer 20. Bacamo kocku. Neka je
B = {pao je broj 5}
Tada su A i B disjunktni.
Algebra dogadaja
Familiju svih dogadaja koji se pojavljuju u nekom pokusu označavat ćemo
s F i zvati algebra dogadaja (na dogadajima ćemo moći raditi operacije
nalik na algebarske).
Unija dogadaja - dogadaj koji se ostvaruje ako se ostvario barem jedan od
dogadaja A ili B, oznaka: A ∪ B ili A + B
Presjek dogadaja - dogadaj koji se ostvaruje ako su se ostvarila oba
dogadaja A i B, oznaka: A ∩ B ili AB
Razlika dogadaja - dogadaj koji se ostvaruje ako se ostvari dogadaj A, a
da se ne ostvari dogadaj B, oznaka: A \ B ili A − B
Komplement ili suprotni dogadaj dogadaja A je dogadaj Ω \ A, oznaka:
A ili Ac
Primjer 21. Bacamo jednu kocku. Neka je
19
2.2 Svojstva vjerojatnosti
Vjerojatnost je preslikavanje P : F → [0, 1] definirano na algebri dogadaja
F, koje ima svojstva:
20
Ovakav vjerojatnosni prostor nazivamo klasični vjerojatnosni prostor.
Neka je A bilo koji dogadaj. Da bismo izračunali vjerojatnost dogadaja A,
dovoljno nam je samo znati koliko on elementarnih dogadaja sadrži. Ako je
A = {ωi1 , . . . , ωim }, onda je P (A) = pi1 + · · · + pim = m
n
.
(n je broj svih mogućih ishoda, a m je broj svih povoljnih ishoda)
U klasičnom vjerojatnosnom prostoru vjerojatnost dogadaja računa se
formulom
m broj povoljnih ishoda
P (A) = = .
n broj mogućih ishoda
De Morganovi zakoni
P (A B) = P (A + B)
P (A + B) = P (AB)
21
Primjer 24. Bacamo malo neobičnu kocku, koja na svojim stranama ima
zapisane brojeve 2, 3, 3, 4, 4, 6. Kolika je vjerojatnost sljedećih dogadaja?
C = {pojavio se broj 5}
Ω = {(1, 1), (1, 2), (1, 3), . . . (6, 4), (6, 5), (6, 6)},
Promotrimo sada dogadaj B. Možemo izabrati sve tri plave kuglice ili sve tri
crvene kuglice, pa povoljnih dogadaja za dogadaj B imamo MB = 63 + 43 .
Dakle,
6
+ 43
MB 3 1
P (B) = = 10
= .
N 3
5
Dvije plave kuglice možemo izabrati na 62 načina, a jednu crvenu na 41
23
točka bude izabrana unutar podskupa A jednaka je
m(A)
P (A) = .
m(Ω)
1.0 y=x
0.8
0.6
0.4
0.2
A
0.2 0.4 0.6 0.8 1.0 1.2
2.0
1.5 3
y= -x
2
1.0
0.5
B
0.2 0.4 0.6 0.8 1.0 1.2
1·1
Površina skupa A je m(A) = 2
, pa je vjerojatnost dogadaja A
1
m(A) 1
P (A) = = 2 = .
m(Ω) 1 2
24
Površinu skupa B možemo izračunati tako da od površine skupa Ω oduzmemo
površinu pravokutnog trokuta s katetama 12 i 21 (vidi Sliku 2.2), pa je
1
2
· 12 7 m(B) 7
7
m(B) = 1 − = , pa je P (B) = = 8 = .
2 8 m(Ω) 1 8
6
2 1
P (AB) = 10 = .
2
3
25
Primjer 29. U kutiji se nalazi 6 bijelih i 4 crne kuglice. Izvlačimo jednu po
jednu dvije kuglice.
1. Kolika je vjerojatnost da će druga kuglica biti bijela ako je prva kuglica
bila bijela?
26
Primjer 30. Dva broja x i y biramo na sreću unutar intervala [0, 2]. Kolika
je vjerojatnost da je x > 1 ako je poznato da vrijedi x + y > 2?
Rješenje. Neka su A i B dogadaji
1.5
1.0 B
y=2-x
0.5
2.0
1.5
y=2-x
1.0
AB
0.5
2·2 m(B) 2 1
Površina skupa B je m(B) = 2
= 2, pa je P (B) =
= = .
m(Ω) 4 2
Površinu skupa AB možemo izračunati kao zbroj površine kvadrata
[1, 2] × [1, 2] i površine pravokutnog trokuta (vidi Sliku 2.4), pa je m(AB) =
1·1 3 m(AB) 3
1·1+ = . Dakle, P (AB) = = . Tražena vjerojatnost je
2 2 m(Ω) 8
P (AB) 3
P (A|B) = = .
P (B) 4
27
2.4.1 Nezavisni dogadaji
Dogadaji A i B su nezavisni ako vrijedi P (A|B) = P (A) ili P (B|A) = P (B).
Nužan i dovoljan uvjet za nezavisnost je da vrijedi:
P (AB) = P (A) · P (B).
28
Bayesova formula
P (Hi ) · P (A|Hi )
P (Hi |A) = Pn
j=1 P (Hj ) · P (A|Hj )
3 2 2 3 12
P (A) = · + · = .
5 7 5 7 35
Primjer 34. Ptica slijeće u slučajno izabrano gnijezdo od ukupno tri gnijezda
koja su joj na raspolaganju. Svako gnijezdo sadrži dva jaja i to: u prvom
gnijezdu su oba jaja zdrava, u drugom je jedno zdravo i jedan mućak, a u
trećem su oba jaja mućak. Nadite vjerojatnost da ptica sjedi na mućku. Ako
je sjela na mućak, kolika je vjerojatnost da sjedi u drugom gnijezdu?
Rješenje. Neka su H1 , H2 , H3 i A dogadaji
29
H3 = {ptica slijeće u treće gnijezdo},
A = {ptica sjedi na mućku}.
Vjerojatnosti da ptica sleti u prvo, drugo ili treće gnijezdo su iste pa je
1
P (H1 ) = P (H2 ) = P (H3 ) = . U prvom gnijezdu su oba jaja zdrava
3
pa je vjerojatnost da sjedi na mućku jednaka 0, to jest P (A|H1 ) = 0. U
drugom gnijezdu je jedno jaje zdravo, a drugo je mućak pa je vjerojatnost
1 1
da sjedi na mućku jednaka , to jest P (A|H2 ) = . U trećem gnijezdu
2 2
su oba jaja mućak pa je vjerojatnost da sjedi na mućku jednaka 1, to jest
P (A|H2 ) = 1. Vjerojatnost
Pn da ptica sjedi na mućku dobivamo korištenjem
formule P (A) = i=1 P (Hi ) · P (A|Hi ), dakle
1 1 1 1 1
P (A) = ·0+ · + ·1= .
3 3 2 3 2
Još treba izračunati kolika je vjerojatnost da sjedi u drugom gnijezdu ako je
sjela na mućak, to jest treba izračunati P (H2 |A).
1 1
P (H2 ) · P (A|H2 ) 3
· 2 1
P (H2 |A) = = 1 = .
P (A) 2
3
Primjer 35. U dvije od tri jednake pregrade nalaze se 2 crne i 2 bijele kuglice,
a u trećoj 1 crna i 5 bijelih. Iz slučajno odabrane pregrade izvučena je bijela
kuglica. Kolika je vjerojatnost da je ona izvučena iz treće pregrade?
Rješenje. Neka su H1 , H2 , H3 i A dogadaji
Hi = {kuglica je izvučena iz i − te pregrade}, i = 1, 2, 3
A = {izvučena je bijela kuglica}.
Vjerojatnosti izbora pregrade su jednake pa je P (H1 ) = P (H2 ) = P (H3 ) =
1
. U prvoj i drugoj pregradi su dvije crne i dvije bijele kuglice pa je vjerojat-
3
1 1
nost da izvučemo bijelu kuglicu jednaka , to jest P (A|H1 ) = P (A|H2 ) = .
2 2
U trećoj pregradi je jedna crna kuglica i pet bijelih kuglica pa je vjerojatnost
5 5
da izvučemo bijelu kuglicu jednaka , to jest P (A|H3 ) = . Izračunajmo
6 6
najprije vjerojatnost dogadaja A:
1 1 1 1 1 5 11
P (A) = · + · + · = .
3 2 3 2 3 6 18
Sada možemo izračunati vjerojatnost da je kuglica izvučena iz treće pregrade:
1 5
P (H3 ) · P (A|H3 ) 3
· 6 5
P (H3 |A) = = 11 = = 0.45.
P (A) 18
11
30
Primjer 36. U tvornici se proizvode proizvodi X i Y . Poznato je da se
proizvodi 25% loših proizvoda X i 10% loših proizvoda Y . Proizvodi Y
iznose 60% ukupne proizvodnje. Ako se nasumce uzme loš proizvod, kolika
je vjerojatnost da je to proizvod Y ?
Rješenje. Neka su H1 , H2 i A dogadaji
H2 = {izabran je proizvod Y },
A = {proizvod je loš}.
Proizvodi X iznose 40% ukupne proizvodnje, pa je P (H1 ) = 0.4. Analogno,
proizvodi Y iznose 60% ukupne proizvodnje, pa je P (H2 ) = 0.6 Proizvodi
se 25% loših proizvoda X, pa je P (A|H1 ) = 0.25. Analogno, proizvodi se
10% loših proizvoda Y , pa je P (A|H2 ) = 0.1. Treba izračunati P (H2 |A).
Korištenjem formule
P (Hi ) · P (A|Hi )
P (Hi |A) = Pn
j=1 P (Hj ) · P (A|Hj )
dobivamo
0.6 · 0.1
P (H2 |A) = = 0.375.
0.4 · 0.25 + 0.6 · 0.1
31
3. Pretpostavimo da tenisač uvijek servira negdje unutar protivničkog
polja, kolika je vjerojatnost da je pogodio polje servisa? (Napomena:
dimenzije protivničkog polja su: 11.89m x 8.23m, a dimenzije polja
servisa su 6.4m x 4.115m.)
32
Poglavlje 3
Deskriptivna statistika
fi
fri =
n
33
vrijednost frekvencija relativna frekvencija
a1 f1 fr1
a2 f2 fr2
.. .. ..
. . .
am fm frm
Σ n ≈1
1, 4, 2, 3, 1, 1, 2, 4, 2, 3, 4, 5, 3, 2, 2, 2, 5, 3, 2, 2, 3, 3, 4, 2, 3, 2, 3, 3, 3, 3.
34
Grafikon frekvencija
Na temelju tabličnog prikaza statističkih podataka izraduju se različiti
grafički prikazi.
Grafikon frekvencija: na os apscisa nanesemo podatke, a na os ordinata
odgovarajuće frekvencije
Grafikon relativnih frekvencija: na os apscisa nanesemo podatke, a na
os ordinata odgovarajuće relativne frekvencije.
Spajanjem tih točaka dobije se poligon (relativnih) frekvencija.
Grafikon frekvencija
12
11
10 10
broj studenata
4 4
3
2 2
0
1 2 3 4 5
ocjene
Prikaz ocjena
12 11
10
10
broj studenata
6
4
4 3
2
2
0
1 2 3 4 5
ocjene
35
Strukturni krug (Pie chart)
Ako imamo relativno malo različitih vrijednosti koje statističko obilježje može
poprimiti, onda statističke podatke možemo prikazati pomoću strukturnog
kruga.
Prikaz ocjena
7% 10%
13%
1
2
3
33%
4
5
37%
R
c=
k
(uvijek zaokružujemo na više!)
36
Napomena: Širinu razreda možemo računati i po formuli:
R
c= .
1 + 3.22 log n
R
Tada je broj razreda jednak k = .
c
Primjer 38. Na pismenom ispitu iz statistike dobiveni su sljedeći podaci (broj
bodova):
68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
65 80 73 57 88 78 62 76 53 74
(a) Izvršite grupiranje podataka u razrede te napravite tablicu frekvencija
i relativnih frekvencija.
(b) Nacrtajte histogram.
(c) Analizirajte podatke: najmanji broj bodova, najveći broj bodova, ko-
liko studenata ima više od 86 bodova, itd.
Rješenje. Najprije odredimo najmanji i najveći podatak. Dobivamo xmin =
53 i xmax = 93. Stoga je raspon
√ R = 40. Uočimo da imamo 30 podataka,
pa je n = 30, odnosno k ≈ 30 = 5.48. Dakle, zaokruživanjem na više
dobivamo da je broj razreda k = 6. Zajednička širina razreda
R 40
c= = = 6.7.
k 6
Preostaje nam odrediti razrede. Ako želimo osigurati da nijedan od danih
podataka nije rubni u nekom razredu, lijevi prag prvog razreda odredimo tako
da od xmin oduzmemo 0.05. Dakle, lijevi prag prvog razreda je 52.95, dok
desni prag prvog razreda dobivamo tako da lijevom dodamo širinu razreda
6.7, odnosno dobivamo 59.65. Analogno dobivamo lijeve i desne pragove
preostalih pet razreda.
Sada možemo napraviti tablicu frekvencija i relativnih frekvencija.
Razredi Frekvencije Relativne frekvencije Sredine razreda
I1 = h52.95, 59.65i 3 0.1 56.3
I2 = h59.65, 66.35i 4 0.13 63
I3 = h66.35, 73.05i 6 0.2 69.7
I4 = h73.05, 79.75i 7 0.23 76.4
I5 = h79.75, 86.45i 4 0.13 83.1
I6 = h86.45, 93.15i 6 0.2 89.8
Σ 30 0.99
37
Možemo analizirati podatke: najmanji broj bodova je 53, dok je najveći 93,
više od 86 bodova ima šest studenata.
Nacrtajmo histogram za ove podatke.
Histogram
8
5
frekvencije
0
56,3 63 69,7 76,4 83,1 89,8
Broj bodova
Ostaje još nacrtati histogram za dane podatke. Širina stupića nije proizvoljna
(sada je jednaka širini razreda, tj. c=0.53). Na osi apscisa označimo sredine
razreda.
Histogram
Histogram
14
12
10
frekvencija
8
6
4
2
0
2,08 2,61 3,14 3,67 4,2 4,73 5,26
podaci
39
3.1.1 Zadaci za vježbu
1. Rezultati mjerenja neke veličine su:
138 164 150 132 144 125 149 159 146 158
140 147 136 148 152 144 168 126 138 176
163 119 154 165 146 173 142 147 135 153
140 135 161 145 135 142 150 156 145 128
40 44 37 70 63 45 48 51 53 66
58 62 62 60 48 50 53 67 75 64
48 66 52 55 62 28 57 59 45 67
72 48 50 60 46 60 47 61 28 55
83 34 29 76 61 43 52 75 62 48
Odredite:
40
a) donju granicu 6. razreda, gornju granicu 2.razreda
b) veličinu 3. razreda
c) postotak zaposlenika koji zaraduju više od 3500 kn
d) postotak zaposlenika koji zaraduju više od 3000 kn, a manje od
5000 kn
e) nacrtajte histogram frekvencija
41
Primjer 41. Izračunajte aritmetičku sredinu brojeva 3, 3, 3, 3 i 1, 7, 1.
Rješenje. x̄1 := 41 (3 + 3 + 3 + 3) = 3, x̄2 := 13 (1 + 7 + 1) = 3.
Uočimo da ova dva niza imaju istu aritmetičku sredinu, no takoder je vidljivo
da su članovi prvog niza skoncentrirani u jednoj točki, dok su članovi drugog
niza raspršeni u odnosu na srednju vrijednost. Zaključujemo da na srednju
vrijednost utječu ekstremne vrijednosti.
Primjer 42. U jednom privatnom poduzeću zaposleno je 7 zaposlenika. Nji-
hove plaće iznose redom: 2200kn, 2750kn, 3560kn, 2100kn, 10300kn, 3010kn,
2050kn. Izračunajte prosječnu plaću u tom poduzeću.
Rješenje.
2200 + 2750 + 3560 + 2100 + 10300 + 3010 + 2050 25970
x̄ := = = 3710kn
7 7
Uočavamo da samo zaposlenik s najvećom plaćom ima plaću veću od
prosjeka, dok svi ostali imaju plaće manje od prosjeka.
Svojstva aritmetičke sredine:
(b) 3, 4, 4, 5, 6, 8, 8, 8, 10
42
(c) 5, 5, 7, 9, 11, 12, 15, 180
68 ≤ 72 ≤ 78 ≤ 84 ≤ 87 ≤ 91
n=6=2·3
x(3) + x(4) 78 + 84
m= = = 81
2 2
68 + 72 + 78 + 84 + 87 + 91 480
aritmetička sredina: x̄ = = = 80
6 6
(b) niz je sortiran po veličini i ima 9 članova
n=9=2·5−1
m = x5 = 6
3 + 4 + 4 + 5 + 6 + 8 + 8 + 8 + 10 56
aritmetička sredina: x̄ = = = 6.22
9 9
(c) niz je sortiran po veličini i ima 8 članova
n=8=2·4
x4 + x5 9 + 11
m= = = 10
2 2
5 + 5 + 7 + 9 + 11 + 12 + 15 + 180
aritmetička sredina: x̄ = = 30.5
8
Primijetimo da na medijan utječu samo središnji elementi iz statističkog niza
za razliku od x̄ na kojeg utječu svi podaci. Lijevo i desno od medijana
nalazi se isti broj podataka, odnosno medijan dijeli niz podataka na dva
jednakobrojna dijela.
Medijan uzorka je broj za koji vrijedi da je 50% svih podataka manje od
ili jednako njemu i 50% svih podataka veće od ili jednako njemu.
3.2.3 Mod
Mod je ona vrijednost statističkog obilježja koja se u uzorku javlja s na-
jvećom frekvencijom.
43
Ako svi podaci imaju istu frekvenciju pojavljivanja u uzorku, onda
uzorak nema mod.
(c) 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9
Zadaci
1. Nadite aritmetičku sredinu, medijan i mod niza brojeva:
4 ≤ 7 ≤ 7 ≤ 7 ≤ 9 ≤ 9 ≤ 10 ≤ 12 ≤ 15
n = 9, m = x(5) = 9.
mod = 7
4 + 7 · 3 + 2 · 9 + 10 + 12 + 15 80
x̄ = = = 8.9
9 9
44
(b) Sortirajmo podatke po veličini:
1 ≤ 2 ≤ 3 ≤ 4 ≤ 4 ≤ 5 ≤ 5 ≤ 6 ≤ 6 ≤ 7 ≤ 8 ≤ 8 ≤ 10 ≤ 10 ≤ 11 ≤ 12
1 + 2 + 3 + 2 · 4 + 2 · 5 + 2 · 6 + 7 + 2 · 8 + 2 · 10 + 11 + 12
x̄ =
16
= 6.375.
Aritmetička sredina:
45
3.3 Mjere raspršenosti (disperzije)
Uzoračka varijanca i uzoračka standardna
devijacija
Uzorci s istim srednjim vrijednostima mogu biti posve različiti, stoga nas
zanima i Praspršenost podataka.
Kako je ni=1 (xi − x̄) = 0 kao mjeru raspršenosti ne možemo uzeti mjeru
odstupanja od srednjeP vrijednosti. Možemo promatrati i prosječno apso-
lutno odsutpanje n1 ni=1 |xi − x̄|. To nam daje mjeru odstupanja, ali otežava
računanje zbog apsolutne vrijednosti. P Takoder možemo zbrojiti kvadrate
odstupanja, to jest promatrati s = n−1 ni=1 (xi − x̄)2 .
2 1
Uzoračka varijanca:
n
2 1 X
s = (xi − x̄)2
n − 1 i=1
Vrijedi:
n n
2 1 X 1 X 2
s = (xi − x̄)2 = (x − 2xi x̄ + x̄2 )
n − 1 i=1 n − 1 i=1 i
n n n
! n
!
1 X X X 1 X
= x2 − 2x̄ xi + x̄2 = x2i − 2nx̄2 + nx̄2
n − 1 i=1 i i=1 i=1
n − 1 i=1
n
!
1 X
= x2 − nx̄2
n − 1 i=1 i
46
Koeficijent varijacije:
s
v= (obično se iskazuje u postotcima)
x̄
Standardna pogreška:
s
sx̄ = √
n
Primjer 46. Mjerenjem mase 20 čokolada dobiveni su ovi rezultati u gramima
97 99 98 96 98 101 98 95 97 99
98 96 97 98 98 100 99 97 101 98
Odredite prosječnu masu čokolade, varijancu, standardnu devijaciju, stan-
dardnu pogrešku i koeficijent varijacije.
Rješenje. Napišimo najprije tablicu frekvencija:
xi fi xi − x̄
95 1 -3
96 2 -2
97 4 -1
98 7 0
99 3 1
100 1 2
101 2 3
Σ 20
Prosječna masa:
95 + 2 · 96 + 4 · 97 + 7 · 98 + 3 · 99 + 100 + 2 · 101 1960
x̄ = = = 98 g
20 20
Varijanca:
7
1 X
s2 = fi (xi − x̄)2
n − 1 i=1
1
= (1 · 9 + 2 · 4 + 4 · 1 + 7 · 0 + 3 · 1 + 1 · 4 + 2 · 9)
19
46
= = 2.421 g2
19
√
Standardna devijacija: s = s2 = 1.56 g.
Koeficijent varijacije:
1.56 g
v= = 0.016 = 1.6%.
98 g
47
Standardna pogreška:
s 1.56
sx̄ = √ = √ = 0.35 g.
n 20
Primjer 47. Odredite srednju vrijednost mase (u kg) za 100 zaposlenika os-
iguravajuće kuće za podatke iz tablice:
48
3.4 Zadaci za vježbu
1. Prikupljeni su podaci o broju golova koje je hokejaški tim postigao
igrajući kod kuće tijekom sezone 2006. − 2007.
4 5 2 4 6 5 3 7 1 2 10 5 8 4 3 5 9 3 5 4
8 6 4 8 7 6 5 6 4 4 6 5 3 5 4 3 4 5 5 1
razredi frekvencija
1−5 10
6−9 20
10 − 13 50
14 − 17 12
18 − 21 8
25, 51, 32, 40, 33, 35, 25, 48, 23, 21, 25, 36, 28, 36, 27, 32, 41, 31.
49
5. Anketirano je 80 radnika o udaljenosti koju prelaze na putu do posla.
Rezultati su dani u sljedećoj tablici:
udaljenost (u km) [0, 10i [10, 20i [20, 30i [30, 40i [40, 50i
broj radnika 38 23 5 6 8
50
Poglavlje 4
Statistički podaci o
dvodimenzionalnom obilježju
4.1 Uvod
n n
!
1 X 1 X
s2y = (yi − y)2 = yi2 − ny 2 .
n − 1 i=1 n−1 i=1
Ukupno odstupanje od srednje vrijednosti:
n n
!
1 X 1 X
sxy = (xi − x)(yi − y) = xi yi − nx · y .
n − 1 i=1 n−1 i=1
51
Primjer 48. U jednom razredu od 30 učenika promatra se ocjena iz matem-
atike X i ocjena iz fizike Y , kao dvodimenzionalno statističko obilježje (X, Y ).
Uvidom u imenik dobiveni su sljedeći rezultati:
(1, 3), (4, 3), (2, 2), (3, 2), (1, 2), (1, 1), (2, 2), (4, 4), (2, 2), (3, 3)
(4, 4), (5, 5), (3, 5), (2, 1), (2, 3), (2, 2), (5, 5), (3, 3), (2, 2), (2, 2)
(3, 3), (3, 2), (4, 4), (2, 2), (3, 3), (2, 1), (3, 2), (3, 2), (3, 2), (2, 2).
Tablica frekvencija
P
X/Y 1 2 3 4 5
1 1 1 1 − − 3
2 2 8 1 − − 11
3 − 5 4 − 1 10
4 − − 1 3 − 4
5
P − − − − 2 2
3 14 7 3 3 30
52
frekvenciji f (a, b) u nizu statističkih podataka.
Za svaki niz statističkih podataka možemo formirati pripadnu tablicu
frekvencija koja se obično naziva kontigencijska tablica.
P
X/Y b1 b2 ... bk ... bs
a1 f11 f12 ... f1k ... f1s f1
a2 f21 f22 ... f2k ... f2s f2
.. .. .. .. .. ..
. . . . . .
aj fj1 fj2 ... fjk ... fjs fj
.. .. .. .. .. ..
. . . . . .
ar
P fr1 fr2 ... frk ... frs fr
g1 g2 ... gk ... gs n
ai 1 2 3 4 5 bj 1 2 3 4 5
fi 3 11 10 4 2 gj 3 14 7 3 3
53
1 · 3 + 2 · 11 + 3 · 10 + 4 · 4 + 5 · 2
x= = 2.7
30
1 · 3 + 2 · 14 + 3 · 7 + 4 · 3 + 5 · 3
y= = 2.63
30
5
!
1 X
s2x = fi · a2i − n · x2 = 1.11
29 i=1
5
!
1 X
s2y = gj · bj − n · y 2 = 1.29
29 j=1
5 5
!
1 XX
sxy = fij ai bj − n · x · y = 0.9.
29 i=1 j=1
Svaki unutarnji redak ili stupac može se shvatiti tako kao da je njime
definirana odredena jednodimenzionalna razdioba frekvencija.
Ako izdvojimo treći redak iz prve tablice dobivamo razdiobu frekvencija
vrijednost obilježja Y 1 2 3 4 5
X=3
frekvencija 0 5 4 0 1
54
x(5) = 13 (1 · 3 + 2 · 5+) = 13
3
= 4.33
Dobivene vrijednosti prikažemo grafički i dobijemo krivulje regresije.
5 y
x
0
0 1 2 3 4 5
55
4
y
x
0
0 1 2 3 4
nužni uvjeti su ∂F
∂A
∂F
= 0, ∂B = 0 (parcijalne derivacije).
Rješavanjem ovih jednadžbi dobijemo:
sxy sxy
A = 2 , B = y − 2 x.
sx sx
Jednadžba pravca, koja u smislu metode najmanjih kvadrata najbolje
aproksimira krivulju regresije y = y(aj ), glasi: y = Ax + B, odnosno
sxy sxy
y= 2
x + y − 2 x.
sx sx
Dakle, jednadžba pravca glasi
sxy
y − y = 2 (x − x) (pravac prolazi kroz točku(x, y)).
sx
Na analogan način možemo dobiti i parametre C i D. Pa je druga jednadžba
pravca
sxy
x − x = 2 (y − y).
sy
Ovi pravci nazivaju se pravci regresije. Oba pravca prolaze točkom (x, y).
Kut ϕ koji zatvaraju ti pravci računamo po formuli:
kp1 − kp2
tg ϕ = ,
1 + kp1 kp2
56
gdje je kp1 koeficijent smjera prvog pravca, a kp2 koeficijent smjera drugog
pravca.
Uvodimo oznaku:
sxy
r= , −1 ≤ r ≤ 1.
sx sy
r nazivamo koeficijent korelacije.
Sada kut koji zatvaraju pravci regresije možemo računati po formuli:
1 − r 2 sx sy
tg ϕ = .
r s2x + s2y
Ako je r2 = 1, tj. r = 1 ili r = −1, onda se pravci regresije poklapaju, što
znači da se statistički podaci (x1 , y1 ), (x2 , y2 ), . . . ,(xn , yn ) nalaze na jednom
pravcu. To znači da su podaci o obilježju y linearno zavisni o podacima o
obilježju x.
Ako je r = 0, onda je sxy = 0, pa bi pravci bili y = y i x = x, odnosno
okomiti. U tom slučaju kažemo da su podaci (xi , yi ) linearno nekorelirani.
Općenito,
ako je |r| < 0.5 kažemo da su podaci slabo korelirani
ako je |r| ≥ 0.5 kažemo da su podaci značajno korelirani.
Za r > 0 govorimo o pozitivnoj korelaciji, a za r < 0 o negativnoj
korelaciji.
Napomena 1. Ako je r = 0, onda nema linearne korelacije (povezanosti x i y),
no time nije utvrdeno da ne postoji nikakva statistička povezanost izmedu x i
y. Ta povezanost može biti eksponencijalna, logaritamska, u obliku potencija,
itd.
Primjer 49. Odredite i nacrtajte pravce regresije za ocjene iz matematike i
fizike. Izračunajte i koeficijent korelacije, te kut izmedu pravaca regresije.
Rješenje. Već smo izračunali sve potrebno: x = 2.7, y = 2.63, s2x = 1.11,
s2y = 1.29, sx = 1.05, sy = 1.14, sxy = 0.9.
Stoga su pravci regresije:
y − y = ssxy2 (x − x) x − x = ssxy2 (y − y)
x y
y − 2.63 = 0.81(x − 2.7) x − 2.7 = 0.70(y − 2.63)
y = 0.81x + 0.44 x = 0.70y + 0.86
Koeficijent korelacije:
0.9
r= = 0.75.
1.05 · 1.14
Dakle, podaci su pozitivno i značajno korelirani.
Kut koji zatvaraju ti pravci:
1 − 0.752 1.05 · 1.14
tg ϕ = · = 0.29.
0.75 1.11 + 1.29
57
Dakle, ϕ = 16o 100 2000 .
Na Slici 4.3 su prikazani odredeni pravci regresije.
5
y
x
1 2 3 4 5 6
sxy
Koeficijent korelacije: r = = 0.998, pa su podaci pozitivno i
sx sy
značajno korelirani.
Jednadžba pravca regresije glasi:
442.78
y − 67.3 = (x − 145).
916.7
58
Odnosno,
y = 0.48x − 2.74.
Na Slici 4.4 prikazan je odredeni pravac regresije.
Pravac regresije
100
Iskoristivost procesa
90
y = 0,483x - 2,739
80
70
60
50
40
90 110 130 150 170 190 210
temperatura
59
b) Odredite i nacrtajte pravce regresije, te kut izmedu pravaca regre-
sije.
c) Nacrtajte krivulje regresije.
Rješenje. Računamo prosječnu ocjenu iz matematike u završnom
razredu srednje škole i prosječnu ocjenu iz matematike na fakultetskom
ispitu iz matematike. Dobivamo: x = 3.96, y = 3.51.
Zatim računamo varijance, te ukupno odstupanje od srednje vrijed-
nosti. Dobivamo: s2x = 0.69, s2y = 1.53, sxy = 0.74.
sxy
Koeficijent korelacije: r = = 0.72, pa su podaci pozitivno i
sx sy
značajno korelirani.
Imamo,
1 − r 2 sx sy
tg ϕ = = 0.31.
r s2x + s2y
Dakle, kut izmedu pravaca regresije je ϕ = 17o 130 2400 .
Jednadžbe pravaca regresije:
y = 1.07x − 0.74
x = 0.48y + 2.26
Pravci regresije:
y
4 φ
x
1 2 3 4 5
-1
60
razredu srednje škole iz matematike imaju 2, 3, 4 ili 5. Dobivamo:
y(2) = 1.83, y(3) = 2.16, y(4) = 3.89, y(5) = 4.4
Zatim računamo prosječnu ocjenu iz matematike u završnom razredu
srednje škole za studente koji na fakultetskom ispitu iz matematike
imaju 1, 2, 3, 4 ili 5.
x(1) = 3.08, x(2) = 2.97, x(3) = 3.89, x(4) = 4.16, x(5) = 4.71.
5 y
x
0
1 2 3 4 5
61
2. Podaci o veličini poljoprivrednog zemljišta i godišnjem prihodu za 8
seoskih gospodarstava dani su u sljedećoj tablici:
površina (ha) 1 2 3 4 5 6 7 8
prihod (000 kn) 40 45 68 92 112 132 135 140
Troškovi (kn) 4 4, 5 5 5, 5 6 6, 5 7 7, 5
Dobit (kn) 75, 3 66, 0 57, 1 52, 0 48, 5 45, 2 42, 5 38, 0
62
Poglavlje 5
Osnovne razdiobe
1) pi = P (X = ai )
∞
X
2) pi = 1
i=1
63
Neka je X : Ω → R slučajna varijabla. Funkcija vjerojatnosti od X je
funkcija f : RX → [0, 1] definirana s
f (ai ) := P (X = ai ) = pi
Funkcija distribucije slučajne varijable X je funkcija F : R → [0, 1]
definirana s
F (x) := P (X ≤ x), x ∈ R.
Vrijedi X
F (x) = f (ai ).
ai ≤x
Broj
V[X] := E[X 2 ] − (E[X])2
zove se varijanca diskretne slučajne varijable X.
Standardna devijacija slučajne varijable X je broj
p
σX := + V[X]
xi 1 2 3 4 5
1 5 1 3 1
f (xi ) 12 24 6 8 6
1 5 1 3 1 10
E[X] = 1 · +2· +3· +4· +5· = .
12 24 6 8 6 3
Zakon razdiobe slučajne varijable X 2 dan je s:
2 1 4 9 16 25
X ∼ 1 5 1 3 1 .
12 24 6 8 6
64
1 5 1 3 1 151
E[X 2 ] = 1 · +4· + 9 · + 16 · + 25 · = .
12 24 6 8 6 12
2
2 2 151 10 53
V[X] = E[X ] − (E[X]) = − = .
12 3 36
2. Odredite konstantu a tako da funkcija f dana tablicom bude funkcija
vjerojatnosti slučajne varijable X. Izračunajte E[X] i V [X].
xi −1 0 1 2 3
a a a a a
f (xi ) 2 10 5 4 20
a a a a a
+ + + + = 1,
2 10 5 4 20
10
to jest a = 11
.
Izračunajmo sada očekivanje i varijancu slučajne varijable X sa za-
konom razdiobe:
−1 0 1 2 3
X∼ 5 1 2 5 1 .
11 11 11 22 22
5 1 2 5 1 7
E[X] = −1 · +0· +1· +2· +3· = .
11 11 11 22 22 22
Zakon razdiobe slučajne varijable X 2 dan je s:
2 0 1 4 9
X ∼ 1 7 5 1 .
11 11 22 22
1 7 5 1 43
E[X 2 ] = 0 · +1· +4· +9· = .
11 11 22 22 22
2
43 7 897
V[X] = E[X 2 ] − (E[X])2 = − = .
22 22 484
3. Za slučajnu varijablu X sa zakonom razdiobe
1 2 3 4
X∼ 1 1 1 1
4 4 4 4
65
Rješenje. Za funkciju distribucije vrijedi
X
F (x) = P (X ≤ x) = f (ai ), x ∈ R.
ai ≤x
Dakle,
0,
x<1
1
4, 1≤x<2
F (x) = 21 , 2≤x<3
3
, 3≤x<4
4
1, x ≥ 4.
Dakle,
0, x < −2
1
, −2 ≤ x < −1
5
3 , −1 ≤ x < 0
F (x) = 10
3
5
, 0≤x<1
4
, 1≤x<2
5
1, x ≥ 2.
66
4. Binomna slučajna varijabla broji broj ”uspjeha” k u tih n pokusa.
Slučajna varijabla X ima binomnu razdiobu ili distribuciju s parametrima
n i p ako X poprima vrijednosti iz skupa {0, 1, 2, . . . , n} s vjerojatnostima
n k n−k
P (X = k) = p · q , 0 ≤ k ≤ n,
k
gdje je q = 1 − p. Slučajnu varijablu X koja ima binomnu razdiobu
označavamo s:
X ∼ B(n, p).
Očekivanje binomne razdiobe je E [X] = np.
Varijanca binomne razdiobe je V [X] = npq.
(b) Neka kao u (a) dijelu zadatka slučajna varijabla X označava broj
pojavljivanja broja 6. Tada X ima binomnu razdiobu X ∼
B(10, 61 ). Dogadaj da se barem jednom pojavi broj 6 uključuje
dogadaje da se broj 6 pojavi jednom, dvaput, . . . , deset puta.
Umjesto da računamo P (X ≥ 1) kao P (X = 1) + P (X =
2) + · · · + P (X = 10) jednostavnije je izračunati vjerojatnost
suprotnog dogadaja. Tada je
0 10
10 1 5
P (X ≥ 1) = 1 − P (X = 0) = 1 − · = 0.838.
0 6 6
67
(c) Neka slučajna varijabla X označava broj pojavljivanja neparnog
broja. Vjerojatnost da se pojavi neparan broj jednaka je 12 , pa
je p = 21 . Odnosno, q = 1 − p = 12 . Dakle, X ima binomnu
razdiobu X ∼ B(10, 12 ). Stoga je vjerojatnost da se sedam puta
pojavi neparan broj jednaka
7 3
10 1 1
P (X = 7) = · = 0.117.
7 2 2
(a)
5
P (X = 1) = 0.05 · 0.954 = 0.204.
1
(b)
5
P (X ≤ 1) = P (X = 0)+P (X = 1) = 0.050 ·0.955 +0.204 = 0.977.
0
(c)
5
P (X ≥ 1) = 1 − P (X = 0) = 1 − 0.050 · 0.955 = 0.226.
0
68
5.1.2 Hipergeometrijska razdioba
Osnovna svojstva koja opisuju hipergeometrijsku razdiobu:
nM
Očekivanje hipergeometrijske razdiobe je E [X] = .
N
Napomena. Za dovoljno velike n vrijedi Hg(M, N, n) ≈ B(n, p).
(a)
50 950
1 4
P (X = 1) = 1000
= 0.204.
5
(b)
50 950
0 5
P (X ≤ 1) = P (X = 0) + P (X = 1) = 1000
+ 0.204 = 0.977.
5
(c)
50 950
0 5
P (X ≥ 1) = 1 − P (X = 0) = 1 − 1000
= 0.226.
5
69
2. Odredite očekivani broj dječaka u obitelji s 8 djece pod pretpostavkom
da je spol djeteta jednakovjerojatan. Kolika je vjerojatnost da će se
ostvariti očekivani broj dječaka?
Rješenje. Neka slučajna varijabla X označava broj dječaka. Budući
da je spol djeteta jednakovjerojatan imamo da je p = 12 . Dakle, X ∼
B(8, 12 ). Stoga je očekivani broj dječaka u obitelji jednak
1
E[X] = n · p = 8 · = 4.
2
P (X ≥ 2) = 1 − P (X = 0) − P (X = 1)
7 0 7 7
=1− 0.25 · 0.75 − 0.25 · 0.756 = 0.55.
0 1
70
5.1.3 Poissonova razdioba
Slučajna varijabla X ima Poissonovu razdiobu ili distribuciju s parametrom
λ > 0 ako je funkcija vjerojatnosti te slučajne varijable zadana formulom:
λk −λ
P (X = k) = e , k = 0, 1, 2, 3, . . .
k!
Slučajnu varijablu X koja ima Poissonovu razdiobu označavamo s:
X ∼ P(λ).
71
(b)
P (X > 2) = 1 − P (X = 0) − P (X = 1) − P (X = 2)
80 −8 81 −8 82 −8
=1− ·e − ·e − ·e
0! 1! 2!
= 1 − e−8 (1 + 8 + 32) = 0.9862.
23 −2
P (X = 3) ≈ · e = 0.1804.
3!
Vrijedi:
P (a ≤ X ≤ b) = F (b) − F (a).
Svojstva neprekidne slučajne varijable:
72
(1) Za svaki broj a ∈ R je P (X = a) = 0. Stoga vrijedi
(2)
Z ∞
f (t)dt = P (−∞ < X < ∞) = 1
−∞
gdje je sada Z ∞
2
E[X ] = t2 · f (t)dt.
−∞
1. Dokažite da je funkcija
(a)
(
2 4
9
x − 9
za x ∈ [2, 5]
f (x) =
0 za x ∈
/ [2, 5]
(b)
2
x
za x ∈ [0, 1]
2
f (x) = za x ∈ [1, 2]
3
0 za x ∈
/ [0, 2]
(c)
(
cos x za x ∈ [0, π2 ]
f (x) =
0 / [0, π2 ]
za x ∈
73
Rješenje. (a) Funkcija Rf je funkcija gustoće vjerojatnosti neke slučajne
∞
varijable X ako je −∞ f (x)dx = 1. Kako je
Z ∞ Z 2 Z ∞
Z 5
2 4
f (x)dx = 0 dx + x− dx + 0 dx
−∞ −∞ 2 9 9 5
2 x2 4
5 25 20 4 8
= · − x 2 = − − − = 1,
9 2 9 9 9 9 9
0.6
0.5
0.4
0.3
0.2
0.1
2 4 6 8
Slika 5.1:
Dakle, za x ≤ 2 imamo
Z x Z x
F (x) = f (t)dt = 0dt = 0
−∞ −∞
za 2 ≤ x ≤ 5 imamo
Z x 2 x
2 t2 4
Z Z
2 4
F (x) = f (t)dt = 0dt + t− dt = − |x2
−∞ −∞ 2 9 9 92 9
1
= (x2 − 4x + 4)
9
za x ≥ 5 imamo
Z x Z 2 Z 5 Z x
2 4
F (x) = f (t)dt = 0dt + t− dt + 0dt = 1,
−∞ −∞ 2 9 9 5
74
odnosno
0,
x≤2
F (x) = 19 (x2 − 4x + 4), 2 ≤ x ≤ 5
1, x ≥ 5.
(b)
Z ∞ Z 0 Z 1 Z 2 Z ∞
2 2
f (x)dx = 0 dx + x dx + dx + 0 dx
−∞ −∞ 0 1 3 2
1 2 1 2
= x3 10 + x 21 = + (2 − 1) = 1
3 3 3 3
pa je f funkcija gustoće vjerojatnosti. Graf funkcije f dan je na
Slici 5.2.
1.2
1.0
0.8
0.6
0.4
0.2
-1 1 2 3
Slika 5.2:
za 0 ≤ x ≤ 1 imamo
Z x 0 x
t3 x x3
Z Z
F (x) = f (t)dt = 0dt + t2 dt = | =
−∞ −∞ 0 3 0 3
75
za 1 ≤ x ≤ 2 imamo
Z x 0 1 x
t3
Z Z Z
2 2 2
F (x) = f (t)dt = 0dt + t dt + dt = |10 + t|x1
−∞ −∞ 0 1 3 3 3
1 2 2 2 1
= + x− = x−
3 3 3 3 3
za x ≥ 2 imamo
Z x Z 0 Z 1 Z 2 Z x
2 2
F (x) = f (t)dt = 0dt + t dt + dt + 0dt = 1,
−∞ −∞ 0 1 3 2
odnosno
0,
x<0
x3 ,
0≤x≤1
F (x) = 23 1
x − 3, 1 ≤ x ≤ 2
3
1, x ≥ 2.
Izračunajmo sada očekivanje slučajne varijable X:
Z ∞ Z 0 Z 1 Z 2 Z ∞
3 2
E[X] = xf (x)dx = 0 dx + x dx + x dx + 0 dx
−∞ −∞ 0 1 3 2
1 2 x2 2 1 5
= x4 10 + · 1 = +1= .
4 3 2 4 4
(c) Kako je
π
Z ∞ Z 0 Z
2
Z ∞
f (x)dx = 0 dx + cos x dx + 0 dx
π
−∞ −∞ 0 2
π π
= sin x 0 = sin − sin 0 = 1,
2
2
funkcija f je funkcija gustoće vjerojatnosti. Graf funkcije f dan
je na Slici 5.3.
Izračunajmo funkciju distribucije:
za x ≤ 0 imamo
Z x Z x
F (x) = f (t)dt = 0dt = 0
−∞ −∞
π
za 0 ≤ x ≤ 2
imamo
Z x Z 0 Z x
F (x) = f (t)dt = 0dt + cos tdt = sin t|x0 = sin x
−∞ −∞ 0
76
1.2
1.0
0.8
0.6
0.4
0.2
-2 -1 1 2 3 4
Slika 5.3:
π
za x ≥ 2
imamo
Z x π
Z 0 Z
2
Z x
F (x) = f (t)dt = 0dt + cos tdt + 0dt = 1,
π
−∞ −∞ 0 2
odnosno
0,
x≤0
π
F (x) = sin x, 0 ≤ x ≤ 2
1, x ≥ π2 .
77
Μ-Σ Μ Μ+Σ
Slika 5.4:
FHxL
Slika 5.5:
78
Veza izmedu N (µ, σ 2 ) i N (0, 1) distribucije
Ako u funkciji f (x) gustoće vjerojatnosti distribucije N (µ, σ 2 ) uzmemo sup-
stituciju z = x−µσ
, onda dobivamo funkciju gustoće vjerojatnosti ϕ(z) dis-
tribucije N (0, 1). Dakle, ako X ima N (µ, σ 2 ) distribuciju, onda X ∗ = X−µ
σ
ima N (0, 1) distribuciju. Stoga je P (a ≤ X ≤ b) = P a−µ σ
≤ X ∗
≤ b−µ
σ
=
b−µ a−µ
Φ σ −Φ σ .
Pravilo “3 sigma”
U primjenama najvažnije svojstvo normalne razdiobe je to da je 99.74%
svih vrijednosti slučajne varijable udaljeno od očekivanja (µ) za najviše tri
standardne devijacije (3σ). Stoga možemo smatrati da je dogadaj gotovo
nemoguć ako je za više od 3σ udaljen od očekivanja.
Μ-3Σ Μ Μ+3Σ
Takoder vrijedi
79
Μ-3Σ Μ-2Σ Μ-Σ Μ Μ+Σ Μ+2Σ Μ+3Σ
Slika 5.7:
e) Koliki je očekivani broj studenata viših od 195 cm, ako ima ukupno
3000 studenata?
(a)
175 − 172 ∗ 185 − 172
P (175 ≤ X ≤ 185) = P ≤X ≤
7.5 7.5
∗
= P (0.4 ≤ X ≤ 1.73) = Φ(1.73) − Φ(0.4)
= 0.9582 − 0.6554 = 0.3028.
(b)
∗ 170 − 172
P (X < 170) = P X <
7.5
∗
= P (−∞ ≤ X < −0.27) = Φ(−0.27) = 0.3936.
80
(c)
∗160 − 172
P (X > 160) = P X >
7.5
∗
= P (−1.6 < X ≤ ∞)
= 1 − Φ(−1.6) = 1 − 0.0548 = 0.9452.
(d)
165 − 172 ∗ 180 − 172
P (165 ≤ X ≤ 180) = P ≤X ≤
7.5 7.5
∗
= P (−0.93 ≤ X ≤ 1.07) = Φ(1.07) − Φ(−0.93)
= 0.8577 − 0.1762 = 0.6815.
(e) Očekivani broj studenata viših od 195 cm dobit ćemo tako da ukupan
broj studenata pomnožimo s vjerojatnošću da je pojedini student viši
od 195 cm.
∗ 195 − 172
P (X > 195) = P X >
7.5
∗
= P (3.07 < X ≤ ∞) = 1 − Φ(3.07) = 1 − 0.9989 = 0.0011.
a) manji od 16
b) najmanje 30
81
Rješenje. Neka slučajna varijabla X označava broj proizvoda prve
klase. Budući da je u skladištu od 1000 proizvoda 20% proizvoda prve
klase, vjerojatnost da je proizvod prve klase je 0.2. 100 puta uzimamo
jedan proizvod pa je n = 100. Dakle, X ∼ B(100, 0.2).
Kako je np = 20, slučajnu varijablu X možemo aproksimirati normal-
nom razdiobom N (20, 16) (σ 2 = npq = 100 · 0.2 · 0.8 = 16). Neka
je X ∗ = X−µσ
. Tada X ∗ ima standardnu normalnu razdiobu, to jest
∗
X ∼ N (0, 1).
(a)
0 − 20 ∗ 15 − 20
P (0 ≤ X ≤ 15) = P ≤X ≤
4 4
∗
= P (−5 ≤ X ≤ −1.25)
= Φ(−1.25) − Φ(−5) = 0.1056 − 0 = 0.1056.
(b)
30 − 20 100 − 20
P (X ≥ 30) = P (30 ≤ X ≤ 100) = P ≤ X∗ ≤
4 4
∗
= P (2.5 ≤ X ≤ 20) = Φ(20) − Φ(2.5)
= 1 − 0.9938 = 0.0062.
a) P (X ≤ 1.42)
b) P (−1.37 ≤ X ≤ 2.01)
c) P (X ≥ 1.13)
d) P (|X| ≤ 0.5)
e) P (0.65 ≤ |X|)
Rješenje. (a)
P (X ≤ 1.42) = Φ(1.42) = 0.9222.
(b)
(c)
82
(d)
(e)
a) P (0 ≤ X ≤ t) = 0.4236
b) P (X ≤ t) = 0.7967
c) P (t ≤ X ≤ 2) = 0.1000
Rješenje. (a) P (0 ≤ X ≤ t) = Φ(t)−Φ(0) = Φ(t)−0.5 a to je iz uvjeta
zadatka jednako 0.4236. Dakle, Φ(t) = 0.4236 + 0.5 = 0.9236.
Odnosno, t = Φ−1 (0.9236) = 1.43.
(b) P (X ≤ t) = Φ(t) = 0.7967. Dakle, t = Φ−1 (0.7967) = 0.83.
(c) P (t ≤ X ≤ 2) = Φ(2) − Φ(t) = 0.9772 − Φ(t) = 0.1000. Dakle,
Φ(t) = 0.8772. Odnosno, t = Φ−1 (0.8772) = 1.16.
(a) P (X ≤ t) = 0.14
(b) P (X ≥ t) = 0.975
(c) P (|X − 8| ≤ t) = 0.9
Rješenje. Neka je X ∗ = X−µσ
, gdje je µ = 8, σ = 4. Tada je X ∗ ∼
N (0, 1). Graf funkcije gustoće dan je na Slici 5.8.
(a) P (X ≤ t) = P X ∗ ≤ t−8 t
= 0.14. To jest 4t − 2
4
= Φ 4
− 2 =
−1
Φ (0.14) = −1.08. Dakle, t = 3.68.
t−8 ∗
(b) P (X ≥ t) = P (t ≤ X ≤ ∞) = P 4
≤ X ≤ ∞ = 1 −
t t t
Φ 4 − 2 = 0.975. To jest Φ 4 − 2 = 0.025. Pa je 4 − 2 =
Φ−1 (0.025) = −1.96. Dakle, t = 0.16.
83
4 8 12
Slika 5.8:
(c)
84
Rješenje. V je normalno distribuirana, µ = 170cm, σ = 12.7cm, to
jest V ∼ N (170, 12.72 ). Neka je V ∗ = V σ−µ . Tada je V ∗ ∼ N (0, 1).
Očekivani broj stanovnika s odredenom visinom ćemo dobiti tako da
broj stanovnika pomnožimo s vjerojatnošću da je pojedini stanovnik
odredene visine.
(a)
165.1 − 170 177.8 − 170
P (165.1 ≤ V ≤ 177.8) = P ≤V∗ ≤
12.7 12.7
∗
= P (−0.39 ≤ V ≤ 0.61)
= Φ(0.61) − Φ(−0.39)
= 0.7291 − 0.3483 = 0.3808.
Očekivani broj stanovnika s visinom izmedu 165.1cm i 177.8cm je
800 · 0.3808 = 304.64 ≈ 305.
(b)
182.88 − 170 ∗
P (V ≥ 182.88) = P ≤V ≤∞
12.7
= P (1.01 ≤ V ∗ ≤ ∞) = 1 − Φ(1.01)
= 1 − 0.8438 = 0.1562.
Očekivani broj stanovnika viših od 182.88cm je 800 · 0.1562 =
124.96 ≈ 125.
7. Prema izvješću Auto kluba očekivano vrijeme izmedu poziva i dolaska
do mjesta nesreće je 25 minuta. Pretpostavimo da se radi o nor-
malno distribuiranoj slučajnoj varijabli sa standardnom devijacijom
4.5 minute. Ako slučajno izaberemo 80 poziva, koliki je očekivani broj
poziva na koje će biti reagirano u roku manjem od 15 minuta?
Rješenje. Neka slučajna varijabla T označava vrijeme izmedu poziva i
dolaska do mjesta nesreće. Imamo da je µ = 25min, σ = 4.5min. T
je normalno distribuirana pa je T ∼ N (25, 4.52 ). Neka je T ∗ = T −µσ
.
∗
Tada je T ∼ N (0, 1). Vjerojatnost da je na poziv reagirano u roku
manjem od 15 minuta jednaka je
0 − 25 ∗ 15 − 25
P (T < 15) = P (0 < T < 15) = P ≤T ≤
4.5 4.5
∗
= P (−5.56 ≤ T ≤ −2.22) = Φ(−2.22) − Φ(−5.56) = 0.0132.
Očekivani broj poziva na koje će biti reagirano u roku manjem od 15
minuta je 80 · P (T < 15) = 80 · 0.0132 = 1.056 ≈ 1.
85
5.2.2 Uniformna razdioba
Kažemo da je slučajna varijabla X uniformno distribuirana, ako je ona kon-
tinuirana, RX = R, i ako je funkcija gustoće vjerojatnosti dana formulom
(
1
b−a
, za a ≤ x ≤ b;
f (x) =
0, inače,
gdje su a, b ∈ R.
Pišemo: X ∼ U(a, b).
a+b (b−a)2
Vrijedi: E[X] = 2
, V [X] = 12
.
15 − 0
P (X ≤ 15) = = 0.6
25 − 0
25
(b) Prosječno vrijeme čekanja izmedu dolaska dva tramvaja je E[X] = 2
=
12.5s.
86
5.2.3 Gama razdioba
Kažemo da slučajna varijabla X ima gama razdiobu, ako je ona kontinuirana,
RX = R, i ako je funkcija gustoće vjerojatnosti dana formulom
( b
a
xb−1 e−ax , za x > 0;
f (x) = Γ(b)
0, za x ≤ 0.
R∞
gdje je a > 0, b > 0, Γ(b) = 0 tb−1 e−t dt gama funkcija.
Pišemo: X ∼ Γ(b, 1/a).
gdje je a > 0.
Pišemo: X ∼ E(a).
87
(b) da poziv stigne izmedu 40-te i 80-te s,
(b) Dogadaj ”poziv je stigao izmedu 40-te i 80-te s” možemo zapisati kao
{40 ≤ X ≤ 80}. Računamo vjerojatnost tog dogadaja:
80 40 4 8
P (40 ≤ X ≤ 80) = 1 − e− 70 − (1 − e− 70 ) = e− 7 − e− 7 = 0.2458
5.2.5 χ2 -razdioba
Kažemo da slučajna varijabla X ima χ2 -razdiobu s n stupnjeva slobode, ako
je ona kontinuirana, RX = R, i ako je funkcija gustoće vjerojatnosti dana
formulom n
( 21 ) 2 n2 −1 − 12 x
x e , za x ≥ 0;
f (x) = Γ( n2 )
0, za x < 0,
gdje je n ∈ N.
Oznaka za χ2 -razdiobu s n stupnjeva slobode je χ2 (n), gdje je n ∈ N.
Vrijedi: E[X] = n, V [X] = 2n.
Napomena. Ako je X ∼ Γ n2 , 2 , onda je X ∼ χ2 (n). Takoder, primjetimo
da je χ2 (2) = E 12 .
Za n > 30 vrijedi X ∼ χ2 (n) ≈ N (n, 2n).
88
Zadatak 3. Neka je X slučajna varijabla sa χ2 -razdiobom.
(a) Ako je n = 20, za koji x vrijedi P (X > x) = 0.1?
1 Γ n+1
2 1
f (x) = √ n n+1
nπ Γ 2 2
1 + xn 2
gdje je x ∈ R.
Za n > 1 t-razdioba ima matematičko očekivanje E[X] = 0, a za n > 2 ima
n
i varijancu V [X] = n−2 .
Napomena. Za velike n (npr. n > 100) Studentova t razdioba je gotovo
istovjetna sa standardnom normalnom razdiobom.
Zadatak 4. Neka je X slučajna varijabla sa Studentovom razdiobom.
89
(a) Ako je n = 11, za koji x vrijedi P (X > x) = 0.25?
90
5.3 Zadaci za vježbu
1. Odredite konstantu a tako da funkcija f dana tablicom
xi −5 −3 −1 1 3 5
f (xi ) 17 8
49
a
49
2
7
2
49
1
7
2. Dokažite da je funkcija f
(
1 1
2
x + 2
za x ∈ [−1, 1]
f (x) =
0 za x ∈
/ [−1, 1]
91
(a) Izračunajte vjerojatnost da slučajno odabrani klima uredaj bude
popravljen za manje od 2.5h.
(b) Izračunajte vjerojatnost da slučajno odabrani klima uredaj bude
popravljen za više od 3h.
(c) Koliko je prosječno vrijeme popravka klima uredaja?
10. Vrijeme ispravnog rada mobitela je slučajna varijabla koja ima ekspo-
nencijalnu distribuciju s očekivanjem 2 godine. Kolika je vjerojatnost
da će se mobitel pokvariti
92
Poglavlje 6
93
ristimo uzoračku aritmetičku sredinu:
1
X= (X1 + · · · + Xn ) ,
n
1
E[X] = (E[X1 ] + . . . + E[Xn ])
n
1
= nE X =E X .
n
1
V [X] = V [X1 + . . . + Xn ]
n2
1
= (V [X1 ] + . . . + V [Xn ])
n2
1 V [X]
= 2
n V [X] = .
n n
V [X]
Kako V [X] = n
→ 0, kada n → ∞, zaključujemo da je X konzinstentan
procjenitelj.
n
2 1 X
S = (Xi − X)2 ,
n − 1 i=1
94
Pretpostavljena Oznaka Parametar Procjenitelj Svojstva
razdioba procjenitelja
X
Binomna B(n, p) p p̂ = n
=X Nepristran,
konzistentan
X−µ
• Slučajna varijabla T = S
√
ima Studentovu razdiobu (t-razdiobu) s
n
(n − 1) stupnjeva slobode, tj. T ∼ t(n − 1);
95
Pokažimo kako se odreduju pouzdani intervali kada nemamo pretpostavku
o normalnoj razdiobi.
• Za dovoljno veliko n (npr. n > 30), bez obzira kakvu razdiobu ima
slučajna varijabla X, srednja vrijednost X ima približno normalnu
2
σX
razdiobu s parametrima E[X] = E[X] = µX i V [X] = V [X] n
= n
,
X−µX
tj. Z = σ√X ≈ N (0, 1) (jedna verzija centralnog graničnog teo-
n
rema).
Poissonova P(λ) λ X − ε, X + ε n ≥ 30 q
ε = zα/2 Xn
Zadaci
1. Mjerimo visinu studenata TTF-a. Poznato je da visina studenata TTF-
a ima normalnu razdiobu s varijancom 64cm2 , ali je parametar srednje
vrijednosti nepoznat. Na slučajan način odabrano je 100 studenata
TTF-a i izmjerena im je visina. Zbroj svih dobivenih visina iznosi
96
16910 cm. Kolika je procjena za µ? Procijenite 95% pouzdani interval
za parametar µ na osnovi zadanog uzorka.
Rješenje. Slučajna varijabla X mjeri visinu studenata TTF-a i znamo
da je X ∼ N (µ, 82P ). µ procjenjujemo aritmetičkom
P100 sredinom uzorka
1 n
pa je µ̂ = X = n i=1 xi , gdje je n = 100, a i=1 xi = 16910 cm.
Stoga je µ̂ = 16910
100
= 169.10 cm.
Procijenimo sada 95% pouzdani interval za parametar µ:
α = 1 − 0.95 = 0.05, pa je α/2 = 0.025
σ 2 je poznato (σ = 8) pa koristimo formulu ε = zα/2 √σn .
Iz tablica pročitamo vrijednost zα/2 :
Φ(z0.025 ) = 1 − α2 = 1 − 0.025 = 0.975, pa je z0.025 = 1.96.
8
Uvrstimo dobivene podatke u formulu za ε i dobivamo ε = 1.96 · 10 =
1.57.
U prvom dijelu zadatka smo izračunali da je X = 169.10 pa sad možemo
izračunati 95% pouzdani interval. Dakle,
1
S 2 = (1.22 +0.82 +0.62 +1.12 +1.22 +0.92 +1.52 +0.92 +12 −9 · 1.022 )
8
= 0.0746 mg2 .
97
σ 2 je nepoznato pa koristimo formulu ε = tα/2 (n − 1) √Sn .
Iz tablice pročitamo da je tα/2 (n − 1) = t0.01 (8) = 2.896. Sada imamo
sve potrebno za izračunati ε, pa je ε = 2.896 · 0.27
3
= 0.26 mg. Dakle,
98
4. Zanima nas postotak pušača u populaciji 18−godišnjaka. Na slučajan
način odabran je uzorak duljine 7383 iz te populacije. U uzorku je bilo
32.8% pušača. Procijenite 95% pouzdani interval za postotak pušača u
toj populaciji.
Rješenje. Slučajna varijabla X označava postotak pušača u populaciji
18−godišnjaka i vrijedi X ∼qB(n, p). Imamo n = 7383 > 40, pa ε
računamo po formuli ε = zα/2 X(1−X) n
. U uzorku je bilo 32.8% pušača,
pa je X = 0.328.
α = 1 − 0.95 = 0.05, odnosno α/2 = 0.025.
Iz tablica pročitamo vrijednost zα/2 :
Φ(z0.025 ) = 1 − α2 = 1 − 0.025 = 0.975, pa je z0.025 = 1.96.
Uvrstimo dobivene podatke u formulu za ε i dobivamo
r
0.328 · (1 − 0.328)
ε = 1.96 · = 0.011.
7383
Dakle, 95% pouzdani interval je:
99
Iz tablica pročitamo vrijednost zα/2 :
Φ(z0.005 ) = 1 − α2 = 1 − 0.005 = 0.995, pa je z0.005 = 2.58.
Znamo da je σ = 3, a za ε uzmemo najveći dozvoljeni ε, pa možemo
izračunati
√ n.
n = zα/2 σε = 2.58 · 0.583
= 13.34. Pa je n = 178.08. Dakle, treba
planirati uzorak veći ili jednak 179.
7. Inženjer želi procijeniti prosječno vrijeme potrebno za sastavljanje neke
elektroničke komponente. Koliki uzorak treba uzeti da bi mogao biti
95% siguran da je greška u procjeni srednjeg vremena manja od 0.25
minuta? Standardna devijacija vremena sastavljanja je 0.45 minuta.
Rješenje. Da bi greška u procjeni srednjeg vremena bila manja od 0.25
minuta mora vrijediti da je duljina intervala [X − ε, X + ε] manja od
0.25, odnosno 2ε < 0.25. Dakle, ε < 0.125.
σ 2 je poznato (σ = 0.45) pa koristimo formulu ε = zα/2 √σn .
α = 1 − 0.95 = 0.05, pa je α/2 = 0.025.
Iz tablica pročitamo vrijednost zα/2 :
Φ(z0.025 ) = 1 − α2 = 1 − 0.025 = 0.975, pa je z0.025 = 1.96.
Za
√ ε uzmemo ε = 0.125, pa možemo izračunati n.
σ 0.45
n = zα/2 ε = 1.96 · 0.125 = 7.057. Pa je n = 49.79. Dakle, inženjer
treba uzeti uzorak veći ili jednak od 50.
100
b) Uz razinu značajnosti α = 0.05 testirajte hipotezu da je tvrdnja
proizvodača istinita.
101
102
Poglavlje 7
103
Primjer 52. Kocka se baca 60 puta. Rezultati su dani u tablici:
Broj na kocki 1 2 3 4 5 6
Broj pojavljivanja 13 19 11 8 5 4
Da li je kocka ispravna?
H0 je točna H0 je netočna
√
prihvaćamo H0 pogreška 2. vrste
√
odbacujemo H0 pogreška 1. vrste
104
Vjerojatnosti tih pogrešaka označavamo s:
α = P(pogreška 1. vrste)= P(odbacujemo H0 | H0 točna) i
β = P(pogreška 2. vrste)= P(prihvaćamo H0 | H0 netočna).
Sljedeća tablica prikazuje vjerojatnosti mogućih situacija
H0 je točna H0 je netočna
prihvaćamo H0 1−α β
odbacujemo H0 α 1−β
(1 ) Definirati H0 i H1 ;
105
7.1 Parametarski testovi
Neka je θ nepoznati parametar o kojemu ovisi pretpostavljena razdioba. Tada
možemo testirati slijedeće hipoteze:
(i) H : θ = θ0 (ii) H : θ 6= θ0 (iii) H : θ > θ0 (iv) H : θ < θ0
Uz svaku od od navedenih hipoteza definiramo alternativnu iz iste skupine,
ovisno o zadatku koji rješavamo. Ako je hipoteza tipa (ii) govorimo o dvos-
tranoj hipotezi tj. o dvostranom testu, a za slučajeve (iii), (iv) o jed-
nostranoj hipotezi tj. o jednostranom testu.
H0 : µ = 30
H1 : µ = 38 > 30
106
√
Računamo vrijednost test-statistike prema formuli Z = X̄−µ σ
n.
Imamo µ = 30, σ = 10, n = 105, X̄ = 38. Dakle, Z = 8.1976.
Iz tablice za normalnu razdiobu čitamo zα = z0.01 = Φ−1 (1 − 0.01) =
Φ−1 (0.99) = 2.33, pa je kritično područje C0 = [2.33, ∞i. Budući da
je Z ∈ C0 odbacujemo nultu hipotezu u korist alternativne.
broj nedostataka 1 2 3 4 5 6 7 8 9 10
broj m2 tkanine 15 12 15 22 15 8 5 3 3 2
H0 : µ = 5
H1 : µ < 5
1 · 15 + 2 · 12 + 3 · 15 + 4 · 22 + 5 · 15 + 6 · 8 + 7 · 5 + 8 · 3 + 9 · 3 + 10 · 2
x̄ =
100
= 4.01
√
pa je vrijednost test-statistike Z = 4.01−52
100 = −4.95
Iz tablice za normalnu razdiobu čitamo zα = z0.01 = Φ−1 (1 − 0.01) =
Φ−1 (0.99) = 2.33, pa je kritično područje C0 = h−∞, −2.33]. Budući
da je Z ∈ C0 odbacujemo nultu hipotezu u korist alternativne, tj. za-
ključujemo da ova vrsta tkanine zadovoljava uvjete standarda uz razinu
značajnosti 0.01 jer je u uzorku broj nedostataka po 1m2 tkanine manji
od 5.
107
3. Proizvodač tvrdi da je dimenzija serijski radenog proizvoda 35mm.
Mjerenjem 20 slučajno odabranih proizvoda dobiveni su rezultati:
s = 0.167,
√
pa je vrijednost test-statistike T = 35.07−35
0.167
20 = 1.897.
Iz tablice za studentovu razdiobu čitamo t 2 (n−1) = t0.025 (19) = 2.093,
α
108
Rješenje. Neka je X slučajna varijabla koja označava prosječan vijek
trajanja proizvoda. Imamo X ∼ N (µ, σ 2 ), n = 6.
Postavljamo hipoteze:
H0 : µ = 21.5
H1 : µ < 21.5
19 + 18 + 22 + 20 + 16 + 25
x̄ = = 20
6
X − p0 √
Z=p n ≈ N (0, 1).
p0 (1 − p0 )
109
1. Proizvodač tvrdi da njegove pošiljke sadrže najviše 5% neispravnih
proizvoda. Uzet je slučajni uzorak od 300 komada iz jedne pošiljke
i bilo je 16 neispravnih. Da li možemo prihvatiti tvrdnju proizvodača
uz razinu značajnosti 0.05?
Rješenje. Neka je X slučajna varijabla koja označava postotak neis-
pravnih proizvoda. Imamo X ∼ B(300, p). Postavljamo hipoteze:
H0 : p = 0.05
H1 : p < 0.05
Kada bi za alternativnu hipotezu postavili H1 : p 6= 0.05, u slučaju
odbacivanja nulte hipoteze mogli bi zaključiti samo da proporcija neis-
pravnih nije 0.05, a to može značiti da je veća, ali i da je manja od te
vrijednosti što je još bolje.
Odredimo kritično područje:
110
Test statistika je:
S12
F =
S22
1
f1− α2 (n1 − 1, n2 − 1) = .
f (n2 − 1, n1 − 1)
α
2
H0 : µ1 = µ2
H1 : µ1 6= µ2 , H1 : µ1 > µ2 , H1 : µ1 < µ2 .
111
Nulta hipoteza Test statistika Alternativna Kritično područje
hipoteza
H1 : µ1 6= µ2 C0 = h−∞, −z α2 ]∪
X̄1 −X̄2
H0 : µ1 = µ2 Z= r
2
σ1 σ2
[z α2 , ∞i
n1
+ n2
2
σ12 i σ22 Z ∼ N (0, 1) H1 : µ1 > µ2 C0 = [zα , ∞i
poznato
H1 : µ1 < µ2 C0 = h−∞, −zα ]
H1 : µ1 6= µ2 C0 = h−∞, −t α2 (n1 + n2 − 2)]
X̄1 −X̄2
H0 : µ1 = µ2 T = q
1
∪[t α2 (n1 + n2 − 2), ∞i
S· n
+ n1
1 2
(n1 −1)S12 +(n2 −1)S22
σ12 = σ22 = σ 2 S2 = n1 +n2 −2
H1 : µ1 > µ2 C0 = [tα (n1 + n2 − 2), ∞i
nije poznato
T ∼ t(n1 + n2 − 2) H1 : µ1 < µ2 C0 = h−∞, −tα (n1 + n2 − 2)]
H0 : σ12 = σ22
H1 : σ12 6= σ22
H0 : µ1 = µ2
H1 : µ1 6= µ2
112
Najprije izračunamo S 2 = 0.108. Zatim računamo vrijednost test-
X̄1 −X̄2
statistike: T = q 1 1
= −1.075.
S· n1
+n
2
Iz tablice za studentovu razdiobu čitamo t0.05 (6) = 1.943 pa je kritično
područje C0 = h−∞, −1.943] ∪ [1.943, ∞i. Budući da T ∈ / C0 nema
razloga da odbacimo nultu hipotezu uz razinu značajnosti α = 0.1.
Zaključujemo da obje metode daju istu točnost uz razinu značajnosti
α = 0.1.
4.a 57 60 63 59 62 60 58 56 54 62
4.b 58 62 60 56 63 58 61 57 53 61
H0 : σ12 = σ22
H1 : σ12 6= σ22
S12
F = = 0.8822.
S22
A grupa 70 75 80 80 85 90 85
B grupa 75 90 95 100 80 85
113
Da li se uz razinu značajnosti 0.1 može smatrati da je uspjeh u obje
grupe isti?
Rješenje. Najprije provodimo F -test, odnosno usporedbu varijanci.
Postavljamo hipoteze:
H0 : σ12 = σ22
H1 : σ12 6= σ22
Imamo n1 = 7, n2 = 6. Računanjem dobivamo sljedeće: X̄1 =
80.71, X̄2 = 87.5, S12 = 46.05, S22 = 87.5. Računamo vrijednost test-
S2
statistike: F = S12 = 0.517.
2
Iz tablice za Fisherovu razdiobu čitamo f0.05 (6, 5) = 4.95 i f0.95 (6, 5) =
1 1
f0.05 (5,6)
= 4.39 = 0.228 pa je kritično područje C0 = h0, 0.228] ∪
[4.95, ∞i. Budući da F ∈ / C0 nema razloga da odbacimo nultu hipotezu
uz razinu značajnosti α = 0.1.
Sad provodimo t-test, odnosno usporedbu očekivanja.
Postavljamo hipoteze:
H0 : µ1 = µ2
H1 : µ1 6= µ2
Računamo S 2 = 64.89 odnosno S = 8.06. Zatim računamo vrijednost
X̄1 −X̄2
test-statistike: T = q 1 1
= −1.514.
S· n1
+n
2
Iz tablice za studentovu razdiobu čitamo t0.05 (11) = 1.796 pa je kritično
područje C0 = h−∞, −1.796] ∪ [1.796, ∞i. Budući da T ∈ / C0 nema
razloga da odbacimo nultu hipotezu uz razinu značajnosti α = 0.1.
Zaključujemo da uz razinu značajnosti α = 0.1 možemo smatrati da je
uspjeh u obje grupe isti.
7.2 χ2 -test
Jedan od prvih statističkih testova je χ2 -test. Predložio ga je K. Pearson
1900. godine, pa je poznat i pod nazivom Pearsonov test. χ2 − test je
neparametarski test. Pomoću χ2 -testa testiramo nultu hipotezu da obilježje
X ima odredenu (teorijsku) razdiobu protiv alternativne da nema tu raz-
diobu. Isto tako pomoću χ2 -testa ispitujemo nezavisnost dva statistička
obilježja, kao i homogenost populacija. Za sve navedeno test-statistika je
(općenito):
k
X (fi − fti )2
H=
i=1
fti
114
gdje su fi eksperimentalne, a fti teorijske frekvencije.
Ako je za neki i očekivana (teorijska) frekvencija fti < 5 združimo
taj razred sa susjednim(a) razredom(ima) tako da novodobiveni
razred zadovoljava uvjet da mu je očekivana frekvencija barem 5.
Uz pretpostavku da je H0 točna hipoteza za velike n (n → ∞)
H ≈ χ2 (r − l − 1)
P (H > χ2 (r − l − 1)|H0 ) = α.
C0 = [χ2α (r − l − 1), ∞i
Broj na kocki 1 2 3 4 5 6
Broj pojavljivanja 13 19 11 8 5 4
115
Statističko obilježje je X ≡ broj na kocki. Prirodno je ispitati da li se iz
tablice frekvencija može zaključiti da empirijska razdioba bitno ne odstupa
od teorijske diskretne uniformne razdiobe (vjerojatnosti pojavljivanja svakog
broja na kocki su jednake, tj. broj pojavljivanja -frekvencija svakog broja u
60 bacanja je 10). Stoga definiramo hipoteze:
H0 : X ima diskretnu uniformnu razdiobu i
H1 : X nema diskretnu uniformnu razdiobu.
Ako je H0 istinita hipoteza onda bi funkcija vjerojatnosti obilježja X bila:
1 2 3 4 5 6
X∼ 1 1 1 1 1 1 .
6 6 6 6 6 6
(fi −fti )2
fi fti fti
13 10 0.9
19 10 8.1
11 10 0.1
8 10 0.4
5 10 2.5
P 4 10 3.6
60 60 15.6
116
H0 : ” Proizvodač je u pravu” i
H1 : ” Proizvodač nije u pravu”.
Kako bismo izračunali vrijednost odgovarajuće test-statistike trebaju
nam teorijske frekvencije. Njih računamo po formuli fti = npi gdje je
pi odgovarajuća vjerojatnost. Formirajmo tablicu:
(fi −fti )2
fi fti ft i
40 25 9
432 460 1.704
P 28 15 11.267
500 500 21.971
interval [0, 0.2) [0.2, 0.4) [0.4, 0.6) [0.6, 0.8) [0.8, 1]
broj br. 32 44 38 42 44
117
(fi −fti )2
fi fti ft i
32 40 1.6
44 40 0.4
38 40 0.1
42 40 0.1
P 44 40 0.4
200 200 2.6
udaljenost (km) [0, 2i [2, 4i [4, 6i [6, 8i [8, 10i [10, 12i [12, 14i
broj radnika 5 10 20 33 18 10 4
118
Postavljamo (nultu) hipotezu da slučajna varijabla X koja mjeri udal-
jenost od kuće do posla ima distribuciju X ∼ N (6.9, 8.03), odnosno
alternativnu hipotezu da X nema distribuciju X 6∼ N (6.9, 8.03).
Sljedeći korak je odrediti teorijske frekvencije fti = n · pi , gdje je
n = 100. Neka je Z = X−µσ
. Tada je
0 − 6.9 2 − 6.9
p1 = P (0 ≤ X < 2) = P √ ≤Z< √
8.03 8.03
= Φ(−1.73) − Φ(−2.43) = 0.0418 − 0.0075
= 0.0343 ≈ 0.03 ⇒ ft1 = n · p1 = 100 · 0.03 = 3
2 − 6.9 4 − 6.9
p2 = P (2 ≤ X < 4) = P √ ≤Z< √
8.03 8.03
= Φ(−1.02) − Φ(−1.73) = 0.1539 − 0.0418 = 0.1121 ≈ 0.11
⇒ ft2 = 11
p3 = P (4 ≤ X < 6) = P (−1.02 ≤ Z < −0.32)
= Φ(−0.32) − Φ(−1.02) = 0.2206 ≈ 0.22 ⇒ ft3 = 22
p4 = P (6 ≤ X < 8) = P (−0.32 ≤ Z < 0.39)
= Φ(0.39) − Φ(−0.32) = 0.2772 ≈ 0.28 ⇒ ft4 = 28
p5 = P (8 ≤ X < 10) = P (0.39 ≤ Z < 1.09)
= Φ(1.09) − Φ(0.39) = 0.2104 ≈ 0.21 ⇒ ft5 = 21
p6 = P (10 ≤ X < 12) = P (1.09 ≤ Z < 1.8)
= Φ(1.8) − Φ(1.09) = 0.102 ≈ 0.10 ⇒ ft6 = 10
p7 = P (12 ≤ X < 14) = P (1.8 ≤ Z < 2.51)
= Φ(2.51) − Φ(1.8) = 0.0299 ≈ 0.03 ⇒ ft7 = 3
Budući je ft1 < 5 i ft7 < 5, spojit ćemo prva dva i posljednja dva
razreda, pa će tako ostati ukupno 5 razreda. Dakle, r = 5. Formiramo
tablicu:
(fi −fti )2
fi fti fti
15 14 0.071
20 22 0.182
33 28 0.893
18 21 0.429
P 14 13 0.077
100 ≈ 100 1.652
119
Vrijednost test-statistike je prema tome
5
X (fi − fti )2
h= = 1.652,
i=1
fti
a
χ2α (r − l − 1) = χ20.05 (2) = 5.99,
pa kako je h < χ20.05 (2), nultu hipotezu ne možemo odbaciti, odnosno
zaključujemo da se radi o uzorku iz normalno distribuirane populacije.
k
!
1 X
σ̂ 2 = s2 = x̄2i · fi − n · x̄2
n−1 i=1
32 · 10 + 52 · 47 + 72 · 63 + 92 · 30 + 112 · 20 − 170 · 7.042
=
169
= 4.6
X ∼ N (7.04, 4.6)
120
dok je alternativna da X nema distribuciju N (7.04, 4.6). Sljedeći korak
je odrediti teorijske frekvencije fti = 170 · pi . Neka je Z = X−µ
σ
. Tada
je
2 − 7.04 4 − 7.04
p1 = P (2 ≤ X < 4) = P √ ≤Z< √
4.6 4.6
= Φ(−1.42) − Φ(−2.35) = 0.0778 − 0.0094 = 0.0684 ≈ 0.07
⇒ ft1 = 170 · 0.07 = 11.9
p2 = P (4 ≤ X < 6) = P (−1.42 ≤ Z < −0.48)
= Φ(−0.48) − Φ(−1.42) = 0.2378 ≈ 0.24 ⇒ ft2 = 40.8
p3 = P (6 ≤ X < 8) = P (−0.48 ≤ Z < 0.45)
= Φ(0.45) − Φ(−0.48) = 0.358 ≈ 0.36 ⇒ ft3 = 61.2
p4 = P (8 ≤ X < 10) = P (0.45 ≤ Z < 1.38)
= Φ(1.38) − Φ(0.45) = 0.2426 ≈ 0.24 ⇒ ft4 = 40.8
p5 = P (10 ≤ X < 12) = P (1.38 ≤ Z < 2.31)
= Φ(2.31) − Φ(1.38) = 0.0734 ≈ 0.07 ⇒ ft5 = 11.9
Formiramo tablicu:
(fi −fti )2
fi fti fti
10 11.9 0.303
47 40.8 0.942
63 61.2 0.053
30 40.8 2.859
P 20 11.9 5.513
170 ≈ 170 9.67
a
χ2α (r − l − 1) = χ20.05 (2) = 5.99,
pa kako je h > χ20.05 (2), nultu hipotezu odbacujemo, odnosno za-
ključujemo da se ne radi o uzorku iz populacije s normalnom distribu-
cijom uz razinu značajnosti 0.05.
121
5. U jednom trgovačkom centru 200 puta je registriran broj kupaca u 10
sekundi.
Dobiveni su rezultati:
broj kupaca 0 1 2 3 4
broj mjerenja 109 65 22 3 1
122
Budući je ft3 < 5 i ft4 < 5, a i ft3 + ft4 < 5, spojit ćemo zadnja tri
razreda, pa će tako ostati ukupno 3 razreda. Dakle, r = 3. Formiramo
tablicu:
(fi −fti )2
fi fti fti
109 108.6 0.001
65 66.2 0.022
P 26 25 0.04
200 ≈ 200 0.063
a
χ2α (r − l − 1) = χ20.1 (1) = 2.71,
pa kako je h < χ20.1 (1), pa nema razloga da ne prihvatimo nultu
hipotezu, odnosno zaključujemo da se radi o uzorku iz populacije s
Poissonovom distribucijom uz razinu značajnosti 0.1, odnosno s vjero-
jatnošću 0.9.
xi 0 1 2 3 4
fi 116 56 22 14 2
X ∼ P(0.714)
123
dok je alternativna da X nema distribuciju P(0.714). Sljedeći korak je
odrediti teorijske frekvencije fti = 210 · pi .
0.7140 −0.714
p0 = P (X = 0) = e = 0.4897
0!
⇒ ft0 = 102.84
0.7141 −0.714
p1 = P (X = 1) = e = 0.3496
1!
⇒ ft1 = 73.42
0.7142 −0.714
p2 = P (X = 2) = e = 0.1248
2!
⇒ ft2 = 26.21
0.7143 −0.714
p3 = P (X = 3) = e = 0.0297
3!
⇒ ft3 = 6.24
0.7144 −0.714
p4 = P (X = 4) = e = 5.30 · 10−3
4!
⇒ ft4 = 1.11
Budući je ft4 < 5, spojit ćemo zadnja dva razreda, pa će tako ostati
ukupno 4 razreda. Dakle, r = 4. Formiramo tablicu:
(fi −fti )2
fi fti fti
116 102.84 1.684
56 73.42 4.133
22 26.21 0.676
P 16 7.35 10.18
210 ≈ 210 16.673
a
χ2α (r − l − 1) = χ20.05 (2) = 5.99,
pa kako je h > χ20.05 (2), pa odbacujemo nultu hipotezu, odnosno za-
ključujemo da se ne radi o uzorku iz populacije s Poissonovom distribu-
cijom uz razinu značajnosti 0.05, odnosno s pouzdanošću 95%.
124
7.2.2 χ2 - test nezavisnosti dviju varijabli
Neka je (X1 , Y1 ), (X2 , Y2 ), . . . (Xn , Yn ) slučajni uzorak za dvodimenzionalno
diskretno statističko obilježje (X, Y ) i neka je pritom:
Skup vrijednosti obilježja X :
RX = {a1 , . . . , ar };
RY = {b1 , . . . , bs };
Nadalje,
fij : frekvencija od (ai , bj ) u uzorku
fi : (marginalna) frekvencija od ai u uzorku
gj : (marginalna) frekvencija od bj u uzorku
Vrijedi:
s
X r
X
fi = fij , gj = fij
j=1 i=1
Označimo:
pij = P (X = ai , Y = bj )
pi = P (X = ai )
qj = P (Y = bj )
Hipoteze su:
H0 : X i Y su nezavisna obilježja i
125
H1 : X i Y su zavisna obilježja, tj.
H0 : pij = pi · qj za sve i i j, a
H1 : postoje i, j takvi da pij 6= pi · qj
Uz pretpostavku da je H0 točna hipoteza , procjene za pi i qj su:
fi gj
p̂i = , qˆj =
n n
Očekivane (teorijske) vrijednosti ftij od fij uz H0 su:
fi gj f i · gj
ftij = n p̂i qˆj = n · · =
n n n
Test-statistika je:
r X s
X (fij − ftij )2
H=
i=1 j=1
ftij
Ako je H0 istinita, onda za n → ∞:
H ≈ χ2 ((r − 1) · (s − 1)),
gdje χ2 ((r − 1) · (s − 1)) označava χ2 −razdiobu s ((r − 1) · (s − 1)) stupnjeva
slobode.
Za zadanu pogrešku prve vrste α, kritično područje odredujemo iz uvjeta
P (H > χ2 ((r − 1) · (s − 1))|H0 ) = α.
Dakle, kritično područje je:
C0 = [χ2α ((r − 1) · (s − 1)), ∞i,
gdje χ2α ((r − 1) · (s − 1)) čitamo iz tablica. Ako s h označimo vrijednost test
statistike izračunate iz uzorka, onda nultu hipotezu odbacujemo ako
h ∈ C0 tj. h ≥ χ2α ((r − 1) · (s − 1)).
1. U cilju ispitivanja uspješnosti na kolokvijima iz statistike interesira
nas da li prolaznost na drugom kolokviju ovisi o prolaznosti na prvom
kolokviju. Za slučajno odabranih 120 studenata dobiveni su podaci
dani u tablici. Možete li na osnovu ovih podataka zaključiti da uspjeh
na drugom kolokviju ovisi o uspjehu na prvom kolokviju, uz razinu
značajnosti 0.01?
P
1. kolokvij/ 2. kolokvij Položili Pali
Položili 45 25 70
Pali
P 20 30 50
65 55 120
126
Rješenje. Neka je X = prolaznost na prvom kolokviju, a Y = pro-
laznost na drugom kolokviju.
RX = RY = {”položio”, ”pao”}
Testiramo:
H0 : X i Y su nezavisna obilježja,
uz alternativnu
H1 : X i Y su zavisna obilježja.
Test statistika je:
127
Može li se uz razinu značajnosti α = 0.1 zaključiti da su obje ekipe
jednako brze?
128
a) Nacrtajte histogram za dobivene podatke, te izračunajte prosječnu
duljinu vlakana, standardnu devijaciju te varijancu.
b) Uz razinu značajnosti α = 0.01 provjerite hipotezu o normalnoj
razdiobi duljine vlakana.
129
Statističke tablice
Normalna razdioba
Studentova t-razdioba
Hi-kvadrat razdioba (χ2 razdioba)
Fisherova razdioba (F −razdioba)
136
Bibliografija
[5] Ž. Pauše, Uvod u matematičku statistiku, Školska knjiga, Zagreb, 1993.
[7] http://www.statsoft.com/textbook/stathome.html
137