You are on page 1of 90

~5b:;J

VELEUCILISTI
U VARAlOINt
IZDAVAC:
31 I<t.G'; Damira Kecek
Veleuciliste u Varazdinu, 1. Krizanica 33

AUTORI:

Damir Modrie
Damira Kecek, dipl. ing.
Marko Stojie
doc. dr. BC. Damir Modric

doc. dr. Be. Marko Stojic

RECENZENTI:

rnr. SC. Zoran Pusic

doc. dr. sc. Sanja Kovac

LEKTOR:
Ljiljana Sarec, prof.

NAKLADA:
VJEROJATNOST I

, 200 primjeraka

TEHNICKI UREDNIK:
STATISTIKA

Dean Valdec, dipL ing.

Objavljivanje ovoga udzbenika odobrilo je Stmcno vijece u VaraZdinu

odlukom od 20. ozujka 2012. godine,

klasa: 602-04/12-07/6, ur.br.: 2186-0231-12-09-1

ISBN 978-953-7809-11-9

CIP zapis dostupan u racunalnom katalogu


Nacionalne i Bveucilisne knjifuice u Zagrebu
pod brojem 821190

© Veleuciliste u Varazdinu, VaraZdin 2012.


VELEUCILISTE U VARAZDlNU

1. izdanje
Varazdin, 2012.

Predgovor

Koristenje i razumijevanje statistike i statistickih procedura vjestine su


potrebne gotovo svakoj struci i akademskoj disciplini. Statistika je neapho"
dan kolegij za studente svih dodiplomskih studija. Ovaj udzbenik nastao
je iz predavanja i auditornih kolegija Statistika koji se predaje na
studijima Veleucilista u Varazdinu. Svrha mu je da pomogne studentima
savladati osnovne statisticke pojmove i tehnike te osigurati njihovu prirr_jenu
u stvarnom zivotu.
U udzbeniku je demonstrirana primjena teorije vjerojatnosti za dobi­
.'." vanje uvida 0 stvarnim, svakodnevnim statistiCkim problemima i sit-laci­
jama. Pazljiv prikaz teorije vjerojatnosti potice modele vjerojatnosti s:;var­
nih pojava i statisticke postupke koji slijede. Ovaj pristup rezultira ~ntu­
itivnim razumijevanjem statistickih procedura i strategija koje najcesce ko­
riste inzenjeri i znanstvenici.
Provedena diskusija je stroga s paZljivo motiviranim definicijama, teo­
remima i dokazima, namijenjena publici cija matematicka pozadina nije vrlo
jaka i koji ne trebaju detalje i matematieku dubinu slienih knjiga napisanih
za matematicare iIi statisticare. Problemi na kraju svakog poglavlja po­
moei ee citateljima da izvjezbaju logicko razmisljanje. Da bi sto bolje odgo­
varao raznolikoj skupini potencijalnih korisnika, primjeri i problemi u cvom
udzbeniku izabrani su iz razlieitih izvora.

Antori
Sadrzaj

Predgovor

Uvod vii

1 Kombinatorika
1
1.1 Permutacije . . . . . . . . . . . . . . 5

,J"
1.1.1 Permutacije bez ponavljanja . 5

1.1.2 Permutacije s ponavljanjem 6

1.2 Varijacije . . . . . . . . . . . . . 7

1.2.1 Varijacije bez ponavljanja 7

1.2.2 Varijacije s ponavljanjem 9

1.3 Kombinacije............ 10

1.3.1 Kombinacije bez ponavljanja 11

1.3.2 Kombinacije s ponavljanjem . 12

1.4 Zadaci za vjezbu . . . . . . . . . . . 13

2 Vjerojatnost 16

2.1 Osnovni pojmovi teorije vjerojatnosti . . . . . . . . . . . 16

2.1.1 Slucajan pokus i prostor elementarnih dogadaja . 16

ii iii

SADRZAJ SADRZAJ v
iv

2.1.2 Operacije i odnosi medu dogaaajima . . . . . . 18


3.5 Cebisevljeva nejednakost, Bernoullijev zakon velikih brojeva

20
i Centralni granicni teorem 77

2.2 Definicije vjerojatnosti ~ . . . . . . . . . . . . . . . . .


2.2.1 Klasicna definicija vjero jatnosti (vjero jatnosti

3.6 Zadaci za vjezbu .. 81

a priori) . . . . . . . . . . . . . . . . . . . . . . 20

4 Deskriptivna statistika 85

2.2.2 Statisticka definicija vjerojatnosti (vjerojatnost

a posteriori) . . . . . . . . . . . . . . 21
4.1 Osnovno 0 statistici. . . . . . . . . . 85

2.2.3 Aksiomatska definicija vjerojatnosti 22


4.2 Grupiranje i grafiCki prikaz podataka 87

2.2.4 Svojstva vjerojatnosti 23


4.3 Srednje vrijednosti ..... 93

2.3 Uvjetna i potpuna vjerojatnost 29


4.3.1 Aritmeticka sredina . 94

2.3.1 Nezavisni dogadaji 32


4.3.2 Mod .. 97

2.4 Zadaci za 35 r
'.~ 4.3.3 Medijan 98

4.4 Mjere rasprsenosti (disperzije) . :01


3 Slucajne varijable 38
4.4.1 Raspon varijacije 101

3.1 Diskretna slucajna varijabla . . . . . . . . . . . 40


4.4.2 Varijanca .... 102

3.1.1 Ocekivanje diskretne slucajne varijable . 44


4.4.3 Standardna devijacija
,j 103

3.1.2 Varijanca i standardna devijacija diskretne slucajne


4.4.4 Koeficijent varijacije 103

varijable .. 46

4.5 Zadaci za vjezbu 105

3.2 Diskretne razdiobe . . . . 47

3.2.1 Binomna razdioba 47

3.2.2 Poissonova razdioba 51


j'
... 5 Procjena parannetara
5.1 Tockovna procjena
108

108

3.3 Neprekidna slucajna varijabla 55


I
5.2 Intervalna procjena . 112

3.3.1 Ocekivanje, varijanca i standardna devijacija


5.2.1 Intervalna procjena ocekivanja f1 normalne razdiobe

neprekidne slucajne varijable 62

uz poznatu varijancu . . . . . . . . . . . . . . . . . . 113

3.4 Neprekidne razdiobe . . . . 64


5.2.2 Intervalna procjena ocek~vanja j.t normalne razdiobe

3.4.1 Uniformna razdioba 64


uz nepoznatu varijancu 114

3.4.2 :;(! razdioba . . . . . 66


5.2.3 Intervalna procjena vjerojatnosti 116

3.4.3 Normalna razdioba . 68


5.3 Zadaci za vjezbu • • * • ~ • • • • • • •119


6 Testiranje statistickih hipoteza 121
6.1 Testiranje hipoteze 0 parametru ocekivanja
normalne distribucije uz poznatu varijancu . . . . . . . . .
123
6.2 Testiranje hipoteze 0 parametruocekivanja
normalne distribucije uz nepoznatu varijancu . ~ .. . . 126
6.3 Testiranje hipoteze 0 parametru ocekivanja
131
Dvod
proizvoljne distribucije na osnovi velikog uzorka
6.4 X2 test . . . . . . 132
6.5 Zadaci za vjezbu 141
Postoje tri vrste laZi: laz, prokleta laz i statistika.
144 Disraeli 1
7 Korelacija i regresija
144 Statisticko razmisljanje ce jednoga dana biti potrebno za ucinkovito voaenje
7.1 Korelacijska analiza . . . . . . . . . . .

drzave kao i sposobnost Citanja i pisanja.


7.1.1 Pearsonov koeficijent korelacije 145
H. G. Wells2
7.2 Regresijska analiza 149
Statistika je disciplina koja se bavi prikupljanjem, analizom, interpretaci­
7.3 Zadaci za vjezbu 154 jom i prezentacijom podataka, te metodama kojima se donose zakljucci na
temelju podataka. 8tatistiCka metodologija se koristi uzorkom naSeg mis­
r
8 Malo povijesti... 155 ljenja 0 temama u rasponu od umjetnosti do zoologije. Koristi se i u po­
duzecima i industriji kako bi se nadzirala kvaliteta roba i usluga koje ani
159 proizvode. 80c1010zi i psiholozi koriste statisticke metode za proucavanje
Prilozi
nai3eg ponaSanja. Zbog sirokog spektra primjene, statistika se koristi u
Literatura
164 disciplinama kao sto su sociologija, psihologija, kazneno pravo, biologija,
medicina, sestrinstvo, prirodne i tehniCke znanosti, farmacija, obrazovanje
itd.
U podrucju statistike sve se vrti oka donosenja odluka,· a odluka se
temelji na grupi kvantiziranih podataka. Statisticari stalna postavljaju pi­

lBenjamin Disraeii, 1. grof od Beaconsfielda (1804. 1881.), britanski premijer,


parlamentarni zastupnik, konzervativni drzavnik i knjizevni Uk.
2Herbert George Wells (1866. - 1946.), engleski pisac, najpoznatiji po svom radu u
zanru znanstvene fantastike. Plodan pisac i u mnogim drugim zanrovima, ukljucujuci i
suvremene romane, povijesti, politike i socijalne komentare itd. Zajedno s Jules Verne­
om, Wells se naziva ocem znanstvene fantastike.

vii
viii UVOD UVOD ix

tanja 0 tome sto nam brojke govore, koji su trendovi, koja predviaanja Npr., politicki analitiear moze koristiti podatke iz dijela glasaekog
mozemo uciniti, koje zakljuCke mozemo izvuci. Da bi odgovorili na ova za predvidanje politicke preferencije cijelog glasaCkog tijela. IIi, gradsko
pitanja, statisticari su razvili niz analitickih alata koji pomazu da nademo vijece moze odlueiti gdje ce izgraditi novu pistu zracne luke na temelju
smisao u brdima podataka te da razumijemo brojeve koje smo generira izvjestaja 0 utjecaju gradnje na okoJis, te od demografskih izvjestaja
tijekom naSeg rada. BuduCi da su intenzivni izracuni cesto sastavni dio ukljucuju razne statistiCke podatke. Vjerojatnost i statistika prozimlju se
statistickog skupa alata, Ijudi su u zabludi kada misle da se statistika bavi naSim svakodnevnim zivotom. Odlikuju naSe kladenje na Ijude, zivotinje i
samo analizom brojeva. Analiza brojeva samo je jedan mali dio puta ka strojeve. Mozda rijee kladionica nije tako elegantna kao sto je donosenje
donosenju ispravne odluke. odiuka, ali Ijudi se klade na svoja ulaganja na usjeve i stoku iii se klade
Tcorija vjcrojatnosti je grana matematike koja se bavi dogadajima na svoje tvornice s obzirom na njihove strojeve i proizvodnju. Osiguranje
se ponavljaju, a Cije je pojavljivanje iIi nepojavljivanje predmet slucajnostl od rizika je nepredvidivo za pojedinacne slucajeve, ali je predvidljivo za
vjerojatnosti potela je u 17. stoljecu u Francuskoj kada su se dva grupe. Izrazi lito je naCin na koji se lopta odbija od podal! iIi kako se
velika francuska matematicara, Blaise Pascal i Pierre de Fermat, slozili oko "kolaeic 'l'aspadne kad ga zagrizemo" pokazuju prihvacanje nepredvidivosti
dva problema vezana uz igre na srecu. Problemi poput ovih koje su Pas­ dogadaja. Postizanje osnovnog razumijevanja 0 vjerojatnosti i statistici
cal i Fermat rijesili utjecali su na istrazivace kao sto Sll Huygens, Bernoulli moze biti dug put ka poboljsanju vlastite srece. Takoder se moze pokazati
i DeMoivre II uspostavljanju matematicke teorije vjerojatnosti. Danas je zaSto se i lose i dobre stvari dogadaju i losim i dobrim ljudima, zasto se
teorija vjerojatnosti afirmirana grana matematike koja nalazi primjenu u moze donijeti odlicna odluka i pritom patiti od nesretnog ishoda te zai5to
svim podrucjima znanstvene aktivnosti, od glazbe do fizike, te u svakod­ se moze donijeti losa odluka koja rezultira sretnim ishodom. VeCina Ijudi
nevnom iskustvu od prognoze vremena i predvidanja rizika novog medicin­ razumije uzasne posljedice iz straSnih odluka i izvrsne posljedice iz odIicnih
.J
skog tretmana. Teorija vjerojatnosti je slozena matematiCka teorija koja odlucivanja.
nadilazi domete i potrebe ovog udzbenika. U ovoj knjizi dane su osnovne
Citalac vjerojatno vec zna nesto 0 statistici. Ako Citate novine, pretrazu­
ideje vjerojatnosti i osnovne tehnike potrebne za izgradnju nekih bazicnih
jete internet, gledate vijesti na televiziji iii pratite sport, cesto cete vidjet i
statistiCkih modela.
cuti rijec statistika. Uvest cemo dvije glavne vrste statistike: deskriptivnu
Na sto asocira rijec statistika? Za veCinu ljudi sugerira numericke ci­ i inferencijalnu statistiku. Takoder cemo uvesti terminologiju koja nam
njenice ili podatke kao sto su podaci 0 nezaposlenosti, cijeni prehrambenih pomaze razlikovati razlicite vrste statistickih istraZivdJlja. Deskriptivna se
proizvoda iii broju brakova i razvoda. Dvije su zajedniCke definicije rijeci statistika sastoji od metoda za organiziranje i sumiranje informacija. Ona
statistika: obuhvaca izgradnju grafikona i tablica i izracune razIieitih deskriptivnih
mjera kao sto su prosjeci mjere varijacije i s1. Inferencijalna statistika se
1. Cinjenice ili podaci, bilo numeriCki iii nenumericki, organizirani i sazeti sastoji od metoda za odredivanje i mjerenje pouzdanosti zakljucaka 0 po­
kako bi se osigurale korisne i dostupne informacije 0 odredenoj terni na temelju informacija dobivenih iz uzorka populacije. Deskriptivna
2. znanost organiziranja i sumiranja numericke ili nenumeriCke informa­ i inferencijalna statistika medusobno su povezane. Gotovo uvijek moraju
cije se koristiti tehnike deskriptivne statistike da bi organizirali i saZeli infor­
macije dobivene iz uzorka prije obavljanja deduktivne analize.
StatistiCari analiziraju podatke u svrhu donosenja odluka i generaliza- preliminarne deskriptivne analize uzorka cesto otkrivaju znacajke koje ce
ll{ UVOD UVOD
xi

vas dovesti do izbora (iIi preispitivanjc odgovarajuce deduktivne ako ne i nemoguce, precizno definirati. Nasumicnost je ncgativno svojstvo
metode. pokazuje nedostatak obrasca u pojavama i a priori promatranja)
Slueajni iii stohastieki proces je matematicki model za fenomen kOJl se fenomen.
u vremenu na nepredvidljiv [latin s gledista promatraea. Pojava
moze biti niz realnih mjerenja napona iIi temperature, binarnog toka po-­
dataka s raeunala, modulirani binarni protok podataka od modema, niz
bacanja kovanica, dnevni prosjek Dow Jones indeksa itd. Ona moze biti
nepredvidijiva zbog uCinaka kao sto su smetnje iIi sum u komunikacijskim
vezama iii mediju za pohranu. Teorija slucajnih procesa kvantificira gornje
pojmove tako da se mogu kcinstruirati matematiCki modeli stvarnih feno­
mena koji 8U jednostavni i smisleni te daju kOl'isna predvidanja buduceg
ponailanja. Jednostavnost je potl'ebna da bi inzenjer (iIi bilo tko drugi)
mogao izvoditi analize i sinteze slucajnih procesa. Smislenost je uvjet da
su modeli dobra aproksimacija stvarnog fenomena. Previse pojednostavlje­
ni model moze dati rezultate i zakljuCke koji se ne mogu primijeniti na
pl'avi fenomen. Previse slozeni modelmoze ograniciti potencijal primjenc,
teorija postaje previse teska da bi bila kOl'isna te dovodi do opterecenja
raeunalnih resursa koje imamo na raspolaganju. Znacajka koja mozda naj­
••J
vise pokazuje razliku izmedu prosjecnog i izvanrednog inzenjera je njegova
sposobnost da uCinkovito izvede model koji pruza dobru ravnotezu izmedu
slozenosti i tocnosti. Fenomeni vjerojatnosti sveprisutni su kod vremenske
prognoze, rekreativnog kladenja na lutriji i sportu, kod poslovnih spajanja,
trzista dionica, u industriji. GlavIlo pitanje je gdje lezi pojam vjerojatnosti:
u naSem sustavu vjerovanja iIi u samoj eksperimentalnoj pojavi.
U stanovitom smislu Ijudi se mogu sloziti u odredenim aspektima vjero­
jatnosne pojave. Ako kovanicu bacamo 10 000 puta u Americi i takoder 10
000 puta. u Aziji, ocekujemo da ce novae pokazati sliene distribucije fI glave fl
i !!pisma". Slucajnost ishoda je funkcija kovaniee, a ne vjerovanja Ijudi. U
drugom smislu Ijudska vjerovanja se razlikuju sto svjedoCi razlika u
kod oklade. Pretpostavimo da ste se kladili da ce kovanica pasti na !!pismo fl
i da vam kazu, dok je kovanica u zraku, da ona ima dvije "glave ". Tada
vas sustav vjerovanja 1110ze prouzrociti promjenu predvidanja u
iako kovanica nije promijenjena. Cak i pojam nasumienosti je tesko,
Poglavlje 1

Kombinatorika

U svakida.snjem zivotu vrlo eesto cujemo rijeci kombinirati iIi kombi-


Ti pojmovi su gotovo svakome manje iIi vise poznati. Tako se npr.
na nogometnoj utakmici gavori 0 kombinacijama napada ili obranej slikar
govori a ugodnim kombinacijama bojaj u privredi se govod 0 uspjeloj kom­
binaciji asortimana; kemiear govod 0 kombinacijama elemenata ili spojeva
.~
i dr. Postoji medutim i grana matematike koia se zove kombinatorika iIi
znanost 0 kombinacijama.
Za uvod spomenimo rijeCi koje je Jacob Bernoulli rekao u svom djelu
Cini poeetke raeuna vjerojatnosti (liArs conjectandP', Basel 1713): "Besko­
naena raznolikost koja se pokazuje kako u tvorevinama prirode tako i u
Ijudskim djelima i koja eini osobitu Ijepotu svemira ocito i nema ni u eemu
drugome svoj uzrok oaim u raznovrsnosti spojeva, mjesavini iIi grupiranju
pojedinih dijelova. Kako je broj onoga ato utjeee na stvaranje neke pojave
iIi nekog dogadaja eesto tako velik i tako raznovrstan da upoznavanje svih
naeina po kojima se moze, odnosno ne moze izvesti to spajanje, mije.~anje iIi
grupiranje, nailazi na najvece teskoce, nije eudo ato i najmudriji i
ne padaju tako cesto ni u jednu pogresku, kao u pogresku koja
se u lOgIC! zove nedovoljnim nabrajanjem dijelova. Stoga se ne ustrucavam
ustvrditi da je ta pogreaka gotovo jedini izvor vrlo mnogih zabluda u koje

xii 1
2 Kombinatorika
3

svakodnevno upadamo pri promatranju pojava ako ih nastojimo upoznati i Rijec kombinatorika dolazi od latinske rijeci combinaTe = slagati. Kom­
njima se koristiti. 1I binatorika je grana matematike koja proucava odredena svojstva konacnih
Pokusajmo odgovoriti na pitanje cimo se bavi znanost 0 kombinacijama skupova.
iii kombinatorika. Iz aritmetike znamo da je osnovna i prvobitna operacija
operacija brojenja. Bez poteskoce cemo izbrojiti predmete u nekom skupu: Tipicni kombinatorni problemi:
npr. ovee u stadu, jabuke u kosari, studente na ispitu itd. Treba samo
svakom objektu te grupe pridruziti po redu jedan broj iz skupa prirodnih 1. Koliko razliCitih telefonskih brojeva postoji kojima prva znamenka nije
brojeva: 1,2,3,4,5,6, ... Ovakvo brojenje nece ciniti teskoce ni onda kad jednaka nuli, a brojevi su sesteroznamenkasti?
imamo i puno objekata, trebat ce samo vise vremena. Medutim, postoje i
skupovi elemenata i ako su ti elementi rasporedeni u odredene grupe 2. Na koliko naCina moze cetvero Ijudi za okrugli stol?
na razliCite naCine, tu operacija brojenja nije tako jednostavna.
3. Na koliko nacina se moze izvuci 6 brojeva od 45 u igri LOTO?
Primjer za ovaj problem kao i njegovo rjesenje, samo u drugom ruhu, dali
su prije dvjestotinjak godina Leonhard Euler 1 i Nicolaus Bernoulli. 2 Radilo 4. Koliko ima sesteroznamenkastih brojeva koji su parni i kojima su sve
se 0 II zamijenjenim pismima ll • Netko pise n pisama i ima n omotnica s znamenke razliCite?
adresama. Na koliko naeina moze staviti pismo u pogreSnu omotnicu? Iz
ovoga primjera mozemo razabrati da brojenje nije bilo lako ako su elementi
bili rasporedeni uz postavljene uvjete. Pri tome je brojenje moglo postati Rjesavanje ovakvih problema temelji se na osnovnom principu prebro­
..,.. dosta tesko, mnogo teze nego sto je npr. brojenje ovaca u stadu Hi knjiga u javanja koji glasi:
biblioteci. Izbrojiti deset knjiga na jednoj polici nije problem. Drukciji je
slucaj da je na polici deset knjiga, a mi zelimo doznati na koliko se razlicitih Ako biramo po jedan element iz svakog od m zadanih skupova A 1 , A2, Am "'j

naCina one mogu razmjestiti najprije bez ikakvog posebnog uvjeta, a zatim pri cemu sImp Al sadrZi nl elemenata, A2 sadrzi n2 elemenata, ... , a Am
po nekom odredenom redu (naslovu, imenu autora, abecednim redom itd.). sadrzi nm elemenata, tada razlicitih odabira ima n1 . n2 ..... 1tm.
Moze se postaviti pitanje 0 broju raz!icitih skupina Hi grupa koje se
Primjer 1.1. Iz Gakovca u Varazdin vode tri ceste, a iz Varaidina u Zagrab
mogu naciniti od danih predmeta uz odredene uvjete koji su razliCiti od
cetiri ceste. Na koliko se nacina tim cestama maze doti iz Gakovca preko
slucaja do slucaja. Npr., koliko jc nacina na koje mozemo podijeliti karte u Varaidina u Zagreb?
nekoj kartaskoj igri?
Rjesenje:

lLeonhard Euler (1707. - 1783.), ~vicarski matematicar i fiziCar. Dosao do vaznih


otkrica u poljima kao sto su infinitezimalni racun i teorija grafova. Uveo je modernije
Oznaeimo ceste iz Cakovca u Varazdin skupom A {ar, a2, a3} , a ceste iz
matematicke termine i oznake, posebno u matematiCkoj analizi, kao sto je pojam matema­ VaraZdina u Zagreb skupom B = {bI, b2, b3, b4}.
ticke funkcije. Poznat je i po svom radu u mehanici, dinamici fluida, optici i astronorniji.
2Nicolaus Bernoulli (1695. - 1726.), svicarski matematicar. Radio je uglavlIom na
problemima krivulja, diferencijalnim jednadZbama i vjerojatnostii pridonio dinamici flu­
ida.
4 Kombinatorika 1.1 Permutacije 5

Zagreb a) Uredeni parovi elemcnata skupa A kod kojih se elemen-;i unutar para ne
Q
I
Varazdin bl ponavljaju su:
Cakovec
(1,2), (2,1), (1, 3), (3,1), (2,3), (3,2).
b1
Q2 h3 Prva komponenta uredenog para moze 'se odabrati na tri razliCita naeina.
Kako se elementi unutar para ne smiju ponavljati, nakon :zbora prve kom­
Q3 b4
ponente za odabir druge komponetne preostaju dvije mogucnosti. Na
nacin se dobiva ukupno 3·2 = 6 uredenih parova iz skupa .4 bez ponavljanja.
Slika 1.1.
b) Kako se elementi skupa A unutar para smiju ponavljati, prva kompo­
Cestu iz Cakovca u Varazdin mozemo odabrati na tri razlicita naCina, a menta para se moze izabrati na tri nacina kao i druga, pa je broj uredenih
cestu iz Varazdina u Zagreb na cetiri razlicita nacina. Svi naCini putovanja parova kod kojih se elementi skupa A mogu ponavljati 8 . 3 9. To su
iz Cakovca preko Varazdina u Zagreb su tada (slika sljedeci parovi:
albl alb2 alba Q'lb4
1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2).(3,3).
a2bl a2b2 azba a2 b4
./
a3bl a3b2 a3b3 a3 b4
Prema osnovnom principu prebrojavanja ukupan traZeni broj naeina puto­
~. vanja jednak je 3 . 4 = 12. ./ 1.1 Permutacije
Primjer 1.2. Koliko postoji razlicitih cetveroznamenkastih brajeva?
1.1.1 Permutacije bez ponavljanja
Rjesenje\;
1. naCin: Prvi cetveroznamenkasti broj je 1000, a posljednji 9999. Od 1000 Jedan od osnovnih pojmova kombinatorike je pojam permutacije. Pret­
do 9999 ima 9999-1000+1=9000 brojeva. postavimo da imamo n razliCitih elemenata. Tih n elemena~a mozemo pore­
dati u konacan niz na vise razliCitih naCina. Svaki takav niz zove se per­
2. naCin: Prva znamenka se moze izabrati na 9, a ostale tri na 10 razliCitih mutacija, a dvije se permutacije razlikuju same po redoslijedu elemenata.
nacina. Ukupan broj razlicitih mogucnosti je 9 . 10 . 10 . 10= 9000. ./
Neka je S n-clani skup ciji su elementi medusobno razliCiti. Per­
Primjer 1.3. Zadan je skup A {I, 2, 3}. mutacija bez ponavljanja n-clanog skupa je svaki niz od n medusobno
a) Koliki je braj uredenih para va elemenata skupa A kod kojih se elementi razliCitih elemenata skupa S.
unutar para ne ponavljaju?
b) Koliki je broj uredenih parova elemenata skupa A (bez ogranicenja, dakle Primjer 1.4. Na kaje sve razlicite nacine mogu Mario, Ana i Tea stati u
dementi se mogu i ponavljati)? red?

Rje8enje: Rjesenje:
6 Kombinatorika 1.2 Varijacije 7

Na prvo mjesto u redu moze stati bilo koja od tri osobe. Kada je prvo Cetiri slova koja su meausobno razliCita mozemo poredati u niz na 4! naCina.
mjesto popunjeno, drugo mjesto moze zauzeti jedna od preostale i:i.V''ije oso­ Kako su slova A meausobno jednaka, permutacijom slova A meausobno
be, a kada su prva dva mjesta zauzeta, posljednje, trece mjesto moze zauzeti unutar jednog niza dobijemo istu rijec. Dva slova A mozemo permutirati
sarno jedna, preostala osoba. Tako Mario, Ana i Tea mogu stati u red na na 2! nacina. 1sto razmisljanje vrijedi i za slova T. Tako sada umjesto 4!
sljedece nacine: (Mario, Ana, (Mario, Tea, Ana), (Ana, Mario, Tea), pernmtacija slijedi da je broj svih moguCih nizova od dva slova A i dva slova
(Ana, Mario), (Tea, Mario, Ana) i (Tea, Ana, Mario). ..( T jednak:
4!
Do broja razliCitih permutacija skupa od n elemenata dolazimo primjenom 2!.2! 6.
principa 0 uzastopnom prebrojavanju. Na prvo mjesto u nizu mozemo Ispisimo sada sve permutacije slova rijeci TATA:
staviti bilo koji od n elemenata, pa je prvo mjesto u nizu moguce popu­ AATT AT.AT ATTA T AAT TATA TTAA
niti na n razlicitih naCina. Kada popunimo prvo mjesto, ostaje nam n - 1
elemcnata, pa drugo mjesto mozemo popuniti na n - 1 naCina. Kada je ..(
n 1 mjesta popunjeno, posljednje n-to mjesto mozemo popuniti Broj svih permutacija od n elemenata meau kojima je n1 jednakih elemenata
sarno na jedan jedini naCin. Stoga je broj razliCitih permutacija skupa od n prve vrste, n2 jednakih elemenata druge vrste, ... , a nm elemenata m-te
elemenata vrste jednak je
P", n.(n 1)·(n 2) .. ·2·1=n!,
n!
nl!·n2!···nm !·
gdje se n! cita n faktorijela.

Primjer 1.6. Koliko se permutacija maze napraviti od rijeci STATISTIKA?


Definiramo: O! 1, a za n 2: 1 vrijedi:

.,' Rjesenje:
n! = n . (n - I)!
Y'h 2
Tr azem permu taCIJa

lma p 10,3,2,2,1 = 2! . 31 .1O!
2! . 2! . I! = 75600 . ..(
1.1.2 Permutacije s ponavljanjem
Neka je S skup koji se sastoji od n elemenata s time da je meau njima 1.2 Varijacije
n1 jednakih elemenata prve vrste, n2 jednakih elemenata druge vrste, ... , a
nm elemenata m-te vrste, Vidjeli smo da je kod permutacija u konacan niz rasporeaeno svih n
elemenata nekog skupa S. Kod vadjacija se od n elemenata uzima r..jih m.
n1+n2+···+nm n. Svaka ureaena m-torka elemenata zadanog skupa S predstavlja varijaciju.
Svaka ureaena n-torka elemenata skupa S naziva se permutacija s po·
navljanjem. 1.2.1 Varijacije bez ponavljanja
Primjer 1.5. Odredite broj perrmdacija koje se mogu dobiti od slova
Svaka ureaena m-torka meausobno razliCitih elemenata n-clanog
TATA.
A (m ::; n)naziva se varijacija bez ponavljanja rn-tog razreda u skupu
Rjesenje: A.
8 Kombinatorika 1.2 Varijacije 9

Odredimo broj varijacija bez Od ukupno n elemenata, prvu Uredene cetvorke s komponentama iz skupa {1, 2, ... , 7} u kojima se brojevi
kamponentu m-torke mozemo odabrati na n naCina. Kada je prva kompo­ ne ponavljaju predstavljaju razlicite rasporede zauzimanja racunala.
nenta odabrana, drugu mozemo odabrati na n - 1 naeina jer mora biti uredena cetvarka (1,2,4,7) oznacava da je prvi student zauzeo racunalo
razlicita od prve. Posljednju komponentu, u ovom slucaju m-tu, mozemo oznaceno brojem 1, drugi student je zauzeo racunalo oznaceno brojem 2,
odabrati na n - (m - 1) = n - m + 1 naCina. Tada prema principu 0 uza­ treCi student ce raditi na racunalu broj 4, a cetvrti na racunalu broj 7.
stopnom prebrojavanju slijedi da je ukupan broj varijacija bez pcinavljanja Uredenih cetvorki bez ponavljanja u skupu od 7 elemenata ima V74 7 . 6 .
m-tog razreda u n-clanom skupu jedllak 5·4 = 840. .,f

V~=n'(n-1)"'(n m+l),m:'S:n. Primjer 1.9. U nekoj tvomici se proizvodi oznacavaju s 3 slova. Koltko se
razlicitih oznaka moze formirati od 30 slova tako da u oznaci sva slova budu
U1JelJellJe ovog izraza s prethodnu formulu mozemo razlicita?
n! Rjesenje:

Od elemenata skupa kaji sadrZi 30 slava formiraju se uredene trojke slova


OCito je da je V; Pn n!
je nermutacii taka da clementi u uredenaj trojci nisu jednaki. Takvih razlicitih oznaka
razreda od n elemellata.
ima: V3t = 30·29·28 24360. .,f

Primjer 1. 7. Zadan je skup S {a, b, c}. N apisite sve varijacije drugog


,",
razreda skupa S. 1.2.2 Varijacije s ponavljanjem
Rjesenje:
Svaka uredena m-torka elemenata n-clanog skupa A naziva se varijacija
Treba ispisati sve uredene parove elemenata skupa S kod kojih se elementi m-tog razreda u skupu A. Ako se elementi unutar uredene m-torke
unutar para razlikuiu. Imamo: ponavljati, govori se 0 varijacijama s ponavljanjem.
Prvu komponentu m-torke mozemo odabrati na n naeina. Kako je do­
b) (a, c) pusteno ponavljanje elemenata unutar m-torke, drugu komponentu takoaer
mozemo odabrati na n naCina, kao i posljednju m-tu komponentu. Po
c) principu uzastopnog prebrojavanja slijedi da ukupan broj varijacija s ponav­
Ijanjem m-tog razreda u n-clanom skupu jednak
a) (c,b)
.,f ---
V~=~n· .. ··n=n m

mputa.
Primjer 1.8. Na koliko razlicitih nacina mogu 4 studenta zauzeti 7 racunala
za rad u laboratoriju? Primjer 1.10. Koliko je raz[icitih ishoda bacanja novci6a 4
Rjesenje: Rjesenje:
Kombinatorika 1.3 Kombinacije 11
10

U ovom primjeru je skup A :=;; {P, G}. Svaku komponentu ureaene cetvorke 1.3.1 Kombinacije bez ponavljanja
mozemo popuniti na dva nacina: s P iIi s G. Stoga je ukupan broj razliCitih
ishoda bacanja novcica 4 puta uzastopno jednak Vz4 = 24 16. .; Svaki podskup od rn razlicitih elernenata n-clanog skupa S, m :s; n
zoverno kombinacija bez ponavljanja m-tog razreda od n elemenata
skupa S.
Broj razlicitih kombinacija bez ponavljanja razrcda od n elernenata
1.3 Kombinacije oznacavarno s K;::, a do njega dolazimo porno6u broja varijacija koje se
razlikuju sarno u poretku elemenata u skupu svih varijacija bez ponavljanja
Definicija 1.1. Ako su n, mEN U n ;:: m, tada se rn-tog razreda u n-clanorn skupu. S obzirorn na to da svaka skupina vari­
jacija bez ponavljanja sadrzi m! elernenata koji se razlikuju po poretku
(mn) = mt·(nn! m)!
elemenata, vrijedi da je

Km
n
= n!
zove binomni koeficijent.

Svojstva binomnih koeficijenata: Primjer 1.11. Od elemenata skupa S = {I, 2, 3, 4} treba sastaviti. sve
dvoclane i troclane kombinacije bez ponavljanja.

a) (~) = 1 Rjesenje:

'" b) (n~m) Sve dvoclane kombinacije bez ponavljanja skupa S su:

c) (:J + (~1)
{1,2}, 3}, {I, 4}, {2, {3,4},

Teorem 1.1. Neka se a, bE JR.. Za svaki n EN


a Bve troclane:
2,3},{1,2,4},{2,3,4},{1,3,4}.

(a+
to (:) (Ll)

Primjer 1.12. Na koliko se nacina iz grupe od 12 osoba moze odabrati njih


,f

Formulu (1.1) nazivamo binomna formula. 49


Pri rjesavanju raznih problema prebrojavanja, poredak odabranih ele­ Rjesenje:
rnenata cesto nije vaZan. Svaki podskup skupa od n razlicitih elernenata,
kod kojega redoslijed elernenata nije bitan, naziva se kombinacija. Dvije Posto poredak osoba nije bitan, 4 od ukupno 12 osoba moguce je odabrati
kombinacije rnedusobno se razlikuiu sarno ako nernaju iste elernente. na K12 (~) = 495 nacina. .;
12 Kombinatorika 1.4 Zadaci za vjezbu 13

1.3.2 Kombinacije s ponavljanjem 1.4 Zadaci za vjezbu


Kombinacija s ponavljanjem m-tog razreda od n elemenata skupa S 1. Izmedu 128 studenata prve godine jednog odjela na Veleucilistu u
je svaki skup od m elemenata pri cemu je dopusteno ponavljanje svakog VaraZdinu bira se troClano predstavnistvo studenata. Koliko je raz­
elementa proizvoljno mnogo puta. Kombinacije s ponavljanjem su rjede te licitih mogucnosti za izbor troclanog predstavnistva studenata?
ih necemo izvoditi.
Broj kombinacija s ponavljanjem m-tog razreda od n elemenata je 2. Na koliko naCina se moze napraviti niz od 5 zelenih, 5 plavih, 5 zutih
i 5 crvenih kuglica (kuglice iste boje se ne razlikuju)?
= (n+m-1) = (n+m I)!
m m! . (n - I)!"
3. Koliko postoji razliCitih troznamenkastih brojeva?
Primjer 1.13. U vOGarni se mogu kupiti jabuke, kruiJke, narance i banane.
Na koliko nacina se maze kupiti 3 kg YOGa ako se moze kupiti po kilogram 4. Koliko se troznamenkastih brojeva s razlicitim \Znamenkama moze/
ponudenog vOGa? napisati pomocu znamenki 1,3,7,8?

Rjesenje: 5. Koliko se troznamenkastih brojeva moze napisati pomocu znamenki


, (3';'(,81
N = (4+~-1) 20. ,f

Primjer 1.14. Broj kombinacija 5. razreda nekog broja elemenaia odnosi 6. Kaliko ima cetverOznamenkQ,stihbmj€va

se prema broju kombinacija 7. mzreda istih elemenata kao 7 : 5. Koliko a) kojirna jeprva znamenka p~anbroj?

..- ima tiJ~ elemenata ako su to kombinacije bez ponavljanja? b) kojima je prva znamenka neparan broj?

c) kojima je prva i zadnja znamenkaparan broj?

Rjesenje: d) koji su neparni i sve znamenke su im razliCite?

je broj kombinacija bez ponavljanja 5. razreda od n elemenata, a e) koji su djeljivi) 5 i sve znamenke su im razliCite?

kombinacija bez ponavljanja 7. razreda od n elemenata te je


7. Na koliko se naeina u grupi od 28 studenta mogu odabrati 4 student a
(~) _ 7 koji ce napisati po jedan seminar iz 4 razlicite teme?
(~) - 5'
8. Na koliko se razlicitih naCina moze napraviti popis od 38 studenata u
Raspisivanjem i sredivanjem izraza na lijevoj strani dobiva se jednoj grupi?
7·6 7
(n- 5' 9. Od znamenaka 1,2,3,4,5 naeinjeni su svi peteroznamenkasti brojevi s
razlicitim znamenkama. Koliko brojeva postoji meau njima
odnosno a) koji ne pocinju znamenkom 5?
n2 Un = O. b) koji ne pocinju s 52?
Rjesenje n = 0 ove jednadzbe ne dolazi u obzir, te je rjesenje polazne c) kod kojih se znamenke 3 i 4 nalaze na prvom i posljednjem mjestu
jednadzbe, odnosno traZeni broj elemenata n = 11. ,f (u bilo kojem poretku)?

---
14 Kombinatorika 1.4 Zadaci za vjezbu 15

10. Ispit se sastoji ad 5 pitanja na koja se odgovdra zaokruzivanjem odgovo­ c) 7 neispravnih'?

ra A, B ili C. Na koliko se nacina moze rijffiiti ispit ako se odgovara d) svih 20 neispravnih?

na sva pitanja?
17. Koliko anagrama ima rijec MATEMATIKA?
11. a) Na koliko nacina se moze odabrati grupa od 5 oBoba iz grupe od 4
18. Knjiznica VELV-a sadrZi 11 knjiga iz matematike, 13 knjiga iz fizike,
profesora i 7 studenata?

24 knjige iz baza podataka i 8 knjiga iz grafickog dizajna.


b) Na koliko nacina se moze odabrati grupa od 5 osoba iz grupe od 4

profesora i 7 studenata taka da u grupi budu tocno 2 profesora?


a) Na koliko naCina se moze odabrati po jedna knjiga iz svake skupine?
c) Na koliko naCina se moze odabrati grupa od 5 osoba iz grupe od 4
b) N a koliko naCina nakon toga po jednu knjigu moze odabreti sljedeci
student?

profcsora i 7 studenata tako da u grupi budu barem 3 profesora?

c) Ako biramo sarno dvije knjige, po jednu iz razliCitih skupina, Na

12. U jednoj drzavi zeli se povecati broj moguCih registracijskih tablica ne koliko nacina to mozemo uciniti?

povecavajuCi broj zuakova na tablici. Umjesto sesteroznamenkastih 19. Odredite broj permutacija s ponavljanjem skupa A = {I, 1, 2, 2, 3}.
brojeva, na tablicama ce biti 3 slova i troznamenkasti broj. Koliko
ce biti vise tablica? Ni u jednom slucaju nije dopustena nula kao 20. Na koliko nacina se moze iz snopa od 52 karte izvuCi njih 13, ali tako
registarski broj. da medu njima budu 3 pika, 4 herca, 2 bundeve i 4 trefa?

13. a) Na koliko nacina moze 11 clanova odbora sjesti za okrugli sto!?


,~
b) Na koliko nacina moze 11 Clanova odbora sjesti za okrugli stol tako
da predsjednik i potpredsjednik odbora sjede zajedno?

14. Od znamenaka 0,1,6,7,9 zapisujemo peteroznamenkaste brojeve. Ko­


liko ima takvih brojeva koji su simetricni? (npr. 11611, 67176).

15. Na polici u knjiznici Veleucilista u VaraZdinu nalazi se 13 razliCitih


knjiga od kojih su 5 matematickog sadrzaja, a ostale su iz fizike.
a) Na koliko nacina mozemo te knjige rasporediti na polici ako zelimo
da na prvih 5 mjesta budu knjige iz matematike?
b) Koliko je rasporeda knjiga na polici ako zelimo da su knjige iz
matematike jedna do druge?

16. Od 100 racunala 5 ih je neispravnih. Na koliko naCina se moze odabrati


20 racunala tako da medu njima bude: .
a) svih 20 ispravnih:?
b) 2 neispravna?
2.1 Osnovni pojmovi teorije vjerojatnosti 17

izvlacenje "sedmice ll na lutriji, pojava "glave ll kod bacanja novCiea, pojava


"sestice" kod bacanja kocke i s1.
Prostor elementarnih dogadaja 0 je skup svih moguCih ishoda
nekog slucajnog pokusa. Elemente W E 0 prost ora elementarnih dogao.aja
nazivamo elementarnim dogadajima. Svaki podskup A S;;; 0 naziva se
slucajni dogadaj iIi krace dogadaj. Dogadaj A ce se dogoditi ako je
Poglavlje 2 ishod slucajnog pokusa bilo koji elementarni dogadaj koji je element skupa
A. Broj elemenata skupa A oznacavamo sa k(A). Vidimo da se uspostavlja
odnos 1 - 1 izmedu podskupova skupa 0 i dogadaja vezanih uz eksperi­
Vjerojatnost ment Ciji su ishodi elementi skupa O. To ce omoguciti da odnose i racun
sa skupovima primijenimo na dogaaaje. Dogadaj 0 se naziva siguran do­
gadaj. Skup svih podskupova od 0 naziva se partitivni skup i oznacava
s P(O). Partitivni skup sadrzi i pra:6an skup 0. Skup 0 je dogadaj koji ne
sadrzi ni jedan ishod. Zovemo ga nemoguCi dogadaj.
2.1 Osnovni pojrnovi teorije vjerojatnosti
Primjer 2.1. Kod bacanja jednog simetricnog novcica ishodi su IIp ismo It (P)
Znanstvena istraZivanja vjerojatnosti vezana su uz igre na sreeu. Poz­ i "glava II (G) pa je prostor elementarnih dogadaja skup 0 = {P, G}. Pa-ii­
" nato je da su stari Egipeani vee 3500 godina prije Krista igrali igre sliene tivni skup je P(O) {0, {P}, {G}, {P, G}}, a dogadaj A = {palo je pismo}
naSirn igrarna s kockom. Medutim, zanimajuCi se problemima hazardnih A = {Pl. ./
igara, temelje teorije vjerojatnosti postavili su francuski znanstvenici Pierre
de Fermat (1601. - 1665.) i Blaise Pascal (1623. - 1662.).
U svagdanjem govoru eesto se cuju ocjene da jedan dogadaj ima malu, a Primjer 2.2. Konstruirajte prostor elementarnih dogadaja za sljedeee sluca­
jne pokuse:
drugi veliku vjerojatnost da se ostvari. Prije nego sto pocnemo govoriti 0
vjerojatnosti treba preciznije odrediti osnovne pojmove vezane uz teoriju uzastopno bacanje simetricnog novcica dva puta,
b) bacanje jedne simetricne igrace kockice,
vjerojatnosti.
c) uzastopno bacanje simetricnog novcica sve dok se prvi put ne pojavi grb,
d) slucajan izbor dva elem~nta iz skupa elemenata {a, b, e, d}.
2.1.1 Slucajan pokus i prostor elementarnih dogadaja Rjesenje:
Slucajan pokus je polms ciji je ishod slucajan, koji ima vise mogucih
ishoda, a rezultat ishoda je nepoznat prije samog izvodenja pokusa. Tipicni a) 0 = {(P, P), (P, G), (G, P), (G, Gn,

primjeri slucajnih pokusa su: bacanje novciea, bacanje kocke, izvlaeenje b) 0 = {1,2,3,4,5,6},

karte iz snopa i s1. Dogadaj koji se u odredenim uvjetima moze, ali i ne c) 0 {G,PG,PPG,PPPG, ... },
mora dogoditi naziva se slucajan dogadaj.Slucajan dogadaj moze biti: d) 0 = {{a, b},{a, e}, {a, d}, {b, e}, {b, d}, {e, d}}. ./

16
18 Vjerojatnost 19

2.1.2 Operacije i odnosi medu dogadajima

Dogadaji su skupavi ciji elementi su ishadi eksperimenta, pa meau njima


mozema definirati operacije u analagiji sa skupavnim operacijama:

• Unija dogadaja A i B je dagadaj AU B kaji se dagodi ako i sarno


aka se dagadi harem jedan od dogadaja A i B, dakle aka se ostvari
ishad koji je u skupu Au B .

• Presjek dogadaja A i B je dogadaj AnB kaji se dogodi aka i sarno


ako se dogade i dogadaj A i dagadaj B.

• Komplement ili suprotni dogadaj dogadaja A je dogadaj AC =


0\ A koji se dogodi ako i sarno aka se A ne dogodi .

• Razlika dogadaja A i B je dogadaj A \ B koji se dagodi aka i sarno Slika 2.1.


06
ako se A dogodi, a B se ne dogodi.
Vennav 1 dijagram je jedan od najboljih naCina vizualnog prikazivanja
dogadaja i odnosa izmedu dagadaja. Na slici 2.1 Vennovim dijagramima
Odnosi meau dogaaajima: prikazani su dagadaji A, AC, Au B, An dogadaj A c B i disjunktni
dogadaji A i B redam. Prostor dogadaja je prikazan kao pravokutnik (0),
a razni dogadaji se iscrtavaju kao ovali (iIi neki drugi geometrijski oblici)
• za dogadaje Ai B kaZemo da su disjunktni iIi se medusobno
unutar pravokutnika.
iskljucuju ako je An B = 0,
Primjer 2.3. Bacamo simetricnu kockicu. Neka su dogadaji A, B i C

definirani na sljedeci nacin:

• za dogaaaj A kaZemo da povlaci dogadaj B ako je A c B, odnasno


A={pao je prost oroj},

dogadaj B slijedi iz dogadaja A,


IDonald A. Venn, clan Kraljevskog drustva (1834. - 1923.), britanski logicar i filozof.
Poznat po uvodenju Vennovog dijagrama koji se koristi u mnogim podrucjima, ukljucujuCi
• dogadaji A i B su jednaki (A = B) ako je A c BiB c A. i teoriju skupova, vjerojatnost, logiku, statistiku i informatiku.
Vjerojatnost 2.2 Definicije vjerojatnosti 21
20

Zato sto unaprijed (a priori) znamo sadrZaj kutije, prema klasicno definic:ji
B={pao je neparan

G={pao je broj djeljiv s

vjerojatnosti, vjerojatnost da cemo izvuCi plavu kuglicu je


Odredite A n B, A u A n Be n A BnG.

40 2
Rjesenje: p 60 :3
Prostor elementarnih dogadaja je skup fl = {1, 2, 3, 4, 5,

Dogadaii A, BiG su:


2.2.2 Statisticka definicija vjerojatnosti (vjerojatnost
a posteriori)
A = {2,3, B = {1, 3, 5}, G = {3,6}.
Postoje i pojave kod kojih se vjerojatnost ne moze unaprijed oareCl.lt-I.,
TOOa je: A =C
4,6}, AnB = {3,5}, AuB = 2,3,5}, A\B vee treba promatrati izvjesne pojave i naknadno ustanoviti vjerojatnost.
AnBcnG = i AnBnG {3}. ./ Ako nas npr. zanima vjerojatnost smrti jednog covjeka, onda treba kroz
izvjesno vrijeme, npr. godinu dana promatrati grupu ljudi i ustanoviti ko­
liko ee Ijudi iz te grupe unutar tog vremenskog razdoblja umrijeti. Pro­
2.2 Definicije vjerojatnosti matranu grupu mozemo definirati jos nekim dodatnim uvjetima kao sto je
zdravstveno stanje, profesija, dob itd. Ako smo promatrali 10 000 zdravih
2.2.1 Klasicna definicija vjerojatnosti (vjerojatnosti starijih od 70 godina kroz godinu dana i ustanovili da je u tom raz­
a priori) umrlo npr. 500 Ijudi, onda mozemo reCi da je umrlo cjelokupne
.... grupe. Taj broj je naknOOno ustanovljena vjerojatnost smrti zdravih Ijudi
Neka je fl prostor sa konacno mnogo elementarnih dogadaja koji su starijih od 70 godina. Naravno, iz iskustva znamo da ljudi u tim godinarr:.a
jednako moguCi. Neka je A dogadaj, A ~ fl. Povoljnim ishodima za do­ koji pate od nekih teskih bolesti umiru u vecem postotku. Tu vjerojatnost
gadaj A nazivaju se svi elementarni dogadaji kojima se ostvaruje dogadaj A. ne mozemo ustanoviti unaprijed, vee moramo pricekati da proue
Vjerojatnost a priori dogadaja A, u oznaci P(A), definirana je formulom: vremensko razdoblje i da tu vjerojatnost na taj nacin naknOOno ustanovimo.
Tako postupamo u svim slucajevima u kojima nije moguee unapdjed ustano­
P(A) k(A) = broj povoljnih ishoda za dogadaj A (2.1) viti vjerojatnost. Vjerojatnost koja se na taj naein ustanovljuje na temelju
k(fl) ukupan broj mogueih ishoda pokusa' promatranja izvjesnih pojava zove se vjerojatnost a posteriori. Rijee pos­
teriori znaci unatrag, tj. to je vjerojatnost koja se naknadno ustanovljuje.
Dakle, vjerojatnost a priori proizvoljnog dogadaja A omjer je broja ishoda Kako dolazimo do vjerojatnosti a posteriori? Izvodi se odreueni broj
slucajnog pokusa koji ·ga ostvaruju prema broju svih jednako moguCih iIi promatranja i ustanovljuje se koUko puta se unutar tih promatranih po­
Spomenuta definicija vjerojatnosti a priori primjenjuje se uvijek kada pos­ java dogodio izvjestan ocekivani dogadaj.
toeno odredeni broj kako mogucih tako i povoljnih dogadaja. Vjerojat­
nost a priori objasnit cemo na sljedecem primjeru. U jednoj kutiji nalazi se Pretpostavimo da smo neki slucajan pokus ponovili n puta i daje pritorr_
20 crvenih i 40 plavih kuglica. Iz kutije izvlaeimo jednu kuglicu. Pitanje je dogadaj A nastupio nA puta. Broj nA nazivamo apsolutnom frekvenci­
kolika je vjerojatnost da je izvucena kuglica plave boje. . . jom dogadaja A, a omjer nA relativnom frekvencijom dogadaja A u tih T.
n

VELEUCILlSTE
22 Vjerojatnost 2.2 Definicije vjerojatnosti
23

pokusa. Pri tome je


A3) ako se dogaaaji A i B meausobno iskljucuju, tj. An B 0, vjero­
0< nA < 1.
jatnost da ce nastupiti dogaaaj A Hi dogadaj B jednaka je zbroju
- n -
vjerojatnosti, .
Ako se prilikom vrlo velikog broja ponavljanja pokusa relativne frekven­
cije dogaaaja A grupiraju oko neke fiksne vrijednosti onda se ta vrijednost peA U B) = peA) + PCB)
o :::; peA) :::; 1 i naziva vjerojatnost a posteriori do-
Ako jedan dogadaj moze nastati na vise nacina koji se meausobno
iskljucuju, onda je vjerojatnost jednaka zbroju vjerojatnosti
a posteriori objasnit cemo na primjeru kutije koja sadrzi crvene
koja pripada svakom pojedinom nacinu nastanka. Takva
Kugllce, pod pretpostavkom da ne znamo koliko u kutiji ima kuglica
nost se naziva totall1a vjerojatnost. To cemo pravilo uvijek primjenji­
te koliko je crvenih, a koliko plavih kuglica.
vati kad cemo racunati vjerojatnost nastupanja jednog dogadaja iIi
je kolika je vjerojatnost da cemo izvuci kuglicu na jedan iIi na drugi naCin (pravilo Hili _
Da bismo odredili trazenu vjerojatnost, nasumce izvlaCimo jednu po jednu
kuglicu s vracanjem i biljezimo boju izvucene kuglice. Pretpostavimo da Aksiom prosirujemo uvodenjem aksioma
smo postupak izvlaeenja kuglice ponovili 10 000 puta. Ako smo
kuglicu izvukli 6658 puta, vjerojatnost izvlacenja plave kuglice po za prebrojiv niz dogaaaja AI, A 2, ... , An, ... koji se meausobno iskljucuju,
statistickoj definiciji vjerojatnosti iznosi tj. n Aj = 0, if. j
6658 peAl U A2 U ... U An U ... ) = peAl) + P(A2) + ... + P(An) + ...
p=~ 0.6658,
,-'
2 2.2.4 Svojstva vjerojatnosti
8to je priblizno "3'
Na temelju aksioma spomenutih u aksiomatskoj definiciji vjerojatnosti
2.2.3 Aksiomatska definicija vjerojatnosti izvode se mnoga druga svojstva vjerojatnosti. U nastavku dokazujemo
cesee koristena svojstva.
Neka je D prostor elementarnih dogaaaja. Vjerojatnost je funkcija P
koja svakom dogaaaju A ~ D pridruzuje realan broj peA) koji nazivamo • vjerojatnost suprotnog dogaaaja AC dogaaaja A jedl1aka je
vjerojatnost dogadaja A, pri cemu funkcija P morazadovoljavati sljedece
aksiome: P(A C) = 1 - peA). (2.2)
vjerojatnost da se dogaaaj A nece dogoditi jednaka je 1 minus
AI) P je nenegativna, tj. za svaki dogaaaj A vrijedi
vjerojatnost da ce se dogoditi. To je tzv. pravilo komplementarnosti.
peA) 2: a
Dokaz: Dogadaj D mozello prikazati kao uniju disjunktnih dogaaaja
vjerojatnost dogaaaja jednaka je I, tj. Ai AC, tj. D Au AC. Primjenom aksioma A2) i A3)
P(D) C
1 1= = peA U A ) = peA) + P(A C
) P(A C ) =1 peA).
Vjerojatnost 2.2 Definicije vjerojatnosti 25
24

• vjerojatnost nemoguceg dogadaja jednaka je nuli, tj. • vjerojatnost peA) svakog dogadaja A zadovoljava nejednakost

(2.3) 0:::; peA) :::; 1 (2.6)


P(0) = o.
Dokaz: Prema aksiomu AI) je peA) ~ 0 za svaki dogadaj A. Posto
Dokaz: Iz 0 = DC primjenom aksioma A2) i vjerojatnosti suprotnog je A c D, prema (2.4) i A2) slijedi

dogadaja slijedi:
peA) :::; P(D) 1.

P(0) =1- P(D) =1 1 = o.


• vjerojatnost unije dogadaja A i B jednaka je

• ako je A ~ B ondaje peA U B) = peA) + PCB) - peA II B) (2.7)


P(A):::; PCB). (2.4)
Ovo pravilo mozemo i ovako interpretirati: za bilo koja dva dogadaja
Dokaz: Ako je A ~ B, onda se dogadaj B moze prikazati kao unija vjerojatnost da ce se barem jedan od njih dogoditi jednaka je zbroju
disjunktnih dogadaja A i B \ A (slika 2.2). njihovih pojedinacnih vjerojatnosti umanjenom za vjerojatnost da su
se oba dogadaja dogodila.
n
Dokaz: ZasvakadvadogadajaA i B vrijedi AuB = AU(B\(AIIB)),
..,.. gdje 8U Ai B \ (A n B) di8junktni dogaaaji (slika 2.3) .

Slika 2.2.

Prema aksiomu AI) i aksiomu A3) imamo:


Slika 2.3.
PCB) peA U (B \ A)) = peA) + PCB \ A) ~ peA)
Prema aksiomu A3) je
cime je tvrdnja dokazana.lz prethodne relacije takoder slijedi da je
vjerojatnost razlike dogaaaja B i A jednaka razlici njihovih vjerojat­ peA U B) = peA) + PCB \ (A II B)).
nosti, tj. ako je A ~ B vrijedi: S obzirom na to da je (A n B) c B, prema (2.5) vrijedi

PCB \ A) = PCB) - peA). (2.5) PCB \ (A n B)) = PCB) - p(An B)


26 Vjerojatnost 2.2 Definicije vjerojatnosti
27

pa je konacno Neka je dogadaj A = {od 3 izvucena proizvoda 2 su ispravna}. U paketu


imamo 5 ostecenih i 13 ispravnih proizvoda. Od ukupno 18 proizvoda u
peA U B) = peA) + PCB) - peA n B).
paketu, uzorak od 3 proizvoda mozemo formirati na (~8) = 816 naCina.
Primjer 2.4. Baca se simetricna igraca kockica. Kolika je vjerojatnost: Od ukupno 13 ispravnih proizvoda, 2 ispravna proizvoda mozemo izabrati
a) da se pojavi broj 6,
na (~) = 21 ~3; 11 = 78 naCina, dok jedan osteceni od ukupno 5 ostecenih
b) da se pojavi neparan broj,

c) da se ne pojavi broj 6?
proizvoda mozemo izabrani na 1!~!4! = 5 nacina. Dva ispravna
(D
proizvoda pridruzena jednom loscm ostvaruju dogadaj A, pa je trazena
Rjesenje: vjerojatnost
Prostor elementarnih dogaaaja jc skup n {I, 2, 3, 4,5, 6}, pa je broj svih peA) = ei) . m_78 5
mogucih elernentarnih dogadaja ken) 6. (~8) - 816 0.48.
a) Dogaaaj cija nas vjerojatnost zanima je dogadaj A {6}, k(A) = 1, pa ,f
je prema klasiCnoj definiciji vjerojatnosti
Primjer 2.6. Dva prijatelja, Mario i Goran bacaiu loptu u koso Kada
k(A) 1
Mario baca laptu, vjerojatnost da lopta ude u kos iznosi ~ a vjerojatnost
ken) 6:
b) Neka jc B {1,3,5} dogaaaj da se prilikom bacanja kockice pojavi
da Goran pogodi kot je ~. Vjerojatnost da obojica pogode ko! je ~ K olika
/ je vjerojatnost da ce bar jedan od njih pogoditi kos u jednom bacanju?
neparan broj, k(B) :=:3, pa je
RjeSenje:
k(B) 3 1
PCB) ken) = 6 = 2' Dogadaji

A {Mario je pogodio kos},

c) Ako je A {2} dogadaj da se prilikom bacanja kocke pojavi broj 6,


B = {Goran je pogodio kos})

onda je A dogadaj da se prilikom bacanja kockice ne pojavi broj 6. Kako


C
An B = {i Mario i Goran su pogodili kos} i

je peA) = ~ onda je Au B {bar jedan od dvojice prijatelja je pogodio kos}

.nastupaju sa sljedeCim vjerojatnostima:


1 2 3 1
=
P((!C) ;= 1 -,- peA) 1 - 6 P(A) = 3' PCB) = 4' peA n B) = 2'
,f
Primjenom formule (2.7) dolazimo do trazene vjerojatnosti. Dakle,
jatnost da ce barem jedan od dvojice prijatelja pogoditi kos je
Primjer 2.5. U paketu od 18 proizvoda 5 ih je osteceno. Kolika je vjero­ 2 3 1 11
jatnost da od 3 istodobno izvucena proizvoda 2 budu ispravna? P(AU -+---=
3 . 4 2
Rjesenje: ,f
Vjerojatnost 2.3 Uvjetna i potpuna vjerojatnost 29
28
2.3 Uvjetna i potpuna vjerojatnost
Primjer 2.7. Kutija sadrzi 12loptica za stolni tenis od kojih su 4- :t!de boje,

a ostale su bijele. Na slucajan nacin izvadimo odjednom 1loptica. Kolika

Cesto puta vjerojatnost nekog dogadaja ovisi 0 tome sto znamo 0 tijeku
je vjerojatnost da 6e medu njima biti:
pokusa koji se izvodi. Zamislimo neki pokus u kojem se realiziraju dogadaji
aJnajvise jedna zuta loptica?
A i B s vjerojatnostima peA) i PCB).
b) 2 zute ili 4- zute loptice?
Postavlja se pitanje kolika je vjerojatnost dogadaja A ako znamo da se
dogodio dogadaj B.
Rje!§enje:
Ovu vjerojatnost oznacavamo s P(AIB) i citamo P od A, ako je B, odnosno
a) Ako je dogadaj A {od 7 loptica izvadili smo jednu Hi nijednu zutu lopticu vjerojatnost dogadaja A, ako se dogodio dogadaj B. Preciznije, uvjetna
ondaje vjerojatnost dogadaja A, ako je poznato da se ostvario dogadaj B takav
= 0.15. da je PCB) > 0, je
peA)
7.
P(AIB) = peA n B) (2.8)
Neka je dogadaj B = {od 7 loptica izvadili smo 2 zute iIi 4 zute loptice}. PCB) .
Vjerojatnost dogadaja B je Uvjetna vjerojatnost dogaaaja B, ako je poznato da se realizirao dogadaj
A takav da je peA) > 0, je
PCB) ~.~)-~... {~);"l-
(1;)
(1) . @ 0 49
. .
P(BIA) = peA n B)
if peA) .
'"
Ako je n konaean skup i ako su svi elementarni dogadaji jednako vjerojatni,
Primjer 2.8. Iz tvornice je dosla posiljka od 300 proizvoda. Tvornica garan­
tira da je u posiljci najvise 10% losih proizvoda. Slucajnim izborom kontrola tada zbog peA n B) k(~r~\B) i PCB) = ~~~~ iz (2.8) slijedi:
je uzela 4- proizvoda. Odredite vjerojatnost da se u izabranom uzorku nadu
k(An B)
3 losa proizvada.
P(AIB) = peA n B) ken) k(A n B)
Rjesenje: PCB) k(B) k(B)
Iz skupa od 300 proizvoda, 4 proizvoda moguce je uzeti na (3~O) nacina. ken)
Posto je 10% losih proizvoda, tada cemo od 300 proizvoda imati 30 losih Dakle, uvjetnu vjerojatnost dogadaja A uz uvjet da se dogodio dogadaj
i 270 dobrih. Uzorak od tri lolla i jedan dobar proizvod mozemo dobiti na B dobijemo dijeljenjem broja povoljnih elementarnih dogadaja za dogadaj
.
e~) (2iO) razliCitih naeina. Prema tome trazena vjerojatnost je: An B i broja povoljnih elementarnih dogadaja za dogadaj B.
30) (270) Primjer 2.9. Bacamo dvije kocke. Aka je umnozak brajeva koji su pali 6,
= (3 . 1 = 0 0033 kolika je vjerajatnost da je na jednoj kocki pao braj 2?
P (3~O) . . .
if Rjesenje:
Vjerojatnost 2.3 Uvjetna i potpuna vjerojatnost 31
30

n
Definirarno dogadaje:

A = {na jednoj kocki je pao broj

B {pa~ je urnnozak 6}.

Trazirno: p(AIB). Kako je B = {(I, 6), (6,1), (2,3), (3, 2)}, k(B) = 4, a

An B {(2,3), (3,2)}, k(A n B) = 2 slijedi daje

P(AIB) k(An B)
k(B)
~4 = 0.,
5
Slika 2.4.
.(

Prornotrimo jos jedan problem vezan uz uvjetnu vjerojatnost. Neka je n Kako je P(AkIB) = P(~(~ B), vjerojatnost hipoteze Ak ako se zna da se
prosto elernentarnih dogadaja, a Al, Az, ..., An njegov rastav na disjunktne dogadaj B dogodio moze se racunati kao:
r
skupove. Dogadaji AI, Az, ..., An nazivaju se hipotezarna i cine potpuni
sistem dogadaja ako vrijedi sljedece: P(AkI B ) = :(Ak)P(BIAk) .
AnAj=0 zai i j L P(Ai)P(BJAi )
i=l

Jednakost (2.10) zove se Bayesova2 formula.

Ui~lAi = n. Bayesova formula daje vjerojatnost pojedine hipoteze ako znarno da se neki

Neka je dogadaj B definiran na istom prostoru n (s1ika 2.4). Za svaki dogadaj vee dogodio.

dogadaj Ak, k = 1,2, ... , n uz uvjet da je peAk) > 0 vrijedi relacija


Primjer 2.10. Isti se artikl izraduje u dvije tvornice. Tvornica Tl pod­
P(B\A ) = peAk n B) miruje 60%, a tvornica T z 40% potreba trZista. Ispravno je 90% artikala

k P(Ak)'
tvornice Tl i 70% artikala tvornice Tz.

Dogadaj B mozerno zapisati na sljedeCi nacin (slika 2.4): a) Kupi Ii kupac 100 artikata, koliko ce ih biti ispravnih?

b) Ako je artikl ispravan, koUka je vjerojatnost da je proizveden u tvornici

B = B n n := B n (AI U Az U .. , U An) Tz ?

= (B n AI) U (B n A2) U .,. U (B nAn)·


Rjesenje:
Kako se dogadaji Ai n B, i = 1,2, ... , n meullsobno iskljucuju slijedi da je
a) OznaCimo s B dogaaaj da je artikl ispravan, s A1 da je proizveden
PCB) = PC(AI n B) u (Az n B) U··· U (An n B)) u tvormci T 1 , a s A2 da je proizveden u tvornici T2 . U tom je slucaju
n n (2.9) P(BJA 1 ) = 0.9, P(BIA 2 ) = 0.7
2:P(Ai n B) 2: P (Ai)P(B\Ai)'
i=l i=l Bayes (1701. - 1761.), engleski matematicar i prezbiterijanski svecenik.
Poznat po tome sto je formulirao formulu koja nosi njegovo ime - Bayesova formula.
Formula (2.9) naziva se formula totalne vjerojatnosti.
Vjerojatnost 2.3 Uvjetna i potpuna vjerojatnost 33
32

Nadaije, vjerojatnost odabiranja artikia tvornice Tl je peAl) = 0.6, a vjero­ Npr., bacarno dvije kocke i pitamo se kolika je vjerojatnost da (;e na obje
jatnost odabiranja artikia tvornice T2 je P(Az) = 0.4. Prema formuli (2.9) kocke pasti broj 5. Vjerojatnost da ce na jednoj kocki pasti 5 jednaka je
imamo:
PCB) = peAl) . p(BIAl) + P(Az) . p(BIAz) 0.6·0.9 + 0.4·0.7 = 0.82.
Pl = ~, vjerojatnost da (;e nll, drugoj kocki pasti broj 5 je takoaer jednaka

Dakie, od 100 kupijenih artikaia bit (;e 82 ispravna.


P2 6' paje vjerojatnost da ce ina prvoj ina drugoj kocki pasti 5 jednaka
Vjerojatnost da je artild proizveden u tvornici T2, uZ uvjet da je artiki

1 1 1
ispravan, jednaka je: P = Pl' P2 = 6 . -:=-.
6 36
P(Az)p(BIAz)
P(Az!B) = P(Al)' P(BIA1) + P(Az) . P(BjA2) Da je to ispravno Iako se mozemo uvjeriti i na sljedeCi naCin. Kako svaka
0.4·0.7 kocka ima 6 ploha, sve mogu(;nosti dobivarno tako da svakoj plohi prve
kocke pridruzimo po redu svih 6 ploha druge kocke. Prema tome, imamo
0.6.0.9 + 0.4·0.7
sve moguce slucajeve koji mogu nastupiti (n = 6· 6 36).Povoljni su
= 0.341.
medutim sarno oni slucajevi kada imarno na obje kocke broj 5, sto znaci da
Ovaj primjer primjene Bayesovog pravila pokazuje kako ne treba panicariti imamo sarno jedan povoljan ishod jer svaka kocka ima sarno jednu plohu s
da (;emo kupiti 1sti artikl iako tvornice proizvode toliko neispravnih artikala. brojem 5 (m = 1 ' 1 = 1), pa je prema tome vjerojatnost
,( m 1
P=r;:= 36'

To pravilo cerna upotrijebiti uvijek kad racunamo vjerojatnost da (;e jedan


2.3.1 Nezavisni dogaaaji dogadaj nastupiti i na jedan i na drugi nacin (pravilo "i - ill). Naravno,
Dogadaj A ne ovisi 0 dogadaju B ako vrijedi p(AIB) = peA). ovakvo razmisljanje se moze primijeniti i na vise dogadaja.
Ako su A i B nezavisni dogadaji onda su nezavisni i dogadaji:
. Iz formule (2.8) slijedi
a) Ai BC,
peA n B) = P(A)P(BIA) = P(A)P(B), , AC i B te
c) AC i Be.

KaZemo da su dogadaji A i B nezavisni ako vrijedi Pokazimo da ako su A i B nezavisni dogadaji da su tada nezavisni i dogadaji

peA n B) = P(A)P(B),
Ai BC.

Kako su dogaaaji A n B iAn BC disjunktni vrijedi da je


tj. ako je vjerojatnost pojavljivanja i dogadaja A i dogadaja B jednaka
A = (A n B) U (A nBC),
produktu vjerojatnosti pojedinih dogadaja A i B.

Ako se jedan dogadll,j sastoji od vise dogadll,ja koji su medusobno nezavisni,


paje
onda 5e vjerojatnost za takav dogll,dll,j zove slozena vjerojll,tnost i jednaka
peA) = P«A n B) U (A n Be)) = peA n B) + peA n Be),
je produktu vjerojll,tnosti pojedinih dogadaja.

34 Vjerojatnost 2.4 Zadaci za vjezbu


35

Tada imamo: A = {gost nije zadovoljan hranom},

peA nBC) = peA) peA n B) B = {gost je zadovoljan ambijentom},

C = {gost je zadovoljan poslugom}.

= peA) P(A)P(B) 'I'razena vjerojatnost je

= P(A)[l PCB)]
= P(A)P(BC). p P(A
C
). PCB) . PCC) = 0.95 . 0.98 . 0.99 = 0.92.
Primjer 2.11. U kutiji Kl se nalazi 10 mobitela od kojih su 4 neispravna,

,(
a u kutiji K2 se nalazi 6 mobitela od kojih su 2 neispravna. Slucajno je

izabran po jedan mobitel iz svake kutije.

a) Kolika je vjemjatnost da su oba mobitela ispravna?

b) Kolika je vjerojatnost da je jedan mobitel iSpralJan, a drugi neispravan?

2.4 Zadaci za vjezbu

Rjesenje: 1. U kartaSkoj igri - beli se dijeli 8 karata. Odredite vjerojatnost dobi­


vanja:
Imamo sljedece dogadaje:
a) jednog kralja,
A = {izabran je ispravan mobitel iz KI},
b) barem jednog kralja,

B {izabran je ispravan mobitel iz K 2 }·


c) jednog asa?

6 3 4 2
peA) = - = - PCB) = - = -.
10 5' . 6 3 2. Bacamo dvije kocke. Biljezimo rezultat na svakoj od njih.
a) Odabir mobitela iz kutije Kl ne utjece na odabir mobitela iz kutije K2
pa je traZena vjerojatnost a) KoUko ima elementarnih dogadaja?

Koliko elementarnih dogadaja imaju sljedeci dogadaji:

3 2 b) A = {oba broja su parna}?

p = peA) . PCB) = "5 . 3 = 004.


c) B = {oba broja su veca od 4}?

b) Vjerojatnost da je jedan mobitel ispravan, a drugi neispravan jednaka je


3. U kutiji se nalazi 5 plavih, 7 crvenih i 2 zute kuglice. Izvlacimo 3
3 1 2 2
p = peA) . P(B C
) + P(A C
) • PCB) = - . - + . - = 0.47. kuglice bez vracanja. Kolika je vjerojatnost da se izvuku kuglice raz­
5 3 5 3 licitih boja?
,(

4. U jednoj veIikoj seriji 96% proizvoda zadovoljava tehniCke uvjete propi­


Primjer 2.12. U jednom hrvatskom restoranu provedena je anketa koja je
pokazala da 5% gostiju nije zadovoljno hranom, 98% gostiju zado'IJoljno je sane standardom. Prciizvodi se podvrgavaju gruboj kontroli koja
ambijentom i 1% nije zado'IJoljno poslugom. K olika je vjemjatnost da je proglaSava proizvode dobrim liZ vjerojatnost od 0,98 ako je proizvod
stvarno dobar, i uz vjerojatnost 0,05 ako je proizvod stvarno los. Ko­
slucajno odabrani gost zadovoljan i hranom i ambijentom i poslugom?
lika je vjerojatnost da je proizvod stvarno dobar, ako ga je kontrola
Rjesenje: proglasila dobrim?
Vjerojatnost Zadaci za .. :~,""h .. 37
36

5. Bacamo novcie 4 puta. Kolika je vjerojatnost sljedeCih dogauaja: 13. Od 20 pitanja student je nauCio njih 15 i izasao je na ispit iz Statistike.
a) A={pojavilo se tocno jedno pismo}? Na iapitu izvlaci 4 pitanja. KoUka je vjerojatnost da student zna
b) B={ u drugom bacanju pojavilo se pismo}? odgovoriti na:
c) C={pojavilo se barem jedno pismo}? a) sva 4 pitanja?
d) D={pismo se pojavilo harem dva puta}? b) na barem jedno?

6. Od 100 rnohitela 5 ih je neispravno. Kolika je vjerojatnost da ce od 3 14. Na Veleucilistu u Varazdinu je 5% studenata i 2% studentica visih od
slucajno odabrana mobitela sva 3 biti ispravna? 2 metra, dok au 60% studenata muskarci. Ako je slucajno izabrana
jedna osoba i visa je od 2 metra, koUka je vjerojatnost da je zena'?
7. Plocice na kojirna su ispisana slova A, A, A, B, N, N slazemo jednu
do druge. Kolika je vjerojatnost da cemo dobiti rijec BANANA? 15. S parkiralista na kojern su bila 3 playa i 1 crni Audi, 3 playa i 5 crna
BMW-a i 2 playa i 1 crna Mazda ukraden je jedan automobil. Ako
8. Kutija ima 3 jednake pregrade. U prvoj pregradi se nalazi 5 plavih i
je ukradeni automobil playa boje, koUka je vjerojatnost da je to bila
4 bijele kuglice, u drugoj 3 bijele i 6 plavih, a u trecoj 5 crvenih i 8
Mazda?
plavih kuglica. Kolika je vjerojatnost da cerno vadeCi dvije kuglice iz
na sreeu odabrane pregrade izvuCi 2 plave kuglice?
9. Iz skupa {I, 2, 3,4,5,6,7,8, 9} biramo na sreeu dva broja. Kolika je
vjerojatnost da su:
a) oha parna?
/
hrojevi suprotne parnosti?
e) oha prosta?
10. Kolika je vjerojatnost da se u igri LOTO 6/45 u jednoj kombinaciji
postigne dohitak od 6 zgoditka, od 5 zgoditka, od 4 ili od 3 zgoditka?
11. Vjerojatnost da zrakoplov hude oboren prije nego stigne do cilja je
5%. Vjerojatnost da unisti eilj, ako do njega stigne, je 30%. Kolika je
vjerojatnost da zrakoplov dospije do eilja i unisti
12. Simetricna kockica se baea dva puta. Odredite vjerojatnost sljedeCih
dogadaja:
a) A={pali su jednaki brojevi},
b) B={surna brojeva koji su pali je 8},
c) C={produkt brojeva koji su pali je 8},

d) D={surna brojeva koji su pali je veea od produkta brojeva koji su

pali}.

39

je kockica neispravna. Tadaje vjerojatnost ishoda proporcionalna broJcano


oznaci ishoda: Itsestical! dolazi do sest puta cesce od Itjedinice", "petica"
dolazi do pet puta cesee od I!jedinice!l itd. Kolika je vjerojatnost svakog
ishoda? Sve vjerojatnosti trebaju zbrojene dati 1. Svi brojevi na kockici
pa su vjerojatnosti: p(l) 2\ '

Poglavlje 3 21
Naziv slucajna varijabla sugerira varijablu koja poprima vTlJednostl na­
sumicno. Ovakav intuitivan nacin daje pravo turnacenje. Prornatrac koji
koliCinu auma na komunikacijskim vezama gleda na sum kao na slu­
Slucajne varijable varijablu. U analiticlce svrhe trazimo precizniju matematicku defini­
ciju. Slucajna varijabla X : n --+ lR je funkcija s prostora elementarnih
dogadaja u skup realnih brojeva. Slucajna varijabla svakom ishodu pokusa
pridruzuje neki realan
Statisticari i svi koji se bave vjerojatnoscu gledaju na proces kao sto je Vratirno se na bacanje ispravne kockice gdje postoji sest osnovnih rnogu­
bacanje novCica Hi bacanje kockice kao eksperiment. Prolazenje kroz takav cih ishoda. Ako koristimo oznaku X da bi oznacili rezultat bacanja, tada
proces nazivamo pokusaj. To se mozda ne uklapa u vaSu osobnu definiciju X moze biti bilo koji cijeli broj od 1 do 6. BuduCi da X moze poprimi­
eksperimenta (Hi pokusaja) , ali za statisticara je eksperiment bilo koji proces
lt ti skup vrijednosti, X je varijabla. Moguce vrijednosti od X odgovaraju
koji proizvodi jedno od najmanje dva razlicita rezultata (poput Itglave Hi osnovnim rezultatima eksperimenta, ato znaCi da se ne moze s apsolutnom
1!pisma" kod bacanja novcica). Drugi dio definicije eksperimenta je taj da sigurnoscu predvidjeti vrijednost. Zbog toga se X naziva slucajna varijabla.
se rezultat sa sigurnoscu ne moze predvidjeti. Svaki razliCit rezultat zove se Oznake koje se koriste za slucajne varijable su X, Y, Z, ... Slucajne
osnovni ishod. Stavimo Ii grupu osnovnih ishoda zajedno, imamo dogadaj. dolaze u dvije varijante. Jedna vrstaje diskretna slucajna varijabla (primjer
kod bacanja kockice osnovni ishod su brojevi 2, 4 i 6 i cine dogaaaj bacanja kockice). Diskretna slucajna varijabla moze poprimati, kako to
"pao je pami brojl!. Stavimo Ii sve mogu(;e osnovne ishode zajedno dobit . matematicari vole zvati, prebrojiv broj vrijednosti - kao ato su brojevi od 1
cemo prostor uzoraka. Brojevi 1, 2, 3, 4, 5 i 6 Cine prostor uzoraka za do 6. Nemoguce su vrijednosti izmeau cijelih brojeva 1 i 6 koji odgovaraju
kockicu, dok Itglava" i Itpismo lt Cine prostor uzoraka za kovanicu. Naravno, . rezultatima bacanja kockice(kao sto je 1,25 iIi 3,1416). Druga vrsta slucajne
postoji i treCi ishod kod bacanja kovanice. To bi bio ishod kad bi kovanica varijable je kontinuirana. Kontinuirana slucajna varijabla moze
ostala stajati vertikalno oslonjena na svoj obod. Medutim, taj ishod se beskonacno mnago vrijednosti. Uzmimo za primjer temperaturu. Ovisno a
pojavljuje toliko rijetko da se ignorira i smatra nemogu6im. Ako osnovni preciznosti termometra, moze se odrediti temperatura kao sto je npr. 34,516
ishodi nisu jednako vjerojatni, treba naei vjerojatnost dogadaja na drukciji stupnjeva.
nacin. Prvo moramo imati neki nacin dodjeljivanja vjerojatnosti svakom od
Pritom treba imati na umu da svaka vjerojatnost mora biti izmedu
nula i jedan. Sve vjerojatnosti osnovnih ishoda u prostoru uzorka moraju
zbrojene dati jedinicu. Kako dodijeliti te vjerojatnosti? Pretpostavimo da

38
40 Slucajne varijable '1 Diskretna na varijabla 41

3.1 Diskretna slucajna varijabla dWIVUa, slucajne varijable X

X""(~ ~).
Diskretna slucajna varijabla je slucajna varijabla koja poprima vri­
jednosti Xl, X2, ... s odredenim vjerojatnostima PI, P2, .... Diskretnu slucajnu
varijablu zadajemo tako da zadamo pripadni skup vrijednosti {Xl, X2, ••• } i
pridruzene vjerojatnosti Pi = P(X = xi), sto zapisujemo U obliku tablice ,f
Funkcija razdiobe (distribucije) diskretne slucajne varijable X je
X "" (Xl X2 ... Xn ...) funkcija definirana formulom
PI P2 ... Pn ...

koja predstavlja razdiobu iIi distribuciju slucajne varijable X. Brojevi F(x) P(X ::; x) L P(X = = LPi.
Pi su nenegativni i vrijedi x,:5x x,:5x

Funkcija distribucije predstavlja vjerojatnost da slucajna varijabla X poprimi


PI + P2 + ... + Pn + ... = 1. vrijednost manju iii jednaku od z.
Primjer 3.1. Bacanje simetricnog novcica se maze opisati slucajnom va­

rijablam X : {P, G} -+ {O,

Primjer 3.3. Odredite Junkciju distribucije slucajne varijable iz primjera


Zakan razdiabe ave slucajne varijable je
3.2 i nacrtajte njen graf.

X",,(~ k)'
oJ

,f Funkciju distribucije odredujemo po intervalima. Na intervalu (-00, I) je

Primjer 3.2. Bacamo dvije kacke. Slucajna varijabla X poprima vrijednast F(x) = P(X ::; z) = 0,
1 ako su na kackama pali jednaki brojevi, a 2 aka su pali razliCiti brojevi.
Odredite razdiabu slucajne varijable X. slucajna varijabla X ne poprima vrijednost z koja je strogo manja od 1.
Nadalje, na intervalu [1,2}
Rjesenje:
1
Neka je dogaaaj A = {(i, i), 1 :::; i ::; 6}. Prema klasicnoj definiciji vjero­ F(z) = P(X ::; x) = P(X = 1) 6'
6
jatnosti je peA) = 36 =! Vjerojatnost da slucajna varijabla X poprimi
vrijednost 1 jednaka je vjerojatnosti dogadaja A, tj. P(X = 1) peA),
jer je 1 jedina vrijednost manja od X unutar intervala (-00,2) koju slucajna
varijabla X moze poprimiti. Konacno, na intervalu [2, +(0) je
dok je vjerojatnost da slucajna varijabla X poprimi vrijednost 2 jednaka
vjerojatnosti dogadaja AC, dakle P(X 2) = P(AC) ~~ ~. Stoga je F(z) = R(X ::; x) = P(X = 1) + P(X = 2)
1+6
6
5 = 1,
42 Slucajne varijable 1 Diskretna varijabla
43

!lto je i za ocekivati buduCi da slucajna varijabla X ne poprima vrijednost


ve6u od 2. Tako imamo
(7) (4~) .
Pj = (~2) ,J = 0, 1,2,3,4.
O' x < 1
F(x) = ~, 1 S; x < 2 Razdioba slucajne varijable X je
{
1, x 2:: 2
01234)
X '" ( 0.071 0.353 0.424 0.141 0.01 .
Graficki prikaz funkcije distribucije slucajne varijable X dan je na slid 3.1.
.(
F(x) se razdioba slucajne varijable prikazuje tako da se na x os nanesu
"\JICl,UCKI

vrijednosti Xj, a na y os pripadne vjerojatnosti Pj. Pritom se linija koja


tocke koristi samo zbog vizualizacije razdiobe. Slika 3.2 prikazuje
bu slucajne varijable X iz primjera 3.4.
1
Pj
0.5

1
0.4
6

0.3
1 2 x
0.2
Slika 3.1.
0.1
.(

Primjer 3.4. U kutiji se nalazi pet dobrih i sedam losih proizvoda. Slucajna
varijabla X predstavlja broj dobrih praizvoda u sluifajnom uzorku ad cetiri
o 2 3 4 j
proizvoda. Odredite razdiobu slucajp,e varijable X.
Slika 3.2.
Rjesenje:
3.5. Diskretna slucajna varijabla ima razdiobu
Vrijednosti koje slucajna varijabla X moze poprimiti su 0,1,2,3 i 4. Vjero­
jatnost da se u slucajnom uzorku od cetiri proizvoda n~e j dobrih je (vidi
,
X
rv
(0 2 5 7 9)
0.3 0.2 0.05 0.25 p .
44 Slucajne varijable 3.1 Diskretna slucajna varijabla 45

Odredite:

Ocekivanje E(aX + b) varijable aX + b mozemo odrediti preko E(X) na


a) p,
sljedeci nacin:
b) P(X > 9),

c) P(X ~ 5).
E(aX + b) 2:)aX + b)P(X Xi)
i
Rjesenje: i

a L XiP(X = Xi) +b L P(X Xi)


a) Iz 0.3 + 0.2 + 0.05 + 0.25 + P = 1 slijedi da je p 0.2,
Slucajna varijabla X ne poprima vrijednost vecu od 9, pa je ~----~v~----~
=E(X)
~
=1

P(X > 9) 0,
a· E(X) + b.
Dakle,
c) Vjerojatnost da slucajna varijabla X poprimi vrijednost manju ilijednaku
od 5 je E(aX + b) = a· E(X) + b. (3.2)
Specijalno, za b = 0 imamo
P(X ~ 5) P(X = 0) + P(X = 2) + P(X = 5)
0.3 + 0.2 + 0.05 0.55. E(aX) = a· E(X). (3.3)
,( Moze se pokazati da vrijedi i
,J

3.1.1 Ocekivanje diskretne slucajne varijable E(X + Y) = E(X) + E(Y).


Neka je X diskretna slucajna varijabla i neka je P(X = Xj) Pj'
Pod ocekivanjem E(X) slucajne varijable X podrazumijevamo sumu pro­ . Ocekivanje E(X) cemo oznacavati i sa /-tx iii jednostavno s /-t kada je jasno
dukata vrijednosti varijable i pripadnih vjerojatnosti, tj. na koju se slucajnu varijablu ocekivanje odnosi.

Primjer 3.6. Pri bacanju kocke slucajna varijabla X maze poprimiti vri•

. E(X) 2:::XiPi (3.1)


jednosti 1,2,3,4,5 i 6, svaku s vjerojatnoscu P = 6"1 Odredite ocekivanje

i
slucajne varijable X i varijable 2X + 2.

uz uvjet da red na desnoj strani konvergira apsolutno. Ako ovaj uvjet nije
zadovoljen, tada kazemo da varijabla X nema konaenog ocekivanja. lljesenje:

Ako je zadana slucajna varijabla X i realne konstante a i b, tada je aX + b


takoder slucajna varijabla. Ako varijabla X poprima vrijedllost Xj, nova Prema (3.1) ocekivanje slucajne varijable X jednako je
varijabla aX + b poprima vrijednost aXj + b. Vrijednosti aXj + b pridruzuje
se ista vjerojatnost kao i vrijednosti Xj. 1 1 1 1 1 1 21
E(X) = 1 . - + 2 . + 3 . - + 4· - + 5· - + 6 . - - = 3.5.
6666666
46
Slucajne varijable 3.2 Diskretne razdiobe
47

Varijabla 2X + 2 poprima vrijednosti 4,6,8, 12 i a od


· .Primjer
3.7. Odredimo varijancu slucajne varijable X i slucajne varijable

pripada vjerojatnost ~. Stoga je 2X + 2 iz primjera 3.6.

· Rjesenje:

1 1 1 1 1 1

E(2X + 2) 4· - + 6 . - + 8 . - + 10 . + 12 . + 14 . 9.
6 6 6 6 6 6

· Najprije cerna odrediti distribuciju slucajne varijable , a zatirn njeno


Isti rezultat mozemo dobiti POIIlOCU formule (3.2). ocekivanje.
Irnamo:
Dakle, E(2X + 2) 2· E(X) + 2 2·3.5 + 2 = 9. ,( X2 rv
(1
(5
(5
4 9 16 25 36)

111111,
(5 6" 6" (5

3.1.2 Varijanca standardna devijacija diskretne slucajne 2 1 1 1 1 1 1 91

E(X )=1'-+4· +9· +16·-+25· +36·-= 15.17.

varijable 666 6 6 66

Prema (3.4) varijanca slucajne varijable X

Varijanca iIi disperzija diskretne slucajne varijable X definira se


formulorn:
Var(X) E(X2) _ [E(X)f = 91 _ (~1) 2 = 105 = 2.92.

Var(X) E[(X E(X»2] 6

= E(X2) - [E(X)]2 Yarijanca slucajne varijable 2X + 2 prerna (3.5):

.
" 2)Xi - E(X)f· Pi Var(2X + 2) = 22 . Var(X) 4·2.92 = 11.68 .
(3.4)
'L:XtPi - 2E(X) 'L:XiPi +E2(X) 'L:Pi ,(
i i

'--v--" '--v-'
=E(X) =1 Diskretne razdiobe
= 'L:xtPi - [E(X)]2.
i
Binomna razdioba
Varijanca mjeri rasipanje slucajne varijable X s obzirom na ocekivanu vri­
Pretpostavirno da se neki slucajni pokus u idealno jednakim uvjetima
jednost E(X). Moze se pokazati da slucajnoj varijabli aX + b, a, b E lEt
. ponavlja nezavisno n puta i pretpo8tavimo da 8U u svakorn pojedinacnom
pripada varijanca
pokusu rnoguca sarno dva ishoda: dogadaj A se ostvario ili dogadaj A se
Var(aX + b) = . Var(X). (3.5)
nije ostvario. Neka se u pokusu dogadaj A realizira s konstantnorn vjero­
Standardna devijacija iii srednje kvadratno odstupanje diskretne jatnoscu p. Vjerojatnost da se dogadaj A ne realizira je tada q 1 _ p.
slucajne varijable X je .Svaki dogadaj s opisanirn svojstvirna zove se Bernoullijev dogadaj. Broj
nastupanja dogadaja A u n pokusa je slucajna varijabla koja moze poprirn­
(l(X) jVar(X). (3.6) iti vrijednosti 0,1,2, ... , n.
48 Slucajne varijable ··3.2 Diskretne razdiobe 49

Postavlja se pitanje kolika je vjerojatnost da se u n pokusa dogadaj A po­ a prema formuli (1.1) dalje imarno
javi tocno k puta.
Vjerojatnost da dogadaj A nastupi k puta u nizu od n slucajnih E(X) = np(p + q)n-l = np.
"'-v-"
jednaka je vjerojatnosti da se u tom nizu na k mjesta pojavi dogadaj A, a 1

na preostalih n - k mjesta dogadaj AC. Takvom nizu pripada vjerojatnost . Na sliean nacin moze se pokazati da je varijanca slucajne varijabie dis­
pkqn-k. Nizova koji saddle k simbola A ima (~) jer se od ukupno n mjesta tribuirane po binomnoj razdiobi
k moze odabrati na G) nacina. Dakle, vjerojatnost da se u n pokusa

aogaaai A pojavi tocno k puta jednaka je


Var(X) npq.

Primjer 3.8. Pokus se od 3 uzastopna bacanja novcica.


P(X = k) = (~)pkqn-k,q = 1- p. (3.7) slucajne varijable X jednake su broju pojavljivanja pisama u 3 uza:;:tc-pna
bacanja.
Distribucija slucajne varijable X naziva se binomna distribucija s
a) Odredite skup vrijednosti slucajne varijable X.

nip i oznacava se sa
b) Kolika je vjemjatnost da se barem 2 puta pojavilo

Xrv
Ocekivanje slucajne varijable s binomnom distribucijom jednako je
.:l1ucaJna varijabla X moze poprimiti vrijednosti:
E(X) np. (3.8) 0= pismo se nije pojavilo prilikom uzastopnog bacanja novcica,
1 = pismo se jednom pojavilo,
,J
Zaista, prema (3.1) i (3.7) imamo 2 = pismo se dva puta pojavilo i
3 = pismo se pojavilo u sva 3 bacanja novcica.
n I

E(X) I:k. k!. (~._ k)!pkqn-k

k=O
Slucajna varijabla X ima binomnu razdiobu)
~ (n -1)1 k-l n-l-(k-l)
np ~ (k I)!, {n - 1 - (k I))! p q . X B(3,
rv

b) Vjerojatnost da se pismo pojavilo barem 2 puta jednaka je


Stavimo da je l = k . 1. Tada je
P(X 2: 2) == P(X 2) + P(X = 3)
E(X)
n-l
np '\:"
L...tl!·(n
1=0"-".-.'
(
n

(nIl)
1)1
.
l-l)!
plqn-l-l
G) (~r (~r-2 + G) (~r
= 0.375 + 0,125
Gr- 3

I:
np n-l ( n ~ 1) plqn-l-l, =0.5.
1=0 ,(
50 Slucajne varijable 3.2 Diskretne razdiobe 51

Primjer 3.9. Na drug oj godini VELV-a ima 20% studenata muskog


3.2.2 Poissonova razdioba
Kolika je vjerojatnost da su u slucaino odabranom uzarku ad 5 studenata:

a) dva studcnta muskog spolar,


Poissonova1 razdioba je granicni slucaj binomne razdiobe kada n tezi
b) sve same studenticef
u beskonacnost, a p nuli, uz uvjet da produkt ,\ = np ostane konstantan.
Rjesenje:
Dakle, kada imamo proces koji se opisuje binomnom raspodjelom, pri cemu
imamo izuzetno velik broj pokusaja i vrlo mali broj uspjeha, tada Poisso­
A {odabrani student je muskog nova raspodjela aproksimira binomnu.
AC = {odabrani student je zenskog Kazemo da diskretna slucajna varijabla X ima Poissonovu
P(A) 0.2, P(AC) 0.8, parametrom A > 0 ako X poprima vrijednosti iz skupa {O, 1,2, ... , } s
X = broj nastupanja dogadaja A jatnostima
Slucajna varijabla X ima binomnu razdiobu,
X", B(5, P(X= Akk! -Ak 01,2, . . ,
~e 1 , (3.9)

a) Vjerojatnost da u slucajno odabranom uzorku od 5 studenata VELV-a


sto oznacavamo sa
budu tocno dva studenta muskog spola je

P(X = 2) G) 0.2 2 • 0.8" = 0.2.


X", PCA).

Pokazimo da je doista Poissonova distribucija granicni binomne dis­


b) Vjerojatnost da u slucajno odabranom uzorku od 5 studenata VELV-a
tribuciie. Imamo:
budu sve studentice je

= 0) = C) 0.20 . O.So ::::= 0.33.


P(X = k) n) k n-k
(k p q ::::= k!(n
n!
k)!P
k(1
.(
n·(n-l) .. ·(n k+l) (pn)\1 pt(l­
Primjer 3.10. Vjerujete Ii da pastoji izvanzemaljski iivat? Sa !fDA" ce k! nk
odgovoriti 50% velike papulacije. Na uzarku ad 100 [judi adredite ocekivanje
i standardnu devijaciju slucajne varijable X koja predstavlja brojrJozitivnih
odgovara u uzarku. Stavimo da je np = A, tj. p ~. Tada
n
Rjesenje:
X", B(100,
P(X = k) 1 (l_~)"'(I_k:l)Ak(l_~)n'(I_~)-k
E(X) = 100·0.5 = 50, u(X) = .J100 . 0.5 . 0.5 = 5.
U ponovljenim uzorcima s n 100, u prosjeku 50 Ijudi ce reCi "DA". Odstu­
od tog broja razlikuje se od uzorka do uzorka i iznosi oko 5. .( lSimeon Denis Poisson francuski matematicar i fizicar.
52 Slucajne varijable 3.2 Diskretne razdiobe 53

Prelaskom na limes kada n tezi u beskonacnost dobivamo: Slucajna varijabla X poprima vrijednosti jednake broju oBoba alergicnih na
jagode u uzorku od 2000 osoba. X ima Poissonovu distribuciju s parametrom
limP(X
n.....oo
k)=A lim
k! n-+oo
k

'"---
(1-!:') ... (l_ -l).
-.~
n
lim
n-4oo
,
k
n
,
A 2000· 0.001 2, dakle
--v- v
=1 =1 X rv P(2),
. lim (1- ~)n lim 1 ". _1_
~n--+ool __ I_A
= Ak . e- A
kI
=e-), r;; n,
=1 2k
P(X k)= k!e-Z,k 0,1,2, ...
Poissonova razdioba opisuje vjerojatnost rijetkih dogadaja kao sto su au~
tomobilske nesrece, alergija na jagode, broj tiskarskih pogresaka na stranici
teksta itd. Ocekivanje i varijanca slucajne varijable X s Poissonovom dis~ a) Vjerojatnost da ce od 2000 osoba tocno tri biti alergicne na jagode jed­
tribucijom jednake su parametru A, tj. nakaje:
E(X) = A,
23 z
P(X 3) = 3! e- = O.lS.
Var(X) = A.

.-" DokaZimo da je E(X) = A. Prema (3.1) i (3.9) imamo:


'I'raZena vjerojatnost jednaka je
00 Ak_A
E(X) = 2::>' k! e
k=l k 1 P(X > 2) = P(X = 3) + P(X = 4) + ...
= e-
A
• A L
00 A-A.
(k _ I)!
= 1 (P(X 0) + P(X = 1) + P(X = 2))

~ z 2
= 1 - e:- ( 1 + 11
22)
+ 2!
e),

0.323.
Primjer 3.11. Vjerojatnost daje osaba alergicna najagadeje 0.001. Kolika
je vjerojatnast da ce od 2000 osoba
a) tacno tri osobe
b) vise od dvije osobe Na slici 3.3 prikazana je razdioba slucajne varijable koja predstavija broj
biti alergicne na jagode? osoba iz uzorka kojesu alergicne na jagode, Pi = P(X = i). Vrijednosti
vjerojatnosti su spojene da se naglasi tendencija ponasanja P(X = i) kada
Rjesenje: se i E N mijenja.
54
Slucajne varijable 3.3 Neprekidna slucajna varijabla 55

Pj 3.3 N eprekidna slucajna varijabla


0.5

0.4 U prethodnom poglavlju vidjeli smo da diskretna slucajna


poprimiti konaean iIi prebrojiv broj vrijednosti. Medutim, vet na
0.3 tavnijim primjerima moze se da postoje slucajne varijable
mogu poprimiti sve vrijednosti iz nekog intervala realnih brojeva, dakle
0.2 neprebrojivo mnogo.
Neprekidna (kontinuirana) slucajna varijablaje
0.1 za ciju funkciju distribucije F(x) = P(X :; x) postoji funkcija
daje

o 2 3 4 j

SHka 3.3. x

..(
F(x) = J
-00
Primjer 3.12. Na naplatnu postaju "NP" tijekom jednog sata stife u pros­
£40 automobila. Odredite vjerojatnost da tijekom minute stignu
4 amcmobila.
Rjes?nje:
Funkcija gustoce vjerojatnosti neprekidne slucajne varijable X je funkcija
Defini::amo slucajnu varijablu X koja broji automobile koji produ kroz f : JR JR sa sljedeCim svojstvima:
naplatnu kuticu "Npl! u minuti. Kroz naplatnu kuticu "NP" u minuti
mozE proti 1 automobil, ali i njih 500. Kako je vjerojatnost prolaska 500 f(x) ::::: 0, za svaki x E JR,
autom::lbila kroz naplatnu kuCicu mala, za opis vjerojatnosti ovih rijetkih 00

doga'laja koristimo Poissonovu distribuciju. Trebamo odrediti parametar f f(x)dx = 1,


-00
A. Taj parametar jednak je prosjecnom ili ocekivanom broju automobila
b
koji produ kroz naplatnu kuticu ffNP" u minuti. Stoga je A jednak (iii) f f(x)dx Pea <X < a < b.
a
,=240=4
,II 60 . Svojstvo (i) predstavlja nenegativnost funkcije f, odnosno oznacava da se
da te tijekom jedne minute na naplatnu postaju "Npl! stiCi 4 gustote nalazi iznad osi x. Svojstvo (ii) govori da je vjerojatnost
44 .. e- 4 sigurnog dogadaja jednaka 1, odnosno da je povrsina ispod krivulje gustoce
automobila jednaka je P(X = 4) = 0.195. ..(
jednaka 1 (slika 3.4).
56 Slucajne varijable 3.3 Neprekidna slucajna varijabla 57

y y

I(x)

x x

Stika 3.4. Slika 3.6.


(iii) govori da se svakom intervalu (a, b) pridruzuje vjerojatnost Vjerojatnost svakog elementarnog dogadaja neprekidne slucajne varijable
pea < x < b) koja je jednaka povrsini ispod kdvulje gustoce na intervalu jednaka je nuli zbog toga jer je
b) (slika
P(X = a) = 1(J, f(x)dx = O.
y
/ Stoga su sljedece vjerojatnosti medusobno jednake, tj.

P0$X$~=P0<X$~=P0$X<~ P0<X<~

i racunaju se
I(x) Pea < X $ b) = P(X $ b) - P(X $ a)
- F(a).
x Vjerojatnost da slucajna varijabla X poprimi vrijednost vecu od x jednaka
je
Stika 3.5. P(X > x) = 1 - P(X $ x)

Funkcija F(x) predstavlja vjerojatnost da slucajna varijabla X poprimi = 1 F(x).


bilo koju vrijednost koja je manja ill jednaka od vrijednosti x. Vrijed­ gustoce moze se dobiti iz funkcije distdbucije jer vrijedi
nost funkcije distribucije F(x) jednaka je povrsini ispod krivulje gustoce na
intervalu x) (slika 3.6). = F'(x).
3.3 N eprekidna slucajna varijabla 59
58 Slucajne varijable

Primjer 3.13. Bacamo kuglice n Zonac na cijem je dnu oznacena povrsina F(x)
kao na sZjedecoj slid:

R x

Slika 3.8.
.f

Primjer 3.14. Neka je X neprekidna slucajna varijabla s funkcijom gnstoce


Slika 3.7.
J(x) = {ex, ~ $:yX $: 3,
0, mace.
N eka je slucajna varijabla X udaljenost sredista lonca do mjesta pada kuglice.
Vjerojatnost da knglica padne unutar zacrtane krnznice proporcionalna je a) Odredite konstantu c i nacrtajte krivuljn gustoce.

b) Odredite Junkciju razdiobe i nacrtajte graf Junkcije razdiobe.

povrsinama:
.J c) Izracnnajte: P(X $: 2), P(l $: X $: 2), P(X > 2) i P(O < X < 6) .

o, x <0, Rjesenje:
2
X 1J" x2
P(X$:x) = R2' O$:x$:R, a) Prema svojstvu (ii) funkcije gustoce vjerojatnosti, povrsina ispod krivulje
{
1, x> R. gustoce na intervalu [0,3J jednaka je 1 pa je

Prema tome, Junkcija distribucije slncajne varijable X je f3 = c· 2x 2\3 = c· 92


3exdx = cxdx 2
1 f 0 =? c= 9'
o 0
O, x<O, Dakle, funkcija gustoce je
~:, ° {~x,
F(x) = P(X $: x) = $: x $:R,
{ f(x)
o $: x $: 3,
1, x>R.

0, inace.

Njen graJ prikazan je na slid 3.8.


Krivulja gustoce prikazana je na slid 3.9.
60 Slucajne varijable 3.3 Neprekidna slucajna varijabla 61

f(x) c) Imamo:
P(X :s; 2) = F(2) ~,
PC1 :s; X :s; 2) F(2) - F(l) = ~,
4 5

P(X> 2) = 1 - P(X :s; 2) =1 F(2) =1 9= 9'


1 8
P(O < X < 6) F(6) FCl) = 1 9= 9 .(

Primjer 3.15. Slucajna varijabla je zadana funkcijom razdiobe:

-2 -1 2 3 4 x o, x < 0,
x2
Slika 3.9. F(x) = 25' O:s; x :s; 5
{
1, x> 5.
b) Funkcija razdiobe je
a) Nacrtajte graf funkcije razdiobe.
o, x < 0, b) Odredite funkciju gustoce.
x 1 c) Odredite P(X = 1) i P(X >
F(x)= [~tdt=9x2, o:s; x:S; 3,
{ Rjesenje:
,.' 1, x> 3,
a) Na slici 3.11 prikazan je graf funkcije razdiobe F(x).
a njen graf prikazan je na slici 3.10.
F(r)
F(x)

-2 -I 234 x 2 3 4 5 6
-2 ·1 x

Slika 3.10. Slika 3.11.


62 Slucajne varijable 3.3 Neprekidna slucajna varijabla 63

b) Iz = pi (x) slijedi da je Moze se pokazati da vrijedi


00
o, x < 0, { 2
0:::;x:::;2 Var(X) = J x 2f(x)dx (E(X))2. (3.12)
f(x) 225 x, 0:::;x:::;5= 0,
{ inace. -00
0, x> 2.
Standardna devijacija neprekidne slucajne varijable definirana se isto
c) Imamo:
kao i kod diskretne slucajne varijable,
P(X = 1) = 0,
(J = VVar(X).
1 24

P(X> 1) = 1 - P(X :::; 1) = 1 - F(l) = 1 - 25 = 25' ./


Primjer 3.16. Odredite ocekivanje i varijancu slucajne varijable iz primjera
3.14·
3.3.1 Ocekivanje, varijanca i standardna devijacija

Rjesenje:
neprekidne slucajne varijable

Definicije ocekivanja, varijance i standardne devijacije neprekidnih slucaj­ Funkcija gustoce slucajne varijable X je
nih varijabli slicne su definicijama diskretnih varijabli, ali ipak malo kom­
pliciranije. Neprekidna slucajna varijabla pojedinu svoju vrijednost prima f(x) {~x, ~:::;x~3,
s vjerojatno8Cu nula sto zahtijeva drukCiju metodu zadavanja vjerojatnosne 0, mace,
,J razdiobe nego u diskretnom slucaju. Neprekidnu slucajnu varijablu povezu­
jemo s matematickim pravilom koje generira funkciju distribucije F(x) = Ocekivanje slucajne varijable X je prema (3.10) jednako
P(X :::; x) = p(w: X(w) E (-00, xJ) iz koje se deriviranjem dobije funkcija 3 3
gustoce vjerojatnosti, f(x) = FI(x). Ocekivanje i varijanca neprekidne
slucajne varijable raCuna se preko integrala.
E(X) = J x· ~Xdx = ~ J 2
x dx
o 0
Neka je X neprekidna slucajna varijabla s funkcijom gustoce f(x). Oceki­ 3
vanje neprekidne slucajne varijable X definira se kao = ~.
93
x \3 2
.
00
0

E(X) J x' f(x)dx (3.10) Prema (3.11) je varijanca jednaka


-00 3 3
ako ovaj nepravi integral konvergira. Varijanca se definirana kao Var(X) J(X-2)2.~XdX ~J(x3-4x2+4x)dx
00 o 0 •

Var(X) = J (x-E(X))2f(x)dx. (3.11) 2 (x4 x3+ 4


x2)
--4- - 1
3
­1
-00 9 4 3 2 0 2'
64 Slucajne varijable 3.4 Neprekidne razdiobe 65

odnosno prema (3.12)


f(x)

3
2X4\30 -
Var(X)
J
o
2 2
x • 9xdx - 22 = 94 4 1
b-a

9 8 1
2 - 2 = 2'

./

x
a b
SA Neprekidne razdiobe
Slika 3.12.
3.4.1 Uniformna razdioba
Funkcija distribucije slucajne varijable X "" U(a, b) je
Neka je X neprekidna slucajna varijabla koja poprima vrijednosti na
intervalu [a, b]. Kazemo da X s funkcijom gustoce O' x $ a,
~.
x-a
F(x) = b _ a' . a < x < b
{
O' x $ a, 1, x ~ b.
f(x)= b~a' a<x<b, Moze se pokazati da je ocekivanje uniformno distribuirane slucajne varijable
{
0, x~ b X
E(X) = a+b
ima uniformnu distribuciju s parametrima a i b.
a varijanca
Pisemo: Var(X) = (b a)2
12· .
X rv U(a,
Primjer 3.17. A utobus stize na stanicu svakih 10 minuta. Osoba dolazi
na stanicu u slucajno vrijeme. Kolika je vjerojatnost da se vrijeme cekanja
Graf funkcije gustoce uniformno distribuirane slucajne varijable prikazan je
nalazi u intervalu od 5 do 7 minuta ?
na slid 3.12.

Rjesenje:
66 8.4 Neprekidne razdiobe 67

Slucajna varijabla X predstavlja vrijeme cekanja dok ne sljcdeCi au­ Pokazimo da za gama rekurzivna
tobus. X je neprckidna, uniform no distribuirana varijabla koja
poprima vrijednosti izmedu 0 i 10 minuta. Trazena vjerojatnost jednaka je = a>1.
povrsini krivulje gustoce
Koristimo formulu parcijalne
1

izmedu 5 i 7 minuta
=1O,0<x<1O
J u(x)v'(x)dx u(x)· vex) - J v(x)· u'(x)dx.

Imamo:
f(x)

xC.-le-Xdx v'(x) = e- X J
(a - 1)xC.-2 v _e- x
0.1

-1) I

=0

o 5 10 x (0: 1) . rCa - 1)

Slika 3.13. U slucaju da je 0: = n E N, uzastopnom primjenom ove formule dobivamo


daje
Povrsina osjencanog a.VIJKU~H1M jednaka je P = 2·0.1 = 0.2. r(n) = (n - I)!.
Gama mozemo napisati i na sljedeCi naCin:
Dakle, 7 1 2
7 1 x I 5) - _ ,f
P(5<X<7)=[lO dx 105 10 -10' u /3x,/3>O
du
X2 razdioba
3.4.2
razmatranja X2 razdiobe treba nesto reci 0 gama funkciji koja je
J00

/3c.-l x a-l e -/3{JJ /3dx

sastavni clio ove razdiobe. Gama funkcija je funkcija o

:C:) J
00

=} 1= xc.-l e -/3{JJdx.
o
68 Slucajne varijable 3.4 Neprekidne razdiobe 69

Vidimo da funkcija Za neprekidnu slucajnu varijablu X s funkcijom gustoce


1 (x_~2
O, x ::; 0, --e- ,x E lR
f(x) = { fP xo:- 1 e-,6x,
i7..j21i­ 20'

x>O
rea) kazemo da ima normalnu iIi Gaussovu distribuciju s parametrima p,
(ocekivanje) i (varijanca).

Pisemo:
=1. X", N(p"
-00
Graffunkcije gusto6e zove se normalna iii Gaussova krivulja 3,14).
Zakljueujemo da je f(x) funkcija gustoce vjerojatnosti. Za slueajnu vari­
" jablu koja ima tu funkciju gustoce vjerojatnosti kazemo da je distribuirana
p'o gama razdiobi. f(x)

3.4.3 Normalna razdioba


u.Jii
Kada nesto mjerimo u fiziCkom svijetu, npr. duzinu i tezillu, bavimo se
..,.predmetima mozemo vidjeti i dotaknuti. S druge strane, statisticari,
sociolozi, istraZivaCi trZista i POSlOVlli Ijudi eesto moraju izmjeriti nesto
sto ne mogu vidjeti ili dotaknuti. Osobine poput inteligencije, glazbene
SpOSObllosti, spremnost n3 kupnju novog proizvoda pripadaju ovoj kate­
goriji. Ovakve vrste osobina obiello su distribuiralle po cijeloj populaciji
tako da je veCina Ijudi oko prosjeka, s postupno manje Ijudi zastupljenih ka
ekstremima. p+u x
p-u p
Normalna razdioba je najvaznija neprekidna razdioba koja ima primjenu
u raznim podruejima. Mnogo drugih razdioba, uz .odredene uvjete, moze Stika 3.14.
se aproksimirati normalnom razdiobom. Poznata je jos i pod imenom
Moze se primijetiti da je Gaussova krivulja zvonolikog oblika, simetricna
Gaussova2 razdioba prema njemackom matematiearu C. F. Gaussu.
je s obzirom na pravac x = p" maksimalnu vrijednost postize u tocki

2.Johann Carl Friedrich Gauss - 1855.), njemacki matematicar. Poznat je po


(p" i7~) i asimptotski se priblizava osi x. ToCke su tocke inflek­
sirokom doprinosu matematici, geometriji, fizici (osobito u proucavanju elektromagne­ sije, odnosno toCke u kojima funkcije prelazi iz podrueja konveksnosti
tizma), astronomiji, optici te geodeziji. u podrucje konkavnosti i obrnuto.
70 Slucajne varijable 3.4 Neprekidne razdiobe 71

Dakle, ako pretpostavimo da se mogu mjeriti osobine poput inteligencije F\mkcija razdiobe normalno distribuirane slucajne varijable je
i ako pretpostavimo da ova krivulja pokazuje kako se inteligencija distribuira x
u populaciji, mozemo reCi sljedece: zvonolika krivulja pokazuje da vecina F( x ) =P(X:::;x) 1 / e- (t-,,/ dt,
2(7
ljudi ima prosjecnu inteligenciju, vrlo malo ih ima nisku inteligenciju i vrlo
malo ljudi su geniji. Normalna raspodjela zapravo je familija raspodjela -00
ovisnih 0 dva parametra: Jk i (T2. Moze se pokazati da Jk predstavlja oceki­ a graf funkcije razdiobe prikazan je na slid 3.16.
vanje, a (T2 disperziju slucajne varijable distribuirane po normalnoj razdiobi:
F(x)

Jk = (J.,f2ir
1 /00 X • = E(X),
-00
......................................................................::.;:.:;;:.:;=

00

1
(J 2 = (J.,f2ir / 2 e- ~
x· 2" dx -,P = Var(X). 0.5
-00
U ocekivanju Jk funkcija gustoce ima svoj maksimum, a sto je disperzija (J2
(odnosno standardna devijacija (J) veca to je maksimalna vrijednost funkdje J1
1 x
gustoce, 1i'C' manja. Na slid 3.15 prikazane su Gaussove krivulie za istu
(Jv21f Slika 3.16.
r vrijednost I" 10 i razliCite vrijednosti (J «(T I, (J = 2).
Za racunanje vjerojatnosti da normalno distribuirana slucajna varijabla
I(x)
X", N(p" (J2) poprimi vrijednost manju iii jednaku od x koristimo standar­
diziranu varijablu
Y=--.
x -p,
(T
1. .[iii Varijabla Y ima tzv. standardnu normalnu iIi jedinicnu normalnu
distribuciju s parametrima Jk = 0 i (J2 = 1, tj.
2 . ..[iii ........................­ .....,...
Y", N(O,
Funkcija gustoce vjerojatnosti standardne normalne razdiobe je
1 .2
10 x tp(z) = .,f2ire- 2 .

Stika 3.15. Njen graf dan je na slid 3.17.


72 Slucajne varijable 3.4 Neprekidne razdiobe 73

qJ(Z)

qJ(Z)
1
..ffi

-z Z
-3 3 Z
SHka 3.19.
Slilm 3.17.
Vrijednosti standardne normalne razdiobe su tabelirane, a ocitamo ih iz
Funkcija distribudje standardne normalne razdiobe je tablica A i B u prilogu.

~(Z) =
J
z
1
<p(u)du =...;27r Jz
.,2
e-Tdu,
Pokazimo vaznu jednakost koja omogucuje da se pomocu tablica funkdje
distribucije standardne normalne razdiobe izraeunavaju vrijednosti funkcija
distribucije za sve normalne razdiobe, za bilo koji J), i 0". Za X N(J),,0"2) ("V

-00 -00
imamo
a grafiCki je prikazana na slid 3.18.
F(x)
'" f(t)dt JX 1 (t_,,)2
m=e-~ dt =
[ !::::.l!:. u]
<:D(z) J O"y21T
0'
dt O"du
-00 -00
r
=
= 1
0"...;27r J" e-"2 O"du =
-00
2
J
7
-00
<p(u)du = ~ (x: J),) .

0.5
Vjerojatnost da X padne unutar intervala (a, b), odnosno [a, bj, (a, bj, [a, b)
je

-3
Pea < X < b) = F(b) - F(a)
3 Z

Slilm 3.18.

=~C:tt)_~(a:J),).
Iz slike 3.19 vidimo da zbog parnosti vrijedi:
Posebno, za svaku slucajnu varijablu X ("V N(J)"0"2) vrijedi:
~(-z) 1 ~(z).

P(J), - 0" :5 X :5 J), + 0") = ~(l) ~(-1) 0.6827,


74 Slucajne varijable
3.4 Neprekidne razdiobe
75
P(fJ. - 20' :s; X :s; fJ. + 20') = <p(2) .p( -2) 0.9545,

30' :s; X :s; fJ. + 30") = <P(3) = 0.9973. P(X >1.65)

Drugim rijeCima, normalno distribuirana slucajna varijabla X unutar in­


tervala (fJ. - O', fJ. + O') poprima vrijednosti s vjcrojatno8Cu vecom od 68%,
/
unutar intervala {fJ. - 20', fJ. + 20') poprima vrijednosti s vjerojatnoscu vecom
o 1.65
od 95%, a unutar interval a (fJ. 30", fJ. + 30") s vjerojatnoscu vecom od 99%.
b) P( -2.42 < X < 3.3) = <P(3.3) - .p( -2.42) = 0.9995 - 0.0078 :::: 0.9917

f(X)

P( -2.42 < X < 3.5)

l~ I ~"f"~1 ~ ...
,u-3tJ: i;.-2cr .u-q fl p+2Ir p+31r X
IHU
-2.42 o 3.5
c) pet < X < 2.02) = .p(2.02) - <p(t) 0.6824
=} .p(t) 0.2959 =} t = -0.54.
Primjer 3.18. Neka je X '" N(O, 1). Odredite:
if
a) P(X > 1.65),
Primjer 3.19. Visina covjeka je normalna slucajna varijabla s ocekivanjem
b) P(-2.42 < X < 3.3),
E(X) 174 ern i standardnom devijacijom 0" = 9 em.
e) t iakav da je pet < X < 2.02) 0.6824.
Koliki je posiotak ljudi visih od 2 m?
b) Ispod koje visine 5% ljudi?
Rjesenje:
e) Koliki je postotak ljudi visine 160-190 em?
Rjesenje:
a) P(X > =1 P(X:S; 1.65) 1 - <p(1.65) = 1 - 0.9505 = 0.0495,
X", N(174, 92 )
Slucajne varijable 3.5 Cebisevljeva nejednakost, Bernoullijev zakon velikih brojeva
76
i Centralni teorem

a) X"" N(25,36)
16 - 25)
P(X > 200) = 1 - P(X :::; = 1- F(200) = 1 <I> COO ~ 174) a) P(X < 16) = <I> ( - 6 - = 0.0668,

= 1 Q>(2.891 1 - 0.9981 = 0.0019. b) P(X> 33) = 1- <I> C


3
6 25) = 1- 0.9082 = 0.0918,

=> Ljudi visih od 2 metra ima t - 25) = 0.01 => t


e) P(X > t) = 0.01 => 1 - <I> ( -6- 38.98. ,(

b)
3.5 Cebisevljeva nejednakost, Bernoullijev zakon
P(X < v) = 0.05 => <I> (v -9174 ) = 0.05
velikih brojeva i Centralni granicni teorem
v 174
- - = -1.645 => v = 159.2em Teorem 3.1. (Cebisevljeva3 nejednakost) Ako je X slucajna varijabla
s konacnim ocekivanjem E(X) /k i konacnom varijancom Var(X) = (72
=> 5% je nize od 159.2 em. onda za svaki c: > 0 vrijedi:
(}"2
e) P(IX - /kl ~ c:) :::;
'"' P(160 < X < 190) = F(190) - F(160)

C
== <I> gO
~ 174) _ <I> C60 ~ 174)
Dokaz. Dokaz provodimo za diskretnu slucajnu varijablu X koja
vrijednosti Xl, X2, ... , x n .
n

= 0.9625 0.0594 = 0.9031. (72 Z)Xi /k)2. P(X =

i=l
,(
=> 90.31% Ijudi je visine izmedu 160 i 190 em.
:E
(Xi - p,)2 • P(X Xi) + :E
(Xi /k)2 . P(X = Xi)
Primjer 3.20. Maksimalna dnevna temperatura zraka u mjesecu srpnju je
~~~ ~~Q.

normaino distribuirana slucajna varijabla X 8/k 25°G i (}" 6°G. Odre­


> :E
(Xi /k)2 . P(X = Xi) ~ :E
c: 2 • P(X = Xi)
dite:
IXi-l-l'l;?:c IXi-l-l'l;?:e
a) vjerojatnost da maksimalna temperatura padne ispod 16°G,

= - /kl ~ c:).
b) vjerojatnost da maksimalna temperatura poraste iznad 33°G,

c) temperaturu u °G iznad koie maksimalna temperatura dospijeiJa s vjero­ 3PaInuti Lvovic Cebisev (1821. - 1894.), ruski matematicar poznat po zasnivanju
petrogradske matematicke skole sredinom 19. stoljeca. Cebisev se bavio teorijom brojeva.
jatnos6u 0.01.

Tzv. Bertranov postuiat dokazao je 1850. g. Danas je najpoznatiji po svojim radovima


Rjesenje:
u teoriji vjerojatnosti.
3.5 Cebisevljeva nejednakost, Bernoullijev zakon velikih brojeva
Slucajne varijable i Centralni teorem 79
78

N a sEcan nacm dokazuje se Cebisevljeva nejednakost za kontinuiranu Tada je X slucajna varijabla koja predstavlja relativnu frekvenciju dogadaja
o n
slucajnu varijablu.
A. Bernoullijev zakon velikih brojeva tvrdi da za proizvoljni E: > 0 vrijedi

Moze se pokazati da je Cebisevljeva nejednakost ekvivalentna nejednakosti

0'2
lim P
n-+QO
(I X
n - pi 2:: 6) = 0,
- 111 < E:) 2:: 1 - tj. ako braj ponavljanja n pokusa tezi prema beskonacnosti, onda relativna
frekvencija dogadaja A tezi po vjerojatnosti prema stvarnoj vjerojatnosti p
Primjer 3.21. Stroj se sastoji od 3(J dijelova koji rade nezavisno jedan od

dogadaja A.
drugoga. Vjerojatnost kvara na svakom dijelu u vrijeme t je 15%. Pracije­

vjerojatnost da apsolutna vrijednost razlike izmedu broja dijelova koji

se :pokvare i pripadnog ocekivanja za vrijeme t bude man-ia od 8. Dokaz. Za slucajnu varijablu X s binomnom distribucijom je E(X) = np,
a Var(X) = npq. Prema (3.3) i (3.5) je tada E (~ . X ) ~ . np = p, a
Rjesenje:

Neka slucajna varijabla X predstavlja broj dijelova koji se pokvare za vri­ Var (.!.n .X) ~
n
. npq pq. Nadalje, prema Cebisevljevoj nejednakosti
n
jeme t. vrijedi

Ocekivanje i varijanca od X su:

X", B(30,

P (I ~ -pi 2:: 6) ::; -+ 0 kada n -+ 00.


o
E(X) = np = 30·0.15 = 4.5

Za primjene je pogodna relacija


30·0.15·0.85 3.825.

Var(X)
U nasem primjeru za E:
npq
8 sHjedi da je traZena vjerojatnost
P (I~ -p!2:: c) : ; :2'
P(IX - 4.51 < 8) 2:: 1 - 3.825 0.94. odnosno
,( p(l~ pl<c) 2::1-::2.
Teorem 3.2. (Bernoullijev zakon velikih brojeva) Neka slucajna va­ Primjer 3.22. U svakom od 6000 nezavisnih pokusa vjerojatnost ostvarenja
rijabla X broji nastupanje dogadaja A u n nezavisnih pokusa i neka je p dogadaja A iznosi 0.625. Odredite vjerojatnost da se relativna Jrekvencija
vjerojatnost nastupanja dogadaja A. dogadaja A ne razlikuje od 0.625 po apsolutnoj vrijednosti za vise od (J.0i.
Rjesenje:
X", B(n,p).
Slucajne varijable 3.6 Zadaci za vjezbu 81
80

pravoj, opeenito nepoznatoj, vjerojatnosti tog ishoda kako se poveea'la broj


U naSem primjeru je X "-' B(6000, 0.625), a uvrstavanjem u formulu
opazanja. Zakon velikih brojeva vrijedi uvijek kada se radi 0 pojavi koja se

"
p(1 pI < c:) ~
X _
n
1- ~
nc: 2
promatra u velikom mnostvu. Taj zakon ima svoju punu vaznost u prirod­
nim pojavama i u dnevnom zivotu. Iskustvo je pokazalo da goclisnje u
velikim gradovima izvjestan broj ljudi strada u prometnim nesrecama. To
dobivamo je zakon veIikog grada. PromatrajuCi sa strane statistike vidjet eemo da

P (I X I )
6000 - 0.625 < 0.01
0.625 . 0.375
~ 1 - 6000.0.01 2 = 0.609.
se postotak tako unesrecenih ljudi iz godine u godinu vrlo malo mijenja,
osim ako se prometne prilike u gradu bitno ne promijene. lsto tako, lead
promatramo statistiku umiranja vidjet cemo da godisnje umire prc·sjecno
,f uvijek jednako mnogo Ijudi. Zakon velileih brojeva toliko je pouzdan da
pomocu njega mozemo praviti posve sigurne prognoze. U nasem ZiV01;U ima
'Teorem 3.3. (Centralni granicni teorem) Ako X B(n,p), onda za
°
f'J
dogadaja za koje ne mozemo unaprijed reCi kada ee se dogoditi i hoee Ii se
veliki n, < p < 1 i proizvoljne a, b E JR, a < b v1'ijedi uopee dogoditi. Svaki covjek mora umrijeti, ali mi ne mozemo unaprijed

P( a :5 X
b- np) (a - np).
:5 b) i">j <p ( yiriJi7l - <p yInPq
reCi kada ce to biti. Ako promatramo veliku grupu ljudi ne znamo kada ee
pojedinci iz te grupe umrijeti, ali znamo da ce godisnje iz te grupe umrijeti
odredeni broj Ijudi i u tom broju neeemo puno pogrijesiti. Nas dakle ne
Ova aproksimacija se upotrebljava kada je n ~ 30. zanima pojedinac vee veeina, kolektiv. Kalkulacije ne pravimo s obzirom
r'
na pojedinca vee S obzirom na Citavo mnostvo. EmancipirajuCi se na
Dokaz ove tvrdnje nesto je slozeniji i neeemo ga navoditi. naCin od pojedinca, dobivamo moguenost da postavimo zakone koji yrijede
Primjer 3.23. P1'ocijenite vjerajatnost da u 4000 bacanja novcica braj g1'­ za mnostvo.
bova (G) bude u gmnicama od 1968 do 2040.
Rjesenje: 3.6 Zadaci za vjezbu
1. Dva strijelca 8 1 i 82 gadaju jednom u istu metu. Vjerojatnost pogotka
X,,-, B(4000,0.5) za 8 1 iznosi 0.7, a za 820.6. Ako je X broj pogodaka u metu, nadite:
2040 - 2000) (1968 - 2000) a) razdiobu slucajne varijable X,
P(1968 < X < 2040) = <p ( v'IB05 - <p VlOOO b) P(X:5
=: <p(L26) -<p(-1.01) 2. Osiguravatelj pokusava procijeniti vjerojatnost nastanka stete u osigu­
= 0.8962 - 0.1562 0.74. ranju imovine. Ako je na uzorku od 14 kuca osigurani slucaj nastupio
,f
na njih 20%, kolika je vjerojatnost da tri kuce imaju stetu?

Pokazali smo da je zakon velikih brojeva posljedica Cebisevljeve nejed­ 3. Vjerojatnost da stroj proizvede los proizvod jednaka je 0.2. Ako je
nakosti. Govori da relativna frekvencija uocenog ishoda postaje sve bliza ispitano 2000 proizvoda, procijenite vjerojatnost da apsolutna vrijed­
82 Slucajne varijable 3.6 Zadaci za vjezbu 83

nost razlike relativne frekvencije broja ispravnih i njegove 11. Slucajna varijabla je zadana funkcijom razdiobe:
vjerojatnosti ne bude manja od 0.05.
O' x < 0,
4. Automatska telefonska centrala prima prosjecno 100 poziva na sat.
Nadite vjerojatnost da ce u minuti biti vise od 3 poziva. F(x) = 0:::; x:::; 2
{
5. Iz skupa od 12 proizvoda medu kojima su 3 neispravna bira se slucajni 1, x> 2.
uzorak od 3 proizvoda. Vrijednosti slucajne varijable X jednake su a) Nacrtajte funkcije razdiobe.

neispravnih proizvoda u uzorku. Odredite razdiobu slucajne b) Odredite funkciju gustoce.

~HJ~Dle X. c) Odredite P(X 1), P(X > 1) i P(l < X <

6. Neka je ocekivanje duljine putovanja u gradskom prometu, na odre­


clenoj relaciji, 15 minuta, a standardna devijacija je 2 minute. U 12. Zadana je slucajna varijabla X rv (0~4 0~3 0~1 0~2)' Odredite
je granicama duljina putovanja ako je donja granica pripadne Va1"(X) i a(X).
vjerojatnosti 0.7696?
13. Zadana je varijabla X '" N(26, 1.5 2 ). Nadite:
7. Pismeni iz Statistike sastavlja se tako da se iz unaprijed poznatog a) P(24 < X < 30),
skupa od 50 zadataka slucajno izabere 5 zadataka. Za prolaz na b) P(IXI < 20).
treba rijesiti 2 zadatka i to je ocjena dovoljan; tri rijesena zadatka su
za ocjenu dobar; 4 za vrlo dobar i 5 za izvrstan. Student je naucio 14. Ocekivanje slucajne varijable X s distribucijom
tocno 10 zadataka od ukupno 50. Kolika je vjerojatnost da ce student
poloziti ispit? Kolika je vjerojatnost da ce dobiti izvrsnu ocjenu? X rv
(
1"
1
14
-2 -1 5)
P 2p
5
14
8. Tezina covjeka je normalno distribuirana slucajna varijabla X s oceki­
vanjem 82 i standardnom devijacijom 11 kg. je E(X) = ~. Odredite nepoznanice 1" i p.
a) Koliki postotak Ijudi ima tezinu 60-90 kg?
b) Koliki je postotak Ijudi tezih od 100 kg? 15. Jedno kazaliste godisnje ima 1095 predstava.
c) koje granice je 5% Ijudi?
9. Bacamo kocku 5 puta. Kolika je vjerojatnost da ce "sestica" pasti 2 a) Nadite vjerojatnost da ce se u jednom danu izvoditi 4 predstave.
puta?
b) Nadite vjerojatnost da se u jednom danu nece izvoditi vise od 2
10. Statisticki je utvrdeno da ima 1% oBoba. Neka ::1!uI,.;d,JH<l predstave.
X poprima vrijednosti jednake Ijevorukih osobaizmedu
16. Zadana je funkcija gustoce slucajne varijable X:
200 odabranih osoba.
a) Kolika je vjerojatnost da meau njima bude tocno 4 Ijevaka? - x 2 ), -1:::; x :::; 1,
b) Kolika je vjerojatnost da medu njima ne bude manje od 4 Ijevaka? lex) =
>1.
Slucajne varijable
84

a) Odredite vrijednost parametra Q,.


b) Odredite funkciju razdiobe slucajne varijable X.

c) Odredite

d) Odredite P(X >

17. Vjerojatnost da ne proklija jedno zrno zita iznosi 0.15. Nadite


jatnost da od 700 slucajno odabranih zrna proklija najmanje 600. Poglavlje 4

Deskriptivna statistika

4.1 Osnovn60 statistici

Statistika je znanstvena disciplina koja se bavi prikupljanjem, grupi­


ranjem i analizom podataka te interpretacijom dobivenih rezultata prove­
denog istraZivanja. U suvremenom zivotu statistika je dio obrazo­
vanja i opce kulture. Danas je tesko zamisliti covjeka bilo koje struke ko­
jem su pojmovi kao ato je srednja vrijednost, varijabilitet, kovarijacija i s1.
nepoznati. Statistiku treba poznavati pri obradi rezultata dobivenih istra­
zivanjem iIi eksperimentom, u opisu i analizi rezultata te radi donosenja
zakljucaka iz konkretnog slucaja na opci slucaj. Metode koje se koriste
u zakljucivanju na temelju podataka nazivaju se statisticke metode, a
temelje se pdje svega na teoriji vjerojatnosti. Statisticke metode reduciraju
podatke tako da iskljucuju nebitne informacije, a vrednuju relevantne in­
formacije 0 pojavi koju opisuju. Ove metode primjenjuju se u ekonomiji,
poljoprivredi, u zdravstvu i prometu, u unutraSnjoj i vanjskoj trgovini, tu­
rizmu i u drugim strucnim i znanstvenim podrucjima. Da bi razumjeli
statistiku i njene metode, treba upoznati matematicku teoriju koja tumaci
i oblikuje statistiCke zakonitosti.
Statistiku dijelimo na deskriptivnu i inferencijalnu statistiku. Deskrip­

85
86 Deskriptivna statistika 4.2 Grupiranje i graficki prikaz podataka 87

tivna (opisna) statistika se bavi prikupljanjem, uredivanjem i analizom


statistickih podataka. Koristi odredcne metode i postupke za egzaktno 12,14, 15, 12,17,
proucavanje statistickih skupova. Inferencijalna (analitiCka, matema­
ticka) statistika temelji se na teoriji vjerojatnosti i proucava statistiCke 12, 18, 16,16, 14.
metode kojima se dolazi do zakljucaka 0 karakteristikama statistickog skupa Iz dobivenih rezultata vidimo da je najkrace vrijeme trcanja 12 sekundi, a
kao cjeline na temelju uzorka. najdulje 18 sekundi. Buduci da ne postoje valjani razlozi da vrijeme istrca­
vanja doticne staze ne bi moglo biti bilo koje vrijeme izmedu 12 i 18 sekundi,
Jedan od osnovnih pojmova statistike je statisticki skup, odnosno skup vrijeme trcanju je jedno kontinuirano obiljeije. ./
elemenata sa zajednickim numerickim svojstvima Cija se vrijednost mijenja
od element a do elementa. Ta svojstva nazivamo statisticka obiljezja Skup je diskretan ako obiljezje poprima diskretne vrijednosti.
iJi varijable. Skup podataka 0 statistickom obiljezju koje se promatra u
Primjer 4.2. Primjer diskretnog skupa: Iz pismenog ispita na kolegiju
statistickom skupu naziva se populacija Hi osnovni skup. Skup manjeg
Statistika studenti su postigli sljedece ocjene:
broja podataka iz populacije zovemo uzorak. Cesto je u praksi nemoguce
prikupiti i obraditi sve podatke koji se odnose na neki skup (npr. pros­ 1,4,1,3,3,2,1,2,
jecna visina stanovnika Republike Hrvatske). Stoga se odabire reprezenta­
tivni dio osnovnog skupa koji odrazava karakteristike populacije i naziva se 2,1,2,3,1,3,5,4.
reprezentativni uzorak. Da bi uzorak bio reprezentativan svaki podatak Student moze dohiti samo jednu od sljede6ih ocjena: 1, 2, 3, 4 ili 5. U
populacije treba imati jednaku vjerojatnost izbora u uzorak sto se postize ovom primjeru obiljezje ima znacenje dobivene ocjene pa je ono diskretnog
slucajnim izborom.Npr., ako su podaci podjednako rasporedeni u popu­ karaktera. ./
laciji, tada se izbor uzorka moze postiei uzimanjem svakog i-tog podatka
(npr. svaki peti, deseti, stoti i s1.). Tako dobiveni uzorak nazivamo slucaj­
ni uzorak. 4.2 Grupiranje i graficki prikaz podataka
Prema broju obiljezja, statisticki skupovi mogu biti jednodimenzionalni Cesto su podaci koje dobijemo mjerenjem nekog statistickog obiljezja
(promatra se sarno jedno obiljezje, npr. tezina studenata) i visedimenzio­ napisani redoslijedom koji ne daje jasnu sliku stanja koje istrazujemo. Pl'i­
nalni (promatm se istodobno vise obiljezja, npr. ~isina i dob studenata). kupljene podatke treba urediti da pojava koju istrazujemo bude sto uocljivija.
Prema svojstvu obiljezja, statistiCke skupove dijelimo na kontinuirane i Metoda grupiranja podataka je najvaznija metoda uredivanja podataka.
diskretne. Kod kontinuiranih skupova promatrano obiljezje moze popri­ Grupil'anje podataka ostvaruje se razvrstavanjem podataka u razrede, odnos­
miti bilo koju vrijednost iz nekog intervala. no izradom distribucije frekvencija. Ako je obiljezje diskretno, podaci se
grupiraju tako da se u jedan razred stavljaju iste vrijednosti, sto pred­
stavlja prebrojavanje pojedine vrijednosti u podacima. S druge strane, ako
Primjer 4.1. Primjer kontinuiranog skupa: Na jednom sportskom nat­ su vrijednosti prilicno rasipane, tj. podaci su neprekidni, opisanim razvrsta­
jecanju studenata u trcanju na 100 m dobiveni su sljedeci rezultati u sekun­ vanjem podataka dobili bi preveliki broj razreda sto hi otezalo uocavanje
dama: zakona distribucije podataka. U tom slucaju prikladnije je u jedan razred
Deskriptivna statistika 4.2 Grupiranje i graficki prikaz podataka 89
88

staviti vise uzastopnih vrijednosti obiljezja, Na taj je naCin razred pred­


dok se kumulativne apsolutne frekvencije "vise od" dobivaju postup­
nim zbrajanjem vrijednosti apsolutnih frekvencija pocevsi od posljednje u
stavljen citavim intervalom,

nizu prema prvoj


Neka su brojevi xi, X2, ,." Xn rezultat n ponovljenih mjerenja statistiCkog

obiljezja X, 1'e brojeve nazivamo statistickim podacima promatranog

Ik,lk + A-I> .. ·,Ik + Ik-l + ,.. + 12 + h


obiljezja X, Meau statistickim podacima XI, X2, "" Xn obiljezja X mogu

se pojaviti i jednake vrijednosti, pa cemo skup svih vrijednosti oznaCiti sa


Kumulativne relativne frekvencije dobivaju se postupnim zbrajanjem
aI, a2, ,." ak, k :5 n,
relativnih frekvencija
Apsolutna frekvencija iii ucestalost Ii neke vrijednosti lLi statistickog

obiljezja X je broj pojavljivanja te vrijednosti u promatranom skupu po­


AI' + f r 2' ... , + f'r2 + ... + Irk'
dataka Xl, X2, ••. , X n •

Za ilustraciju postupka grupiranja i grafickog prikaza podataka obradit


Wijedi: cemo dva skupa podataka, jedan diskretni, a drugi neprekidnL
k
LIi=n, Primjer 4.3. Kocka je bacena 20 puta. Dobiveni su sljedeci podaci:
i=l

suma svih apsolutnih frekvencija jednaka je broju danih podataka n. 1,3,2,4,3,5,6,1,6,2,2,1,3,1,1,2,4,6,5,4.

'Distribucija frekvencija je skup svih parova (ai, Ii), i = 1,2, ... , k. Statisticko obiljezje X predstavlja broj dobiven bacanjem kocke. Moguce
Osim apsolutne frekvencije, u statistickoj obradi podataka koristi se i rela­ vrijednosti obiljezja X su I, 2, 3, 4, 5 i 6, Dakle, obiljezje X je diskretno.
tivna frekvencija fri neke vrijednosti ai statistickog obiljezja X koja je Prvi korak grupiranja podataka je ispis podataka u niz po veliCini. Na taj
definirana kao omjer apsolutne frekvencije te vrijednosti i ukupnog broja nacin dobivamo jedan numericki niz oblika
podataka n,
1 1 1 1 1 2 2 2 2 3 3 3 4 4 4 5 5 6 6 6.
f,,; = n
Distribucija frekvencija dana je sljedecom tablicom:
Vrijedi:
k

L 1. 2 56
i=l Ii 11151 4 3 3 2
ai
.
1 1
3\3\4 I

Kumulativne apsolutne frekvencije "manje odlt dobivaju se postup­


nim zbrajanjem vrijednosti apsolutnih frekvencija pocevsi od prve u nizu Mozemo napraviti i frekvencijsku tablicu u kojoj se u prvom stupcu
nalaze vrijednosti obiljezja X, u drugom apsolutne frekvencije, u trecem
prema posljednjoj
relativne frekvencije, a u posljednjem kumulativne relativne frekvencije (k.
It + h, ..., it + 12 + ... + A-I + fk r. f.).
90 Deskriptivna statistika 4.2 Grupiranje i graficki prikaz podataka 91

ai ii iT; k. r. f.
vi sine fi. Sirina pravokutnika je proizvoljna. Graficki prikaz podataka za
1 5 5/20 = 0.25 0.25
nas primjer dan je na sljedecoj slici.
2 4 4/2Q = 0.2 0.45

3 3 3/20 = 0.15 0.60


J;
4 3 3/20 = 0.15 0.75

5 2 2/20 = 0.1 0.85


5

6 3 3/20 = 0.15 1
4

L: n= 20 1.00
3

Podaci 0 bacanju kocke mogu se graficki prikazati poligonom frekvencija iIi 2

histogramom. Ako na x osi oznaCimo vrijednosti ai, ana y osi frekvencije ii,
spajanjem tocaka (ai, Ii) dobivamo poligon frekvencija koji je prikazan
n:a slici 4.1.
a,

;; Slika 4.2.

Histogram se moze nacrtati i tako da ukupna povrsina pravokutnika bude


5
jednaka 1. To se postize tako da se na y osi oznace relativne frekvencije,
sto je prikazano na sljedecoj slici.
4
/,
3

2 3 4 5 6 ai
a,
Slika 4.1.
Slika 4.3.
Drugi naCin prikazivanja podataka je histogram. Za crtanje histograma
x
potrebno je na osi oznaciti vrijednosti obiljezja X i nacrtati pravokutnike if
92 Deskriptivna statistika 4.3 Srednje vrijednosti 93

Primjer 4.4. Medu studentima Veleucilista u Varazdinu odabrano je razredi Ii I


26 i izmjerena im je visina u metrima. Dobiveni su sljedeci podaci: RI [1.575~i.635J 2 2/26 0.077
R2 [1.635, 1.695] 1 1/26 0.039
1.90,1.75, 1.75, 1.79, 1.60, 1.78,1.79,1.80, R3 [1.695,1.755J 9 9/26 = 0.346
= [1.755, 9 9/26 = 0.346
1.88,1.76,1.74, 1.91,1.79, 1.68,1.74, 1.83,1.77. = [1.815, 1.8751 2 2/26 = 0.077
R6 = [1.875,1.9351 3 3/26 = 0.115
U ovom primjeru statistiCko obiljezje X predstavlja visinu studenata. 2: n = 26 1.000
Najmanja vrijednost dobivena mjerenjem je 1.58 metara, a najveca 1.91

Prilikom crtanja histograma sirina pravokutnika vise nije proizvoljna -.ree


metara. Visina moze biti bilo koja vdjednost izmedu 1.58 i 1.91 metara.

je jednaka sirini razreda c = 0.06. Na x osi oznacimo granice interval a , a


. Stoga je visina jedno neprekidno statisticko obiljezje. Podatke cemo svrstati

visina pravokutnika jednaka je frekvenciji k


~ razrede na sljedeCi nacin:

!.
• Odredimo Xmin = 1.58 (najmanja vrijednost medu podacima) i Xmax =
1.91 (najveea vrijednost medu podacima) 10

• Odredimo broj razreda k: ne postoji egzaktan nacin odredivanja razreda, 8

u praksi se najcesce primjenjuje Sturgesovo pravilo prema kojem se


6

razreda racuna prema formuli:


4

k ,;;;1 + 3.31ogn 1 + 3.3 log 26 :::} k 6.


2
Broj razreda je obicno izmedu 5 i 15.
a,
• Odredimo sirinu razreda c iz formule
Slika 4.4.
c= Xmax Xmin 1.91 - 1.58 = 0.055 0.06
,(

zaokruzivanjem na vise i na onoliko decimal a na koUko su nam dani


4.3 Srednje vrijednosti
• Odredimo granice razreda R I , R2, ... , Rk (intervale) i za svaki razred Pod pojmom srednja vrijednost podrazumijevamo konstantu kojom se
izracunamo apsolutnu i rc1ativnu frekvenciju podataka koji pripadaju predstavlja niz varijabilnih podataka i oko koje se gomilaju vrijednosti nu­
odredenom razredu. merickog obiljezja. Srednje vrijednosti dijelimo napotpune i polol1ajne.
94 Deskriptivna statistika 4.3 Srednje vrijednosti 95

U potpune srednje vrijednosti ubrajamo: aritmeticku, harmonijsku i ge­ a;Jl2 J ~ 7 \ 8 1 9 \ l1JW41~_


ometrijsku sredinu. Znacajka potpunih srednjih vrijednosti je ta sto se u ~r3p-ll 2 3 5l 1 I il :q 1
iZfaeun uzmaju sve vrijednosti varijable. Polozajne srednje vrijed­
nosti odredene su polozajem podatka u nizu, a tu pripadaju: mod i medijan. Prosjecan broj bodova danih u tablici frekvencija racunamo ovako
U nastavku cemo def1nirati i objasniti najces6e koristenu potpunu srednju
vrijednost - aritmeticku sredinu, i obje polozajne srednje vrijednosti mod
i medijan.
x
4.3.1 Aritmeticka sredina 208
= 22 =9.45.
Neka su Xl, X2, ... , Xn izmjerene vrijednosti obiljezja X. Aritmeticka sre­
dina, u oznaci x definirana je formulom: Dakle, prosjecan broj bodova postignutih na prvom kolokviju je 9.45. .(
Ako su podaci grupirani u razrede, u formuli (4.2) vrijednost ai pred­
stavlja aritmetiCku sredinu sirine razreda. AritmetiCka sredina sirine razreda
x= Xl + (4.1) se ne mora podudarati s aritmetickom sredinom podataka u razredu, tako
n da se koristenjem ove formule za izracun aritmeticke sredine dobiva aproksi­
Aritmeticka sredina je jedna od najvaznijih mjera srednje vrijednosti. U mativna vrijednost aritmeticke sredine.
praksi se cesto naziva i prosjekom. Ako je poznata distribucija frekvencija
Ii), i = 1,2, ... , k skupa podataka, aritmeticka sredina takvog skupa je Primjer 4.6. Podaci 0 vremenu izvoaenja nekog pokusa dani su u sljedecoj

tablici:

a,;f; 8-~/l
x=---"'=-=:---::::--=----::-"= n
(4.2)
razredi
22-24
::22: +(5~')l{6-D)
Primjer 4.5. Na prvom kolokviju iz kolegija Statistika studenti su postigli 25-27 4
sljedece bodove: 14, 15, 11, 9, 14, 11, 2, 5, 9, 8, 2, 11, 11, 2, 9, 13, 5,
7, 8, 11, 15, 16. Iiracunajte prasjecan braj bodova postignutih na prvom
kolokviju.
5n~
Rjdenje: Odredite prosjecno vrijeme izvodenja pokusa.
Poredamo Ii podatke po velicini od najmanjeg do najveceg, dobit cemo niz Rjesenje:

2,2,2,5,5,7,8;8,9,9,9,11, 11,11,11,13,14,14,15,15,16. Najprije cemo odrediti aritmeticke sredine sirine razreda i taj broj uzimamo

Distribuciju frekvencija mozemo prikazati sljedecom tablicom kao vrijednost kojoj pripada frekvencija tog razreda.

Deskriptivna statistika 4.3 Srednje vrijednosti 97


96
odnosno
razredi \ Ii ai k k
22-24 2 23 I: (a; x? Ii < '2)a; - c)2fi' c f x.
25-27 4 26 ;=1 ;=1
28-.30 5 29
5. Aritmeticka sredina nije reprezentativna kada se u numerickom nizu
31-33 3 32
nalaze ekstremno male i ekstremno velike vrijednosti nekog obiljezja.
34-36 2 I 35
Prosjecno vrijeme izvoaenja pokusa je 4.3.2 Mod
23 . 2 + 26 . 4 + 29 . 5 + 32 . 3 + 35 . 2
x=------------­
Mod (Mo) iIi dominantna vrijednost je podatak u nizu izmjerenih vri­
2+4+5+3+2
jednosti Xl, X2, ••. , Xn S najvecom frekvencijom, odnosno podatak koji se
= 28.8 minuta
najceSce javlja u nizu vrijednosti.
./

Svojstva aritmeticke sredine: Primjer 4.7. Niz 1, 2, 2, 3, 3, 3, 4, 5, 5, 7 ima jedan mod: Mo 3.

Niz 1, 1, 2, 2, 2, 3, 3, 3,4, 4, 5, 5, 6 ima dva moda: Mo = 2 i Mo = 3.

1. Numericki niz Xl> X2, •.. , .'l:n ima sarno jednu aritmetiCku sredinu.
Niz 1, 2, 3, 4, 8, 9, 10 nema mod. ./

2. Aritmeticka sredina se uvijek nalazi izmeau najmanje i najvece vri­


Karla su podaci skupa grupirani u razrede, mod se raeuna po formuli
jednosti niza.
3. Aritmeticka sredina ima svojstvo da je suma odstupanja vrijednosti
Dl
Mo=Lo+ D D ·c, (4.3)
obiljezja X od x jednaka nuli, tj. 1 + 2

n gdje je
2:)Xi -x) =0,
;=1 Lo - donja granica modalnog razreda (razreda s najvecom frekv!Oncijom),
odnosno k Dl - razlika. apsolutnHi frekvencija modalnog i razreda ispred modalnog
I:(a;- x)/i = O. razreda, .
i=1

4. Zbroj kvadrata odstupanja vrijednosti obiljezja X od aritmeticke sre­ D2 - razlika apsolutnih frekvencija modalnog i razreda iza modalnog razreda,
dine je minimalan, tj. manji je od zbroja kvadrata odstupanja svih
vrijednosti obiljezja X od bilo koje druge proizvoljno odabrane vri­ c - sirina razreda.
jednosti, n n Primjer 4.8. Za podatke iz primjera 4.6 odredite mod Mo.
I:(Xi x? <I:(x;-c)2,cf x , • Rjesenje:
;=1 ;=1
98 Deskriptivna statistika 4.3 Srednje vrijednosti 99

Prema formuli (4.3) imamo Primjer 4.10. Za podatke iz primjera 4.6 odredite medijan M.
5-4 Rjesenje:
Mo = 28 + (5 _ 4) + (5 _ 3) = 28.33 ~ 28

sto znaCi da je najcesce vrijeme izvodenja pokusa 28 minuta. ..(


razredi fi
22-24 2
4.3.3 Medijan 25-27 4
28-30 5
Medijan (M) nekog skupa podataka poredanih u niz po velicini je vrijed­ 31-33 3
nost "sredisnjeg" podatka. Ako je broj podataka u nizu neparan, medijan 34-36 2
.Oje jednak vrijednosti u sredini niza. Medijan je jednak aritmetickoj sredini
dva sredisnja podatka ako je broj podataka u nizu paran. Medijan dakle Da bismo po formuli mogli izracunati medijan, u postojecu tablicu treba
dijeli niz elemenata poredanih po veliCini u dvije sku pine koje sadrze jednak ukljuciti stupac apsolutnih kumulativnih frekvencija "manje od" (a. k. f.
broj podataka. "manje od"). Dobivamo tablicu oblika:
Primjer 4.9. U nizu 10,10, 12, 15, 20 je M = 12, au nizu 2, 3,4, 4, 10,
4+ 10 razredi I fi I a. k. f. "manje od"
11, 11, 12 M = - 2 - = 7.

22-24 21 ____________!-,
.2?-3.L--±' 2
Kada su elementi skupa grupirani u razrede, medijan se racuna po formuli
08-30~. 11==)

M = LM + fk)
Ti -
( 2 fM . C, (4.4) ~!~~: ~------lJ
pri cemu je
Podatak koji se nalazi u sredini ovog skupa je !!. = 8. Kumulativnoj apso­

LM - donja granica medijalnog razreda, tj. razreda koji odgovara prvoj lutnoj frekvenciji "manje od" u nizu koja ukljucuje vrijedn9st 8 odgovara
kumulativnoj apsolutnoj frekvenciji "manje od" u nizu koja ukljucuje vri­ 3. razred kojemu je donja granica 28,,Pa je LM = 28.
~fi Prema (4.4) medijan je
. d n i

2.; 6)
Je nost "2 = -2-'

fk - kumulativna frekvencija prvog razreda iznad medijalnog,

M = 28 +( 16
·2 = 28.8 ~ 29,

fM - apsolutna frekvencija medijalnog razreda,


sto znaCi da se 50% pokusa izvodi 29 minuta ili manje od 29 minuta. ..(

Ilustracija aritmeticke sredine, moda i medijana za neparan broj po­


c - sirina razreda.
dataka n = 23 dana je na slici 4.5.
100
Deskriptivna statistika 4.4 Mjere rasprsenosti (disperzije) 101

Mod as 4.4 Mjere rasprsenosti (disperzije)


MadgeI'! "'84

Pri mjerenju mnogih pojava uocava se gomilanje podataka oko neke


srednje vrijednosti. Kada su vrijednosti niza mjerenja gusto grupirc.ne oko
srednje vrijednosti, tada ta srednja vrijednost dobro reprezentira rezultate.
o<! 00 (I (I U protivnom, ako grupiranost ima malu gustocu, tada srednja vri~ednost
~ iG~il357rl7.i~~~~~~~~T7.~~~
slabo reprezentira rezultate. Skupovi podataka mogu imati jednake sred­
nje vrijednosti, ali se mogu razlikovati po stupnju rasprsenosti (varijadje)
vrijednosti obiljezja. Prema tome, nije dovoljno poznavati sarno srednju vri­
jednost prikupljenih podataka nego treba poznavati i koliko podaci odstu­
paju od srednje vrijednosti. Najpoznatije mjere disperzije su: raspon vari­
Slika 4.5. jacije, interkvartil i koeficijent kvartilne devijacije, varijanca te iz n~e izve­
dena standardna devijacija i koefidjent varijacije. Sve ove mjere disperzije
Ilustracija aritmeticke sredine, moda i medijana za paran broj podataka mogu se izracunati za numericke podatke. Smisleno je mjeriti disperziju
n = 22 dana je na slid 4.6. istovrsnih i varijabilnih statistiCkih podataka, a ako su vrijednosti nekog
obiljezja medusobno jednake, disperzija ne postoji.

Mod-S6
? 4.4.1 Raspon varijacije
Medijan =85 '
Raspon varijacije Rx je najjednostavnija mjera rasprsenosti i predstavlja
razliku izmedu najvece i najmanje vrijednosti numeriCke varijable,
~ 91 1 "
,I Rx = Xmax - Xmin' (4.5)
" 9?O ~ 9 9) 9" 90 " "
Ako je = 0, disperzije nema jer su sve vrijednosti obiljezja jednake.
Prednost ove mjere rasprsenosti je njena jednostavnost u izracunu, a mana
je sto ovisi same 0 ekstremnim vrijednostima.

Primjer 4.11. Dva niza podataka 10,11,12,18 i 10,13,17,18 ima.ju isti


raspon, Rx = 18 10 8, ali nemaju istu dispe'rziju. Stoga je pot'rebno naci
Slika 4.6. pouzdaniju mjeru disperzije. ,f
102 Deskriptivna statistika 4.4 Mjere rasprsenosti (disperzije) 103

4.4.2 Varijanca
1 k
Varijanca je najvaznija mjera rasprsenosti vrijednosti numericke va­ n L- io,j2 - x 2
=-"'1
rijable. Do varijance dolazimo kvadriranjem pojedinacnih razlika vrijednosti i=1 .
obiljezja od aritmeticke sredine. Kvadriranje se provodi da bi se izbjegle
Matematicki, varijanca izrazava stupanj varijacije podataka od srednje vri­
gativne vrijednosti. Prema tome, varijanca je aritmeticka sredina kvadrata jednosti. Velika varijacija znaci da pojedinacni podaci uzorka puno odstu­
odstupanja iIi rasprsenosti vrijednosti numericke varijable X od njene arit­
paju od srednje vrijednosti, dok mala varijacija pokazuje malo odstupanje
meticke sredine, tj.
podataka od srednje vrijednosti.
(J
2 ~
= 1 L)Xi-X
-)2
. (4.6)
n 1=1 4.4.3 Standardna devijacija
Varijanca distribucije frekvencija dana je izrazom
Standardna devijacija (J je pozitivni drugi korijen iz varijance,

~
1 k k
1 n
;;:L i=1
,n=L
i=l
(4.7) (J -

n
L(xi - x)2,
1=1
(4.8)

Kvadriranjem izraza pod znakom sume i sredivanjem dobivamo prikladniju odnosno


formulu u obliku
(J
lk
Lfi(o,i x)2= ~Ik
-Llio,;- k
,n=Lk (4.9)
n 1=1 n 1=1 i=1
k
(J
2
= n1L-/I(o,i
",
- -x)2 Standardna devijacija je apsolutna mjera rasprsenja i predstavlja prosjecno
;=1 od8tupanje vrijednosti numericke varijable od njene aritmeticke sredine.
1 k
Jednostavnije niceno, standardna devijacija je broj koji mjeri koliko je uda­
= ...:.. 2: fi(o,;- 2o,ix + x 2) svaki broj u skupu podataka od njihove srednje vrijednosti. Ako je
n 1=1 standardna devijacija velika, znaCi da 8U brojevi rasprseni oko njihove sred­
1 k k k nje vrijednosti, a ako je mala, brojevi su u blizini njihove srednje vrijednosti.
-(2:/;0,;- 2xLlio,i +x 2
L
n i=1 i=l 1=1
4.4.4 Koeficijent varijacije
1 k
( Llia; 2x·x· n + Relativna mjera disperzije, koeficijent varijacije V je omjer standardne
n 1=1
devijacije i aritmeticke sredine pomnozene sa 100 (izrazava se u postocima),
k

= 1 'L-lio,i
" 2
2x-2 + (J

n 1=1 V = _ ·100,x=F o. (4.10)


x
104 Deskriptivna statistika 4.5 Zadaci za vjezhu 105

Koeficijent varijacije ne ovisi 0 mjernim jedinicama pa je prikladan za us­ godine rada Ii ai a f~


poredivanje disperzije raznorodnih numerickih nizova. VeCi koeficijent va­ 0-5. 56 2.5 6.25 350
rijacije oznacava za isti X vecu disperziju, odnosno manju reprezentativnost 5-10 83 7.5 56.25 5 4668.75
aritmeticke sredine. 10-15 106 12.5 156.25 5 16562.5
Iako nam standardna devijacija daje mjeru rasipanja od sredrije vrijed­ 15-20 59 17.5 306.25 5 18068.75
nosti, ta nam mjera ipak ne daje potpuno jasnu sliku tog rasprsenja. Ako 20-25 42 22.5 506.25 21262.5
imamo skup kojem su pojedine karakteristike izrazene velikim brojevima, 346 5 60912.5
onda ce i standardna devijacija biti izraZena velikim brojem. lato vrijedi i
za skupove karakterizirane malim brojevima gdje ce standardna devijacija
biti mala. Iz ovoga proizlazi da postoje teskoce u usporedivanju dva skupa u
..odnosu na standardnu dcvijaciju. Stoga ako trebamo usporediti dva skupa '~ka srcd'ma: -x
An't metlc = 4065
346 = 11 .75 .
s pbzirom na njihova rasprsenje koristimo koeficijent varijacije.
.. .. 60912.5 .
Standardna devlJacIJa: (Y = - 11.75 2, = 6.16
Primjer 4.12. U jednoj organizaciji klasificirani su radnici po godinama
rada provedenih u toj organizaciji. Dobiveni su sljedeci podaci: Koeficijent varijacije: V 16~~:5' 100 = 52.43%.

Dakle, prosjecne godine rada su 11.75, dok je prosjecno odstupanje 6.16


godina, odnosno 52.43%. /
godine rada broj djelatnika
0-5 56
5-10 83
10-15 106
15-20 59 4.5 Zadaci za vjezbu
20-25 42
1. Dani su sljedeCi brojevi: 1,2,5,6,4,4, 3, 4, 3, 2, 5, 1,5, 4, 5, 2, 1, 1,
3, 4. Odredite pripadnu tablicu frekvencija, graficki prikazite podatke
Odredite: aritmeticku sredinu, standardnu devijaciju i koeficijent varijacije. histogramom i poligonom frekvencija i izraeunajte aritmeticku sredinu
Rjesenje: danih brojeva.

Prosirimo danu tablicu stupcima s vrijednostima koje su nam potrebne za 2. Mjerena je visina (u centimetrima) 40 studenata. Odredite prosjecnu
izracun zadanih mjera. visinu studenta, mod i medijan prema podacima iz sljedece tablice.
106 Deskriptivna statistika 4.5 Zadaci za vjezbu 107

visina broj studenata 2,4,1,5,3,4,1,3,3,1,


1.59-1.64 4
1.64-1.69 6
3,5,4,3,1,4,5,4,1,3.
1.69-1.74 8 a) Sastavite tablicu distribucije frekvencija.

1.74-1.79 15 b) N acrtajte poligon frekvencija.

1.79-1.84 4 c) Nadite aritmeticku varijancu, standardnu i ko­


1.84-1.89 3 eficijent varijacije.

d) Odredite mod i LUv"'"J"'U,

3. Dani su brojevi 5, 1, 5, 3, 2, 3, 6, 5, 6, 1, 2, 5, 1, 6, 3, 1, 3, 4, 1, 6.
Sastavite tablicu frekvencija, graficki prikazite podatke te pronaaite
mod(ove) i medijan.

4. Iz statistickog skupa uzet je uzorak i dobivene su sljedece vrijednosti


promatranog obiljezja x:

2,0,1,3,2,2,1,6,4,5,
1,1,0,2,0,4,5,3,2,2,
6,3,1,0,1,2,2,3,5,2,
4,3,2,1,1,1,2,3,3,4.
a) Sastavite tablicu razdiobe f,..pl",pn(';

"'UJ""''"'U i standardnu devijaciju za

5. Izostanci studenata s iz kolegija Statistika, akademske go-


dine 2011./2012., bili su: 16, 6, 2, 4., 6, 6, 1, 7, 10. sati. Odredite
medijan.

6. Statisticki skup Gini 30 studenatajednog studija Veleucilista u Varazdi­


nu, a obiljezje X je dobivena ocjena iz Matematike 1. na prvom ispit­
nom roku. Dobiveni su ovi podaci:

4,3,4,3,1,3,4,3,3,3,
5.1 Tockovna procjena 109

Neka je X slucajna varijabla, odnosno promatrano statistiCko obiljezje.


Niz nezavisnih, jednako distribuiranih slucajnih varijabli Xl, X 2 , •.• ) Xn ko­
je razdioba jednaka razdiobi slucajne varijable X zovemo slucajnim
uzorkom duljine n. Tockovni procjenitelj Hi jednostavnije procjenitelj
e
nepoznatog parametra je slucajna varijabla

Poglavlje 5 T t(Xl, X2, ... , Xn)

definirana na slucajnom uzorku Xl, X2, ... , X n . Ovako definiranu


nu varijablu zovemo statistika. Raeunanjem vrijednosti statistike na po­
.Procjena parametara dacima iz slucajnog uzorka dobivamo broj blizak vrijednosti parametra.
Ako je ocekivanje procjenitelja jednako vrijednosti koja se procjenjuje, tj.
ako je
E(T) (j
Neka je Xl, X2, ... , Xn slucajni uzorak iz odredene raspodjele, npr. uzo­
rak iz Poissonove I'aspodjele je srednja vrijednost nepoznata, Hi uzorak takav procjenitelj se naziva nepristrani procjenitelj.
iz normalne raspodjele s nepoznatom sredinom i varijancom. Dok je u Pretpostavimo da je X sIucajna varijabla s ocekivanjem p, = E(X) i vari­
teoriji vjerojatnosti uobicajeno pretpostaviti da su svi parametri raspod­ jancom 0- 2 = Var(X). Da bismo procijenili vrijednosti p, i 0- 2 koristimo
jele poznati, u statistici imamo suprotnu situaciju, tj. koristimo prom a­ slucajni uzorak Xl, X2, ... , X n . Statistika
trane podatke kako bi generirali zakljucke 0 nepoznatim parametrima. U
ovom poglavlju predstavit cemo metode najvece podudarnosti za odredi­ - Xl+ X 2+",+Xn
X
vanje procjenitelja nepoznatih parametara. Takve procjene se zovu tockovne n
procjene jer se sastoje u odredivanju jedne vrijednosti kao procjene za nepoz­
nepristrani procjenitelj parametra p,.
nati parametar kciji zovemo e. Nadalje, razmatrat cemo problem dobivanja
intervala procjene, tj. odredivat cemo interval u kojem procjenjujemo da
Imamo:
lezi e. Takoder r~matramo pitanje kolika je pouzdanost koju bismo mogli
pridruziti takvom intervalu procjene.
E(X) = E + X2 + ... +
n
1
5.1 Tockovna procjena =-E(XI + +·,,+Xn )
n
1
Procjena parametara pojedine razdiobe zasniva se na prikupljenim nu­ n
(E(Xl) + E(X2) + ... + E(Xn))
meriCkim podacima koji Cine slucajni uzorak, te na odabiru odgovarajuceg 1
procjenitelja. = -:;;,np, = p,

108
110 Procjena parametara 5.1 Tockovna procjella 111

Dakle, ako SU Xl, X 2 , ••. , Xn jednako distribuirane slucajne varijable S oceki­ Iz definicije varijance slijedi:
vanjem p" ondaje i ocekivanje njihove aritmeticke sredine takoder p,. Statis­
tiku X nazivamo aritmeticka sredina uzorka ili uzoracka aritmeticka E(X2) = Var(X) + (E(X))2 Var(X) +
sredilla. Za konkretnu realizaciju uzorka
Kako su varijable Xl, X2, ... , Xn nezavisne i jednako distribuirane, imamo:
XI, X2, ... , X n ,
- 1
tj. za konkretne numericke podatke dobivene tijekom istrazivanja dobiva se Var(X) = zVar(X l + X2 + ... +XrJ
n
jedna realizacija 1
1 n = z(VarXl + VarX2 + ... + VarX n )
X LXi n
n i=l 1 2
-'(W
n2
.statistike 0'2
=
Slucajna varijabla n

8 2 = _1_ t(Xi _ X)2 KOllacno je:


n 1
i=l
je nepristrani procjenitelj varijance. Statistiku 8 2 llazivamo uzoracka vari­
janca.
E(82 ) 1 t
;=1
E(Xl) - n n 1 E(X2)

=
1
--nCO' 2
+ p,2 ) - -- -
n (0'2 + p,2)
Ocito je n-l n-l n
= 0'2.
8 2 =_1_ ~(Xi X)2
n-lL..­
i=l Za kOllkretnu realizaciju uzorka Xl, X2, ... ) Xn dobiva se

= nIt ( Xf - 2XiX + X2) 82 _ 1 n


i=l - n _ 1 ~(Xi - x)2
t=1

n~ 1 ( ~Xf -2X~Xi+X2~1
n n n )

leao jedna realizacija statistilee 8 2 •

n
1 (t xl -
;=1
2XnX + X2 n) Primjer 5.1. Mjerenjem neke duZine dobiveni su ovi podaei u em: 2.8,
2.7, 2.5, 2.5, 2.7, 2.6, 2.5, 2.6, 2.6, 2.6, 2.6, 2.5, 2.6, 2.8, 2.6, 2.7, 2.7.
Odredite tockovnu procjenu za ocekivanje i varijancu.

= n~ 1 (tXf .=1
nx2). Rjesenje:

112 (!) dled \ ~<:t,


I k'~ TrCXf. WriXi, ''vO" 11 Ctnt u
Pro<tjena parametara
5.2 Intervalna procjena 113
Tockovna procjena za ocekivanje je
5.2.1 Intervalna procjena ocekivanja J.k normalne razdiobe

2·2.8 uz poznatu varijancu

x =- - -__---:-::::--_____
Nekaje Xl, X2, ...) Xn slucajni uzorak iz normalne razdiobe s parametrima
= 2.624.
p, i 0"2 i neka je parametar 0"2 poznat. Nadalje, neka je

Za varijancu iznosi: X rv N(p" :)


1­ /..
l\-~ aritmeticka sredina tog uzorka. 'Iransformacijom slucajne varijable X, odnosno
standardizacijom dobivamo novu varijablu
~ 1 [2. (2.8
2
17 2.624)2 + 4· (2.7 2.624)2+
/? = ---Iii
8 X-p, X-p,
+ 4 . (2.5 - 2.624)2 + 7 . (2.6 - 2.624)2J
Z = 0"
0"2
'" N(O, 1).
n
= 0.00943.
Za a E (0,1) definiramo broj ZS!. koji zadovoljava
2

a
if <.{l(Z~)=1-2

i koji odredimo iz tablica A i B normalne razdiobe.


5.2 Intervalna procjena Vrijedi:
::; z ::; 1- a {=}
Intervalna procjena nepoznatog parametra 0 sastoji se u odredivanju

intervala [aI, a2} za koji uz vjerojatnost p = 1 - a mozemo utvrditi da

sadr2ii parametar 0, ~: p( - 0" ::; Z~) 1­ a {=}

P (-X - 0"
. -fo < < -X + Z<>2" • -=
-1"-
I/.
0")
yn 1 - a.
peal ::; 0 ::; a2) ~ 1 - a, a E (0,1). Tako je (1 - a) . 100% pouzdani interval za parametar p,:

Interval [al, a2j zovemo (1 - a) . 100% pouzdani interval za parametar


P, E [-X 0"- +
- z~ . fo,X 0"] .
. fo
O. Pouzdanost (1 - a) . 100% oznacava da ce u (1 a). 100% sluca­ Primjer 5.? Neka je X 2 , ... , X 64 slucajni uzorak iz normalne razdiobe
jeva interval [aI, a2} sadrzavati parametar () osnovnog skupa. a zovemo s nepoznatim ocekivanjem p, i varijancom 9.' Aritmeticka sredina uzorka je
rizik pouzdanosti i obicno za. rizik pouzdanosti uzimamo vrijednosti a = 39.7. Odredite 95% pouzdani interval za ocekivanje.
0.01,0.05,0.1.
Rjesenje:
114 Procjena parametara 5.2 Intervalna procjena 115

distribucije. Na slici 5.1 prikazana je t-razdioba s jedinicnom normalnom


Posto je Xl, X2, ... , X6'1 rv N(fJ" 9), to je Z = ; fJ, V64 rv N(O,
razdiobom. Za dovoljno veliki n (n > 31) Studentova razdioba se moze
1z q,(ZO.05) = 1 - 0.05 slijedi ZO.05 q,-1(0.975) 1.96. aproksimirati jedinicnom normalnom razdiobom.
2 2 2
AritmetiCka sredina uzorka je X 39.7 pa je 95% pouzdani interval za
parametar fJ, N(O,l)

r
l39.7
3
1.96· 8 39.7 + 1.96· '3]

8 [38.97,40.44]. / t razdioba

.(

.' 5.2.2 Intervalna procjena ocekivanja f.J, normalne razdiobe


uz nepoznatu varijancu
Nekaje Xl) X2) Xn slucajni uzorak iz normalne razdiobe s parametrima
"'j
o
fJ, i i neka su oba parametra nepoznata.
(}2
_
Neka je X rv N fJ" (12)
-n aritmetiCka sredina uzorka. Parametar (12 procijenju­
Slilm 5.1.

jemo statistikom 8 2 1 - X)2. Uvodimo novu varijablu Vrijedi:


n 1 P(t~(n-1) -5T-5 =l-a{=}
'-v--"
-t1_~(n-l)
T

Moze se pokazati da slucajna varijabla T ima tzv. Studentovu1 iIi t­ p(-t1_%(n 1)-5X8fJ,Vri-5tl_%(n-l)) I-a{=}
distribuciju s (n 1) stupnjeva slobode (s. s.) s funkcijom gustoce
n+1 P (X
-
(n - 1) .
8-
-5 fJ, -5 X + tl-~ -1)· £) -.
fo -1
/(x) = . (1+-n)--2 a.

Dakle, (1 a) ·100% pouzdani interval za parametar fJ" uz llepoznatu vari­


Pisemo:
janCl! je
T rv ten - 1).

Studentovu distribuciju prvi je izracunao W. S. Gosset, poznatiji pod pseudo­


nimom Student. Broj stupnjeva slobode predstavlja parametar Studentove
-
fJ,E [X-tl_%(n-l)· fo,X+
s ­
-1) . In],
str. 158. gdje se vrijednost t 1 _.9'. (n - 1) odreduje iz tablice D t-distribucije.
2
116 Procjena parametara 5.2 Intervalna procjena 117

Primjer 5.3. Thristicka agencija zeli oeijeniti koliko u prosjeku turisti nastupanja dogadajaA u n pokusa. Slucajna varijabla X ima binomnu
potmse na nekom pOd'NLCjU. U tu svrhu uzet je uzorak od 29 turista i do­ distribuciju, tj.
biveni su sljedeci podaei: x 1504 kn, a s 312 kn. Odredite 90% pouzdani X", B(n,p).
interval za pmsjeeni potroseni novae na tom podrucju.
Ocekivanje slucajne varijable X jednako je E(X) np, a varijanca Var(X) =
Rjesenje: npq, pri cemu je q = 1 p. Za dovoljno veliki n razdioba slucajne varijable
X moze se aproksimirati normalnom razdiobom, tj.
BuduCi da je Xl, X 2 , ... , X29 rv N(J-l, 0'2), to je T = ; J-l v'29 rv t(28).
X rv N(nv,npq).
Iz tablice t-distribucije odredimo vrijednost
Relativna frekvencija dogadaja A u n pokusa je
(n 1) t 1 _lU.(28) to.95 (28) 1.7011
2

Uvrstavanjem vrijednosti aritmeticke sredine X = 1504 kn i standardne


P X
n
devijacije s 312 1m dobivamo da je 90% pouzdani interval za J-l interval
Ako X ima normalnu razdiobu, onda i relativna frekvencija Pima normalnu
312 312]
[1504 - 1.701· v'29' 1504 + 1.701· v'29 [1405.45,1602.55). razdiobu s ocekivanjem

.( E(P) =E ( ~) ~E(X)
N apomena: Iako su intervalne procjene ocekivanja J-l konstruirane pod 1
pretpostavkom da podaci dolaze iz normalne razdiobe, one se mogu koristiti = ;np=p
u praksi i u onlm situacijama kada podaci dolaze iz neke druge distribucije.
Taka za velike uzorke (n > 30) za intervalnu procjenu ocekivanja J-l koristimo i varijancom
interval
0'
·-<JI.<X+z~·-
fo _f"'_
-
2
0'
fo' ~ =Var -;
Var(P) (X) n12 Var(X)
.

a za manje uzorke interval 1 pq


n 2npq =-;.
- 1) .
s - +
::; J-l ::; X (n - 1) .
s
X t 1-]'
Primijetimo da je ocekivanje procjenitelja P jednako vrijednosti koju proc­
jenjujemo pa je P= X nepristrani procjenitelj od p. Dakle, za dovoljno
5.2.3 Intervalna procjena vjerojatnosti n ~
i
veliki n, relativna frekvencija P je normalno distribuirana slucajna vari­
\
Pretpostavimo da izvodimo pokus n puta u kojemu dogad~j A nas­ jabla,
tup. s ;,tom vj""jatno'," p. Neka slu,.jn. "",,;jabls X /
I
b<oj P rv N(p, r;:).
118 Procjena parametara 5.3 Zadaci za vjezbu 119

Standanli,oeijom ,~,ijabl, Pdobivamo novu _ijablu l' ~ ~ koja ima cemo odrediti procjenu

~ 997 .

P = 2000 = 0.4985.

jedinicnu norm ainu razdiobu, tj.

p P-p Iz q,(Z!kQl) =1 - 0.01 slijedi ZO.005 = q,-1(O.995) = 2.575.

fij '" N(O, 1). 2


Prema tome, 99% pouzdani interval za vjerojatnost pojave pisma je

Tada imamo: [0.4985-2.575.V 0.4985~OOOO.4985) , 0.4985+2.575· 0.4985(1 - 0.4985)] =


2000
P(-Z~:SP:S )=1 a{:}

= [0.469, 0.527].
P( - S z~) 1 a{:} ,f

(
P P~ - ~ :S p :S P~ + Z% . V.-;:
. V-;: ~) 1 - a. 5.3 Zadaci za vjezbu
Dakle, (1 a)· 100% pouzdani interval za vjerojatnost p dogadaja A je 1. Obavljeno je 32 mjerenja i dobiveni au sljedeci podaci u sekundama:

[~
pEP - z}: .
~ ~
V-;:' ~]
P + z~ . V-;: . 15,18,14,23,17,11,16,25,

10,15,17,16,11,13,15,16,

Da bismo mogli odredite ovaj interval sadrzi nepoznati parametar p, p


zamijenimo procjenom 21,14,22, 12,13,

17,20,18, 16,19,19,18.

Tako dobivamo interval

J
[ p~ _ . P(l- P) ,P+·
~
n
P(1- P)] J n
Procijenite x i 0' i liz pouzdanost 95% intervalno procijenite ocekivanje

varijable osnovnog skupa.

2. Pod odredenim uvjetima isti je pokus ponovljen 120 puta. Dogadaj


koji u praksi koristimo za odredivanje (I - a) . 100% pouzdanog intervala A nastupio je u 25 pokusa. Uz pouzdanost 90% intervalno procijenite
za vjerojatnoat p. vjerojatnost p dogadaja A.
Primjer 5.4. Novci6 je bacen2000 puta, pismo je palo 997 puta. Nadite 3. Mjerimo visinu covjeka. Pozhato je da visina covjeka ima normalnu
99% pouzdani interval za vjerojatnost pojave pisma. razdiobu s varijancom 64cm 2 , ali je parametar srednje vrijednosti f.1
Rje§enje: nepoznat. Na sluc:ajan naein odabrano je n = 100 osoba i izmjerena
120 Procjena parametara

im je V1Sma. Zbroj svih dobivenih visina iznosi 16910 em. Kolika je


procjena za fL? Za parametar fL nadite interval sa svojstvom da sadrzi
pravu vrijednost fL uz pouzdanost od 95%.
4. Na temelju podataka dobivenih mjerenjem aktivne supstance u sluca­
uzorku od 200 tableta nekog lijeka izracunato je da je prosjecna
vrijednost 0.824 mg sa standardnom devijacijom 0.042 mg. Kolike su Poglavlje 6
granice intervala u kojem se nalazi srednja vrijednost mase aktivne
supstance cijelog osnovnog skupa tableta uz pouzdanost 95%?

5. Anketa je u jednom gradu pokazala da 62% zena pusi. Odredite


98,86% pouzdani interval za vjerojatnost da slucajno odabrana zena
Testiranje statistickih hipoteza
pusi ako je anketom obuhvaceno 100 zena.

6. Iz 26 mjerenja neka velicine uz jednake uvjete dobivena je aritmeticka


sredina x = 27.51 i standardna devijacija s 2.2. Ako ta velicina ima "\ U prethodnom poglavlju govorili smo 0 metodama kojima se pomocu
normalnu razdiobu, intervalno procijenite njenu stvarnu vrijednost uz \ uzoraka procjenjuju odredene karakteristike osnovnog skupa. Sada se pos­
pouzdanost od 99%. \~avlja pitanje koliko su te procjene pouzdane, odnosno s kojom sigurnoscu
il+ozemo rezultate dohivene na uzorku prosiriti na citavu populaciju.
D~~le, prije svega smo zainteresirani koristiti rezultat uzorka da bi testi­
rali\hipotezu koja se odnosi na te podatke. Za primjer pretpostavimo da
je gr devinska tvrtka upravo kupila velike koliCine kabela koji zajamceno
imaju prosjecnu lomnu cvrstocu materijala od najmanje 48 Mpa. Kako hi
provje ila tu tvrdnju, tvrtka je odlucila uzeti slucajni uzorak od 10 kabela
da se u yrdi njihova lomna cvrstoca. Koristit ce rezultat ovog eksperimenta
da utvr . da Ii prihvatiti iIi ne prihvatiti hipotezu proizvodaea da je srednja
vrijednos lomne cvrstoce najmanje 48 Mpa.
Da bi se 0 ustanovilo razvijeni su postupci koji se u praksi nazivaju statis­
ticki testri.

Hipdteza je svaka pretpostavka 0 parametru distribucije (parametarska


hipoteza~ iIi 0 citavoj distribuciji (neparametarska hipoteza). Statistic •
test ili tfstiranje je provjera istinitosti hipoteze. U postupku tes . anja.
hipoteza postavljamo dvije hipoteze: nul hipotezu Ho i alt nativnu

121
6.1 Testiranje hipoteze 0 parametru ocekivanja
122 Testiranje statistickih hipoteza normalne distribucije uz poznatu varijancu 123

hipotezu Hi. Te dvije hipoteze mcausobno se iskljucujn. Testiranje se 6.1 Testiranje hipoteze 0 parametru ocekivanja
provodi tako da se na temelju realizacije Xl, X2, ... , Xn slucajnog uzorka normalne distribucije uz poznatu varijancu
Xl, ... ,Xn pronaae statistika testiranja hipoteza, tzv. test statistika,
koja je informativni sazetak podataka koji su najrelevantniji u razlikovanju Neka je X normalno distl'ibuirana slucajna varijabla s nepoznatim oceki­
od Ho i da se oformi skup brojeva koji zovemo kriticno podrucje. vanjem p, i poznatom varijancom 0'2 i neka je X J , X 2 , ... , Xn slucajni uzorak
Rezultat testa moze biti prihvacanje iIi odbacivanje nul hipoteze, a odluka duljine n.
se donosi na sljedeCi nacin: ako ostvarenje test statistike pripada kriticnom
podrucju, Ho se odbacuje u korist Hi, u protivnom se Ho prihvaca. Prilikom Dvosmjerno testiranje
testiranja moze se pogrijesiti, tj. moze se donijeti kriva odluka. Postoje
vrste pogresaka. Vjerojatnost a da se odbaci hipoteza Ho ako je ona istinita Na terdelju slucajnog uzorka proizvoljne populacije zelimo testirati je Ii
l}aziva se nivo signifikantnosti iIi razina znacajnosti. To je pogreska ocekivinje 11 te populacije jednako unaprijed zadanoj numel~ftjeEl~i
prye vrste. Pogreska druge vrste je vjerojatnost prihvacanja hipoteze 110. ~Nul hipotezu i alternativnu hipotezu postavljam~sljedeCi
H~ ako je ona neistinita. Tu vjerojatnost oznacavamo sa (3. Vjerojatnost
1 - (3 odbacivanja nul hipoteze kada je ona neistinita zove se jakost testa. Ho : 11 = 110
U postupku testiranja a i (3 trebaju biti sto manji, 0: se najcesce zadaje
unaprijed i to s vrijednostima 0: = 0.01 iii 0: = 0.05 Hi a O.l. HI : 11 i=
Dahle, eilj statistickog testa nije eksplicitno utvrditi je li Ho istinita iii Test statistika koju koristimo je
nije, vee je Ii njena valjanost u skladu s rezultirajueim podaeima. Ovako
postavljeni eilj Cini razumnim da Ho treba odbaciti ako su rezultirajuCi po­ z =---'t"­
daei vrlo malo vjerojatni kad je Ho istinita. Klasican naGin provoaenja ovog
postupka je odrediti vrijednost a, a zatim zahtijevati da test ima sljedece i zovemo je Z test.
svojstvo: kad god je Ho tocna, vjerojatnost da ee biti odbacena nikada nije
Uz uvjet daje hipoteza Ho istinita, aritm~iCka sredina X uzorka Xl, X2, ... ,
veea od a.

Xn ima prema Centralnom granicnomeOl'emu norm aInu distribueiju s


U sljedecoj tabliei prikazani su svi moguCi slucajevi s obzirom na istinitost
2
hipoteze Ho i pravilnosti odluke: 11 i ~, a test statistika Z ediniCnu normalnu. Tada je na
n
a vjerojatnost prihvacan'a
Hipoteza Ho Istinita Neistinita
Prihvaca se Pravilna odluka Pogreska druge vrste
Odbaeuje se Pogreska prve vrste Pravilna odluka
Dakle, ako je se prihvaca. Hipoteza Ho se
U ovom poglavlju obradit cemo parametarske statistiCke testove koji se odbacuje ako je djetimo se: broj zadovoljava
odnose na testiranje hipoteze 0 parametru ocekivanja i jedan neparame­
jednakost if>(z.s!.) -1 (1 - ~), a odrectujemo ga iz
tarski test, X2 test, koji testira hipotezu da obiljezje nepoznate razdiobe 2

ima neki odreaeni zakon razdiobe. tablica A i B normalne


6.1 Testiranje hipoteze 0 parametru ocekivanja
124 Testiranje statistickih hipoteza normalne distribucije uz poznatu varijancu 125

N(ji, (J'2)

-Za Z",
2
2 -Za ji

SUka 6.1.

Jednosmjerno testiranje Nairne, ako je Ho tocna, prava 'ednost E(X) = /1- veca je ili jednaka /-hO.
Tada u stvarnosti Z irna oeeki D iIi nesto vece od nule. Vjerojatnost
Ako zelirno testirati hipotezu da je ocekivanje populacije vece iIi jednako da Z bude manje od -Za: manje je najvise jednako a. Ako se to za neki
unaprijed zadanoj nurnerickoj vrijednosti /1-0, hipoteze zapisujemo kao: a ipak dogodi, srnatrarno da naSa nije tocna. Kod jednosrnjernog
na gornju granicu kriticno je interval (za, +oo).
Ho : p,?'.: /1-0
HI: p, < P,o·
N (f.J, (J'2 ) N (f./ll , (J'2 )
Ovaj test se naziva i jednosmjeran test na donju granicu.

Jednosmjernim testom na gornju granicu kod kojeg su hipoteze postavlje­


ne kao:
Ho : p,:::; /1-0
HI : /1- > /1-0
testira se hipoteza da je ocekivanje populacije rnanje ili jednako unaprijed
zadanoj numerickoj vrijednosti /1-0.
ji Jio Za;
U oba jednosmjerna testa koristi se test statistika Z test. U slucaju jednos­
mjernog testa na donju granicu, kriticno podrucje je interval (-00, -za). SUka 6.3.
mDO];eZe 0 parametru ocekivanja
126 Testiranje statistickih hipotcza uz nepoznatu varijancu 127

6.2 Testiranje hipoteze 0 parametru ocekivanja vrijednosti (n -1), t 1 -1), ta(n-1), tl-a(n-l) odrede se iz tablice
normaIne distribucije uz nepoznatu varijancu D uz napomenu: t~ (n - 1) i to. (n 1) = 1)

Neka je Xl, X2, ... , Xn slucajni uzorak iz normalne distribucije s oceki­ Dvosmj testiranje
vanjem p i varijallcom (J2 te pretpostavimo da su oba parametra p, i (J2
llepoznata. Nepoznato ocekivanje procjelljujemo statistikom

n,
Za zadanu raz~nu znacajnosti 0: nul lllpu{,e~u
a. nepoznatu varijancu procijenjujemo statistikom nost test stati~tike t < (n ­ 1) iii t >

82 _1_ ~ (Xi X)2.


n-1L...­
i=]

I U ovom slucaju zelimo provesti dvosmjerno i jednosmjerno testiranje. Ko­


ristimo test statistiku
T=X-po. 'n
8 v'"
nazivamo t test. T ima Studentovu distribuciju s - 1) stupnjeva
. ()'.

2
slobode.

Testiranje hipoteze Ho prema alternativnoj hipotezi provodi


se na sljedeci nacin:
- na temelju realizacije x 1, ... , Xn slucajnog uzor ka Xl, ..., X n izracuna se
Slika 6.4.
_ +:"+Xn
x
n
Jednosmjerno testiranje na donju granicu

- X)2 + ... (Xn - x)2] Ho : p ;:: P,o,

=}s=Vii Hl: P,<P,o


- izracuna se vrijednost t test statistike T Za zadanu razinu znacajnosti 0: nul hipotezu Ho odbacujemo ako je vrijed­
- odredi se razina znacajnosti 0: nost test statistike t < ta (n - 1).
i
I
I

128
I
Testiranje statistickih hipoteza 6.2 Testiranje hipotezt 0 parametr ocekivanja

normalne distribucijel uz nepoznatu varijancu

129

Primjer 6.1. lz jednjkutije slucajno je ~zvadeno 10 cokolada deklarirane


mase .100 grama ii3'
Z
jerena im je mas a ~ gramima. Dobiveni su sljedeci
podac$:
9 ,100,100,101,99,99,9 ,100,99,101.
Da Ii na temelju i mjerenih podataka, uz fnacajnost a 0.01, proizvodac
cokolade smije deklarirati masu rokolada 01100 grama? Masa cokolada ima
normalnu razdiob~.
I
Rjesenje: I
la(n-l)
Imamo: flo =: 100
10, 'a e -
= 0.01.
Slika 6.5.
, 2
'" N(p., a )

Jednosmjerno testiranje na gornju granicu


Postavljamo hipoteze:

40tf21~
Ho : fl S {lo
Ho : fl = 100 (tvrdnja proizvodaca cokolada)
...
HI: {l > /1,0
HI : {l f:. 100
Za zadanu razinu znacajnosti a nul hipotezu Ho odbacujemo ako je vrijed­

nost test statistike t > tl-a(n -1). Rijec je 0 dvosmjernom t testu. Da bismo izracunali njegovu vrijednost,

najprije trebamo izracunati aritmeticku sredinu uzorka i procijeniti nepoz­

natu varijancu. Aritmeticka sredina uzorka je

- _ 98 + 4·99 + 3 ·100 + 2 ·101 _ 99


x- 10 - .6,
a varijanca uzorka
2
8 = _1_[(98-99.6)2+
10-1 4 .{99-99.6)2+ 3.(100-99.6)2+ 2'(101_99.6)2J = 0.93.

Odatle je 8 = 0.96. Vrijednost t testa je

t1_,,(n-l)
t = 99·~.~6100 . vTi5 == -1.32.
Treba odrediti i kriticno podrucje
Slika 6.6.
K = <-00, -tl _!@!(9»)
2
U (t 1_ om (9), +001 =
2
6.3 Testiranje hipoteze 0 parametru ocekivanja

130 Testiranje statistickih hipoteza proizvoljne distribucije na osnovi velikog uzorka


131

= (-00, -3.2498) U (3.2498, +(0). Kako se vrijednost z = 1.84 test statistike Z nalazi u kriticnom
na razini znacainosti od 5% odbacujemo
BuduCi da se vrijednost t testa t -1.32 ne naiazi u kriticnom
Ho se prihvaca.
dostave je vece od oglasenog vrernena. ,f

Zakljucak: Proizvodac cokolada deldarirati masu cokolada od 100


grama uz razinu znaca inosti od ,f
6.3 Testiranje hipoteze 0 parametru ocekivanja
Primjer 6.2. U oglasu jedne varazdinske pizzerie stoji kaka ce se narucena proizvoljne distribucije na osnovi velikog uzorka
dastaviti na kucnu adresu za 1 sat' ad primitka narudzbe. Iz
slucajnog lLzarka od 85 narudzbenica izracunat je x = 65 minuta i s 25 Pretpostavimo da je Xl,X 2 , ••• , dis­
minuta. Pretpostavimo da je vrijeme dostave pizze normalno distdbuirano. tribucije s nepoznatim ocekivanjem {k i ne]pmma,tOlll
Testirajte na razini znacajnosti od 5% je Ii vrijeme dostave vece od vremena
danog u oglasu. Zelimo testirati:
Rjesenje: ,
1.
Irnamo: {ko = 60, n = 85, x = 65, s 25, a 0.05. Ho : Ji = /1'0

HI : Ji i: {ko,

Xrv
2.
Koristirno JCUIlOt)l;I test na hipoteze na Ho: {k ~ Jio
naGin:
HI: {k < /1·0,
: f1 60 iz oglasa) 3.
Hl : f1 > 60 Ho : Ji ::; JiO
HI: Ji > Jio·
Kad u test statistiku Z = X ~ {k°fo uvrstimo izracunate vrijednosti dobi­
varno: koristimo t test kao test statistiku koja za dovoljno veliki
65 - 60 n ima iedinicnu normalnu razdiobu, tj.
z=~ . v'85 = 1.84.

Kriticno podrucje je: T ~ Z rv N(O, 1).

K = (ZO.05, +(0) = «P-l(l ­ U slucaju dvosmjernog testa kritieno podrucjeje K = ,+(0).


U slucaju jednosmjernog testa na donju granicu kritiCno podrucje K =
(-00, - za), au slucaju jednosmjernog testa na gornju j;(ranicu K
132 Test hipoteza 6.4 X2 test 133

6.4 X2 test XHI rubovi i-tog razreda

U ovom poglavlju govorit cemo 0 jednom vaznom ncparametarskom - ako je za neki i ei < 5, spajamo susjedne razrede tako da frekvencije budu
testu koji se naziva x2 (hi-kvadrat) test ili Pearsonoyl test. Ovaj barem 5. Na taj naCin dobije se broj razreda za koji je frekvencija ba.rem
statisticki test koristimo kada testiramo hipotezu da obiljezje X nepoznate 5. Neka je taj broj k.
distribucije ima neki odredcni zakon distribticije (binomni, Poissonov, nor­
malan, ... ), tj. testiramo: - izracunamo vrijednost test statistike
k
Ho : distribucija osnovnog skupa jednaka je zadanoj teorijskoj distribuciji 2
X L
i=1
ei

.HI : distribucija osnovnog skupa nije jednaka zadanoj teorijskoj distribuciji


koja je pribliznOfdistribuirana po zakonu X2 razdiobe s k r 1 stupnjeva
Testiranje proyodimo na sljedeci nacin: slobode (s. s.), pri cemu je k broj razreda, a r broj procijenjenih paramet..ara
(r = 1 za binomnu i Poissonovu distribuciju, a za normalnu je r = 2).
- iz populacije na slucajan nacill izaberemo uzorak duljille n (slucajna vari­
X ostvarila se n puta); X2 predstavlja mjeru odstupanja istinite razdiobe od zadane. Stoga hipo-;ezu
Ho valja odbaciti ako je vrijednost test statistike X2, koja je izraeunata iz
- ako pararnetar (j distribucije nije poznat, procijenimo ga na temelju uzorka konkretnog uzorka, veea od odredene kriticne vrijednosti X;;,(k - r 1). Th
... ,xn); kriticnu vrijednost za zadanu razinu znacajnosti a: i odredeni broj stupnjeva
slobode nalazimo u tablici C u prilogu.
- podrucje vrijednosti slucajne var'ijable X podijelimo u disjunktne inter­
vale, razrede;

odredimo apsolutne frekvencije Ii, Ii­ elemenata uzorka koji se nalaze


k
u i-tom razredu. Mora biti 2:: Ii n,
;=1

- odredimo teoretske ocekivane frekvencije ei na temelju pretpostavljene


distibucije:

• ako je obiljezje X diskretno, ei = n . P(X = xd


z~(k-r-l)
• ako je obiljezje X neprekidno, ei = n· P(Xi ::::; X ::::;
gdje su Xi i
lvidi str. 157.
SHka 6.7.
134 Testiranje statistickih hipoteza 6.4 test 135

U tablici C su dani podaci do 30 stupnjcva slobode. Ako je broj stupnjeva Racunamo ocekivane frekvencije:
slobode veti od 30, primjenjuju se tablice povrsina ispod normalne krivulje,
tablice A i B. ei = n'P(X =
e-). XCi
Primjer 6.3. Tablicom je prikazan braj automobilskih nesreca ()~!Jezemn n'
ti.iekom 50 dana u jednom gradu u Hrvatskoj. Uz razinu znacajnosti a 1% e- O.9 0.9 Xi .
testirajte hipotezu ima Ii bra) nesreca X biljeienih u 50 dana Poissonov~t =50· z=0, ...,4.
distribuciju?
Dobivamo sljedecu tablicu:
braj nesreca Xi ~

o Xi Ii Ci
1 18 20.33
0 21
2 7 1 18 18.30
3 3 2 8 8.23
4 1 3 2 2.47
4 1 0.56
Rjesenje:
Kako je e3 < 5 i C4 < 5, spajamo posljednja tri razreda. Tako ukupno
Testiramo: imamo 3 razreda, ti. k = 3.

: X "-' P(A)
(fi - ei?
HI : X nema Poissonovu distribuciju Xi Ii C;
C'
0 21 20.33 0.02
Procijenimo nepoznati parametar A. Kako je kod Poissonove distribucije 1 18 18.30 0.0049
E(X) = A, to je 2 11 11.26 0.006
I: 50
A=X
fixi
Dahle, vrijednost test statistike X2 je
n
18 + 14+ 9 +4
50 2 (fi - Ci)2 = 0.031.
'X2= ei
= 0.9. ;=0
136 Testiranje statistickih hipoteza 6.4 test 137

Za broj razreda k = 3, broj procijenjenih parametara r = 1 i razinu znaea­


x, a (J'N s 8
2
Za izracun ovih procjenitelja treba najprije odredi:;i sredine
jnosti Q = 1% odredujemo kriticno podrucje
razreda.
- r - 1), [X5.01(3 - 1-1), zaposlenica Ii sredina razreda Xi

[X5.01 (1), +00) 1


147

149.5 - 154.5 3
152

+00).
154.5 - 159.5 7
157

Kako je X2 ~ 0.031 < 6.63 = X6.01(1), Ho se ne odbacuje, tj. 159.5 - 164.5 10


162

prihvaca se hipoteza da je broj automobilskih nesreca distribuiran po Poisso­ 164.5 - 169.5 11


167

novoj razdiobi. ./ 169.5 - 174.5 8


172

174.5 - 179.5 3
177

P'rimjer 6.4. Mjerenjern visina zaposlenica VELV-a dobiveni su sljedeci


podaci: Racunamo:

visina Vi broj zaposlenica Ii x = 1 . 147 + 3 . 152 + 7 . 157 + 10· 162 + 11 . 167 + 8 . 172 + 3·1 '77 = 164.33

144.5 149.5 1

- 154.5 3
s2 = :2 [(147-164.33)2+3.(152-164.33)2+ ... +3.(177-164,33)2] = 52.8
154.5 - 159.5 7

159.5 - 164.5 10
=> X I'V N(164.33, 52.8)
164.5 - 169.5 11

Nadalje, raeunamo ocekivane frekvencije


169.5 - 174.5 8

174.5 179.5 3
ei n . P(Xi ::; X ::;
L 43

=n' ( X'+l
t 8 x) !l? (X'-t-8-- x) ], i 1, .. " 7,
Testirajte na razini znacajnosti od 5% pripada Ii spornenuta razdioba nor­
rnalnoj distribuciji. Imamo:
Rjesenje:
= 43. [!l? (149 164.33) -!l? (145 164.33)]
Testiramo: el 7.27 7.27
43· [!l?( -2.11) - !l?( -2.66)] 43· (0.0174 - 0.0039) = 0.58
Ho : X '" N({t,
: X nema normalnu razdiobu
= 43. [!l? (154 164.33) -!l? (150 164.33)

Parametri normalne distribucije, {t i (J2 nisu poznati, pa ih moramo pro­ e2 7.27 7.27

cijeniti. Odavde odman slijedi da je r = 2. Znamo da {t procjenjujemo s = 43 . [!l?( -1.42) -!l?( -1.97)J 43· (0.0778 - 0.0244) 2.3
138 Testiranje statistickih hipoteza 6.4 X2 test 139

Prema tome, vrijednost test statistike X2 je


= 43. i(]} (159 -164.33) _ (]) (155 164.33)]
4
1"3 7.27 7.27
x2= L =3.04.
= 43· [(])( -0.73) - (])(- 1.28)] = 43 . (0.2327 0.1003) = 5.69 i=l ei

Kriticno podrucje je
43. [(]) (164 -164.33) (]) (160 -164.33)]
[x;(k - r - 1), +00) = [X5.o5(1), +00 >= [3.84, +00).
e4 7.27 7.27

43· [(])( -0.05) (])(-0.6)J = 43 . (0.4801 - 0.2743) = 8.85 Kako jc X2 < X6.05(1), zatdjucujemo da je razdioba zaposlenica VELV-a
distribuirana prema normalnoj distribuciji. ,(

= 43 . [(]) (169· 164.33) _ (]) (165 - 164.33) ]


Primjer 6.5. U jednakim vremenskim intervalima kontralor prilazi au­
e5 7.27 . 7.27
tomatu, pregledava uzorak od 5 praizvoda i utvrduje braj ispravnih proizvoda
= 43 . [(]}(0.64) (]}(0.09)] 43· (0.7389 - 0.5359) 8.73 u uzorku. Nakon 50 obilazaka dobiveni su sljede6i podaci:

Xi fi
43. (174 - 164.33) _ (]) (170 - 164.33) ]
i (]) o 5
e6 I 7.27 7.27 1 10
= 43 . [(]}(1.33) - (]}(0.78)] = 43· (0.9082 - 0.7823) = 5.41 2 16
3 13
4 4
= 43. [(]) (179 - 164.33) (]) (175 164.33)]
5 2
e7 7.27 7.27

= 43· [(]}(2.02) (]}(1.47)] = 43· (0.9783 - 0.9292) = 2.11 Pod pretpostavkom da automat uvijek daje isti postotak ispravnih proizvoda,
testirajte na razini znaiSajnosti od 10% hipotezu 0 binomnoj razdiobi po­
BuduCi da je el < 5, e2 < 5 i e7 < 5, spajamo prva tri razreda i posljednja
dataka.

hl
dva razreda. Tako ukupno imamo 4 razrcda. Dakle, k = 4.
Rjesenje:
f; ei -~)' Kontrolor uzima uzorak od 5 proizvoda. Menu njima moze biti 0, .. " 5

un

8.57 . ··0]9 ispravnih proizvoda pa je


2 10 8.85 0.15 X rv B(5,p).
3 11 8.73. 0.59 Parametar p cemo procijeniti. Za binomnu razdiobu vrijedi E(X) = 5 . p.
4 11 7.52 1.61
2::43 3.04 Procjenitelj za E(X) jednak je x pa slijedi da je procjenitelj za p jednak ~
140 Testiranje statistickih hipoteza 141
6.5 Zadaci za vjezbu

2.14, to je Kako je 0.13 = < X5.1 (4 - 1- 1) X5.1 (2) 4.61,

Ho, odnosno zakljucujemo da su podaci rasporcaeni po UHlU11111U I

2.14
P -5- 0.43. .f

Racunamo ocekivane frekvencije


6.5 Zadaci za vjezbu
ei = n·P(X =
L Obavljeno je 69 mjerenja neke slucajne pojave. Podaci su dani tabli­
= 50· 0.43 i O.575- i
, i = 0, ... ,5. com

10123456

'eo 50· (g)0.4300.57 5 =


h [14 24 17 9 2 2 1

el = 50· G)0,43 10.574 11.34, Uza= testirajte hipotezu da X dolazi iz Poissonove distribucije.

e2 50 . @0,43 2 0.573 2. Jedna pekara pece, izmedu ostalih, i kruh mase 800g. Zbog sumnje
da jc doslo do promjene mase slucajno se uzima 36 komada kruha
e3 = 50· (~)0.4330.572 = 12.92, te su dobiveni podaci: x = 790g, 8 = 50g. Moze Ii se s pragom
signifikantnosti od 1% smatrati da je doslo do promjene mase kruha?
e4 = 50 . (~)0.4340.571 = 4.87, 3. Mjerenjem tezine 20 cokolada deklarirane netto tezine 100g dobivena
je aritmeticka sredina x = 98g i uzoraCka varijanca 8 2 2.42. Mozemo
e5 50· (~)0.4350.57° 0.74. Ii na temelju izmjerenih podataka uz znacajnost a = 0.05 zakljuciti

da je stvarna netto tezina manja od 100g?

Buduei da je eo < 5, e4 < 5 i e5 < 5, spajamo prvi i drugi razred, cetvrti i

peti. Na taj nacin dobivamo ukupno k. 4 razreda. 4. Proizvodnjom automobila bavi se 270 proizvodaca u regiji. Pret­
postavlja se da oni prosjecno zaposljavaju po 6 radnika. U slw:ajnom
uzorku od 25 proizvodaca automobila prosjecan broj zaposlenika izno­
Xi Ji ei '1 ei)2 sio je 4.9 sa standardnom devijacijom od 2 radnika. Testirajte s
1
15
14.35
2
16
17.12
rTI c·
3
0.07 ,~
signifikantnosti.

5. U prodavaonici se razmatra moguenost promjene procesa prodaje.


3 13
12.92 0.0005
I

I
4
6
! 5.61
I: 50
i

I ..
.0.03
0.13
Pl'omjena je isplativa ako dobit poraste iznad trenutnih 80 kn pros-
po pl'oizvodu. U probnom procesu prodano je 164 pl'oizvoda s
prosjecnom cijenom prodaje ad 76 kn i standardnom devijacijom ad 21

142 Testiranje statistickih hipoteza 6.5 Zadaci za vjezbu 143

kn. Uz 99% pouzdanosti, odnosno signifikantnosti od procijenite Testirajte na razini znacajnosti od pripada Ii spomenuta razdioba
isplativost promjene procesa prodaje. normalnoj distribuciji.
6. U jednoj telefonskoj centrali biljeze se pogresni spojevi ujednoj minuti. 9. U prometni evor dolaze voziia iz odredenog smjera. T'rodnevnim pro­
BiIjezenjem takvih spojeva u 50 minuta dobivamo sljedece podatke: matranjem broja vozila po satu dobiveni su sIjedeCi podaci:

Xi Ii
1 15
o 9
1 31
2 12
2 22
3 9
3 9
4 4 4 1
5 2
6 1 Testirajte hipotezu 0 binomnoj razdiobi broja vozila uz pouzdanost
Ako pretpostavimo da je razdioba broja minuta u kojima je bilo od 95%.
0, 1,2, '" pogresnih spojeva Poissonova, testirajte hipotezu pomocu
2
X testa s pragom signifikantnosti od 5%.

7. Izmjerena je masa (u gramima) slucajno odabranog uzorka od pet


vrecica secera odredenog proizvodaca na kojima je deklarirana masa
od 1 kg. Dobiveni su sljedeci podaci:

985,985, 975,995.

Je Ii prosjecna masa vreCica secera manja od deklarirane (a 0.05)?


3. Uzorak od 60 domaCinstava dao je sIjedecu potrosnju voca u kilogra­
mima:

Xi I Ii
0-0.3 6
0.4 - 0.7 15
0.8 - 1.1 29
1.2 1.5 9
1.6 - 1.9 3
2 - 2.3 2
7.1 Korelacijska analiza 145

7.1.1 Pearsonov koeficijent korelacije

Pearsonov koefidjent korelacije pokazuje mjerujakosti i smjer povezanosti


dviju varijabli. Za uzorak velicine n u slucaju linearne povezanosti Pear­
sonov koeficijent korelacije r dan je izrazom
Poglavlje 7 Sxy
r=--
SxSy
gdje je
Korelacija i regresija 1 n 1 n
SXY =n_l2:::(Xi- X)(Yi-Y) n_l(2:::XiYi n.x.1}) (7.2)
~l ~l

kovarijanca uzorka,
7.1 Korelacijska analiza 1 n 1 n
S;=
n
_
1
2::: (Xi
;=1
x)2 n_1(2:::x;-n.x2)
i=1
(7.3)
Korelacija predstavlja suodnos ili uzajamnu povezanost razlicitih obilje­
varijanca obiljezja X, a
zja u statistickom skupu. IstraZivanje povezanosti razlicitih obiljeZja svodi
se na uspostavljanje veza izmedu doticnih varijabli. Premda se moze is­ n n
traziti povezanost vise varijabli, zbog jednostavnosti postupka ograniCit SY2 =-1- 2:::(Yi 1}) 2 -1- (2::: Yi2 - n· 1}2) (7.4)
n-1 n-1
cemo se na bivarijantan slucaj (X, Y). i=1 i=1 .
varijanca obiljezja Y.
U kore1acijskoj analizi odreduje se jakost statistiCkih veza medu varijablama.
Najjednostavniji oblik ove analize dobiva se kada su varijable X i Y u li­ Vrijednost Pearsonovog koeficijenta r krece seu intervalu [-1, 1J i pokazuje
nearnom odnosu. Pretpostavimo da su mjerenjem u statistickom skupu smjer i jakost linearne statisticke veze izmedu dviju pojava. Predznak Pear- .
dobiveni sljedeci podaci:
sonovog koeficijenta pokazuje smjer korelacije. Pozitivne vrijednosti Pear­
sonovog koeficijenta imamo onda kada rast vrijednosti jedne varijable prati
rast druge varijable. Tada govorimo 0 pozitivnoj povezanosti. Kada vri­
Y1), (X2, Y2), ... , (xn, Yn). jednost jedne varijable raste, a druge varijable pada, Pearsonov koeficijent
ima negativne vrijednosti, odnosno imamo negativnu povezanost. Potpunu
Da bi se lakse uocila veza izmedu varijabli X i Y, treba dobivene podatke korelaciju imamo za vrijednosti Pearsonovog koeficijenta r - L odnosno
graficki analizirati. Unosenjem dobivenih rezultata u pravokutni koordi­ r = 1, dok za vrijednost r = 0 ne postoji linearna korelacija.
natni sustav dobivamo dijagrame rasipanja. Karakteristicni slucajevi rasipanja za razlicite vrijednosti koeficijenta ko­
relacije r prikazani su na slid 7.1.
144
146
Korelacija i regresija 1.1 Korelacijska analiza 147

Ovisno 0 iznosu koeficijenta korelacije, sljedece


;:... ;:...
'-'
IJ)
Cl) Apsolutne vrijednosti koeficijenta korelacije I Korelacija
....~
.0
;~
.~

~
o Odsutnost korelacije
o 0.01-0.49 Sla,bakorelacija
6 0.50-0.79
::'-..,,--­
Korelacija srednje jacine
0.80-0.99 Cvrsta korelacija
ObiljeZjeX 1 Potpuna korelacija
Obiljez.jeX
r = I r - J Kvadrat Pearsonovog koeficijenta korelacije r2 naziva se koefh;ijent
determinacije. Koeficijent determinacije pokazuje u kojem se postotku
kvadrati odstupanja mogu objasniti vezom izmedu varijabli. Kod slabih ko­
;:... ;:... koeficijent determinacije je znatno manji nego korl cvrstih korelacija.
III
'-'
'N .~ Npr.:
....~
.0
'~
....:.:::;.
za r 0.4 :::} r2 . 100% =
o .0
o za r = 0.8 :::} r2 . 100% = 64%.
Ovdje je vrlo vazno napomenuti da iako koristimo rezultate jedne vari­
ObiljeZjeX
ObiljeZjeX
jable da bi predvidjeli rezultate druge, rezultat jedne varijable ne uzrokuje
O-<r-<l
rezultat druge. "Odnos, veza" ne znaci nuzno i !1uzrocnost". To se donekle
l-<r-<O
vidi ako promatramo visine i telline unutar neke populacije. Iako bi na
pogled mogli reci da su visi ljudi i tezi, to ne mora biti istina u potpunosti
o • 0
je tezina nekog covjeka karakteristika koja nuzno ne ovisi samo 0 visini,
~ 0 0 0° :o~ °o::~oo vee i 0 prehrani, nasljednim faktorima, kolicini aktivnosti kojom se covjek
"Q) 0 0G~oo·o oo8o°e,:0
I)
bavi itd.
'W
IV 0; 00
0 0 00 O~O 000 0
°0YoClS () ... OOo
~ 0 o~:~~~%~::~
..Q 0 0 000° ,p 00830
00 0 Primjer 1.1. Pracenjem broja objavljenih reklama jednog proizvoda i nje­
O 0 °0 09,.,5,) 0 0 0
o Y,OOgo "t> 000
0
0
0
gove prodaje dobiveni su sljedeci podaci:
o 0
(tooo
rP 0
J>
ft:
0 0
c
o ~ 0
Broj reklama 31~~
ObiljezjeX Broj prodanih proizvoda 20f25
r 0
Odredite koeficijent korelacije dobivenih podataka.
SHka 7.1.
Rjesenje:
148
Korelacija i regresija 7.2 Regresijska analiza 149

izracunajmo

Konacno, prema formuli (7.1) dobivamo


1 8 1

X 8Lxi 8(16+59+65+43+82+90+31+22)=51 r SXY


---
i=l SxSy - 7;;;:;;:;=;=;=-~===== = 0.82.

1 8 1 U ovom primjeru imamo cvrstu korelaciju.


Y= 8 Yi = 8(18 + 6:3 + 28 + 71 + 85 + 98 + 20 + 25) = 51. Racunaju6i r2 dobivamo

racunamo r2 = 0.818 2 = 0.67,


8

2 sto znaCi da se 67% od svih odstupanja moze objasniti vezom izmedu


2
2 2
+ 59 + 65 + 43 + 82 + 90 2 + 31 2 + 222 = 26080, X i Y, a preostalih 33% je posljedica drugih Cimbenika. .(
i=1

L Yl
i=l
2
+ 63 + 28 2 + 71 2 + 85 2 + 98 2 +
+ 25 2 27972 7.2 Regresijska analiza
Dok se u korelacijskoj analizi odreduje jakost i smjer veze izmedu va­
8 rijabli, u regresijskoj analizi se istrazuje priroda te veze, tj. odnos izmedu
LXiYi = 16.18+59.63+65.28+43.71+82.85+90.98+31.20+22.25 = 25838. zavisne i neza.visne varijable.
i=l
tehniCki i znanstveni problemi bave se odredivanjem odnosa izmeau
Kovarijanca uzorka je prema (7.2) jednaka skupa varijabli. Npr., u kemijskim procesima mozemo biti zainteresirani za
odnos izmedu izlaza tog procesa, temperature pri kojoj se dogada i kolicine
8
1 1 koristenih katalizatora. Poznavanje takvog odnosa omogu6uje nam
Sxy _1(L X iYi-8.X·Y) =7(25838-8.51. = 718.57, vidanje izlaza za razliCite vrijednosti temperature i koliCine katalizatora.
1=1
Ako svakoj promjeni jedne varijable odgovara priblizno jednaka linearna
varijanca obiljezja X, gdje X broj reklama, je prema (7.3) promjena druge varijable, govorimo 0 linearnoj regresiji. Matematicki
8
opis linearne regresije dan je jednadzbom pravca
S; = ~ 1 (LX; i=l
8· x2) ~(26080 8.51 2) 753.14, y=a+
a varijanca obiljezja Y, gdje je Y gdje je
prodanih proizvoda, je prema
8
S; = 1 (L 8· y2) ~(27972 - 8.51 2 ) = 1023.43.
• X nezavisna varijabla
i=l
• y zavisna varijabla
151
150 Korelacija i regresija 7.2 Regresijska analiza

• b regresijki koeficijent odnosno n


-2 L(Yi - a - bXi)Xi = O. (7.6)
• a konstantni clan
i=1
Pravac Y = a + bx zovemo regresijski pravac. Regresijski koeficijent b Sredivanjem (7.5) prelazi u
pokazuje za koliko se u prosjeku promjeni varijabla y pri jedinicnoj promijeni n n
varijable x. Konstantni clan a pokazuje regresijsku vrijednost varijable y LYi - na - bLXi = 0, (7.7)
kada varijabla x poprimi vrijednost nula. ;=1 i=1
Slika 7.1 prikazuje dijagrame rasipanja s pravcem koji "najbolje odgovara"
tockama. Kroz ove tocke moguce je provuCi beskonacan broj pravaca, pa se odnosno u n n
(7.8)
postavlja pitanje koji od njih "najbolje odgovara"'? Intuitivno, pravac koji na+b LXi = LYi,
"najbolje odgovara ll treba biti onaj pravac koji prolazi kroz maksimalni i=1 i=l

broj tocaka i nije previse udaljen od tocaka kroz koje ne prolazi. Da bi a (7.6) u n n n
bio tlnajbolji tI, pravac mora zadovoljiti odredene standarde: ako iscrtamo (7.9)
udaljenosti izmedu tocaka i pravca u vertikalnom smjeru te ih kvadriramo i LYixi - a LXi - bLX; 0,
i=1 i=l i=1
zbrojimo, najbolje Be uklapa pravac za koji je zbroj tih kvadrata udaljenosti
najmanji. odnosno u n n n
(7.10)
Pravac linearne regresije dakle odredujemo metodom najmanjih kvadrata,
odnosno minimaliziranjem funkcije od dvije varijable. Kod izbora pravca
a I>i + bLX; = LXiYi'
;=1 i=1 i=1

varijable 8U koeficijenti a i b.
Uvrstavanjem izraza

n
Q(a, b) = L(Yi - a - bXi)2. n
LX; = (n - 1) S; +
i=l
i=l
Koeficijente a i b odredujemo rjesavanjem sustava jednadzbi koje 8U nuzan
uvjet za postojanje ek8trema funkcije od dvije varijable, Q(a, b): n
8Q LXiYi = (n -l)Sxy + nxy
-=0 i=1

8a
u jednadzbu (7.10) i kratkim sredivanjem imamo

8Q
8b =0. (n l)(bS; - Sxy) = nx(y - a- bx).

Raeunanjem parcijalnih derivacija po parametrima a i b dobivamo .


Podijelimo Ii jednadzbu (7.8) s n, tada ona poprima obUk

n
-2 :2)Yi - a - bXi) = 0, (7.5) y a+bx,

i=l
152
Korelacija i regresija 7.2 Regresijska analiza 153

odakle slijedi formula za racunanje konstantnog clana


Koeficijente b i a racunamo prema formulama (7.13) i (7.12):
a= 'iJ-bx. (7.12) b S,1;y 718.57 0 95
S; 753.14 .,
Uvrstavanjem izraza 'iJ = a + bx u jednadibu (7.11) dobivamo
a = 'iJ - b-x = 51 - 0.95 . 51 2.34.
bS; Sxy 0
Jednadiba pravca regresije glasi:
odakle slijedi formula za racunanje regresijskog koeficijenta y = a + bx 7' 2.34 + 0.95x.
Sxy Zax 100 imamo
b S2' (7.13)
x
y(100) = 2.34 + 0.95· 100 ~ 98.
Za mjerenje disperzije, odnosno rasprsenosti oka regresije adreaujemo vari­
jancu i iz nje izracunavamo standardnu devijaciju. Varijancu regresije racu­ Dahle, ako je broj objavljenih reklama 100, mazemo predvidjeti da ce
ilamo karisteCi izraz prodanih proizvoda biti 98.
Na slid 7.2 prikazan je dijagram rasprsenja i pravac regresije za podatke iz
l(n
=;;; ~yt-a~Xi-b~XiYi
n n) , primjera 7.1.
2.34+0,95 X

dok je standardna devijacija jednaka


90

1 n n n
00"

~ n(~ yt - a ~Xi b ~XiYi)'


1
(Jy

fO
Relativna mjera disperzije aka regresije izrazava se koeficijentam regresije
Iso
koji je jednak omjeru standardne devijacije regresije i aritmeticke sredine

zavisne varijable, .. : to
g
Vi; =
_ ·100%. 40

Y
30
Koeficijent varijacije regresije pokazuje stupanj disperzije ako regresije i ne
ovisi 0 mjernim jedinicama zavisne varijable.

Primjer 7.2. Procijenite pravac regresije za podatke iz primjera 7.1 koji ce


prikazivati ovisnost broja prodanih proizvoda 0 broju objavljenih reHama.
Slika 7.2.
Rjesenje:
,(
154
Korelacija i regresija

7.3 Zadaci za vjezbu

1. Neka su X i Y dva statisticka obiljezja s podacima

Xi 8
Yi 6

a) Prikazite tocke (Xi, Yi) u pravokutnom koordinatnom sustavu.


Poglavlje 8
b) Izracunajte koeficijent korelacije.
c) Procijenite pravac regresije i Skicirajte ga zajedno sa toCkama.

2. Nakon pismenog ispita iz Statistike sestero studenata upitano je koUko Malo povijesti. ..
su se vremena pripremali za ispit. Dobiveni su sljedeci podaci 0 broju
bodova Y osvojenih na ispitu (od najvise 100) u ovisnosti 0 vremenu
X (u satima) utrosenom na pripremu ispita:
Sustavno prikupljanje podataka 0 stanovnistvu i gospodarstvu pocelo je
. -- I 33
u talijanskim gradovima Veneciji i Firenci tijekom renesanse. Pojam statis­
, A I ,,~ I - - . 95 tike izveden je od engleske rijeci state=drzava, a koristen je za prikupljanje
cinjenica od interesa za drzavu. Ideja prikupljanja podataka prosirila se iz
a) Procijenite pravac regresije. Italije u os tale zemlje zapadne Europe. Doista, do prve polovice 16. stoljeca
b) Koliki je ocekivani broj postignutih bodova studenta koji se pripremao bilo je uobicajeno za europske vlade zahtijevati od zupa registraciju rodenja,
20 sati? zakljucenja brakova i smrtne slucajeve. Zbog slabih javnih zdravstvenih
c) Je Ii na temelju ovog pravca regresije opravdano procjenjivati broj uvjeta ova posljednja statistika je od posebnog interesa. Visoka stopa smrt­
postignutih bodova studenta koji se pripremao 45 sati? Zasto? nosti u Europi prije 19. stoljeca bila je zbog epidemija bolesti, ratova i zbog
gladi. Meau epidemijama najgora je bila kuga. Godine 1562. kao naGin da
se kraljevskom dvoru ukaZe da razmatranje odlaska na selo gdje je opasnost
od epidemije bila manja, London je poceo objavljivati tjedne zapise 0 smrt­
nosti. U pocetku ovi zapisi smrtnosti navode same mjesta smrtnosti i to je Ii
smrt nastupila kao posljedica kuge. Godine 1625. zapisi su prosireni na sve
uzroke smrti. Godine 1662. engleski trgovac John Graunt objavio je knji­
gu pod naslovom IIPrirodna i politiCka promatranja 0 zapisima smrtnosti".
Graunt koristi zapise 0 smrtnosti u Londonu za procjenu broja gradskog
stanovnistva. Za procjenu populacije Londona u 1660. godini Graunt anke­
tira domacinstva u pojedinim londonskim zupama (iIi cetvrtima) i otkriva
da su u prosjeku bila oko 3 smrtna slucaja na svakih 88 Ijudi. Dijeljenjem

155
156
Malo povijesti. .. 157

s 3 pokazuje da je u prosjeku bila otprilike jedna smrt na svaku osohe. ¥ i nema njene upotrebe u proucavanju statistiCkih rezultata. U to se doba
Buduci da zapisi navode za tu godinu 13 200 smrtnih sIucajeva u Londonu,
veCina drustvenih statisticara zadovoljila time da puste podatke da govore
Graunt procjenjuje londonsko stanovnistvo na otprilike 13200. 387200.
sami za sebe. Konkretno, statisticari u to vrijeme nisu hili zainteresirani za
koristi ovu procjenu za projekciju broja stanovnistva Engleske.
izvodenje zakljucaka 0 po jedincima, vee ih je zanimalo drustvo u cjelini. Oni
U svojoj knjizi napomenuo je da ce te brojke biti od interesa za vladara
se nisu bavili naeinom odredivanja uzoraka iz populacije, vee BU pokusava.li
zemlje kao pokazatelji broja ljudi koji hi mogli biti pozvani u vojsku iIi
dobiti cenzus cjelokupne populacije. Kao rezultat takvog pristupa u 19.
broja Ijudi koji bi mogli placati porez. Graunt zatim koristi te informacije
stoljecu, probabilisticki zakljucci izvcdeni iz uzorka neke populacije bili su
za izracun tablica daju dobnu zastupljenost stanovnistva koje umire.
nepoznati u socijalnoj statistici. Tek se kasnih 1800-tih statistika
Grauntove procjene dobnih skupina u kojima su ljudi umirali zanimljive su
poCinje baviti zakljuCivanjem iz numerickih podataka. To je zapoceo Francis
za one u poslu prodaje rente. Rente su suprotno od zivotnog osiguranja
jer se pritom uplacuju sredstva It pausalnom iznosu kao ulaganje, a zatim Galtona3 na analizi nasljedne genijalnosti pomoeu upotrebe onoga sto mi
se primaju redovite isplate taka dugo dok osaba zivi. Grauntov rad na danas nazivamo regresija i korelacijska analiza, a dobio je veti dio petie:::.ia
tabIicama smrtnosti inspirira Edmunda Halleya koji je otkrio komet koji radom Karla Pearsona4 .
nosi njegovo ime i covjeka koji je najvise odgovoran za poticaj i financijsku Pearson, koji je razvio X2 testove ocjene prilagodbe, bio je prvi rav­
potporu prilikom objavljivanja poznate Newtonove 1 Philosophiae Naturalis natelj Laboratorija Galton koji je 1904. godine osnovao Francis Galton. Tu
Principia Mathematica. Halley je predlagao osiguravateljima tog vremena je nastao Pearsonov istrazivaeki program usmjeren na razvoj novih n:.eteda
da hi godisnja premija osiguranja zivota trebala ovisiti 0 starosti osobe kOja koristenja statistike u zakljuCivanju. Njegov laboratorij pozivao je Ha,un;'-'Lle
se osigurava. SljedeCi Graunta i Halleya, prikupljanje podataka se stalno
Ciji rad je osnova za razvoj matematicke astronomije i statistike. Sazeo je i proSi.rio
povecava u 17. i 18. stoljecu. U Parizu je prikupljanje zapisa 0 smrtnosti rad svojih prethodnika u svojoj knjizi Mecanique Celeste (Nebeska mehanika) (1799.
pocelo 1667. godine, a 1730. godine je zapisivanje uzrasta kod smrti postala - 1825.). OViID djelom je proucavanje klasicne mehanike pomocu geometrije za:nijE::lio
uobicajena praksa u citavoj Europi. Pojam statistike, koji je koristen sve prouCavanjem na osnovi kalkulusa. U statistici, tzv. Bayesovu interpretaciju vjerojatnosti
do 18. stoljeea kao kratica za deskriptivne znanosti 0 drzavi, u 19. stoljecu uglavnom je razvio Laplace. Laplace je formulirao tzv. Laplaceovu jednadzbu i ra2vio
Laplaceovu transformaciju koja se pojavljuje u mnogim granema matematiCke fizike.
se sve vise identificira s brojevima. Do 1830-ih taj pojam se gotovo uni­ Laplacian diferencijalni operator, koji se naSiroko koristi u matematici, takoder je dobio
verzalno koristi u Velikoj Britaniji i Francuskoj kao sinonim za "numericke ime po njemu. Prepravio je i razvio nebularnu hipotezu 0 nastanku Suncevog sustava
znanosti II drustva. i bio je jedan od prvih znanstvenika koji je postulirao postojanje crnih rupa i pojrna
gravitacijskog koiapsa.
Iako su teoriju vjerojatnosti vee razvili matematicari Jacob
3Francis Galton, clan Kraljevskog drustva (1822. 1911.), IOaak Charlesa Darwma.
Karl Friedrich Gauss i Pierre-Simon Laplace 2 , tijekom 19. stoljeca gotovo
Engleski viktorijanski znanstvenik cija je strucnost obuhvaeala znaeajan broj raziic:tih
podrucja, kao sto su antropoiogija i eugenika. Bio je tropski istraZivac, geograf, izumitelj,
- 1728.), engleski fizicar, matematicar i astronom. Jedan od naj­ meteorolog, proto-geneticar i statisticar. Takoder je stvorio statistiCki pojam korela,~ije
vecih prirodnih znanstvenika u povijesti. Godine 1687. Newton je napisao Philosophiae i regresije. Bio je prvi koji je primijenio statisticke metode za proucavanje Ijudskih
Naturalis Principia Mathematica (Matematicka naeela prirodne filozofijc). To je djelo razlika i nasljedivanje inteligencije, te je uveo koristenje ankete za prikupljanje podataka
izmijenilo pogJed na svijet. U njemu je Newton ujedinio istraZivanja Galilea Galileja i o ljudskim zajednicema koji 8U potrebni za geneaioske i biografske radove te za njeg:l\'e
Johannesa Keplera u jednu teoriju gravitacije te je uspostavio osnovu klasicne mehanike antropometrijske studije.
u kojoj je formulirao tri osnovna zakona gibanja. 4Karl Pearson, clan Kraljevskog drustva (1857. - 1936.), utjecajan engleski Iilll.tema­
2Pierre-Simon, markiz de Laplace (1749. 1827,). francuski matematicar i astronom ticar. Zasluzan za uspostavu discipline matematicke statistike. Godine 1911. osnovao je
prvi svjetski sveucilisni Odje! za statistiku pri University College u Londonu.
158 Malo povijesti...

studente iz znanosti i gospodarstva kako bi nauCili 0 statistickim meto­


dama koje mogu primjenjivati u svojim poljima. Jedan od njegovih naj­
gostujuCih istrazivaca bio je W.S. Gosset 5 , kemicar po zanimanj
koji je pokazao svoju predanost Pearsonu objavljivanjem svojih radova pod
nazivom Student. Prica kaze da se Gosset nije objavljivao pod svojim
imenom zbog straha da hi njegov poslodavac, Guinness pivovara, mogao
biti nesretan ako otkrije da jedan od njegovih kemicara radi istrazivanja u Prilozi - Tablice
statistici. Gosset je poznat po razvoju t testa.
Dva najvaZuija podrucja primijenjene statistike u ranom 20.
bila su populacijska biologija i poljoprivreda zbog interesa Pearsona i drugih jedinicne normalne raz-
suradnika u njegovom laboratoriju te zbog znatnih postignuca engleskog Tablica A: Tablica vrijednosti funkcije QlSl,;tlUU<.;lJ

znanstvenika Ronald A. Fishera. Teorija zakljucivanja koju su razvili pi­ diobe, <l>(z) = P(Z :::; z), Z "-' N(O, 1)
: oniri dovoljno je opcenita da se bavi sirokim rasponom kvantitativnih i
Tablica B: Tablica vrijednosti funkcije distribuciJe jediniCne normalne raz­
prakticnih problema. Kao rezultat, sredinom 20. stoljeca naglo raste broj
u znanosti, poslovanju i vlasti lwji je smatrati statistilm kao cliobe
alat kojim je moguce osigurati kvantitativna rjesenja znanstvenih i prak­ stu pnj eva
Tablica C: Kriticne 'ijednosti X2 razdiobe za odredeni
ticnih problema. Danas je ideja statistike posvuda. Deskriptivna statistika
pokazuje se kao osobito privlacna svakim novinama Hi casopisu. Statisticko slobode
zakljucivanje postalo je neophodno za javno zdravstvo i medicinska istraZi­
Tablica D: Kriticne vrijednosti Studentove t razdiobe za odredeni broj
vanja, inzenjering i znanstvene studije, za marketing i kontrolu kvalitete, za
obrazovanje, racunovodstvo, ekonomiju, meteoroloske prognoze, glasovanje i stupnjeva slobode
ankete, sport, osiguranja, kockanje. Statistika je doista postala ukorijenjena
u intelektualnoi bastini.

"William Sealy Gosset (1876. - 1937.), poznat kao statisticar pod pseudonimom Stu­
dent, te po svom radu na Studentovoj t raspodjeli.
I

159

160
PRILOZI PRILOZI 161

~.
\
Tablica B: Tablica vrijednosti funkcije distribucije jedinicne
normalne razdiobe

z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
Tablica A: Tablica vrijednosti funkcije distribucije jedinicne 0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
normalne razdiobe, ip(z) = P(Z ::; z), Z ~ N(O, 1) 0.2
0.3
.5793
.6179
.5832
.6217
.5871
.6255
.5910 .5948
.6331
.5987 .60266 .6064 .6103 .6141
.6293 .6368 .6406 .6443 .6480 .6517
0.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
z .00 .01 .02 .03 .04 .05 0.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
.06 .0'7 .08 .09
-3.4 .0003 .0003 .0003 .0003 .0003 0.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
.0003 .0003 .0003 .0003 .0002
-3.3 .0005 .0005 .0005 .0004 .0004 0.'7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
.0004 .0004 .0004 .0004 .0003
-3.2 .0007 .0007 .0006 .0006 .0006 0.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
.0006 .0006 .0005 .0005 .0005
-3.1 .0010 .0009 .0009 .0009 .0008 0.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
.0008 .0008 .0008 .0007 .0007
-3.0 .0013 .0013 .0013 .0012 .0012 1.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621
.0011 .0011 .0011 .0010 .0010
.' -2.9 .0019 .0018 .0018 .0017 1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830
.0016 .0016 .0015 .0015 .0014 .0014
-2.8 .0026 .0025 .0024 .0023 .0023 1.2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015
.0022 .0021 .0021 .0020 .0019
-2.'7 .0035 .0034 .0033 .0032 .0031 1.3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177
.0030 .0029 .0028 .0027 .0026
-2.6 .0047 .0045 .0044 .0043 .0041 1.4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319
.0040 .0039 .0038 .0037 .0036
-2.5 .0062 .0060 .0059 .0057 .0055 1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
.0054 .0052 .0051 .0049 .0048
-2.4 .0082 .0080 .0078 .0075 .0073 1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
.0071 .0069 .0068 .0066 .0064
-2.3 .0107 .0104 .0102 .0099 .0096 1.'7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
.0094 .0091 .0089 .0087 .0084
-2.2 .0139 .0136 .0132 .0129 .0125 1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706
.0122 .0119 .0116 .0113 .0110
-2.1 .0179 .0174 .0170 .0166 .0162 1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
.0158 .0154 .0150 .0146 .0143
-2.0 .0228 .0222 .0217 .0212 .0207 2.0 .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .9817
.0202 .0197 .0192 .0188 .0183
-1.9 .0287 .0281 .0274 .0268 .0262 .0256 2.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857
.0250 .0244 .0239 .0233
-1.8 .0359 .0351 .0344 .0336 .0329 .0322 2.2 .9861 .9864 .9868 '.9871 .9875 .9878 .9881 .9884 .9887 .9890
.0314 .0307 .0301 .0294
-1.'7 .0446 .0436 .0427 .0418 .0409 2.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .9916
.0401 .0392 .0384 .0375 .0367
-1.6 .0548 .0537 .0526 .0516 .0505 2.4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936
.0495 .0485 .0475 .0465 .0455
-1.5 .0668 .0655 .0643 .0630 .0618 2.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952
.0606. .0594 .0582 .0571 .0559
-1.4 .0808 .0793 .0778 .0764 .0749 2.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964
.0735 .0721 .0708 .0694 .0681
-1.3 .0968 .0951 .0934 .0918 .0901 2.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974
.0885 .0869 .0853 .0838 .0823
-1.2 .1151 .1131 .1112 .1093 .1075 2.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981
.1056 .1038 .1020 .1003 .0985
-1.1 .1357 .1335 .1314 .1292 .1271 2.9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986
.1251 .1230 .1210 .1190 .1170
-1.0 .1587 .1562 .1539 .1515 .1492 3.0 .9987 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .9990
.1469 .1446 .1423 .1401 .1379
-0.9 .1841 .1814 .1788 .1762 .1736 3.1 .9990 .9991 .9991 .9991 .9992 .9992 .9992 .9992 .9993 .9993
.1711 .1685 .1660 .1635 .1611
-0.8 .2119 .2090 .2061 .2033 .2005 3.2 .9993 .9993 .9994 .9994 .9994 .9994 .9994 .9995 .9995 .9995
.1977 .1949 .1922 .1894 .1867
-0. '7 .2420 .2389 .2358 .2327 .2296 3.3 .9995 .9995 .9995 .9996 .9996 .9996 .9996 .9996 .9996 .9997
.2266 .2236 .2206 .2177 .2148
-0.6 .2743 .2709
-0.5
.2676 .2643 .2611 .2578 .2546 .2514 .2483 .2451 ~. .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9998
- ...
.3085 .3050
~

.3015 .2981 .2946 .2912 .2877 .2843


-0.4 .3446 .2810 .2776
.3409 .3372 .3336 .3300 .3264 .3228
-0.3 .3192 .3156 .3121
.3821 .3783 .3745 .3707 .3669 .3632 .3594 .3557 .3520 .3483
-0.2 .4207 .4168 .4129 .4090 .4052 .4013 .3974 .3936 .3897 .3859
-0.1 .4602 ,4562 .4522 .4483 .4443 .4404 ,4364 .4325 .4286 .4247
~ .5000 .4960 ,4920 ,4880 ,4840 ,4801 ,4761 .4721 .4681 .4641
162 PRILOZI PRILOZI 163

II-<~

Tablica C: Kriticne vrijednosti X2 razdiobe za odredeni broj Tablica D: Kriticne vrijednosti Studentove t razdiobe za
stupnjeva slobode odredeni broj stupnjeva slobode

s. s.
f---y-' ~~OO
ta.950 to.975 to.9S8 to.990 to.995
0.051 0.103 0.211 5.991 7.378 3.0777 6.3138 12.7062 25.4517 31.8205 63.6567
:I 0.072 10.597
0.Z16 0.352 0.584 7.815
<I 0.207 0.484 0.711 1.064
9.348 11.345 12.838 2 1.8856 2.9200 4.3027 6.2053 6.9646 9.9248
9.488 11.143 13.Z77 14.860
'5 0.412 0.831 1.145 1.610 11.070 12.833 15.086 16.750
:3 1.6377 2.3534 3.1824 4.1765 4.5407 5.8409
6 0.676 1.237 1.635 2.204 10.645 12.592 14.449 16.812 18.548 4 1.5332 2.1318 2.7764 3.4954 3.7469 4.6041
7 0.989 1.600 2.167 2.833 12.017 14.067 16.013
8 1.344 2.180 2.733 3.490 13.362 15.507
18.475 20.278 5 1.4759 2.0150 2.5706 3.1634 3.3649 4.0321
17.535 20.090 2l.955
9 1.735 2.700 3.325 4.168 14.684 16.919 19.023 21.666 23.589 6 1.4398 1.9432 2.4469 2.9687 3.1427 3.7074
10 2.156 3.247 3.940
11 2.603 3.816
4.865 15.987 18.307 20.483 23.209 25.188 7 1.4149 1.8946 2.3646 2.8412 2.9980 3.4995
>1,575 5.578 17.275 19.675 21.920 24,725
12 3.074 26.757 8 1.3968 1.8595 2.3060 2.7515 2.8965 3.3554
4.404 5.226 6.304 18.549 21.026 23.337
13 26.217 28.300
3.565 5.009 5.892 7.042 19.812 22.362 24.736 27.688 29.819 9 1.3830 1.8331 2.2622 2.6850 2.8214 3.2498
14 4.075 5.629 6.571 7.790 21.064 23.685
15 4.601 6.262
26.119 29.141 31.319 10 1.3722 1.8125 2.2281 2.6338 2.7638 3.1693
1.261 8.647 22.307 24.996 27.488 30.578 32.801
16 5.142 6.908 1.962 9.312 23.542 26.290 28.845 32.000
11 1.3634 1.7959 2.2010 2.5931 2.71808 3.1058
17 34.267
3.697 7.564 8.672 10.085 24.709 27.587 30.191 33.409 35.718 12 1.3562 1.7823 2.1788 2.5600 2.6810 3.0545
18 $,265 8.231 9.390 10.865 25.989
19 ~.844 8.907 10.117 11.651
28.869 31.526 34.805 37.156 IS 1.3502 1.7709 2.1604 2.5326 2.6503 3.0123
27.204 30.144 32.852 36.191 38.582
20 "'.434 9.591 10.851 12.443 28.412 31.410 34.170 37.566
14 1.3450 1.7613 2.1448 2.5096 2.6245 2.9768
21 8.034 10.283 11.591 13.240 29.615 32.671 15 1.3406 1.7531 2.1314 2.4899 2.6025 2.9467
35.479 38.932
22 a.643 10.982 12.338 14.041 30.813 33.924
23 9.260 11.689 13.091 14.848
36.781 40.289 42.796 16 1.3368 1.7459 2.1199 2.4729 2.5835 2.9208
32.007 35.172 38.076 41.638 44.181
24 9.886 12.401 13.848 15.659 33.196 36.415 39.354 42.980 45.559
17 1.3334 1.7396 2.1098 2.4581 2.5669 2.8982
25 10.520 13.120
26
14.611 16.473 34.382 37.652 40.646 44.314 46.928 18 1.3304 1.7341 2.1009 2.4450 2.5524 2.8784
11.160 13.844 15.379 17.292 35.563 38.885 41.923 45.642
27 11.808 14.573 16.151 18.114 36.741 40.113
48.290 19 1.3277 1.7291 2.0930 2.4334 2.5395 2.8609
43.195 46.963 49.645
28 12.461 15.308 18.928 18.939 37.916 41.337 44.461 48.278 50.993 20 1.3253 1.7247 2.0860 2.4231 2.5280 2.8453
29 :.3.121 16.047 17.708 19.768 21 1.3232. 1.7207 2.0796 2.4138
30 :3.787 16.791
39.067 42,551 45.722 49.588 52.336 2.5176 2.8314
18.493 20.599 40.256 43.773 46.979 50.892 53.672
<10 20.707 24.433 26.509 29.051 51.805 55.758 59.342
22 1.3212 1.7171 2.0739 2.4055 2.5083 2.8188
63.691 66.766
50 2'7.991 32.357 34.764 37.689 63.167 67.505 71.420 76.154 79.490 2S 1.3195 . 1.7139 2.0687 2.3979 2.4999 2.8073
60 35.534 40.482 43.188
70 ";'3.275
46.459 74.397 19.082 83.298 68.379 91.952 24 1.3178 1.7109 2.0639 2.3909 2.4922 2.7969
48.758 51.739 55.329 85.527 90.531 95.023 100.425 104.215
80 ei.172 57.153 60.g91 64.278 96.578 101.879 106.629
25 1.3163 1.7081 2.0595 2.3846 2.4851 2.7874
112.329 116.321
90 5P.196 65.647 69.126 73.291 107.565 113.145 118.136 124.116 128.299 26 1.3150 1.7056 2.0555 2.3788 2.4786 2.7787
100 . 6,.328 74.222 77929 82.358 118.498 124.342 129.561 135.807 140.169 27 1.3137 1.7033 2.0518 2.3734 2.4727 2.7707
28 1.3125 1.7011 2.0484 2.3685 2.4671 2.7633
29 1.3114 1.6991 2.0452 2.3638 2.4620 2.7564
SO 1.3104 1.6973 2.0423 2.3596 2.4573 2.7500
00
'--­
1.2816
--­
1.6449 1.9510 2.2414 2.3264 2.5758

You might also like