You are on page 1of 104

VJEROVATNOĆA I

STATISTIKA SKRIPTA

(INŽENJERSKA
STATISTIKA)

0
1
2
SADRŽAJ
VJEROVATNOĆA I STATISTIKA ............................................................................................................. 4
1. Analiza podataka. Teorija Vjerovatnoće........................................................................................... 3
1.1 Prikazivanje podataka. Prosječna Vrijednost. Rasipanje .......................................................... 3
1.1.1 Grafičko predstavljanje podataka .................................................................................... 4
1.1.2 Srednja vrijednost. Standardna devijacija. Varijansa. Empirijsko pravilo ........................ 5
1.2 Eksperimenti, ishodi, događaji ................................................................................................. 7
1.2.1 Unije, Presjeci, Komplementi događaja ........................................................................... 7
1.3 Vjerovatnoća ............................................................................................................................ 9
1.3.1 Osnovne teoreme vjerovatnoće ..................................................................................... 11
1.3.2 Uvjetna vjerovatnoća. Neovisni događaji....................................................................... 12
1.4 Permutacije i kombinacije ...................................................................................................... 14
1.4.1 Permutacije .................................................................................................................... 14
1.4.2 Kombinacije .................................................................................................................... 16
1.4.3 Faktorijelna funkcija ....................................................................................................... 17
1.4.4 Binomni koeficijent......................................................................................................... 17
1.5 Slučajne varijable. Raspodjele vjerovatnoće .......................................................................... 18
1.5.1 Diskretne slučajne varijable i raspodjele ........................................................................ 19
1.5.2 Kontinuirane slučajne varijable i raspodjele .................................................................. 21
1.6 Srednja vrijednost i varijansa raspodjele ............................................................................... 23
1.6.1 Transformacija srednje vrijednosti i varijanse................................................................ 24
1.6.2 Očekivanje, momenti ..................................................................................................... 25
1.7 Binomna, Poissonova, a Hipergeometrijska raspodjela ......................................................... 26
1.7.1 Binomna raspodjela........................................................................................................ 26
1.7.2 Poissonova raspodjela .................................................................................................... 28
1.7.3 Uzorkovanje sa zamjenom ............................................................................................. 29
1.7.4 Uzorkovanje bez zamjene. Hipergeometrijska raspodjela ............................................. 30
1.8 Normalna raspodjela .............................................................................................................. 31
1.8.1 Funkcija raspodjele F(x) .................................................................................................. 32
1.8.2 Numeričke vrijednosti .................................................................................................... 33
1.8.3 Upotreba tabela za normalnu raspodjelu D3 i D4 u Dodatku 1 ..................................... 34
1.8.4 Normalna aproksimacija binomne raspodjele ............................................................... 35
1.9 Raspodjela nekoliko slučajnih varijabli ................................................................................... 36
1.9.1 Diskretne dvodimenzionalne raspodjele ........................................................................ 37
1.9.2 Kontinuirane dvodimenzionalne raspodjele .................................................................. 37
1.9.3 Marginalne raspodjele diskretne raspodjele.................................................................. 38
1.9.4 Marginalne raspodjele kontinuirane raspodjele ............................................................ 40
1.9.5 Neovisnost slučajnih varijabli ......................................................................................... 40

3
1.9.6 Funkcije slučajnih varijabli .............................................................................................. 41
1.9.7 Dodavanje srednjih vrijednosti....................................................................................... 41
1.9.8 Dodavanje varijansi ........................................................................................................ 42
2. Matematska Statistika .................................................................................................................... 45
2.1 Uvod. Slučajno uzorkovanje ................................................................................................... 46
2.2 Tačka procjene parametara.................................................................................................... 47
2.2.1 Metoda maksimalne vjerovatnoće ................................................................................. 48
2.3 Interval povjerenja ................................................................................................................. 49
2.3.1 Interval povjerenja za  normalne raspodjele sa poznatim  2 ...................................... 50
2.3.2 Interval povjerenja za  normalne raspodjele sa nepoznatim  2.................................. 52
2.3.3 Interval povjerenja za varijansu  2 normalne raspodjele .............................................. 55
2.3.4 Interval povjerenja za parametre drugih raspodjela ...................................................... 57
2.4 Testiranje hipoteza. Odluke ................................................................................................... 57
2.4.1 Jednostrane i dvostrane alternative (Slika 2.5) .............................................................. 59
2.4.2 Greške u testovima......................................................................................................... 60
2.4.3 Test za  normalne raspodjele s poznatom  2 .............................................................. 62
2.4.4 Test za  kad je  2 nepoznato i za  2 ............................................................................ 64
2.4.5 Upoređivanje srednje vrijednosti i varijanse .................................................................. 65
2.5 Kontrola kvaliteta ................................................................................................................... 68
2.5.1 Kontrolni dijagram za srednju vrijednost ....................................................................... 68
2.5.2 Kontrolni dijagram za varijansu ...................................................................................... 69
2.5.3 Kontrolni dijagram za standardnu devijaciju .................................................................. 70
2.5.4 Kontrolni dijagram za raspon ......................................................................................... 70
2.6 Uzorkovanje prihvatanja ........................................................................................................ 71
2.6.1 Greške pri uzorkovanju................................................................................................... 72
2.6.2 Ispravljanje ..................................................................................................................... 73
2.7 Ocjena uklapanja 2 test......................................................................................................... 74
2.8 Neparametarski testovi .......................................................................................................... 77
2.9 Regresija. Uklapanje pravca. Korelacija.................................................................................. 79
2.9.1 Regresiona analiza .......................................................................................................... 79
2.9.2 Intervali povjerenja u regresionoj analizi ....................................................................... 83
2.9.3 Korelaciona analiza ......................................................................................................... 84
2.9.4 Testiranje koeficijenta korelacije  ................................................................................ 86
DODATAK 1 ..................................................................................................................................... 89

4
VJEROVATNOĆA I STATISTIKA

Teorija vjerovatnoće (Poglavlje 1) obezbjeđuje modele raspodjela vjerovatnoće (teorijski modeli uočljivih
događaja koji uključuju slučajnost) koji se ispituju statističkim metodama kojima također daje
matematske osnove (Poglavlje 2).

Savremena matematska statistika (Poglavlje 2) ima različite inženjerske primjene. Na primjer, u


ispitivanju materijala, kontroli proizvodnih procesa, kontroli kvalitete proizvodnih rezultata, ispitivanju
performansi sistema u robotici i automatizaciji općenito, planiranju proizvodnje, marketinškoj analizi itd.

Ovome se može dodati dugi popis područja primjene, na primjer, u poljoprivredi, biologiji, računarstvu,
demografiji, ekonomiji, geografiji, upravljanju prirodnim resursima, medicini, meteorologiji, politici,
psihologiji, sociologiji, kontroli saobraćaja, urbanističkom planiranju itd. Iako su te primjene vrlo
heterogene, vidjet ćemo da je većina statističkih metoda univerzalna u smislu da se svaka od njih može
primijeniti u različitim područjima primjene.

1
2
1. Analiza podataka. Teorija Vjerovatnoće

Prvo ćemo pokazati kako se raspolaže sa podacima numerički ili u smislu grafikona i kako iz njih izvući
potrebne informacije (prosječne vrijednosti, rasipanje podataka itd.). Ako na podatke utječe
"slučajnost", faktorima čiji učinak ne možemo tačno predvidjeti (npr. metereološki podaci, cijene
dionica, životni vijek guma itd.), moramo se osloniti na teoriju vjerovatnoće. Ova je teorija nastala u
igrama na sreću, kao što su bacanje kovanice, bacanje kockica ili kartanje. Danas ona daje matematske
modele slučajnim procesima nazvanim slučajni eksperimenti ili, ukratko, eksperimenti. U takvom
eksperimentu promatramo slučajnu promjenjivu X, to jest funkciju čije se vrijednosti u pojedinačnom
eksperimentu - opitu (provođenje eksperimenta) pojavljuju "slučajno" (Dio. 1.3) prema raspodjeli
vjerovatnoće koja daje pojedinačne vjerovatnoće pomoću kojih se, dugoročno, događanje moguće
vrijednosti X može predvidjeti. Na primjer, svako od šest lica kockice može se pojaviti s istom
vjerovatnoćom, 1/6. Također, moguće je istovremeno posmatrati više od jedne slučajne varijable, na
primjer, visinu i težinu osoba ili pritisnu i zateznu čvrstoću čelika. O ovome će se raspravljati u Dijelu 1.9,
u kojem će se dati osnove za matematsko dokazivanje statističkih metoda u Poglavlju 2.

1.1 Prikazivanje podataka. Prosječna Vrijednost. Rasipanje

Podaci se mogu prikazati numerički ili grafički na različite načine. Na primjer, dnevni list može sadržavati
tablice cijena dionica i tečaja valuta, krivulja ili bar grafikona koji ilustriraju ekonomske ili političke
događaje, ili pita-grafikone koji pokazuju kako se troši porez koji plaćaju građani. Tu su i brojni drugi
prikazi podataka za posebne namjene.

U ovom dijelu raspravljat će se o upotrebi standardnih prikaza podataka u statistici (za to su dostupni
programski paketi, kao što su Excel, Data Desk, Mathcad, Maple ili Mathematica), a objasnit će se i
odgovarajući pojmovi i metode putem tipičnih primjera.

PRIMJER 1: Bilježenje i sortiranje

Vrijednosti opita (uočavanja i mjerenja) trebaju se zabilježiti u redoslijedu u kojem se pojavljuju. Kao
prvi korak ispitivanja svojstava eksperimentiranja i grafičkog prikazivanja ispitanih uzoraka vrši se
njihovo sortiranje, tj. redanje vrijednosti uzorka po veličini. Sortiranje je standardni proces na računaru.

Super legure su zajedničko ime za legure koje se koriste pri izradi mlaznih i motora raketa, koje
zahtijevaju visoku otpornost na temperaturu (tipično 1000C), visoku čvrstoću i izvrsnu otpornost na
oksidaciju. Trideset ispitanih uzoraka čelične legure na bazi nikla imali su zatezne čvrstoće (mjerenu u
MPa) koje su zabilježene u dobijenom redoslijedu ispitivanja i zaokružene na cijele vrijednosti,

625 531 610 627 607 651 678 545 597 579 588 568 607 614 538
(1)
621 627 563 623 572 574 634 600 621 593 614 561 603 579 614

Sortiranjem i redanjem dobije se:

531 538 545 561 563 568 572 574 579 579 588 593 597 600 603
(2)
607 607 610 614 614 614 621 621 623 625 627 627 634 651 678

3
1.1.1 Grafičko predstavljanje podataka

Sada ćemo predstaviti standardno grafičko prikazivanje koje se koriste u statistici za dobijanje
informacija o svojstvima podataka.

PRIMJER 2: Histogram (Slika 1.1a)

Za velike skupove podataka, najbolji način prikazivanja raspodjele podataka je pomoću histograma.
Princip je objašnjen na Slici 1.1. (Primjena na veći skup podataka prikazana je u poglavlju 2.7). Osnove
pravougaonika na Slici 1.1 su x-intervali (poznati kao intervali klasa) 530-560, 560-590, 590-620, 620-
650, 650-680, čiji su srednje tačke (poznate kao oznake klasa) x = 545, 575, 605, 635, 665.

Visina pravougaonika s oznakom klase x je ili apsolutna frekvencija fabs(x) (broj podatka u pojedinom
intervalu klase) ili relativna frekvencija klase frel(x) definirana kao broj podataka u toj klasi, podijeljen sa
ukupnim brojem podataka n = 30 u našem slučaju. Zbog toga su površine pravougaonika proporcionalne
ili apsolutnim frekvencijama 3, 8, 10, 7, 2 ili relativnim frekvencijama, 0,10, 0,27, 0,33, 0,23, 0,07, tako
da histogrami daju dobru predstavu o raspodjeli podataka.

Slika 1.1a Histogram apsolutnih i relativnih frekvencija i kumulativnih frekvencije u Primjeru 1

Visina pravougaonika histograma na desnoj strani Slike 1.1 (histogram apsolutne i relativne
kumulativne frekvencije Fabs(x) i Frel(x)) proporcionalna je zbiru apsolutnih ili relativnih frekvencija do
razmatranog intervala klase. Prema tome svi intervali klasa u Primjeru 1 imaju sljedeće apsolutne
kumulativne frekvencije 3, 3 + 8 = 11, 11 + 10 = 21, 21 + 7 = 28, 28 + 2 = 30 i relativne kumulativne
frekvencije (0,1), (0,1 + 0,27 = 0,37), (0,37 + 0,33 = 0,7), (0,7 + 0,23 = 0,93) i (0,93 + 0,07 = 1). Ovo, npr.,
znači da samo 0,37 ∙ 100 = 37% uzoraka ima vrijednost manju od 590 MPa, što daje apsolutnu
kumulativnu frekvenciju od 3 + 8 = 11 uzoraka. Sličan se zaključak može izvući i za ostale vrijednosti
uzoraka u Primjeru 1.

PRIMJER 3: Predstavljanje podataka pravougaonikom. Medijan. Raspon kvartila. Netipične vrijednosti

Predstavljanjem podataka pomoću pravougaonika prikazuje se prosječna vrijednost i rasipanje podataka


a to su, najčešće, dvije najvažnije veličine koje zastupaju skup.

Prosječna vrijednost se mjeri medijanom qM ili srednjim kvartilom. Ako je broj članova n skupa neparan
onda je medijan qM vrijednost srednjeg člana sortiranog skupa. Međutim, ako je broj članova n paran

4
broj onda je qM prosječna vrijednost dva srednja člana sortiranog skupa. U Primjeru 1, skup podataka (2)
gdje je n = 30, qM = 1/2∙(x15 + x16) = 1/2∙(603 + 607) = 605.

Rasipanje podataka može se mjeriti rasponom maksimalne i minimalne vrijednosti R = xmax - xmin. U
Primjeru 1, Tabela (2) R = xmax - xmin = 678 – 531 = 147

Bolje informacije o rasipanju podataka daje raspon kvartila IQR = qU – qL. Gdje je qU vrijednost srednjeg
člana (ili srednja vrijednost dva srednja člana) članova iznad medijana, a vrijednost qL je vrijednost
srednjeg člana (ili srednja vrijednost dva srednja člana) članova ispod medijana. U Primjeru 1, Tabela (2)
qU = x23 621 i qL = x8 = 574 te je IQR = 47.

Pravougaonik na Slici 1.1b se prostire vertikalno od qL do qU vrijednosti a njegova visina je IQR = 47.
Vertikalne linije iznad i ispod pravougaonika prostiru se do xmax = 678 i xmin = 531što daje R = 147.

Slika 1.1b Predstavljanje podataka skupa (1) pravougaonikom

Linija iznad pravougaonika je preduga. Ovo upućuje na mogućnost postojanja netipične vrijednosti, tj.
vrijednost koja je viša od 1,5 puta IQR od bilo kojeg kraja pravougaonika, gdje je 1,5 čisto
konvencionalna vrijednost. Netipična vrijednost ukazuje na mogućnost greške kod prikupljanja
podataka. U (2) imamo da je 621 + 1,5∙IQR = 691,5 > 678 pa nemamo netipičnih vrijednosti.

1.1.2 Srednja vrijednost. Standardna devijacija. Varijansa. Empirijsko pravilo

Medijani i kvartili lako se dobijaju sortiranjem i brojanjem, praktično bez ikakvog proračuna. Međutim,
oni ne daju pune informacije o podacima: u određenoj se mjeri vrijednosti podataka mogu promijeniti
bez promjene medijana. Slično je i sa kvartilima.

Srednja vrijednost svih podataka je

1 n 1
x 
n j 1
x j   x1  x2  ...  xn 
n
(3)

5
Ovo je aritmetička sredina vrijednosti podataka, dobijena njihovim zbirom podijeljenim brojem
podataka n. Stoga je u Primjeru 1,

1 17964
x  531  538  ...  678    598,8
30 30

Svaki podatak doprinosi i promjenom jednog od njih promijenit će se i srednja vrijednost.

Slično tome, rasipanje (varijabilnost) podataka može se mjeriti standardnom devijacijom s, ili njenim
kvadratom, varijansom.

1 n
  xj  x  
1 
 x1  x   ...  xn  x  
2 2 2
s2  (4)
n  1 j 1 n 1 

Dakle, kako bi se dobila varijansa podataka, treba sračunati sumu kvadrata razlike svakog podatka od
srednje vrijednosti (xj – x̄ )2, i na kraju tu sumu podijeliti sa n – 1 (a ne sa n, kao što stoji u Dijelu 2.2). Da
bi se dobila standardna devijacija s, treba sračunati kvadratni korijen od varijanse s2.
Na osnovu (4) varijansa u Primjeru 1 je

1  17964  
2 2
17964  
1 n
 j  
2
s2  x  x   531    ...   678     1112
n  1 j 1 29  30   30  

Stoga je standardna devijacija s = √1112 = 33,3. Napominjemo da standardna devijacija ima istu jedinicu
mjere kao i vrijednosti podataka (u Primjeru 1 to je MPa). S druge strane, varijansa se više koristi od
standardne devijacije u razvoju statističkih metoda, što će biti pokazano u Poglavlju 2.

PAŽNJA! Kompjuterska aplikacija može koristiti 1/n umjesto 1/(n – 1) u (4), međutim posljednji izraz je
bolji kad je n malo (vidi Dio 2.2).

Srednja vrijednost i standardna devijacija, uvedeni radi davanja prosječne vrijednosti i rasipanja
podataka od prosječne vrijednosti, zapravo daju mnogo više informacija shodno sljedećem pravilu.

Empirijsko pravilo. Za svaku približno simetričnu raspodjelu podataka oblika humke/zvona, intervali
x̄ ± s, x̄ ± 2s i x̄ ± 3s sadrže 68%, 95% i 99,7% od ukupnog broja podataka.

PRIMJER 3: Empirijsko pravilo i odstupanje. k-vrijednost

Iz Primjera (1) sa x̄ = 598,8 i s = 33,3 intervali iz empirijskog pravila 565,4  x  632,1, 532,1  x  665,5 i
498,7  x  698,8 sadrže 73% (22 podatka, 5 podbačaja i 3 prebačaja), 93% (28 podataka, 1 podbačaj i 1
prebačaja) i 100% od ukupnog broja vrijednosti.

Konačno, relativni položaj vrijednosti x u skupu čija je srednja vrijednost x̄ i standardna devijacija s može
se mjeriti k-vrijednošću

xx
k x   x  x  k xs
s

Na primjer, k(568) = – 0,92 i ovo je negativan broj jer se 586 nalazi ispod srednje vrijednosti.

6
1.2 Eksperimenti, ishodi, događaji

Cilj teorije vjerovatnoće je osigurati matematske modele za situacije koje su pogođene ili se čak
rukovode "slučajnošću", na primjer, u vremenskim prognozama, životnom osiguranju, kvaliteti tehničkih
proizvoda (računara, baterija, čeličnih limova itd.), i, naravno, igara na sreću s kartama ili kockicama. A
tačnost tih modela može se provjeriti odgovarajućim opažanjima ili eksperimentima - to je glavna svrha
statistike o kojoj će biti riječi u Poglavlju. 2.

Na ovom mjestu definirat će se neki standardni pojmovi. Eksperiment je proces mjerenja ili opažanja, u
laboratoriju, u fabrici, na ulici, u prirodi ili bilo gdje drugo. Stoga se pojam "eksperiment" koristi u
prilično općenitom smislu. Nas zanimaju eksperimenti koji uključuju slučajnost, tj. oni eksperimenti kod
kojih ne možemo tačno predvidjeti rezultat. Ispitivanje/pokušaj je provođenje pojedinačnog
eksperimenta. Rezultat je ishod ispitivanja/pokušaja, a n ispitivanja tada daje n rezultata. Prostor/skup
svih mogućih ishoda eksperimenta naziva se prostor/skup ishoda S.

PRIMJERI 1 do 6: Slučajni eksperimenti. Skup S

(1) Kontrola žarulja. S = {Neispravna, Ispravna}.

(2) Bacanje kocke. S = {1, 2, 3, 4, 5, 6}.

(3) Mjerenje zatezne čvrstoće žice. S su vrijednosti čvrstoće u nekom intervalu.

(4) Mjerenje sadržaja bakra u mesingu. S je recimo od 50% do 90%.

(5) Brojanje dnevnih saobraćajnih nesreća u Mostaru. S je cijeli broj u nekom intervalu.

(6) Traženje mišljenje o novom modelu automobila. S = {Sviđa, Ne sviđa, Neodlučan}.

Podskupovi skupa S nazivaju se događaji, a ishodi se nazivaju jednostavni događaji.

PRIMJER 7: Događaji

U (2) događaji su A = {1, 3, 5} (neparni brojevi), B = {2, 4, 6} (parni brojevi), C = {5, 6} itd. Jednostavni
događaji su {1}, {2}, {3}, , {6}.

Ako se pri ispitivanju dogodi ishod a i a  A (a je element A), kažemo da se A dogodilo. Na primjer, ako
pri bacanju kockice ispadne 3, događaj A se desio (jer je 3 neparan broj). Slično tome, ako se dogodi C u
Primjeru 7 (što znači da se pojavilo ili 5 ili 6), onda se dogodilo i, recimo, D = {4, 5, 6}. Također treba
imati na umu da se S događa pri svakom ispitivanju, što znači da se neki događaj iz S uvijek događa.

1.2.1 Unije, Presjeci, Komplementi događaja

Kako bi se uspostavili osnovni zakoni vjerovatnoće trebat će se definirati sljedeći pojmovi i činjenice o
događajima (podskupovima) određenog skupa S.

Unija AB sastoji se od svih tačaka u A ili B ili oba događaja.

Presjek AB sastoji se od svih tačaka koje su i u A i u B.

7
Ako A i B nemaju zajedničkih tačaka, pišemo AB = 

Gdje je  prazan skup (skup bez elemenata), a A i B nazivamo međusobno isključujućim događajima
pošto pri ispitivanju događanje A isključuje događanje B (i obrnuto). Ako pri bacanju kockice ispadne
neparan broj u istom pokušaju ne može ispasti paran broj. Istovjetno kovanica u istom pokušaju ne
može ispasti i pismo i glava.

Komplement Ac od A. Ovo je skup svih događaja u S koji nisu u A, te je AAc =  i AAc = S

U Primjeru 7 Ac = B te je AAc = {1, 2, 3, 4, 5, 6} = S.

Unije i presjeci više događaja se definišu slično.

Unija

A
j 1
j  A1  A2  ...  Am

događaja A1, , Am sastoji se od svih tačaka koje su najmanje u jednom Aj. Slično je i sa unijom A1A2
 beskonačno mnogo podskupova A1, A2,  u beskonačnom skupu S tj., onom koji sadrži beskonačno
mnogo tačaka (jednostavnih događaja).

Presjek

A
j 1
j  A1  A2  ...  Am

događaja A1, , Am sastoji se od tačaka iz S koje se nalaze u svakom od događaja. Slično je i sa


presjekom A1A2  beskonačno mnogo podskupova A1, A2,  u beskonačnom skupu S.

Rad s događajima može se ilustrirati i olakšati Vennovim dijagramima za prikazivanje unija, presjeka i
komplemenata, čiji su tipični primjeri prikazani na Slikama 1.2 i 1.3.

Slika 1.2 Vennovi dijagrami dva događaja A i B u skupu S, njihova unija (obojena) i presjek (obojeno)

PRIMJER 8: Unije i presjeci 3 događaja

Pri bacanju kockice razmotri događaje: A: broj veći od 3, B: broj manji od 6 i C: paran broj
Iz ovoga slijedi da je: AB = {4, 5}, BC = {2, 4}, CA = {4, 6}, ABC = {4}. Nacrtaj Vennove dijagrame
za ove slučajeve! Dalje, zašto je AB = S i ABC = S?

8
Slika 1.3 Vennov dijagram za eksperiment bacanja kockica koji prikazuje skup S, te događaje
A = {4, 5, 6}, C = {2, 4, 6}, AC = {2, 4, 5, 6}, AC = {4, 6}

1.3 Vjerovatnoća

"Vjerovatnoća" događaja A u eksperimentu trebala bi izmjeriti koliko često će se A pojavljivati ako se


učini mnogo pokušaja. Ako bacimo kovanicu, tada se glava H i pismo J pojavljuju jednako često - kaže se
da su H i J jednako vjerovatni. Slično tome, za korektno načinjenu kockicu svaki od šest rezultata će biti
jednako vjerovatan. Ovo su primjeri eksperimenata u kojima se skup ishoda S sastoji od konačnog broja
tačaka koji se zbog neke simetrije smatraju jednako vjerovatnim. Ovo upućuje na sljedeću definiciju.

DEFINICIJA 1: Prva definicija vjerovatnoće

Ako se S prostor eksperimenta sastoji od konačnog broja rezultata (tačaka) koji su jednako vjerovatni,
onda je vjerovatnoća P(A) događaja A

broj tačaka u A
P  A  (1)
broj tačaka u S

Iz ove definicije izravno slijedi da je,

P S   1 (2)

PRIMJER 1: Bacanje kockice

Prilikom jednog bacanja kockice, koja je vjerovatnoća P(A) da će se dobiti brojevi 5 ili 6? I da će se desiti
događaj B = neparan broj?

Rješenje: Šest je ishoda jednako vjerovatno, a svaki ima vjerovatnoću 1/6. P(A) = 2/6 = 1/3 jer
A = 5, 6 ima dvije tačke, a P(B) = 3/6 = 1/2.

Definicija 1 vodi računa o većini igara na sreću kao i nekim praktičnim primjenama, kao što ćemo kasnije
vidjeti, ali svakako ne o svim eksperimentima, jer u mnogim problemima nemamo konačno mnogo
jednako vjerovatnih ishoda. Da bismo došli do općenitije definicije vjerovatnoće, vjerovatnoću
smatramo istovjetnom relativnoj frekvenciji. Ovdje se treba podsjetiti da je u Djelu 1.1 rečeno da je
apsolutna frekvencija f(A) događaja A broj koliko se puta događaj A dešava u n pokušaja, a da je
relativna frekvencija od A, u tim pokušajima jednaka f(A)/n, te je

9
f  A broj dešavanja u A
Prel  A    (3)
n ukupan broj pokušaja

Ako se A nije dogodilo, onda je f(A) = 0. Ako se A događa u svim pokušajima onda je f(A) = n. Ovo su
ekstremni slučajevi. Dijeljenje sa n daje

0  frel  A  1 (4*)

Konkretno, za A = S imamo da je f(S) = n jer se S uvijek javlja (što znači da se neki događaj uvijek javlja,
vidi Dio. 1.2, nakon primjera 7). Dijeljenje sa n daje

frel S   1 (5*)

Konačno, ako se A i B međusobno isključuju, oni se ne mogu dogoditi zajedno. Dakle, apsolutna
frekvencija njihove unije AB mora biti jednaka zbiru apsolutnih frekvencija A i B. Dijeljenje sa n daje isti
odnos za relativne frekvencije,

frel  A  B   frel  A  frel B  , AB  (6*)

Sada se može proširiti definiciju vjerovatnoće i na eksperimente u kojima se ne javljaju jednako


vjerovatni rezultati. Naravno, proširena definicija trebala bi obuhvatati Definiciju 1. Budući da bi
vjerovatnoće trebale biti istovjetne relativnim frekvencijama, svojstva (4*), (5*) i (6*) se postavljaju kao
aksiomi. (Historijski gledano, takav je izbor rezultat dugog procesa stjecanja iskustva o onome što bi bilo
najbolje i najprikladnije.)

DEFINICIJA/AKSIOM 2: Općenita definicija vjerovatnoće

S obzirom na skup S, svaki događaj A od S (podskup od S) povezan je s brojem P(A) koji se naziva
vjerovatnoća od A, tako da su zadovoljeni sljedeći aksiomi vjerovatnoće.

1. Za svaki A u S,

0  P  A  1 (4)

2. Cijeli skup S ima vjerovatnoću

P S   1 (5)

3. Za međusobno isključujuće događaje A i B (AB =  vidi Dio 1.2),

P  A  B   P  A  P B  , AB  (6)

Ako je skup S beskonačan (ima beskonačno mnogo tačaka), Aksiom 3 mora biti zamijenjen sa 3'. Za
međusobno isključujuće događaje A1, A2, ,

P  A1  A2  ...  P  A1   P  A2   ... (6')

10
1.3.1 Osnovne teoreme vjerovatnoće

Kasnije ćemo vidjeti da aksiomi vjerovatnoće omogućavaju izgradnju teorije vjerovatnoće i njenu
primjenu u statistici. Na samom početku krenut ćemo od ove tri osnovne teoreme. Prva od njih je
korisna ako se vjerovatnoća komplementa Ac može dobiti lakše od vjerovatnoće P(A).

TEOREMA 1: Pravilo komplementarnosti

Za događaj A i njegov komplement Ac u skupu S,

 
P Ac  1  P  A  (7)

DOKAZ: Definiranjem komplementa (Dio 1.2) imamo AAc = S i AAc = . Stoga Aksiomi 2 i 3,

 
1  P S   P  A   P Ac  
te je: P Ac  1  P  A 

PRIMJER 2: Bacanje kovanice

Pet kovanica bacaju se istodobno. Pronađite vjerovatnoću događaja A: pojavljuje se barem jedna glava.
Pretpostavimo da su kovanice fer.

Rješenje: Budući da svaka kovanica može ispasti glave ili pismo, uzorak se sastoji od 25 = 32 ishoda.
Budući da su kovanice fer, možemo dodijeliti istu vjerovatnoću (1/32) svakom ishodu. Tada se događaj
Ac (pet bacanja bez pojavljivanja glave) sastoji od samo jednog ishoda. Odatle je P(Ac) = 1/32 pa odgovor
glasi P(A) = 1 – P(Ac) = 1 – 1/32 = 31/32.

Sljedeća teorema je jednostavno proširenje Aksioma 3, koje možemo lako dokazati indukcijom.

TEOREMA 2: Pravilo dodavanja za međusobno isključujuće događaje

Za međusobno isključujuće događaje A1, A2, , Am u skupu S,

P  A1  A2  ...  Am   P  A1   P  A2   ...  P  Am  (8)

PRIMJER 3: Međusobno isključujući događaji

Ako su vjerovatnoće, da će u bilo kojem radnom danu radionica primiti 10-20, 21-30, 31-40, više od 40
automobila, 0,20, 0,35, 0,25, 0,12, kolika je vjerovatnoća da će zadanog radnog dan radionica primiti
najmanje 21 automobil?

Rješenje: Budući da su to međusobno isključujući događaji, Teorema 2 daje odgovor 0,35 + 0,25 + 0,12 =
0,72. Provjerite ovo pomoću pravila komplementarnosti.

U mnogim slučajevima događaji neće biti međusobno isključujući. U tom slučaju imamo

TEOREMA 3: Pravilo dodavanja za proizvoljne događaje

Za događaje A i B u skupu S,

P  A  B   P  A  P  B   P  A  B  (9)

11
DOKAZ: Događaji C, D, E na Slici 1.4 čine AB i međusobno su isključujući. Dakle, Teorema 2 daje,

P  A  B   P C   P D   P E 

Ovo daje (9) jer je s desne strane jednačine, prema Aksiomu 3 i prema bivanju međusobno isključujućim
događajima P(C) + P(D) = P(A); i također prema Aksioma 3 i bivanju međusobno isključujućim
događajima P(E) = P(B) – P(D) = P(B) – P(AB).

Treba imati na umu da za međusobno isključujuće događaje A i B vrijedi AB = , po definiciji i


poređenjem (9) i (6),

P    0 (10)

Možete li ovo dokazati putem (5) i (7)?

Slika 1.4 Dokaz Teoreme 3

PRIMJER 4: Unija proizvoljnih događaja

Kod bacanja kockice, koja je vjerovatnoća dobijanja neparnog broja ili broja manjeg od 4?

Rješenje: Neka događaj A bude "Neparan broj" i događaj B "Broj manje od 4." Odgovor se dobije
primjenom Teoreme 3,

3 3 2 2
P A  B    
6 6 6 3

jer je događaj AB = "Neparni brojevi manji od 4" = 1, 3.

1.3.2 Uvjetna vjerovatnoća. Neovisni događaji

Često je potrebno pronaći vjerovatnoću događaja B pod uvjetom da se desi događaj A. Ova vjerovatnoća
naziva se uvjetna vjerovatnoća B ako se desi A i označava se P(BA). U ovom slučaju A služi kao novi
(reducirani) skup uzoraka, a ta vjerovatnoća je

P  A  B
P B A  , P  A   0  (11)
P  A

Slično tome, uvjetna vjerovatnoća A ako se desi B je

P  A  B
P  A B  , P  B   0  (12)
P B 

12
TEOREMA 4: Pravilo množenja

Ako su A i B događaji u skupu S i P(A)  0 i P(B)  0 onda vrijedi,

P  A  B   P  A  P B A   P B  P  A B  (13)

PRIMJER 5: Pravilo množenja

U proizvodnji vijaka, neka je A: vijak premalog prečnika i B: vijak prekratak. Neka je P(A) = 0,1 i neka je
uvjetna vjerovatnoća da je vijak premalog prečnika također prekratak P(BA) = 0,2. Koja je vjerovatnoća
da će slučajno odaberani vijak iz proizvedene serije, biti ujedno premalog prečnika i prekratak?

Rješenje: Po Teoremi 4 P(AB) = P(A)P(BA) = 0,1 ∙ 0,2 = 0,02 = 2%

Neovisni događaji. Ako su događaji A i B takvi da je

P  A  B   P  A P B  (14)

onda su oni neovisni događaji. Uz pretpostavku da P(A)  0 i P(B)  0 iz (11)-(13) se vidi da je tada

P  A B   P  A , P B A  P B 

To znači da je vjerovatnoća od A neovisna o dešavanju ili nedešavanju B, i obrnuto.

Neovisnost m događaja. Slično, m događaja A1, A2, , Am se nazivaju neovisnim ako je

P  A1  A2  ...  Am   P  A1  P  A2  ...P  Am  (15a)

Isto vrijedi i za k različitih događaja Aj1, Aj2, , Ajk

P  Aj 1  Aj 2  ...  Ajl   P  Aj 1  P  Aj 2  ...P  Ajk  gdje je k = 2, 3, , m – 1. (15b)

Prema tome, tri događaja A, B, C neovisni su ako i samo ako

P  A  B   P  A  P B 
P  B  C   P  B  P C 
(16)
P C  A   P C  P  A 
P  A  B  C   P  A  P  B  P C 

Uzorkovanje. Sljedeći primjer ima veze sa slučajnim odabirom predmeta, jednog po jednog, iz
određenog skupa predmeta. Ovo se zove uzorkovanje iz populacije. Postoje dva načina uzorkovanja i to:

1. Kod uzorkovanja s zamjenom predmet koji je nasumično izvučeni vraća se u skup iz kojeg je uzet
nakon čega se skup temeljito miješa tek onda se nasumično izvlači sljedeći predmet, itd..

2. U uzorkovanju bez zamjene predmet koji je izvučen stavlja se na stranu.

13
PRIMJER 6: Uzorkovanja sa i bez zamjene

Kutija sadrži 10 vijaka, od kojih su tri oštećena. Dva su vijka izvučena slučajnim redoslijedom. Pronađite
vjerovatnoću da niti jedan od dva vijka nije oštećen.

Rješenje: Razmatrajmo događaje A: Prvi izvučeni vijak neoštećen i B: Drugi izvučeni vijak neoštećen.
Pošto je P(A) = 7/10, jer 7 od 10 vijaka nisu oštećeni i pošto izvlačimo nasumice, tako da svaki vijak ima
istu vjerovatnoću (1/10) da ga se izabere.

Ako izvlačimo sa zamjenom, situacija prije drugog izvlačenja je ista kao na početku, i P(B) = 7/10.
Događaji su neovisni, a odgovor je

P  A  B   P  A P B   0,7  0,7  0,49  49%

Ako izvlačimo bez zamjene, P(A) = 7/10 kao i prije. Ako se A desilo, u kutiji je ostalo 9 vijaka, od kojih su 3
oštećena. Tako da je P(BA) = 6/9 = 2/3. Teorem 4 daje odgovor

7 2
P A  B    47%
10 3

Da li je intuitivno jasno da ta vjerovatnoća mora biti manja od prethodne?

1.4 Permutacije i kombinacije

Permutacije i kombinacije pomažu u pronalaženju vjerovatnoće P(A) = a/k sistematskim brojanjem


tačaka a od kojih se sastoji događaj A, dok je ovdje k broj tačaka u skupu uzoraka S. Praktična teškoća je
da a često može biti iznenađujuće veliko, tako da stvarno brojanje postaje beznadežno.

Na primjer, ako u montaži nekog instrumenta trebate 10 različitih vijaka u određenom redosljedu i želite
ih izvući nasumično iz kutije (koja ne sadrži ništa drugo) vjerovatnoća da ih dobijete u potrebnom
redoslijedu je samo 1/3.628.800 zato što ima

10! = 1 ∙ 2 ∙ 3 ∙ 4 ∙ 5 ∙ 6 ∙ 7 ∙ 8 ∙ 9 ∙ 10 = 3.628.800

redosljeda u kojima se mogu izvući. Slično tome, u mnogim drugim situacijama brojevi redosljeda,
rasporeda itd. često su nevjerovatno veliki.

Ako niste impresionirani, uzmite 20 vijaka - koliko će veći broj redoslijeda biti?

1.4.1 Permutacije

Permutacija određenih stvari (elemenata ili objekata) je raspored ovih stvari u nizu po nekom
redosljedu. Na primjer, za tri slova a, b, c postoje 3! = 1 ∙ 2 ∙ 3 = 6 permutacije: abc, acb, bac, bca, cab,
cba. Ovo se ogleda u (a) u sljedećoj teoremi.

14
TEOREMA 1: Permutacije

(a) Različite stvari. Broj permutacija od n različitih stvari kada se sve uzimaju u isto vrijeme je,

n !  1  2  3  ...  n (čitaj en faktorijel) (1)

(b) Klase jednakih stvari. Ako se n datih stvari može podijeliti u c klasa jednakih stvari koje se razlikuju
od klase do klase, onda je broj permutacija tih stvari uzetih u isto vrijeme,

n!
(n1 + n2 + n3 +  + nc = n) (2)
n1 ! n2 ! n3 !...nc !

Gdje je nj broj stvari u j klasi

DOKAZ:

(a) Postoji n mogućnosti za popunjavanje prvog mjesta u nizu. Potom je još uvijek (n – 1) stvari dostupno
za popunjavanje drugog mjesta itd.

(b) Postoji ukupno n! = (n1 + n2 + n3 +  + nc)! permutacija ovih stvari. Međutim, za svaku klasu j
predmeta postoji nj! permutacija (permutirajući iste predmete j klase) koje su iste i od kojih u obzir treba
uzeti samo jednu. Zato treba n! podijeliti sa n1! n2! n3!  nc!.

PRIMJER 1: Ilustracija Teoreme 1(b)

Ako kutija sadrži 6 crvenih i 4 plave kuglice, vjerovatnoća izvlačenja najprije crvenih, a zatim plavih
kuglica je, P = 6! 4!/10! = 1/210  0,5% (210 permutacija).

Permutacija n stvari od kojih se k uzima istovremeno je permutacija koja sadrži samo k od navedenih n
stvari. Dvije takva permutacija koje sadrže k istih elemenata u različitom redoslijedu, različite su po
definiciji. Na primjer, postoji 6 različitih permutacija tri slova a, b, c, uzeta dva odjednom, ab, ac, bc, ba,
ca, cb.

Permutacija n stvari od kojih se k uzima istovremeno sa ponavljanjem je raspored koji se dobija


stavljanjem bilo koje stvari u prvu poziciju, bilo koje stvari, uključujući ponavljanje one koja je već uzeta
na drugu poziciju, i nastavljajući tako sve dok se ne popuni k pozicija. Na primjer, postoji 32 = 9 takvih
različitih permutacija za slova a, b, c uzeta 2 slova istovremeno, naime, prethodnih 6 permutacija i
permutacije aa, bb, cc. Ovo možete dokazati.

TEOREMA 2: Permutacije

Broj različitih permutacija n različitih stvari uzetih k istovremeno bez ponavljanja je,

n!
n  n  1 n  2  ...  n  k  1  (3a)
 n  k !
a sa ponavljanjem je,

nk (3b)

15
PRIMJER 2: Ilustracija Teoreme 2

U šifriranoj poruci slova su raspoređena u skupinama od pet slova, nazvanih riječi. Iz (3b) vidimo da je
broj različitih takvih riječi 305 = 24.300.000.

Iz (3a) slijedi da je broj različitih riječi koje svako slovo sadrže samo jednom 30!/(30-5)! = 30 ∙ 29 ∙ 28 ∙27 ∙
26 = 17.100.720.

1.4.2 Kombinacije

Kod permutacija neophodan je, redoslijed odabranih stvari. Nasuprot tome, kombinacija datih stvari
znači bilo koji odabir jedne ili više stvari bez obzira na redoslijed. Postoje dvije vrste kombinacija, kako
slijedi:

Broj kombinacija n različitih stvari, od kojih se k uzima istodobno, bez ponavljanja je broj skupova koji
mogu biti sastavljeni od n datih stvari, svaki skup sadrži k različitih stvari i nijedan skup ne sadrži tačno
iste k stvari.

Broj kombinacija n različitih stvari, od kojih se k uzima istodobno, s ponavljanjem je broj skupova koji
se mogu sastojati od k elemenata izabranih iz datih n stvari, od kojih se svaki koristi onoliko često koliko
se želi.

Na primjer, postoje tri kombinacije tri slova a, b, c, kada se uzimaju dva slova odjednom, bez
ponavljanja, naime, ab, ac, bc i šest takvih kombinacija s ponavljanjima, naime, ab, ac, bc, aa, bb, cc.

TEOREMA 3: Kombinacije

Broj različitih kombinacija n različitih stvari od kojih se k uzima u isto vrijeme, bez ponavljanja je

n n! n  n  1 ...  n  k  1
   (4a)
 k  k !  n  k ! 1 2...  k

a broj kombinacija s ponavljanjima jeste

 n  k  1
  (4b)
 k 

DOKAZ: Tvrdnja (4a) slijedi iz prvog dijela Teoreme 2 primjećujući da postoji k! permutacija k stvari
iz datih n stvari koje se razlikuju po redoslijedu elemenata (vidi Teoremu 1), međutim postoji samo jedna
kombinacija onih k stvari čija je vrsta naznačena u prvoj tvrdnji Teoreme 3. Posljednja tvrdnja Teoreme 3
može se dokazati indukcijom.

PRIMJER 3: Ilustracija Teoreme 3

Broj uzoraka od 5 žarulja koje se mogu odabrati između 500 žarulja je [vidi (4a)]

 500  500! 500  499  498  497  496


 5   5! 495!  1 2  3  4  5
 255.244.687.600
 

16
1.4.3 Faktorijelna funkcija

Po definiciji je,

0!  1 (5)

Vrijednost faktorijelne funkcije se može izračunati na sljedeći način

 n  1!   n  1 n ! (6)

Za veliko n funkcija je vrlo velika, te se tada, kao dobra aproksimacija, može koristiti Stirlingova formula

n
n
n! ~ 2 n   (e = 2,718) (7)
e

gdje se  čita "asimptotski jednak" i znači da se odnos dvije strane u (7) približava 1 kad se n teži
beskonačnosti.

PRIMJER 4: Stirlingova formula

n! prema (7) tačna vrijednost relativna greška


4! 23,5 24 2,1%
10! 3.598.696 3.628.800 0,8%
20! 2,42279  1018 2.432.902.008.176.640.000 0,4%

1.4.4 Binomni koeficijent

Binomni koeficijenti su definirani formulom

 a  a  a  1 a  2  ...  a  k  1
  (k  0, cijeli broj) (8)
k  k!

Numerator ima k faktora. Nadalje, definiramo

a 0
   1, također    1 (9)
0 0

Za cijeli broj a = n iz (8) dobijemo

n  n 
   (n  0 i 0  k  n) (10)
k  n  k 

Binomni koeficijenti mogu se izračunati rekurzivno, jer

 a   a   a  1
    (k  0, cijeli broj) (11)
 k   k  1  k  1

17
Formula (8) također daje

 m  k  m  k  1
    1   (k  0, cijeli broj i m > 0) (12)
 k   k 

Nadalje postoje brojni drugi odnosi; od kojih spominjemo dva važna,

n 1
k  s n  k 
   (k  0, n  1, i k i n su cijeli brojevi) (13)
s 0  k   k  1
r
 p q   p  q 
k r  k   
k 0   
 (r  0, cijeli broj) (14)
  r 

1.5 Slučajne varijable. Raspodjele vjerovatnoće

U Dijelu 1.1 razmotrili smo raspodjelu frekvencija podataka. Te raspodjele pokazuju apsolutnu ili
relativnu frekvenciju podataka. Slično tome, raspodjela vjerovatnoće ili, ukratko, raspodjela, pokazuje
vjerovatnoću događaja u eksperimentu. Veličina koju pratimo u eksperimentu bit će označena s X i zove
se slučajna varijabla (ili stohastička varijabla) jer vrijednost koja će se desiti u sljedećem ispitivanju ovisi
o slučajnosti, npr. ako bacamo kockice, dobije se jedan od brojeva 1 do 6, ali se ne zna koji će se sljedeći
broj pojaviti. Tako su brojevi na kockici koji se pojavljuju slučajna varijabla X. Također X je i pritisna ili
zatezna čvrstoća betona isl.. ("Stohastičan" znači slučajan.)

Ako brojimo (automobile na cesti, neispravne vijke u proizvodnji, bacanja dok kockica ne pokaže prvu
šesticu), imamo diskretnu slučajnu varijablu i raspodjelu. Ako mjerimo (električni napon, padavine,
tvrdoću čelika ili betona), imamo kontinuiranu slučajnu varijablu i raspodjelu. Precizne definicije dat će
se kasnije. U oba slučaja raspodjela X određuje se funkcijom raspodjele:

F x  P  X  x (1)

Ovo je vjerovatnoća da će u opitu varijabla X poprimiti bilo koju vrijednost koja ne prelazi x.

PAŽNJA! Terminologija nije ujednačena. F(x) se ponekad zove i funkcija kumulativne raspodjele.

Da bi (1) imalo smisla u slučaju diskretne i kontinuirane raspodjele, formuliraju se uvjeti kako slijedi.

DEFINICIJA 2: Slučajna varijabla

Slučajna varijabla X je funkcija definirana na prostoru S eksperimenta. Njene su vrijednosti realni brojevi.
Za svaki broj a definišu se vjerovatnoća

P  X  a

s kojom X poprima vrijednost a. Slično tome, za svaki interval I definiše se vjerovatnoća

P  X I 

s kojiom je X poprima bilo koju vrijednosti u I.

18
Iako je ova definicija vrlo općenita, u praksi se javlja vrlo mali broj raspodjela.

Iz (1) dobijamo osnovnu formulu za vjerovatnoću koja odgovara intervalu a < X  b,

P a  X  b   F  b   F a  (2)

Ovo važi jer su događaji X  a ("X poprima bilo koju vrijednost koja ne prelazi a") i a < X  b ("X poprima
bilo koju vrijednost u intervalu a < x  b"), prema (1) i Aksiomu 3 Definicije 2 u Dijelu. 1.3, međusobno
isključujući događaji te je

F  b   P  X  b   P  X  a   P  a  X  b   F a   P a  X  b 

što prebacivanjem F(a) na lijevu stranu izraza daje (2).

1.5.1 Diskretne slučajne varijable i raspodjele

Po definiciji, slučajna varijabla X i njena raspodjela su diskretne ako X pretpostavlja samo konačno
mnogo ili najviše prebrojivo beskonačno mnogo vrijednosti x1, x2, x3,  zvanih moguće vrijednosti od X,
s pozitivnim vjerovatnoćama p1 = P(X = x1), p2 = P(X = x2), p3 = P(X = x3),  dok je vjerovatnoća P(X  I)
nula za bilo koji interval I koji ne sadrži nikakvu moguću vrijednost.

Jasno je da je diskretna raspodjela X također određena funkcijom vjerovatnoće f(x) od X,

 p j ako je x  x j
f x   (j = 1, 2, 3, ) (3)
0 u ostalim slučajevima

Iz čega sumiranjem dobijamo vrijednosti funkcije raspodjele F(X),

F x   f x    p
x j x
j
x j x
j (j = 1, 2, 3, ) (4)

gdje za bilo koje x saberemo sve vjerovatnoće pj za koje je xj manje ili jednako od x. Ovo je stepenasta
funkcija sa skokovima prema gore veličine pj nad mogućim vrijednostima xj od X i konstantom između
ovih vrijednosti.

PRIMJER 1: Funkcija vjerovatnoće i funkcija raspodjele

Slika 1.5a prikazuje funkciju vjerovatnoće f(x) i funkciju raspodjele F(X) diskretne slučajne varijable
X = broj koji se javlja jednim bacanjem kockice. Moguće vrijednosti za X su x = 1, 2, 3, 4, 5, 6 sa
vjerovatnoćom 1/6. Na tim vrijednostima x funkcija raspodjele ima skokove prema gore veličine 1/6.
Tako da se na osnovu grafikona f(x) možemo nacrtati grafikon F(X) i obrnuto.
Na slici 1.5a i 1.5b na svakom skoku tačka označava vrijednost funkcije pri skoku!

19
Slika 1.5 Funkcija vjerovatnoće ƒ(x) i funkcija raspodjele F(x) kod a) slučajna varijabla X = broj dobijen
jednim bacanjem kockice. b) Zbir dva broja dobijena bacanjem dvije kockice po jednom

PRIMJER 2: Funkcija vjerovatnoće i funkcija raspodjele

Slučajna varijabla X = zbir dva broja, dobijena bacanjem dviju kockica je diskretna i ima sljedeće moguće
vrijednosti 2 (1 + 1), 3, 4, , 12 (6 + 6). Postoji 6  6 = 36 jednako vjerovatnih rezultata (1, 1), (1, 2), ,
(6, 6) gdje je prvi broj onaj prikazan na prvoj kockici, a drugi koji ispadne na drugoj kockici. Svaki takav
ishod ima vjerovatnoću 1/36. Konkretno, X = 2 dešava se kada ishod bacanja bude (1, 1), X = 3 u slučaju
ishoda (1, 2) i (2, 1) itd. Stoga funkcije f(x) = P(X = x) i F(x) = P(X = x) imaju vrijednosti

x 2 3 4 5 6 7 8 9 10 11 12
f(x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
F(x) 1/36 3/36 6/36 10/36 15/36 21/36 26/36 30/36 33/36 35/36 36/36

Ove funkcije prikazane su na Slici 1.5b.

Dvije korisne formule za diskretne raspodjele lako se dobiju na sljedeći način. Za vjerovatnoću koja
odgovara intervalima iz (2) i (4) se dobije

P a  X  b   F  b   F a    pj (X diskretno) (5)
a  x j b

Ovo je zbir svih vjerovatnoća pj za koje xj zadovoljava uvjet a < xj  b (Vodi računa o < i  !). Odavde i iz
P(S) = 1 (Dio 1.3) dobije se sljedeća formula

p
j
j 1 (suma svih vjerovatnoća) (6)

PRIMJER 3: Ilustracija formule (5)

U Primjeru 2, izračunajte vjerovatnoću da zbir kockica bude najmanje 4 i najviše 8.

Rješenje: P(3 < X  8) = F(8) – F(3) = 26/36 – 3/36 = 23/36

20
PRIMJER 4: Problem vremena čekanja. Prebrojivo beskonačni skup S

Pri bacanju kovanice varijabla je X = broj pokušaja dok se ne pojavi prva glava. Potom, iz neovisnosti
događaja (Dio 1.3),

P(X = 1) = P(H) = 1/2

P(X = 2) = P(JH) = 1/2  1/2 = 1/4 (H = glava, J = pismo)

P(X = 3) = P(JJH) = 1/2  1/2  1/2 = 1/8

P(X = n) = (1/2)n = qn n = 1, 2, 3, 

Također, (6) se može potvrditi formulom sume prvih n članova geometrijskog niza koja je jednaka
a/(1-q), gdje je a prvi član niza (u primjeru 1/2) i q količnik niza (u primjeru 1/2), te je

1
1 1 1 a
j p j  2  4  8  ...  1  q  2 1  1
1
2

1.5.2 Kontinuirane slučajne varijable i raspodjele

Diskretne slučajne varijable javljaju se u eksperimentima u kojima brojimo (nedostaci u proizvodnji,


sunčani dani u Mostaru, korisnici usluga koji čekaju u redu itd.). Kontinuirane slučajne varijable javljaju
se u eksperimentima u kojima mjerimo (dužine vijaka, napon u električnoj liniji, tvrdoća čelika itd.).
Prema definiciji, slučajna varijabla X i njena raspodjela kontinuiranog su tipa, ako se njena funkcija
raspodjele F(x) [definirana u (1)] može dati integralnom

F  x    f v  dv
x
(7)


(pišemo v jer je x potreban za gornju granicu integrala) čiji se integrand f(x) naziva gustoća raspodjele,
koja nije negativna i kontinuirana je, osim za možda konačno mnogo x-vrijednosti. Diferenciranjem se
uspostavlja odnos između f i F

f x  F 'x (8)

za svako x za koje je f(x) kontinuirano.

Iz (2) i (7) dobija se vrlo važna formula za vjerovatnoću koja odgovara intervalu:

P  a  X  b   F  b   F a    f v  dv
b
(9)
a

Ovo je analogno (5).

Iz (7) i P(S) = 1 (Dio 1.3) dobije se izraz analogan izrazu (6):

21

 f v  dv  1

(10)

Kontinuirane slučajne varijable su jednostavnije od diskretnih u odnosu na interval. Zaista, u


kontinuiranom slučaju četiri vjerovatnoće a < X  b, a < X < b, a  X  b i a  X < b za bilo koje fiksno a i b
(> a) su ustvari iste.

Možete li vidjeti zašto? (Odgovor: Ova vjerovatnoća je površina ispod krivulje gustoće (Slika 1.6) i ne
mijenja se dodavanjem ili oduzimanjem jedne tačke u intervalu integracije.) Ovo je razlika s obzirom na
diskretni slučaja! (Objasniti.)

Slika 1.6 Primjer koji ilustruje formulu (9)

Sljedeći primjer prikazuje tipične primjene dosadašnjih formula.

PRIMJER 5: Kontinuirana raspodjela

Neka X ima funkciju gustoće f(x) = 0,75 (1 – x2) kada je –1  x  1 i nula u svim ostalim slučajevima. Nađi
funkciju raspodjele, nađi vjerovatnoće za intervale P(–1/2  X  1/2), P(1/4  X  2) i odredi veličinu x
tako da je P(X  x) = 0,95.

Rješenje: Iz (7) se dobije F(x) = 0 ako je x  –1

 
F  x   0,75 1  v 2 dv  0,5  0,75 x  0,25 x 3
x
kada je –1  x  1
1

i F(x) = 1 ako je x > 1. Iz ovoga i (9) dobije se

 1 1  1  1
1/2

 2 2 2  2

P    X    F    F     0,75  1  v 2 dv  68,75% 
1/2

(jer je za kontinuiranu raspodjelu P(–1/2  X  1/2) = P(–1/2 < X  1/2). Nadalje,

1   1
1

4  4

P   X  2   F  2   F    0,75  1  v 2 dv  31,64% 
1/4

(Napominjemo da gornja granica integracije je 1, a ne 2. Zašto?). Konačno,

P  X  x   F  x   0,5  0,75x  0,25x 3  0,95

Uproštavanjem se dobije 3x – x3 = 1,8, a rješenje je x  0,73. Skiciraj f(x) i označi x = -1/2, 1/2, 1/4 i 0,73
kako bi vidio rezultate (vjerovatnoće) kao područja ispod krivulje. Skicirajte također F(x).

22
1.6 Srednja vrijednost i varijansa raspodjele

Srednja vrijednost  i varijansa  2 slučajne varijable X i njene raspodjele teoretski odgovaraju srednjoj
vrijednosti x̄ i varijansi s2 raspodjele frekvencije iz Dijela 1.1 i služe sličnoj svrsi. Srednja vrijednost
obilježava centralno mjesto a varijansa širenje/rasipanje (varijabilnost) raspodjele. Srednja vrijednost 
definiše se kao

   xjf x j  (diskretna raspodjela) (1a)


j


  xf  x  dx

(kontinuirana raspodjela) (1b)

A varijansa  2

 2  xj   f xj 
2
(diskretna raspodjela) (2a)
j


    x    f  x  dx
2 2
(kontinuirana raspodjela) (2b)


U jednačinama (a) i (b)  (pozitivni kvadratni korijen od  2) je standardna devijacija od X i njegove


raspodjele, a f je funkcija vjerovatnoće (jednačine (a)) ili gustoća (jednačine (b)).

Srednja vrijednost se naziva i očekivanje E(X) jer daje prosječnu vrijednost X koja se očekuje u mnogim
opitima. Veličine kao što su  i  2 koje mjere određena svojstva raspodjele nazivaju se parametri.  i  2
su dva najvažnija parametra. Iz (2) vidimo da je

2 0 (3)

PRIMJER 1: Srednja vrijednost i varijansa

Slučajna varijabla X = broj glava u jednom bacanju kovanice ima moguće vrijednosti X = 0 i X = 1 i
vjerovatnoćama P(X = 0) = 1/2 i P(X = 1) = 1/2. Iz (1a) dobijamo srednju vrijednost  = 0  1/2 + 1  1/2 =
1/2, dok se iz (2a) dobije varijansa  2 = (0 – 1/2)2  1/2 + (1 – 1/2)  1/2 = 1/4.

PRIMJER 2: Jednolika raspodjela. Varijansa mjeri rasipanje

Raspodjela gustoće:

1
f x  kada je a < x < b,
ba

a u suprotnom f(x) = 0 naziva se jednolika raspodjela u intervalu a < x < b. Iz (1b) (ili iz sljedeće Teoreme
1), dobit ćemo da je  = (a + b)/2, a iz (2b) dobije se varijansa,

b  a
2 2
 ab 1
b
  x 
2
 dx  kada je a < x < b
a
2  ba 12

23
Slika 1.7 prikazuje da je rasipanje veliko ako i samo ako je  2 veliko.

Slika 1.7 Jednolike raspodjele sa istom srednjom vrijednosti (0,5), ali različitom varijansom

Simetrija. Moguće je dobiti srednju vrijednost bez proračuna ako je raspodjela simetrična. Dokaži.

TEOREMA 1: Simetrična raspodjela

Ako je raspodjela simetrična u odnosu na x = c tj. ako je f(x – c) = f(x + c), tada je  = c. (Primjeri 1 i 2 ovo
demonstriraju).

1.6.1 Transformacija srednje vrijednosti i varijanse

Ako je data slučajna varijabla X sa srednjom vrijednosti  i varijansom  2, ovdje želimo sračunati srednju
vrijednost i varijansu od X* = a1 + a2X gdje su a1 i a2 date konstante. Ovaj problem je važan i često se
javlja u statistici.

TEOREMA 2: Transformacija srednje vrijednosti i varijanse

(a) Ako slučajna varijabla X ima srednju vrijednost  i varijansu  2, onda slučajna promjenjiva

X   a1  a2 X (a2 > 0) (4)

ima srednju vrijednost * i varijansu *2

   a1  a2  i  2  a2   2 (5)

(b) Dok standardizirana slučajna varijabla Z, koja odgovara X, i data je obrascem

X 
Z (a2 > 0) (6)

ima srednju vrijednost 0 i varijansu 1.

24
DOKAZ: Izraz (5) će biti dokazan za kontinuiranu raspodjelu. Malom intervalu I dužine x na x-osi
odgovara vjerovatnoća f(x)x [približno; površina pravougaonika osnove x i visine f(x)]. Tada
vjerovatnoća f(x)x mora biti jednaka vjerovatnoći odgovarajućeg interval na x*-osi, tj. f*(x*)x* gdje je
f* gustoća od X* i x* je dužina intervala na x*-osi koja odgovara I. Stoga za diferencijale imamo
f*(x*)dx* = f(x)dx. Nadalje, shodno (4) x* = a1 + a2x, tako da se (1b) odnosi i na X* što daje

   
   x f  x  dx  a  a2 x  f  x  dx  a1  f  x  dx  a2  xf  x  dx
    
 1
   

Prvi integral sa desne strane je jednak 1, shodno (10) u Dijelu 1.5. Drugi integral je  što dokazuje (5) i
implicira

x     a1  a2 x   a1  a2    a2  x   

Iz ovog i kada se (2) primijeni na X* i ponovnim korištenjem f*(x*)dx* = f(x)dx dobijamo drugu formulu u
(5),

 

 x   
   f  x  dx   a22   x    f  x  dx  a22 2
2
 2   2

 

Za diskretnu raspodjelu dokaz izraza (5) je sličan.

Odabirom a1 = –/ i a2 = 1/ pišući da je X* = Z iz (4) dobijemo (6). Za ove a1 i a2 formula (5) daje
* = 0 i *2 = 1 kako je navedeno u (b).

1.6.2 Očekivanje, momenti

Podsjetimo se da (1) definiše očekivanje (srednju vrijednost) od X, tj. vrijednost X koja je očekivana
prosječnost, ukratko  = E(X). Općenitije, ako je g(x) nekonstantno i kontinuirano za sve x, onda je g(X)
slučajna varijabla. Dakle, njezino matematičko očekivanje ili, ukratko, njeno očekivanje E(g(X)) je
vrijednost od g(X) koja su prosječno očekuje i koja je definirana [slično kao (1)] sa

E  g  X    g  x j  f  x j  (7a)
j


E g  X    g  x  f  x  dx (7b)


U prvoj formuli, f je funkcija vjerovatnoće diskretne slučajne varijable X. U drugoj formuli, f je gustoća
kontinuirane slučajne varijable X.

Važni posebni slučajevi su k-ti moment od X (sa k = 1, 2, )

 
E X k   x kj f  x j  (8a)
j

25

    x f  x  dx
E X k k
j (8b)


i k-ti centralni moment od X (sa k = 1, 2, )


E  X  
k
  x j
j   f xj 
k
(9a)

 

E  X       x    f  x  dx
k k
(9b)


Ako je moment prvi onda je to srednju vrijednost od X

EX   [(8) sa k = 1)] (10)

Ako je centralni moment drugi onda je to varijansa od X


E  X  
2
  2
[(9) sa k = 2)] (11)

Za kasniju uporabu možete se dokazati da je

E 1  1 (12)

1.7 Binomna, Poissonova, a Hipergeometrijska raspodjela

Ovo su tri najvažnije diskretne raspodjele, s brojnim aplikacijama.

1.7.1 Binomna raspodjela

Binomna raspodjela se javlja u igrama na sreću (bacanje kockice i sl.), provjeri kvaliteta (npr. brojanje
nedostataka), anketiranju javnog mnijenja (brojanju zaposlenika koji preferiraju određene promjene na
poslu itd.), medicini (npr. bilježenje broja pacijenata koji su se oporavili novim lijekovima) i tako dalje.
Uvjeti njene pojave su kako slijedi.

Zanima nas koliko se puta događaj A desio u n neovisnih pokušaja/ispitivanja. U svakom pokušaju
događaj A ima istu vjerovatnoću P(A) = p. Vjerovatnoća da se pri pokušajima A neće desiti ima vrijednost
q = 1 – p. U n pokušaja slučajna varijabla koja nas interesira je X = broj pojavljivanja događaja A u n
pokušaja.

X može zauzeti vrijednosti 0, 1,  n i želimo odrediti odgovarajuće vjerovatnoće. Sada, X = x znači da se


A javlja u x pokušaja, a da se u n – x pokušaja A ne pojavljuje. Ovo se može zapisati na sljedeći način

1A 4A2 ...
4 3A B
1 4B2 ...
4 3B (1)
x puta n  x puta

26
Ovdje je B = Ac komplement A, što znači da se A ne pojavljuje (Dio 1.2). Sada koristimo pretpostavku da
su pokušaji neovisni, tj. da oni ne utječu jedan na drugog. Stoga (1) ima vjerovatnoću (vidi Dio 1.3 o
nezavisnim događajima)

p p ... p  q q ... q  p x q n  x (1*)


1 4 2 43 1 42 43
x puta n  x puta

(1) je samo jedan način uređivanja x A-ova i (x – n) B-ova. Sada ćemo iskoristiti Teoremu 1(b) u Dijelu
1.4, koja daje broj permutacija n stvari (n ishoda od n pokušaja) koje se sastoje od 2 klase. Klasa 1 sadrži
n1 = x A-ova i Klasa 2 sadrži n – n1 = n – x B-ova. Ovaj broj je

n n!
 
 x  x !  n  x !

Prema tome, (1*) pomnožen s ovim binomnim koeficijentom, daje vjerovatnoću P(X = x) od X = x tj.,
dešavanja A tačno x puta u n pokušaja. Dakle, X ima funkciju vjerovatnoće

n
f  x     pxq nx (x = 0, 1, , n) (2)
x

dok je f(x) = 0 u ostalim slučajevima. Raspodjela X sa funkcijom vjerovatnoće (2) naziva se Binomna ili
Bernoullijeva raspodjela. Dešavanje A naziva se uspjehom (bez obzira na to što on zapravo jest, to može
značiti da propustite avion ili izgubite sat), a nedešavanje A naziva se neuspjehom. Slika 1.8 prikazuje
neke tipične primjere. Numeričke vrijednosti mogu se dobiti iz Tabele D1 u Dodatku 1 ili iz neke
kompjuterske aplikacije.

Slika 1.8 Funkcija vjerovatnoće (2) binomne raspodjele za n = 5 i različite vrijednosti p

Srednja vrijednost binomne raspodjele je

  np (3)

a varijansa je

 2  npq (4)

27
Za simetričan slučaj jednakih šansi uspjeha i neuspjeha p = q = 1/2 dobije se srednja vrijednost n/2,
varijansa n/4 i funkciju vjerovatnoće

n
n 1
f x     (x = 0, 1, , n) (2*)
 x  2 

PRIMJER 1: Binomna raspodjela

Izračunajte vjerovatnoću dobijanja najmanje dvije šestice pri bacanju kockice 4 puta.

Rješenje: p = P(A) = P(šest) = 1/6, q = 5/6, n = 4. Događaj "Barem dvije šestice" javlja se ako dobijemo
dvije ili tri ili četiri šestice. Stoga je odgovor

2 2 3 4
 4 1   5   4 1   5   4 1 
P  f  2  f 3   f  4                    
 2 6   6   3 6   6   4 6 
1 171
 4  6  25  4  5  1   13,2%
6 1296

1.7.2 Poissonova raspodjela

Diskretna raspodjela sa beskonačno mnogo mogućih vrijednosti i funkcijom vjerovatnoće

 x 
f x  e (x = 0, 1, ) (5)
x!

naziva se Poissonova raspodjela. Slika 1.9 prikazuje (5) za neke vrijednosti . Može se dokazati da je ova
raspodjela dobijena kao ograničavajući slučaj Binomne raspodjele, ako pustimo da p  0 i da n  
tako da se  = np približi nekoj konačnoj vrijednosti. (Na primjer,  = np može se održavati konstantnim.)
Poissonova raspodjela ima srednju vrijednost  i varijansu

2   (6)

Slika 1.9 daje predstavu da se, porastom srednje vrijednosti, povećava širenje raspodjele, i na ovaj način
ilustrira formulu (6), te da raspodjela postaje sve više i više (približno) simetrična.

Slika 1.9 Funkcija vjerovatnoće (5) Poissonove raspodjele za različite vrijednosti 

28
PRIMJER 2: Poissonova raspodjela

Ako je vjerovatnoća izrade neispravnog vijka p = 0,01. Koja je vjerovatnoća da će kutija od 100 vijaka
sadržavati više od 2 neispravna?

Rješenje: Komplementarni događaj je Ac = ne više od 2 neispravna. Za njegovu vjerovatnoću, iz binomne


raspodjele sa  = np = 1, dobijamo vrijednost [vidi (2)]

 100   100   100 


 
P Ac    0,99  
100

 1 
 0,01 0,9999    0,01  0,99
2 98

 0   2 

Pošto je p vrlo malo, ovo možemo aproksimirati prikladnijom Poissonovom raspodjelom sa srednjom
vrijednosti  = np = 100  0,01 = 1 što daje [vidi (5)]

 1
 
P Ac  e 1  1  1    91,97%
 2

PRIMJER 3: Problemi s parkiranjem. Poissonova raspodjela

Ako u prosjeku 2 automobila uđu u određeno parkiralište u minuti, koja je vjerovatnoća da će u bilo
kojoj minuti 4 ili više automobila ući u parkiralište?

Rješenje: Da bismo shvatili da je Poissonova raspodjela odgovarajući model za ovaj slučaj, zamislimo da
se minuta podijeli na mnogo vrlo kratkih vremenskih intervala, neka p bude (konstantna) vjerovatnoća
da će automobil ući u parkiralište tokom tog kratkog intervala, i pretpostavimo neovisnost događaja koji
se dešavaju tokom tih intervala. U tom slučaju se radi o Binomnoj raspodjeli s vrlo velikim n i vrlo malim
p. Ovo se da aproksimirati Poissonovom raspodjelom sa  = np = 2, jer u prosjeku dvoja kola ulaze u
parking. Komplementarni događaj događaja da "4 ili više automobila uđu tokom određene minute" je
"da uđu 3 ili manje automobila". Ovaj događaj ima vjerovatnoću

 20 21 22 23 
f  0   f 1  f  2   f  3   e 2     
 0! 1! 2! 3! 
 0,857

Odgovor: 14,3% (Zašto smo razmatrali komplement?)

1.7.3 Uzorkovanje sa zamjenom

Ovo znači da iz određenog skupa izvlačimo stvari jednu po jednu, a nakon svakog pokušaja zamijenimo
ono što je izvučeno (vraćamo ga nazad u zadani skup i miješamo) prije nego izvučemo sljedeću stvar. To
garantira neovisnost događaja i vodi Binomnoj raspodjeli. Uistinu, ako kutija sadrži N stvari, na primjer,
vijaka, od kojih je M neispravno, vjerovatnoća izvlačenja neispravnog vijka u pokušaju je p = M/N. Zato je
vjerovatnoća izvlačenja ispravnog vijka q = 1 – p = 1 – M/N, a (2) daje vjerovatnoću izvlačenja x
neispravnih vijaka u n pokušaja u obliku

x nx
n M   M
f x     1  N  (x = 0, 1, , n) (7)
 x  N   

29
1.7.4 Uzorkovanje bez zamjene. Hipergeometrijska raspodjela

Uzorkovanje bez zamjene znači da ne vratimo vijak u kutiju. Tada više nemamo neovisnost pokušaja
(Zašto?), a umjesto (7) vjerovatnoća izvlačenja x neispravnih vijaka u n pokušaja je

M N  M 
  
x nx 
f x    (x = 0, 1, , n) (8)
N 
 
n

Raspodjela sa ovakvom funkcijom vjerovatnoće naziva se Hipergeometrijska raspodjela.

Izvođenje (8): Sa (4a) u Dijelu 1.4 postoji

N 
a)   različitih načina uzimanja n stvari iz N,
n

M 
b)   različitih načina uzimanja x neispravnih vijaka iz M,
x

N  M 
c)   različitih načina uzimanja n – x ispravnih vijaka iz N – M.
 nx 

Svaki način u (b) u kombinaciji sa svakim načinom u (c) daje ukupan broj međusobno isključujućih načina
dobijanja x neispravnih vijaka u n izvlačenja bez zamjene. Pošto je (a) ukupni broj ishoda i pošto
nasumično izvlačimo, svaki takav način ima vjerovatnoću

1
iz ovoga slijedi (8)
N 
 
n

Hipergeometrijska raspodjela ima srednju vrijednost

M
 n (9)
N

i varijansu

nM  N  M  N  n 
2  (10)
N 2  N  1

PRIMJER 4: Uzorkovanje sa i bez zamjene

Želimo izvući slučajne uzorke dviju brtvi iz kutije sa deset brtvi, od kojih su tri neispravne. Pronađite
funkciju vjerovatnoće slučajne varijable X = broj neispravnih brtvi u uzorku.

Rješenje: U ovom primjeru N = 10, M = 3, N – M = 7, n = 2. Kod uzorkovanje sa zamjenskom, (7) daje

30
x 2 x
 2 3   3 
f x     1   , f  0   0, 49, f 1  0, 42, f  2   0,09
 x   10   10 

Za uzorkovanje bez zamjene moramo koristiti (8), što daje

3 7 
 x 2  x 
f x 
   , f 0  f 1  21  0, 47, f 2  3  0,07
    
 10  45 45
2
 

Ako su N, M, i N – M, veliki s obzirom na n, tada nije važno da li je uzorak sa ili bez zamjene. U tom
slučaju se hipergeometrijska raspodjela može aproksimirati binomnom raspodjelom (sa p = M/N) koja je
nešto jednostavnija.

Stoga, u uzorkovanju iz neograničeno velike populacije ("beskonačna populacija") možemo koristiti


binomnu raspodjelu, bez obzira da li uzorak uzimamo sa ili bez zamjene.

1.8 Normalna raspodjela

U ovom dijelu, preusmjerit ćemo pažnju sa diskretnih na kontinuirane raspodjele i raspravljat ćemo o
normalnoj raspodjeli. Ovo je najvažnija kontinuirana raspodjela, jer u mnogim slučajevima mnoge
slučajne varijable su normalne slučajne varijable (tj. Imaju normalnu raspodjelu) ili su približno
normalne ili mogu biti pretvorene u normalnu slučajnu varijablu na relativno jednostavan način. Nadalje,
normalna raspodjela je korisna aproksimacija složenijih raspodjela, a također se javlja u dokazima
različitih statističkih ispitivanja.

Normalna ili Gaussova raspodjela definiše se kao raspodjela s gustoćom

1  1  x   2 
f x  exp      ( > 0) (1)
 2  2    

gdje je exp eksponencijalna funkcija s bazom prirodnog logaritma e = 2,718. Ovo je jednostavnije nego
što na prvi pogled izgleda. f(x) ima sljedeće karakteristike (vidi također Sliku 1.10):

1.  i  su srednja vrijednost i standardna devijacija.

2. 1/(2) je konstantan faktor koji čini površinu ispod krivulje f(x) koja se rasprostire od – do 
jednakom 1, kao što mora biti shodno (10), Dio 1.5.

3. Krivulja f(x) je simetrična s obzirom na x =  jer je eksponent kvadrat. Stoga je za  = 0 simetrična s


obzirom na y osu odnosno osu x = 0 (Slika 1.10, "zvonolika krivulja").

4. Eksponencijalna funkcija u (1) vrlo brzo opada ka nuli ako je mala standardna devijacija , kao što bi i
trebalo biti, Slika 1.10.

31
Slika 1.10 Gustoća (1) normalne raspodjele za  = 0 za različite vrijednosti 

1.8.1 Funkcija raspodjele F(x)

Iz (7) u Dijelu 1.5 i (1) vidimo da normalna raspodjela ima funkciju raspodjele

1  1  v   2 
x
F x    2     dv
exp (2)
 2   

Ovdje smo trebali x kao gornju granicu integrala te smo u integrandu umjesto x pisali v.

Za odgovarajuću standardiziranu normalnu raspodjelu, srednje vrijednosti  = 0 i standardne devijacije


 = 1, F(x) označavamo sa (z). Odavde iz (2) imamo

z 1 2
1 
 z 
u

2
e

2
du (3)

Ovaj integral ne može se izračunati analitički pomoću neke od metoda iz matematičke analize. Ali to nije
ozbiljan problem jer se njegove vrijednosti mogu dobiti iz Tabele D3 u Dodatku 1 ili pomoću neke
kompjuterske aplikacije. Ove vrijednosti su potrebne za rad sa normalnom raspodjelom. Krivulja (z) je
u obliku slova S i monotono se povećava od 0 do 1 (zašto?) i presijeca vertikalnu osu u 1/2 (zašto?), kako
je prikazano na Slici 1.11.

Slika 1.11 Funkcija raspodjele (z) normalne raspodjele s srednjom vrijednošću 0 i varijansom 1

32
Odnos između F(x) i (z). Iako će vaša kompjuterska aplikacija izravno dati vrijednosti F(x) iz (2) za bilo
koje  i , važno je shvatiti da se i zašto se takvo F(x) može izraziti u smislu tablične standardne (z),
kako slijedi.

TEOREMA 1: Upotreba Tabele D3 u Dodatku 1 za normalnu raspodjelu

Funkcija raspodjele F(x) normalne raspodjele s bilo kojim  i  [vidi (2)] u vezi je se standardiziranom
funkcijom raspodjele (z) iz (3) preko formule

x
F x     (4)
  

DOKAZ: Upoređujući (2) i (3) vidimo da trebamo staviti

v  x
u . Tada v = x daje u 
 

kao novu gornju granicu integracije. Iz v –  =  u dobije se dv =  du. Uvrštavajući sve ove smjene u (2) i
budući da se  pokrati, dobije se

x 

x
1 2
1 
F x 
u

 2


e 2
 du    
  

Vjerovatnoće koje odgovaraju intervalima potrebno su prilično često u Poglavlju 2 o statistici. One se
dobijaju kako slijedi.

TEOREMA 2: Normalne vjerovatnoće za intervale

Vjerovatnoće da normalna slučajna varijabla X srednje vrijednosti  i standardne devijacije  poprimi


bilo koju vrijednost u intervalu a < x  b je

b a 
P a  x  b   F b   F a         (5)
     

DOKAZ: Formula (2) u Dijelu 1.5 daje prvu jednakost u (5) a (4) u ovom Dijelu daje drugu jednakost.

1.8.2 Numeričke vrijednosti

Za praktičan rad s normalnom raspodjelom dobro je znati da će se oko 2/3 svih vrijednosti X smjestiti
između   , oko 95% između   2 i praktički sve između tri-sigma granica   3 ili preciznije,
prema Tabeli D3 u Dodatku 1,

a) P      X       68%

b) P    2  X    2   95,5% (6)

c) P    3  X    3   99,7%

33
Formule (6a) i (6b) prikazane su na Slici 1.12. Također, formule (6) pokazuju da će se, vrijednost koja
odstupa spram  više od , 2 ili 3, pojaviti jednom u približno 3, 20 i 300 pokušaja/opita.

Slika 1.12 Ilustracija formula (6)

U opitima (Poglavlje 2) pitat ćemo, obrnuto, koji su to intervali koji odgovaraju određenim
vjerovatnoćama. U praksi najvažnije su vjerovatnoće od 95%, 99% i 99,9%. Za njih, Tabela D4 u Dodatku
1 daje odgovore   2,   2,6 i   3,3. Tačnije,

a) P    1,96  X    1,96   95%

b) P    2,58  X    2,58   99% (7)

c) P    3,29  X    3,29   99,9%

1.8.3 Upotreba tabela za normalnu raspodjelu D3 i D4 u Dodatku 1

Postoje dvije tabele za normalnu raspodjelu u Dodatku 1, Tabele D3 i D4. Ako želite vjerovatnoću,
upotrijebite Tabelu D3. Ako su date vjerovatnoće i traže se intervali ili x-vrijednosti, upotrijebite Tabelu
D4. Slijedeći primjeri su tipični. Uradite ih pažljivo, provjeravajući sve vrijednosti, a ne samo da ih uradite
putem vaših softvera. Napravite skice gustoće da vidite da li rezultati izgledaju razumno.

PRIMJER 1: Čitanje podataka iz Tabele D3

Ako je X standardizirana normalna varijabla ( = 0 i  = 1 ) onda je

P  X  2, 44   0,9927  99,27%

P  X  1,16   1   1,16   1  0,8770  0,1230  12,3%

P  X  1  1  P  X  1  1  0,8413  0,1587 prema (7) iz Dijela 1.3 

P 1,0  X  1,8    1,8    1,0   0,9641  0,8413  0,1228

PRIMJER 2: Vjerovatnoće za date intervale, Tabele D3

Neka je X normalna varijabla sa  = 0,8 i  2 = 4 (tako da je  = 2). Onda je prema (4) i (5)

 2,44  0,80 
P  X  2, 44   F  2, 44         0,82   0,7939  80%
 2 

34
Ili ako više volite (slično i za druge slučajeve)

 X  0,80 2, 44  0,80 
P  X  2, 44   P     P  Z  0,82   0,7939
 2 2 
 1,0  0,80 
P  X  1  1  P  X  1  1      1  0,5398  0, 4602
 2 
P 1,0  X  1,8     0,5     0,1  0,6915  0,5398  0,1517

PRIMJER 3: Nepoznate vrijednosti c za date vjerovatnoće, Tabela D4

Neka je X normalna varijabla sa  = 5 i  2 = 0,04 (tako da je  = 0,2). Odredi c ili k koji odgovaraju
navedenoj vjerovatnoći

c 5 c 5
P  X  c   95%,     95%,  1,645, c  5,329
 0,2  0,2
P  5  k  X  5  k   90%, 5  k  5,329 (kao u prethodnom slučaju, zašto?)

c 5
P  X  c   1%, pa je P  X  c   99%,  2,326, c  5, 465
0,2

PRIMJER 4: Nedostaci

U proizvodnji čeličnih šipki neka prečnik X bude normalne raspodjele sa srednjom vrijednosti 2 cm i
standardnom devijacijom od 0,008 cm. (a) Koji postotak nedostataka možemo očekivati postavljajući
granicu tolerancije na 2  0,02 cm? (b) Kako postaviti granice tolerancije kako bi se omogućili nedostaci
od 4%?

Rješenje: (a) je 1¼ jer iz (5) i Tabele D3 dobijamo vjerovatnoću za komplementarni događaj

 2,02  2,00   1,98  2,00 


P 1,98  X  2,02        
 0,008   0,008 
   2,5     2,5   0,9938  1  0,9938   0,9876  98,76%

(b) 2  0,0164 jer, za komplementarni događaj, imamo

0,96  P  2  c  X  2  c  ili 0,98  P  X  2  c 

tako da je iz Tabele D4

2c 2 2c 2


0,98    ,  2,054, c  0,0164.
 0,008  0,008

1.8.4 Normalna aproksimacija binomne raspodjele

Funkcija vjerovatnoće binomne raspodjele je (Dio 1.7)

n
f  x     pxq nx (x = 0, 1, , n) (8)
x

35
Ako je n veliko, binomni koeficijenti i stepeni postaju nepodobni. Od vrlo je velike praktične (i teoretske)
važnosti da u ovom slučaju normalna raspodjela daje dobru aproksimaciju binomne raspodjele, prema
sljedećoj teoremi, jednoj od najvažnijih teorema u cijeloj teoriji vjerovatnoće.

TEOREMA 3: Granični teorem De Moivrea i Laplacea

Za veliko n

f x ~ f  x (x = 0, 1, , n) (9)

Ovdje f je dato u (8). Funkcija

1 
1 2
x  np
f  x 
z
e 2
, z (10)
2 npq npq

je gustoća normalne raspodjele sa srednjom vrijednosti  = np i varijansom  2 = npq (srednja vrijednost i


varijansa binomne raspodjele). Simbol  (čitaj asimptotski jednak) znači da se omjer obe strane
približava 1 kako se n približava . Nadalje, za sve ne-negativne brojeve a i b (> a)

b
n a  np  0,5 b  np  0,5
P  a  X  b       p x q n  x ~         sa   i  (11)
x a  x  npq npq

Dokaz ove teoreme može se naći u odgovarajućoj literaturi. Dokaz pokazuje da je broj 0,5 u  i 
korekcija uzrokovana prelaskom sa diskretne na kontinuiranu raspodjelu.

1.9 Raspodjela nekoliko slučajnih varijabli

Raspodjele dviju ili više slučajnih varijabli su od interesa iz dva razloga:

1. One se javljaju u eksperimentima u kojima posmatramo nekoliko slučajnih varijabli, na primjer,


sadržaj ugljika X i tvrdoću Y čelika, količinu gnojiva X i prinos kukuruza Y, težina X1, visina X2 i krvni
pritisak X3 osoba, i tako dalje.

2. One će biti potrebne u matematskim obrazloženjima statističkih metoda u Poglavlju 2.

U ovom dijelu uzet će se u obzir dvije slučajne varijable X i Y ili, kako se također kaže, dvodimenzionalna
slučajna varijabla (X, Y). Za (X, Y) ishod pokusa je par brojeva X = x i Y = y koji se može predstaviti tačkom
u XY-ravnini.

Dvodimenzionalna raspodjela vjerovatnoće slučajne varijable (X, Y) data je funkcijom raspodjele

F  x, y   P  X  x,Y  y  (1)

Ovo je vjerovatnoća da će u pokušaju, X poprimiti bilo koju vrijednost koja nije veća od x i u istom
pokušaju Y će poprimiti bilo koju vrijednost koja nije veća od y. To odgovara zatamnjenom području na
Slici 1.13, koje se pruža do –  prema lijevo i prema dolje. F(x, y) jedinstveno određuje raspodjelu
vjerovatnoće, jer analogno formuli (2) u Dijelu 1.5, gdje je P(a < X  b) = F(b) – F(a), sada za pravougaonik
imamo.

36
P a1  X  b1, a2  Y  b2   F  b1, b2   F a1, b2   F b1, a2   F a1, a2  (2)

Kao i prije, u dvodimenzionalnom slučaju imat ćemo i diskretne i kontinuirane slučajne varijable i
raspodjele.

Slika 1.13 Formula (1)

1.9.1 Diskretne dvodimenzionalne raspodjele

Analogno slučaju jedne slučajne varijable X (Poglavlje 1.5) dvodimenzionalnu varijablu (X, Y) i njenu
raspodjelu možemo smatrati diskretnim ako (X, Y) može poprimiti samo konačno mnogo, ili najviše
prebrojivo beskonačno mnogo parova vrijednosti (x1, y1), (x2, y2),  sa pozitivnim vjerovatnoćama, dok
je vjerovatnoća za bilo koje područje koje ne sadrži ove (X, Y) vrijednosti jednaka nuli.

Neka je (xi, yj) bilo koji od tih parova i neka je njegova vjerovatnoća P(X = xi, Y = yj) = pij (gdje dopuštamo
mogućnost da je pij = 0 za određene parove indeksa i, j). Tada definišemo funkciju vjerovatnoće f(x, y)
od (X, Y) kao

f  x, y   pij ako je x  xi , y  y j i f  x, y   0 u suprotnom (3)

sa neovisnim i = 1, 2,  i j = 1, 2, . Analogno (4), Dio 1.5, za funkciju raspodjele imamo formulu

F  x, y     f x ,y 
xi  x y j  y
i j (4)

Umjesto (6) u Dijelu 1.5 sad imamo

 f  x , y   1
i j
i j (5)

PRIMJER 1: Diskretna dvodimenzionalna raspodjela

Ako istovremeno bacamo kovanicu od jedne KM i od dvije KM i razmotrimo događaje: X = broj glava koji
se pojavi na kovanici od jedne KM, Y = broj glava koji se pojavi na kovanici od dvije KM, tada X i Y mogu
imati vrijednosti 0 ili 1, a funkcija vjerovatnoće je f(0, 0) = f(1, 0) = f(0, 1) = f(1, 1) = 1/4 u suprotnom f(x,
y) = 0.

1.9.2 Kontinuirane dvodimenzionalne raspodjele

Analogno kao kod jedne slučajne varijable X (Dio 1.5) i par varijabli (X, Y) kao i njihovu raspodjelu
nazivamo kontinuiranim ako se odgovarajuća funkcija raspodjele može dati dvostrukim integralom

37
y x

F  x, y     f  x, y  dxdy (6)
 

čiji se integrand f naziva gustoća od (X, Y), koja je svugdje nenegativna i kontinuirana.

Iz (6) dobijamo vjerovatnoću, da (X, Y) poprimi bilo koju vrijednost u pravougaoniku (Slika 1.14), koja je
data formulom

b1 b2

P  a1  X  b1, a2  X  b2     f  x, y  dxdy (7)


a1 a2

Slika 1.14 Dvodimenzionalna raspodjela

PRIMJER 2: Dvodimenzionalna jednolika raspodjela u pravougaoniku

Neka je R pravougaonik dat sa 1 < x  1, 2 < y 2. Gustoća (vidi sliku 1.15a),

f(x, y) = 1/k ako je (x, y) unutar R i f(x, y) = 0 u suprotnom, (8)

definiše takozvanu jednoliku raspodjelu u pravougaoniku R. Ovdje je k = (1 – 1)( 2 – 2) površina od R.
Funkcija raspodjele prikazana je na Slici 1.15b.

Slika 1.15 a) Gustoća i b) Funkcija raspodjele jednolike raspodjele

1.9.3 Marginalne raspodjele diskretne raspodjele

Ovo je prilično prirodna ideja, bez pariteta kod slučaja sa jednom slučajnom varijablom. Interesantna je
samo jedna od dvije varijable (X, Y) na primjer varijabla X čija se raspodjela, nazvana marginalna
raspodjela, traži. Stoga tražimo vjerovatnoću P(X = x, Y proizvoljno). Pošto je (X, Y) diskretne raspodjele,

38
takvo je i X. Njegovu funkciju vjerovatnoće, nazvanu recimo f1(x), dobijamo iz funkcije vjerovatnoće f(x,
y) od (X, Y) sumiranjem po y:

f1  x   P  X  x,Y proizvoljno    f  x, y  (9)


y

gdje sabiremo sve vrijednosti f(x, y) koje nisu 0 za taj x. Iz (9) vidimo da je funkcija raspodjele marginalne
raspodjele od X jednaka

F1  x   P  X  x,Y proizvoljno    f x 
x * x
1

(10)

Slično tome, funkcija vjerovatnoće

f2  y   P  X proizvoljno,Y  y    f  x, y  (11)
x

određuje graničnu raspodjelu Y u (X, Y). Ovdje sabiramo sve vrijednosti koje nisu nula za odgovarajuće y.
Funkcija raspodjele ove marginalne raspodjele jest

F2  y   P  X proizvoljno,Y  y    f y 
y * y
2

(12)

PRIMJER 3: Marginalna raspodjela diskretne dvodimenzionalne slučajne varijable

U izvlačenju 3 karte iz špila uz zamjenu razmotrimo varijablu (X, Y) gdje je X = broj kraljica, Y = broj
kraljeva ili kečeva. Špil ima 52 karte. To uključuje 4 kraljice, 4 kralja i 4 keca. Stoga u jednom pokušaju
kraljica ima vjerovatnoću px = 4/52 = 1/13, a kraljevi ili kečevi py = 8/52 = 2/13. Ovo daje
dvodimenzionalnu binomnu funkciju vjerovatnoće od (X, Y) (sa q = 1 – px – py = 1 – 1/13 – 2/13 = 10/13)
oblika

x y 3 x  y
3!  1   2   10 
f  x, y   ako je (x + y  3) i f(x, y) = 0 u suprotnom
x ! y !  3  x  y  !  13   13   13 

U Tabeli 1.1 nezatamnjeni stupci prikazuju vrijednosti f(x, y), a u krajnjem desnom stupcu i donjem redu
vrijednosti funkcija vjerovatnoće ƒ1(x) i ƒ2(y) marginalne raspodjele od X i Y.

Tabela 1.1 Vrijednosti funkcija vjerovatnoće ƒ(x, y), ƒ1(x), ƒ2(y) u izvlačenju tri karte Primjer 3

y 0 1 2 3 f1(x)
x
0 1000/2197 600/2197 120/2197 8/2197 1728/2197
1 300/2197 120/2197 12/2197 0 432/2197
2 30/2197 6/2197 0 0 36/2197
3 1/2197 0 0 0 1/2197
f2(y) 1331/2197 726/2197 132/2197 8/2197 2197/2197

39
1.9.4 Marginalne raspodjele kontinuirane raspodjele

Konceptualno ovaj slučaj je isti kao i prethodni, s funkcijama vjerovatnoće i sume zamijenjene
gustoćama i integralima. Za kontinuiranu slučajnu varijablu (X, Y) s gustoćom f(x, y) imamo marginalnu
raspodjelu X u (X, Y), definiranu funkcijom raspodjele

x
F1  x   P  X  x,   Y      f  x  dx
 
1 (13)


s gustoćom f1 od X koja se dobije iz f(x, y) integracijom preko y,


f1  x    f  x, y  dy (14)


Promjenom uloga X i Y dobijemo marginalnu raspodjelu Y u (X, Y) sa funkcijom raspodjele

F2  y   P    X  ,Y  y    f  y  dy
 
2 (15)


i gustoće


f2  y    f  x, y  dx (16)


1.9.5 Neovisnost slučajnih varijabli

X i Y u diskretnoj ili kontinuiranoj slučajnoj varijabli se smatraju neovisnim ako

F  x, y   F1  x  F2  y  (17)

vrijedi za sve (x, y). U suprotnom, ove slučajne varijable su ovisne. Na ove definicije sugerišu
odgovarajuće definicije za događaje u Dijelu. 1.3.

Nužan i dovoljan uvjet neovisnosti za sve x i y je

f  x, y   f1  x  f2  y  (18)

Ovdje su f navedene funkcije vjerovatnoće ako je (X, Y) diskretno, ili funkcije gustoće ako je (X, Y)
kontinuirano.

PRIMJER 4: Neovisnost i ovisnost

U bacanju kovanica od jedne KM i dvije KM, X = broj glava na kovanici od jedne KM i Y = broj glava na
kovanici od dvije KM, kovanice mogu poprimiti vrijednosti 0 ili 1 i neovisni su. Slučajne varijable u Tabeli
1.1 su ovisne.

Proširenje neovisnosti na n-dimenzionalne slučajne varijable. Ovo će biti potrebno kroz cijelo Poglavlje
2. Raspodjela ovakve slučajne varijable X = (X1, , Xn) određuje se funkcijom raspodjele oblika

40
F  x1,..., xn   P  X1  x1,..., X n  xn 

Smatra se da su slučajne varijable X1, , Xn neovisne ako

F  x1,..., xn   F1  x1  F2  x2  ...Fn  xn  (19)

za sve (x1, , xn). Ovdje je Fj(xj) funkcija raspodjele marginalne raspodjele Xj po X, to jest

Fj  x j   P  X j  x j , X k proizvoljno, k  1,..., n, k  j 

U suprotnom, za ove slučajne varijable se kaže da su ovisne.

1.9.6 Funkcije slučajnih varijabli

Kada je n = 2 pišemo X1 = X, X2 = Y, x1 = x, x2 = y. Uzimajući nekonstantnu kontinuiranu funkciju g(x, y)


definiranu za sve x, y, dobije se slučajna varijabla Z = g(x, y). Npr., ako bacimo dvije kockice, a X i Y su
brojevi koje kockica poprimi u pokušaju, onda je Z = X + Y zbir tih dvaju brojeva (Slika 1.5b u Dijelu 1.5).

U slučaju diskretne slučajne varijable (X, Y) možemo dobiti funkciju vjerovatnoće f(z) od Z = g(x, y)
sumiranjem svih f(x, y) za koje je g(x, y) jednako razmatranim vrijednostima z, tako da je

f  z   P Z  z     f  x, y  (20)
g  x ,y   z

Tako da je funkcija raspodjele od Z

F  z   P Z  z     f  x, y  (21)
g  x ,y   z

gdje sabiramo sve vrijednosti f(x, y) za koje je g(x, y)  z.

U slučaju kontinuirane slučajne varijable (X, Y) imamo slično

F  z  P Z  z    f  x, y  dxdy (22)
g  x ,y   z

gdje za svako z gustoću f(x, y) od (X, Y) integriramo preko regiona g(x, y)  z u xy-ravni. Granična krivulja
ovog regiona je g(x, y) = z.

1.9.7 Dodavanje srednjih vrijednosti

Broj

 g  x, y  f  x, y   X ,Y  diskretno
x y

E  g  X ,Y       (23)

  g  x, y  f  x, y  dxdy

 X ,Y  kontinuirano

41
zove se matematičko očekivanje ili, ukratko, očekivanje od g(X, Y). Ovdje se pretpostavlja da dvostruki
niz apsolutno konvergira i da integral g(x, y) f(x, y) nad xy-ravninom postoji (da je konačan). Pošto su
sumiranje i integracija linearni procesi, iz (23) se dobije

E  ag  X ,Y   bh  X ,Y    aE  g  X ,Y    bE  h  X ,Y   (24)

Važan poseban slučaj je

E  X  Y   E  X   E Y 

a indukcijom dobijamo sljedeći rezultat.

TEOREMA 1: Sabiranje srednjih vrijednosti

Srednja vrijednost (očekivanje) zbira slučajnih varijabli jednak je zbiru srednjih vrijednosti (očekivanja),
tj.,

E  X1  X2  ...  Xn   E  X1   E  X 2   ...  E  X n  (25)

Nadalje, imamo

TEOREMA 2: Množenje srednjih vrijednosti

Srednja vrijednost (očekivanje) proizvoda nezavisnih slučajnih varijabli jednaka je proizvodu srednjih
vrijednosti (očekivanja), tj.,

E  X1 X2 ...Xn   E  X1  E  X2  ...E  X n  (26)

Dokaz: Ako su X i Y nezavisne slučajne varijable (i obe su diskretne ili su boe kontinuirane), onda je
E(X, Y) = E(X)E(Y). U stvari, u diskretnom slučaju imamo

E  XY    xyf  x, y    xf1  x  yf2  y   E  X  E Y 


x y x y

U slučaju kontinuiranih slučajnih varijabli dokaz odnosa je sličan. Proširenje na n nezavisnih slučajnih
varijabli daje (26), te je Teorema 2 dokazana.

1.9.8 Dodavanje varijansi

Ovo je još jedna za praksu važna i potrebna stvar. Kao i prije, neka je Z = X + Y, a srednju vrijednost i
varijansu od Z označimo sa  i  2. Tada prvo imamo

 
 2  E Z     E  Z 2   E  Z 
2 2

Iz (24) vidimo da je prvi termin na desnoj strani jednak

     
E Z 2  E X 2  2 XY  Y 2  E X 2  2E  XY   E Y 2  

42
Za drugi termin na desnoj strani iz Teoreme 1 dobijamo

E  Z   E  X   E Y   E  X   2E  X  E Y   E Y 


2 2 2 2

Zamjenom tih izraza u formulu za  2 na početku imamo

 
 2  E  X 2   E  X   E Y 2   E Y   2 E  XY   E  X  E Y 
2 2

Može se pokazati da je izraz u vitičastoj zagradi zbir varijansi X i Y, koje označavamo 12 i 22. Termin u
drugom redu (bez faktora 2) je

 XY  E  XY   E  X  E Y  (27)

i zove se kovarijansa od X i Y. Dakle, rezultat je

 2   12   22  2 XY (28)

Ako su X i Y neovisni, onda je

E  XY   E  X  E Y 

Te je XY = 0 i

 2   12   22 (29)

Proširenje na više od dvije varijable daje

TEOREMA 3: Dodavanje varijansi

Varijansa zbira neovisnih slučajnih varijabli jednaka je zbiru varijansi tih varijabli.

OPREZ! U brojnim primjenama Teoreme 1 i 3 moramo uvijek zapamtiti da Teorema 3 stoji samo za
neovisne varijable.

43
44
2. Matematska Statistika

U teoriji vjerovatnoće postavili smo matematske modele procesa na koje utječe "slučajnost". U
matematskoj statistici ili, ukratko, statistici, provjeravamo ove modele spram uočenih stvarnosti. Ovo se
naziva statističkim zaključivanjem, a provodi se uzorkovanjem, tj. izvlačenjem slučajnih uzoraka, kratko
nazvanih uzorcima. To su skupovi vrijednosti iz mnogo većeg skupa vrijednosti koji bi se mogao izučavati
nazvan populacijom. Primjer je prečnici 10 vijaka izvučenih iz velikog broja vijaka. Uzorkovanje se
provodi kako bi se utvrdilo da li je model populacije dovoljno tačan za praktične svrhe. Ako jeste, model
se može koristiti za predviđanja, odluke i radnje. Na primjer, pri planiranju proizvodnje, nabavke
opreme, ulaganju u poslovne projekte i tako dalje.

Najvažnije metode statističkog zaključivanja jesu procjene parametara (Dio 2.2), određivanje intervala
povjerenja (Dio 2.3) i testiranje hipoteza (Dio 2.4, 2.7, 2.8) uz primjenu na kontrolu kvalitete (Dio 2.5) i
uzorkovanje prihvatanja (Dio 25.6).

U zadnjem Poglavlju (2.9) dajemo uvod u regresijsku i korelacijsku analizu koje se odnose na
eksperimente koji uključuju dvije varijable.

45
2.1 Uvod. Slučajno uzorkovanje

Matematska statistika sastoji se od metoda za izradu i procjenu slučajnih eksperimenata radi dobijanja
informacija o praktičnim problemima, kao što su: istraživanje odnosa sadržaja željeza i gustoće željezne
rude, kvalitete sirovine ili gotovih proizvoda, učinkovitosti klimatizacijskih sistema, performanse
određenih automobila, učinak oglašavanja, reakcije potrošača na novi proizvod itd.

Slučajne varijable pojavljuju se u inženjerstvu (i drugdje) češće nego što se misli. Na primjer, svojstva
proizvoda iz masovne proizvodnje (vijci, žarulje i sl.) uvijek pokazuju slučajnu varijaciju zbog malih
(nekontroliranih!) razlika u sirovini ili proizvodnim procesima. Tako je prečnik vijaka slučajna varijabla X i
imamo ispravne vijke sa prečnikom između zadanih granica tolerancije i neispravne vijke sa prečnikom
izvan tih granica. Možemo tražiti raspodjelu X, kako bi se dobio procenat neispravnih vijaka, radi
neophodnog poboljšanja proizvodnog procesa.

Uzorci se odabiraju iz populacija - 20 vijaka iz skupine od 1000, 100 birača iz skupine od 5000, 8 srndaća
u projektu zaštite divljine - jer bi obuhvatanje cjelokupne populacije bilo preskupo, dugotrajno,
nemoguće ili čak besmisleno (razmisli o razornom ispitivanje svjetiljki ili dinamita). Da biste dobili
smislene zaključke, uzorci moraju biti slučajno odabrani. Svaki od 1000 vijaka, barem približno, mora
imati iste šanse izvlačenja uzorka (izvlačenja kada uzorkujemo). Samo tada će srednja vrijednost
x̄ = (x1 +  + x20)/20 (Dio. 1.1) uzorka veličine n = 20 (ili bilo kojeg drugog n) biti dobra aproksimacija
srednje vrijednosti populacije  (sl. 1.6). Tačnost aproksimacije, kao što ćemo vidjeti, općenito će se
poboljšati s povećanjem n. Slično za ostale parametre (standardnu devijaciju, varijansu itd.).

Neovisne vrijednosti uzorka dobit će se u eksperimentima s beskonačnim skupom/prostorom uzorka S


(Dio 1.2), za konstruisanje normalne raspodjele. To vrijedi i za uzorkovanje uz zamjenu, a približno je
tačno u izvlačenju malog broja uzoraka iz velike konačne populacije (na primjer, 5 ili 10 iz 1000
predmeta). Međutim, ako uzimamo uzorke bez zamjene iz male populacije, utjecaj ovisnosti vrijednosti
uzoraka na rezultat može biti značajan.

Nasumični brojevi pomažu u dobijanju uzoraka koji zapravo treba biti slučajno odabran. Ponekad to nije
lako postići jer postoje mnogi suptilni faktori koji mogu pristrano utjecati na uzorkovanje (putem lične
pristranosti kod intervjua, putem loših radnih mašina, putem izbora netipičnih uvjeta posmatranja itd.).
Nasumični brojevi mogu se dobiti iz generatora nasumičnih brojeva u nekoj od kompjuterskih aplikacija
(Maple, Mathematica isl.). (Brojevi nisu stvarno slučajni, kao što se dobije bacanjem kovanica ili kockica,
ali su izračunati na način koji ima praktički sve bitne karakteristike istinske slučajnosti.)

PRIMJER 1: Nasumični brojevi iz generatora nasumičnih brojeva

Za odabir uzorka veličine n = 10 iz 80 datih kugličnih ležajeva obilježimo ih brojevima od 1 do 80. Nakon
toga pustimo da generator nasumično proizvede 10 cijelih brojeva od 1 do 80 i potom u uzorak treba
uključiti ležajeve označene tim brojevima., npr. 44, 55, 53, 03, 52, 61, 67, 78, 39, 54, ili nekim drugim
brojevima koje izbaci generator.

Prikazivanje i obrada podataka u vezi sa raspodjelom frekvencija razmatrani su u Dijelu 1.1. To su


empirijski pariteti raspodjelama vjerovatnoće koji pomažu donošenju aksioma i svojstava u teoriji
vjerovatnoće. Novi aspekt u ovom poglavlju jeste slučajnost: podaci su uzorci odabrani slučajno iz
populacije. Shodno tome, odmah možemo uspostaviti vezu sa Dijelom 1.1, koristeći histograme za
grafički prikaz uzoraka.

46
Tek sada srednju vrijednost x̄ u (5), Dio 1.1, nazivamo srednja vrijednost uzorka

1 n 1
x 
n j 1
x j   x1  x2  ...  xn 
n
(1)

n nazivamo veličinom uzorka, varijansu s2 u (6), Dio 1.1, nazivamo varijansom uzorka,

1 n
  xj  x  
1 
 x1  x   ...  xn  x  
2 2 2
s2  (2)
n  1 j 1 n 1 

i njen pozitivni kvadratni korijen s standardnom devijacijom uzorka. x̄, s2 i s se zovu parametri uzorka i
oni će stalno biti potrebni u ovom Poglavlju.

2.2 Tačka procjene parametara

Na početku ovog dijela, raspravljat ćemo o najosnovnijim praktičnim zadacima u statistici i


odgovarajućim statističkim metodama. Prva od njih je tačka procjene parametara, tj. veličina koje se
javljaju u raspodjelama, kao što je p u binomnoj raspodjeli i  i  u normalnoj raspodjeli.

Tačka procjene parametra je broj koji se izračunava iz određenog uzorka i služi kao aproksimacija
nepoznate tačne vrijednosti parametra populacije. Interval procjene je interval ("interval povjerenja")
dobijen iz uzorka. Takve procjene će se razmatrati u sljedećem dijelu. Procjena parametara ima veliku
praktičnu važnost u mnogim primjenama.

Kao aproksimacija srednje vrijednosti populacije  možemo uzeti srednju vrijednost odgovarajućeg
uzorka x̄. To daje procjenu da je ̂ = x̄ za , to jest

1 n 1
ˆ  x  
n j 1
x j   x1  x2  ...  xn 
n
(1)

gdje je n veličina uzorka. Slično tome, procjena varijanse ̂ 2 populacije je varijansa s2 odgovarajućeg
uzorka, tj.

1 n
  xj  x  
1 
 x1  x   ...  xn  x  
2
ˆ 2  s 2 
2 2
(2)
n  1 j 1 n 1 

Jasno je da su (1) i (2) procjene parametara za raspodjele u kojima se  ili  pojavljuju eksplicitno kao
parametri npr., normalne i Poissonove raspodjele. Za binomnu raspodjelu p = /n, (vidi (3) u Dijelu 1.7).
Iz (1) stoga dobijamo procjenu za p

x
pˆ  (3)
n

Spomenimo da je (1) poseban slučaj takozvane metode momenata. U ovoj metodi se parametri koji se
procjenjuju izražavaju u smislu momenata raspodjele (vidi poglavlje 1.6). U dobijenim formulama, ti
momenti raspodjele zamjenjuju se odgovarajućim momentima uzorka i tako se dobiju procjene. Ovdje je
k-ti moment uzorka x1, , xn

47
1 n k
mk   xj
n j 1

2.2.1 Metoda maksimalne vjerovatnoće

Druga metoda za dobijanje procjena je takozvana Fisherova metoda maksimalne vjerovatnoće. Da


bismo to objasnili, razmotrimo diskretnu (ili kontinuiranu) slučajnu varijablu X čija funkcija vjerovatnoće
(ili gustoća) f(x) ovisi o jednom parametru . Uzimamo odgovarajući uzorak od n neovisnih vrijednosti.
Onda je, u diskretnom slučaju, vjerovatnoća da se uzorak veličine n sastoji upravo od tih n vrijednosti

l  f  x1  f  x2  ... f  xn  (4)

U slučaju kontinuirane varijable vjerovatnoća da se uzorak sastoji od vrijednosti u malom intervalu


xj  x  xj + x (j = 1, 2, , n) je

f  x1  xf  x2  x ... f  xn  x  l  x 
n
(5)

Budući da f(xj) ovisi o , funkcija l u (5) izražena preko (4) ovisi o x1, , xn i . Zamislimo da su date
vrijednosti x1, , xn fiksne. Onda je l funkcija od  koja se zove funkcija vjerovatnoće. Osnovna ideja
metode maksimalne vjerovatnoće je vrlo jednostavna. Odaberemo da je aproksimacija nepoznate
vrijednosti , ona za koju je l najveći. Ako je l diferencijabilna funkcija po , neophodan uvjeta da l ima
maksimum u intervalu (ne na granici) je

l
0 (6)


(Pišemo parcijalni izvod, jer l ovisi i o x1, , xn). Rješenje (6) ovisno o x1, , xn zove se maksimalna
procjena vjerovatnoće. (6) možemo zamijeniti sa

 ln l
0 (7)


jer je f(xj) > 0, jer je maksimum od l općenito pozitivan, i lnl je monotono rastuća funkcija od l. Ovo često
pojednostavljuje proračune.

Više parametara. Ako raspodjela X uključuje r parametara 1, , r, onda umjesto (6) imamo r uvjeta
l/1 = 0, , l/r = 0, i umjesto (7) imamo

 ln l  ln l
 0, ..., 0 (8)
1  r

PRIMJER 1: Normalna raspodjela

Pronađite maksimalna procjenu vjerovatnoće za 1 =  i 2 =  u slučaju normalne raspodjele.

Rješenje: Iz (1), Dio 1.8, i (4) dobijamo funkcije vjerovatnoće

48
n n
 1   1  h
x  
n
1 2
l     e gdje je h
 2     2 2 j
j 1

Uzimajući logaritam, imamo

ln l  n ln 2  n ln   h
Prva jednačina u (8) je (ln l)/ = 0, tj.,

 ln l h
xj    0
n n
1

  2
  j 1
odavde x
j 1
j  n  0

Rješenje je željena procjena ̂ = x̄ za 

1 n
ˆ   xj  x
n j 1

Druga jednačina u (8) je (ln l)/ = 0, tj.,

 ln l n h
x    0
n
1 1 2
    3
     j
j 1

Zamjenom  sa ̂ = x̄ i rješavanjem po  2 dobije se procjena

1 n
  xj  x   0
2
ˆ 2 
n j 1

Ove procjene ćemo koristiti u Dijelu 2.7. Treba primijetiti da se ovo razlikuje od (2). Ne možemo
raspravljati o kriterijima dobre procjene, ali želimo spomenuti da je za malo n, formula (2) poželjnija.

2.3 Interval povjerenja

Intervali povjerenja nepoznatog parametra  (npr.  = ) neke raspodjele su intervali 1    2 koji sa


sigurnošću ne sadrže  nego sa velikom vjerovatnoćom  koju možemo odabrati (a najpopularnije su
95% i 99%). Taj interval izračunava se iz uzorka.  = 95% znači vjerovatnoću od 1 –  = 5% = 1/20 da je 
pogrešno. Umjesto pisanja 1    2 ovo označavamo jasnije pisanjem

CONF 1    2  (1)

Takav poseban simbol, CONF, čini se vrijednim kako bi se izbjegao nesporazum da se  mora nalaziti
između 1 i 2.

 se naziva nivo povjerenja, a 1 i 2 se nazivaju donjom i gornjom granicom povjerenja. Oni ovise o .
Što je odabrana veća vrijednost za , manja je vjerovatnoća greške 1 – , ali je duži interval povjerenja.
Ako   1, onda njegova dužina ide u beskonačnost. Izbor  ovisi o vrsti primjene. Npr. nije tragično ako
postoji 5% šansi da ćemo pokisnuti ako izađemo bez kišobrana. Međutim, u medicinskoj odluci gdje se
radi o životu ili smrti, 5% šansi da je odluka pogrešna može biti preveliko i šansa od 1% bivanja u krivu
( = 99%) može biti poželjnija.

49
Intervali povjerenja su vredniji od tačaka procjene (Dio 2.2), jer, možemo uzeti sredinu od (1) kao
aproksimaciju  i polovicu dužine (1) kao "granicu greške" (ne u strogom smislu granice greške, nego kao
grešku čiju vjerovatnoću znamo).

1 i 2 u (1) se izračunavaju iz uzorka x1, , xn. Ovo su n opažanja/uočavanja slučajne varijable X. Sada
dolazi uobičajeni trik. x1, , xn smatramo jednim opažanjima n slučajnih varijabli X1, , Xn (sa istom
raspodjelom, naime, onom od X). Tada su 1 = 1(x1, , xn) i 2 = 2(x2, , xn) u (1) uočene vrijednosti
dviju slučajnih varijabli 1 = 1(X1, , Xn) i 2 = 2(X1, , Xn). Uvjet (1) koji uključuje  sada se može
napisati kao

P  1    2    (2)

Pogledajmo što sve to znači u konkretnim praktičnim slučajevima.

U svakom slučaju u ovom dijelu prvo ćemo navesti korake dobijanja intervala povjerenja u obliku tabela,
a zatim razmotriti tipičan primjer, te konačno teoretski opravdati te korake.

2.3.1 Interval povjerenja za  normalne raspodjele sa poznatim  2

Tablica 2.1 Određivanje intervala povjerenje za srednju vrijednost  normalne raspodjele sa poznatom
varijansom  2

Korak 1. Odaberite nivo povjerenja  (95%, 99% ili slično).

Korak 2. Odredite odgovarajući c (podaci za c izvađeni su iz Tabele D4 Dodatak 1):

 0,900 0,950 0,990 0,999


c 1,645 1,960 2,576 3,291

iz tabele t-raspodjele sa n – 1 stepeni slobode (Tabela D5 u Dodatku 5, ili koristiti kompjutersku


aplikaciju; n = veličina uzorka).

Korak 3. Sračunaj srednju vrijednost x̄ uzorka x1, , xn.

Korak 4. Izračunaj k = c/n. Interval povjerenja za  je

CONF x  k    x  k (3)

PRIMJER 1: Intervala povjerenje za srednju vrijednosti  normalne raspodjele poznate varijanse  2

Odredite 95% interval povjerenja za srednje vrijednosti normalne raspodjele varijanse  2 = 9 pomoću
uzorka od n = 100 vrijednosti čija je srednja vrijednost x̄ = 5.

Rješenje:

Korak 1. Zahtijevano  = 0,95;

Korak 2. Odgovarajuće c = 1,960 (vidi tabelu 2.1.);

Korak 3. Dato je x̄ = 5;

50
Korak 4. Sračunati k = 1,960 ∙ 3/100 = 0,588 slijedi da je x̄ – k = 4,412 i x̄ + k = 5,588, a interval povjerenja je

CONF0,95 4,412    5,588.

Ovo se ponekad zapisuje kao   0,588, ali ovaj način može biti varljiv te ga nećemo koristiti. Upotrebom
kompjuterske aplikacije izravno možete odrediti ovaj interval. Slično je i sa ostalim primjerima u ovom
Dijelu.

Teorija iza Tabele 2.1. Metoda u Tabeli 2.1 zasniva se na

TEOREMA 1: Suma neovisnih normalnih slučajnih varijabli

Neka su X1, , Xn neovisne normalne slučajne varijable od kojih svaka ima srednju vrijednost  i
varijansu  2. Iz ovoga slijedi.

(a) Suma X1 +  + Xn je normalna varijabla sa srednjom vrijednosti n i varijansom n 2.

(b) Sljedeća slučajna varijabla X̅ je normalna s srednjom vrijednosti  i varijansom  2/n.

1
X  X1  ...  X n  (4)
n

(c) Sljedeća slučajna varijabla Z je normalna sa srednjom vrijednosti 0 i varijansom 1.

X 
Z (5)
 n

DOKAZ: Tvrdnje o srednjoj vrijednosti i varijansi u (a) slijede iz Teorema 1 i 3 u Dijelu 1.9. Odavde i
Teoreme 2 u Dijelu 2.6, X̅ ima srednju vrijednost (1/n)n =  i varijansu (1/n)2n 2 =  2/n. To znači da Z
ima srednju vrijednost 0 i varijansu 1, prema Teoremi 2(b) u Dijelu 2.6 Normalnost X1, , Xn se može
dokazati (vidi odgovarajuću literaturu). Ovo podrazumijeva normalnost (4) i (5).

Izvođenje (3) u Tabeli 2.1. Uzorkovanje iz normalne raspodjele daje neovisne vrijednosti uzorka (vidi Dio
25.1), tako da važi Teorema 1. Stoga možemo izabrati  i odrediti c takve da je

 X  
P  c  Z  c   P  c   c     c     c    (6)
  n 

Za vrijednost  = 0,95 dobijemo z(D) = 1,960 iz Tabele D4 Dodatak 1, što je korišteno u Primjeru 1. Za
 = 0,9, 0,99, 0,999 dobijemo ostale vrijednosti c navedene u Tabeli 2.1. Konačno, sve što moramo učiniti
jest izraziti nejednakost u (6) preko  i uvrstiti uočene vrijednosti dobijene iz uzorka. Množimo –c  Z  c
sa –1 a potom sa /n i uz smjenu da je k = c/n (kao u Tabli 2.1),

 X 
P  c  Z  c   P  c  Z  c   P  c 
 n

 c   P k    X  k   
 

Prebacivanjem X̅ dobije se P(X̅ + k    X̅ – k) ili


P X k    X k   (7)

51
Uvrštavanjem uočene vrijednosti x̄ od X̅ dobije se (3). Ovdje x1, , xn smatramo pojedinačnim
opažanjima od X1, , Xn (standardni trik!), tako da je x1 +  + xn uočena vrijednost od X1 +  + Xn i x̄
uočena vrijednost od X̅ . Zapazi da je nadalje (7) oblika (2) sa 1 = X̅ – k i 2 = X̅ + k.

PRIMJER 2: Veličina uzorka potrebna za interval povjerenja odgovarajuće dužine

Koliko veliko n mora biti u Primjeru 1 ako želimo dobiti 95% interval povjerenja dužine L = 0,4?

Rješenje: Interval (3) ima dužinu L = 2k = 2c/n. Rješavanjem po n, dobijemo

n   2c L 
2

Slika 2.1 a) Dužina intervala povjerenja u funkciji veličine uzorka n za  = 95% i  = 99% prema (3) iz
Tabele 2.1 kad je  2 poznato i b) odnos dužina povjerenja prema (10) i (3) za isto  i za s = 

U ovom slučaju odgovor je n = (2 ∙ 1, 960 ∙ 3/0,4)2  870. Slika 2.1a prikazuje kako se L smanjuje
povećanjem n i da je za  = 99% interval povjerenja znatno duži nego kad je  = 95% (veličina uzorka n je
ista).

2.3.2 Interval povjerenja za  normalne raspodjele sa nepoznatim  2

U praksi je  2 često nepoznato. Zato metoda u Tabeli 2.1 ne pomaže i cijela se teorija mijenja, iako
koraci određivanja intervala povjerenja za  ostaju vrlo slični. Odgovarajući koraci prikazani su u Tabeli
2.2. Vidimo da se k razlikuje od onog u Tabeli 2.1, naime standardna devijacija uzorka s zauzima mjesto
nepoznate standardne devijacije populacije . c sada ovisi o veličini uzorka n i mora se odrediti iz Tabele
D5 u Dodatku 1 ili pomoću kompjuterske aplikacije. Tabela D5 daje vrijednosti z za određene vrijednosti
funkcije raspodjele (Slika 2.2a) t-raspodjele,

 m 1

x
 u2  2
F  z   Km  1   du (8)
 
m

Ovdje je m = (1, 2, ) parametar, nazvan broj stepeni slobode raspodjele (skraćeno s.s.). U ovom
slučaju m = n – 1, vidi Tabelu 2.2. Konstanta Km je takva da je F() =1. Integracijom se dobije

52
1 1
 m  
Km  
2 2
1 
m   m 
2 
gdje je  gama funkcija (vidi odgovarajuću literaturu).

Tabela 2.2 Određivanje intervala povjerenje za srednju vrijednost  normalne raspodjele sa nepoznatom
varijansom  2

Korak 1. Odaberite nivo povjerenja  (95%, 99% ili slično).

Korak 2. Odredite c preko jednačine

1
F c   1    (9)
2

iz tabele t-raspodjele sa n – 1 stepeni slobode (Tabela D5 u Dodatku 1, ili koristiti kompjutersku


aplikaciju; n = veličina uzorka).

Korak 3. Izračunajte srednju vrijednost x̄ i varijansu s2 uzorka x1, , xn.

Korak 4. Izračunaj k = cs/n. Interval povjerenja za  je

CONF x  k    x  k (10)

Slika 2.2b upoređuje krivulju gustoće t-raspodjele s onom normalne raspodjele. Kasnija je strmija. Ovo
ilustrira da Tabela 2.1 (koja koristi više informacija tj., poznatu vrijednost  2) daje kraće intervale
povjerenja od Tabele 2.2, što se vidi na Slici 2.1b, koja također daje predodžbu o prednosti veće veličine
uzorka.

Slika 2.2 a) Funkcije raspodjele t-raspodjele sa 1. i 3. stepeni slobode i standardizirane normalne


raspodjele (najstrmija krivulja); b) Gustoće t-raspodjela sa 1. i 3. stepeni slobode i standardizirane
normalne raspodjele

53
PRIMJER 3: Intervala povjerenje srednje vrijednosti  normalne raspodjele nepoznate varijanse  2

Pet neovisnih ispitivanja pritisne čvrstoće betonskih cilindara 15x30 cm, izvađenih iz tijela brane
Jablanica, dala su vrijednosti čvrstoća 66, 64, 63, 61, 62 (zaokružene vrijednosti u MPa). Pretpostavimo
normalnost raspodjele, odredite 99% interval povjerenja za srednju vrijednost.

Rješenje:

Korak 1.  = 0,99;

Korak 2. F(c) = 1/2(1 + ) = 0,995; Iz Tabele D5 u Dodatku 1 sa n – 1 = 4 s.s. dobije se c = 4,60;

Korak 3. x̄ = 63,2 i s2 = 2,96;

Korak 4. Sračunati k = 4,6 ∙ 2,96/5 = 3,54 slijedi da je x̄ – k = 59,66 i x̄ + k = 66,74, a interval povjerenja
je CONF0,99 59,66    66,74.

Ako je varijansa  2 poznata i jednaka varijansi uzorka s2 tj.,  2 = s2 = 2,96, tada će se iz Tabele 2.1 dobiti
k = c/n = 2,5762,96/5 = 1,98 i CONF0,99 61,22    65,18. Vidimo da interval dobijen iz Tabele 2.2
gotovo dvostruko duži od onog dobijenog iz Tabele 2.1 (sa  2 = 2,96). Dakle za manji broj uzoraka razlika
je znatna! Vidi Sliku 2.1b.

Teorija iza Tabele 2.2.

TEOREMA 2: Studentska t-raspodjela

Neka su X1, , Xn neovisne normalne slučajne varijable od kojih svaka ima istu srednju vrijednost  i istu
varijansu  2. Onda slučajna varijabla

X 
T  (11)
S n

Ima t-raspodjelu (vidi (8)) sa n – 1 stepeni slobode (s.s.); ovdje je X̅ dato sa (4) i

1 n

 Xj  X 
2
S2  (12)
n  1 j 1

Izvođenje (10) u Tabeli 2.2. Ovo je slično izvođenju (3). Odaberemo broj  između 0 i 1 i odredimo broj c
iz tablice D5 u Dodatku 1 sa n – 1 s.s. tako da je

P  c  T  c   F c   F  c    (13)

Budući da je t-raspodjela simetrična, imamo

F  c   1  F c 

i (13) poprima formu (9). Zamjenjujući (11) u (13) i uz transformaciju rezultat kao prije, dobijamo


P X K    X K   (14)

54
gdje je

K  cS n

Uvrštavanjem uočene vrijednosti x̄ od X̅ i s2 od S2 u (14) dobijemo (10).

2.3.3 Interval povjerenja za varijansu  2 normalne raspodjele

Tabela 2.3 prikazuje korake koji su slični onima u Tabelama 2.1 i 2.2.

Tabela 2.3 Određivanje intervala povjerenje za varijansu  2 normalne raspodjele čiju srednju vrijednost
 ne treba poznavati

Korak 1. Odaberi nivo povjerenja  (95%, 99% ili slično).

Korak 2. Odredi c1 i c2 preko jednačine

1 1
F  c1   1    i F  c2   1    (15)
2 2

iz tabele chi-kvadrat raspodjele sa n – 1 stepeni slobode (Tabela D6 u Dodatku 1, ili koristiti


kompjutersku aplikaciju; n = veličina uzorka).

Korak 3. Izračunaj (n – 1)s2 gdje je s2 varijansa uzorka x1, , xn.

Korak 4. Izračunaj k1 = (n – 1)s2/c1 i k2 = (n – 1)s2/c2. Interval povjerenja je


CONF k2   2  k1  (16)

PRIMJER 4: Intervala povjerenje za varijansu Normalne raspodjele

Odredite 95% interval povjerenja za varijansu, koristeći Tabelu 25.3 i uzorak (zatezna čvrstoća čeličnog
lima u MPa zaokruženu na cijele vrijednosti): 89, 84, 87, 81, 89, 86, 91, 90, 78, 89, 87, 99, 83, 89.

Rješenje:

Korak 1. Odabrani nivo povjerenja  = 0,95;

Korak 2. Za n = 14 i n – 1 = 13 i F(c1) = 0,025 i F(c2) = 0,975 iz Tabele D6 dobijemo: c1 = 5,01 i c2 = 24,74;

Korak 3. 13s2 = 326,9;

Korak 4. Sračunati k1 = 13s2/c1 = 65,25 i k2 = 13s2/c2 = 13,21, a interval povjerenja za varijansu je:

CONF0,95 13,21   2  65,25.

Ovo je prilično velika dužina, a za postizanje boljeg rezultata potreban je mnogo veći uzorak.

Teorija za Tabelu 2.3. U Tabeli 2.1 korištena je normalna raspodjela, u Tabeli 2.2 t-raspodjela, a sada
ćemo koristiti 2-raspodjelu (chi-kvadrat raspodjelu), čija je funkcija raspodjele F(z) = 0 ako je z < 0 i

55
z u  m  2

F  z   Cm  e 2
u 2
du ako je z  0 (Slika 2.3)
0

Parametar m ( = 1, 2, ) se naziva broj stepeni slobode (s.s.) i

1
Cm 
m
m
2  
2

2

Imajte na umu da raspodjela nije simetrična (vidi Sliku 2.3b).

Slika 2.3 a) Funkcije raspodjele b) Gustoća chi-kvadrat raspodjele za 2, 3, 5 s.s.

Za izvođenje (16) u Tabeli 2.3 potrebna nam je sljedeća teorema.

TEOREMA 3: chi-kvadrat raspodjela

Pod pretpostavkama u Teoremi 2 slučajna varijabla

S2
Y   n  1 (17)
2

sa S2 iz (12), ima chi-kvadrat raspodjelu sa n – 1 stepeni slobode

Dokaz se može naći u odgovarajućoj literaturi.

Izvođenje (16). Ovo je slično izvođenju (3) i (10). Odaberemo broj  između 0 i 1 između 0 i 1 i odredimo
c1 i c2 iz Tabele D6, Dodatak 1, tako da [vidi (15)]

1 1
P Y  c1   F  c1   1    , P Y  c2   F  c2   1   
2 2

Oduzimanjem imamo

P c1  Y  c2   P Y  c2   P Y  c1   F c2   F c1   

56
Transformacijom c1  Y  c2 sa Y iz (17) u nejednačinu po  2 dobijemo

n 1 2 n 1 2
S 2  S
c2 c1

Uvrštavanjem uočene vrijednosti s2 od S2 dobijamo (16).

2.3.4 Interval povjerenja za parametre drugih raspodjela

Postupci u Tabelama 2.1 do 2.3 za intervale povjerenja za  i  2 namijenjeni su normalnoj raspodjeli.


Sada ćemo pokazati da se one mogu primijeniti i na druge raspodjele ako koristimo velike uzorke.

Znamo da ako su X1, , Xn neovisne slučajne varijable sa istom srednjom vrijednosti  i jednakom
varijansom  2, njihova suma Yn = X1 +  + Xn ima sljedeća svojstva:

(A) Yn ima srednju vrijednost n i varijansu n 2 (po Teoremama 1 i 3 u Dijelu 1.9).

(B) Ako su te varijable normalne, tada je Yn normalno (po Teoremi 1).

Ako slučajne varijable nisu normalne, tada (B) nije primjenjivo. Međutim, kad je n veliko slučajna
varijabla Yn još uvijek je približno normalna. Ovo proizlazi iz centralnog graničnog teorema, koji je jedan
od najvažnijih rezultata u teoriji vjerovatnoće.

TEOREMA 4: Centralna granična teorema

Neka su X1, , Xn neovisne normalne slučajne varijable koje imaju iste funkcije raspodjele i stoga istu
srednju vrijednost  i istu varijansu  2. Neka je Yn = X1 +  + Xn. Onda je slučajna varijabla

Yn  n 
Zn  (18)
 n

asimptotski normalna sa srednjom vrijednosti 0 i varijansom 1; odnosno, funkcija raspodjele Fn(x) od Zn


zadovoljstva

x u2
1 
lim Fn  x     x   e 2
du
n 
2 

Dokaz za ovo se možete naći u odgovarajućoj literaturi.

Stoga, pri primjeni Tablica 2.1 do 2.3 na nenormalnu raspodjelu, moramo koristiti dovoljno velike
uzorke. Za brzu procjenu, ako uzorak ukazuje da je asimetričnost raspodjele mala, treba koristiti barem
n = 20 za srednju vrijednost i najmanje n = 50 za varijansu.

2.4 Testiranje hipoteza. Odluke

Ideje intervala povjerenja i testova su dvije najvažnije ideje u suvremenoj statistici. U statističkom testu
o populaciji zaključujemo iz uzorka kroz testiranje hipoteza, koje proistječu iz iskustva ili opažanja, iz
teorije ili zahtjeva kvalitete, itd.. U mnogim slučajevima rezultat testa se koristi kao osnova za odluke, na

57
primjer, kupiti (ili ne kupiti) određeni model automobila ovisno o testu učinkovitosti goriva
(litara/kilometar ili naravno neki drugih testovi), primijeniti neki lijek ovisno o testu njegovog učinka;
nastaviti s marketinškom strategijom ovisno o testu reakcija potrošača itd.

Objasnimo takav test u smislu tipičnog primjera i uvedimo odgovarajuće standardne pojmove
statističkog testiranja.

PRIMJER 1: Testiranje hipoteze. Alternativa. Nivo značaja 

Želimo kupiti 100 armaturnih šipki 18 mm, pod uvjetom da možemo potvrditi tvrdnju proizvođača da
šipke imaju granicu kidanja  = 0 = 200 kN (ili više). Ovo je hipoteza koju treba testirati (također se zove
nulta-hipoteza)  = 0 = 200 kN. Nećemo kupiti šipke ako (statistički) test pokaže  = 1 < 0 da su šipke
zapravo slabije čvrstoće, tj. da je tvrdnja proizvođača netačna. 1 se naziva alternativa (ili alternativna
hipoteza) testa. Prihvaćamo hipotezu ako test nagovještava da je ona istinita, osim za malu
vjerovatnoću greške  koja se naziva nivo značaja testa. Inače odbacujemo hipotezu. Stoga je 
vjerovatnoća odbacivanja hipoteze čak i ako je istinita. Vrijednosti  se biraju, a popularne su 5% i 1%.

Za test trebamo uzorak. Nasumično odabiremo 25 šipki od svake odrežemo komad i eksperimentalno
odredimo granicu kidanja. Pretpostavimo da uzorak od n = 25 vrijednosti granice kidanja, ima srednju
vrijednost x̄ = 197 kN (nešto manje od zahtjeva!) i standardnu devijaciju s = 6 kN.

U ovom trenutku možemo samo nagađati da li je ta razlika 197 – 200 = –3 zbog slučajnosti, ili je
značajna, zapravo zbog lošijeg kvaliteta šipki. Da svoju odluku ne bismo zasnivali na špekulaciji, potrebna
nam je teorija vjerovatnoće, kako slijedi.

Pretpostavljamo da je granica kidanja normalno raspodijeljena. (Ta se pretpostavka može ispitati


metodom u Poglavlju 2.7 ili se možemo sjetiti centralne granične Teoreme (Dio 2.3) i uzeti još veći
uzorak.) Zatim

X  0
T
S n

varijabla u (11), Dio 2.3 sa  = 0 ima t-raspodjelu sa n – 1 stepeni slobode (n – 1 = 24 za naš uzorak).
Također, x̄ = 197 i s = 6 kN su uočene vrijednosti od X̅ i S koje ćemo iskoristiti kasnije. Sada možemo
odabrati nivo značaja, recimo,  = 5%. Iz Tabele D5 u Dodatku 1, ili kompjuterske aplikacije možemo
dobiti kritično c tako da je P(T  c) =  = 5%. Za P(T  c̃) = 1 –  = 95%. Tabele D5 daje c = – c̃ = –1,71
zbog simetrije raspodjele, Slika 2.4.

Sada razmišljamo na sljedeći način i ovo je ključna ideja testa. Ako je hipoteza istinita, imamo samo
 (= 5%) šansi da iz opita opažanjem dobijemo vrijednost t od T (izračunato iz uzorka) koja će pasti
između – i –1,71. Stoga, ako ipak opazimo takav t, tvrdimo da hipoteza ne može biti istinita i odbijemo
je. Tada prihvaćamo alternativu. Međutim, ako je t  c prihvatamo hipotezu.

Jednostavan proračun konačno daje t = (197 – 200)/(625) = –2,5 kao uočenu vrijednost od T. Pošto je
–2,5 < –1,71 odbacujemo hipotezu (tvrdnju proizvođača) i prihvatamo alternativu  = 1 < 200 jer čini se
da su šipke slabijeg kvaliteta od tvrdnje.

58
Slika 2.4 t-raspodjela u Primjeru 1

Ovaj primjer prikazuje korake testiranja:

1. Formulirajte hipotezu  = 0 koju treba testirati. (0 = 0 u primjeru)

2. Formulirajte alternativu  = 1. (1 = 1 u primjeru.)

3. Odaberite nivo značaja  (5%, 1%, 0,1%)

4. Upotrijebite slučajnu varijablu  ̂ = g(X1, , Xn) čija raspodjela ovisi o hipotezi i alternativi, a ta
raspodjela je poznata u oba slučaja. Odredite kritičnu vrijednost c iz raspodjele 
̂ uz pretpostavku da je
̂ = T, a c je dobijeno iz P(T  c) = ).
hipoteza istina. (U primjeru 

5. Koristite uzorak x1, , xn za utvrđivanje uočene vrijednosti ̂ = g(x1, , xn) od 


̂ (t u primjeru).

6. Prihvatiti ili odbaciti hipotezu, ovisno o veličini ̂ spram c. (t < c u primjeru, odbacivanje hipoteze.)

Dvije važne činjenice zahtijevaju daljnju raspravu i pažnju. Prva je izbor alternative. U primjeru 1 < 0,
ali druge primjene mogu zahtijevati 1 > 0 ili 1  0. Druga činjenica ima veze s greškama. Znamo da je
 (nivo značaja testa) vjerovatnoća odbacivanja istinite hipoteze. Međutim, raspravljat ćemo i o
vjerovatnoći  prihvatanja neistinite hipoteze.

2.4.1 Jednostrane i dvostrane alternative (Slika 2.5)

Neka je  nepoznati parametar u raspodjeli, i pretpostavimo da želimo testirati hipotezu  = 0. Tada
postoje tri glavne vrste alternativa, naime,

  0 (1)

  0 (2)

  0 (3)

(1) i (2) su jednostrane alternative, a (3) je dvostrana alternativa.

59
Slika 2.5 Test u slučaju alternative (1) (slika na vrhu), alternative (2) (srednji dio) i alternative (3)

Područje odbacivanja (ili kritično područje). Ako ovo područje sadrži uočenu vrijednost u testu,
hipotezu odbacujemo. U ① kritično c, kao i alternativa, leže s desne strane 0. Znači područje
odbacivanja proteže se desno. Ovo se naziva desnostranim testom. U ② kritično c leži lijevo od 0 (kao
u Primjeru 1), područje odbacivanja proteže se lijevo i imamo lijevostrani test (Slika 2.5, srednji dio).
Ovo su jednostrani testovi. U ③ imamo dva područja odbacivanja, te je ovo dvostrani test (Slika 2.5,
donji dio).

Sve tri vrste alternative pojavljuju se u praktičnim problemima. Na primjer, (1) se može desiti ako je 0
najveća podnošljiva netačnost voltmetra ili nekog drugog mjernog instrumenta. Alternativa (2) se može
desiti u ispitivanju čvrstoće materijala, kao u Primjeru 1. Konačno, 0 u (3) može biti prečnik rude, a
previše tanke ili previše debele rude su jednako nepoželjne, tako da moramo pazite na odstupanja u oba
smjera.

2.4.2 Greške u testovima

Testovi uvijek uključuju rizik od pogrešnih odluka:

(I) Odbacivanje prave hipoteze (greška tipa I).

 = Vjerovatnoća donošenja greške tipa I.

(II) Prihvatanje neistinite hipoteze (greška tipa II).

 = Vjerovatnoća donošenja greške tipa II.

Jasno je da se ove greške ne mogu izbjeći, jer se iz uzoraka ne mogu izvesti apsolutno sigurni zaključci o
populaciji. Međutim, pokazat ćemo da postoje putevi i načini odabira odgovarajućih nivoa rizika, tj.
vrijednosti  i . Izbor ovisi o prirodi problema (npr. mali rizik  = 1% se koristi ako je riječ o životu ili
smrti).

60
Razmotrimo ovo sistematično za test hipoteze  = 0 spram alternative koja je, radi jednostavnosti,
jedan broj 1. Neka je 1 > 0 tako da imamo desnostrani test. Za lijevostrani ili dvostrani test rasprava je
vrlo slična.

Izabrali smo kritično c > 0 (kao u gornje dijelu Slike 2.5), metodama koje su opisane u nastavku. Iz datog
uzorka x1, , xn sračunamo vrijednost

ˆ  g  x1,..., xn 

s odgovarajućim g (čiji će izbor biti glavna tačka naše daljnje rasprave, npr. uzmimo g = (x1 +  + xn)/n u
slučaju kada je  srednja vrijednost). Ako je ̂ > c odbacujemo hipotezu. Ako je ̂  c prihvatamo je.
Ovdje se vrijednost ̂ može smatrati uočenom vrijednošću slučajne varijable

ˆ  g  X1,..., X n 
 (4)

jer se xj može smatrati uočenom vrijednošću od Xj, j = 1, , n. U ovom testu postoje dvije mogućnosti
greške, kako slijedi:

Greška tipa I (vidi Tabelu 2.4). Hipoteza je istina, ali je odbačena (stoga je alternativa prihvaćena) jer
̂ poprima vrijednost ̂ > c. Očito, vjerovatnoća činjenja takve greške jednaka je


ˆ c
P    0
 (5)

 se zove nivo značaja testa, kao što je prije spomenuto.

̂ poprima vrijednost ̂  c.
Greška tipa II (vidi Tabelu 2.4). Hipoteza je pogrešna, ali je prihvaćena jer 
Vjerovatnoća činjenja takve greške označena je sa  te je


ˆ c
P   1
 (6)

 = 1 –  naziva se snagom testa. Očito, snaga  je vjerovatnoća izbjegavanja greške tipa II.

Tabela 2.4 Greške tipa I i tipa II u testiranju hipoteze  = 0 spram alternative = 1

Nepoznata istina
 = 0  = 1
ispravna odluka greška tipa II
prihvaćeno

 = 0 P=1– P=
greška tipa I ispravna odluka
 = 1 P= P=1–

Formule (5) i (6) pokazuju da oboje  i  ovise o c, a želimo odabrati c takvo da su vjerovatnoće grešaka
što je moguće manje. Međutim, važna Slika 2.6 pokazuje da su to suprotstavljeni zahtjevi jer
smanjenjem  moramo c pomaknuti desno, što onda povećava . U praksi najprije odaberemo  (5%
ponekad 1%), a zatim odredimo c, i konačno izračunavamo . Ako je  veliko tako da je snaga  = 1 – 
mala, trebali bismo ponoviti test, odabirati veći uzorak, iz razloga koji će se uskoro pojaviti.

61
Ako alternativa nije jedan broj, već je u obliku (1) do (3), tad  postaje funkcija od . Ova funkcija ()
naziva se operativna karakteristika (OC) testa, a njegova kriva OC kriva. Jasno, u ovom slučaju  = 1 – 
također ovisi o . Ova funkciji () naziva se funkcija snage testa. (Primjeri slijede.)

Slika 2.6 Ilustracija grešaka tipa I i II u testiranju hipoteze = 0 spram alternative  = 1


(> 0, desnostrani test)

Naravno, iz testa koji vodi do prihvatanja određene hipoteze 0, ne slijedi da je to jedina moguća
hipoteza ili najbolja moguća hipoteza. Stoga je pojam "ne odbacuj" možda bolji od pojma "prihvatiti".

2.4.3 Test za  normalne raspodjele s poznatom  2

Sljedeći primjer objašnjava tri vrste hipoteza.

PRIMJER 2: Testiranje srednje vrijednosti normalne raspodjele sa poznatom varijansom

Neka je X normalna slučajna varijabla s varijansom  2 = 9. Korištenjem uzorka veličine n = 10 sa


srednjom vrijednosti x̄, testiraj hipotezu  = 0 = 24 prema tri vrste alternativa, naime:

a)  > 0, b)  < 0, c)   0.

Rješenje: Odabiremo nivo značaja  = 0,05. Procjenu srednje vrijednosti dobit ćemo iz

1
X  X1  ...  X n 
n

Ako je hipoteza istina, X̅ je normalne raspodjele sa srednjom vrijednosti  = 24 i varijansom  2/n = 0,9,
vidi Teoremu 1, Dio 2.3.

Stoga kritičnu vrijednost c možemo dobiti iz Tabele D4 u Dodatku 1.

Slučaj (a). Desnostrani test. Određujemo c iz P(X̅ > c) = 24 =  = 0,05 tj.

 c  24 

P X c    24
     1    0,95
 0,9 

Tabela D4 u Dodatku 1 daje (c – 24)/0,9 = 1,645 i c = 25,56 koje je veće od 0, kao u vrhu Slike 2.5. Ako
je x̄  25,56 hipoteza je prihvaćena. Ako je x̄ > 25,56 hipoteza se odbacuje. Funkcija snage testa je (vidi
Sliku 2.7)

62
     P  X  25,56   1  P  X  25,56 
 

 25,56    (7)
 1      1    26,94  1,05  
 0,9 

Slika 2.7 Funkcija snage () u Primjeru 2, slučaj (a) (crtkana kriva) i slučaj (c)

Slučaj (b). Lijevostrani test. Kritična vrijednost c dobije se iz jednačine

 c  24 

P X c    24
       0,05
 0,9 

Tabela D4 u Dodatku 1 daje c = 24 – 1,56 = 22,44 Ako je x̄  22,44 hipoteza se prihvata. Ako je x̄ < 22,44
hipoteza se odbacuje. Ako odbijemo. Funkcija snage testa je

     P  X  22,44 

 22,44    (8)
       23,65  1,05  
 0,9 

Slučaj (c). Dvostrani test. Budući da je normalna raspodjela simetrična, izaberimo c1 i c2 jednako
udaljene od  = 24, recimo, c1 = 24 – k i c2 = 24 + k potom odredimo k iz

 k   k 

P 24  k  X  24  k    24
          1    0,95
 0,9   0,9 

Tabela D4 u Dodatku 1 daje k/0,9 = 1,960 te je k = 1,86. Ovo daje vrijednosti c1 = 24 – 1,86 = 22,14 i
c2 = 24 + 1,86 = 25,86. Ako x̄ nije manje od c1 i nije veće od c2 hipoteza je prihvaćena. Inače je
odbacujemo. Funkcija snage testa je (Slika 2.7)

     P  X  22,44   P  X  25,86   P  X  22,44   1  P  X  25,86 


   

 22,44     25,86   
 1         (9)
 0,9   0,9 
 1    23,34  1,05      27,26  1,05  

63
Shodno tome, operativna karakteristika () = 1 – () (vidi prije) je (Slika 2.8)

       27,26  1,05     23,34  1,05 

Slika 2.8 Krivulje operativne karakteristike (OC krivulje) u Primjeru 2, slučaj (c), za dvije različite veličine
uzorka n

Ako uzmemo veći uzorak, recimo veličine n = 100 (umjesto 10), onda je 2/n = 0,09 (umjesto 0,9), a
kritične vrijednosti su c1 = 23,41 i c2 = 24,59 što se lako može potvrditi. Tada je operativna karakteristika
testa

 24,59     23, 41   
             81,97  3,33     78,03  3,33  
 0,09   0,09 

Slika 2.8 pokazuje da je odgovarajuća OC krivulja strmija od one za n = 10. To znači da je povećanje n
dovelo do poboljšanja testa. U svakom praktičnom slučaju odabire se što je moguće manji n, ali toliko
velik da odstupanja između  i 0 dobijena testom budu od praktičnog interesa. Na primjer, ako je
odstupanje od interesa 2 jedinice, na Slici 2.8 vidimo da je n = 10 previše malo jer kad je  = 24 – 2 = 22
ili  = 24 + 2 = 26,  je gotovo 50%. S druge strane, vidimo da je n = 100 dovoljno za tu svrhu.

2.4.4 Test za  kad je  2 nepoznato i za  2

PRIMJER 3: Testiranje srednje vrijednosti normalne raspodjele s nepoznatom varijansom

Mjerena je zatezna čvrstoća uzorka n = 16 užadi (prečnika 7,6 cm). Srednja vrijednost uzorka bila je
x̄ = 44,82 kN, a standardna devijacija  = 1,15 kN. Pod pretpostavkom da je zatezna čvrstoća normalna
slučajna varijabla, testirajte hipotezu 0 = 45 kN spram alternative 1 = 44 kN. Ovdje 0 može biti
vrijednost koju je dao proizvođač, dok bi 1 mogao biti rezultat prethodnog iskustva.

Rješenje: Odabiremo nivo značaja  = 5%. Ako je hipoteza istinita, iz Teoreme 2 u Dijelu 2.3, slijedi da
slučajna varijabla ima

X  0 X  45
T 
S n S 4

64
t-raspodjelu sa n – 1 = 15 s.s. Test je lijevostrani. Kritično c dobijemo iz P(T < c) 0 =  = 0,05. Iz Tabele D5
u Dodatku 1 dobijemo vrijednost c = –1,75. Kao uočenu vrijednost od T iz uzorka dobijamo da je
t = (44,82 – 45,00)/(1,15/4) = –0,626. Vidimo da je t > c te hipotezu prihvatimo. Za dobijanje numeričkih
vrijednosti snage testa trebali bi imati tabelu za necentralnu studentsku t-raspodjelu. O ovom pitanju
ovdje nećemo raspravljati.

PRIMJER 4: Testiranje varijanse normalne raspodjele

Koristeći uzorak veličine n = 15 i varijansu uzorka s2 = 13 iz normalne populacije, testiraj hipotezu


 2 = 02 = 10 spram alternative  2 = 12 = 20.

Rješenje: Odaberimo nivo značaja  = 5%. Ako je hipoteza istina, onda

S2 S2
Y   n  1  14  1,4S 2
 02 10

ima chi-kvadrat raspodjelu sa n – 1 = 14 s.s. prema Teoremi 3, Dio 2.3. Iz

P Y  c     0,05, tj. P Y  c     0,95

i Tabele D6 u Dodatku 1 sa 14 stepeni slobode dobijamo c = 23,68. Ovo je kritična vrijednost Y. Dakle
jednačini S2 = Y02/(n – 1) = 0,714Y odgovara kritična vrijednost c* = 0,714  23,68 = 16,91. Pošto je
s2 = c* hipotezu prihvatimo.

Ako je alternativa istinita, slučajna varijabla Y = 14  S2/12 = 0,7S2 ima chi-kvadrat raspodjelu sa 14 s.s.
Stoga test ima snagu

  P S 2  c   
 P Y1  0,7c    1  P Y1  11,84  2 20
 2 20  2 20

Iz proširenih tabela za chi-kvadrat raspodjelu, ili putem kompjuterske aplikacije, može se vidjeti da je
  62%. Stoga je rizik Tipa II od 38% vrlo velik. Da bi rizik bio manji treba povećati veličinu uzorka.

2.4.5 Upoređivanje srednje vrijednosti i varijanse

PRIMJER 5: Upoređivanje srednjih vrijednosti dvije normalne raspodjele

Pomoću uzorka x1, , xn normalne raspodjele sa nepoznatom srednjom vrijednosti x i uzorka y1, , yn
također normalne raspodjele sa nepoznatom srednjom vrijednosti y želimo testirati hipotezu da su
srednje vrijednosti jednake x = y protiv alternative, recimo, x > y. Varijanse ne moraju biti poznate,
ali se pretpostavlja da su jednake.1

Dva slučaja upoređivanja srednjih vrijednosti imaju praktičnu važnost:

1
Ova se pretpostavka jednakosti varijansi može testirati, kao što je prikazano u sljedećem primjeru. Ako test
pokazuje da se značajno razlikuju, odaberite dva uzorka iste veličine n1 = n2 = n (da nisu premaleni, n > 30, recimo),
koristite test u primjeru 2 zajedno s činjenicom da je (12) uočena vrijednost približno standardizirane normalne
slučajne varijable.

65
Slučaj A. Uzorci su iste veličine. Nadalje, svaka vrijednost prvog uzorka odgovara točno jednoj vrijednosti
drugog, jer odgovarajuće vrijednosti proizlaze iz iste osobe ili stvari – npr., dva mjerenja iste stvari
dvjema različitim metodama, ili dva mjerenja sa dva oka iste osobe. Općenitije, ona mogu biti rezultat
parova sličnih pojedinaca ili stvari, na primjer, identičnih blizanaca, para korištenih prednjih guma sa
istog automobila itd. Tada bi trebali formirati razlike odgovarajućih vrijednosti i testirati hipotezu da
populacija razlika ima srednju vrijednost 0, koristeći metodu u Primjeru 3. Ako možemo birati ova
metoda je bolja od sljedeće.

Slučaj B. Dva uzorka su neovisna i nisu nužno jednake veličine. Tada možemo nastaviti kako slijedi.
Pretpostavimo da je alternativa x > y. Izabiremo nivo značaja . Nakon toga možemo izračunati
srednje vrijednosti uzoraka x̄ i ȳ kao i (n1 – 1)sx2 i (n2 – 1)sy2 gdje su sx2 i sy2 varijanse uzoraka. Upotrebom
Tabele D5 u Dodatku 1 sa n1 + n2 – 2 stepeni slobode, treba odrediti c iz

P T  c   1   (10)

Konačno izračunamo

n1n2  n1  n2  2  x y
t0  (11)
n1  n2  n1  1 sx2   n2  1 sy2

Može se pokazati da je ovo uočena vrijednost slučajne varijable koja ima t-raspodjelu sa n1 + n2 – 2
stepeni slobode, pod uvjetom da je hipoteza istinita. Ako je t0  c hipoteza se prihvaća. Ako je t0 > c
odbacuje se.

Ako je alternativa x  y tada (10) mora biti zamijenjeno sa

P T  c1   0,5, P T  c2   1  0,5 (10*)

Imajte na umu da se za uzorke jednake veličine n1 = n2 = n formule (11) reduciraju na

x y
t0  n (12)
sx2  sy2

Da bismo prikazali proračun, razmotrimo dva uzorka (x1, , xn) i (y1, , yn) koja su data sa

105 108 86 103 103 107 124 105


89 92 84 97 103 107 111 97

Ove vrijednosti pokazuju relativni učinak radnika na proizvodnji limenih ploča pod dva različita radna
uvjete. Pretpostavljajući da su odgovarajuće populacije normalne i da imaju istu varijansu, testirajmo
hipotezu x = y spram alternative x  y. (Jednakost varijansi će se testirati u sljedećem primjeru.)

Rješenje: Pronašli smo da je

x̄ = 105,125; ȳ = 97,500; sx2 = 106,125; sy2 = 84,000

Odabiremo nivo značaja  = 5%. Iz (10*) sa 0,5 = 2,5% i 1 – 0,5 = 97,5% i Tabele D5 u Dodatku 1 sa 14
stepeni dobjemo c1 = –2,14 i c2 = 2,14. Formula (12) sa n = 8 daje vrijednost

66
7,625
t0  8  1,56
190,125

Pošto je c1  t0  c2 prihvatamo hipotezu x = y da je pod oba uvjeta srednja vrijednost učinka ista.

Slučaj A je primjenjiv u ovom primjeru jer prve dvije vrijednosti uzorka odgovaraju određenoj vrsti posla,
druge dvije su dobijene za drugu vrstu posla itd. Tako da možemo koristiti razlike

16 16 2 6 0 0 13 8

odgovarajućih vrijednosti uzoraka i metod iz Primjera 3 za test hipoteze  = 0 gdje je  srednja vrijednost
populacije razlika. Kao logičnu alternativu uzmemo   0. Srednja vrijednost uzorak je d̄ = 7,625 a
varijansa uzorka je s2 = 45,696. Stoga je

7,625  0
t 8  3,19
45,696

Iz P(T  c1) = 2,5%, P(T  c2) = 97,5% i Tabele D5 u Dodatku 1 sa n – 1 = 7 stepeni slobode dobijamo
c1 = –2,36 i c2 = 2,36. Hipotezu odbacujemo, jer t = 3,18 ne leži između c1 i c2. Dakle, naš sadašnji test, u
kojem smo koristili više informacija (ali iste uzorke), pokazuje da je razlika u učinku značajna.

PRIMJER 6: Uporedba varijanse dvije normalne raspodjele

Koristeći dva uzorka u posljednjem primjeru, testirati hipotezu x2 = y2 pretpostavljajući da su
odgovarajuće populacije normalne a priroda eksperimenta sugeriše alternativu x2 > y2.

Rješenje: Našli smo da su sx2 = 106,125; sy2 = 84,000. Odabrali smo nivo značaja  = 5%. Korištenjem
P(V  c) = 1 –  = 95% i Tabela D7 u Dodatku 1 sa (n1 – 1, n2 – 1) = (7, 7) stepeni slobode, odredili smo da
je c = 3,79. Konačno sračunamo v0 = sx2/sy2 = 1,26. Pošto je v0  c prihvatamo hipotezu. Da je v0 < c
odbacili bismo je.

Ovaj se test opravdava činjenicom da je v0 uočena vrijednost slučajne varijable koja ima tzv. F-raspodjelu
sa (n1 – 1, n2 – 1) stepeni slobode, pod uvjetom da je hipoteza istinita. F-raspodjela sa (m, n) stepeni ima
funkciju raspodjele F(z) = 0 ako je z < 0 i

z m 2 mn 
F  z   K mn  t  mt  n   z  0

2 2 dt ,
0

Gdje je

m n
m   
n
K mn m n2  2 2
2
m n
  
 2  2

Ovaj dugački Dio sadrži osnovne ideje i pojmove testiranja, zajedno s tipičnim primjenama. Možda biste
ga trebali ponoviti prije nego što nastavite, budući da se sljedeći Dijelovi zasnivaju na primjeni ovih ideja
na poslove od velike praktične važnosti.

67
2.5 Kontrola kvaliteta

Ideje o testiranju mogu se prilagoditi i proširiti na različite načine kako bi služile osnovnim praktičnim
potrebama u inženjerskom i drugim područjima. U preostalim dijelovima skripte biće riječi o nekim od
najvažnijih zadataka koji se mogu riješiti statističkim metodama. Prvo takvo područje razmatranja biće
kontrola kvaliteta u industriji, kao vrlo uspješna metoda koja se koristi u raznim granama industrije.

Nijedan proizvodni proces nije tako savršen da su svi proizvodi potpuno isti. Uvijek postoji mala varijacija
uzrokovana velikim brojem malih, nekontroliranih faktora i stoga se mora smatrati slučajnom
varijacijom. Važno je osigurati da proizvodi imaju potrebne vrijednosti (npr., dužinu, čvrstoću ili bilo koja
osobina koja se zadesi u konkretnom slučaju). U tu svrhu napravimo test hipoteze da proizvodi imaju
potrebnu osobinu, recimo,  = 0 gdje je 0 potrebna vrijednost. Ako je to učinjeno nakon što je
proizvedena cijela serija (npr., serija od 100.000 vijaka), test će nam reći koliko su dobri ili loši proizvodi,
ali očito je prekasno mijenjati neželjene rezultate. Mnogo je bolje testirati u toku proizvodnje. To se vrši
u pravilnim vremenskim razmacima (na primjer, svaki sat ili pola sata) i zove se kontrola kvalitete. Svaki
put uzima se uzorak iste veličine, u praksi 3 do 10 puta. Ako se hipoteza odbaci, zaustavljamo
proizvodnju i tražimo uzrok problema.

Ako zaustavimo proizvodni proces iako on ispravno napreduje, pravimo grešku Tipa I. Ako ne zaustavimo
proces, iako nešto nije u redu, činimo grešku Tipa II (vidi Dio 2.4). Rezultat svakog testa se predstavlja u
grafičkoj formi na onome što se zove kontrolni dijagram.

2.5.1 Kontrolni dijagram za srednju vrijednost

Ilustracija i primjer kontrolnog dijagrama prikazana je na lijevoj strani Slike 2.9 (vrijednosti iz Tabele 2.5).
Ovaj kontrolni dijagram za srednju vrijednost prikazuje donju kontrolnu granicu LCL (lower control limit),
centralnu kontrolnu liniju CL (center control line) i gornju kontrolnu granicu UCL (upper control limit).
Dvije kontrolne granice odgovaraju kritičnim vrijednostima c1 i c2 u slučaju (c) iz Primjera 2 u Dijelu 2.4.

Slika 2.9 Kontrolni dijagrami srednje vrijednosti (lijevo) i standardnu devijaciju za uzorak iz Tabele 2.5

68
Čim srednja vrijednost uzorka padne izvan raspona između kontrolnih granica, odbacujemo hipotezu i
tvrdimo da je proces proizvodnje "izvan kontrole"; tj. tvrdimo da je došlo do promjene u nivou procesa.
Kad god tačka prekorači granice treba poduzeti stanovite mjere.

Tabela 2.5 Dvanaest uzoraka od kojih svaki ima pet vrijednosti (vrijednosti za kontrolne dijagrame na
Slici 2.9 – prečnik malih cilindara u milimetrima)

Uzorak
vrijednosti uzorka x̄ s R
br.
1 4,06 4,08 4,08 4,08 4,10 4,08 0,01 0,04
2 4,10 4,10 4,12 4,12 4,12 4,11 0,01 0,02
3 4,06 4,06 4,08 4,10 4,12 4,08 0,03 0,06
4 4,06 4,08 4,08 4,10 4,12 4,09 0,02 0,06
5 4,08 4,10 4,12 4,12 4,12 4,11 0,02 0,04
6 4,08 4,10 4,10 4,10 4,12 4,10 0,01 0,04
7 4,06 4,08 4,08 4,10 4,12 4,09 0,02 0,06
8 4,08 4,08 4,10 4,10 4,12 4,10 0,02 0,04
9 4,06 4,08 4,10 4,12 4,14 4,10 0,03 0,08
10 4,06 4,08 4,10 4,12 4,16 4,10 0,04 0,10
11 4,12 4,14 4,14 4,14 4,16 4,14 0,01 0,04
12 4,14 4,14 4,16 4,16 4,16 4,15 0,01 0,02

Ako odaberemo previše razmaknute kontrolne granice, nećemo otkriti promjene u procesu. S druge
strane, ako su kontrolne granice previše zbijene, nećemo moći pokrenuti proces zbog čestih potraga za
nepostojećim problemima. Uobičajena nivo značaja je  = 1%. Iz Teoreme 1 u Dijelu 2.3 i Tabele D4 u
Dodatku 1 vidimo da su u slučaju normalne raspodjele odgovarajuće kontrolne granice za srednju
vrijednost

 
LCL  0  2,58 i UCL  0  2,58 (1)
n n

Ovdje se pretpostavlja da je  poznato. Ako je  nepoznato, možemo izračunati standardnu devijaciju


prvih 20 ili 30 uzoraka i uzeti njihovu aritmetičku sredinu kao približnu vrijednost za . Izlomljena linija
koja povezuje srednje vrijednosti na Slici 2.9 služi samo prikazu rezultata.

Dodatne, suptilnije kontrole često se koriste u industriji. Npr., posmatra se kretanje srednje vrijednosti
uzorka iznad i ispod centralne linije, što bi se trebalo često događati. Međutim, dugo protezanje (obično
dužine 7 ili više) svih srednjih vrijednosti iznad (ili da su sve ispod) centralne linije može ukazivati na
problem.

2.5.2 Kontrolni dijagram za varijansu

Uz srednju vrijednost, često se kontrolira varijansa, standardna devijacija ili raspon. Kod izrade
kontrolnog dijagrama za varijansu u slučaju normalne raspodjele, za uspostavu kontrolnih granica
možemo koristiti metodu u Primjeru 4 Dio 2.4. Uobičajeno je uspostaviti samo jednu kontrolnu granicu,
naime, gornju kontrolnu granicu. Sada iz Primjera 4, Dio 2.4 imamo S2 = Y02/(n – 1) gdje, zbog
pretpostavke o normalnosti, slučajna varijabla Y ima chi-kvadrat raspodjelu sa n – 1 stepeni slobode.
Stoga je željena kontrolna granica

69
 2c
UCL  (2)
n 1

gdje se c dobija iz jednačine

P Y  c   , tj., P Y  c   1  

i Tabele chi-kvadrat raspodjele (Tabela D6 u Dodatku 1) sa n – 1 stepeni slobode (ili putem kompjuterske
aplikacije). Ovdje je  (recimo 5% ili 1%) vjerovatnoća da je u ispravnom procesu posmatrana vrijednost
s2 od S2 veća od gornje kontrolne granice.

Ako bismo željeli kontrolni dijagram za varijansu sa obe i gornjom i donjom kontrolnom granicom UCL i
LCL, ta bi ograničenja bila

 2c1  2 c2
LCL  i UCL  (3)
n 1 n 1

gdje su c1 i c2 dobijeni iz Tabele D6 sa n – 1 stepeni slobode i jednačina

 
P Y  c1   i P Y  c2   1  (4)
2 2

2.5.3 Kontrolni dijagram za standardnu devijaciju

Za uspostavu kontrolnog dijagrama za standardnu devijaciju potrebno nam je gornja kontrolna granica

 c
UCL  (5)
n 1

dobijena iz (2). Na primjer, u Tabeli 2.5 imamo n = 5. Pretpostavimo da je odgovarajuća populacija


normalna sa standardnom devijacijom  = 0,02 i odaberimo  = 1%. Iz jednačine

P Y  c   1    99%

i Tabele D6 u Dodatku 1 sa 4 stepena slobode dobijamo kritičnu vrijednost c = 13,28 a iz (5)

UCL  0,02 12,28 4  0,0365

što je prikazano na desnoj strani Slike 2.9. Kontrolni dijagram za standardnu devijaciju s gornjom i
donjom kontrolnom granicom dobija se iz (3).

2.5.4 Kontrolni dijagram za raspon

Umjesto varijanse ili standardne devijacije, često se kontrolira raspon R (= najveća vrijednost uzorka
minus najmanja vrijednost uzorka). Može se pokazati da je u slučaju normalne raspodjele standardna
devijacija  proporcionalna očekivanju slučajne varijable R* za koju je R uočena vrijednost, recimo,
 = nE(R*) gdje faktor proporcionalnosti n ovisi o veličini uzorka n i ima vrijednosti

70
n 2 3 4 5 6 7 8 9 10
n = /E (R*) 0,89 0,59 0,49 0,43 0,40 0,37 0,35 0,34 0,32

n 12 14 16 18 20 30 40 50
n = /E (R*) 0,31 0,29 0,28 0,28 0,27 0,25 0,23 0,22

2.6 Uzorkovanje prihvatanja

Uzorkovanje prihvatanja obično se obavlja kada proizvodi napuste fabriku. Standardna situacija u
uzorkovanju prihvatanja je da proizvođač isporučuje potrošaču (kupcu ili veletrgovcu) veliki broj N
predmeta (npr. sanduka vijaka). Odluka o prihvatanju ili odbijanju partije vrši se utvrđivanjem broja x
defektnih stvari u uzorku veličine n iz partije. Partija je prihvaćena ako je x  c gdje se c naziva broj
prihvatanja, koji određuje dopušteni broj defektnih stvari. Ako je x > c potrošač odbija partiju. Jasno,
proizvođač i potrošač moraju se složiti oko određenog plana uzorkovanja koji određuje n i c.

Iz hipergeometrijske raspodjele vidimo da je događaj A: "Prihvati partiju" ima vjerovatnoću (vidi Dio 1.7)

c
M N  M  N 
P  A  P  X  c          (1)
x 0  x   n  x  n

gdje M predstavlja broj defektnih stvari u partiji od N stvari. Udio defektnih stvari može se izraziti preko
odnosa  = M/N tada se (1) može napisati kao

c
 N   N  N  N 
P  A;         (2)
x 0  x   n  x  n

P(A; ) može poprimiti n + 1 vrijednosti koje odgovaraju  = 0, 1/N, 2/N, , N/N. Ovdje, su n i c fiksni.
Neprekidna monotona krivulja kroz ove točke naziva se operativna karakteristična krivulja (OC krivulja)
razmatranog plana uzorkovanja.

PRIMJER 1: Plan uzorkovanja

Pretpostavimo da su određeni dijelovi alata pakirani 20 komada u kutiju i da se koristi sljedeći plan
uzorkovanja. Izvlače se uzorak od dva predmete, a odgovarajuća kutija je prihvaćena ako i samo ako su
oba predmeta u uzorku ispravna. U ovom slučaju, N = 20, n = 2 i c = 0 a (2) ima oblik

 20   20  20   20   20  20 19  20 


P  A;       
 0  2   2 380

Vrijednosti P(A; ) za  = 0, 1/20, 2/20, , 20/20 i rezultirajuća OC kriva su prikazane na Slici 2.10a.

71
Slika 2.10 a) OC kriva Primjer 1; OC kriva Primjer 2

U većini praktičnih slučajeva  će biti malo (manje od 10%) i ako još uzmemo male uzorke u odnosu na
N, (2) možemo aproksimirati Poissonovom raspodjelom (Dio 2.7).

c
x
P  A;  ~ e   ( = n) (3)
x 0 x!

PRIMJER 2: Plan uzorkovanja. Poissonova raspodjela

Pretpostavimo da se za velike partije koristi sljedeći plan uzorkovanja. Uzet je uzorak veličine n = 20.
Ukoliko uzorak sadrži ne više od jednog defektne stvari, partija je prihvaćena. Ako uzorak sadrži dvije ili
više defektne stvari, partija je odbijena. U ovom planu se iz (3) dobije

P  A;  ~ e20 1  20 

Odgovarajuća OC kriva prikazana je na Slici 2.10b.

2.6.1 Greške pri uzorkovanju

Pokazali smo kako se uzorkovanje prihvatanja uklapa u opću teoriju testiranja (Dio 2.4) i što to znači s
praktičnog aspekta. Proizvođač želi da je vjerovatnoća odbacivanja  prihvatljive partije stvari (partije
za koju  ne prelazi određeni broj 0 sa kojim se slažu obe strane) mala. 0 se naziva prihvatljivi nivo
kvaliteta (acceptable quality level AQL). Slično tome, potrošač (kupac) želi da je vjerovatnoća 
prihvatanja neprihvatljive partije (partija za koju je  veće ili jednako od nekog 1) također mala. 1 se
zove tolerantni procenat defektnih stvari u partiji (lot tolerance percent defective LTPD) ili odbačeni
nivo kvaliteta (rejectable quality level RQL).  se naziva rizik proizvođača, a odgovara grešci tipa I u
Dijelu 2.4.  se naziva rizikom potrošača i odgovara grešci tipa II. Na Slici 2.11 prikazan je primjer.
Vidimo da tačke (0, 1 – ) i (1, ) leže na OC krivoj. Može se pokazati da za velike partije možemo
odabrati 0, 1 (> 0),  i , te zatim odrediti n i c takve da OC krivulja prolazi vrlo blizu propisanih tačaka.

72
Slika 2.11 OC kriva proizvođačev i potrošačev rizik

Tabela 2.6 prikazuje analogiju između uzorkovanja prihvatanja i testiranja hipoteze u Dijelu 2.4.

Tabela 2.6 Uzorkovanje prihvatanja i Testiranje hipoteze

Uzorkovanje prihvatanja Testiranje hipoteze


prihvatljivi nivo kvaliteta (AQL)  = 0  hipoteza  = 0
tolerantni procenat defektnosti u partiji (LTPD)  = 1  alternativa  = 1
dopušteni broj defektnih stvari c  kritična vrijednost c
vjerovatnoća  činjenja greške tipa I
rizik proizvođača za   0 
(nivo značaja)
rizikom potrošača  za   1  vjerovatnoća  činjenja greške tipa II

2.6.2 Ispravljanje

Ispravljanje odbačene partije znači da se partija pregledava predmet po predmet, a sve defektne stvari
se uklanjaju i zamjenjuju ispravnim. (To bi moglo biti preskupo ako je partija jeftina, u ovom slučaju se
partija može prodati po niskoj cijeni ili otpisati). Ako proizvodnja izbaci 100 % defektnih stvari, onda je
u K partija od kojih je svaka veličine N, KN od KN stvari neispravno/defektno. Sada, KP(A; ) od ovih
partija je prihvaćeno. One sadrže KPN nedostataka, dok odbijene pa ispravljene partije ne sadrže
nedostatke zbog ispravljanja. Dakle nakon ispravke udio defektnih stvari u svim K partijama je KPN/KN.
Ovo se zove prosječni izlazni kvalitet (average outgoing quality AOQ), tj.,

AOQ     P  A;  (4)

Na Slici 2.12 prikazan je primjer. Budući da je AOQ(0) = 0 i P(A; 1) = 0, AOQ kriva ima maksimum u  = *
koji jeste granica prosječnog izlaznog kvaliteta (average outgoing quality limit AOQL). To je najgori
prosječni kvalitet za koji se može očekivati da bude prihvaćen nakon ispravke.

73
Slika 2.12 OC kriva i AOQ kriva za plan uzorkovanja na Slici 2.10a

2.7 Ocjena uklapanja 2 test

Testiranje uklapanja znači da želimo testirati da li je određena funkcija F(x) funkcija raspodjele raspodjeli
koju smo dobili iz uzorka x1, , xn. Potom testiramo da li se funkcija raspodjele uzorka 𝐹̃ (x) (𝐹̃ (x) = suma
relativnih frekvencija svih vrijednosti uzoraka xj koje ne prelaze x), "dovoljno dobro" uklapa u F(x). Ako
jeste, prihvatit ćemo hipotezu da je F(x) funkcija raspodjele populacije; ako nije, odbacit ćemo hipotezu.

Ovaj test ima značajnu praktičnu važnost i razlikuje se od testova za parametre (,  2
i sl.) koji su
razmatrani do sada.

Da bismo testirali na ovaj način, moramo znati koliko se 𝐹̃ (x) može razlikovati od F(x) ako je hipoteza
istina. Stoga moramo najprije uvesti kvantitat koji mjeri odstupanje 𝐹̃ (x) od F(x) i moramo znati
raspodjelu vjerovatnoće ovog kvantiteta uz pretpostavku da je hipoteza istina. Zatim nastavljamo kako
slijedi. Odredimo broj c tako da ako je hipoteza istina, odstupanje veće od c ima malu unaprijed
dodijeljenu vjerovatnoću. Ako je ipak odstupanja veće od c, imamo razloga sumnjati da je hipoteza
istinita i odbijamo je. S druge strane, ako odstupanje ne prelazi c, tako da je 𝐹̃ (x) dovoljno dobra
aproksimacija F(x), prihvaćamo hipotezu. Naravno, ako prihvatimo hipotezu, to znači da nemamo
dovoljno dokaza da je odbijemo, ali to ne isključuje mogućnost da postoje druge funkcije koje se ne bi
odbacile u testu. U tom pogledu situacija je vrlo slična onoj u Dijelu 2.4.

Tabela 2.7 prikazuje test takve vrste. Taj je test opravdan činjenicom da ako je hipoteza istina, onda je
02 uočena vrijednost slučajne varijable čija funkcija raspodjele prilazi chi-kvadrat raspodjeli sa K – 1
stepeni slobode (ili K – r – 1 stepeni slobode ako se procjenjuje r parametara) kako n teži beskonačnosti.
Zahtjev da se u svakom od intervala u Tabeli 2.7 nalazi najmanje pet vrijednosti uzoraka, proistječe iz
činjenice da za konačno n ta slučajna varijabla ima samo približno cki-kvadrat raspodjelu. Dokaz za ovo
može se naći u odgovarajućoj literaturi. Ako je uzorak toliko mali da se zahtjev ne može zadovoljiti, test
se može nastaviti, ali treba biti oprezan pri upotrebi rezultata.

74
Tabela 2.7 Chi-kvadrat test hipoteze: F(x) je funkcija raspodjele populacije iz koje je uzet uzorak x1, , xn

Korak 1. Podijelite x-osu u K intervala I1, , IK tako da svaki interval sadrži najmanje 5 vrijednosti
zadanog uzorka x1, , xn. Odredite broj bj vrijednosti uzorka u intervalu Ij gdje je j = 1, 2, , K.

Ako vrijednost uzorka leži na zajedničkoj graničnoj tački dva intervala, dodajte 0,5 svakom od dva
odgovarajuća bj.

Korak 2. Koristeći F(x), izračunajte vjerovatnoću pj da razmatrana slučajna varijabla X poprimi bilo
koju vrijednost u intervalu Ij, gdje je j = 1, 2, , K. Izračunaj
ej = npj
(Ovo je broj vrijednosti uzoraka teoretski očekivanih u Ij ako je hipoteza istina.)

Korak 3. Izračunajte devijaciju

b  ej 
2
k
 
2 j
0 (1)
j 1 ej

Korak 4. Odaberite nivo značaja (5%, 1% ili slično).

Korak 5. Odredite c kao rješenje jednačine

 
P  2  c  1 

iz Tabele D6 Dodatak 1 chi-kvadrat raspodjele sa K – 1 stepeni slobode. Ako je r parametara od F(x)


nepoznato i koristi se njihova maksimalna procijenjena vjerovatnoća (Dio 2.2), upotrijebite K – r – 1
stepeni slobode (umjesto K – 1).
Ako je 02  c prihvatite hipotezu. Ako je 02 > c odbijete hipotezu.

PRIMJER 1: Test normalnosti

Ispitajte da li je populacija iz koje je uzet uzorak u Tabeli 2.8 normalna.

Rješenje: Tabela 2.8 prikazuje vrijednosti u redoslijedu koji je dobijen u eksperimentu. Tabela 2.9
prikazuje raspodjele frekvencija i Slika 2.13 prikazuje histogram. Teško je pretpostaviti ishod testa - da li
histogram dovoljno liči ili ne liči normalnoj gustoći?

Maksimalne procijenjena vrijednost za  i  2 su ̂ = x̄ = 35,87 i ̂ 2 = 5,24. Proračun u Tabeli 2.10 daje


vrijednost 02 = 2,762. Vrlo je zanimljivo da interval 38  40 najviše doprinosi vrijednosti 02, ali taj
interval nema najveću frekvenciju na histogramu. Drugi interesantan interval je posljednji 36  38 gdje
je situacija sasvim obrnuta, što možda nije očito iz inspekcije.

75
Tabela 2.8 Uzorak od 100 vrijednosti pritisne čvrstoće (MPa) betonskih cilindara iz ZPIMK

36,6 42,9 38,2 30,1 36,8 31,1 34,1 22,5 30,9 28,7
28,2 25,7 30,7 27,4 40,9 33,8 36,3 35,0 31,2 27,0
34,2 35,7 41,6 34,1 36,6 36,4 33,4 29,7 40,8 29,2
34,6 45,0 39,0 30,2 46,0 36,4 36,3 36,4 33,4 29,7
35,2 33,5 31,6 39,9 32,8 31,7 35,6 32,8 31,7 42,3
35,6 31,6 36,8 42,2 33,3 32,8 35,9 49,2 42,9 40,3
38,5 41,4 43,8 35,8 41,0 36,4 34,3 41,7 33,0 34,5
43,1 39,8 45,6 31,8 35,1 45,6 35,1 32,4 40,3 41,1
39,5 41,7 36,2 33,6 39,0 42,9 36,9 37,7 33,6 34,4
36,3 37,5 38,3 32,9 45,7 43,7 27,5 28,7 22,9 33,2

Tabela 2.9 Tabela frekvencija za uzorak is Tabele 2.8


1 2 3 4 5
Kumulativna Kumulativna
Pritisna Apsolutna Relativna
apsolutna relativna
čvrstoća frekvencija frekvencija
frekvencija frekvencija
x MPa 𝑓̃(x) 𝐹̃ (x)
22 2 0,02 2,0 0,02
24 0 0,00 2,0 0,02
26 1 0,01 3,0 0,03
28 6 0,06 9,0 0,09
30 7 0,07 16,0 0,16
32 12 0,12 28,0 0,28
34 16 0,16 44,0 0,44
36 22 0,22 66,0 0,66
38 5 0,05 71,0 0,71
40 9 0,09 80,0 0,80
42 11 0,11 91,0 0,91
44 3 0,03 94,0 0,94
46 5 0,05 99,0 0,99
48 0 0,00 99,0 0,99
50 1 0,01 100,0 1,00

Slika 2.13 Histogram frekvencija uzorka u Tabeli 2.8, x u MPa

76
Odabiremo  = 5%. Pošto je K = 10 i procijenili smo da je r = 2. Parametri koje treba da koristimo nalaze
se u Tabeli D6 Dodatak 1 sa K – r – 1 = 7 stepeni slobode. Pronašli smo da je c = 14,07 kao rješenje
P(02  c) = 95%. Pošto je 02 < c prihvatamo hipotezu da je populacija normalna.

Tabela 2.10 Proračun u primjeru 1

x j  364, 7  x  364, 7  Izraz



j
xj  ej bj
(1)
26, 7  26, 7 
-  28 -  -1,50 0,0000  0,0667 6,67 6 0,0673
28  30 -1,50  -1,12 0,0667  0,1315 6,48 6 0,0353
30  32 -1,12  -0,74 0,1315  0,2303 9,88 11 0,1276
32  34 -0,74  -0,36 0,2303  0,3607 13,04 14 0,0701
34  36 -0,36  0,02 0,3607  0,5099 14,92 16 0,0782
36  38 0,02  0,41 0,5099  0,6577 14,78 15 0,0032
38  40 0,41  0,79 0,6577  0,7845 12,68 8 1,7294
40  42 0,79  1,17 0,7845  0,8788 9,43 10 0,0349
42  44 1,17  1,55 0,8788  0,9395 6,07 8 0,6152
44   1,55   0,9395  1,0000 6,05 6 0,0004
 = 2,7616
0
2

2.8 Neparametarski testovi

Neparametrijski testovi, koji se nazivaju i testovi bez raspodjele, vrijede za svaku raspodjelu. Stoga se
upotrebljavaju u slučajevima kada je vrsta raspodjele nepoznata ili je poznata, ali takva da nisu dostupni
nikakvi testovi za nju posebno projektovani. U ovom dijelu objasnit ćemo osnovnu ideju tih testova. Ako
ipak postoji izbor, testovi projektovani za određenu raspodjelu obično daju bolje rezultate od
neparametrijskih testova. Na primjer, ovo se odnosi na testove u Dijelu 2.4 za normalnu raspodjelu.

Razmotrit ćemo dva testa u smislu tipičnih primjera. U izvođenju raspodjela korištenih u testu, bitno je
da se raspodjele, iz kojih uzorkujemo, kontinuirane. (Neparametrijski testovi također se mogu izvesti za
diskretne raspodjele, ali je to nešto složenije.)

PRIMJER 1: Test za medijan

Medijan populacije je rješenje x = ̃ jednačine F(x) = 0,5 gdje je F funkcija raspodjele populacije.

Pretpostavimo da je testirano osam radio operatora, prvo u sobama bez klimatizacije, a zatim u
klimatiziranim prostorijama u istom vremenskom razdoblju, a razlika grešaka (neuvjetno minus uvjetno)
bila je:

9 4 0 6 4 0 7 11

Testirajte hipotezu ̃ = 0 (tj., klimatizacija nema nikakvog učinka) protiv alternativne ̄ = 0 (tj. lošiji
učinak u neaklimatiziranim prostorijama).

Rješenje: Odaberemo nivo značaja  = 5%. Ako je hipoteza istina, vjerovatnoća p pozitivne razlike je ista
kao negativne razlike. Stoga u ovom slučaju p = 0,5 i slučajna je varijabla X = broj pozitivnih vrijednosti

77
među n vrijednostima, ima binomnu raspodjelu sa p = 0,5. Uzorak ima osam vrijednosti. Izostavljamo
vrijednosti 0 koje ne doprinose odluci. Tada ostaje šest vrijednosti, od kojih su sve pozitivne. Pošto je

6
P  X  6     0,56 0,50  0,0156  1,56%
6

primjećujemo događaj čija je vjerovatnoća vrlo mala za istinitost hipoteze, 1,56% <   5%. Dakle
tvrdimo da je alternativa ̄ = 0 istinita. To znači da je broj grešaka u neaklimatiziranim prostorijama
znatno veći, pa je potrebno uzeti u obzir instalaciju klimatizacije.

PRIMJER 2: Test za proizvoljni trend

Za rezanje žice koristi se određena mašina. Pet uzastopnih komada imalo je dužinu

29 31 28 30 32

Koristeći ovaj uzorak, ispitajte hipotezu da ne postoji trend, tj. da mašina ne proizvodi duže i duže
komade niti kraće i kraće komade. Pretpostavimo da tip mašine sugeriše alternativu da postoji pozitivan
trend, tj. da postoji tendencija da uzastopni komadi postaju sve duži.

Rješenje: Prvo izbrojimo broj transpozicija u uzorku, tj. koliko puta veća vrijednost prethodi manjoj
vrijednosti:

29 prethodi 28 (1 transpozicija), 31 prethodi 28 i 30 (2 transpozicije).

Preostale tri vrijednosti uzorka imaju rastući redoslijed. Stoga u uzorku postoje 1 + 2 = 3 transpozicije.
Sada razmotrimo slučajnu varijablu, T = broj transpozicija

Ako je hipoteza istina (bez trenda), tada svaka od 5! = 120 permutacija od pet elemenata 1 2 3 4 5 ima
istu vjerovatnoću (1/120). Organiziramo ove permutacije prema broju transpozicija:

T=0 T=1 T=2 T=3


1 2 3 4 5 1 2 3 5 4 1 2 4 5 3 1 2 5 4 3
1 2 4 3 5 1 2 5 3 4 1 3 4 5 2
1 3 2 4 5 1 3 2 5 4 1 3 5 2 4
2 1 3 4 5 1 3 4 2 5 1 4 2 5 3
1 4 2 3 5 1 4 3 2 5
2 1 3 5 4 1 5 2 3 4
2 1 4 3 5 2 1 4 5 3
2 3 1 4 5 2 1 5 3 4 Itd.
3 1 2 4 5 2 3 1 5 4
2 3 4 1 5
2 4 1 3 5
3 1 2 5 4
3 1 4 2 5
3 2 1 4 5
4 1 2 3 5

78
Odakle se dobije

P(T  3) = 1/120 + 4/120 + 9/120 + 15/120 = 29/120 = 24%

Prihvaćamo hipotezu jer smo posmatrali događaj koji ima relativno veliku vjerovatnoću (svakako mnogo
veću od 5%) ako je hipoteza istinita.

Vrijednosti raspodjele funkcije T u slučaju da nema trenda prikazane su u Tabeli D8 Dodatak 1. Na


primjer, ako je n = 3 onda je F(0) = 0,167; F(1) = 0,500; F(2) = 1 – 0,167. Ako je n = 4 onda je F(0) = 0,042;
F(1) = 0,167; F(2) = 0,375; F(3) = 1 – 0,375; F(4) = 1 – 0,167 itd.

Naša metoda i ove vrijednosti odnose se na kontinuirane raspodjele. Teoretski, možemo očekivati da su
sve vrijednosti uzorka različite. Praktično, neke vrijednosti uzorka mogu i dalje biti jednake, zbog
zaokruživanja: Ako je m jednakih vrijednosti, dodaj m(m – 1)/4 (= srednja vrijednost transpozicija u
slučaju permutacija m elemenata), tj. 1/2 za svaki par jednakih vrijednosti, 3/2 za trostruko jednake
vrijednosti, itd.

2.9 Regresija. Uklapanje pravca. Korelacija

Do sada smo se bavili slučajnim eksperimentima u kojima smo posmatrali jednu veličinu (slučajnu
varijablu) i dobili uzorke čije su vrijednosti bili pojedinačni brojevi. U ovom Dijelu raspravljamo o
eksperimentima u kojima istodobno posmatramo ili mjerimo dvije vrijednosti kako bismo dobili uzorke
parova vrijednosti (x1, y1), (x2, y2), , (xn, yn). Većina praktičnih primjena uključuje jednu od sljedeće
dvije vrste eksperimenata:

1. U regresionoj analizi jedna od dvije varijable, nazvana x, može se smatrati običnom varijablom jer je
možemo mjeriti bez značajne greške ili joj čak možemo dodijeliti vrijednosti koje želimo. x se zove
neovisna varijabla, ili ponekad kontrolirana varijabla jer je možemo kontrolirati (postaviti je na
odabrane vrijednosti). Druga varijabla, Y, je slučajna varijabla, a zanima nas ovisnost Y spram x. Tipični
primjeri su ovisnost krvnog tlaka Y od godišta x osobe ili, kao kako ćemo to sada nazvati, regresija Y
spram x, regresija dobitka težine Y određenih životinja spram dnevnog obroka x, regresija provodljivosti
toplote Y mineralne vune spram specifične težine x mineralne vune itd.

2. U korelacionoj analizi obe su veličine slučajne varijable i zainteresirani smo za njihov međusobni
odnos. Primjeri su odnos/relacija (ili "korelacija") između habanja X i habanja Y prednjih guma
automobila, između razreda X i Y učenika matematike i fizike, odnosno između tvrdoće X čeličnih ploča u
sredini i njihove tvrdoće Y blizu rubova ploča itd.

2.9.1 Regresiona analiza

U regresionoj analizi, ovisnost Y spram x je ovisnost srednje vrijednosti  od Y spram x, tako da je


 = (x) funkcija u uobičajenom smislu. Kriva se naziva regresiona kriva Y spram x. U ovom poglavlju
raspravljamo o najjednostavnijem slučaju, to jest o ravnoj regresionoj liniji

  x   0  1x (1)

79
Potom mogli bismo htjeti grafički prikazati vrijednosti uzorka kao n-tačaka u xy-ravni, uklopiti se linearno
kroz njih i upotrijebiti ih kod procjene (x) za vrijednosti x koje nas zanimaju, kako bismo znali koje
vrijednosti Y možemo očekivati za vrijednosti x. Uklapanje te linije od oka ne bi bilo dobro jer bi bilo
subjektivno; tačnije, rezultati bi bili različiti kod različitih osoba, pogotovo ako su tačke razbacane.

Dakle, trebamo matematičku metodu koja daje jedinstveni rezultat koji ovisi samo od n-tačaka. Najviše
korišten postupak je metoda najmanjih kvadrata Gaussa i Legendrea koja se formuliše na sljedeći način.

Princip najmanjih kvadrata

Pravac treba biti postavljena kroz zadane tačke tako da je zbir kvadrata udaljenosti tih tačaka od pravca
minimalan, pri čemu se udaljenost mjeri u vertikalnom smjeru (y smjeru).

Da bismo dobili jedinstvenost pravca, trebamo dodatni uvjet. Da biste to vidjeli, uzmimo uzorak (0, 1),
(0, –1). Svi pravci y = k1x sa bilo kojim k1 zadovoljavat će prije navedeni princip. (Možete li to vidjeti?)

Sljedeća pretpostavka implicira jedinstvenost, što ćemo uskoro saznati.

Opća pretpostavka (A1)

X-vrijednosti x1, , xn u našem uzorku (x1, y1), (x2, y2), , (xn, yn) nisu sve jednake.

Iz datog uzorka (x1, y1), (x2, y2), , (xn, yn) sada ćemo odrediti pravac putem najmanjih kvadrata. Pravac
zapišemo kao

y  k0  k1x (2)

i nazovimo ga regresionim pravcem uzorka, jer će on biti paritet regresionom pravcu populacije (1).

Sada je vertikalna udaljenost tačke (xj, yj) uzorka (udaljenost mjerenu u y smjeru) od pravca (2) data sa

y j   k0  k1x j  (vidi Sliku 2.14.)

Slika 2.14 Vertikalna udaljenost tačke (xj, yj) od pravca y = k0 + k1x

Slijedi da je zbir kvadrata ovih udaljenosti

q    y j  k0  k1x j 
n
2
(3)
j 1

U metodi najmanjih kvadrata moramo odrediti k0 i k1 takve da je q minimalno. Iz analize znamo da je za


to nužan sljedeći uvjet

80
q q
0 i 0 (4)
k0 k1

Vidjet ćemo da se iz ovih uvjeta dobije formula za regresioni pravac uzorka

y  y  k1  x  x  (5)

Ovdje x̄ i ȳ jesu srednje vrijednosti od x i y vrijednosti u uzorku, tj.

1
x  x1  ...  xn  (6a)
n
1
y  y1  ...  y n  (6b)
n

Nagib k1 u (5) naziva se koeficijentom regresije uzorka i dat je sa

s xy
k1  (7)
s x2

Ovdje je sxy "kovarijansa uzorka" i data je sa

1 n 1 n  n 
sxy 
1 n

n  1 j 1
 x j  x  y j  y    j j
n  1  j 1
x y    j    x j 
x
n  i  j   j 1  
(8)

dok je sx2 dato sa

1  n 2 1 n  
2

  x j  x   n  1 
1 n
xj   xj  
2
s 
2
 (9a)
n  1 j 1
x
n  ij  
 j 1

Iz (5) vidimo da regresioni pravac uzorka prolazi kroz tačku (x̄, ȳ) kojom je zajedno s regresionim
koeficijentom (7) određen. sx2 možemo nazvati varijansom x-vrijednosti, ali treba imati na umu da je x
obična varijabla, a ne slučajna varijabla.

Uskoro ćemo također trebati

1  n 2 1 n  
2

  j  n  1 
1 n
 j  
2
sy2  y  y   y  y (9b)
n  1 j 1
j
n  ij  
 j 1

Izvođenje (5) i (7). Diferenciranjem (3) i pomoću (4), prvo dobijemo

q q
 2  y j  k0  k1x j   0  2 x j  y j  k0  k1x j   0
n n
i
k0 j 1 k1 j 1

gdje sumiramo preko j od 1 do n. Sada podijelimo sa 2, svaku od dviju suma napišimo kao tri sume, a
zatim prebacimo sume koje sadrže yj i xjyj na desnu stranu. Tako se dobiju "normalne jednačine"

81
k0 n  k1  x j   y j
(10)
k0  x j  k1  x   x j y j
2
j

Ovo je linearni sistem dviju jednačina sa dvije nepoznate k0 i k1. Determinanta njenih koeficijenta [vidi
(9)] je

n x
 n  x 2j    x j   n  n  1 sx2  n   x j  x 
j 2 2

x j x 2
j

i nije nula zbog pretpostavke (A1). Stoga sistem ima jedinstveno rješenje. Dijeleći prvu jednačinu (10) sa
n i pomoću (6), dobije se k0 = ȳ – k1x̄. Zajedno sa y = k0 + k1x iz (2) dobije se (5). Da bismo dobili (7),
rješavamo sistem (10) Cramerovim pravilom (Sek.7.6) ili eliminacijom, kada dobijemo

n x j y j   x j  y j
k1  (11)
n  n  1 s x2

Ovo daje (7) do (9) čime se okončava izvođenje.

PRIMJER 1: Regresioni pravac

Izmjeren je pad volumena y [%] kože za određene fiksne vrijednosti visokog pritiska x [u atmosferama].
Rezultati su prikazani u prve dvije kolone Tabele 2.11. Pronađite regresioni pravac y od x.

Tabela 2.11 Regresija smanjenja volumena y [%] kože pod pritiskom x [Atmosfere]

Zadane vrijednosti Pomoćne vrijednosti


xj yj xj2 xjyj
4.000 2,3 16.000.000 9.200
6.000 4,1 36.000.000 24.600
8.000 5,7 64.000.000 45.600
10.000 6,9 100.000.000 69.000
28.000 19,0 216.000.000 148.400

Rješenje: Vidimo da je n = 4 te odredimo vrijednosti x̄ = 28.000/4 = 7.000, ȳ = 19,0/4 = 4,75 i iz (8) i (9)

1 28.000  19  15.400
sxy  148.400    3
3 4

1 28.000 2  20.000.000
sx2  216.000.000  
3 4  3

Otud i iz (7) k1 = 15.400/20.000.000 = 0,00077, a regresioni pravac je

y  4,75  0,00077  x  7.000 ili y  0,00077x  0,64

Primijetite da je y(0) = –0,64, što fizički nema smisla, ali ovo tipično pokazuje da je linearna veza samo
aproksimacija koja vrijedi na nekom ograničenom intervalu.

82
2.9.2 Intervali povjerenja u regresionoj analizi

Ako želimo dobiti intervale povjerenja, moramo pretpostaviti raspodjelu Y (koje nismo dosad donijeli, a
najmanje kvadrati su "geometrijski princip" i nigdje ne uključuju vjerovatnoću!). Pretpostavljamo
normalnost i neovisnost u uzorkovanju:

Pretpostavka (A2)

Za svako fiksno x slučajna varijabla Y je normalna sa srednjom vrijednosti (1), tj.

  x   0  1x (12)

i varijansom  2 neovisnom od x.

Pretpostavka (A3)

n provođenja eksperimenta kojim dobijamo uzorak (x1, y1), (x2, y2), , (xn, yn) su neovisni.

1 u (12) naziva se koeficijent regresije populacije, jer se može pokazati da je, pod pretpostavkama (A1)
do (A3), procjena maksimalne vjerovatnoće za 1 upravo koeficijent regresije uzorka k1 dat u (11).

Pod pretpostavkama (A1) - (A3), sada možemo dobiti interval povjerenja, koracima iz Tabele 2.12.

Tabela 2.12 Određivanje intervala povjerenje za 1 u (1) pod pretpostavkama (A1) do (A3)

Korak 1. Odaberite nivo povjerenja  (95%, 99% ili slično).

Korak 2. Odredite c preko jednačine

1
F c   1    (13)
2
iz tabele t-raspodjele sa n – 2 stepeni slobode (Tabela D5 u Dodatku 1, ili koristiti compjutersku
aplikaciju; n = veličina uzorka).

Korak 3. Korištenjem uzorka (x1, y1), , (xn, yn) izračunaj (n – 1)sx2 iz (9a), (n – 1)sxy iz (8), k1 iz (7),

2
n
1 n 
 
n  1 s  
2
y
j 1
y  yj 
2
j
n  j 1 
(14)

kao u (9b) i


q0   n  1 sy2  k12sx2  (15)

Korak 4. Izračunaj

q0
K c , a interval povjerenja je
 n  1 n  2 sx2

CONF k1  K  1  k1  K  (16)

83
PRIMJER 2: Interval povjerenja za koeficijent regresije

Koristeći uzorak u Tabeli 2.11, odredite interval povjerenja metodom u Tabeli 2.12.

Rješenje:

Korak 1. Odabrali smo  = 0,95.

Korak 2. Jednačina (13) poprima oblik F(c) = 0,975 i Tabela D5 u Dodatku 1 sa (n – 2) = 2 stepeni slobode
daju c = 4,30.

Korak 3. Iz Primjera 1 imamo 3sx2 = 20.000.000 i k1 = 0,00077. Iz Tabele 2.11 izračunamo

192
3sy2  102,0   11,85 i q0  11,95  20.000.000  0,00077 2  0,092
4

Korak 4. Tako dobijemo

0,092
K  4,30  0,000206
2  20.000.000

a interval povjerenja je

CONF0,95 0,00056  1  0,00098

2.9.3 Korelaciona analiza

Sad ćemo navesti osnovne činjenice korelacione analize, a dokaze treba potražiti u odgovarajućoj
literaturi.

Korelaciona analiza odnosi se na vezu X i Y u dvodimenzionalnoj slučajnoj varijabli (X, Y) (Dio 1.9). Uzorak
se sastoji od n parova vrijednosti (x1, y1), , (xn, yn) kao i prije. Međusobna povezanost vrijednosti x i y u
uzorku mjeri se kovarijansom uzorka sxy iz (8) ili koeficijentom korelacije uzorka

sxy
r (17)
s x sy

sa sx i sy iz (9). r ima prednost da se ne mijenja usljed množenja vrijednosti x i y nekim faktorom (npr.
promjenom centimetara u milimetre, itd.).

TEOREMA 1: Koeficijent korelacije uzorka

Koeficijent korelacije uzorka r zadovoljava nejednačinu –1  r  1. Posebno, r = 1 ako i samo ako


vrijednosti uzorka leže na pravcu. (Vidi Sliku 2.15)

Teoretska protuteža r je koeficijent korelacije  od X i Y,

 XY
 (18)
 XY

84
gdje su X = E(X), Y = E(Y), X2 = E([X – X]2) i y2 = E([Y – Y]2) (srednje vrijednosti i varijanse marginalnih
raspodjela od X i Y, vidi Dio 1.9), i xy kovarijansa od X i Y data sa (vidi Dio 1.9)

 XY  E  X   X Y  Y   E  XY   E  X  E Y  (19)

Slika 2.15 Uzorci raznih vrijednosti koeficijenta korelacije r


Analogna Teoremi 1 je

TEOREMA 2: Koeficijent korelacije

Koeficijent korelacije  zadovoljava nejednačinu –1    1. Posebno,  = 1 ako i samo ako su X i Y u


linearnoj vezi tj.: Y =  X +  i X = *Y + *.

X i Y se nazivaju nekorelirani (da nemaju korelaciju) ako je  = 0.

TEOREMA 3: Neovisnost. Normalna raspodjela

(a) Neovisni X i Y (vidi Dio 2.9) su u nekorelirani.

(b) Ako je (X, Y) normalno (vidi dolje), tada su nekorelirani X i Y neovisni.

Ovdje se može uvesti dvodimenzionalna normalna raspodjela putem dvije nezavisne standardizirane
normalne slučajne varijable X* i Y* čija zajednička raspodjela ima gustoću

x* 2
 y *2 
f 
x ,y 
 

1 
2
e 2 (20)

(koja predstavlja rotacionu površinu iznad x*y* ravni sa zvonastom krivuljom u poprečnom presjeku) i
postavkama

X  X   X X 
Y  Y   Y X   1   2  Y Y 

85
Ovo daje opću dvodimenzionalnu normalnu raspodjelu gustoće

h  x ,y 
1 
f  x, y   e 2
(21a)
2 X  Y 1   2

gdje je

1  x    2  x   X   y  Y   y  Y  
2

h  x, y    X
  2      (21b)
1  2   X    X   Y    Y  

U Teoremi 3b važna je normalnost što se može vidjeti iz sljedećeg primjera.

PRIMJER 3: Slučajne varijable koje nisu u korelaciji, ali su međusobno ovisne

Ako X poprimi vrijednosti –1, 0, 1 sa vjerovatnoćom 1/3, i Y = X2 onda je E(X) = 0 i iz (19)

 XY  E  XY   E  X 3    1 
3 1 1 1
 03   13   0
3 3 3

pa pošto je  = 0 iz (18) X i Y nisu u korelaciji. Međutim, ove varijable sigurno nisu neovisne jer su
funkcionalno povezane.

2.9.4 Testiranje koeficijenta korelacije 

Tabela 2.13 prikazuje test za  u slučaju dvodimenzionalne normalne raspodjele. t je uočena vrijednost
slučajne varijable koja ima t-raspodjelu sa n – 2 stepeni slobode. Dokaz za ovo se može naći u
odgovarajućoj literaturi.

Tabela 2.13 Test hipoteze  = 0 spram alternative  > 0 u slučaju dvodimenzionalne normalne raspodjele

Korak 1. Odaberite nivo povjerenja  (5%, 1% ili slično).

Korak 2. Odredite c preko jednačine

P T  c   1  

iz tabele t-raspodjele sa n – 2 stepeni slobode (Tabela D5 u Dodatku 1, ili koristiti compjutersku


aplikaciju; n = veličina uzorka).

Korak 3. Izračunaj r iz (17) korištenjem uzorka (x1, y1), , (xn, yn).

Korak 4. Izračunaj

n2
t r
1 r 2

Ako t  c prihvati hipotezu. Međutim, ako je t > c odbaci je.

86
PRIMJER 4: Test za koefocijent korelacije 

Testiraj hipotezu  = 0 (X i Y su neovisni shodno Teoremi 3) spram alternative  > 0, koristeći podatke u
donjem lijevom uglu Slike 2.15, gdje je r = 0,6 (greške pri ručnom lemljenju na 10 dvostranih strujnih
pločica urađenih od strane 10 radnika, x = prednja strana pločice, y = stražnja strana pločice).

Rješenje: Odaberimo  = 5%, onda je 1 –  = 95%. Pošto je n = 10, n – 2= 8 Tabela D5 daje c = 1,86.
Također t = 0,6(8/0,64) = 2,12 > c. Odbacujemo hipotezu i tvrdimo da postoji pozitivna korelacija.
Radnici koji čine dosta grešaka na prednjoj strani pločice imaju tendenciju činjenja dosta grešaka na
stražnjoj strani pločice.

87
88
DODATAK 1

Tabela D1 Binomna raspodjela


Funkcija vjerovatnoće ƒ(x) [vidi (2) Dio 1.7] i funkcija raspodjele F(x)

p = 0,1 p = 0,2 p = 0,3 p = 0,4 p = 0,5


n x ƒ(x) F(x) ƒ(x) F(x) ƒ(x) F(x) ƒ(x) F(x) ƒ(x) F(x)

0, 0, 0, 0, 0,
1 0 9000 0,9000 8000 0,8000 7000 0,7000 6000 0,6000 5000 0,5000
1 1000 1,0000 2000 1,0000 3000 1,0000 4000 1,0000 5000 1,0000

0 8100 0,8100 6400 0,6400 4900 0,4900 3600 0,3600 2500 0,2500
2 1 1800 0,9900 3200 0,9600 4200 0,9100 4800 0,8400 5000 0,7500
2 0100 1,0000 0400 1,0000 0900 1,0000 1600 1,0000 2500 1,0000

0 7290 0,7290 5120 0,5120 3430 0,3430 2160 0,2160 1250 0,1250
1 2430 0,9720 3840 0,8960 4410 0,7840 4320 0,6480 3750 0,5000
3
2 0270 0,9990 0960 0,9920 1890 0,9730 2880 0,9360 3750 0,8750
3 0010 1,0000 0080 1,0000 0270 1,0000 0640 1,0000 1250 1,0000

0 6561 0,6561 4096 0,4096 2401 0,2401 1296 0,1296 0625 0,0625
1 2916 0,9477 4096 0,8192 4116 0,6517 3456 0,4752 2500 0,3125
4 2 0486 0,9963 1536 0,9728 2646 0,9163 3456 0,8208 3750 0,6875
3 0036 0,9999 0256 0,9984 0756 0,9919 1536 0,9744 2500 0,9375
4 0001 1,0000 0016 1,0000 0081 1,0000 0256 1,0000 0625 1,0000

0 5905 0,5905 3277 0,3277 1681 0,1681 0778 0,0778 0313 0,0313
1 3281 0,9185 4096 0,7373 3602 0,5282 2592 0,3370 1563 0,1875
2 0729 0,9914 2048 0,9421 3087 0,8369 3456 0,6826 3125 0,5000
5
3 0081 0,9995 0512 0,9933 1323 0,9692 2304 0,9130 3125 0,8125
4 0005 1,0000 0064 0,9997 0284 0,9976 0768 0,9898 1563 0,9688
5 0000 1,0000 0003 1,0000 0024 1,0000 0102 1,0000 0313 1,0000

0 5314 0,5314 2621 0,2621 1176 0,1176 0467 0,0467 0156 0,0156
1 3543 0,8857 3932 0,6554 3025 0,4202 1866 0,2333 0938 0,1094
2 0984 0,9841 2458 0,9011 3241 0,7443 3110 0,5443 2344 0,3438
6 3 0146 0,9987 0819 0,9830 1852 0,9295 2765 0,8208 3125 0,6563
4 0012 0,9999 0154 0,9984 0595 0,9891 1382 0,9590 2344 0,8906
5 0001 1,0000 0015 0,9999 0102 0,9993 0369 0,9959 0938 0,9844
6 0000 1,0000 0001 1,0000 0007 1,0000 0041 1,0000 0156 1,0000

0 4783 0,4783 2097 0,2097 0824 0,0824 0280 0,0280 0078 0,0078
1 3720 0,8503 3670 0,5767 2471 0,3294 1306 0,1586 0547 0,0625
2 1240 0,9743 2753 0,8520 3177 0,6471 2613 0,4199 1641 0,2266
3 0230 0,9973 1147 0,9667 2269 0,8740 2903 0,7102 2734 0,5000
7
4 0026 0,9998 0287 0,9953 0972 0,9712 1935 0,9037 2734 0,7734
5 0002 1,0000 0043 0,9996 0250 0,9962 0774 0,9812 1641 0,9375
6 0000 1,0000 0004 1,0000 0036 0,9998 0172 0,9984 0547 0,9922
7 0000 1,0000 0000 1,0000 0002 1,0000 0016 1,0000 0078 1,0000

0 4305 0,4305 1678 0,1678 0576 0,0576 0168 0,0168 0039 0,0039
1 3826 0,8131 3355 0,5033 1977 0,2553 0896 0,1064 0313 0,0352
2 1488 0,9619 2936 0,7969 2965 0,5518 2090 0,3154 1094 0,1445
3 0331 0,9950 1468 0,9437 2541 0,8059 2787 0,5941 2188 0,3633
8 4 0046 0,9996 0459 0,9896 1361 0,9420 2322 0,8263 2734 0,6367
5 0004 1,0000 0092 0,9988 0467 0,9887 1239 0,9502 2188 0,8555
6 0000 1,0000 0011 0,9999 0100 0,9987 0413 0,9915 1094 0,9648
7 0000 1,0000 0001 1,0000 0012 0,9999 0079 0,9993 0313 0,9961
8 0000 1,0000 0000 1,0000 0001 1,0000 0007 1,0000 0039 1,0000

89
Tabela D2 Poissonova raspodjela
Funkcija vjerovatnoće ƒ(x) [vidi (5) Dio 1.7] i funkcija raspodjele F(x)

µ = 0,1 µ = 0,2 µ = 0,3 µ = 0,4 µ = 0,5


x ƒ(x) F(x) ƒ(x) F(x) ƒ(x) F(x) ƒ(x) F(x) ƒ(x) F(x)

0, 0, 0, 0, 0,
0 9048 0,9048 8187 0,8187 7408 0,7408 6703 0,6703 6065 0,6065

1 0905 0,9953 1637 0,9825 2222 0,9631 2681 0,9384 3033 0,9098
2 0045 0,9998 0164 0,9989 0333 0,9964 0536 0,9921 0758 0,9856
3 0002 1,0000 0011 0,9999 0033 0,9997 0072 0,9992 0126 0,9982
4 0000 1,0000 0001 1,0000 0003 1,0000 0007 0,9999 0016 0,9998
5 0001 1,0000 0002 1,0000

µ = 0,6 µ = 0,7 µ = 0,8 µ = 0,9 µ=1


x ƒ(x) F(x) ƒ(x) F(x) ƒ(x) F(x) ƒ(x) F(x) ƒ(x) F(x)

0, 0, 0, 0, 0,
0 5488 0,5488 4966 0,4966 4493 0,4493 4066 0,4066 3679 0,3679

1 3293 0,8781 3476 0,8442 3595 0,8088 3659 0,7725 3679 0,7358
2 0988 0,9769 1217 0,9659 1438 0,9526 1647 0,9371 1839 0,9197
3 0198 0,9966 0284 0,9942 0383 0,9909 0494 0,9865 0613 0,9810
4 0030 0,9996 0050 0,9992 0077 0,9986 0111 0,9977 0153 0,9963
5 0004 1,0000 0007 0,9999 0012 0,9998 0020 0,9997 0031 0,9994

6 0001 1,0000 0002 1,0000 0003 1,0000 0005 0,9999


7 0001 1,0000

µ = 1,5 µ=2 µ=3 µ=4 µ=5


x ƒ(x) F(x) ƒ(x) F(x) ƒ(x) F(x) ƒ(x) F(x) ƒ(x) F(x)

0, 0, 0, 0, 0,
0 2231 0,2231 1353 0,1353 0498 0,0498 0183 0,0183 0067 0,0067

1 3347 0,5578 2707 0,4060 1494 0,1991 0733 0,0916 0337 0,0404
2 2510 0,8088 2707 0,6767 2240 0,4232 1465 0,2381 0842 0,1247
3 1255 0,9344 1804 0,8571 2240 0,6472 1954 0,4335 1404 0,2650
4 0471 0,9814 0902 0,9473 1680 0,8153 1954 0,6288 1755 0,4405
5 0141 0,9955 0361 0,9834 1008 0,9161 1563 0,7851 1755 0,6160

6 0035 0,9991 0120 0,9955 0504 0,9665 1042 0,8893 1462 0,7622
7 0008 0,9998 0034 0,9989 0216 0,9881 0595 0,9489 1044 0,8666
8 0001 1,0000 0009 0,9998 0081 0,9962 0298 0,9786 0653 0,9319
9 0002 1,0000 0027 0,9989 0132 0,9919 0363 0,9682
10 0008 0,9997 0053 0,9972 0181 0,9863

11 0002 0,9999 0019 0,9991 0082 0,9945


12 0001 1,0000 0006 0,9997 0034 0,9980
13 0002 0,9999 0013 0,9993
14 0001 1,0000 0005 0,9998
15 0002 0,9999

16 0000 1,0000

90
Tabela D3 Normalna raspodjela
Vrijednosti funkcije raspodjele (z) [vidi (3), Dio 1.8], (–z) = 1 – (z)

z (z) z (z) z (z) z (z) z (z) z (z)

0, 0, 0, 0, 0, 0,
0,01 5040 0,51 6950 1,01 8438 1,51 9345 2,01 9778 2,51 9940
0,02 5080 0,52 6985 1,02 8461 1,52 9357 2,02 9783 2,52 9941
0,03 5120 0,53 7019 1,03 8485 1,53 9370 2,03 9788 2,53 9943
0,04 5160 0,54 7054 1,04 8508 1,54 9382 2,04 9793 2,54 9945
0,05 5199 0,55 7088 1,05 8531 1,55 9394 2,05 9798 2,55 9946
0,06 5239 0,56 7123 1,06 8554 1,56 9406 2,06 9803 2,56 9948
0,07 5279 0,57 7157 1,07 8577 1,57 9418 2,07 9808 2,57 9949
0,08 5319 0,58 7190 1,08 8599 1,58 9429 2,08 9812 2,58 9951
0,09 5359 0,59 7224 1,09 8621 1,59 9441 2,09 9817 2,59 9952
0,10 5398 0,60 7257 1,10 8643 1,60 9452 2,10 9821 2,60 9953
0,11 5438 0,61 7291 1,11 8665 1,61 9463 2,11 9826 2,61 9955
0,12 5478 0,62 7324 1,12 8686 1,62 9474 2,12 9830 2,62 9956
0,13 5517 0,63 7357 1,13 8708 1,63 9484 2,13 9834 2,63 9957
0,14 5557 0,64 7389 1,14 8729 1,64 9495 2,14 9838 2,64 9959
0,15 5596 0,65 7422 1,15 8749 1,65 9505 2,15 9842 2,65 9960
0,16 5636 0,66 7454 1,16 8770 1,66 9515 2,16 9846 2,66 9961
0,17 5675 0,67 7486 1,17 8790 1,67 9525 2,17 9850 2,67 9962
0,18 5714 0,68 7517 1,18 8810 1,68 9535 2,18 9854 2,68 9963
0,19 5753 0,69 7549 1,19 8830 1,69 9545 2,19 9857 2,69 9964
0,20 5793 0,70 7580 1,20 8849 1,70 9554 2,20 9861 2,70 9965
0,21 5832 0,71 7611 1,21 8869 1,71 9564 2,21 9864 2,71 9966
0,22 5871 0,72 7642 1,22 8888 1,72 9573 2,22 9868 2,72 9967
0,23 5910 0,73 7673 1,23 8907 1,73 9582 2,23 9871 2,73 9968
0,24 5948 0,74 7704 1,24 8925 1,74 9591 2,24 9875 2,74 9969
0,25 5987 0,75 7734 1,25 8944 1,75 9599 2,25 9878 2,75 9970
0,26 6026 0,76 7764 1,26 8962 1,76 9608 2,26 9881 2,76 9971
0,27 6064 0,77 7794 1,27 8980 1,77 9616 2,27 9884 2,77 9972
0,28 6103 0,78 7823 1,28 8997 1,78 9625 2,28 9887 2,78 9973
0,29 6141 0,79 7852 1,29 9015 1,79 9633 2,29 9890 2,79 9974
0,30 6179 0,80 7881 1,30 9032 1,80 9641 2,30 9893 2,80 9974
0,31 6217 0,81 7910 1,31 9049 1,81 9649 2,31 9896 2,81 9975
0,32 6255 0,82 7939 1,32 9066 1,82 9656 2,32 9898 2,82 9976
0,33 6293 0,83 7967 1,33 9082 1,83 9664 2,33 9901 2,83 9977
0,34 6331 0,84 7995 1,34 9099 1,84 9671 2,34 9904 2,84 9977
0,35 6368 0,85 8023 1,35 9115 1,85 9678 2,35 9906 2,85 9978
0,36 6406 0,86 8051 1,36 9131 1,86 9686 2,36 9909 2,86 9979
0,37 6443 0,87 8078 1,37 9147 1,87 9693 2,37 9911 2,87 9979
0,38 6480 0,88 8106 1,38 9162 1,88 9699 2,38 9913 2,88 9980
0,39 6517 0,89 8133 1,39 9177 1,89 9706 2,39 9916 2,89 9981
0,40 6554 0,90 8159 1,40 9192 1,90 9713 2,40 9918 2,90 9981
0,41 6591 0,91 8186 1,41 9207 1,91 9719 2,41 9920 2,91 9982
0,42 6628 0,92 8212 1,42 9222 1,92 9726 2,42 9922 2,92 9982
0,43 6664 0,93 8238 1,43 9236 1,93 9732 2,43 9925 2,93 9983
0,44 6700 0,94 8264 1,44 9251 1,94 9738 2,44 9927 2,94 9984
0,45 6736 0,95 8289 1,45 9265 1,95 9744 2,45 9929 2,95 9984
0,46 6772 0,96 8315 1,46 9279 1,96 9750 2,46 9931 2,96 9985
0,47 6808 0,97 8340 1,47 9292 1,97 9756 2,47 9932 2,97 9985
0,48 6844 0,98 8365 1,48 9306 1,98 9761 2,48 9934 2,98 9986
0,49 6879 0,99 8389 1,49 9319 1,99 9767 2,49 9936 2,99 9986
0,50 6915 1,00 8413 1,50 9332 2,00 9772 2,50 9938 3,00 9987

91
Tabela D4 Normalna raspodjela
Vrijednosti z za date vrijednosti (z) [vidi (3), Dio 1,8] i D(z) = (z) – (–z)
Primjer: z = 0,279 ako je (z) = 61%; z = 0,860 ako je D(z) = 61%

% z() z(D) % z() z(D) % z() z(D)


1 -2,326 0,013 41 -0,228 0,539 81 0,878 1,311
2 -2,054 0,025 42 -0,202 0,553 82 0,915 1,341
3 -1,881 0,038 43 -0,176 0,568 83 0,954 1,372
4 -1,751 0,050 44 -0,151 0,583 84 0,994 1,405
5 -1,645 0,063 45 -0,126 0,598 85 1,036 1,440

6 -1,555 0,075 46 -0,100 0,613 86 1,080 1,476


7 -1,476 0,088 47 -0,075 0,628 87 1,126 1,514
8 -1,405 0,100 48 -0,050 0,643 88 1,175 1,555
9 -1,341 0,113 49 -0,025 0,659 89 1,227 1,598
10 -1,282 0,126 50 0,000 0,674 90 1,282 1,645

11 -1,227 0,138 51 0,025 0,690 91 1,341 1,695


12 -1,175 0,151 52 0,050 0,706 92 1,405 1,751
13 -1,126 0,164 53 0,075 0,722 93 1,476 1,812
14 -1,080 0,176 54 0,100 0,739 94 1,555 1,881
15 -1,036 0,189 55 0,126 0,755 95 1,645 1,960

16 -0,994 0,202 56 0,151 0,772 96 1,751 2,054


17 -0,954 0,215 57 0,176 0,789 97 1,881 2,170
18 -0,915 0,228 58 0,202 0,806 97,5 1,960 2,241
19 -0,878 0,240 59 0,228 0,824 98 2,054 2,326
20 -0,842 0,253 60 0,253 0,842 99 2,326 2,576

21 -0,806 0,266 61 0,279 0,860 99,1 2,366 2,612


22 -0,772 0,279 62 0,305 0,878 99,2 2,409 2,652
23 -0,739 0,292 63 0,332 0,896 99,3 2,457 2,697
24 -0,706 0,305 64 0,358 0,915 99,4 2,512 2,748
25 -0,674 0,319 65 0,385 0,935 99,5 2,576 2,807

26 -0,643 0,332 66 0,412 0,954 99,6 2,652 2,878


27 -0,613 0,345 67 0,440 0,974 99,7 2,748 2,968
28 -0,583 0,358 68 0,468 0,994 99,8 2,878 3,090
29 -0,553 0,372 69 0,496 1,015 99,9 3,090 3,291
30 -0,524 0,385 70 0,524 1,036

31 -0,496 0,399 71 0,553 1,058 99,91 3,121 3,320


32 -0,468 0,412 72 0,583 1,080 99,92 3,156 3,353
33 -0,440 0,426 73 0,613 1,103 99,93 3,195 3,390
34 -0,412 0,440 74 0,643 1,126 99,94 3,239 3,432
35 -0,385 0,454 75 0,674 1,150 99,95 3,291 3,481

36 -0,358 0,468 76 0,706 1,175 99,96 3,353 3,540


37 -0,332 0,482 77 0,739 1,200 99,97 3,432 3,615
38 -0,305 0,496 78 0,772 1,227 99,98 3,540 3,719
39 -0,279 0,510 79 0,806 1,254 99,99 3,719 3,891
40 -0,253 0,524 80 0,842 1,282

92
Tabela D5 t-raspodjela
Vrijednosti z za date vrijednosti funkcije raspodjele F(z) (vidi (8) u Dijelu 2.3)
Primjer: Za 9 stepeni slobode, z = 1,83 kad je F(z) = 0,95

Broj stepeni slobode


F(z)
1 2 3 4 5 6 7 8 9 10

0,5 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
0,6 0,32 0,29 0,28 0,27 0,27 0,26 0,26 0,26 0,26 0,26
0,7 0,73 0,62 0,58 0,57 0,56 0,55 0,55 0,55 0,54 0,54
0,8 1,38 1,06 0,98 0,94 0,92 0,91 0,90 0,89 0,88 0,88
0,9 3,08 1,89 1,64 1,53 1,48 1,44 1,41 1,40 1,38 1,37

0,95 6,31 2,92 2,35 2,13 2,02 1,94 1,89 1,86 1,83 1,81
0,975 12,7 4,30 3,18 2,78 2,57 2,45 2,36 2,31 2,26 2,23
0,99 31,8 6,96 4,54 3,75 3,36 3,14 3,00 2,90 2,82 2,76
0,995 63,7 9,92 5,84 4,60 4,03 3,71 3,50 3,36 3,25 3,17
0,999 318,3 22,3 10,2 7,17 5,89 5,21 4,79 4,50 4,30 4,14

Broj stepeni slobode


F(z)
11 12 13 14 15 16 17 18 19 20

0,5 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
0,6 0,26 0,26 0,26 0,26 0,26 0,26 0,26 0,26 0,26 0,26
0,7 0,54 0,54 0,54 0,54 0,54 0,54 0,53 0,53 0,53 0,53
0,8 0,88 0,87 0,87 0,87 0,87 0,86 0,86 0,86 0,86 0,86
0,9 1,36 1,36 1,35 1,35 1,34 1,34 1,33 1,33 1,33 1,33

0,95 1,80 1,78 1,77 1,76 1,75 1,75 1,74 1,73 1,73 1,72
0,975 2,20 2,18 2,16 2,14 2,13 2,12 2,11 2,10 2,09 2,09
0,99 2,72 2,68 2,65 2,62 2,60 2,58 2,57 2,55 2,54 2,53
0,995 3,11 3,05 3,01 2,98 2,95 2,92 2,90 2,88 2,86 2,85
0,999 4,02 3,93 3,85 3,79 3,73 3,69 3,65 3,61 3,58 3,55

Broj stepeni slobode


F(z)
22 24 26 28 30 40 50 100 200 
0,5 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
0,6 0,26 0,26 0,26 0,26 0,26 0,26 0,25 0,25 0,25 0,25
0,7 0,53 0,53 0,53 0,53 0,53 0,53 0,53 0,53 0,53 0,52
0,8 0,86 0,86 0,86 0,85 0,85 0,85 0,85 0,85 0,84 0,84
0,9 1,32 1,32 1,31 1,31 1,31 1,30 1,30 1,29 1,29 1,28

0,95 1,72 1,71 1,71 1,70 1,70 1,68 1,68 1,66 1,65 1,65
0,975 2,07 2,06 2,06 2,05 2,04 2,02 2,01 1,98 1,97 1,96
0,99 2,51 2,49 2,48 2,47 2,46 2,42 2,40 2,36 2,35 2,33
0,995 2,82 2,80 2,78 2,76 2,75 2,70 2,68 2,63 2,60 2,58
0,999 3,50 3,47 3,43 3,41 3,39 3,31 3,26 3,17 3,13 3,09

93
Tabela D6 Chi-kvadrat raspodjela
Vrijednosti x za date vrijednosti funkcije raspodjele F(z) (vidi Dio 2.3)
Primjer: Za 3 stepena slobode, z = 11,34 kad je F(z) = 0,99

Broj stepeni slobode


F(z)
1 2 3 4 5 6 7 8 9 10

0,005 0,00 0,01 0,07 0,21 0,41 0,68 0,99 1,34 1,73 2,16
0,01 0,00 0,02 0,11 0,30 0,55 0,87 1,24 1,65 2,09 2,56
0,025 0,00 0,05 0,22 0,48 0,83 1,24 1,69 2,18 2,70 3,25
0,05 0,00 0,10 0,35 0,71 1,15 1,64 2,17 2,73 3,33 3,94

0,95 3,84 5,99 7,81 9,49 11,07 12,59 14,07 15,51 16,92 18,31
0,975 5,02 7,38 9,35 11,14 12,83 14,45 16,01 17,53 19,02 20,48
0,99 6,63 9,21 11,34 13,28 15,09 16,81 18,48 20,09 21,67 23,21
0,995 7,88 10,60 12,84 14,86 16,75 18,55 20,28 21,95 23,59 25,19

Broj stepeni slobode


F(z)
11 12 13 14 15 16 17 18 19 20

0,005 2,60 3,07 3,57 4,07 4,60 5,14 5,70 6,26 6,84 7,43
0,01 3,05 3,57 4,11 4,66 5,23 5,81 6,41 7,01 7,63 8,26
0,025 3,82 4,40 5,01 5,63 6,26 6,91 7,56 8,23 8,91 9,59
0,05 4,57 5,23 5,89 6,57 7,26 7,96 8,67 9,39 10,12 10,85

0,95 19,68 21,03 22,36 23,68 25,00 26,30 27,59 28,87 30,14 31,41
0,975 21,92 23,34 24,74 26,12 27,49 28,85 30,19 31,53 32,85 34,17
0,99 24,72 26,22 27,69 29,14 30,58 32,00 33,41 34,81 36,19 37,57
0,995 26,76 28,30 29,82 31,32 32,80 34,27 35,72 37,16 38,58 40,00

Broj stepeni slobode


F(z)
21 22 23 24 25 26 27 28 29 30

0,005 8,0 8,6 9,3 9,9 10,5 11,2 11,8 12,5 13,1 13,8
0,01 8,9 9,5 10,2 10,9 11,5 12,2 12,9 13,6 14,3 15,0
0,025 10,3 11,0 11,7 12,4 13,1 13,8 14,6 15,3 16,0 16,8
0,05 11,6 12,3 13,1 13,8 14,6 15,4 16,2 16,9 17,7 18,5

0,95 32,7 33,9 35,2 36,4 37,7 38,9 40,1 41,3 42,6 43,8
0,975 35,5 36,8 38,1 39,4 40,6 41,9 43,2 44,5 45,7 47,0
0,99 38,9 40,3 41,6 43,0 44,3 45,6 47,0 48,3 49,6 50,9
0,995 41,4 42,8 44,2 45,6 46,9 48,3 49,6 51,0 52,3 53,7

Broj stepeni slobode


F(z)
40 50 60 70 80 90 100 > 100 (Aproksimacija)

0,005 20,7 28,0 35,5 43,3 51,2 59,2 67,3 (h - 2,58)2/2
0,01 22,2 29,7 37,5 45,4 53,5 61,8 70,1  (h - 2,33)2/2
0,025 24,4 32,4 40,5 48,8 57,2 65,6 74,2  (h - 1,96)2/2
0,05 26,5 34,8 43,2 51,7 60,4 69,1 77,9 (h - 1,64)2/2

0,95 55,8 67,5 79,1 90,5 101,9 113,1 124,3 (h + 1,64)2/2
0,975 59,3 71,4 83,3 95,0 106,6 118,1 129,6  (h + 1,96)2/2
0,99 63,7 76,2 88,4 100,4 112,3 124,1 135,8 (h + 2,33)2/2
0,995 66,8 79,5 92,0 104,2 116,3 128,3 140,2 (h + 2,58)2/2
U zadnjoj koloni, h = (2m – 1)1/2, gdje je m broj stepeni slobode,

94
Tabela D7 F-raspodjela sa (m, n) stepeni slobode
Vrijednosti z za koje funkcija raspodjele F(z) [vidi (13), Dio 2.4] ima vrijednost 0,95
Primjer: Za (7, 4) s.s., z = 6,09 ako je F(z) = 0,95

n m=1 m=2 m=3 m=4 m=5 m=6 m=7 m=8 m=9

1 161 200 216 225 230 234 237 239 241


2 18,5 19,0 19,2 19,2 19,3 19,3 19,4 19,4 19,4
3 10,1 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77

6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10


7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02

11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90


12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59

16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54


17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39

22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34


24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21

32 4,15 3,29 2,90 2,67 2,51 2,40 2,31 2,24 2,19


34 4,13 3,28 2,88 2,65 2,49 2,38 2,29 2,23 2,17
36 4,11 3,26 2,87 2,63 2,48 2,36 2,28 2,21 2,15
38 4,10 3,24 2,85 2,62 2,46 2,35 2,26 2,19 2,14
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12

50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07


60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04
70 3,98 3,13 2,74 2,50 2,35 2,23 2,14 2,07 2,02
80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 2,00
90 3,95 3,10 2,71 2,47 2,32 2,20 2,11 2,04 1,99

100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97
150 3,90 3,06 2,66 2,43 2,27 2,16 2,07 2,00 1,94
200 3,89 3,04 2,65 2,42 2,26 2,14 2,06 1,98 1,93
1000 3,85 3,00 2,61 2,38 2,22 2,11 2,02 1,95 1,89
 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88

95
Tabela D7 F-raspodjela sa (m, n) stepeni slobode
Vrijednosti z za koje funkcija raspodjele F(z) [vidi (13), Dio 2.4] ima vrijednost 0,95
n m = 10 m = 15 m = 20 m = 30 m = 40 m = 50 m = 100 

1 242 246 248 250 251 252 253 254


2 19,4 19,4 19,4 19,5 19,5 19,5 19,5 19,5
3 8,79 8,70 8,66 8,62 8,59 8,58 8,55 8,53
4 5,96 5,86 5,80 5,75 5,72 5,70 5,66 5,63
5 4,74 4,62 4,56 4,50 4,46 4,44 4,41 4,37

6 4,06 3,94 3,87 3,81 3,77 3,75 3,71 3,67


7 3,64 3,51 3,44 3,38 3,34 3,32 3,27 3,23
8 3,35 3,22 3,15 3,08 3,04 3,02 2,97 2,93
9 3,14 3,01 2,94 2,86 2,83 2,80 2,76 2,71
10 2,98 2,85 2,77 2,70 2,66 2,64 2,59 2,54

11 2,85 2,72 2,65 2,57 2,53 2,51 2,46 2,40


12 2,75 2,62 2,54 2,47 2,43 2,40 2,35 2,30
13 2,67 2,53 2,46 2,38 2,34 2,31 2,26 2,21
14 2,60 2,46 2,39 2,31 2,27 2,24 2,19 2,13
15 2,54 2,40 2,33 2,25 2,20 2,18 2,12 2,07

16 2,49 2,35 2,28 2,19 2,15 2,12 2,07 2,01


17 2,45 2,31 2,23 2,15 2,10 2,08 2,02 1,96
18 2,41 2,27 2,19 2,11 2,06 2,04 1,98 1,92
19 2,38 2,23 2,16 2,07 2,03 2,00 1,94 1,88
20 2,35 2,20 2,12 2,04 1,99 1,97 1,91 1,84

22 2,30 2,15 2,07 1,98 1,94 1,91 1,85 1,78


24 2,25 2,11 2,03 1,94 1,89 1,86 1,80 1,73
26 2,22 2,07 1,99 1,90 1,85 1,82 1,76 1,69
28 2,19 2,04 1,96 1,87 1,82 1,79 1,73 1,65
30 2,16 2,01 1,93 1,84 1,79 1,76 1,70 1,62

32 2,14 1,99 1,91 1,82 1,77 1,74 1,67 1,59


34 2,12 1,97 1,89 1,80 1,75 1,71 1,65 1,57
36 2,11 1,95 1,87 1,78 1,73 1,69 1,62 1,55
38 2,09 1,94 1,85 1,76 1,71 1,68 1,61 1,53
40 2,08 1,92 1,84 1,74 1,69 1,66 1,59 1,51

50 2,03 1,87 1,78 1,69 1,63 1,60 1,52 1,44


60 1,99 1,84 1,75 1,65 1,59 1,56 1,48 1,39
70 1,97 1,81 1,72 1,62 1,57 1,53 1,45 1,35
80 1,95 1,79 1,70 1,60 1,54 1,51 1,43 1,32
90 1,94 1,78 1,69 1,59 1,53 1,49 1,41 1,30

100 1,93 1,77 1,68 1,57 1,52 1,48 1,39 1,28


150 1,89 1,73 1,64 1,54 1,48 1,44 1,34 1,22
200 1,88 1,72 1,62 1,52 1,46 1,41 1,32 1,19
1000 1,84 1,68 1,58 1,47 1,41 1,36 1,26 1,08
 1,83 1,67 1,57 1,46 1,39 1,35 1,24 1,00

96
Tabela D7 F-raspodjela sa (m, n) stepeni slobode
Vrijednosti z za koje funkcija raspodjele F(z) [vidi (13), Dio 2.4] ima vrijednost 0,99
n m=1 m=2 m=3 m=4 m=5 m=6 m=7 m=8 m=9

1 4052 4999 5403 5625 5764 5859 5928 5981 6022


2 98,5 99,0 99,2 99,2 99,3 99,3 99,4 99,4 99,4
3 34,1 30,8 29,5 28,7 28,2 27,9 27,7 27,5 27,3
4 21,2 18,0 16,7 16,0 15,5 15,2 15,0 14,8 14,7
5 16,3 13,3 12,1 11,4 11,0 10,7 10,5 10,3 10,2

6 13,7 10,9 9,78 9,15 8,75 8,47 8,26 8,10 7,98


7 12,2 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72
8 11,3 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91
9 10,6 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35
10 10,0 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94

11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63


12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89

16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78


17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46

22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35


24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07

32 7,50 5,34 4,46 3,97 3,65 3,43 3,26 3,13 3,02


34 7,44 5,29 4,42 3,93 3,61 3,39 3,22 3,09 2,98
36 7,40 5,25 4,38 3,89 3,57 3,35 3,18 3,05 2,95
38 7,35 5,21 4,34 3,86 3,54 3,32 3,15 3,02 2,92
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89

50 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,78


60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72
70 7,01 4,92 4,07 3,60 3,29 3,07 2,91 2,78 2,67
80 6,96 4,88 4,04 3,56 3,26 3,04 2,87 2,74 2,64
90 6,93 4,85 4,01 3,54 3,23 3,01 2,84 2,72 2,61

100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59
150 6,81 4,75 3,91 3,45 3,14 2,92 2,76 2,63 2,53
200 6,76 4,71 3,88 3,41 3,11 2,89 2,73 2,60 2,50
1000 6,66 4,63 3,80 3,34 3,04 2,82 2,66 2,53 2,43
 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41

97
Tabela D7 F-raspodjela sa (m, n) stepeni slobode
Vrijednosti z za koje funkcija raspodjele F(z) [vidi (13), Dio 2.4] ima vrijednost 0,99
n m = 10 m = 15 m = 20 m = 30 m = 40 m = 50 m = 100 

1 6056 6157 6209 6261 6287 6303 6334 6366


2 99,4 99,4 99,4 99,5 99,5 99,5 99,5 99,5
3 27,2 26,9 26,7 26,5 26,4 26,4 26,2 26,1
4 14,5 14,2 14,0 13,8 13,7 13,7 13,6 13,5
5 10,1 9,72 9,55 9,38 9,29 9,24 9,13 9,02

6 7,87 7,56 7,40 7,23 7,14 7,09 6,99 6,88


7 6,62 6,31 6,16 5,99 5,91 5,86 5,75 5,65
8 5,81 5,52 5,36 5,20 5,12 5,07 4,96 4,86
9 5,26 4,96 4,81 4,65 4,57 4,52 4,42 4,31
10 4,85 4,56 4,41 4,25 4,17 4,12 4,01 3,91

11 4,54 4,25 4,10 3,94 3,86 3,81 3,71 3,60


12 4,30 4,01 3,86 3,70 3,62 3,57 3,47 3,36
13 4,10 3,82 3,66 3,51 3,43 3,38 3,27 3,17
14 3,94 3,66 3,51 3,35 3,27 3,22 3,11 3,00
15 3,80 3,52 3,37 3,21 3,13 3,08 2,98 2,87

16 3,69 3,41 3,26 3,10 3,02 2,97 2,86 2,75


17 3,59 3,31 3,16 3,00 2,92 2,87 2,76 2,65
18 3,51 3,23 3,08 2,92 2,84 2,78 2,68 2,57
19 3,43 3,15 3,00 2,84 2,76 2,71 2,60 2,49
20 3,37 3,09 2,94 2,78 2,69 2,64 2,54 2,42

22 3,26 2,98 2,83 2,67 2,58 2,53 2,42 2,31


24 3,17 2,89 2,74 2,58 2,49 2,44 2,33 2,21
26 3,09 2,81 2,66 2,50 2,42 2,36 2,25 2,13
28 3,03 2,75 2,60 2,44 2,35 2,30 2,19 2,06
30 2,98 2,70 2,55 2,39 2,30 2,25 2,13 2,01

32 2,93 2,65 2,50 2,34 2,25 2,20 2,08 1,96


34 2,89 2,61 2,46 2,30 2,21 2,16 2,04 1,91
36 2,86 2,58 2,43 2,26 2,18 2,12 2,00 1,87
38 2,83 2,55 2,40 2,23 2,14 2,09 1,97 1,84
40 2,80 2,52 2,37 2,20 2,11 2,06 1,94 1,80

50 2,70 2,42 2,27 2,10 2,01 1,95 1,82 1,68


60 2,63 2,35 2,20 2,03 1,94 1,88 1,75 1,60
70 2,59 2,31 2,15 1,98 1,89 1,83 1,70 1,54
80 2,55 2,27 2,12 1,94 1,85 1,79 1,65 1,49
90 2,52 2,24 2,09 1,92 1,82 1,76 1,62 1,46

100 2,50 2,22 2,07 1,89 1,80 1,74 1,60 1,43


150 2,44 2,16 2,00 1,83 1,73 1,66 1,52 1,33
200 2,41 2,13 1,97 1,79 1,69 1,63 1,48 1,28
1000 2,34 2,06 1,90 1,72 1,61 1,54 1,38 1,11
 2,32 2,04 1,88 1,70 1,59 1,52 1,36 1,00

98
Tabela D8 Funkcija raspodjele F(x) = P(T  x) slučajne varijable T u Dijelu 2.8

n n n n n n n n n
x =3 x x x x x x x x
0, 0. 0. 0. 0. 0. 0. 0. 0.
0 167 0 042 0 008 0 001 1 001 2 001 4 001 6 001 8 001
1 500 1 167 1 042 1 008 2 005 3 003 5 003 7 002 9 002
2 375 2 117 2 028 3 015 4 007 6 006 8 005 10 003
3 242 3 068 4 035 5 016 7 012 9 008 11 005
n 4 408 4 136 5 068 6 031 8 022 10 014 12 008
x =20 5 235 6 119 7 054 9 038 11 023 13 013
6 360 7 191 8 089 10 060 12 036 14 020
n
0, 7 500 8 281 9 138 11 090 13 054 15 030
x
50 001 9 386 10 199 12 130 14 078 16 043
51 002 0. 10 500 11 274 13 179 15 108 17 060
52 002 43 001 12 360 14 238 16 146 18 082
n
53 003 44 002 13 452 15 306 17 190 19 109
x
54 004 45 002 16 381 18 242 20 141
55 005 46 003 0. 17 460 19 300 21 179
n 20 364 22 223
56 006 47 003 38 001 x 21 431 23 271
57 007 48 004 39 002
58 008 49 005 40 003 0. 22 500 24 324
n 25 381
59 010 50 006 41 003 32 001 x 26 440
60 012 51 008 42 004 33 002
61 014 52 010 43 005 34 002 0. 27 500
n
62 017 53 012 44 007 35 003 27 001 x
63 020 54 014 45 009 36 004 28 002 n
64 023 55 017 46 011 37 005 29 002 0. x
65 027 56 021 47 013 38 007 30 003 23 001
66 032 57 025 48 016 39 009 31 004 24 002 0. n
67 037 58 029 49 020 40 011 32 006 25 003 18 001 x
68 043 59 034 50 024 41 014 33 008 26 004 19 002
69 049 60 040 51 029 42 017 34 010 27 006 20 002 0. n
70 056 61 047 52 034 43 021 35 013 28 008 21 003 14 001 x
71 064 62 054 53 041 44 026 36 016 29 010 22 005 15 001
72 073 63 062 54 048 45 032 37 021 30 014 23 007 16 002 0.
73 082 64 072 55 056 46 038 38 026 31 018 24 010 17 003 11 001
74 093 65 082 56 066 47 046 39 032 32 023 25 013 18 005 12 002
75 104 66 093 57 076 48 054 40 039 33 029 26 018 19 007 13 003
76 117 67 105 58 088 49 064 41 048 34 037 27 024 20 011 14 004
77 130 68 119 59 100 50 076 42 058 35 046 28 031 21 015 15 007
78 144 69 133 60 115 51 088 43 070 36 057 29 040 22 021 16 010
79 159 70 149 61 130 52 102 44 083 37 070 30 051 23 029 17 016
80 176 71 166 62 147 53 118 45 097 38 084 31 063 24 038 18 022
81 193 72 184 63 165 54 135 46 114 39 101 32 079 25 050 19 031
82 211 73 203 64 184 55 154 47 133 40 120 33 096 26 064 20 043
83 230 74 223 65 205 56 174 48 153 41 141 34 117 27 082 21 058
84 250 75 245 66 227 57 196 49 175 42 164 35 140 28 102 22 076
85 271 76 267 67 250 58 220 50 199 43 190 36 165 29 126 23 098
86 293 77 290 68 275 59 245 51 225 44 218 37 194 30 153 24 125
87 315 78 314 69 300 60 271 52 253 45 248 38 225 31 184 25 155
88 339 79 339 70 327 61 299 53 282 46 279 39 259 32 218 26 190
89 362 80 365 71 354 62 328 54 313 47 313 40 295 33 255 27 230
90 387 81 391 72 383 63 358 55 345 48 349 41 334 34 295 28 273
91 411 82 418 73 411 64 388 56 378 49 385 42 374 35 338 29 319
92 436 83 445 74 441 65 420 57 412 50 423 43 415 36 383 30 369
93 462 84 473 75 470 66 452 58 447 51 461 44 457 37 429 31 420
94 487 85 500 76 500 67 484 59 482 52 500 45 500 38 476 32 473

99