You are on page 1of 10

Teorijske distribucije

-distribucije koje su formirane grupiranjem opaanja ili elemenata skupa


prema nekom obiljeju-nazivaju se originalne(empirijske) distribucije razmatrane u
poglavljima do sada
-distribucije koje se mogu oekivati u skladu sa naim iskustvom ili na temelju
nekih teorijskih postavki nazivaju se teorijskim distribucijama
- njih pretpostavljamo u nekom statistikom modelu ili ih postavljamo kao
hipotezu koju treba ispitati
- zadane su analitiki, te su za njih unaprijed poznate karakteristike : sredine,
mod, medijan, 3 , 4
- javljaju se u ulozi distibucije vjerojatnosti
- do sada smo se bavili vjerojatnou a priori vjerojatnost kod koje moemo
izraunati broj ukupno moguih ishoda i broj povoljnih ishoda
- u statistikom istraivanju najee nisu unaprijed poznati elementi za izraunavanje
vjerojatnosti a priori, pa se eksperimentiranjem dolazi do potrebnog znanja za
izraunavanje vjerojatnosti, tj. naknadno, a posteriori zato se takva vjerojatnost
naziva empirijska ili statistika vjerojatnost
Empirijska vjerojatnost ili a posteriori je granina vrijednost relativne
frekvencije povoljnog ishoda dogaaja A ako broj pokuaja raste u beskonanost, tj.
P(A) = lim
n

m
; m- broj povoljnih ishoda u
n

pokuaima, n- ukupan broj pokuaja


- funkcija distribucije sluajne varijable X , oznaava se F(X) , i to je funkcija koja
daje vjerojatnost da e X poprimiti vrijednost jednaku ili manju od nekog realnog
broja x tj. F( xi ) P X xi p xi , gdje zbrajanje obuhvaa sve vrijednosti
X xi

koje ne prelaze x .
Funkcija F(X) je opeg oblika :
F X a

f x dx

, a parametri distribucije vjerojatnosti

karakteriziraju tu distribuciju.
Najznaajniji parametri jesu : oekivana vrijednost (aritmetika sredina) i varijanca.
Ako je X diskretna sluajna varijabla koja moe poprimiti vrijednosti x1 , x 2 ,..., x k
s odgovarajuim vjerojatnostima p x1 , p x 2 ,..., p x k iji zbroj mora biti jedan,
aritmetika je sredina ili oekivana vrijednost od X :
k

E X p x1 x1 p x 2 x 2 ... p x k x k p xi xi .
i 1

Za kontinuiranu sluajnu varijablu ovaj izraz prelazi u :


E X

xf x dx , - x .

Varijanca diskretne sluajne varijable glasi :

2 X xi p xi , E X odnosno
k

i 1

i 1

xi p xi
2

x p x
i 1

Varijanca kontinuirane sluajne varijable glasi :

2 E X 2

f x dx 2 ,

xf x dx .

Teorijske distribucije za diskretnu varijablu jesu : binomna i Poissonova.


Teorrijske distribucije za kontinuiranu varijablu jesu : normalna (Gaussova),
Studentova, F-distribucija, 2 -distribucija.
Binomna distribucija
Binomna distribucija je najjednostavnija teorijska distribucija za alternativna
obiljeja. Binomna distribucija je u svezi s Bernoullijevim pokusima. Bernoullijev
pokus je sluajni pokus ovih obiljeja:
1. Pokus ima dva ishoda ( uspjeh, neuspjeh )
2. U svakom ponavljanju pokusa vjerojatnost ishoda uspjeh jednaka je p i ne
mijenja se od pokuaja do pokuaja. Vjerojatnost ishoda neuspjehjednaka
q= 1 p
3. Pokuaji su neovisni.
Ako je n broj ponavljanja Bernoullijevog pokusa, p vjerojatnost ishoda uspjeh
( ista u svakom ponavljanju ), a X ( sluajni ) broj ishoda uspjeh, varijabla X je
binomna sluajna varijabla, a pripadajua distribucija vjerojatnosti naziva se
Binomnom distribucijom. Binomna distribucija se skraeno oznauje ovako: B(n,p).
Vrijednosti binomne distribucije ili kumulativne funkcije su tabelirane, a svaki
statistiki paket sadri program koji generira vrijednosti te funkcije.
Binomnu distribuciju protumaiti emo na primjeru sa kutijom, u kojoj se
nalaze bijele i crne kuglice. Ako nakon svakog izvlaenja jedne kuglice tu kuglicu
opet vratimo u kutiju, pa kutiju dobro promijeamo, opet izvuemo jednu kuglicu, i to
neprestano ponavljamo, tada nam se sadraj kutije ini neiscrpnim.
Izvui emo najprije jednu kuglicu, tj. n = 1 ; u tom sluaju postoje dvije
mogunosti ishoda: da je kuglica bijela ( B ) ili crna ( C ), a pripadajue vjerojatnosti
za ta dva sluaja su: p i q.
Ako izvuemo dvije kuglice, tj. n = 2 tada postoje ove mogunosti ishoda:
BB

BC

s vjerojatnostima: p 2

CB

pq qp q 2

2 pq

CC

Prema multiplikativnom teoremu, vjerojatnost da e kuglica u prvom i drugom


izvlaenju biti bijela iznosi:
P( BiB) P( B ) P( B ) p p p 2

Analogno vrijedi i za vjerojatnost ostalih triju ishoda.


Prema aditivnom teoremu, vjerojatnost da e biti izvuena jedna bijela i jedna
crna kuglica, bez obzira na to u kojem od dva izvlaenja, jednaka je:
P ( BCiliCB ) P ( B) P (C ) P(C ) P ( B ) p q q p 2 pq

Ako izvuemo tri kuglice, tj. ako je n = 3, tada postoje ove mogunosti ishoda:
BBB
CBB
BCC
CCC
BCB
CBC
BBC
CCB
s vjerojatnostima:
p3

qpp
pqp
3p 2 q
ppq

pqq
qpq
qqp

q3
3pq 2

Na osnovi toga moemo doi do odgovora na openito postavljeno pitanje koje nas
zanima: kolika je vjerojatnost da se u nizu izvlaenja izvue od n kuglica x bijelih ?
Da se bijela kuglica od tri izvlaenja izvue 0 puta ili 1 put ili 2 puta ili 3 puta jednaka
je, prema aditivnom teoremu, sigurnosti, jer je:
q 3 3 pq 2 3 p 2 q p 3 (q p )3 1

Vjerojatnosti predstavljaju lanove razvijenog binoma ( q + p )n


Openiti odgovor na postavljeno pitanje glasi:
vjerojatnost da se u nizu izvlaenja od n kuglica izvue x bijelih je :

n x nx
p(x) p q
x

, x= 0,1,2,,n

Prethodni izraz je diskretna funkcija vjerojatnosti ili binomna distribucija.


Binomna distribucija zove se i Bernoullieva po Jamesu Bernoulliu, koji ju je otkrio
potkraj 17. stoljea.

Aritmetika sredina (oekivana vrijednost) binomne distribucije glasi:


E[X] = n p

Varijanca i standardna devijacija binomne distribucije glasi:


2 n pq ; n pq

dok je:
3

q p
npq

1 6 pq

; 4 3 npq

Binomnu distribuciju moemo podijeliti u 4 vrste u smislu vjerojatnosti ishoda


i to :
simetrina ; ukoliko vrijedi p=q=0.5
(primjer ispita sa 9 pitanja te moguim DA ili NE odgovorom )

asimetrina; ukoliko p q

(primjer mogunosti "izlaska" broja 4 prilikom n bacanja kocke; p=1/6 q=5/6)

a priori; ukoliko nam je oito znana vjerojatnost p i q


(prethodno spomenuta 2 primjera)
a posteriori; ukoliko moramo prethodno empirijski utvrditi p i q
(primjer sa slobodnim gaanjima koarkaa, 300x2 gaanja
primjeujemo da su oekivane frekvencije dobivene pomou empirijski utvrenih p i
q vrlo sline onima iz pokusa to upuuju na to da bi one bile jo slinije ako
poveamo n)
Zadatak:
Raunovodstvena sluba poduzea je utvrdila da zbog visoke inflacije, 40% kupaca
ne plaa raun na vrijeme. Ako se na sluajan nain iz skupa rauna izabere njih 6,
kolika je vjerojatnost:

1. da su svi kupci na koje se odnose rauni podmirili na vrijeme


2. da ih je preko podmirilo raune
3. da 50% nije platilo raune na vrijeme

p=60%=0,6 (plaa na vrijeme)


q=40%=0,4 (ne plaa na vrijeme)
n=6

xi
0
1
2
3
4
5
6

p(x)
0,004096
0,036864
0,138245
0,276480
0,311040
0,186624
0,046656

f(x)
0,004096
0,040960
0,179205
0,455685
0,766725
0,953349
1,000000

n x n x
p(x) p q
x

1. to znai da je svih 6 izvuenih rauna podmireno na vrijeme odnosno da je


x=n=6 pa iz gornje tablice vidimo da je p(6)=4,67%
2. od 6 je 4,5 pa obzirom da je pitanje "preko 3/4 " za nas je mjerodavan
podatak koji odgovara x=5 jer je to prvi cijeli broj vei od 4,5 i podatak koji
odgovara x=6. itamo, stoga, u tablici vrijednost p(5)= 18,66% i p(6)= 4,67%
te na osnovi aditivnog teorema, iste zbrajamo pa je konaan rezultat 23,33%.
3. 50% odnosno od 6 je 3 pa slijedi p(3) je vjerojatnost da JE vie od 50%
izvuenih rauna plaeno na vrijeme, a kako bismo dobili kolika je
vjerojatnost da je vie od 50% izvuenih rauna plaeno sa zakanjenjem je
1 p (3) 1 0,27648 0,72352 odnosno 72,35%

Poissonova distribucija
Ako je p veoma malen, tj. ako je p 0.1 , a n 50 , tada se binomne
vjerojatnosti mogu izraunati aproksimativno pomou funkcije koju je otkrio Poisson:
p x

e x
, 0, x 0,1,2,... , gdje je np; p x 1.
x!

Ta teorijska distribucija zove se Poissonovom distribucijom i ona je granini sluaj


binomne distribucije.
Oekivana vrijednost, varijanca i standardna devijacija Poissonove distribucije glase:
E X
2 , =
1
1
3
, 4 3 .

Ako se u konkretnom sluaju ne moe odrediti vjerojatnost a priori, onda se


eksperimentiranjem moe saznati aritmetika sredina empirijske distribucije
frekvencija. Dovoljno je izraunati samo aritmetiku sredinu da bi se odredila
Poissonova distribucija. U tom sluaja formula Poissonove distribucije prelazi u :
p x

e x
, a raunanje je jednostavnije pomou
x!

logaritamskog oblika :
log p x x log log e log x!

Za velike brojane vrijednosti x jednostavnije se moe odrediti x! Pomou Stirlingove


aproksimacije : x! ~ 2x x x e x odnosno :

log x!

1
1
log 2 x log x log x x log e .
2
2

Primjer :
Ispravnost rada stroja koji automatski proizvodi neki proizvod kontrolirat
emo tako da u odreenim vremenskim razmacinma izuzmemo seriju od 200
proizvoda i prebrojimo koliko je komada karta u toj seriji. U tom je primjeru n=200,
a varijabla je diskretna(broj kartiranih proizvoda). Ne znamo proporciju karta p, ali
pretpostavljamo da je ispod 0.1. Zabiljeen je broj kartiranih proizvoda u 100 serija
po 200 proizvoda, te je dobivena empirijska distribucija frekvencija prikazanih u
tablici :

Broj
kom.
karta
xi

0
1
2
3
4
5
6
7
8
9
Ukupno

Broj
serija
fi

10
21
24
18
13
7
4
2
1
0
100

xi f i

x i log

0
21
48
54
52
35
24
14
8
0
256

0
0.40824
0.81648
1.22472
1.63296
2.04120
2.44944
2.85768
3.26592
3.67416
-

x!

1
1
2
6
24
120
720
5040
40320
362880
-

log x!

0
0
0.30103
0.778151
1.380211
2.079181
2.857332
3.702431
4.605521
5.559787
-

1.111794
0.703554
0.596344
0.665225
0.859045
1.149775
1.519686
1.956545
2.451395
2.997421
-

log p x

p x

0.0773
0.1979
0.2533
0.2161
0.1383
0.0708
0.0302
0.0111
0.0035
0.0010
0.9995

Prilagoene
apsolutne
frek.

7.7
19.8
25.3
21.6
13.8
7.1
3.0
1.1
0.4
0.1
99.9

Normalna ( Gaussova ) distibucija


Ako se razvije binom p q n i ako nema razlike izmeu p i q, te ako se n poveava u
beskonanost, stupnjeviti grafiki prikaz binomne distribucije ima sve ue i ue baze
stupca, postoje sve ''glai'' I prelazi u kontinuiranu krivulju koja se pribliava
grafikom prikazu normalne distribucije kao graninoj vrijednosti.
Normalna krivulja : ima oblik zvona, unimodalna je, protee se od do ,
simetrina je, pa joj je 3 0 , aritmetika sredina jednaka je modu i medijanu, mjera
zakrivljenosti joj je 4 3 .
Njezina je formula :

f x

x 2

2 2

standardna devijacija,

aritmetika sredina.
Budui su i e konstante, oblik krivulje ovisi jedino o i . Za vee vrijednosti
standardne devijacije normalna krivulja je vie razvuena i ira, a za manje vrijednosti
ua. Mijenja li se aritmetika sredina krivulja se pomie po apcisnoj osi.
Svaka se normalna distribucija moe svesti na standardiziranu ako se obiljeje X
linearno transformira u X = z , pa se umjesto varijable X dobiva standardizirana
varijabla (obiljeje) z :

x
z
, a znamo da je z 0, z 1 .

Ovom relacijom dobivamo :

f z

z2
2

e
.
2
Vjerojatnost da se vrijednost kontinuirane sluajne varijable z nalazi u intervalu
z1 , z 2 jednaka je razlici vrijednosti funkcije distribucije u mjestima z1 i z 2 tj.
z2

P z1 z z 2 f z dz F z 2 F z1 .
z1

Povrine ispod standardizirane normalne krivulje izmeu dviju ordinata podignutim


na bilo kojim mjestima apcise z1 i z 2 nalaze se u tablici , a to je ujedno i
vjerojatnost da se sluajna varijabla Z nae izmeu vrijedosti z1 i z 2 .
Studentova t-distribucija
-

otkrio ju je 1908. W.S.Gosset , ali ju je objavio pod pseudonimom


'' Student'' te je zbog toga nazvana Studentova t-distribucija
- Otkrio ju je prouavajui i rjeavajui probleme metode uzoraka
( reprezentativne metode)
Funkciju vjerojatnosti za t prikazao je :
1

f t

1 n 1
n 1B
,

2
2

1 n 1
,

2 2

beta-funkcija s parametrima

t2
1

n 1

n
2

, gdje je

1 n 1
,
, a n broj elemenata
2
2

pomou funkcije f(t) moe se izraunati vjerojatnost da t bude premaen, a


vjerojatnosti se nalaze u posebnim tablicama
oblik joj ovisi o veliini broja n, a u formuli izraz (n-1) predstavlja broj
stupnjeva slobode i oznaava se slovom (ni)
broj stupnjeva slobode jednog pokazatelja definira se kao broj neovisnih
opaanja n umanjen za broj k parametara potrebnih da bi se odredio dani
pokazatelj : df n k
Studentova je distribucija razvuenija od normalne
Za velike vrijednost n (vee od 30 ) ova se distribucija pribliava
standardiziranoj normalnoj

Hi-kvadrat 2 distribucija
-

primjenjuje se u sluajevima kada treba donijeti odluku o signifikantnosti


razlika stvarnih (opaenih) i teorijskih (oekivanih ) frekvencija, odnosno
vrijednosti varijabla (obiljeja)
obiljeava se grkim slovom hi , definira se kao zbroj odnosa razlika
izmeu opaenih i oekivanih vrijednosti prema oekivanim vrijednostima,
tj.

m i ei 2

i 1

ei

; mi - opaena frekvencija,

ei - oekivana ( teorijska ) frekvencija

ova distribucija moe zauzeti vrijednosti od 0 do , vrijednosti su uvijek


pozitivne, ovisi o broju stupnjeva slobode, pa je za svaki broj stupnjeva
slobode hi-kvadrat distribucija razliita
vjerojatnosti distribucije dane su u tabeli
u tablici su dati podaci do 30 stupnjeva slobode, a ako se radi o vie od 30
stupnjeva slobode R.A.Fisher sugerira da se uzme izraz :
2 2

2 1

koji je priblino normalno distribuiran, pa se za taj sluaj mogu primijeniti tablice


povrina ispod normalne krivulje
- aritmetika sredina hi-kvadrat distribucije jednaka je broju stupnjeva
slobode , mod je na mjestu gdje je 2 = 2 (osim ako je 1 ),
varijanca iznosi 2 , a koeficijent asimetrije
-

iz izraza za koeficijent asimetrije slijedi da je ova distribucija vrlo


asimetrina za mali broj stupnjeva slobode, a da se sa poveavanjem
stupnjeva slobode pribliava simetrinosti

Zadaci za vjebu :
a) Normalna distribucija

1. Koliki je koeficijent povjerenja

z
2

za procjenu aritmetike sredine

osnovnog skupa pomou velikog uzoraka ako je 1 : a)0.90 , b)


0.80 , c) o.95 ? Skiciraj postupak odreivanja koeficijenata.
2. Uz koju se razinu povjerenja provodi postupak procjene aritmetike
sredine populacije ako je koeficijent povjerenja : a) 1.40 , b) 2.17 , c)
3.09 ?
3. Odredite vrijednosti standardne pogreke procjene aritmetike sredine
osnovnog skupa za ove sluajeve :
a) procijenjuje se sredina konanog skupa od 125768 lanova pomou
sluajnog uzorka veliine 1250 lanova. Standardna devijacija
osnovnog skupa iznosi 64.
b) Procjena je sredine pomou sluajnog uzorka veliine 600
formiranog izborom svakog 10. lana konanog osnovnog skupa, a
varijanca skupa iznosi 100.
c) Uzorak veliine 36 je izabran iz beskonane populacije N ,5

d) N=35679, n= 2500, =10

e) Veliina uzorka je 256 i ini 2 % populacije, a standardna devijacija


uzorka je 32.
4. U sluajnom uzorku izabranom uz frakciju izbora manja je od 5%
zabiljeeno je ovo trajanje obrade naloga komitenata preko terminala
banke M&N u minutama :
16.10
9.23
11.81
16.20
2.00
4.00
8.44
5.30

11.85
10.96
10.86
4.90
10.36
9.72
8.65
12.81

9.37
12.69
12.93
7.44
12.25
15.50
9.70
8.90

7.26
7.91
12.54
8.05
11.89
9.88
10.42
9.08

10.12
2.00
12.70
8.10
11.09
13.55
10.98
11.04

12.53
9.87
7.18
9.93
2.50
10.67
11.09
6.26

9.93
11.88
9,57
5.60
11.72
10.84
8.03
9.54

12.79
8.07
9.88
7.80
9.64
13.15
10.13
4.20

Procijeni prosjeno trajanje svih obrada jednim brojem. U kojim se


granicama moe oekivati prosjeno trajanje obrade naloga komitenata te
banke? Razina povjerenja procjene je 95 %.
b) Studentova distribucija
1. Odredi vrijednosti koeficijenata povjerenja procjene aritmetike
sredine pomou sluajnog uzorka ako je : a) n=11, 1 0.95 b)
n=16, 1 0.80 c) n=27, 1 0.99
2. Zadane su sluajne tabline vrijednosti koeficijenata povjerenja
procjene aritmetike sredine osnovnog skupa pomou malog uzorka :
a) 1.717 ; b) 3.250 ; c) 2.861 ; d) 2.718 . Na kojoj se razini
povjerenja i s kojom veliinom uzorka procjenjuje sredina populacije ?
3. Ispituje se prosjeno trajanje pozivnih telefonskih razgovora preko
telefonske centrale poduzea Market. Trajanje u minutama 10 sluajno
odabranih razgovora iz evidencije 8967 razgovora bili je kako slijedi :
xi : 2 1
1
2
3
4
2
1
1
3
Pretpostavlja se da je trajanje pozivnih razgovora na centrali normalno
distribuirano s nepoznatom aritmetikom sredinom i nepoznatom
standardnom devijacijom. Odredi granice u kojima se moe oekivati
da obuhvaaju prosjeno trajanje razgovora za osnovni skup.
Pouzdanost procjene je : 95%, 90% .

You might also like