You are on page 1of 38

IV.1.2.

POISSONOVA RASPODJELA
Def:
Diskretna sluajna varijabla ima Poissonovu raspodjelu ako joj je raspodjela
vjerojatnosti dana s

e x
p( x; ) =
x!

x = 0,1,2,....

za neki > 0 .
Poissonovu sluajnu varijablu oznaavamo:
X ~ Po( )
Pokaimo da je p ( x; ) raspodjela vjerojatnosti (tj., da zadovoljava aksiome):

p( x; ) = e

x =0

x =0

x!

= e e = 1

=0,5
=1
=2
=3
=5

0.6

p(x;)

0.4

0.2

0.0
0

Slika 1: Poissonova raspodjela za nekoliko razliitih .


Oekivanje i varijanca

E( X ) =

E( X 2 ) =

x =0

x!

xe

x =0

x!

x 2 e

x =2

e e + ( x 2)

x =1

x!

xe

xe

x =1

x 2

x =1

( x 1)!

y =0

y!

x 1
x 1
= e
+ ( x 1)
=
( x 1)!
( x 1)!
x =1 ( x 1)! x =1

= e
( x 2)!

x 1

[e + e ] = +

V ( X ) = E ( X 2 ) ( E ( X ) )2 =

49

Rekurzivna formula
x +1
e
p( x + 1; )

( x + 1)!
=
=
x
p ( x; )
x +1

e
x!

p ( x + 1; ) =

x +1

p ( x; )

Najvjerojatnija vrijednost

p( x M 1) p( x M ) p( x M + 1)

1 xM

Funkcija izvodnica
g (t ) =

x =0

x!

e tx e

t
t
= e e e = e e 1

Pomoni momenti
t
g ' (t ) = e t e (e 1)

m1 =

g ' ' (t ) = e t (1 + e t )e (e 1)
t

m2 = 2 +

Funkcija raspodjele
x

F ( x; ) =

y
y!

y =0

tablice

Primjena Poissonove raspodjele


A. Aproksimacija binomne raspodjele
B. Prouavanje rijetkih dogaaja
A. Poissonova raspodjela kao granini sluaj binomne
Pretpostavimo da u Bin(n,p) stavimo n, a p0 tako da np = = const. > 0.
Tada b(x;n,p)p(x;).
Dokaz:
b( x; n, p) =
=

n!
n!

p x (1 p) n x =
1
x!(n x)!
x!(n x)! n n

n(n 1) L (n x + 1)
1
n
nx

n x

x
x!

x
1 x 1
= 11 L1
1
1
n n x! n
n

lim b( x; n, p) = 1 1L1 e

50

x
x!

= p ( x; )

n x


Upotrijebili smo relaciju lim 1 = e
n
n
Praktino binomnu raspodjelu moemo aproksimirati Poissonovom kad je:
n 50 ; p 0,1
Slijede dva primjera, najprije loe, a onda dobre aproksimacije:
0.5

0.4

b(x;7,1/6)
p(x;7/6)

p(x)

0.3

0.2

0.1

0.0
0

Usporedba binomne i Poissonove raspodjele za n=7 i p=1/6 (broj estica prilikom


bacanja 7 kockica).
0,3

b(x;50,0.05)
p(x;2.5)

p(x)

0,2

0,1

0,0
0

Usporedba binomne i Poissonove raspodjele za n=50 i p=0,05.


B. Poissonova raspodjela kao zakon malih brojeva
Rijetki dogaaji:
prometne nesree na odreenoj dionici autoceste u jednome danu
telefonski pozivi centrali u jednoj minuti
defekti po jedinici duljine bakrene ice
broj estica kozmikog zraenja detektiranih u sekundi.
broj oboljelih stabala po aru ume.

51

Primjer 1:
Odredi raspodjelu vjerojatnosti k raspada tijekom jedne milisekunde ako imamo N=4,81012
radioaktivnih atoma joda, a konstanta raspada je =7,310-10s-1.
t
;
Broj radioaktivnih atoma u vremenu: N = N 0 e

Aktivnost = broj raspada u jedinici vremena: a =

dN
= N = 3,4 10 3 s 1
dt

Pk (t ) = b(k ;1000, p(t )) = p(k ; at )


E ( k ) = at = 3,4

primjer 2:
Knjiga od 750 stranica ima 400 tiskarskih pogreaka. Uz pretpostavku da su pogreke
nezavisne nai vjerojatnost da neka stranica ima
0
400

p 0;
=
e
= 0,59

0!
750
1 p (0) p (1) = 0,10
p ( 4) = 0,002

a) nula pogreaka
b) vie od jedne pogreke
c) tono 4 pogreke

Vidimo:

U pitanju su vremenski ili prostorni intervali. Vjerojatnost dogaaja


proporcionalna je veliini intervala. To su Poissonovi procesi.

Prilagoavanje empirijskih podataka Poissonovoj raspodjeli


primjer:
Bombe koje su padale po Londonu u II svjetskom ratu.

Broj bombi po
sektoru
x
0
1
2
3
4
>5

broj sektora
fopaeno
229
211
93
35
7
1

x=

52

535
= 0,929 = E ( x) =
576

broj bombi
xf
0
211
186
105
28
5

576

fteorijski
227
211
99
31
7
1

535

576

240

broj sektora
fteor (=0,932)

220
200
180
160

f(x)

140
120
100
80
60
40
20
0
0

Slika 4: uz primjer prilagodbe (bombe po Londonu)

Raspodjela dvije nezavisne Poissonove varijable


Imamo sluajne varijable X~Po(m) i Y~Po(n).
Tvrdnja: Za sluajnu varijablu (X+Y) vrijedi (X+Y)~Po(m+n).
dokaz:
definirajmo sluajnu varijablu Z = X + Y
P(Z = z ) =
=

P( X = w) P(Y = z w) =

w=0
e (m + n) z z w z w

z!

w m n
w=0

em

w=0

mw n n z w
e
=
w!
( z w)!

e (m + n)
( m + n) z
z!

Q.E.D.

53

IV.1.3. HIPERGEOMETRIJSKA RASPODJELA


Pretpostavke:
1. Populacija se sastoji od N elemenata. (konana populacija)
2. Svaki element ima svojstvo koje moemo oznaiti kao 'uspjean' ( A ) ili
'neuspjean' ( A ). Postoji M uspjenih elemenata.
3. Izvlai se uzorak od n elemenata, a izvlaenje bilo kojeg uzorka jednako je
vjerojatno.

Sluajna varijabla:

X= broj uspjenih elemenata u uzorku


P ( X = x ) = h ( x; n , M , N )

h ( x; n , M , N ) =

broj mogucih uzoraka s x uspjeha


ukupni broj mogucih uzoraka

M N M

x n x

h ( x; n , M , N ) =
N

n

x = 0,1,2,..., min(n, M )

Oekivanje i varijanca
E( X ) = n

M
N

M
N n M
V(X ) =
n
1

N
N 1 N

Za lake pamenje stavimo p =

M
;
N

E ( X ) = np

q =1 p
N n
V(X ) =
npq
N 1

N n
Faktor
nazivamo korekcijskim faktorom konane populacije.
N 1

Primjer iz prvog dijela predavanja: Imali smo N=100.000; n=20. Izvlaili smo 100
puta. Raspodjelu smo prilagoavali binomnoj. Korekcija do hipergeometrijske bila bi
vrlo mala.

54

Primjer hipergeometrijske raspodjele:


25 tigrova ugroene vrste nalazi se u nekoj praumi. Znanstvenici su ve ranije uspjeli
obiljeiti 5 tigrova radi promatranja. U novom promatranju ulovimo 10 tigrova.
Kolika je vjerojatnost da e manje od tri biti obiljeena?
P ( X < 3) = h (0;10,5,25) + h (1;10,5,25) + h ( 2;10,5,25) = 0,057 + 0,128 + 0,385 = 0,570

IV.1.4. NEGATIVNA BINOMNA (PASCALOVA)


RASPODJELA
Uvjeti pokusa:
1. Sastoji se od niza nezavisnih pokuaja.
2. Pokuaji su meusobno identini Bernoullijevi pokusi s moguim ishodima
'uspjeh' ( A ) i 'neuspjeh' ( A ).
3. Vjerojatnost 'uspjeha' jednaka je za sve pokuaje i oznaavamo je s p .
4. Pokus traje (pokuaji se izvode) sve dok se ne opazi r uspjeha, a r je unaprijed
odreen prirodni broj.
Sluajna varijabla:
X= broj neuspjeha koji prethode r-tom uspjehu

Za razliku od binomne, ovdje je broj pokuaja varijabilan, a broj uspjeha unaprijed


odreen. (zato se zove negativna binomna)
Npr. : Ako je r=5, a x=10 znai da u prvih 14 pokuaja imamo 4 uspjeha i da je 15.
Pokuaj uspjean
P ( X = x ) = nb( x; r , p )
nb( x; r , p ) = P ( r 1 uspjeha u x + r 1 pokuaja) P ( uspjeh )
x + r 1 r 1 x
nb( x; r , p ) =
p q p
r 1

x + r 1 r x
nb( x; r, p ) =
p q
r 1

x = 0,1,2,......

primjer:
Pedijatar eli nai 5 parova koji oekuju prvo dijete da ih ukljui u novi program prirodnog
poroda. Ako je vjerojatnost pristanka p=0,2, kolika je vjerojatnost da e morati upitati 15
parova?

55

r + x = 15
14
nb(10; 5, 0,2) = (0,2 )5 (0,8)10 = 0,034
4

Oekivanje i varijanca
Bez izvoda:
E( X ) =

56

rq
p

V(X ) =

rq
p2

POJAM INTEGRALA

f(x)

f(x)

Prilikom razmatranja kontinuiranih raspodjela esto emo se susretati s problemom


odreivanja povrine ispod funkcije.

Budui da je funkcija prikazana zakrivljenom crtom, nema jednostavnog


geometrijskog naina da tono izraunamo obojenu povrinu.
Mi znademo izraunavati povrine pravokutnika pa emo pokuati promatranu plohu
podijeliti na manje dijelove koje emo tada aproksimirati pravokutnicima. Podijelimo
promatrani interval [a,b] na n ekvidistantnih segmenata [xk-1, xk]. Pritom je x0=a, a
xn=b. Na svakom segmentu pronaemo najveu (Mk) i najmanju (mk) vrijednost
funkcije f. Definirajmo sume:
n

k =1
n

k =1
n

s = m k ( x k x k 1 ) = mk x
S = M k ( x k x k 1 ) = M k x
k =1

f(x)

k =1

Oito je da je naa traena povrina I vea od s, a manja od S. to je vei broj


segmenata n na koje smo podijelili promatrani interval, to je razlika izmeu S i s
manja pa je procjena iznosa povrine I to bolja. Ako je promatrana funkcija f
neprekinuta i konana na promatranom intervalu, onda e se u granici n sume s i
S izjednaiti.
lim s n = lim S n = I
n

57

Piemo:
n

I = lim f ( x k )x =
n

k =1

f ( x)dx = f ( x)dx

[ a ,b ]

Def:
Primitivna funkcija od f je svaka funkcija F sa svojstvom
F ' ( x) = f ( x)

Sve primitivne funkcije neke funkcije f razlikuju se samo za konstantu!


Za neprekidne funkcije vrijedi Leibniz-Newtonova formula:
b

f ( x)dx = F (b) F (a)


a

Navodim nekoliko tablinih primitivnih funkcija:


f(x)

xn

F(x)

, n 1

x n +1
n +1

x 1

ln x

ex

ex

ax

ax
ln a

sin x

cos x

cos x

sin x

1
cos 2 x

tg x

1
sin 2 x

ctg x

58

IV.2. KONTINUIRANA SLUAJNA VARIJABLA I


RASPODJELA VJEROJATNOSTI
Dosad smo razmatrali diskretne sluajne varijable. Mogue vrijednosti diskretne
sluajne varijable ine konaan skup ili se mogu sloiti u ureen beskonaan niz.
U sluaju kontinuirane sluajne varijable, mogue vrijednosti ine cijeli interval
brojeva.
Def: Sluajna varijabla X je kontinuirana ako skup njezinih moguih vrijednosti ini
cijeli interval brojeva, t.j. ako je za neke A i B ( A < B ), svaki x [ A, B ] mogu.
Kontinuirana sluajna varijabla je teorijska reprezentacija kontinuiranih varijabli kao
to su duljina, masa, vrijeme,...

0.25

0.25

0.20

0.20

0.15

0.15

f(x)

P(x); f(x)

Primjer: mjerimo dubinu nekog jezera na 8115 mjesta. Slike prikazuju: 1. raspodjelu
dubina zaokruenih na cijele metre; 2.zaokruenih na cijele decimetre. 3. raspodjelu
dubina zaokruenih na cijele centimetre; 4. kontinuiranu raspodjelu dubina.
Za svaki interval x definiramo funkciju f ( x ) s pomou vjerojatnosti
P ( x X x + x ) = f ( x) x . Na etvrtoj slici intervali su infinitezimalni ( x dx )
pa imamo P ( x X x + dx ) = f ( x )dx
Povrina ispod svih grafova jednaka je jedinici!

0.10

0.10

0.05

0.05

0.00

0.00
0

0.20

0.20

0.15

0.15

f(x)

0.25

f(x)

0.25

0.10

0.10

0.05

0.05

0.00

0.00
0

59

Funkcija gustoe vjerojatnosti

Def: Neka je X kontinuirana sluajna varijabla. Raspodjela vjerojatnosti ili funkcija


gustoe vjerojatnosti varijable X je funkcija f(x) takva da za bilo koja dva broja
a b vrijedi
b

P (a X b) = f ( x)dx .
a

Rijeima: Vjerojatnost da X poprimi vrijednost u intervalu [a, b] dana je povrinom


ispod funkcije gustoe vjerojatnosti u tom intervalu.
Uvjeti na f (x ) :
1. f ( x ) 0 , x

2.

f ( x )dx = 1

Primjer: za raspodjelu dubina jezera: P (2 X 4) = f ( x)dx


2
0.30

0.25

f(x)

0.20

0.15

0.10

0.05

0.00
0

60

f(t)

Primjer: ekanje tramvaja koji vozi svakih 5 minuta.

1
5

P( X 3) =

f ( x )dx =

3
5

To je primjer uniformne ili pravokutne raspodjele.

Def: Kontinuirana sluajna varijabla X ima uniformnu raspodjelu u intervalu [ A, B ]


ako je funkcija gustoe vjerojatnosti dana s
1
A x B
.
f ( x) = B A
0
inace
Ilustracija pravokutne raspodjele:

f(x)

1
B-A

B
x

Vano: Za razliku od diskretne raspodjele, ovdje vrijedi


P ( X = c ) = 0 , c .

To znai:

P ( a X b) = P ( a < X b) = P ( a X < b) = P ( a < X < b)

61

Funkcija raspodjele

Def: Funkcija raspodjele F ( x ) za kontinuiranu sluajnu varijablu X definirana je:

F ( x) = P ( X x) =

f ( y)dy

To je povrina ispod funkcije gustoe vjerojatnosti.


Primjer: funkcija raspodjele za dubinu jezera
1.0

0.8

F(x)

0.6

0.4

0.2

0.0
0

Za pravokutnu raspodjelu vrijedi:


,
0
x A
F ( x) =
,

B
A

,
1

x<A
A x B
x>B

F(X)

B
x

Openito:

P ( a X b) = F (b) F ( a )

Ako poznajemo F ( x ) , onda f ( x ) lako odreujemo:


dF ( x )
.
f ( x) =
dx

62

Oekivanje kontinuirane sluajne varijable

Def: Ako je X kontinuirana sluajna varijabla i f(x) njezina funkcija gustoe


vjerojatnosti, onda je njezino oekivanje

x = E( X ) =

x f ( x )dx

A+ B
2

Primjer: pravokutna: E ( x ) =
Primjer: Neka je

0 x 1
3
2

inace
f(x)

3
1 x2
f ( x) = 2

0
0

Oekivanje je:
1

3
3 3 3
E ( X ) = xf ( x )dx = x x 3 dx = = .
2
4 8 8

Oekivanje funkcije
Def: Ako je X kontinuirana sluajna varijabla i f ( x ) njezina funkcija gustoe
vjerojatnosti, a h ( X ) bilo koja funkcija od X, onda je

E (h( X )) = h ( X ) =

h( x) f ( x )dx

Za linearnu funkciju h ( X ) = aX + b vrijedi


E ( aX + b) = aE ( X ) + b .

63

Varijanca kontinuirane sluajne varijable

Def: Ako je X kontinuirana sluajna varijabla, f(x) njezina funkcija gustoe


vjerojatnosti, a njezino oekivanje, onda je njezina varijanca dana relacijom

V ( X ) = x2 =

(x )

Standardna devijacija je x = V (X ) .

Vrijedi:

( )

V ( X ) = E X 2 (E ( X ) )2

Varijanca funkcije:

V ( h( X )) = E h 2 ( X ) (E (h ( X )))2
primjer: linearna funkcija h ( X ) = aX + b

V (aX + b) = a 2V ( X )
Momenti

mr =
Mr =

f ( x)dx

(x )

f ( x)dx

Funkcija izvodnica

g (t ) =

64

tx

f ( x)dx

f ( x)dx = E ( X ) 2 .

IV.2.1. NORMALNA (GAUSSOVA) RASPODJELA


Premda postoje mnoge druge raspodjele, normalna raspodjela objanjava najvei broj
statistikih opaanja.
Dva primjera:

Raspodjela visina odraslih ljudi

Rezultati mjerenja fizikalnih veliina

Kao objanjenje Gaussove prirode raspodjele ljudskih visina pomislite na mnotvo


genetskih utjecaja i utjecaja okolia na neiju visinu.
Svaki takav utjecaj moemo zamisliti kao jedan avli u Galtonovoj dasci koji
odreuje hoe li netko biti malo vilji ili malo nii. (Galton je bio antropolog)
Zbroj svih tih utjecaja odreuje neiju konanu visinu.
Sputa li se mnotvo kuglica na Galtonovu dasku, a broj redova (odluka) se poveava,
raspodjela kuglica sve e vie liiti Gaussovoj.
http://www.uni-koeln.de/ew-fak/Mathe/Projekte/VisuPro/galton.html
Galtonova daska je prejednostavna za taj opis. Neki utjecaji imaju jae djelovanje od
drugih, dok neki djeluju udrueno, a ne nezavisno.
Ali pokazuje se da ako raznih imbenika ima jako mnogo, Gaussova krivulja dobro
opisuje raspodjelu.
Razmotrimo mjerenje neke fizikalne veliine. Neka je prava vrijednost te veliine xp:

Prilikom mjerenja te veliine dolazi do pogreaka.


Pogreke mogu biti grube, sistematske ili sluajne.
Ako smo paljivim mjerenjem otklonili grube i sistematske, ostaju nam samo sluajne
pogreke. Na njih ne moemo utjecati i one dovode do rasipanja rezultata.
Pretpostavke za Hagenov izvod Gaussove distribucije:
ukupna pogreka sastoji se od niza elementarnih pogreaka koje su sve istog
iznosa
jednaka je vjerojatnost da elementarna pogreka bude pozitivna ili negativna:
p+=p-=1/2
ukupna pogreka sastoji se od n elementarnih pogreaka, n
Radi jednostavnosti stavimo da je n paran broj (n=2)
Ukupna pogreka y jest odstupanje izmjerene vrijednosti x od prave vrijednosti xp:
y=x-xp

65

0
ym=2m

-n

2 1

vrijedi: p m =
+ m 2 2
Da bismo preli na kontinuiranu raspodjelu najprije emo odrediti diferencije, a zatim
u limesu prei na diferencijale pa integrirati.
y m = y m +1 y m = 2
ym
2m
2 m
= pm
1 p m
p m = p m + 1 p m = p m

+ m +1

pa konano dobivamo:
p m
p y
= m m
y m
2 2

66

Uvedimo oznaku 2 = 2 2 pa konano imamo


dp
=
dy

lim

y 0
n 2 = const

1
p
=
py
y
2

Razdvojimo varijable pa integriramo:


1
dp
=
ydy
p
2
ln p =

1
2 2

y2 +C

y2

2
p = Ke 2

f(y)

veci

-1.0

-0.5

0.0

0.5

1.0

Da bi ova funkcija mogla biti funkcija gustoe vjerojatnosti, mora biti normirana.

f ( y)dy = 1

Ke

y2
2 2

dy = 2 K e

y2
2 2

dy = 2 2K e u du = 2 2K I = 1

u
du
Izraun integrala I = e

Izraunat emo najprije kvadrat tog integrala:

I 2 = e x dx e y dy =
2

x2 + y 2
e
dxdy =

00

To je dvostruki (povrinski) integral u kojem varijabla integracije ide po cijelom prvom


kvadrantu. Diferencijalni element povrine je dxdy :

67

dx
y

dy

0
0

Moemo prijei na polarne koordinate:

x = r cos
y = r sin

x2 + y2 = r 2
Diferencijalni element povrine postaje rdrd :

rd
dr

0
0

Sada na integral u polarnim koordinatama izgleda ovako:

/2

2
r 2
r 2
2
e z dz =
I =
e rdrd =
e rdr = (supstitucija z = r ) =
4
4
2
r =0 =0
r =0
0

pa je I =

I2 =

Izraunali smo faktor normiranja

f ( y) =

68

K=

y2

2
e 2

0
-1.0

-0.5

0.0

0.5

1.0

Uvrstimo li y = x x p , funkcija gustoe vjerojatnosti postaje:

f ( x) =

(x x p )2
2 2

Moemo pokazati da je oekivanje:


= E ( X ) = x p . (pokaite sami)
Moemo pokazati da je varijanca:
V ( X ) = 2 . (pokaite sami)

Normalnu raspodjelu obino piemo

f ( x) =

( x )2

Normalnu sluajnu varijablu oznaavamo:


X ~ N , 2

2 2

69

0.20

1.0

N(4,0.25)
0.8

N(50,4)

0.15

f(x)

f(x)

0.6
0.10

0.4

0.05
0.2

0.00

0.0
0

10

20

30

40

50

60

70

80

4
1.0

0.2

0.9

N(100,6.25)

0.8
0.7

N(0,1)

0.6

f(x)

0.5
0.4
0.3
0.2
0.1
0.0

0.0
0

10

20

30

40

50

60

70

80

90

100

110

120

-3

-2

-1

IV.2.1.1. Standardna normalna raspodjela

Ako je X ~ N , 2 uvodimo sluajnu varijablu Z =


Tada je Z ~ N (0,1) .

Funkcija gustoe vjerojatnosti standardne normalne raspodjele:

( z) =

1 z2 / 2
e
2

Funkcija raspodjele za standardnu normalnu varijablu:


z

( z ) =

1 y2 / 2
e
dy
2

tablice

Upotreba tablica
Primjer 1: vjerojatnost P ( Z > 1,38) = 1 P ( Z < 1,38) = 0,0838
Primjer 2: Imamo normalnu raspodjelu s = 50 i = 2 . Zanima nas vjerojatnost da X
bude izmeu 46 i 53.
Rjeenje:
,
X ~ N( 50,4)

70

P ( 46 X 53) = ?

standardiziramo: Z =

X 50
2

P( 2 Z 1,5) = (1,5) ( 2) = 0,9332 0,0228 = 0,9104

Vano svojstvo:
P ( X + ) = 0,6826 68%
P ( 2 X + 2 ) = 0,9544 95%
P ( 3 X + 3 ) = 0,9974 99,7%

Gaussova aproksimacija binomne raspodjele

Ako je X ~ Bin( n, p ) , za veliki n i ne premali p vrijedi priblino X ~ N( np, npq ) .


Primjer: U 12 bacanja novia nai vjerojatnost da e pasti izmeu 4 i 7 glava
(ukljuivo).
a) binomnom:
1
X ~ Bin(12, )
2
12 1
P( X = 4) =
= 0,121
4 212
12 1
P( X = 5) =
= 0,193
5 212
12 1
P( X = 6) =
= 0,226
6 212
12 1
P( X = 7) =
= 0,193
7 212
P( 4 X 7) = 0,733
b) normalnom:
X ~ N( 6,3)
3,5 6
7,5 6
P(3,5 X 7,5) = P(
Z
) = (0,87) ( 1,44) = 0,8078 0,0749 = 0,733
3
3

71

0.10

0.08

p(x), f(x)

0.06

0.04

0.02

0.00
10

12

14

16

18

20

22

24

26

28

30

32

34

36

38

40

Gaussova aproksimacija Poissonove raspodjele

Ako je X ~ Po( ) , za veliki vrijedi priblino X ~ N( , ) .


Primjer: Geigerov broja opaa raspade koji slijede Poissonovu raspodjelu s 25
raspada u sekundi. Nai vjerojatnost da u jednoj sekundi broj raspada bude
23 X 27 .
Rjeenje:
a) Poissonovom:
X ~ Po( 25)

2523
= 0,0763
23!
25
P( X = x + 1) =
P( X = x )
x +1
25
P( X = 24) =
P ( X = 23) = 0,0795
24
P( X = 25) = P( X = 24) = 0,0795

P( X = 23) = e 25

25
P( X = 25) = 0,0765
26
25
P( X = 27) =
P ( X = 26) = 0,0708
27
P( 23 X 27) = 0,3826

P( X = 26) =

b) normalnom:
X ~ N( 25,25)

72

P ( 22,5 X 27,5) = P (

22,5 25
27,5 25
Z
) = (0,5) ( 0,5) = 0,6915 0,3085 = 0,3830
5
5

0.25

0.20

p(x), f(x)

0.15

0.10

0.05

0.00
0

10

12

14

Kada moemo aproksimirati?

Raspodjela

Ogranienja

Aproksimacija

X ~ Bin( n, p )

n velik (>50)
p malen (<0,1)

X ~ Po( np )

X ~ Bin( n, p )

n>10, p
ili
n>30, p

X ~ N( np, npq )

X ~ Po( )

>20

X ~ N( , )

73

IV.2.1.1. Princip najmanjih kvadrata


Mjerimo veliinu X, a njezina prava vrijednost je xp koju ne poznajemo. Obavimo n
mjerenja i rezultati su x1 , x 2 ,K x n . Traimo najvjerojatniju vrijednost za xp.
Da smo obavili samo jedno mjerenje, rezultat bi bio x1. Vjerojatnost da je xp u
intervalu (x,x+x) iznosi:

P1 = P x x p x + x =

( x x1 ) 2
2 2

x1

Da smo obavili dva mjerenja, rezultat bi bili x1 i x2. Vjerojatnost da je xp u intervalu


(x,x+x) iznosi:

P = P1 P2 = P x x p x + x =

x2

( x x1 ) 2 + ( x x 2 ) 2
2 2

(x )2

x1

Obavimo n mjerenja i rezultati su x1,x2,xn. Vjerojatnost da je xp u intervalu (x,x+x)


iznosi:

P = P1 P2 L Pn =

1
2

e 2

( x xi ) 2
2
i =1

(x )n

Budui da ne znamo pravu vrijednost xp, zanima nas najvjerojatnija vrijednost. To je


ona vrijednost xp za koju gornja funkcija (produkt) ima maksimum. Naimo ga!

74

Da bi ova funkcija imala maksimum, mora vrijediti


n

( xi x) 2 = min .

i =1

To zovemo princip najmanjih kvadrata.


Naimo sada x *p za koji je zbroj kvadrata odstupanja minimalan:

d n
( xi x ) 2 = 0

dx i =1

2 ( xi x ) = 0
i =1

Za najvjerojatniji x *p vrijedi

(xi x*p ) = xi nx *p = 0
n

i =1

i =1

x p* =

1 n
xi = x
n i =1

Osnove teorije pogreaka

1. Najvjerojatnija vrijednost na osnovi n mjerenja jest ona pri kojoj je zbroj kvadrata
odstupanja mjerenih veliina najmanji.
2. Ako je prava vrijednost xp neke veliine nepoznata, onda se kao najvjerojatnija
vrijednost koju xp poprima uzima xp= x .

75

IV.2.2. OBITELJ -RASPODJELA


Prije no to nastavimo kontinuirane raspodjele, napravit emo malu digresiju.
Definirat emo gama funkciju:

-funkcija
Def:

( ) = x 1e x dx

>0

30

25

20

15

10

0
0

Tri najvanija svojstva:


1. > 1 ( ) = ( 1) ( 1)
2. n N ( n ) = ( n 1)!
1
3. =
2
Dokazi:
1. Primijenimo pravilo parcijalne integracije udv = uv vdu . Stavimo u = x 1 ,
dv = e x dx , du = ( 1) x 2 , v = e x . Integriramo:

( ) = x
0

76

1 x

dx = x

1 x

+ ( 1) x 2 e x dx = 0 + ( 1)( 1) .
0

2. Izraunajmo prvih nekoliko vrijednosti. Dalje primjenjujemo rekurziju iz 1.

(1) = x 0 e x dx = e x
0

= 1 = 0!

(2) = 1 (1) = 1 0! = 1!
(3) = 2 (2) = 2 1! = 2!
(4) = 3 (3) = 3 2! = 3!
3. Uz supstituciju t = x

, dt =

1 1 / 2
x
dx imamo
2

2
1
= x 1 / 2 e x dx = 2 e t dt = .
2 0
0

Izvod Stirlingove formule

n! = (n + 1) = x n e x dx
0

uvedemo supstituciju:

x=z n+n
dx = n dz
raunamo:

n! =

n
n + n e (z n + n ) n dz =

(z

= ne n
= ne n

n ln z n + n z n

n ln n 1+ z / n z n

[(

dz =

)]

dz =

=n

ne

n ln 1+ z / n z n

dz =

Za veliki n moemo u granice integrala staviti n i razviti logaritam u red:


z z2

+L z n
n

n 2n

ne n e
dz =2n n

2
ne n e z / 2 dz =

nn

napravimo supstituciju u = z / 2

= 2n

2n e

u
n
n
e du =2n 2n e

= 2n n n e n

77

Vraamo se na kontinuirane raspodjele sluajne varijable.

raspodjele
Standardna raspodjela

Def:
Kontinuirana sluajna varijabla X ima standardnu gama raspodjelu ako je njezina
funkcija gustoe vjerojatnosti dana s
x 1e x
, x0

( )
f ( x ; ) =

0
, x<0

gdje je parametar raspodjele ( > 0 ).

Lako vidimo da ova raspodjela zadovoljava osnovne uvjete za raspodjelu


vjerojatnosti:
1. f ( x; ) 0 , x

2.

1
( )
f ( x; )dx =
x 1e x dx =
=1

( )
( )

Oekivanje i varijanca:
E( X ) =
V (X ) =

3
2,5
=1/2

=1

1,5

=2
=3

1
0,5
0
0

Primjena:
Vrijeme reakcije na neki podraaj....
78

Openita raspodjela

Def:
Kontinuirana sluajna varijabla X ima gama raspodjelu ako je njezina funkcija
gustoe vjerojatnosti dana s
x 1e x /
, x0

( )
f ( x; , ) =

0
, x<0

gdje su i > 0 .

Oekivanje i varijanca:
E ( X ) =
V ( X ) = 2

(Tko eli, neka sam izvede!)

Openita gama raspodjela postaje standardna za = 1 .

poseban sluaj je
Eksponencijalna raspodjela

=1 , =

e x

f ( x; ) =
0

x0

x<0

Vjerojatnosti u eksponencijalnoj raspodjeli lako se raunaju.


Oekivanje i varijanca:
1
1
E( X ) =
V (X ) =

Funkcija raspodjele:
1 e x

F ( x; ) =
0

x0

x<0

Primjena:
Kad promatramo vrijeme izmeu dva dogaaja u Poissonovim procesima.
Ako imamo Poissonovu raspodjelu s parametrom t , onda su vremena izmeu
dogaaja raspodijeljena eksponencijalno s parametrom .

79

2 raspodjela

Def:
Neka je n N . Kontinuirana sluajna varijabla X ima 2 raspodjelu s parametrom n
ako je njezina funkcija gustoe vjerojatnosti dana s
x n / 2 1e x / 2
, x0
n/2

2
(
n
/
2
)

f ( x; n ) =

0
, x<0

Parametar n zove se broj stupnjeva slobode varijable X.

2 raspodjela izuzetno je vana za primjenu statistikih testova. Na to emo se vratiti


kasnije.

0,6

0,5

0,4

=2
=5
=10
=20

0,3

0,2

0,1

0
0

80

10

12

14

16

18

20

DODATAK (nije ispredavano)

Veza normalne i gama raspodjele

Neka imamo N(, 2). Vjerojatnost da e normalna sluajna varijabla pasti u


interval (x,x+dx) jest
dP =

1
e
2

( x )2
2 2

dx

Definirajmo novu sluajnu varijablu U koja predstavlja kvadrat odstupanja


sluajne vaijable X od oekivane vrijednosti:
2
(
X )
U=
.
2

Naimo vjerojatnost da U bude u intervalu (u,u+du). Treba razmotriti dva sluaja:


x> i x<.
1. Kad je x> imamo x = u i dx =

2 u

du pa je vjerojatnost da se X nae

u intervalu (x,x+dx) jednaka


1
e u / 2 u 1 / 2 du
2 2

2. Kad je x< imamo x = u i dx =


du pa je vjerojatnost da se X
2 u
nae u intervalu (x-dx,x) jednaka
1
dP =
e u / 2 u 1 / 2 du
2 2

dP =

Ukupna vjerojatnost za (u,u+du) je dakle dvostruka (zbroj dvaju sluajeva) pa


imamo
1 u / 2 1 / 2
1
dP =
e
u
du =
u1 / 2 1e u / 2 du
1
/
2
2
2 (1 / 2)
Zakljuak: Ako je X normalna sluajna varijabla s oekivanjem i standardnom
devijacijom , onda sluajna varijabla U =
parametrima = 1 / 2 i = 2 .

( X )2
2

ima gama raspodjelu s

81

Znaenje ove veze: Vjerojatnost da veliina

bude vea od nekog broja

odreena je povrinom ispod repa gama raspodjele s parametrima = 1 / 2 i = 2


koji se nalazi iza 2 . (osjenani dio na slici)

1,5

1,0

0,5

0,0
0

Neka imamo n nezavisnih normalnih sluajnih varijabli koje sve imaju isti i
razliite i , tj. Xi~N(,i2). Definirajmo veliinu
n

( X i )2

i =1

i2

=
2

Moe se pokazati da je to sluajna varijabla raspodijeljena prema 2 raspodjeli s n


stupnjeva slobode.

82

IV.3. DVODIMENZIONALNE RASPODJELE


U mnotvu eksperimentalnih sluajeva, istraivaa zanima vie od jedne sluajne
varijable. Za poetak, mi emo razmotriti raspodjele vjerojatnosti kad promatramo
dvije sluajne varijable definirane na prostoru elementarnih dogaaja nekog pokusa.

Def: Neka su X i Y dvije diskretne sluajne varijable definirane na prostoru


elementarnih dogaaja nekog eksperimenta. Zdruena raspodjela vjerojatnosti
p(x,y) definirana je za svaki par toaka (x,y) kao vjerojatnost da istodobno varijabla X
poprimi vrijednost x i varijabla Y poprimi vrijednost y:
p(x,y)=P(X=x i Y=y)
primjer:
Na PMF-u studente razvrstamo prema podrujima studiranja (varijabla X) i prema spolu
(varijabla Y). Zdruenu raspodjelu vjerojatnosti za dva obiljeja (podruje i spol) moemo
prikazati tablicom:
Matematika
Fizika
Kemija
Biologija
Geo-znanosti

M
0,151
0,125
0,069
0,062
0,124

0,105
0,079
0,074
0,153
0,058

Def: Rubne (marginalne) raspodjele vjerojatnosti za varijable X i Y oznaavamo


pX(x) i pY(y), a dane su izrazima:
p X ( x ) = p ( x, y )
i
pY ( y ) = p( x, y )
yDY

xDX

primjer:
U gornjem primjeru je, npr., rubna vjerojatnost za matematiku pX(mat)=0,256 , a rubna
vjerojatnost za muki spol pY(M)=0,531.

Analogno definiramo zdruene vjerojatnosti za kontinuirane raspodjele:


Def: Neka su X i Y dvije kontinuirane sluajne varijable. Funkcija f(x,y) je njihova
zdruena funkcija gustoe vjerojatnosti ako za bilo koji dvodimenzionalni skup
A R R vrijedi

P(( X , Y ) A) = f ( x, y )dxdy
A

Posebno, ako je A dvodimenzionalni pravokutnik A = {( x, y ) : a x b, c y d },


tada je
b d

P(( X , Y ) A) = P(a x b, c y d ) = f ( x, y )dxdy


a c

Takva funkcija mora zadovoljavati uvjete:

f ( x, y ) 0 ;

f ( x, y)dxdy = 1

Zamislimo li plohu u trodimenzionalnom koordinatnom sustavu ija visina iznad


toke (x,y)A iznosi f(x,y), tada je vjerojatnost P[(x,y)A] odreena volumenom
ispod te plohe.

83

primjer:
Neka je zdruena funkcija gustoe vjerojatnosti za kontinuirane varijable X i Y dana s

6
( x + y 2 ) x [0,1] , y [0,1]
f ( x, y ) = 5

0
inace
Provjerite je li to ispravna funkcija gustoe vjerojatnosti! Izraunajte vjerojatnost da je

1
1
iY !
4
4

Def: Rubne (marginalne) funkcije gustoe vjerojatnosti za varijable X i Y


oznaavamo fX(x) i fY(y), a dane su izrazima:

f X ( x) =

f ( x, y )dy

fY ( y) =

f ( x, y)dx

primjer: U gornjem primjeru izraunajte vjerojatnost da je Y

1
bez obzira na X !
4

Nezavisne sluajne varijable

Def: Sluajne varijable X i Y su nezavisne ako za svaki par vrijednosti x i y vrijedi


p( x, y ) = p X ( x) pY ( y ) (za diskretne varijable)
ili
f ( x, y ) = f X ( x) fY ( y) (za kontinuirane varijable).
Ako ti uvjeti nisu ispunjeni za sve (x,y), kaemo da su X i Y zavisne.
Primjer: U primjeru studenata na PMF-u provjerite nezavisnost!

Uvjetne raspodjele

Def: Neka su X i Y dvije kontinuirane sluajne varijable sa zdruenom funkcijom


gustoe vjerojatnosti f(x,y) i rubnom funkcijom gustoe vjerojatnosti za varijablu X
danom s fX(x). Tada za bilo koju vrijednost varijable X ija rubna vjerojatnost je
razliita od nule definiramo uvjetnu funkciju gustoe vjerojatnosti za Y ako je
poznat X=x:
f ( x, y )
.
f Y X ( y x) =
f X ( x)
Analogno definiramo uvjetnu raspodjelu vjerojatnosti za diskretne varijable.
Primjer:

84

1. Ako znamo da je student PMF-a mukog spola, odredi uvjetnu raspodjelu


vjerojatnosti smjerova!
2. Ako znamo da u primjeru kontinuirane raspodjele vrijedi X=0,8 , odredi uvjetnu
raspodjelu vjerojatnosti za Y!

Sva razmatranja mogu se poopiti i na promatranje viedimenzionalnih raspodjela.

Momenti dvodimenzionalne raspodjele


Oekivanja
Def:

X =

x p

x p ( x, y )

( x) =

xD X

X =
Def:

Y =

x f X ( x )dx =

y p

( y) =

yDY

Y =

ili

xD X yDY

x f ( x, y )dxdy

y p( x, y )

ili

xD X yDY

y fY ( y )dy =

y f ( x, y )dxdy

Momenti
Pomoni momenti dvodimenzionalne raspodjele:

mrs =

y s p ( x, y )

ili

xDX yDY

mrs =

y s f ( x, y )dxdy

Vidimo da je m10 = X i m01 = Y


Sredinji momenti dvodimenzionalne raspodjele:

M rs =

(x ) ( y )
r

xD X yDY

p( x, y )

ili

M rs =

(x ) ( y )
r

f ( x, y )dxdy

Vidimo da je

M 20 = V ( X ) = X2
M 02 = V (Y ) = Y2

85

Kovarijanca
Cov( X , Y ) = XY = M 11
Primjer:

Skraena formula za raunanje:


Cov( X , Y ) = m11 m10 m01 = E ( X Y ) E ( X ) E (Y )

Korelacija
Kovarijanca je veliina koja nam govori o povezanosti (zavisnosti) varijabli X i Y.
Meutim, iznos kovarijance ovisi o jedinicama u kojima mjerimo. Da bismo mogli
neto rei stupnju zavisnosti, moramo tu povezanost izraziti bezdimenzionalnim
veliinama. Stoga uvodimo pojam korelacije.
Def:
Koeficijent korelacije varijabli X i Y definiran je kao
Corr ( X , Y ) = X ,Y = =

XY
X Y

Svojstva:
1. Corr ( aX + b, cY + d ) = Corr ( X , Y )
2. 1 1
3. Ako su X i Y nezavisne varijable, onda je =0. (Obrat ne vrijedi)
4. Ako je Y=aX+b onda i samo onda je =1 ili =-1.
Korelacija koja iezava ne iskljuuje povezanost veliina, nego samo linearnu
povezanost.
Korelacija blizu 1 ne znai nuno da su porast veliine X uzrokuje porast veliine Y,
nego samo da postoji veza meu njima (primjer: karijes i rjenik djece).

86

You might also like