You are on page 1of 7

Praktični dio materijala

II.1. Kratko ponavljanje osnova vjero-


jatnosti

1 Vjerojatnosne distribucije u R-u


R sadrži ugrađene procedure za većinu parametarskih familija distribucija. Uz svaku
distribuciju vežu se četiri glavne procedure:
• dimedistribucije – funkcija gustoće,
• pimedistribucije – funkcija distribucije,
• qimedistribucije – funkcija kvantila,
• rimedistribucije – slučajan broj iz distribucije.
U gornjem imedistribucije je obično kratica punog imena, primjerice norm (normalna),
binom (binomna), pois (Poissonova), unif (unifromna), exp (eksponencijalna), chisq (χ2 ),
t (Studentova T ), f (Fisherova – F ). Tako bi primjerice za normalnu distribuciju funkcije
redom bile dnorm, pnorm, qnorm, rnorm. U pozivu funkcije, nakon argumenta funkcije
gustoće (odnosno funkcije distribucije, funkcije kvantila ili željenog broja slučajnih bro-
jeva) navode se vrijednosti parametara distribucije. Neke distribucije će imati uobičajene
vrijednosti postavljene za default vrijednost parametara (vidjeti u helpu).
Napomena: drugi parametar normalne distribucije je standardna devijacija, a ne var-
ijanca.
Funkcije distribucije i gustoće neprekidnih distribucija možemo jednostavno crtati
funkcijom curve().

#D i s t r i b u c i j e u R−u
pnorm ( 0 , mean = 0 , sd = 1 ) #f u n k c i j a d i s t r i b u c i j e s t a n d a r d n e normalne u 0
pnorm ( 0 , 0 , 1 ) #i s t i p o z i v bez imena argumenata j e r su n e p o t r e b n a s
obzriom da argumente navodimo u s k l a d u s r e d o s l i j e d o m
pnorm ( 0 ) #j o š k r a ć i p o z i v j e r su 0 i 1 d e f a u l t v r i j e d n o s t i za mean i sd
dnorm ( 0 , 5 , 1 )
qnorm ( 0 . 5 ) #medijan s t a n d a r d n e normalne d i s t r i b u c i j e
rnorm ( 1 0 0 ) #100 ( pseudo ) s l u č a j n i h b r o j e v a i z s t a n d a r d n e normalne
distribucije

## NEPREKIDNE DISTRIBUCIJE
#Uniformna d i s t r i b u c i j a
c u r v e ( d u n i f ( x ) , −1, 2 , c o l= ’ r e d ’ , lwd =3, main= ’ Uniformna d i s t r i b u c i j a na
[ 0 , 1 ] ( gustoća ) ’ )
c u r v e ( p u n i f ( x ) , −1, 2 , c o l= ’ r e d ’ , lwd =3, main= ’ Uniformna d i s t r i b u c i j a na
[0 ,1] ( funkcija distribucije ) ’ )
c u r v e ( q u n i f ( x ) , 0 , 1 , c o l= ’ r e d ’ , lwd =3, main= ’ Uniformna d i s t r i b u c i j a na
[0 ,1] ( fukcija kvantila ) ’ )

1
Praktični dio materijala

#E k s p o n e n c i j a l n a d i s t r i b u c i j a
c u r v e ( dexp ( x , 0 . 5 ) , 0 , 1 0 , ylim = c ( 0 , 1 ) , c o l = ’ r e d ’ , lwd = 3 )
c u r v e ( dexp ( x , 1 ) , add = TRUE, c o l = ’ g r e e n ’ , lwd = 3 )
c u r v e ( dexp ( x , 2 ) , add = TRUE, c o l = ’ b l u e ’ , lwd = 3 )
c u r v e ( dexp ( x , 3 ) , add = TRUE, c o l = ’ o r a n g e ’ , lwd = 3 )
a b l i n e ( v = 0 , l t y = 3)
a b l i n e (h = 0 , l t y = 3)
l e g e n d ( " t o p r i g h t " , c ( e x p r e s s i o n ( lambda ==0.5) , e x p r e s s i o n ( lambda==1) ,
e x p r e s s i o n ( lambda==2) , e x p r e s s i o n ( lambda==3)) , lwd = 3 , l t y = 1 , c o l = c
( ’ red ’ , ’ green ’ , ’ blue ’ , ’ orange ’ ) )
t i t l e ( main = e x p r e s s i o n ( p a s t e ( " E k s p o n e n c i j a l n a d i s t r i b u c i j a − " , E( lambda ) )
))

#Normalna d i s t r i b u c i j a
c u r v e ( dnorm ( x , 0 , s q r t ( 0 . 5 ) ) , −4, 4 , ylim = c ( 0 , 0 . 6 ) , c o l = ’ r e d ’ , lwd =
3)
c u r v e ( dnorm ( x , 0 , 1 ) , add = TRUE, c o l = ’ g r e e n ’ , lwd = 3 )
c u r v e ( dnorm ( x , 0 , s q r t ( 1 . 5 ) ) , add = TRUE, c o l = ’ b l u e ’ , lwd = 3 )
c u r v e ( dnorm ( x , 0 , s q r t ( 2 ) ) , add = TRUE, c o l = ’ o r a n g e ’ , lwd = 3 )
a b l i n e (h = 0 , l t y = 3)
l e g e n d ( " t o p r i g h t " , c ( e x p r e s s i o n ( sigma ^2==0.5) , e x p r e s s i o n ( sigma^2==1) ,
e x p r e s s i o n ( sigma ^2==1.5) , e x p r e s s i o n ( sigma^2==2) ) , lwd = 3 , l t y = 1 , c o l
= c ( ’ red ’ , ’ green ’ , ’ blue ’ , ’ orange ’ ) )
t i t l e ( main = e x p r e s s i o n ( p a s t e ( " Normalna d i s t r i b u c i j a − " , N( 0 , sigma ^2) ) ) )

c u r v e ( pnorm ( x , 0 , s q r t ( 0 . 5 ) ) , −4, 4 , ylim = c ( 0 , 1 . 3 ) , c o l = ’ r e d ’ , lwd = 3 )


c u r v e ( pnorm ( x , 0 , 1 ) , add = TRUE, c o l = ’ g r e e n ’ , lwd = 3 )
c u r v e ( pnorm ( x , 0 , s q r t ( 1 . 5 ) ) , add = TRUE, c o l = ’ b l u e ’ , lwd = 3 )
c u r v e ( pnorm ( x , 0 , s q r t ( 2 ) ) , add = TRUE, c o l = ’ o r a n g e ’ , lwd = 3 )
a b l i n e (h = 0 , l t y = 3)
l e g e n d ( " t o p r i g h t " , c ( e x p r e s s i o n ( sigma ^2==0.5) , e x p r e s s i o n ( sigma^2==1) ,
e x p r e s s i o n ( sigma ^2==1.5) , e x p r e s s i o n ( sigma^2==2) ) , lwd = 3 , l t y = 1 , c o l
= c ( ’ red ’ , ’ green ’ , ’ blue ’ , ’ orange ’ ) )
t i t l e ( main = e x p r e s s i o n ( p a s t e ( " Normalna d i s t r i b u c i j a − " , N( 0 , sigma ^2) ) ) )

#Chi k v a d r a t d i s t r i b u c i j a
c u r v e ( d c h i s q ( x , 1 ) , 0 , 1 0 , ylim = c ( 0 , . 6 ) , c o l = ’ r e d ’ , lwd = 3 )
c u r v e ( d c h i s q ( x , 2 ) , add = T, c o l = ’ g r e e n ’ , lwd = 3 )
c u r v e ( d c h i s q ( x , 3 ) , add = T, c o l = ’ b l u e ’ , lwd = 3 )
c u r v e ( d c h i s q ( x , 5 ) , add = T, c o l = ’ o r a n g e ’ , lwd = 3 )
a b l i n e (h = 0 , l t y = 3)
a b l i n e ( v = 0 , l t y = 3)
l e g e n d ( " t o p r i g h t " , c ( ’ d f=1 ’ , ’ d f=2 ’ , ’ d f=3 ’ , ’ d f=5 ’ ) , lwd = 3 , l t y = 1 , c o l
=c ( ’ r e d ’ , ’ g r e e n ’ , ’ b l u e ’ , ’ o r a n g e ’ ) )
t i t l e ( main = e x p r e s s i o n ( p a s t e ( Chi ^2 , " d i s t r i b u c i j a s d f s t u p n j e v a s l o b o d e "
)))

#Studentova t−d i s t r i b u c i j a
c u r v e ( dt ( x , 1 ) , −3, 3 , ylim = c ( 0 , . 4 ) , c o l = ’ r e d ’ , lwd = 2 )
c u r v e ( dt ( x , 2 ) , add = T, c o l = ’ b l u e ’ , lwd = 2 )
c u r v e ( dt ( x , 5 ) , add = T, c o l = ’ g r e e n ’ , lwd = 2 )
c u r v e ( dt ( x , 1 0 ) , add = T, c o l = ’ o r a n g e ’ , lwd = 2 )

2
Praktični dio materijala

c u r v e ( dnorm ( x ) , add = T, lwd = 3 , l t y = 3 )


t i t l e ( main = " Studentova t d i s t r i b u c i j e s d f s t u p n j e v a s l o b o d e " )
l e g e n d ( " t o p r i g h t " , c ( ’ d f=1 ’ , ’ d f=2 ’ , ’ d f=5 ’ , ’ d f =10 ’ , ’ Standardna normalna ’
) , lwd = c ( 2 , 2 , 2 , 2 , 2 ) , l t y = c ( 1 , 1 , 1 , 1 , 3 ) , c o l = c ( ’ r e d ’ , ’ g r e e n
’ , ’ b l u e ’ , ’ o r a n g e ’ , par ( " f g " ) ) )

#F i s h e r o v a F−d i s t r i b u c i j a
c u r v e ( d f ( x , 1 , 1 ) , 0 , 5 , ylim = c ( 0 , 2 ) , c o l = ’ r e d ’ , lwd = 2 )
c u r v e ( d f ( x , 2 , 5 ) , add = T, c o l = ’ b l u e ’ , lwd = 2 )
c u r v e ( d f ( x , 1 0 , 5 ) , add = T, c o l = ’ g r e e n ’ , lwd = 2 )
c u r v e ( d f ( x , 5 0 , 1 5 0 ) , add = T, c o l = ’ o r a n g e ’ , lwd = 2 )
t i t l e ( main = " F i s h e r o v a F d i s t r i b u c i j e s d f 1 i d f 2 s t u p n j e v a s l o b o d e " )
l e g e n d ( " t o p r i g h t " , c ( ’ d f 1 =1, d f 2=1 ’ , ’ d f 1 =2, d f 2=5 ’ , ’ d f 1 =10 , d f 2=5 ’ , ’ d f 1
=50 , d f 2 =150 ’ ) , lwd = c ( 2 , 2 , 2 , 2 ) , l t y = c ( 1 , 1 , 1 , 1 ) , c o l = c ( ’ r e d ’ ,
’ green ’ , ’ blue ’ , ’ orange ’ ) )

## DISKRETNE DISTRIBUCIJE

#Binomna
x <− 0 : 1 0
f d <− c ( 0 , pbinom ( x , 1 0 , 0 . 5 ) )
f d . p l o t <− s t e p f u n ( x , fd , f = 0 )
par ( mfrow = c ( 1 , 2 ) )
p l o t . s t e p f u n ( f d . p l o t , x l a b = " x " , y l a b = "F( x ) " , main = " F u n k c i j a
d i s t r i b u c i j e binomne − B( 1 0 , 0 . 5 ) " , v e r t i c a l s = FALSE, pch = 1 6 )
p l o t ( x , dbinom ( x , 1 0 , 0 . 5 ) , type = " h " , main = " v j e r o j a t n o s t i " )

#P o i s s o n o v a
x <− 0 : 1 5
f d <− c ( 0 , p p o i s ( x , 5 ) )
f d . p l o t <− s t e p f u n ( x , fd , f = 0 )
par ( mfrow = c ( 1 , 2 ) )
p l o t . s t e p f u n ( f d . p l o t , x l a b = " x " , y l a b = "F( x ) " , main = " F u n k c i j a
d i s t r i b u c i j e P o i s s o n o v e − P( 5 ) " , v e r t i c a l s = FALSE, pch = 1 6 )
p l o t ( x , d p o i s ( x , 5 ) , type = " h " , pch = 1 6 , main = " v j e r o j a t n o s t i " )

#G e o m e t r i j s k a
x <− 0 : 2 0
f d <− c ( 0 , pgeom ( x , 0 . 1 ) )
f d . p l o t <− s t e p f u n ( x , fd , f = 0 )
par ( mfrow = c ( 1 , 2 ) )
p l o t . s t e p f u n ( f d . p l o t , x l a b = " x " , y l a b = "F( x ) " , main = " F u n k c i j a
d i s t r i b u c i j e g e o m e t r i j s k e − p=0.1 " , v e r t i c a l s=FALSE, pch = 1 6 )
p l o t ( x , dgeom ( x , 0 . 1 ) , type = " h " , pch = 1 6 , main = " v j e r o j a t n o s t i " )

#D i s k r e t n a uniformna
x <− 1 : 1 0
v j <− r e p ( 1 / 1 0 , 1 0 )
f d <− c ( 0 , cumsum ( v j ) )
f d . p l o t <− s t e p f u n ( x , fd , f = 0 )
par ( mfrow=c ( 1 , 2 ) )
p l o t . s t e p f u n ( f d . p l o t , x l a b = " x " , y l a b = "F( x ) " , main = " F u n k c i j a

3
Praktični dio materijala

d i s t r i b u c i j e \n d i s k r e t n e uniformne − p=0.1 " , v e r t i c a l s = FALSE, pch =


16)
p l o t ( x , vj , type = " h " , pch = 1 6 , main = " v j e r o j a t n o s t i " )
 

2 Simulacije
Pseudoslučajan broj iz intervala [0, 1] može se generirati funkcijom runif(). Neka je X
neprekidna slučajna varijabla s funkcijom distribucije F koja strogo raste od 0 do 1 na
nekom intervalu I tako da je inverz F −1 dobro definiran na (0, 1). Definirajmo slučajnu
varijablu U = F (X) te neka je FU njena funkcija distribucije. Tada je za u ∈ (0, 1)

FU (u) = P (U ≤ u) = P (F (X) ≤ u) = P (X ≤ F −1 (u)) = F (F −1 (u)) = u

pa U ima uniformnu distribuciju na (0, 1), U ∼ U(0, 1). S druge strane ako je U ∼ U(0, 1),
onda za x ∈ R
P (F −1 (U ) ≤ x) = P (U ≤ F (x)) = F (x).
Stoga slučajna varijabla F −1 (U ) ima funkciju distribucije F . Ova činjenica može se isko-
ristiti za generiranje uzoraka iz proizvoljne neprekidne distribucije. Metoda je poznata
pod nazivom metoda inverzne transformacije. Za neke distribucije ugrađene R funkcije
koriste i druge metode.

#G e n e r i r a n j e uzoraka
u n i f <− r u n i f ( 1 0 0 0 )
uzorak <− qnorm ( u n i f , 0 , 1 )

p l o t ( d e n s i t y ( uzorak ) , c o l = " r e d " )


c u r v e ( dnorm ( x , mean ( uzorak ) , sd ( uzorak ) ) , add = T)

#Za u z o r k e i z p r o i z v o l j n e d i s k r e t n e d i s t r i b u c i j e možemo n a p r a v i t i s l j e d e ć e :
x <− sample ( x = c ( 1 , 2 , 3 , 4 ) , 1 0 , r e p l a c e = TRUE, prob = c ( 0 . 1 , 0 . 2 , 0 . 5 ,
0.2) )
x
#r e p l a c e označava da s e r a d i o u z o r k o v a n j u s vraćanjem (FALSE j e d e f a u l t )
#npr . o d a b r a t i 10 b r o j e v a od 1 do 100 bez v r a ć a n j a :
sample ( 1 : 1 0 0 , 1 0 )

###SIMULACIJE GRANIČNIH REZULTATA

#CENTRALNI GRANIČNI TEOREM:


#Za n i z n . j . d . s l u č a j n i v a r i j a b l i X_i , s o č e k i v a n j e m m i konačnom
v a r i j a n c o m sigma ^2 ,
# ( \ bar {X}_n − m) / ( sigma / s q r t ( n ) ) −> N( 0 , 1 ) po d i s t r i b u c i j i .

CGT <− f u n c t i o n ( r , m, sigma , n = c ( 1 , 3 , 1 0 , 3 0 ) , N = 1 0 0 0 ) { #


f u n k c i j a , r n a z i v d i s t r i b u c i j e , m o č e k i v a n j e , n e k i argumenti imaju
default vrijednost

4
Praktični dio materijala

for ( i in n) {
x <− matrix ( r ( i ∗N) , n c o l = i )
x <− ( apply ( x , 1 , mean ) − m) / ( sigma / s q r t ( i ) ) #apply
p r i m j e n j u j e mean na x , a 1 z n a č i po r e t c i m a
h i s t ( x , c o l = ’ l i g h t b l u e ’ , p r o b a b i l i t y = T, main = p a s t e ( " n =" , i ) ,
ylim = c ( 0 , max ( . 4 , d e n s i t y ( x ) $y ) ) )
l i n e s ( d e n s i t y ( x ) , c o l = ’ r e d ’ , lwd = 3 )
c u r v e ( dnorm ( x ) , c o l = ’ b l u e ’ , lwd = 3 , l t y = 3 , add = T)
i f ( N > 100 ) { #rug d a j e male
c r t i c e i s p o d h i s t o g r a m a k o j e pokazuju g d j e su p o d a c i
rug ( sample ( x , 1 0 0 ) )
}
else {
rug ( x )
}
}
}

#P r i m j e r i za r a z n e d i s t r i b u c i j e
#Kako n r a s t e ( 1 , 3 , 1 0 , 3 0 ) − v e l i č i n a uzorka , t o j e a p r o k s i m a c i j a b o l j a
par ( mfrow = c ( 2 , 2 ) )
CGT( r u n i f , 1 / 2 , s q r t ( 1 / 1 2 ) ) #U[ 0 , 1 ] ima o č e k i v a n j e 1 / 2 i v a r i j a n c u 1 /
12

par ( mfrow = c ( 2 , 2 ) )
CGT( rexp , 1 , 1 ) #E( 1 ) ima o č e k i v a n j e 1 i v a r i j a n c u 1

#V r i j e d i i za d i s k r e t n e , a l i t r e b a p r i l a g o d i t i f u n k c i j u j e r one nemaju
default vrijednosti
#B( 2 0 , 0 . 5 ) , o č e k i v a n j e 1 0 , v a r i j a n c a 5
CGT <− f u n c t i o n ( r , m, sigma , n = c ( 1 , 3 , 1 0 , 3 0 ) , N = 1 0 0 0 ) {
for ( i in n) {
x <− matrix ( r ( i ∗N, 2 0 , 0 . 5 ) , n c o l = i )
x <− ( apply ( x , 1 , mean ) − m ) / ( sigma / s q r t ( i ) )
h i s t ( x , c o l = ’ l i g h t b l u e ’ , p r o b a b i l i t y = T, main = p a s t e ( " n =" , i ) ,
ylim = c ( 0 , max ( . 4 , d e n s i t y ( x ) $y ) ) )
l i n e s ( d e n s i t y ( x ) , c o l = ’ r e d ’ , lwd = 3 )
c u r v e ( dnorm ( x ) , c o l = ’ b l u e ’ , lwd = 3 , l t y = 3 , add = T)
i f ( N>100 ) {
rug ( sample ( x , 1 0 0 ) )
}
else {
rug ( x )
}
}
}

par ( mfrow = c ( 2 , 2 ) )
CGT( rbinom , 1 0 , s q r t ( 5 ) )

#P( 3 ) , o č e k i v a n j e 3 , v a r i j a n c a 3
CGT <− f u n c t i o n ( r , m, sigma , n = c ( 1 , 3 , 1 0 , 3 0 ) , N = 1 0 0 0 ) {

5
Praktični dio materijala

for ( i in n) {
x <− matrix ( r ( i ∗N, 3 ) , n c o l=i )
x <− ( apply ( x , 1 , mean ) − m ) / ( sigma / s q r t ( i ) )
h i s t ( x , c o l = ’ l i g h t b l u e ’ , p r o b a b i l i t y = T, main = p a s t e ( " n =" , i ) ,
ylim = c ( 0 , max ( . 4 , d e n s i t y ( x ) $y ) ) )
l i n e s ( d e n s i t y ( x ) , c o l = ’ r e d ’ , lwd = 3 )
c u r v e ( dnorm ( x ) , c o l = ’ b l u e ’ , lwd = 3 , l t y = 3 , add = T)
i f ( N>100 ) {
rug ( sample ( x , 1 0 0 ) )
}
else {
rug ( x )
}
}
}

par ( mfrow = c ( 2 , 2 ) )
CGT( r p o i s , 3 , s q r t ( 3 ) )

#Paket a n i m a t i o n − d a j e a n i m a c i j u CGT bez puno muke .


#Za v i š e p o g l e d a t i s t r a n i c u h t t p s : / / y i h u i . name/ a n i m a t i o n /
#i n s t a l l . p a c k a g e s ( " a n i m a t i o n " )
l i b r a r y ( animation )

a n i . o p t i o n s ( nmax = 1 0 0 , i n t e r v a l = 0 . 2 )
c l t . a n i (FUN = r u n i f , mean = 0 . 5 , sd = s q r t ( 1 / 1 2 ) )

a n i . o p t i o n s ( nmax = 1 0 0 , i n t e r v a l = 0 . 1 5 )
c l t . a n i (FUN = rexp , mean = 1 , sd = 1 )

#Još neke z a n i m l j i v e s i m u l a c i j e i z paketa a n i m a t i o n ( u k o l i k o ne r a d e u


Rstudiu , a n i m a c i j e s e mogu p o k r e n u t i u osnovnom R−u ) :

#Zakon v e l i k i h b r o j e v a :
ani . options ( i n t e r v a l = 0.3)
l l n . a n i (FUN = f u n c t i o n ( n , mu) r c h i s q ( n , d f = mu) , mu = 5 , cex = 0 . 6 )
dev . o f f ( )

#Buffonov pokus
a n i . o p t i o n s ( nmax = 1 0 0 0 0 , i n t e r v a l = 0 . 0 0 1 3 )
par ( mar = c ( 3 , 2 . 5 , 0 . 5 , 0 . 2 ) , pch = 2 0 , mgp = c ( 1 . 5 , 0 . 5 , 0 ) )
b u f f o n . n e e d l e ( mat = matrix ( c ( 1 , 2 , 1 , 3 ) , 2 ) )

#Galtonova k u t i j a ( " bean machine " ) − l o p t i c a z a v r š i u k−tom ž l i j e b u (


s l i j e v a na desno )
#ako k puta s k r e n e desno − t o ć e d a t i binomnu d i s t r i b u c i j u po ž l i j e b o v i m a
k o j a s e za puno
#redaka može a p r o k s i m i r a t i normalnom po CGT
a n i . o p t i o n s ( i n t e r v a l = 0 . 0 3 , nmax = 2 1 3 )
quincunx ( )

6
Praktični dio materijala

 

You might also like