You are on page 1of 45

Distributiile variabilelor aleatoare

Cursul 3
Pentru o populatie definita, fiecarei variable aleatoare ii este
asociata o distributie care defineste probabilitatea de aparitie a
fiecarei valori posibile a acestei variabile (daca exista un numar finit
masurabil de variabile) sau toate seturile posibile de valori posibile
(daca variabilele sunt definite pe domeniul real).
O variabla este o caracteristica observata sau masurata. O variabla
din populatia studiata poate fi aleatoare sau constanta.
Observatie: variabila este marimea care variaza de la un individ la
altul.
Ce este o variabila aleatoare?
O distribuie a probabilitatilor este un model matematic care exprima
legatura dintre valoarea variabilei si probabilitatea ei de apariie n
populaie.
Distributia probabilitatilor
Distributie discreta Distributie continua
Distributia probabilitatilor

= s s
x
x p x p 1 ) ( si 1 ) ( 0
Distribuia discret este este formata din bare a caror inaltime este
proportionala cu probabilitatea. Probabilitatea variabilei aleatoare X de
a lua valoarea x
i
este:
{ } ( )
i i
x p x x P = =
Distribuia continu este o curb neted, cu aria de sub curba egal
cu probabilitatea, astfel nct probabilitatea ca x sa se afle n intervalul
(a, b) este:
{ } ( )dx x f b x a P
b
a
}
= s s
Se aminteste ca:
(1)
(2)
Media a unei distribuii de probabilitati este o msur a
tendinei centrale a distribuiei. Media se defineste astfel:
( )
( )

=
+

1 i
discreta x ,
continua x ,
i i
x p x
dx x xf

Pentru o variabila aleatoare discreta cu N valori si p(x


i
) = 1/N,
ecuatia (3) se reduce la:
(3)
N
x
N
i
i
=
=
1

Distributia probabilitatilor
Dispersia o
2
exprima imprtierea, rspndirea sau
variabilitatea unei distribuii; este de definita astfel:
( ) ( )
( ) ( )

=
+

1 i
2
2
2
discreta x ,
continua x ,
i i
x p x
dx x f x

o
Pentru o variabila aleatoare discret cu cu N valori si p(x
i
) = 1/N,
ecuatia (4) se reduce la:
(4)
( )
N
x
N
i
=

=
1 i
2
2

o
In practica se utilizeaza abaterea standard:
( )
N
x
N
i
=

= =
1 i
2
2

o o
Distributia probabilitatilor
Distributii discrete - distributiile frecventelor relative pentru experimente
masurabile.
Raspunsuri da - nu.
Distributia Bernoulli
Distributia binomiala
Distributia binomial - negativa
Distributia Poisson
Distributia hipergeometrica
Distributia multinomiala
Suma raspunsurilor Bernoulli
Numarul de incercari
pentru al k
lea
eveniment
Puncte intr-un spatiu dat
Numarul de judecati inaintea
primului succes
Rezultate multiple posible pentru fiecare
incercare.
Distributii discrete importante
Distributia binomiala
Un proces const dintr-o secven de n incercari independente si
identice.
Incercare independenta - rezultatul fiecrui incercari nu depinde de
rezultatele incercarilor anterioare.
Rezultatul fiecrei incercari este fie un succes, fie un eec.
Daca probabilitatea succesului, p este constant pentru orice proces,
atunci numrul de succese x din n incercari are distribuia
binomial cu parametrii n si p, definiti astfel.
x n x
p p
x n x
n
x P

= ) 1 (
)! ( !
!
) (
Probabilitatea:
Media:
np =
Abaterea standard:
) 1 ( p n = t o
(5)
Distribuia binomial
Distribuia binomial se utilizeaza frecvent n ingineria de
calitate.
Este modelul de probabilitate corespunztor pentru prelevarea
de probe de la o populaie infinita unde:
p este fraciunea de produse defecte sau neconforme din
populaie.
x este numrul de articole neconforme dintr-un eantion
aleatoriu de n elemente.

De exemplu, dac p = 0,10 i n = 15, atunci probabilitatea de a
obine un produs neconform x se calculeaz cu functia
binomdist din Excel.
Forma functiilor de probabilitate binomiala
Observatie: Cu cat creste n si p se apropie de 0,5, distributia se
apropie de forma simetrica a distributiei normale.
Experiment: Se arunca 5 monede.
Evenimentul de interes: cate monede cad pe partea cap.
Pentru o moneda, probalitatea ca sa apara capul (un succes) este
p = 0.5. Numarul de capete care apar la aruncarea a 5 monede
este o variabla binomiala aleatoare cu n = 5 si p = 0.5.
nr. de capete Observat Teoretic
0 1 1.56
1 11 7.81
2 11 15.63
3 19 15.63
4 6 7.81
5 2 1.56
Experimentul se repeta de 50 de ori.
0 1 2 3 4 5
20
18
16
14
12
10
8
6
4
2
0
Exemple de distributie binomiala
Rezultat Frecventa Frecventa relativa
2 2 0.04
3 4 0.08
4 4 0.08
5 3 0.06
6 4 0.08
7 7 0.14
8 9 0.18
9 3 0.06
10 5 0.10
11 7 0.14
12 2 0.04
total 50 1.00
Doua zaruri se arunca si se insumeaza indicatiile lor (variabla
aleatoare x). Experimentul se repeta de 50 de ori.
P(x s 8) =
P(x > 6) =
P(4 s x s 10) =
33/50 =0.66
37/50 = 0.74
34/50 = 0.68
Experimentul cu doua zaruri
Probabilitatiile variabilei
aleatoare x:
O distribuie discret util n controlul statistic al calitii este distribuia
Poisson. O variabila aleatoare are distributie Poisson cu parametrul ,
daca functia de probabilitate este:
e=2.718
Distributia Poisson


= e
x
x p
x
!
) (
Un fenomen aleatoriu care apare (numarului de defecte) pe unitatea de
suprafa, de volum, de timp, etc, este aproximat cu distribuia Poisson.
Ex.: Numrul de defecte ce apar ntr-un dispozitiv semiconductor se
distribuie Poisson cu = 4. Probabilitatea ca un dispozitiv semiconductor
selectat aleatoriu sa conina dou sau mai puine defecte este:
=
o
2
=
Probabilitatea:
Media:
Dispersia:
pentru > 0
Se calculeaza cu functia POISSON din Excel
Distributia Poisson
Distributia probabilitatii Poisson pentru diferite valori ale parametrului .
Distributia hipergeometrica
Intr-o populaie finit formata din N elemente, cateva din aceste
elemente se ncadreaz ntr-o clas de interes, D(DN).

Un eantion aleatoriu de n elemente cu x elemente se ncadreaz
n clasa de interes. x apartine unei distribuii de probabilitate
hipergeometrice daca:
( ) D) min(n, ..., 0,1,2,.... x =
|
.
|

\
|
|
.
|

\
|

|
.
|

\
|
=
n
N
x n
D N
x
D
x p
Media:
Probabilitate:
Dispersia:
N
nD
=
|
.
|

\
|

|
.
|

\
|
=
1
1
2
N
n N
N
D
N
nD
o
( )! !
!
b a b
a
b
a

=
|
|
.
|

\
|
Simbol pentru combinatii
Distributia hipergeometrica
Distributia hipergeometric este modelul de probabilitate
corespunztor selectarii unui eantion aleatoriu de n obiecte,
fr nlocuire, dintr-o mulime de N elemente din care D sunt
neconforme sau cu defecte.

n aceste aplicaii, x reprezint numrul de articole neconforme
din eantion.

De ex.: se presupune c o mulime conine 100 de articole,
dintre care 5 nu sunt conforme cu cerintele. Daca 10 articole
sunt selectate la ntmplare, fr nlocuire, care este
probabilitatea de a gsi unul sau mai puine elemente
neconforme n eantion?

Se utilizeaza functia HYPGEOMDIST din Excel
Distributia Pascal i distribuii nrudite
Distribuiile Pascal, la fel ca distribuia binomial, se
bazeaza pe incercarea lui Bernoulli.
Se i-au n considerare o succesiune de incercari
independente, fiecare cu probabilitatea de succes p i se
noteaz cu x incercarea in care succesul apare al r
lea
. x
este o variabil aleatoare cu distribuie Pascal de
probabiliti definita astfel:
( ) ( ) r x 1
1
1
>
|
|
.
|

\
|

=
r x
r
p p
r
x
x p
p
r
=
( )
2
2
1
p
p r
= o
Probabilitate:
Medie:
Dispersie:
(5)
Distributia Pascal i distribuii nrudite
Dou cazuri speciale ale distribuiei Pascal se aplica in CSC

Daca r > 0
Distribuia se numete distribuia binomial negativ. Ecuaia (5)
este distribuie binomial negativ pentru r intreg.
Distribuia binomial negativ este utila pentru tipuri diferite de date
"numrabile", cum ar fi apariia neconformitilor pe unitate de
produs.
n distribuia binomial, se stabileste mrimea eantionului i se
observa numrul de succese.
In distribuia binomial negativ, se stabileste numrul de succese
i se determina dimensiunea eantionului.
Acest concept draplica n diferite tipuri de probleme de eantionare.
Dac r = 1
distribuia este geometric, adica distribuia numrului de incercari
Bernoulli pn la primul succes.
Distributia normala
Distributia Log Normal
Distributia Gamma
Distributia _
2
Distributia F
Distributia t
Distributia Weibull
Distributia Valorilor extreme
(TIp I si tip II)
Se utilizeaza pentru testele
statistice.
O mare parte a statisticii
infereniale se fundamenteaza
pe aceasta distributie
Variablele din mediul ambiental
Durata pn la eec,
Distribuii ale duratei de via
Distributii continue
Variabile aleatoare continue se definesc pentru numere cu
valori continue in domeniul real. Probabilitile se calculeaza
pentru toate seturile de numere posibile.
Distributia normala
Distribuie normal este cea mai importanta distribuie, att n
teorie cat i in aplicatiile statisticii.
Dac x este o variabil aleatoare normal, atunci distribuia de
probabilitate a lui x este:
( ) + < < =
|
.
|

\
|

x -
2
1
2
5 , 0
o

t o
x
e x f
Media distributiei
normale este (- <
< +) si dispersia este
o
2
> 0.
68% din aria totala
este intre -o si +o.
68 . 0 ) ( = + < < o o X P
Distributie simetrica definita pe intervalul (-, + ) a carei forma este
definita de doi parametri, media, , care este centrul distributiei, si
abaterea standard, o, care determina imprastierea distributiei.

+o
o
Aria=.68
Distributia normala
Functia de densitate este in forma de clopot, simetrica.
68% din aria de sub curb este ntre o.
95% din aria de sub curb este ntre 2o.
99.7% din aria de sub curb este ntre 3o.
.68
.95

o
+o +2o
2o
Proprietatile distribuiei normale
Regula empirica
Distributia normala
Distribuia cumulativ normal este definit ca probabilitatea variabilei
aleatoare normal x a:
{ } ( )
2
1
2
5 , 0
}

|
.
|

\
|

= = s
a
x
dx e a F a x P
o

t o
Integrala nu poate fi evaluata n form nchis. Se utilizeaza
schimbarea de variabil:
o

=
x
Z
Evaluarea se face independent de i o
2
:
{ }
|
.
|

\
|

u
)
`


s = s
o

o
a a
z P a x P
u() este funcia de repartiie cumulativ a distribuiei normale standard
cu = 0 si o
2
= 1.
Toate variabilele
aleatoare normale pot fi
corelate cu variabile
aleatoare normale
standard.
O variabil
aleatoare normal
standard are
media 0 i deviaia
standard 1.
Distributia normala standard
3o +3o +2o
+o
o 2o
0 +1 +2
+3
-1
-2
-3
De ce este importanta distributia standardizata?
Pentru c probabilitatea oricarui eveniment al unei
variabile aleatoare normale cu abaterea standard i
media date poate fi calculata din tabelele distribuiei
normale standard.
Distributia normala standard
RVDist-26
Tabel distributiei normale
standardizata
Z
0.0
1.0
Tabelul 1 d zonele lsate de z.
Teorema limit central
Distribuie normal se presupune ca este modelul de probabilitate
adecvat pentru o variabil aleatoare. Aceasta ipoteza trebuie
verificata.

Teorema limita centrala:
Dac x
1
, x
2
,. . . , x
n
sunt variabile aleatoare independente cu media
i dispersia o
2
i dac y = x
1
+ x
2
+. . . + x
n
, atunci distribuia:

=
=

n
i
i
n
i
i
y
1
2
1
o

se apropie distribuia N(0, 1) daca n se apropie de infinit.


Rezulta c suma a n variabile aleatoare distribuite independent este
aproximativ normal, indiferent de distribuiile variabilelor individuale.
Distribuia log-normal
Daca variabilele se coreleaza printr-o relaie exponenial, x = exp
(w) si exponentul w este o variabil aleatoare, atunci si x este o
variabil aleatoare.

Daca w se distribuie normal, distribuia lui x se numeste distribuie
log-normal. Numele rezult din transformarea ln (x) = w.

Funcia de distribuie cumulativ pentru x este:
( ) | | ( ) | | ( ) | |
( ) ( )
(


u =
(


s = s = s = s =
e
u
e
u a a
z P a w P a w P a x P a F
ln ln
ln exp
Fie w o distribuie normal cu media u i dispersia e
2
, atunci
x = exp (w) este o variabil aleatoare cu distributia log-normal.

Functia distributiei log-normal este:
( )
( ) ( )
+ < <
(


= x 0
2
ln
exp
2
1
2
2
e
u
t e
x
x
x f
|
|
.
|

\
|
+ =
2
exp
2
e
u
( ) 1
2 2
2 2
=
+ e e u
o e e
Media:
Dispersia:
Distribuia log-normal
Tema de casa
Alte tipuri de distributii continue
Variabila Z
Se standardizeaza valorile prin exprimarea acestora n functie de
abaterea standard

Se msoar distana de la medie (n cazul n care media este
ajustat la 0) la variabila:
s
x x
Z
i
i

=
Prezentarea datelor in forma standard permite ca datele sa se
compare cu datele altor distributii
Media este egala cu zero
Abaterea standard este egala cu unu
Valorile functiei de distributie standardizate se ia din tabele.

Problema: Inaltimea omului din Neanderthal
Populaia scheletelor Neanderthal
Inaltimea masurata pare s urmeze o distribuie normal
x = 163.7 cm
s = 5.79 cm

Intrebarea 1: Ce proportie a populatiei are inaltimea >165 cm?
Z = ?
Z = (165 -163.7)/5.79 = 0.23
Folosind Tabelul C-2
fdc(0.23) = 0.40905

Raspuns 40.9%
Variabila Z
.48803 .48405 .48006 .47608
fdc df(x) = 0.98
Se foloseste Tabelul C-1; cauta 0,98 rezulta Z = 2.05
Se calculeaza x din formula lui Z:
x = 2.05 5.79 + 163.7 = 175.6 cm
x Z x
i i
+ = o
Intrebarea 2: Care este inaltimea in care se incadreaza 98% din populaie?
Raspuns: H = 175,6 cm.
Variabila Z
Distribuia mediei eantionului
nu se tie forma distribuiei populaiei; se presupune
ca este o distributie normala
Se utilizeaza proprietile distribuiei normale
Se vizualizeaza distributia mediilor unui numr mare de
eantioane
de obicei dispunem de unul dintre aceste eantioane ...
nu putem ti unde se pozitioneaza media esantionului n raport cu
media populaiei, dar putem estima un interval in care ar putea fi ...
acest lucru depinde de
marimea esantionului
o estimare a dispersiei populaiei
Cu cat eantionul este mai mic i populaia mai dispersata, cu atat
probabiliatea ca media eantionul sa fie mai departe de media
populaiei este mai mare.

Acesta afirmatie se reflect n ecuaia utilizat pentru calculul dispersiei
mediei eantioanelor:

n
s
x
2
2
o
=
Distribuia mediei eantionului
Distributia mediilor corespunzatoare seturilor
aleatoare de esantioane luate dintr-o populatie tinde
spre distributia normala.

Conformitatea cu o distribuia normal crete cu
dimensiunea eantioanelor.

Mediile se distribuie n jurul valorii medii a populaiei
=
x
X
Teorema limitei centrale
Abaterea standard a mediilor esantioanelor este eroarea standard a
mediei estimate:
n
n n
s
e
o
o
o
= = =
1
2
Pe baza unui eantion, se calculeaza, cu o anumita probabilitate, un
interval care conine media populaiei utilizand eroarea standard:

n
Z x
o
o

unde Z
o
= 1.96 pentru probabilitatea 0.95
Distribuia mediei eantionului
Exemplu
varfuri de sageata n = 50
lungimea medie x = 22.6 mm
s = 4.2 mm

Eroarea standard = ??
22.6 1.964,2(50)
-0,5
22.6 1.16 mm
Cu probabilitatea de 95% media populaiei se afla n intervalul
21.4 - 23.8
594 . 0
50
2 . 4
= = =
n
s
o
n
s
Z x
o

Distribuia mediei eantionului


Interval de incredere
Intervalele de incredere sunt exprimate in termenii probabilitatii
bazate pe pragul de semnificatie o.

Un interval de incredere (1- o), exprima faptul ca probabilitatea ca
parametrul populatiei sa se gaseasca in intervalul de incredere
este 1- o, iar probabilitatea ca parametrul populatiei sa se
gaseasca in afara intervalului de incredere este o.

Cel mai des folosite sunt limitele de incredere (pragul de
semnificatie) de 95%, care indica faptul ca probabilitatea ca
valoarea mediei necunoscuta din populatie sa se afle intre
aceste limite este de 95%, iar in afara lor este de 5%.

Interval de incredere - prag de semnificatie o
Limitele de incredere ale mediei populatiei () definesc intervalul de
incredere pentru media populatiei pe baza mediei esantionului si
estimarea dispersiei populatiei.

Pentru esantioanele cu n > 30 limitele de incredere se bazeaza pe
raportul critic corespunzator probabilitatii asociate.

Pentru esantioane cu n < 30 limitele de incredere se bazeaza pe
valorile lui t din tabele, corespunzatoare numarului de grade de
libertate si probabilitatii asociate.
Limitele de incredere ale valorii medii
Distributia t
Distributia mediilor esantioanelor mici (reduse numeric) nu este
totdeauna normal distribuita, chiar daca populatia din care deriva
este normal distribuita.

Prin esantion mic se ntelege acel esantion cu n < 30.

Daca populatia este distribuita normal, distributia esantioanelor
urmeaza distributia t, distributie care reflecta o mai mare variatie
datorata sansei in comparatie cu distributia normala.

Este continua, simetrica, unimodala, variaza de la la + , este mult
mai larga in comparatie cu distributia normala.

Daca esantioanele cresc, distributia t se apropie de distributia normala,
iar pentru un numar infinit de grade de libertate cele 2 distributii sunt
identice si valorile critice ale lui t sunt egale cu raportul critic al
distributiei normale
Distributia t este simetrica, la fel ca o distributie normala, dar devine
tot mai plata odata cu micsorarea domensiunii esantionului
Distributia t
Distribuia mediei eantionului
pentru esantioane mici
Pentru a calcula intervalul de ncredere corespunzator mediei unor
esantioane cu numar mic de masuratori (normal sau aproape
normal distribuite) se utilizeaza o formula modificata:
t se obtine din tabelul probabilitatilor pentru distributia t sau
folosind progranul EXCEL.
n
t x
o
o

n tabelul distributiei t, valorile sunt grupate n functie de pragul de


semnificatie o de gradele de libertate df = n -1.

You might also like