Professional Documents
Culture Documents
vo U
Estadística – Grau Bioquímica
Tema 4. Models discrets
al a -
l C tic
ue ís
Miquel Calvo - Departament d’Estadística
iq ad
M st E
t.
Introducció:
ep
1
Definició de variable aleatòria
B
𝜔↦𝑋 𝜔
cada esdeveniment elemental s’associa a un número real.
vo U
el conjunt de valors numèrics que pot tenir una variable rep el nom de
recorregut de la variable i es designa amb X(Ω).
els esdeveniments elementals queden substituïts per valors numèrics que
al a -
permeten un millor tractament matemàtic.
la variable és aleatòria ja que el seu valor final depèn d'un fenomen aleatori que
es presenta amb una determinada probabilitat
l C tic
per uns mateixos resultats d'un experiment es poden construir diferents regles
d'assignació de valors numèrics als elements.
ue ís
Miquel Calvo - Departament d’Estadística 3
iq ad
M st
X=1 X=4
ep
X=2 X=5
X=3 X=6
D
2
Exemple 2: llançament de 2 daus
definim la següent regla d'assignació (numèrica) als resultats del llançament de 2 daus:
X = “assignar a cada resultat la suma de punts de les 2 cares”
B
aquesta v.a. representa cada esdeveniment elemental per un valor numèric.
vo U
els 36 possibles resultats corresponen ara a 11 possibles valors numèrics
al a -
X(Ω) = { 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
les probabilitats dels esdeveniments observables permeten calcular les dels resultats de X:
P(X =10) = P("Que la suma sigui 10“) = 1/12.
P(X ≤ 1) = P{Ø} = 0 (cap resultat té assignat un valor menor o igual a 1)
l C tic
P(X ≤ 2) = P{
P(X ≤ 3,5) = P{
} = 1/36 (només un cas té assignat un valor menor o igual a 2)
(a) P(X ≤ 6) ; (b) P(X ≤ 8,2) ; (c) P(X ≤ 12) ; (d) P(X ≤ 20) ; (e) P(2,2 < X ≤7)
t.
La variable “suma de les cares” és només una de las múltiples variables que es poden
definir sobre l’experiment associat a llançar 2 daus.
ep
3
Classificació de les variables aleatòries
Variables aleatòries discretes
B
X(Ω) = {x1, x2, ... ,xk, ...}
vo U
generalment associades a experiments on es compta el nombre de vegades que s'ha
presentat un esdeveniment.
al a -
Variables aleatòries continues
l C tic
en un interval real: mesures biomètriques, concentracions, intervals de temps, àrees, etc.
ue ís
Miquel Calvo - Departament d’Estadística 7
iq ad
M st
el model discret més simple: tots els resultats possibles tenen la mateixa probabilitat
exemple: punts de les cares d’un dau regular: p(X = 1) = p(X = 2)=…= p(X = 6)=1/6
t.
en general, si X(Ω) = {x1, x2, ... ,xk, ..., xn}, aleshores, per tot k: p(X = xk) = n-1
ep
si X verifica aquest model es diu que segueix una distribució Uniforme Discreta, s'abreuja
X ~ UD(n)
en general en els models discrets, les probabilitats dels valors del recorregut s’estableixen
mitjançant una funció que associa cada element de X(Ω) amb la seva probabilitat.
D
4
Funció de densitat uniforme discreta UD(6)
B
f (x) = 1/6 si x {1,2,3,4,5,6}
f (x) = 0 si x{1,2,3,4,5,6}
vo U
al a -
l C tic
ue ís
Miquel Calvo - Departament d’Estadística 9
iq ad
M st
F(x) = 0 si x < 1
t.
5
Funció de densitat dels models discrets
la funció de densitat es defineix com:
𝑓: ℝ → 0 , 1
B
𝑥↦𝑓 𝑥 𝑝 𝑋 𝑥 𝑝 𝜔 ∈ Ω|𝑋 𝜔 𝑥
f és nulꞏla en tot punt que no pertany a X(Ω)
vo U
tota funció de densitat discreta es pot explicitar mitjançant una taula que associí
directament punts de X(Ω) amb les seves probabilitats
al a -
1. 0 f ( x) 1
n
2. f ( x ) 1, si el recorregut és finit
i 1
i
f ( x ) 1, si el recorregut és numerable
l C tic 3.
i 1
i
Exemple annex: quina és la funció de densitat de X = suma puntuacions dels dos daus?
ue ís
Miquel Calvo - Departament d’Estadística 11
iq ad
M st
el recorregut d'una v.a. pot ser molt gran (fins i tot infinit), usualment es caracteritza
mitjançant la definició de funcions matemàtiques.
ep
𝐹: ℝ → 0 , 1
𝑥↦𝐹 𝑥 𝑝 𝑋 𝑥 𝑝 𝜔 ∈ Ω|𝑋 𝜔 𝑥
D
6
Funció de distribució discreta vs contínua
B
vo U
al a -
l C tic
ue ís
Miquel Calvo - Departament d’Estadística 13
iq ad
M st
xi x
ep
xi ≤ x < xi+1
aleshores
D
F (x) = P(X ≤ x) = P(X = x1) + P(X = x2) + ... + P(X = xi) = f (x1) + f (x2) + f (x3) + ... + f (xi)
7
Valor mig en el model uniforme discret
suposem que es llança 10 cops el dau, obtenint el resultat:
x1 = 3, x2 = 5, x3 = 6, x4 = 5, x5 = 1, x6 = 5, x7 = 2, x8 = 3, x9 = 2, x10 = 1
B
la mitjana mostral dels 10 llançaments seria doncs igual a
vo U
3 5 6 5 1 5 2 3 2 1
X 10 3.3
10
suposem que es fa una sèrie. Els resultats que s’han obtingut son (ordenats); n1 vegades 1
al a -
punt, n2 vegades 2 punts, etc., n6 vegades 6 punts. Quina és l’expressió de la mitjana?
n11 n2 2 n3 3 n4 4 n5 5 n6 6
XN ?
N
l C tic
Què podem conjecturar per una sèrie molt llarga de llançaments (N) ?
ue ís
Miquel Calvo - Departament d’Estadística 15
iq ad
M st
l'esperança matemàtica d'una v.a. és una característica numèrica que informa sobre la
localització de la variable aleatòria sobre la recta real. És un paràmetre de centralització.
definició: si X és discreta amb X(Ω) ={x1, x2, ... ,xk, ...} i densitat f (x)
t.
E( X ) x f (x )
xi X ( )
i i
ep
E(X) correspon al valor mig teòric de tots els possibles valors del recorregut, ponderats
d'acord a la seva probabilitat. És un valor constant.
D
també es pot interpretar E(X) com el centre de gravetat dels valors de la v.a associant una
massa proporcional a la funció de densitat.
quina és l’esperança de
variable aleatòria X = suma de les puntuacions dels dos daus? (veure annex)
guany jugant 10€ a un sol nombre a la ruleta? (es guanyen 350€+10€ si s’encerta)
8
Variància
B
var( X ) E[( X E ( X )) 2 ]
i és la mitjana teòrica de las desviacions al quadrat dels diferents valors que pren la variable
vo U
respecte al seu valor mig teòric o esperança.
x E ( X )
al a -
2
var( X ) i f ( xi )
xi X ( )
l C tic var( X ) E ( X ) ( E ( X )) x f ( xi ) xi f ( xi )
2 2
xi X ( )
2
i
xi X ( )
ue ís
Miquel Calvo - Departament d’Estadística 17
iq ad
M st
9
B
vo U
Models discrets més habituals
al a -
l C tic
ue ís
Miquel Calvo - Departament d’Estadística 19
iq ad
M st
El model Binomial
E
10
Propietats del model Binomial (1)
0 si k 0
n k nk
p (1 p ) si k 0,1, n k
k n
B
f (k ) P[ X k ] F (k ) P[ X k ] p i (1 p ) n i si 0 k n
i 0 i
0 en cas contrari
1 si k n
vo U
al a -
l C tic
ue ís
Miquel Calvo - Departament d’Estadística 21
iq ad
M st
11
Binomial: exemple llançament moneda
• si llancem una moneda 4 cops, el nombre de cares que podem obtenir és:
k = núm. Cares Casos
0 ++++
B
1 +++c ++c+ +c++ c+++
2 ++cc +c+c +cc+ c++c c+c+ cc++
3 ccc+ cc+c c+cc +ccc
4 cccc
vo U
el número de casos per cada k ( k = 0, 1, 2, 3, 4 ) es pot calcular com el nombre de
permutacions amb repetició de 4 elements agafats de k y 4-k (=num. combinatori 4 sobre k.)
4 4!
k k!( 4 k )!
al a -
finalment, atès que tots els casos elementals tenen la mateixa probabilitat (0,0625):
k = núm. Cares Núm. Casos Prob[X=k]
0 1 0,0625
4 4
f (k ) 0.5k (1 0.5) 4k 0.54
l C tic k
k
1
2
3
4
4
6
4
1
0,2500
0,3750
0,2500
0,0625
ue ís
Miquel Calvo - Departament d’Estadística 23
iq ad
M st
1) E(X)= n p
2) Var(X) = n p (1-p)
t.
X1 ~ B ( n = n1 ; p = p0 ) i X2 ~ B ( n = n2 ; p = p0 )
si Z = X1 + X2 ,
Z ~ B ( n = n1 + n2 ; p = p0 )
12
Exemple: probabilitats de grups sanguinis
es considera els 4 grups sanguinis clàssics. Suposem coneguda la freqüència dels 4 grups
dins la població de donants:
B
Grup O A B AB
vo U
Freqüència 45% 40% 10% 5%
al a -
1. Calen 5 donants del grup O, quina és la probabilitat de satisfer aquesta necessitat?
2. quina és la probabilitat de cap dels 8 donants sigui AB?
3. Què és més probable, que dels 8 donants exactament 2 siguin A o que menys de 6
siguin O?
l C tic
4. Igual que la 1, però amb la informació afegida que els 2 primers donants que
arriben són O i B, respectivament.
ue ís
Miquel Calvo - Departament d’Estadística 25
iq ad
M st
el model Binomial negatiu es presenta també en experiències amb resultat dicotòmic (el
resultat només pot ser A o Ac).
es pot reconèixer que una variable aleatòria X segueix el model binomial negatiu si es
presenten les següents condicions en l’experiment aleatori:
t.
13
Propietats del model Binomial negatiu
k r 1 r 1) E(X)= r (1-p) / p.
p (1 p) k si k 0,1,2
r 1
f (k ) P[ X k ] 2) Var(X) = r (1-p) / p2
B
0 en cas contrari
3) Quan r=1 és la distribució geomètrica
vo U
al a -
l C tic
Accedir a la URL http://cinna.upc.edu:3838/statmedia/Statmedia_2/
ue ís
Miquel Calvo - Departament d’Estadística 27
iq ad
M st
? 1
?
? ? 1 ?
P("menys de 3 creus abans de 4 cares") F(?) ? (1 ?) 0.3437
?
k ? ? 1
amb la mateixa distribució dels grups sanguinis que abans, quina és la probabilitat de
obtenir 5 donants de qualsevol grup no A abans de 3 del grup A
D
? ? 1 ?
f (?) ? (1 ?) 0.1045
?
? 1
14
El model Multinomial
B
es pot reconèixer que una variable aleatòria X segueix el model multinomial si es presenten
les següents condicions en l’experiment aleatori:
1. l’experiment consisteix globalment en la repetició de n experiments idèntics simples
vo U
2. en cadascun dels experiments simples, s’observa un dels A1, A2 ,..., Ar esdeveniments.
3. les probabilitats dels esdeveniments A1, A2 ,..., Ar no canvien al llarg de les n
repeticions. Es designen amb prob(Ai) = pi
al a -
4. X comptabilitza el nombre de vegades que s’ha observat cada Ai en les n
repeticions. És doncs un vector de freqüències, on la seva suma val n
El model multinomial queda totalment especificat si es coneixen els valors de:
1. n : nombre repeticions de l'experiència aleatòria en condicions independents.
l C tic
2. p=(p1, p2, ...,pk) : el vector de les probabilitats prob[Ai].
la distribució depèn només dels paràmetres n i p X ~ M ( n ; p )
ue ís
Miquel Calvo - Departament d’Estadística 29
iq ad
M st
n!
f ( k1 , k 2 , k r ) P[( X 1 k1 ) ( X 2 k 2 ) ( X r k r )] p1k1 p2k 2 prk r
k1! k 2 ! k r !
amb p1 p2 pr 1 i k1 k 2 k r n
t.
ep
2) Var(Xi) = n pi (1-pi)
D
3) Generalització del model Binomial. Quan r=2 el model Multinomial correspon a una
Binomial on A1=A i A2=Ac.
15
Exemple: probabilitats de grups sanguinis
B
Grup O A B AB
Freqüència 45% 40% 10% 5%
vo U
a un banc de sang arriben 8 donants. Quines son les probabilitats de
1. que tinguem el mateix nombre de donants de cada grup sanguini?
al a -
2. que dels vuit donants, tres siguin del grup O, dos del grup AB i la resta del grup A o
del grup B
3. que la suma de donants dels grups O i B sigui el triple que la suma de donants dels
grups A i AB
l C tic
Quin és el nombre esperat de donants de cada grup sanguini?
ue ís
Miquel Calvo - Departament d’Estadística 31
iq ad
M st
El model Hipergeomètric
E
mateix context que el model Binomial es presenta en experiències amb resultat dicotòmic
(el resultat només pot ser A o Ac). La diferència radica en que les repeticions son
dependents. S’aplicaria en mostratges sense reemplaçament i poblacions finites.
t.
16
El model de Poisson
B
k
e si k 0,1,2
vo U
k!
f (k ) P[ X k ]
0 en cas contrari
al a -
el model es caracteritza per un sol paràmetre λ que ha de ser positiu.
distribució associada a comptatges del tipus número d'individus per unitat de temps,
longitud, àrea, volum, usualment d’esdeveniments poc probables.
en un procés de Poisson, el nombre d’èxits en el temps t segueix una distribució P (λ t)
l C tic
el model de Poisson s’utilitza també com una aproximació de la binomial.
ue ís
Miquel Calvo - Departament d’Estadística 33
iq ad
M st
El procés de Poisson
E
1. 𝑋 = 0
ep
2. Per a tot n > 0, si t1< t2 < ...< tn les variables X(t1), X(t2)-X(t1),..., X(tn)-X(tn-1) són
mútuament independents i igualment distribuïdes
3. Per tot t > 0, 𝑝 𝑋 𝑡 1 λt 𝑜 𝑡
4. Per tot t > 0, 𝑝 𝑋 𝑡 2 𝑜 𝑡
D
17
Exemple: desintegració d’un radioisòtop
B
després d'observar diferents períodes d’un minut s’observa que en 1 de cada 20 no es
detecta cap desintegració. Acceptant aquest valorat com la probabilitat de l’esdeveniment:
p[X=0] = 1/20 = 0.05
vo U
per tant p[X=0] = f(0) = e-λ
igualant aquesta expressió amb la quantitat obtinguda de la mostra:
0.05 = e-λ → λ = - ln(0.05) = 2.9957
al a -
Conclusió: el nº de cpm té distribució de Poisson de paràmetre λ=2.9957
Calcular la probabilitat de:
1. detectar exactament 3 centelleigs.
l C tic
2. detectar dos o més centelleigs
quina és la distribució de X60 = “centelleigs per hora"? .
ue ís
Miquel Calvo - Departament d’Estadística 35
iq ad
M st
1) E(X) = λ
3) La suma de 2 v.a. independents Poisson és una v.a. també Poisson amb paràmetre igual a
ep
la suma de paràmetres:
X1 ~ P (λ = λ1) i X2 ~ P (λ = λ2)
si Z = X1 + X2 aleshores Z ~ P (λ = λ1 + λ2)
D
4) El resultat 3) implica que sumar n v.a. independents Poisson segueix una Poisson de
paràmetre igual a la suma de paràmetres. Permet també fàcilment determinar el model i el
paràmetre de una Poisson al canviar la unitat física de mesura de la v.a.
18
Aproximació de la Binomial a la Poisson
la Poisson pot definir-se com la generalització a un suport continu d’un procés de
Bernouilli, amb n → ∞ i per tal que nꞏp = λ (constant) és necessari que p → 0.
B
vo U
al a -
l C tic
Accedir a la URL http://cinna.upc.edu:3838/statmedia/Statmedia_2/
ue ís
Miquel Calvo - Departament d’Estadística 37
iq ad
M st
simplificant la situació real, suposem que es disposa d’una solució que conté 5× 106
individus de E.coli per cm3.
t.
19
B
vo U
Annex: càlculs i gràfics dels exemples
al a -
l C tic
ue ís
Miquel Calvo - Departament d’Estadística 39
iq ad
M st
Ω esta format per 36 possibles combinacions, si suposem els daus regulars totes
les possibles parelles tenen probabilitat:
p (i , j) = 1/36.
D
20
Llançament 2 daus: funció de densitat de la suma
amb la v.a. Assignar a cada resultat la suma de punts de les cares on cal 1er especificar
X(Ω) = { 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
B
i després cal determinar per a tot punt x de la recta real prob( X = x).
vo U
al a -
l C tic
Problema: estudiar la densitat de "El menor dels punts de les 2 cares al llançar 2 daus"
ue ís
Miquel Calvo - Departament d’Estadística 41
iq ad
M st
amb la v.a. Assignar a cada resultat la suma de punts de les cares on cal 1er especificar
X(Ω) = { 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
i després cal determinar per a tot punt x de la recta real prob( X <= x).
t.
ep
D
Problema: estudiar la distrib. de "El menor dels punts de les 2 cares al llançar 2 daus"
21
Llançament 2 daus: funció de distribució de la suma -2
X = suma de punts de les cares al llançar 2 daus
B
vo U
al a -
Algunes probabilitats són:
P(X ≤ 1) = F (1) = 0 P(X ≤ 3,5) = F (3,5) = 3/36 = f (2) + f (3)
l C tic
P(X < 6) = F (6) - f (6) = 15/36 - 5/36 = 10/36 = f (2) + f (3) + f (4) + f (5)
P(2,2<X≤7) = F(7) - F(2,2) = 21/36 - 1/36 = 20/36 = f (3) + f (4) + f (5) + f (6) f (7)
P(2<X<7) = F (7) - f (7) - F (2) = 21/36 - 6/36 - 1/36 = 14/36= f (3) + f (4) + f (5) + f (6)
ue ís
Miquel Calvo - Departament d’Estadística 43
iq ad
M st
es vol calcular el valor mig teòric de la variable X = "Suma de punts de las 2 cares“
es pot considerar la variable "suma de punts de les 2 cares“ com la suma de 2s variables
que representen la puntuació de cada dau. L'esperança de la suma és la suma de les
esperances de cada variable sumada.
D
Es proposa el següent joc: "Llança 2 daus, si la suma dels punts és menor o igual a 6
guanyes 100 €, però si és més gran que 6 tens que pagar 90 €".
22
Càlculs dels exemples del model Binomial Negatiu
• en llançar successivament una moneda quina és la probabilitat de
• obtenir 10 creus abans d’aconseguir 4 cares:
10 4 1 4
B
13!
f (10) 0.5 (1 0.5)10 0.514 0.0175
4 1 3!10!
vo U
2
k 4 1 4
F (2) 0.5 (1 0.5) 0.0625 0.1250 0.1562 0.3437
k
k 0 4 1
amb la mateixa distribució dels grups sanguinis que abans, quina és la probabilitat de
obtenir 5 donants de qualsevol grup no A abans de 3 del grup A
al a -
5 3 1 3
f (5) 0.4 (1 0.4) 0.1045
5
3 1
obtenir més de 5 donants de qualsevol grup no O abans de 2 del grup O
l C tic 5
1 F (5) 1
k 2 1
k 0 2 1
0.452 (1 0.45) k 1 0.8976 0.1024
ue ís
Miquel Calvo - Departament d’Estadística 45
iq ad
M st
amb la mateixa distribució dels grups sanguinis que abans, quina és la probabilitat de
2!2!2!2!
2. convé colꞏlapsar en una distribució Multinomial amb tres classes possibles: O, AB i
ep
23
No utilitzades
B
vo U
al a -
l C tic
ue ís
Miquel Calvo - Departament d’Estadística
iq ad
M st
Situació 1
• es llença un sol cop un dau regular
• el recorregut de la variable “puntuació del dau” és:
t.
X(Ω) = { , , , , , }
•
ep
Situació 2
• el prestatge 23 de l’estabulari disposa 7 rates Sprague-Dawley que,
segons el registre, pesen 0.45, 0.6, 0.55, 0.63, 0.35, 0.49 i 0.6 kilograms.
D
X(Ω) = { , , , , , }
24
Representació densitat dau regular
Situació 1: les probabilitats dels diferents possibles valors de X son
idèntiques, corresponen a una uniforme discreta de 6 valors:
B
X=1 X=4
vo U
X=2 X=5
X=3 X=6
al a -
tots els resultats possibles de la variable aleatòria tenen la mateixa
probabilitat, el recorregut és X(Ω) = {1, 2, 3, 4, 5, 6}, i per tot k de X(Ω)
P(X = k) = 1/6
l C tic
25