Professional Documents
Culture Documents
aleatòries
Selecció d’activitats resoltes
Jose Fco. Martínez Boscá, Arnau Mir Torres, Lluís M. Pla Aragonés,
Àngel J. Gil Estallo (autors) i Ángel A. Juan (editor)
© FUOC • 5 Variables aleatòries
Introducció
I una variable aleatòria és una funció que ens relaciona l'espai mostral del
nostre experiment aleatori en el conjunt de nombres, de manera que hem
reduït l'estudi d'aplicar la teoria de les probabilitats a l'espai mostral a l'estudi
d'aplicar les probabilitats a un conjunt àmpliament conegut, com és el con-
junt de nombres.
correu de tots els usuaris. El nostre objectiu és assignar les peticions entrants
de correu al servidor “més” adequat, de manera que el temps d'espera “mit-
jà” de tot el sistema sigui el mínim possible.
© FUOC • 7 Variables aleatòries
Mapa conceptual
Activitats Resoltes - Variables aleatòries
Ángel Gil
Solució
a) Considerem la variable aleatòria X que ens diu quantes empreses han pujat d’entre
les 50 escollides l’últim any. Aquesta variable aleatòria es distribueix segons una
Binomial de paràmetres p = 0.6 i n = 50. Ens demanen trobar la probabilitat següent:
p(X < 20) = p(X Æ 19) Realitzem el càlcul anterior amb R usant alguna de les
instruccions relacionades amb la distribució binomial, que són:
• dbinom(x, size, prob, log = FALSE)
• pbinom(q, size, prob, lower.tail = TRUE, log.p = FALSE)
• qbinom(p, size, prob, lower.tail = TRUE, log.p = FALSE)
• rbinom(n, size, prob)
Concretament la primera (dbinom) és la funció de densitat i calcula p(X = x); la segona
(pbinom) és la funció de distribució i calcula p(X Æ x); la tercera (qbinom) és la funció
de distribució inversa, i donat q entre 0 i 1 calcula el valor de x tal que p(X Æ x) = q;
finalment l’última (rbinom) serveix per obtenir mostres aleatòries de la distribució
binomial. Per tant en el nostre cas usarem pbinom amb x = 10, size = 50 i p = 0.6
amb el que P (X Æ 19) = pbinom(19.50, 0.6) i obtenim
pbinom(c(19), size=50, prob=0.6, lower.tail=TRUE)
## [1] 0.001373762
pel que probabilitat buscada val aproximadament 0.00137
1
b) Considerem la variable aleatòria Y que ens diu el nombre d’empreses a les quals hem
de cridar fins que hi hagi una que no hagi pujat en la borsa l’any anterior. La variable
Y es distribueix segons una variable geomètrica de paràmetre p = 0.4, ja que hi ha
un 40% de probabilitat que una empresa no hagi pujat en la borsa durant l’últim any.
En mitjana, haurem de cridar E(Y ) vegades. Usant que l’esperança d’una distribució
geomètrica val p1 , el nostre cas haurem de cridar a un total de 0.4
1
= 2.5 empreses. És a
dir, haurem de cridar a tres empreses fins a trobar a una que no hagi pujat en la borsa
l’any anterior.
Solució
Considerem la variable X1 dependent d’un paràmetre t que ens dóna el nombre de missatges
amb virus que arriben en t hores. La distribució de la variable X1 és de Poisson de paràmetre
2t, ja que si arriben, en mitjana, 48 missatges amb virus en 24 hores, arriben, en mitjana
48
24
t = 2t missatges amb virus en t hores. Ens demanen p(X1 = 3) (probabilitat que arribin 3
virus en 1 hora), p(X3 = 0) (probabilitat que no arribin virus en 3 hores) i p(X168 > 500)
(probabilitat que arribin més de 500 missatges en una setmana que té 24 ú 7 = 168 hores).
Calculem les probabilitats anteriors amb R.
Si volem usar instruccions de R; haurem d’usar alguna de les relacionades amb la distribució
de Poisson, que són
• dpois(x, lambda, log = FALSE)
• ppois(q, lambda, lower.tail = TRUE, log.p = FALSE)
• qpois(p, lambda, lower.tail = TRUE, log.p = FALSE)
• rpois(n, lambda)
on com en el cas anterior, la que comença per “d” correspon a la funció de densitat, la que
comença per “p” correspon a la funció de distribució, la que comença per “q” al revés de
la distribució, i la que comença per “r” genera mostres aleatòries de la distribució. Vegem
doncs els càlculs que cal fer
dpois(3, lambda=2)
2
## [1] 0.180447
Per tant p(X1 = 3) = 0.180447.
dpois(0, lambda=6)
## [1] 0.002478752
Per tant p(X3 = 0) = 0.0024788.
Finalment
ppois(500,lambda=336,lower.tail=FALSE)
## [1] 2.910482e-17
Per tant p(X168 > 500) = 2.910482 ◊ 10≠17 .
El mateix resultat s’obté amb
1-ppois(499,lambda=336)
## [1] 0
ja que la probabilitat buscada és pràcticament 0, Per tant, és molt improbable que arribin
més de 500 missatges amb virus en una setmana.
Solució
a) Considerem la variable T que ens dóna el temps que triga l’empresa a trobar l’antivirus
per a cada virus nou. Ens diuen que la distribució de T és normal de mitjana µ = 10 dies
i desviació típica ‡ = 4 dies. Ens demanen trobar la probabilitat següent: p(8 < T < 12).
Abans de trobar la probabilitat anterior amb R, escriguem-la en termes de la funció de
3
distribució: p(8 < T < 12) = p(T Æ 12) ≠ p(T Æ 8) Per tant, hem de trobar la funció
de distribució d’una normal de mitjana µ = 10 dies i desviació típica ‡ = 4 dies en els
punts 12 i 8. Per fer-ho, podem usar les funcions relacionades amb la normal, que són,
en la línia de les introduïdes per a la binomial i la Poisson, les següents
• dnorm(x, mean = 0, sd = 1, log = FALSE)
• pnorm(q, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
• qnorm(p, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
• rnorm(n, mean = 0, sd = 1)
Així doncs cal calcular p(8 < T < 12) = p(T Æ 12) ≠ p(T Æ 8) =
pnorm(12, mean = 10, sd = 4) ≠ pnorm(8, mean = 10, sd = 4) amb el que
obtenim
pnorm(12,mean=10,sd=4)-pnorm(8,mean=10,sd=4)
## [1] 0.3829249
b) En termes de probabilitats, ens diuen que p(T < x) = 0.95. Per tant, hem de trobar x
tal que la funció de distribució de la variable normal de mitjana µ = 10 dies i desviació
típica ‡ = 4 dies en x val 0.95. Per trobar aquest valor de x, podem usar directament
la funció qnorm (que és la inversa de la funció de distribució) de la següent forma:
qnorm(0.95,mean=10,sd=4)
## [1] 16.57941
Amb el que podem afirmar que el 95% de les vegades trobem un antivirus en menys de
16.58 dies.
Solució
a) Considerem la variable X que ens dóna el nombre de missatges SPAM d’entre els 50
missatges que hem rebut. La distribució de la variable X serà binomial de paràmetres
700
n = 50 i p = 1000 = 0.7. Ens demanen la probabilitat que almenys 20 missatges
4
no siguin SPAM, que és el mateix que dir la probabilitat de rebre com a màxim 30
missatges SPAM. Escrit en termes de probabilitats, ens demanen p(X Æ 30). Per
calcular-ho en R podem fer-ho amb la instrucció pbinom de la següent forma:
pbinom(30,50,0.7)
## [1] 0.0848026
La probabilitat demanada val, aproximadament, 0.085.
b) Ens demanen la probabilitat següent p(X = 50). Per calcular-ho en R podem usar la
funció dbinom de la següent forma:
dbinom(50,50,0.7)
## [1] 1.798465e-08
La probabilitat, per tant, és pràcticament nul·la.
c) En general, la mitjana d’una variable Binomial de paràmetres n i p val I(X) =
np, V ar(X) = np(1 ≠ p). Substituint els paràmetres en el nostre cas, obtenim que el
nombre esperat de missatges SPAM és I(X) = np = 50 ú 0.7 = 35 missatges, mentre
que la seva variància val V ar(X) = np(1 ≠ p) = 50 ú 0.7 ú 0.3 = 10.5.
Per exemple, la probabilitat que un client estigui connectat 3 hores (en l’arrodoniment) i se
li cobri 2 hores per hora val 0.04. I així successivament. El cobrament total al client serà
Z = X ú Y . Trobar la funció de probabilitat i de distribució de la variable Z així com la seva
esperança i la seva variància.
5
Solució
Calculem primer els valors que pot aconseguir la variable aleatòria Z. Aquests seran: Z( ) =
{1, 2, 3, 4, 5, 8, 9, 12}. Aquests valors s’han obtingut multiplicant els valors de la variable X
pels valors de la variable Y :
En la taula anterior veiem de quina forma es poden obtenir els valors de Z. Trobem a
continuació la funció de probabilitat de la variable Z:
p(Z = 1) = p(X = 1, Y = 1) = 0
p(Z = 2) = p(X = 1, Y = 2) + p(X = 2, Y = 1) = 0.10 + 0.06 = 0.16
p(Z = 3) = p(X = 1, Y = 3) + p(X = 3, Y = 1) = 0.40 + 0.06 = 0.46
p(Z = 4) = p(X = 2, Y = 2) + p(X = 4, Y = 1) = 0.10 + 0.10 = 0.20
p(Z = 6) = p(X = 2, Y = 3) + p(X = 3, Y = 2) = 0.10 + 0.04 = 0.14
p(Z = 8) = p(X = 4, Y = 2) = 0.04
p(Z = 9) = p(X = 3, Y = 3) = 0
p(Z = 12) = p(X = 4, Y = 3) = 0
A posteriori, veiem que Z només aconsegueix els valors 2, 3, 4, 6 i 8 i la funció de probabilitat
queda indicada en la taula següent:
x 2 3 4 6 8
p(X = x) 0.16 0.46 0.20 0.14 0.04
6
I(Z) = 2 · 0.16 + 3 · 0.46 + 4 · 0.20 + 6 · 0.14 + 8 · 0.04 = 3.66
El client paga de mitjana 3.66 euros.
La seva variància serà:
Var(Z) = 22 · 0.16 + 32 · 0.46 + 42 · 0.20 + 62 · 0.14 + 82 · 0.04 ≠ 3.662 = 2.1844.
Solució
Considerem la variable X que ens diu el nombre de terminals preparades per transmetre
missatges en un moment qualsevol del dia de les 50 terminals. La distribució de X serà
Binomial de paràmetres n = 50 i p = 0.7
En primer lloc ens demanen la probabilitat que exactament 16 terminals estiguin preparades
per transmetre a les 8.00 hores del matí, o, escrit en funció de X,n = 50 i p(X = 50). Per
calcular-ho en R usem:
dbinom(16,50,0.7)
## [1] 2.728865e-08
Com podem observar, la probabilitat és pràcticament nul·la.
A continuació ens demanen la probabilitat que com a mínim 25 terminals estiguin preparades
per transmetre a les 12.00 hores del matí. Escrit en termes de la variable X, ens demanen
p(X Ø 25). Si escrivim la probabilitat anterior en termes de la funció de distribució de X,
tenim p(X Ø 25) = 1 ≠ p(X Æ 24). En R podem usar directament la funció pbinom de la
següent forma:
1-pbinom(24,50,0.7)
## [1] 0.9990668
Concloem que és molt probable que hi hagi com a mínim 25 terminals preparades per
transmetre a les 12.00 hores.
7
Finalment, ens demanen la probabilitat que hi hagi entre 20 i 40 terminals ambdues inclu-
sivament preparades per transmetre a les 14.00 hores. Si escrivim aquesta probabilitat en
termes de X, tenim p(20 Æ X Æ 40). Escrivint aquesta probabilitat en termes de la funció
de distribució de X, tenim: p(20 Æ X Æ 40) = p(19 < X Æ 40) = p(X Æ 40) ≠ p(X Æ 19)
Hem de calcular la funció de distribució de X per als valors 40 i 19. Procedint de la mateixa
forma com en el cas del càlcul de la probabilitat anterior, tenim els següents resultats que
ens dóna R:
pbinom(40,50,0.7)-pbinom(19,50,0.7)
## [1] 0.9597655
Solució
En primer lloc, hem de calcular la probabilitat que un treball estigui finalitzat a les 10.01 h.,
o p(X Æ 1) on X recordem que ens dóna el temps que triga la impressora a processar un
treball. En R es calcula de la següent forma:
pexp(1,1/12)
## [1] 0.07995559
Per calcular la probabilitat que a les 10.02 h. encara no estigui finalitzat un treball, hem de
calcular p(X > 2):
1-pexp(2,1/12)
## [1] 0.8464817
8
Dos experts en ordinadors treballen per a una certa empresa com a informàtics. El primer
expert s’encarrega del 60% de les reparacions i el segon del 40%. El temps que triga el
primer expert a reparar un ordinador segueix una distribució exponencial de paràmetre
⁄1 = 3 hores≠1 i el temps que triga el segon expert a reparar un ordinador segueix una
distribució exponencial de paràmetre ⁄2 = 2 hores≠1 . S’ha enviat a reparar un ordinador fa
30 minuts i encara segueix avariat. Quina és la probabilitat que el primer expert treballi en
la reparació d’aquest ordinador? Quin és el temps mitjà de reparació d’un ordinador per a
l’empresa?
Solució
Considerem la variable T1 que ens diu el temps que triga el primer expert i T2 el temps
que triga el segon expert. Definim els successos E1 : “reparació realitzada pel primer
expert” i E2 : “reparació realitzada pel segon expert”. Ens donen les probabilitats següents:
p(E1 ) = 0.6, p(E2 ) = 0.4.
Ens diuen que fa 30 minuts que un ordinador està en reparació i encara no s’ha reparat.
Sigui T la variable que ens dóna el temps de reparació d’un ordinador per l’empresa. Ens
demanen trobar la probabilitat següent: p (E1 |T > 0.5). O sigui, ens demanen la probabilitat
que l’ordinador sigui reparat pel primer expert suposant que es triga més de 30 minuts (0.5
hores) a reparar-ho. Per trobar la probabilitat anterior, usarem la regla de Bayes:
Les probabilitats p (T > 0.5|E1 ) i p (T > 0.5|E2 ) són fàcils de calcular, ja que sabem la
distribució dels temps que triga cadascun dels experts:
p (T > 0.5|E1 ) = p (T1 > 0.5) = e≠⁄1 ú0.5 = e≠3ú0.5 = e≠1.5 ƒ 0.2231
p (T > 0.5|E2 ) = p (T2 > 0.5) = e≠⁄2 ú0.5 = e≠2ú0.5 = e≠1 ƒ 0.3679
0.6 · 0.2231
p (E1 |T > 0.5) = ƒ 0.4764
0.6 · 0.2231 + 0.4 · 0.3679
Per trobar el temps mitjà, usarem l’expressió següent:
9
Activitat 9. Estudi de la falla d’un sistema informàtic.
Variable exponencial.
Un sistema informàtic està basat en dos mòduls independents A i B. Una fallada de qualsevol
dels dos mòduls causa una fallada del sistema. La durada de cadascun dels mòduls segueix
una distribució exponencial de paràmetres ⁄1 = 1 any ≠1 i ⁄2 = 2 anys ≠1 , respectivament.
Es demana:
a) Quina és la probabilitat que el sistema funcioni almenys 2 anys sense tenir una fallada?
b) Si el sistema va fallar en els dos primers anys, quina és la probabilitat que la fallada
hagi estat a causa del mòdul B però no del mòdul A?
Solució
a) Considerem les variables S, T1 i TB que ens dóna el temps de durada del sistema fins
que hi ha una fallada, el temps de durada del mòdul A i el temps de durada del mòdul
B, respectivament. Intentem esbrinar si la distribució de la variable S és coneguda.
Per a això, calculem primerament: p(S > t) = p (TA > t fl TR > t), ja que si el sistema
ha durat més de t anys, els mòduls A i B també. Usant que els mòduls A i B són
independents, obtenim que la probabilitat anterior es pot calcular com:
p(S > t) = p (TA > t fl TB > t) = p (TA > t) · p (TB > t) = e≠t · e≠2·t = e≠3t .
Concloem que la variable S segueix la distribució exponencial de paràmetre ⁄ =
3 anys ≠1 .
Ens demanen la probabilitat següent: p(S > 2) = e≠32 = e≠6 ƒ 0.00248
b) Ens demanen trobar la probabilitat següent: p(TB Æ 2 fl TA > 2|S Æ 2), ja que sabem
que el sistema va fallar en els dos primers anys (S Æ 2) i ens demanen la probabilitat
que la fallada sigui deguda el mòdul B (TB Æ 2) i no al mòdul A (TA > 2). Usant
la fórmula de la probabilitat condicionada obtenim que la probabilitat anterior pot
calcular-se com:
p (TB Æ 2 fl TA > 2 fl S Æ 2)
p (TB Æ 2 fl TA > 2|S Æ 2) = .
p(S Æ 2)
Usant que el succés TB Æ 2 fl TA > 2 està inclòs en el succés S Æ 2, la probabilitat
anterior val:
p (TR Æ 2 fl TA > 2 fl S Æ 2) p (TB Æ 2 fl TA > 2)
p (TB Æ 2 fl TA > 2|S Æ 2) = = .
p(S Æ 2) p(S Æ 2)
10
Activitat 10. Durada d’un processador.
Variable normal.
La durada d’un processador segueix una distribució normal de mitjana 50000 hores i desviació
típica 100 hores. Si volem que només fallin el 3%, que val la x en la següent frase de la
campanya promocional del processador: “Processadors que duren més de x hores!”. Quina
és la probabilitat que un processador d’aquest tipus duri més de 7 anys en un servidor que
funciona les 24 hores?
Solució
Si volem que només fallin el 3%, la x en la campanya promocional ha de complir p(T > x) =
0.97 on recordem que T és la variable que ens dóna la durada del processador. En R hem de
realitzar l’operació següent:
qnorm(0.03,50000,100)
## [1] 49811.92
A continuació, ens demanen la probabilitat que un processador d’aquest tipus duri més de 7
anys en un servidor que funciona les 24 hores, o p(T > 61320) = 1 ≠ p(T Æ 61320):
1-pnorm(7*365*24,50000,100)
## [1] 0
11
Solució
a) Sigui T el temps d’impressió d’un treball qualsevol pel laboratori. Ens diuen que T < 5
minuts i ens demanen la probabilitat que hagi estat imprès per la impressora II. Escrit
matemàticament: p(II|T < 5). Podem trobar la probabilitat anterior usant la fórmula
de Bayes:
Les probabilitats p(T < |I) i p(T < 5|II) es poden calcular en conèixer-se la distribució
dels temps de les impressores I i II: p(T < 5|I) = 1 ≠ e≠1/2·5 = 1 ≠ e≠2.5 ƒ 0.918, p(T <
5|II) = 5≠0
5≠0
0.6ú1
= 1. La probabilitat anterior val: p(II|T < 5) = 0.4ú0.918+0.6ú1 ƒ 0.620.
b) Usem el mateix mètode que hem usat a l’apartat anterior per calcular la probabilitat
demanada:
p(T <1 3) = p(I)2· p(T < 3|I) + p(II) · p(T < 3|II) =
0.4 · 1 ≠ e≠1/2·3 + 0.6 · (3≠0)
(5≠0)
= 0.4 · (1 ≠ e≠1.5 ) + 0.6 · 0.6 ƒ 0.671
12
Solució
p(T > 0.5) = p(I) · p(T > 0.5|I) + p(II) · p(T > 0.5|H) =
(0.5≠20/60)
0.8 · e≠2·0.5 + 0.2 · (40/60≠20/60) ƒ 0.394
En l’expressió anterior hem usat que la distribució del temps de connexió per la línia II
és una variable uniforme de paràmetres a = 20/60 minuts i b = 40/60 minuts.
b) Ens diuen que T < 20/60 minuts ƒ 0.33 minuts i ens demanen p(I|T < 0.33). Trobarem
la probabilitat anterior usant la fórmula de Bayes:
Adreces d’interès
13