You are on page 1of 17

Variables

aleatòries
Selecció d’activitats resoltes

Jose Fco. Martínez Boscá, Arnau Mir Torres, Lluís M. Pla Aragonés,
Àngel J. Gil Estallo (autors) i Ángel A. Juan (editor)
© FUOC • 5 Variables aleatòries

Introducció

Resoldre problemes aleatoris usant la teoria de les probabilitats pot resultar


molt complicat a causa de la complexitat que pot presentar l'espai mostral.

Per exemple, imaginem que estem interessats a estudiar les peticions a un


servidor web d'una empresa per part d'un conjunt d'usuaris. Establir l'espai
mostral d'aquest estudi pot resultar molt complicat. Llavors, hem de pregun-
tar-nos, en què estem interessats realment? Suposem que sigui en l'evolució
de les peticions diàries. En aquest cas, el nostre estudi es redueix a una quan-
titat numèrica. Per tant, hem de relacionar el nostre espai mostral amb la
quantitat numèrica objecte del nostre estudi. Aquesta relació es denomina
variable aleatòria.

I una variable aleatòria és una funció que ens relaciona l'espai mostral del
nostre experiment aleatori en el conjunt de nombres, de manera que hem
reduït l'estudi d'aplicar la teoria de les probabilitats a l'espai mostral a l'estudi
d'aplicar les probabilitats a un conjunt àmpliament conegut, com és el con-
junt de nombres.

Les aplicacions de les variables aleatòries a les ciències de la computació són


múltiples i variades. En destaquem les següents: la simulació, els processos
estocàstics i la teoria de cues.

La simulació intenta trobar probabilitats de successos simulant el comporta-


ment de variables aleatòries. Vegem l'exemple següent: suposem que una
empresa té 250 empleats. Cada minut, la probabilitat que un empleat enviï
una petició al servidor de correu és 0,3. Coneixem la distribució de la varia-
ble aleatòria que ens dóna el nombre de peticions enviades per un usuari per
minut i la distribució de la variable aleatòria del temps que triga el servidor a
processar una petició. Sabent que les peticions es processen consecutiva-
ment, quina és la probabilitat que es processin totes les peticions enviades en
menys d'una hora? Resoldre el problema anterior directament és molt com-
plicat, però simulant les peticions en un ordinador es pot obtenir una respos-
ta aproximada de la probabilitat demanada.

Els processos estocàstics estudien l'evolució d'un determinat procés al llarg


del temps. Aquest procés es modelitza mitjançant una variable aleatòria i
s'estudia l'evolució d'aquesta variable aleatòria. Per exemple, l'ús de la CPU
d'un ordinador es pot considerar un procés estocàstic. La teoria de cues in-
tenta resoldre i assignar peticions a servidors intentant optimitzar el temps
d'espera de les peticions. Per exemple, tenim una empresa amb quatre servi-
dors de correu sortint i aquesta ha de gestionar les peticions d'enviament de
© FUOC • 6 Variables aleatòries

correu de tots els usuaris. El nostre objectiu és assignar les peticions entrants
de correu al servidor “més” adequat, de manera que el temps d'espera “mit-
jà” de tot el sistema sigui el mínim possible.
© FUOC • 7 Variables aleatòries

Mapa conceptual
Activitats Resoltes - Variables aleatòries
Ángel Gil

Activitat 1. Estudi de la pujada en borsa de les empreses


de telecomunicacions.
Variables aleatòries discretes.
a) Se sap que el 60% de les empreses de telecomunicacions han pujat en la borsa durant
l’últim any. Si escollim 50 empreses d’aquest sector a l’atzar, quina és la probabilitat
que menys de 20 hagin pujat durant l’últim any?
b) Suposem que volem realitzar un estudi sobre les empreses de l’apartat anterior mitjançant
trucades telefòniques. A quantes empreses hauré de cridar fins a trobar una que no
hagi pujat l’any anterior?

Solució

a) Considerem la variable aleatòria X que ens diu quantes empreses han pujat d’entre
les 50 escollides l’últim any. Aquesta variable aleatòria es distribueix segons una
Binomial de paràmetres p = 0.6 i n = 50. Ens demanen trobar la probabilitat següent:
p(X < 20) = p(X Æ 19) Realitzem el càlcul anterior amb R usant alguna de les
instruccions relacionades amb la distribució binomial, que són:
• dbinom(x, size, prob, log = FALSE)
• pbinom(q, size, prob, lower.tail = TRUE, log.p = FALSE)
• qbinom(p, size, prob, lower.tail = TRUE, log.p = FALSE)
• rbinom(n, size, prob)
Concretament la primera (dbinom) és la funció de densitat i calcula p(X = x); la segona
(pbinom) és la funció de distribució i calcula p(X Æ x); la tercera (qbinom) és la funció
de distribució inversa, i donat q entre 0 i 1 calcula el valor de x tal que p(X Æ x) = q;
finalment l’última (rbinom) serveix per obtenir mostres aleatòries de la distribució
binomial. Per tant en el nostre cas usarem pbinom amb x = 10, size = 50 i p = 0.6
amb el que P (X Æ 19) = pbinom(19.50, 0.6) i obtenim
pbinom(c(19), size=50, prob=0.6, lower.tail=TRUE)

## [1] 0.001373762
pel que probabilitat buscada val aproximadament 0.00137

1
b) Considerem la variable aleatòria Y que ens diu el nombre d’empreses a les quals hem
de cridar fins que hi hagi una que no hagi pujat en la borsa l’any anterior. La variable
Y es distribueix segons una variable geomètrica de paràmetre p = 0.4, ja que hi ha
un 40% de probabilitat que una empresa no hagi pujat en la borsa durant l’últim any.
En mitjana, haurem de cridar E(Y ) vegades. Usant que l’esperança d’una distribució
geomètrica val p1 , el nostre cas haurem de cridar a un total de 0.4
1
= 2.5 empreses. És a
dir, haurem de cridar a tres empreses fins a trobar a una que no hagi pujat en la borsa
l’any anterior.

Activitat 2. Nombre de missatges amb virus que arriben


a un servidor.
Variable de Poisson.
Suposem que un servidor rep, en mitjana, 48 missatges amb virus cada dia. Si el nombre
de virus que arriben al servidor és una variable de Poisson, trobar la probabilitat que en
una hora arribin 3 virus, la probabilitat que no arribin virus en 3 hores i la probabilitat que
arribin més de 500 missatges amb virus en una setmana.

Solució

Considerem la variable X1 dependent d’un paràmetre t que ens dóna el nombre de missatges
amb virus que arriben en t hores. La distribució de la variable X1 és de Poisson de paràmetre
2t, ja que si arriben, en mitjana, 48 missatges amb virus en 24 hores, arriben, en mitjana
48
24
t = 2t missatges amb virus en t hores. Ens demanen p(X1 = 3) (probabilitat que arribin 3
virus en 1 hora), p(X3 = 0) (probabilitat que no arribin virus en 3 hores) i p(X168 > 500)
(probabilitat que arribin més de 500 missatges en una setmana que té 24 ú 7 = 168 hores).
Calculem les probabilitats anteriors amb R.
Si volem usar instruccions de R; haurem d’usar alguna de les relacionades amb la distribució
de Poisson, que són
• dpois(x, lambda, log = FALSE)
• ppois(q, lambda, lower.tail = TRUE, log.p = FALSE)
• qpois(p, lambda, lower.tail = TRUE, log.p = FALSE)
• rpois(n, lambda)
on com en el cas anterior, la que comença per “d” correspon a la funció de densitat, la que
comença per “p” correspon a la funció de distribució, la que comença per “q” al revés de
la distribució, i la que comença per “r” genera mostres aleatòries de la distribució. Vegem
doncs els càlculs que cal fer
dpois(3, lambda=2)

2
## [1] 0.180447
Per tant p(X1 = 3) = 0.180447.
dpois(0, lambda=6)

## [1] 0.002478752
Per tant p(X3 = 0) = 0.0024788.
Finalment
ppois(500,lambda=336,lower.tail=FALSE)

## [1] 2.910482e-17
Per tant p(X168 > 500) = 2.910482 ◊ 10≠17 .
El mateix resultat s’obté amb
1-ppois(499,lambda=336)

## [1] 0
ja que la probabilitat buscada és pràcticament 0, Per tant, és molt improbable que arribin
més de 500 missatges amb virus en una setmana.

Activitat 3. Temps a crear un antivirus per a un virus


determinat.
Variable normal.
En una empresa dedicada a crear antivirus se sap que el temps que es triga a trobar un
antivirus adequat per a cada virus nou segueix una distribució normal de mitjana 10 dies i
desviació típica o estàndard de 4 dies. Es demana:
a) Calcular la probabilitat que es trigui entre 8 i 12 dies a trobar un antivirus per a un
cert virus.
b) Imaginem que l’empresa vol preparar un eslògan del tipus: “El 95% de les vegades
trobem un antivirus en menys de x dies”. Quant ha de valer x?

Solució

a) Considerem la variable T que ens dóna el temps que triga l’empresa a trobar l’antivirus
per a cada virus nou. Ens diuen que la distribució de T és normal de mitjana µ = 10 dies
i desviació típica ‡ = 4 dies. Ens demanen trobar la probabilitat següent: p(8 < T < 12).
Abans de trobar la probabilitat anterior amb R, escriguem-la en termes de la funció de

3
distribució: p(8 < T < 12) = p(T Æ 12) ≠ p(T Æ 8) Per tant, hem de trobar la funció
de distribució d’una normal de mitjana µ = 10 dies i desviació típica ‡ = 4 dies en els
punts 12 i 8. Per fer-ho, podem usar les funcions relacionades amb la normal, que són,
en la línia de les introduïdes per a la binomial i la Poisson, les següents
• dnorm(x, mean = 0, sd = 1, log = FALSE)
• pnorm(q, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
• qnorm(p, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
• rnorm(n, mean = 0, sd = 1)
Així doncs cal calcular p(8 < T < 12) = p(T Æ 12) ≠ p(T Æ 8) =
pnorm(12, mean = 10, sd = 4) ≠ pnorm(8, mean = 10, sd = 4) amb el que
obtenim
pnorm(12,mean=10,sd=4)-pnorm(8,mean=10,sd=4)

## [1] 0.3829249
b) En termes de probabilitats, ens diuen que p(T < x) = 0.95. Per tant, hem de trobar x
tal que la funció de distribució de la variable normal de mitjana µ = 10 dies i desviació
típica ‡ = 4 dies en x val 0.95. Per trobar aquest valor de x, podem usar directament
la funció qnorm (que és la inversa de la funció de distribució) de la següent forma:
qnorm(0.95,mean=10,sd=4)

## [1] 16.57941
Amb el que podem afirmar que el 95% de les vegades trobem un antivirus en menys de
16.58 dies.

Activitat 4. Nombre de missatges “SPAM” que arriben


a un servidor.
Variables aleatòries discretes.
De cada 1000 missatges que arriben a un servidor de correu, 700 són “SPAM”. Si hem rebut
50 missatges en un matí,
a) Calcular la probabilitat que s’hagin rebut almenys 20 missatges que no siguin “SPAM”.
b) Calcular la probabilitat que tots els missatges rebuts siguin “SPAM”.
c) Trobar el nombre esperat de missatges “SPAM” així com la seva variància.

Solució

a) Considerem la variable X que ens dóna el nombre de missatges SPAM d’entre els 50
missatges que hem rebut. La distribució de la variable X serà binomial de paràmetres
700
n = 50 i p = 1000 = 0.7. Ens demanen la probabilitat que almenys 20 missatges

4
no siguin SPAM, que és el mateix que dir la probabilitat de rebre com a màxim 30
missatges SPAM. Escrit en termes de probabilitats, ens demanen p(X Æ 30). Per
calcular-ho en R podem fer-ho amb la instrucció pbinom de la següent forma:
pbinom(30,50,0.7)

## [1] 0.0848026
La probabilitat demanada val, aproximadament, 0.085.
b) Ens demanen la probabilitat següent p(X = 50). Per calcular-ho en R podem usar la
funció dbinom de la següent forma:
dbinom(50,50,0.7)

## [1] 1.798465e-08
La probabilitat, per tant, és pràcticament nul·la.
c) En general, la mitjana d’una variable Binomial de paràmetres n i p val I(X) =
np, V ar(X) = np(1 ≠ p). Substituint els paràmetres en el nostre cas, obtenim que el
nombre esperat de missatges SPAM és I(X) = np = 50 ú 0.7 = 35 missatges, mentre
que la seva variància val V ar(X) = np(1 ≠ p) = 50 ú 0.7 ú 0.3 = 10.5.

Activitat 5. Càlcul del cost per la connexió a Internet.


Variables aleatòries discretes.
Un proveïdor d’Internet (ISP) cobra als seus clients pel temps en què aquests estan connectats
arrodonint a l’última hora. En la taula següent es mostra la probabilitat que un client
d’aquest proveïdor escollit a l’atzar estigui connectat X hores i es cobri Y euros per les X
hores:

—— 1 hora 2 hores 3 hores 4 hores


1 euro 0 0.06 0.06 0.10
———– ——– ——— ——— ————-
2 euros 0.10 0.10 0.04 0.04
———– ——– ——— ——— ————-
3 euros 0.40 0.10 0 0

Per exemple, la probabilitat que un client estigui connectat 3 hores (en l’arrodoniment) i se
li cobri 2 hores per hora val 0.04. I així successivament. El cobrament total al client serà
Z = X ú Y . Trobar la funció de probabilitat i de distribució de la variable Z així com la seva
esperança i la seva variància.

5
Solució

Calculem primer els valors que pot aconseguir la variable aleatòria Z. Aquests seran: Z( ) =
{1, 2, 3, 4, 5, 8, 9, 12}. Aquests valors s’han obtingut multiplicant els valors de la variable X
pels valors de la variable Y :

——– 1 hora 2 hores 3 hores 4 hores


1 euro 1 2 3 4
———– ——– ——— ——— ————-
2 euros 2 4 6 8
———– ——– ——— ——— ————-
3 euros 3 6 9 12

En la taula anterior veiem de quina forma es poden obtenir els valors de Z. Trobem a
continuació la funció de probabilitat de la variable Z:
p(Z = 1) = p(X = 1, Y = 1) = 0
p(Z = 2) = p(X = 1, Y = 2) + p(X = 2, Y = 1) = 0.10 + 0.06 = 0.16
p(Z = 3) = p(X = 1, Y = 3) + p(X = 3, Y = 1) = 0.40 + 0.06 = 0.46
p(Z = 4) = p(X = 2, Y = 2) + p(X = 4, Y = 1) = 0.10 + 0.10 = 0.20
p(Z = 6) = p(X = 2, Y = 3) + p(X = 3, Y = 2) = 0.10 + 0.04 = 0.14
p(Z = 8) = p(X = 4, Y = 2) = 0.04
p(Z = 9) = p(X = 3, Y = 3) = 0
p(Z = 12) = p(X = 4, Y = 3) = 0
A posteriori, veiem que Z només aconsegueix els valors 2, 3, 4, 6 i 8 i la funció de probabilitat
queda indicada en la taula següent:

x 2 3 4 6 8
p(X = x) 0.16 0.46 0.20 0.14 0.04

La funció de distribució serà:


Y
_
_ 0, si x < 2
_
_
_
_
_ 0.16, si 2 Æ x < 3
_
] 0.16 + 0.46 = 0.62, si 3 Æ x < 4
FZ (x) =
_
_
_ 0.62 + 0.20 = 0.82, si 4 Æ x < 6
_
_
_
_
_
0.82 + 0.14 = 0.96, si 6 Æ x < 8
[
0.98 + 0.04 = 1, si x Ø 8
L’esperança de la variable Z serà:

6
I(Z) = 2 · 0.16 + 3 · 0.46 + 4 · 0.20 + 6 · 0.14 + 8 · 0.04 = 3.66
El client paga de mitjana 3.66 euros.
La seva variància serà:
Var(Z) = 22 · 0.16 + 32 · 0.46 + 42 · 0.20 + 62 · 0.14 + 82 · 0.04 ≠ 3.662 = 2.1844.

Activitat 6. Transmissió de missatges.


Variables aleatòries discretes.
Un sistema interactiu consisteix en 50 terminals totes connectades a un ordinador central.
A qualsevol moment, cada terminal està preparada per transmetre missatges amb una
probabilitat de 0.7, independentment de les altres terminals. Trobar la probabilitat que
exactament 16 terminals estiguin preparades per transmetre a les 8.00 hores del matí, la
probabilitat que com a mínim 25 terminals estiguin preparades per transmetre a les 12.00
hores del matí i que hi hagi entre 20 i 40 terminals ambdues inclusivament preparades per
transmetre a les 14.00 hores.

Solució

Considerem la variable X que ens diu el nombre de terminals preparades per transmetre
missatges en un moment qualsevol del dia de les 50 terminals. La distribució de X serà
Binomial de paràmetres n = 50 i p = 0.7
En primer lloc ens demanen la probabilitat que exactament 16 terminals estiguin preparades
per transmetre a les 8.00 hores del matí, o, escrit en funció de X,n = 50 i p(X = 50). Per
calcular-ho en R usem:
dbinom(16,50,0.7)

## [1] 2.728865e-08
Com podem observar, la probabilitat és pràcticament nul·la.
A continuació ens demanen la probabilitat que com a mínim 25 terminals estiguin preparades
per transmetre a les 12.00 hores del matí. Escrit en termes de la variable X, ens demanen
p(X Ø 25). Si escrivim la probabilitat anterior en termes de la funció de distribució de X,
tenim p(X Ø 25) = 1 ≠ p(X Æ 24). En R podem usar directament la funció pbinom de la
següent forma:
1-pbinom(24,50,0.7)

## [1] 0.9990668
Concloem que és molt probable que hi hagi com a mínim 25 terminals preparades per
transmetre a les 12.00 hores.

7
Finalment, ens demanen la probabilitat que hi hagi entre 20 i 40 terminals ambdues inclu-
sivament preparades per transmetre a les 14.00 hores. Si escrivim aquesta probabilitat en
termes de X, tenim p(20 Æ X Æ 40). Escrivint aquesta probabilitat en termes de la funció
de distribució de X, tenim: p(20 Æ X Æ 40) = p(19 < X Æ 40) = p(X Æ 40) ≠ p(X Æ 19)
Hem de calcular la funció de distribució de X per als valors 40 i 19. Procedint de la mateixa
forma com en el cas del càlcul de la probabilitat anterior, tenim els següents resultats que
ens dóna R:
pbinom(40,50,0.7)-pbinom(19,50,0.7)

## [1] 0.9597655

Activitat 7. Temps de procés d’un treball per una im-


pressora.
Variable exponencial.
El temps que triga una impressora a processar un treball segueix una variable exponencial
de mitjana 12 segons. S’envia un treball a la impressora a les 10.00 hores. Quina és la
probabilitat que estigui finalitzat a les 10.01 hores? Quina és la probabilitat que a les 10.02
h. encara no estigui acabat el treball?

Solució

En primer lloc, hem de calcular la probabilitat que un treball estigui finalitzat a les 10.01 h.,
o p(X Æ 1) on X recordem que ens dóna el temps que triga la impressora a processar un
treball. En R es calcula de la següent forma:
pexp(1,1/12)

## [1] 0.07995559
Per calcular la probabilitat que a les 10.02 h. encara no estigui finalitzat un treball, hem de
calcular p(X > 2):
1-pexp(2,1/12)

## [1] 0.8464817

Activitat 8. Temps de procés d’un treball per una im-


pressora.
Variable exponencial.

8
Dos experts en ordinadors treballen per a una certa empresa com a informàtics. El primer
expert s’encarrega del 60% de les reparacions i el segon del 40%. El temps que triga el
primer expert a reparar un ordinador segueix una distribució exponencial de paràmetre
⁄1 = 3 hores≠1 i el temps que triga el segon expert a reparar un ordinador segueix una
distribució exponencial de paràmetre ⁄2 = 2 hores≠1 . S’ha enviat a reparar un ordinador fa
30 minuts i encara segueix avariat. Quina és la probabilitat que el primer expert treballi en
la reparació d’aquest ordinador? Quin és el temps mitjà de reparació d’un ordinador per a
l’empresa?

Solució

Considerem la variable T1 que ens diu el temps que triga el primer expert i T2 el temps
que triga el segon expert. Definim els successos E1 : “reparació realitzada pel primer
expert” i E2 : “reparació realitzada pel segon expert”. Ens donen les probabilitats següents:
p(E1 ) = 0.6, p(E2 ) = 0.4.
Ens diuen que fa 30 minuts que un ordinador està en reparació i encara no s’ha reparat.
Sigui T la variable que ens dóna el temps de reparació d’un ordinador per l’empresa. Ens
demanen trobar la probabilitat següent: p (E1 |T > 0.5). O sigui, ens demanen la probabilitat
que l’ordinador sigui reparat pel primer expert suposant que es triga més de 30 minuts (0.5
hores) a reparar-ho. Per trobar la probabilitat anterior, usarem la regla de Bayes:

p (E1 fl T > 0.5) p (E1 ) · p (T > 0.5|E1 )


p (E1 |T > 0.5) = =
p(T > 0.5) p (E1 ) · p (T > 0.5|E1 ) + p (E2 ) · p (T > 0.5|E2 )

Les probabilitats p (T > 0.5|E1 ) i p (T > 0.5|E2 ) són fàcils de calcular, ja que sabem la
distribució dels temps que triga cadascun dels experts:

p (T > 0.5|E1 ) = p (T1 > 0.5) = e≠⁄1 ú0.5 = e≠3ú0.5 = e≠1.5 ƒ 0.2231
p (T > 0.5|E2 ) = p (T2 > 0.5) = e≠⁄2 ú0.5 = e≠2ú0.5 = e≠1 ƒ 0.3679

La probabilitat demanada serà:

0.6 · 0.2231
p (E1 |T > 0.5) = ƒ 0.4764
0.6 · 0.2231 + 0.4 · 0.3679
Per trobar el temps mitjà, usarem l’expressió següent:

E(T ) = p (E1 ) · p (T |E1 ) + p (E2 ) · p (T |e2 ) =


1 1
0.6 · e (T1 ) + 0.4 · e (T2 ) = 0.6 · + 0.4 · = 0.4 hores. O sigui, 24 minuts.
3 2
L’expressió anterior usa que el 60% de les vegades fa la reparació el primer expert i el 40%
restant, el segon expert.

9
Activitat 9. Estudi de la falla d’un sistema informàtic.
Variable exponencial.
Un sistema informàtic està basat en dos mòduls independents A i B. Una fallada de qualsevol
dels dos mòduls causa una fallada del sistema. La durada de cadascun dels mòduls segueix
una distribució exponencial de paràmetres ⁄1 = 1 any ≠1 i ⁄2 = 2 anys ≠1 , respectivament.
Es demana:
a) Quina és la probabilitat que el sistema funcioni almenys 2 anys sense tenir una fallada?
b) Si el sistema va fallar en els dos primers anys, quina és la probabilitat que la fallada
hagi estat a causa del mòdul B però no del mòdul A?

Solució

a) Considerem les variables S, T1 i TB que ens dóna el temps de durada del sistema fins
que hi ha una fallada, el temps de durada del mòdul A i el temps de durada del mòdul
B, respectivament. Intentem esbrinar si la distribució de la variable S és coneguda.
Per a això, calculem primerament: p(S > t) = p (TA > t fl TR > t), ja que si el sistema
ha durat més de t anys, els mòduls A i B també. Usant que els mòduls A i B són
independents, obtenim que la probabilitat anterior es pot calcular com:
p(S > t) = p (TA > t fl TB > t) = p (TA > t) · p (TB > t) = e≠t · e≠2·t = e≠3t .
Concloem que la variable S segueix la distribució exponencial de paràmetre ⁄ =
3 anys ≠1 .
Ens demanen la probabilitat següent: p(S > 2) = e≠32 = e≠6 ƒ 0.00248
b) Ens demanen trobar la probabilitat següent: p(TB Æ 2 fl TA > 2|S Æ 2), ja que sabem
que el sistema va fallar en els dos primers anys (S Æ 2) i ens demanen la probabilitat
que la fallada sigui deguda el mòdul B (TB Æ 2) i no al mòdul A (TA > 2). Usant
la fórmula de la probabilitat condicionada obtenim que la probabilitat anterior pot
calcular-se com:
p (TB Æ 2 fl TA > 2 fl S Æ 2)
p (TB Æ 2 fl TA > 2|S Æ 2) = .
p(S Æ 2)
Usant que el succés TB Æ 2 fl TA > 2 està inclòs en el succés S Æ 2, la probabilitat
anterior val:
p (TR Æ 2 fl TA > 2 fl S Æ 2) p (TB Æ 2 fl TA > 2)
p (TB Æ 2 fl TA > 2|S Æ 2) = = .
p(S Æ 2) p(S Æ 2)

Finalment, usant la independència d’A i B i la distribució de les variables S, TA i TB ,


obtenim que la probabilitat anterior val:
(1 ≠ e≠2.2 ) · e≠2 e≠2 ≠ e≠6
p (TB Æ 2 fl TA > 2|S Æ 2) = = ƒ 0.133.
1 ≠ e≠3.2 1 ≠ e≠6

10
Activitat 10. Durada d’un processador.
Variable normal.
La durada d’un processador segueix una distribució normal de mitjana 50000 hores i desviació
típica 100 hores. Si volem que només fallin el 3%, que val la x en la següent frase de la
campanya promocional del processador: “Processadors que duren més de x hores!”. Quina
és la probabilitat que un processador d’aquest tipus duri més de 7 anys en un servidor que
funciona les 24 hores?

Solució

Si volem que només fallin el 3%, la x en la campanya promocional ha de complir p(T > x) =
0.97 on recordem que T és la variable que ens dóna la durada del processador. En R hem de
realitzar l’operació següent:
qnorm(0.03,50000,100)

## [1] 49811.92
A continuació, ens demanen la probabilitat que un processador d’aquest tipus duri més de 7
anys en un servidor que funciona les 24 hores, o p(T > 61320) = 1 ≠ p(T Æ 61320):
1-pnorm(7*365*24,50000,100)

## [1] 0

Activitat 11. Temps de processament de treballs


d’impressió en un laboratori.
Variable exponencial. Variable uniforme.
Un laboratori té dues impressores. La impressora I processa el 40% dels treballs i el seu
temps d’impressió segueix una distribució exponencial de mitjana 2 minuts. La impressora II
processa la resta i el seu temps d’impressió segueix una distribució uniforme entre 0 minuts i
5 minuts.
a) Un treball és imprès en menys de 5 minuts, quina és la probabilitat que hagi estat
imprès per la impressora II?
b) Si un treball triga menys de 2 minuts, quina és la probabilitat que hagi estat imprès
per la impressora I?
c) Trobar la probabilitat que un treball qualsevol trigui menys de 3 minuts a ser imprès
en aquest laboratori.

11
Solució

a) Sigui T el temps d’impressió d’un treball qualsevol pel laboratori. Ens diuen que T < 5
minuts i ens demanen la probabilitat que hagi estat imprès per la impressora II. Escrit
matemàticament: p(II|T < 5). Podem trobar la probabilitat anterior usant la fórmula
de Bayes:

p(II fl T < 5) p(II) · p(T < 5|II)


p(II|T < 5) = =
p(T < 5) p(I) · p(T < 5|I) + p(II) · p(T < 5|II)

Les probabilitats p(T < |I) i p(T < 5|II) es poden calcular en conèixer-se la distribució
dels temps de les impressores I i II: p(T < 5|I) = 1 ≠ e≠1/2·5 = 1 ≠ e≠2.5 ƒ 0.918, p(T <
5|II) = 5≠0
5≠0
0.6ú1
= 1. La probabilitat anterior val: p(II|T < 5) = 0.4ú0.918+0.6ú1 ƒ 0.620.
b) Usem el mateix mètode que hem usat a l’apartat anterior per calcular la probabilitat
demanada:

p(I|T < 2) = p(IflT <2)


p(T <2)
= p(I)·p(T <2|I)+p(II)·p(T
p(I)·p(T <2|I)
<2|II)
=
0.4·(1≠e≠1/2·2 ) 0.4·(1≠e≠1 )
(2≠0) = · 0.4·(1≠e≠1 )+0.6·0.4 ƒ 0.513
0.4·(1≠e≠1/2·2 )+0.6· (5≠0)

c) La probabilitat que la impressora del laboratori trigui menys de 3 minuts a processar


un treball val:

p(T <1 3) = p(I)2· p(T < 3|I) + p(II) · p(T < 3|II) =
0.4 · 1 ≠ e≠1/2·3 + 0.6 · (3≠0)
(5≠0)
= 0.4 · (1 ≠ e≠1.5 ) + 0.6 · 0.6 ƒ 0.671

Activitat 12. Temps de connexió a Internet.


Variable exponencial. Variable uniforme.
Un proveïdor d’Internet té dues línies de connexió per als seus clients. El 80% dels seus clients
es connecten a través de la línia I, i la resta, a través de la línia II. El temps de connexió
per la línia I segueix una distribució exponencial de paràmetre ⁄ = 2minuts≠1 El temps de
connexió per la línia II segueix la distribució uniforme amb paràmetres a = 20 segons i b = 40
segons.
a) Trobar la probabilitat que un client qualsevol trigui més de 30 segons a connectar-se a
Internet.
b) Si un client ha trigat menys de 20 segons a connectar-se a Internet, quina és la
probabilitat que s’hagi connectat per la línia I?

12
Solució

a) Sigui T el temps de connexió per un client qualsevol. Ens demanen la probabilitat


següent: p(T > 0.5), ja que 30 segons són 0.5 minuts. La probabilitat anterior es calcula
de la forma següent:

p(T > 0.5) = p(I) · p(T > 0.5|I) + p(II) · p(T > 0.5|H) =
(0.5≠20/60)
0.8 · e≠2·0.5 + 0.2 · (40/60≠20/60) ƒ 0.394

En l’expressió anterior hem usat que la distribució del temps de connexió per la línia II
és una variable uniforme de paràmetres a = 20/60 minuts i b = 40/60 minuts.

b) Ens diuen que T < 20/60 minuts ƒ 0.33 minuts i ens demanen p(I|T < 0.33). Trobarem
la probabilitat anterior usant la fórmula de Bayes:

p(I|T < 0.33) = p(IflT <0.33)


p(T <0.33)
= p(I)·p(T <0.33|I)+p(II)·p(T
p(I)·p(T <0.33|I)
<0.33|II)
=
0.8·(1≠e ≠20.33
) 0.8·(1≠e ≠0.66
)
(0.33≠0.33) = 0.8·(1≠e≠0.66 )+0 = 1
0.8·(1≠e
≠2·0.33 )+0.2· (0.66≠0.33)

El resultat anterior és l’esperat, ja que si un client triga menys de 20 segons a connectar-


se, és impossible que es connecti a través de la línia II, ja que els clients que es connecten
a través d’aquesta línia triguen entre 20 i 40 segons a connectar-se.

Adreces d’interès

• Definició i tractament matemàtic de variables aleatòries en la Wikipedia.(http://en.


wikipedia.org/wiki/random_variable)
• Definició i propietats de la distribució normal(http://en.wikipedia.org/wiki/normal_
distribution)
• Llibre online sobre probabilitats i variables aleatòries amb un enfocament molt pràctic
i amb molts exemples.(http://math.dartmouth.edu/~prob/prob/prob.pdf)

13

You might also like