You are on page 1of 8

ESTADÍSTICA (GRUP 10)

Resolució Prova escrita E1: 21 d'abril de 2022


1. El diagrama de barres següent correspon a la gràca de la taula de freqüències de la variable X
que registra el preu, en euros, de les accions d'una companyia durant N dies.

Per a cada qüestió, tria la resposta correcta i justica la teva elecció. (1,2 punts)
a ) El nombre total de dies, N , en què s'ha dut a terme el registre és
1) 24
2) 90
3) 100
b ) Quina frase deneix millor la relació entre la mitjana aritmètica i la mediana de X ? (No cal
fer cap càlcul. Podeu justicar la resposta a partir de l'aspecte del diagrama de barres.)
1) La mitjana aritmètica és més gran que la mediana.
2) La mediana és més gran que la mitjana aritmètica.
3) La mitjana aritmètica i la mediana són gairebé iguals.
c ) Si tots els valors de X s'incrementen en 10 euros, aleshores...
1) ni la mitjana aritmètica ni la desviació típica no varien.
2) la mitjana aritmètica augmenta 10 euros, però la desviació típica no varia.
3) tant la mitjana aritmètica com la desviació típica augmenten 10 euros.
Solució:
a) L'opció correcta és la 3), ja que N = 7 + 15 + 24 + 19 + 13 + 6 + 5 + 4 + 4 + 3 = 100.
b) L'opció correcta és la 1), ja que observem que el gràc és asimètric, i més de la meitat dels
valors estan entre 0 i 30, en canvi, el rang de valors va de 0 a 90.
c) L'opció correcta és la 2), ja que la mitjana és lineal, mentre que la variància de X només
es veu afectada quan multipliquem X per un valor. És a dir, si Y = aX + b, aleshores
Y = aX + b i SY2 = a2 SX 2 .
2. S'ha registrat la concentració, en mil·ligrams per litre, de carbonat de calci, CaCO3 , de 20 mostres
i s'han obtingut les dades següents: (1,3 punts)
130,8 129,9 131,5 131,2 129,5 132,7 131,5 127,8 133,7 132,2
134,8 131,7 133,9 129,8 131,4 128,8 132,7 132,8 131,4 131,3

a ) Fes un diagrama de tija i fulla, i calcula la mediana, els quartils i el rang interquartíl·lic.
b ) Hi ha alguna concentració que pugui ser considerada anomalia moderada o extrema? Justi-
ca la resposta calculant els intervals de normalitat i d'anomalia moderada i extrema.
Solució:
a) El diagrama de tija i fulles ens permet ordenar les dades de forma ràpida i ens proporciona
una primera vista de com estan repartides les dades de la mostra. Les fulles tenen un dígit,
per tant, en aquest cas, les tiges estaran formades per tres dígits, que corresponen a la part
entera de cada dada:
127 | 8
128 | 8
129 | 589
130 | 8
131 | 2344557
132 | 2778
133 | 79
134 | 8
La mediana és el valor central de la mostra. En aquest cas, hi ha 20 dades, per tant, els
valors centrals són els que ocupen les posicions 10 i 11 que són, respectivament, 131,4 i
131,5, de manera que és la mitjana dambdós: X e = 131,45.
El primer quartil, Q1 coincideix amb el percentil 25. La posició és t = 21 · 100
25
= 5,25 i
aleshores Q1 = 129,9 + 0,25 · (130,8 − 129,9) = 130,125.
El segon quartil, Q2 coincideix amb el percentil 50 i amb la mediana X e , per tant, Q2 =
131,45.
El tercer quartil, Q3 coincideix amb el percentil 75. La posició és t = 21 · 100
75
= 15,75 i
aleshores Q3 = 132,7 + 0,75 · (132,7 − 132,7) = 132,7.
El rang interquartíl·lic és RIQ = Q3 − Q1 = 132,7 − 130,125 = 2,575.
b) Calculem els valors límits:
f1 = Q1 − 1,5 · RIQ = 126,2625 F1 = Q1 − 3 · RIQ = 122,4
f3 = Q3 + 1,5 · RIQ = 136,5625 F3 = Q3 + 3 · RIQ = 140,425

Calculem les regions:


ˆ regió de normalitat: (f1 , f3 ) = (126,2625, 136,5625)
ˆ regió d'anomalies moderades: (F1 , f1 ] ∪ [f3 , F3 ) = (122,4, 126,2625] ∪ [136,5625, 140,425)
ˆ regió d'anomalies extremes: (−∞, F1 ] ∪ [F3 , ∞) = (−∞, 122,4] ∪ [140,425, ∞)
Tenint en compte que el valor més petit observat és 127,8 i el valor més gran és 134,8, no
hi ha cap anomalia.

3. Amb l'objectiu d'incrementar el rendiment, Y , mesurat en kg/h, d'un procés industrial, un tècnic
modica la temperatura, X , en graus ◦ C, a la que es produeix i manté la resta de condicions
iguals. Tenint en compte les dades registrades, la recta de regressió obtinguda és la següent:
y = 107,1 + 0,29x. (1,5 punts)
a ) Sabent que SX = 7,07 i SY = 2,08, calcula el coecient de correlació lineal. Es pot armar
que aquesta recta és un bon ajust lineal? Justica la resposta.
b ) Sabent que la mitjana de les temperatures registrades és 80◦ , calcula la recta de regressió
de X sobre Y .
c ) Quin seria el rendiment esperat d'un procés que es fa a una temperatura de 72◦ C? A quina
temperatura s'estima que s'ha de fer el procés si es vol obtenir un rendiment de 132 kg/h?
Justica si els resultat obtinguts són ables.
Solució:
a) El coecient de correlació lineal es calcula com
SXY
r=
SX · SY
Per tant, ens cal calcular SXY i ho fem a partir de la recta de regressió donada. Sabem que
aquesta recta es calcula com
SXY
y−Y = 2 · (x − X)
SX
Per tant, vol dir que el pendent de la recta és
SXY
2
SX
Aleshores tenim que SXY = 0,29 · SX
2 = 0,29 · 7,072 = 14,4956 i així

14,4956 14,4956
r= = = 0,9857
7,07 · 2,08 14,7056
L'ajust lineal és molt bo perquè r > 0,95.
b) Per calcular la recta de regressió de X sobre Y utilitzem l'expressió següent:
SXY
x−X = · (y − Y )
SY2

Observem que tenim X , SXY i SY2 , però ens falta X . Per calcular-la, tornem a utilitzar la
recta donada. Recordem que la recta de regressió passa pel punt (X, Y ), per tant, per trobar
Y només cal substituir X = X a la recta donada:
Y = 107,1 + 0,29 · 80 = 130,3
Així doncs, la recta de regressió demanada serà:
14,4956
x − 80 = · (y − 130,3) ⇒ x = −356,51 + 3,35y
2,082
c) Primer ens demanen el rendiment esperat, Y , per a un valor de Y , de manera que cal
utilitzar la recta donada:
y = 107,1 + 0,29 · 72 = 127,98kg/h
A continuació ens demanen la temperatura, X , a la que cal fer el procés per obtenir un
rendiment determinat, Y . Per tant, cal usar la recta calculada:
x = −356,51 + 3,35 · 132 = 85,69◦ C
Els resultats són ables perquè el coecient de correlació calculat a l'apartat a) ens conrma
que la correlació és molt bona.
4. Contesta, fent els càlculs necessaris i de forma justicada, les qüestions següents. (1 punt)
a ) Siguin A i B dos esdeveniments tals, que P (A) = 0,4, P (B) = 0,3 i P (A ∪ B) = 0,42. És
cert que A i B són independents?
b ) Siguin C i D dos esdeveniments. Si la probabilitat que no succeeixin ni C ni D és 3/8, quina
és la probabilitat que almenys un dels dos es produeixi?
Solució:
a) Dos esdeveniments A i B són independents si P (A ∩ B) = P (A) · P (B) o, equivalentment,
si P (A|B) = P (A) o P (B|A) = P (B). Aleshores

P (A) · P (B) = 0,4 · 0,3 = 0,12

D'altra banda,

P (A ∪ B) = P (A) + P (B) − P (A ∩ B) ⇒ P (A ∩ B) = P (A) + P (B) − P (A ∪ B)

i com que P (A ∪ B) = 1 − P (A ∪ B) = 1 − 0,42 = 0,58 tenim que

P (A ∩ B) = 0,4 + 0,3 − 0,58 = 0,12

Per tant, A i B són independents.


b) Tenim que P (C ∩ D) = 3/8 i ens demanem que calculem P (C ∪ D). Per tant, utilitzant les
lleis de Morgan tenim que:

P (C ∪ D) = 1 − P (C ∪ D) = 1 − P (C ∩ D) = 1 − 3/8 = 5/8 = 0,625

5. Per anar a la universitat, una estudiant va en autobús el 30 % de les vegades, camina el 30 % dels
cops i va en bicicleta el 40 % de les vegades. Quan va a la universitat en autobús, arriba tard
el 7 % de les vegades; quan va a peu, arriba tard el 10 % de les vegades; i quan va en bicicleta,
arriba tard el 3 % de les vegades. (1 punt)
a ) Quina és la probabilitat que l'estudiant no arribi tard a la universitat?
b ) Si avui l'estudiant ha arribat puntual a la universitat, quina és la probabilitat que hi hagi
anat a peu?
Solució: Denim els esdeveniments A =0 anar en bus0 , B =0 anar en bicicleta0 , C =0 anar caminant0
i P =0 ser puntual0 .
a) Ens demanen que calculem la probabilitat d'arribar puntual, P (P ):

P (P ) = P (P ∩A)+P (P ∩B)+P (P ∩C) = P (P |A)·P (A)+P (P |B)·P (B)+P (P |C)·P (C) =


93 30 97 40 90 30 9370
= · + · + · = = 0,937
100 100 100 100 100 100 10000
b) En aquest cas ens demanen una probabilitat condicionada, P (C|P ), de manera que podem
utilitzar el teorema de Bayes:
P (C ∩ P ) P (P |C) · P (C) 90/100 · 30/100 2700
P (C|P ) = = = = = 0,2882
P (P ) P (P ) 9370/10000 9370
6. En una caixa hi ha 8 boles blanques, 4 boles negres i 2 boles taronges, i ens proposen el joc
següent: agafem dues boles de la caixa a l'atzar. Per cada bola negra que traiem, guanyem 2
euros; per cada bola taronja que traiem, no guanyem ni perdem cap euro; i per cada bola blanca
que traiem, perdem 1 euro. Sigui X la variable aleatòria que compta els diners que guanyem (o
perdem). (2 punts)
a ) Descriu l'espai mostral de l'experiment i dona la variable aleatòria X de manera explícita.
b ) Deneix la funció de probabilitat de X , fX (x).
c ) Deneix la funció de distribució de X , FX (x).
d ) És just aquest joc? Justica la resposta calculant la mesura estadística adient.
Solució:
a) L'experiment consisteix en treure dues boles de la caixa i l'espai mostral és el següent:
Ω = {BB, BN, BT, N B, N N, N T, T B, T N, T T }

La variable X compta els diners que guanyem (o perdem) en jugar i es deneix com segueix:
X: Ω −→ R X: Ω −→ R
BB 7→ −1 − 1 = −2 BB 7→ −2
BN, N B 7→ −1 + 2 = 1 BT, T B 7→ −1
BT, T B 7→ −1 + 0 = −1 ⇒ TT 7→ 0
NN 7→ 2 + 2 = 4 BN, N B 7→ 1
N T, T N 7→ 2 + 0 = 2 N T, T N 7→ 2
TT 7→ 0 NN 7→ 4

b) Calculem la probabilitat de cada valor que pren X , X(Ω) = {−2, −1, 0, 1, 2, 4}.
8 7 56 28
P (X = −2) = · = =
14 13 182 91
8 2 2 8 32 16
P (X = −1) = · + · = =
14 13 14 13 182 91
2 1 2 1
P (X = 0) = · = =
14 13 182 91
8 4 4 8 64 32
P (X = 1) = · + · = =
14 13 14 13 182 91
4 2 2 4 16 8
P (X = 2) = · + · = =
14 13 14 13 182 91
4 3 12 6
P (X = 4) = · = =
14 13 182 91
Per tant, la funció de probabilitat de X és la següent:
28/91 si x = −2


16/91 si x = −1




 1/91 si x = 0



fX (x) = P (X = x) = 32/91 si x = 1
8/91 si x = 2



6/91 si x = 4




si x ∈

/ {−2, −1, 0, 1, 2, 4}

0
c) Per calcular la funció de distribució de X cal recordar que FX (x) és una probabilitat acu-
mulada, és a dir, FX (x) = P (X ≤ x). Aleshores

P (X < −2) = 0

P (−2 ≤ X < −1) = 28/91

28 16 44
P (−1 ≤ X < 0) = + =
91 91 91
44 1 45
P (0 ≤ X < 1) = + =
91 91 91
45 32 77
P (1 ≤ X < 2) = + =
91 91 91
77 8 85
P (2 ≤ X < 4) = + =
91 91 91
85 6 91
P (X ≥ 4) = + = =1
91 91 91
Per tant, la funció de distribució de X és la següent:
si

 0 x < −2
si



 28/91 −2 ≤ x < −1
si

 44/91 −1 ≤ x < 0


FX (x) = P (X ≤ x) = 45/91 si 0≤x<1
 77/91 si 1≤x<2


si

85/91 2≤x<4



si

x≥4

1

d) Per saber si el joc és just, hem de calcular E(X). Si aquesta és zero, aleshores el joc serà
just (si és positiva, el joc ens afavoreix; i si és negativa, el joc afavoreix a qui el proposa i
no a qui hi juga).
X X
E(X) = x · P (X = x) = x · fX (x) =
x∈X(Ω) x∈X(Ω)

28 16 1 32 8 6
= −2 · −1· +0· +1· +2· +4· =0
91 91 91 91 91 91
Per tant, podem concloure que el joc és just.

7. La variable aleatòria contínua X que mesura el temps, en minuts, que tarden uns alumnes a
respondre una pregunta en un examen té la funció de densitat següent:
k(6x − x2 ), 3 ≤ x ≤ 6

fX (x) =
0, altrament,

on k és una constant. (2 punts)


a ) Troba el valor de k .
b ) Per al valor de k trobat, determina la funció de distribució de X , FX (x).
c ) Quina és la probabilitat que un alumne escollit a l'atzar tardi més de 5 minuts a contestar
la pregunta si sabem que ja han passat 2 minuts i encara no ha contestat? I quina és la
probabilitat que tardi exactament 4 minuts?
d ) Quin és el temps mitjà de resposta esperat?
Solució:
a) Com que f és una funció de densitat, cal que:
ˆ fX (x) ≥ 0 ⇒ k ≥ 0;
R∞
ˆ −∞ fX (x) dx = 1:
Z ∞ Z 3 Z 6 Z ∞ Z 6
2
fX (x) dx = 0 dx + k(6x − x ) dx + 0 dx = k(6x − x2 ) dx =
−∞ −∞ 3 6 3

  2 6
x3 6 · 62 63 6 · 32 33
   
6x
= k − =k − − − = k(36 − 18) = 18k
2 3 3 2 3 2 3
1
Per tant, k = .
18
b) La funció de distribució és una probabilitat acumulada:
Z x
FX (x) = P (X ≤ x) = fX (x) dx
−∞

ˆ si x < 3, aleshores FX (x) = 0.


ˆ si 3 ≤ x < 6, aleshores
Z x Z 3 Z x Z x
1 1
FX (x) = fX (x) dx = (6x − x2 ) dx =
0 dx + (6x − x2 ) dx =
−∞ −∞ 3 18 3 18
3
x 3 3 x3 54
      
1 2 x 1 2 x 2 3 1 2
= 3x − = 3x − − 3·3 − = 3x − −
18 3 3 18 3 3 18 3 3
ˆ si x ≥ 6, aleshores
Z x Z 3 Z 6 Z ∞ Z 6
1 2 1
FX (x) = fX (x) dx = 0 dx+ (6x−x ) dx+ 0 dx = (6x−x2 ) dx = 1
−∞ −∞ 3 18 6 3 18

Per tant, la funció de distribució de X és la següent:


si x < 3


 0



x3 54
  
1

FX (x) = P (X ≤ x) = 2
3x − − si 3 ≤ x < 6

 18 3 3



si x ≥ 6

1

c) En primer lloc ens demanen que calculem una probabilitat condicionada i podem usar el
teorema de Bayes:
P (X > 5 ∩ X ≥ 2) P (X > 5) 1 − P (X ≤ 5)
P (X > 5|X ≥ 2) = = = =
P (X ≥ 2) 1 − P (X < 2) 1 − P (X < 2)
53 54
 
1 2
1− 3·5 − −
1 − FX (5) 18 3 3 1 46 23
= = =1− · =
1 − FX (2) 1−0 18 3 27
D'altra banda, ens demanen P (X = 4), però com que X és contínua, P (X = 4) = 0.
d) Ara cal calcular l'esperança de X :
Z ∞ Z 3 Z 6 Z ∞
1
E(X) = x · fX (x) dx = x · 0 dx + x · (6x − x2 ) dx + x · 0 dx =
−∞ −∞ 3 18 6

6 Z 6 6
x4
Z 
1 2 1 2 3 1 3
= x · (6x − x ) dx = (6x − x ) dx = 2x − =
3 18 18 3 18 4 3
64 34
   
1 3 3 1 297 297 33
= 2·6 − − 2·3 − = · = = = 4,125
18 4 4 18 4 72 8
O sigui, el temps mitjà de resposta esperat és de 4,125 minuts.

You might also like