You are on page 1of 14

Respostes a l’examen

Universitat Pompeu Fabra - Anàlisi de Dades


Permutació Número: 1
Examen de Recuperació 2020 - Duració: 2 hores
L’examen consta de 8 exercicis diferents (Exercicis I-VIII). Els exercicis I a IV s’hauran de con-
testar en les plantilles de respostes que es proveeixen. Cada pregunta compta 1 punt si es respon
correctament i resta un quart de punt si la resposta és incorrecta. Aquestes preguntes es corregiran
mecànicament, aixı́ que assegureu-vos d’entrar les respostes correctament a les plantilles.
Els Exercicis V a VIII es contesten al llibret de respostes. Aquests quatre exercicis es corregiran
de forma manual. Les respostes incorrectes d’aquesta part no compten negativament. Escriviu de
forma clara i precisa.
El total de punts a guanyar de cada exercici consta en el tı́tol de l’exercici.

Instruccions per omplir les plantilles (Exercicis I-IV)


Useu sols llapis, bolı́graf o retolador negre i ompliu bé les caselles. A la primera part de dalt poseu sols el
Nom i el Cognom, aixı́ com el grup.
Ompliu (marcant les caselles de la plantilla) el DNI, la PERMUTACIÓ i el GRUP.
DNI: el vostre número de document d’identitat (si no en teniu, el número que us van assignar en el moment
de matricular-vos).
PERMUT.: Entreu un 1
GRUP: Poseu el número de grup (amb un 0 endavant, o sigui, 01, 02, 03, 04 o 07).
Entreu les respostes en les lı́nies de sota. Cada resposta disposa de dues lı́nies, la primera és per a la
resposta correcta i la segona per anul·lar en cas d’equivocació. Exemple:

Instruccions per contestar els exercicis V a VIII


Contesteu al llibret. No us oblideu d’omplir les vostres dades i signar a la primera pàgina. Podeu utilitzar
llapis o tinta.

Distribuı̈u-vos el temps adequadament! MOLT BONA SORT!


Exercici 1: Pizzeries (10 punts)
S’ha recollit una base de dades amb el nombre de pizzes servides durant 30 setmanes de les pizzeries
Pizza Gorra i RadioPizza, que es presenten a la taula següent:
Pizza Gorra RadioPizza
Nombre de Freqüència Nombre de Freqüència
pizzas absoluta pizzas absoluta
700-720 5 700-720 2
720-740 6 720-740 8
740-760 12 740-760 11
760-780 4 760-780 7
780-800 3 780-800 2
Mitjana=746 Mitjana=749
Desv. est.=24 Desv. est.=21
En base a aquesta informació responeu a les preguntes següents:

Pregunta 1: En aquest conjunt de dades

(A) tenim una variable


(B) tenim dues variables
(C) tenim tres variables
(D) no podem identificar totes les variables
(E) Cap de les respostes anteriors és correcta annswer Tenim dues variables, el nombre de pizzes servides
cada setmana i el nom de la pizzeria que fa la pizza. endanswer

Pregunta 2: Un individu en aquest conjunt de dades és

(A) Un client d’una pizzeria


(B) Una setmana
(C) Una pizzeria
(D) Una pizza
(E) Cap de les respostes anteriors és correcta

Resposta:

El conjunt de dades consisteix en l’observació de 30 setmanes en cada pizzeria, per tant l’individu és
una setmana.
Pregunta 3: La dispersió relativa és

(A) igual a Pizza Gorra que a RadioPizza


(B) més gran a RadioPizza que a Pizza Gorra
(C) més gran a Pizza Gorra que a RadioPizza
(D) 0
(E) Cap de les respostes anteriors és correcta
Resposta:

Calculem la dispersió relativa pel coeficient de variació, o sigui la desviació tı́pica dividida per la mitjana:
24
Pizza Gorra = = 0, 0322
746
21
RadioPizza = = 0, 0280
749
Per tant és més gran a Pizza Gorra.

Pregunta 4: Fent el supòsit que tant per a Pizza Gorra com per a RadioPizza la distribució del nombre
de pizzes per setmana és aproximadament una distribució normal, indica quina de les afirmacions següents
és correcta:

(A) Tant a RadioPizza com a Pizza Gorra més del 68% de les setmanes es venen entre 726 i 770 pizzas
(B) Més del 68% de les setmanes es venen entre 727 i 770 a Pizza Gorra però no a RadioPizza
(C) Tant a RadioPizza com a Pizza Gorra menys del 68% de les setmanes es venen entre 726 i 770 pizzas
(D) Més del 68% de les setmanes es venen entre 726 i 770 a RadioPizza però no a Pizza Gorra
(E) Cap de les respostes anteriors és correcta

Resposta:

68% és el percentatge que a la regla del 68-95-99,7% de la distribució normal correspon a una desviació
tı́pica per sota i per sobre a la mitjana. Per tant per a Pizza Gorra:

746 − 24 = 722

746 + 24 = 770
Per tant entre 726 i 770 hi ha menys d’un 68%. Per a RadioPizza:

749 − 21 = 728

749 + 21 = 770
Per tant entre 726 i 770 hi ha més d’un 68% de les setmanes.
Pregunta 5: A la pizzeria RadioPizza, el rang interquartı́lic aproximat és

(A) 45
(B) 40
(C) 50
(D) 30
(E) Cap de les respostes anteriors és correcta

Resposta:

El rang interquartı́lic el calculem a partir de la diferència entre el tercer quartil aproximat i el primer
quartil aproximat. Usem la taula de freqüències de la pizzeria RadioPizza:
Nombre de Freqüència absoluta Freqüència absoluta
pizzes acumulada
700-720 2 2
720-740 8 10
740-760 11 21
760-780 7 28
780-800 2 30

Els quartils els podem aproximar observant que el primer quartil estarà entre l’observació 7 i 8, perquè
(30+1)/4=7,75, per tant estarà a l’interval 720-740, i el podem aproximar per 730. El tercer quartil estarà
entre el cas 23 i 24, perquè 3*(30+1)/4 = 23,25, i per tant estarà a l’interval 760-780, i el podem aproximar
per 770. Finalment el rang interquartı́lic és igual a:

770 − 730 = 40

Pregunta 6: A la pizzeria Pizza Gorra, la classe que conté la mediana és

(A) 720-740
(B) 760-780
(C) 740-760
(D) 700-720
(E) Cap de les respostes anteriors és correcta

Resposta:

Podem calcular una mediana aproximada obtenint la taula de freqüències:

Nombre des Freqüència absoluta Freqüència absoluta


Pizzes acumulada
700-720 5 5
720-740 6 11
740-760 12 23
760-780 4 27
780-800 3 30

Sent el nombre de casos parell, la mediana estarà entre l’observació 15 i l’observació 16. Veiem per tant
que la classe que acumula la mediana és la classe 740-760.

Pregunta 7: Si fem el supòsit que cada pizza pesa 400 grams la desviació estàndard en grams de les
pizzes que ven cada setmana RadioPizza:

(A) no la podem calcular amb les dades donades


(B) és igual 6800 grams
(C) és igual 7700 grams
(D) és igual 8400 grams
(E) Cap de les respostes anteriors és correcta
Resposta:

La desviació estàndard serà igual a 21 · 400 = 8400 grams.


Pregunta 8: Si fem el supòsit que cada pizza pesa 400 grams la mitjana en grams de les pizzes que ven
cada setmana Pizza Gorra:

(A) no la podem calcular amb les dades proporcionades


(B) és igual a 410100 grams
(C) és igual a 298400 grams
(D) és igual a 326300 grams
(E) Cap de les respostes anteriors és correcta

Resposta:

La mitjana serà igual a 746 · 400 = 298400 grams.

Pregunta 9: Si es venen exactament el mateix nombre de pizzes per setmana, però el seu pes augmenta
en 100 grams

(A) la distribució en grams de les pizzes de Pizza Gorra serà més asimètrica cap a l’esquerra
(B) la distribució en grams de les pizzes de Pizza Gorra serà més asimètrica cap a la dreta
(C) no podem saber com canvia la forma de la distribució de les pizzes de Pizza Gorra
(D) la forma de la distribució en grams de les pizzes de Pizza Gorra no canvia
(E) Cap de les respostes anteriors és correcta

Resposta:

Els canvis d’origen (ni tampoc els d’escala) afecten la forma de la distribució.
Pregunta 10: Si es venen exactament el mateix nombre de pizzes per setmana, però el seu pes augmenta
en 100 grams

(A) la desviació estàndard en grams de les pizzes de RadioPizza no canviarà de valor


(B) la desviació estàndard en grams de les pizzes de RadioPizza s’incrementarà en l’arrel quadrada de
100 grams
(C) la desviació estàndard en grams de les pizzes de RadioPizza s’incrementarà en 100 grams al quadrat
(D) la desviació estàndard en grams de les pizzes de RadioPizza s’incrementarà en 100 grams
(E) Cap de les respostes anteriors és correcta

Resposta:

El canvis d’origen no afecten a les mesures de dispersió, per tant la desviació estàndard no canviarà.

Exercici 2: Temps en acabar una exposició oral (6 punts)


El temps que triguen els equips d’Anàlisi de Dades en completar l’exposició final del seu treball d’equip
segueix una distribució normal, amb una mitjana igual a 10 minuts i una desviació estàndar igual a 2
minuts.
En base a aquesta informació contesta a les preguntes següents:

Pregunta 11: Quin és el percentatge aproximat d’equips que acaben l’exposició oral en 13 minuts o
menys?

(A) 85,23%
(B) 96,87%
(C) 93,32%
(D) 80,11%
(E) Cap de les respostes anteriors és correcta

Resposta:

Estandarditzem:
13 − 10
z= = 1, 5
2
A la taula de la distribució normal estàndard podem veure que hi ha un 93,32% dels equips que acaben
en 13 minuts o menys.

Pregunta 12: Useu la regla 68-95-99,7% per a aquesta pregunta: Quin és el percentatge aproximat
d’equips que acaba el test en 8 minuts o més?

(A) 95%
(B) 84%
(C) 16%
(D) 68%
(E) Cap de les respostes anteriors és correcta

Resposta:

8 és exactament una desviació estàndar per sota de la mitjana, per tant el percentatge és 68 + 32/2 =
84%.
Pregunta 13: Useu la regla 68-95-99,7% per a aquesta pregunta: Si es vol premiar amb un punt extra al
2,5% d’equips que acaben l’exposició més ràpid, quin seria el temps lı́mit per obtenir el premi?

(A) 6 minuts
(B) 5 minuts
(C) 3 minuts
(D) 10 minuts
(E) Cap de les respostes anteriors és correcta

Resposta:
El 2,5% correspon a la part de la regla referent al 95%, aixı́ que això són dos desviacions estàndar per
sota de la mitjana:
10 − 2 · 2 = 6
Es premiarà amb un punt extra als equips que acabin en 6 minuts o menys.
Pregunta 14: Quin lı́mit aproximat de temps s’hauria de posar a l’exposició perquè un 90% dels equips
poguessin completar-la a temps?

(A) 17,82 minuts


(B) 12,56 minuts
(C) 15,23 minuts
(D) 23,12 minuts
(E) Cap de les respostes anteriors és correcta

Resposta:

El valor de z que deixa un 90% a l’esquerra és z = 1, 28. Necessitem determinar x perquè es compleixi:
x − 10
= 1, 28
2
Per tant:
x = 1, 28 · 2 + 10 = 12, 56
L’exposició ha d’acabar en 12,56 minuts perquè aproximadament un 90% dels equips puguin completar-lo
a temps.

Pregunta 15: Un equip amb un temps estandarditzat de finalització de l’exposició oral igual a −1 acabarà
l’exposició oral en

(A) 11 minuts
(B) 8 minuts
(C) 9 minuts
(D) 7 minuts
(E) Cap de les respostes anteriors és correcta

Resposta:

Un temps estandarditzat de −1 minut correspon a un equip amb un temps de finalització de l’exposició


que està una desviació estàndard per sota de la mitjana, per tant triga 10 − 2 = 8 minuts.
Pregunta 16: Un equip que triga 14 minuts en realitzar l’exposició, té un temps estandarditzat de
finalització igual a

(A) -1
(B) 0
(C) 1
(D) 2
(E) Cap de les respostes anteriors és correcta

Resposta:

14 són dues desviacions estàndar per sobre de la mitjana, per tant el temps estandarditzat és igual a 2.

Exercici 3: Costos de La Ràpida SA (10 punts)


La Ràpida SA és una cadena de reparació de pantalles de mòbil que vol predir millor el cost de les
reparacions. La taula següent presenta informació recollida a 4 sucursals de la cadena sobre el nombre de
pantalles reparades i el cost de reparació en milers d’euros. Ens donen a més les desviacions estàndard i el
coeficient de determinació entre reparacions i cost:
sreparacions = 200, scost = 396, R2 = 0, 81

Sucursal Cost Reparacions


1 251 230
2 805 350
3 1200 700
4 900 400

Pregunta 17: En aquest cas la variable explicativa és:

(A) el cost
(B) les reparacions
(C) el nombre de sucursals
(D) les desviacions estàndard
(E) Cap de les respostes anteriors es correcta

Resposta:

Es vol predir el cost mitjançant les reparacions, per tant reparacions és la variable explicativa.
Pregunta 18: El coeficient de correlació és igual a

(A) 0,66
(B) 0,18
(C) 0,81
(D) 0,9
(E) Cap de les respostes anteriors és correcta

Resposta:

És l’arrel quadrada del coeficient de determinació, 0, 81 = 0, 9.

Pregunta 19: El pendent de la recta de regressió, establint la variable dependent i l’explicativa de manera
que tingui sentit econòmic, és aproximadament igual a:
(A) 0,883
(B) 1,782
(C) 0,615
(D) 1,322
(E) Cap de les respostes anteriors és correcta

Resposta:

Ho podem obtenir mitjançant la fórmula:


sy 396
b=r = 0, 9 = 1, 782
sx 200

Pregunta 20: La constant de la recta de regressió, establint la variable dependent i explicativa de manera
que tingui sentit econòmic, és aproximadament igual a:

(A) 40,56
(B) 32,11
(C) 55,10
(D) 60,20
(E) Cap de les respostes anteriors és correcta

Resposta:

Primer calculem les mitjanes:


Ȳ = 789
X̄ = 420
La constant la podem trobar utilitzant les fórmules:
sy 396
b=r 0, 9 = 1, 782
sx 200
i
Ȳ = a + 1, 782X̄.
Per tant:
a = Ȳ − bX̄ = 789 − 1, 782 · 420 = 40, 56

Pregunta 21: Amb la recta de regressió establerta en els apartats anteriors, quina seria la predicció
aproximada per a un valor de la variable explicativa igual a 500?:

(A) 1000,09
(B) 803,27
(C) 1200,11
(D) 931,56
(E) Cap de les respostes anteriors és correcta
Resposta:

La predicció seria:
40, 56 + 1, 782 · 500 = 931, 56

Pregunta 22: La recta calculada en els apartats anteriors no prediu exactament el cost de la sucursal 1.
Concretament l’error de predicció és aproximadament igual a:

(A) -199,42
(B) -257,84
(C) -100,30
(D) 100,17
(E) Cap de les respostes anteriors és correcta

Resposta:

L’error de predicció o residu és igual al valor real menys el valor predit, és a dir:

251 − 40, 56 − 1, 782 · 230 = −199, 42

Exercici 4: Enquesta sobre un producte (6 punts)


En una enquesta sobre un nou producte, s’ha preguntat a 154 subjectes sobre el seu color preferit, i
s’han obtingut els següents resultats:
Blanc Vermell Blau
Home 45 45 9
Dona 25 25 5
En base a aquesta informació contesteu les preguntes següents.

Pregunta 23: Quines són les variables de l’estudi?

(A) Una variable categòrica nominal (o sense ordre) i una variable categòrica ordinal (o amb ordre)
(B) Una variable categòrica i una variable numèrica
(C) Dues variables categòriques nominals (o sense ordre)
(D) Dues variables numèriques
(E) Cap de les respostes anteriors és correcta

Resposta:

Són dues variables categòriques nominals o sense ordre: “Sexe”, i “Color”.

Pregunta 24: D’acord amb la informació de les dades, la freqüència relativa de la distribució conjunta
de “Dona” i “Vermell” és:

(A) 12,33%
(B) 10,17%
(C) 9,42%
(D) 16,23%
(E) Cap de les respostes anteriors és correcta

Resposta:

La freqüència relativa que busquem és 25/154 = 0,162337662, o sigui 16,23%.

Pregunta 25: La distribució marginal de la variable sexe és igual a

(A) Blanc= 70, Vermell= 70, Blau= 14


(B) Blanc= 45, Vermell= 45, Blau= 9
(C) Home = 45, Dona = 25
(D) Home = 9, Dona = 5
(E) Cap de les respostes anteriors és correcta

Resposta:

Cap és correcta, la distribució marginal de sexe és Home=99, Dona=55.

Pregunta 26: El total de casos per a la distribució de sexe condicionada a què es prefereix el color blanc
és

(A) 99
(B) 55
(C) 154
(D) 70
(E) Cap de les respostes anteriors és correcta

Resposta:

Si condicionem a preferir el color blanc veiem que ens queden 70 individus, 45 homes i 25 dones.
Pregunta 27: La distribució de sexe condicionada a preferir el color blanc és igual a

(A) Home= 64,29%, Dona= 35,71%


(B) Blanc=45,45%, Vermell=45,45%, Blau=9,1%
(C) Blanc=64,29%, Vermell=64,29%, Blau=64,29%
(D) Home= 45%, Dona= 55%
(E) Cap de les respostes anteriors és correcta

Resposta:

Del total d’individus que prefereixen el blanc (70) hi ha 45 que són homes (64,29%) i 25 que són dones
(35,71%).
Pregunta 28: En aquesta taula de contingència, podem dir que les dues variables

(A) estan negativament correlacionades


(B) estan positivament correlacionades
(C) estan relacionades
(D) són independents
(E) Cap de les respostes anteriors és correcta

Resposta:

Les distribucions condicionals són iguals. Si mirem per exemple la distribució de sexe condicionada a
la preferència de color, veiem que per blanc, vermell i blau 64% són homes i 36% són dones. Per tant les
variables són independents.

Exercici 5: Contesta en full a part - Dues variables numèriques (6 punts)


En aquest exercici hauràs d’inventar-te 2 conjunts de dues variables numèriques X i Y amb únicament
4 observacions diferents cadascú, que compleixin les següents caracterı́stiques:

Pregunta 29: Per al primer conjunt el coeficient de correlació entre X i Y ha de ser exactament igual a
1.

Resposta:

Els punts han de caure tots exactament sobre una lı́nia recta. Per exemple:

X Y
1 1
2 2
3 3
4 4

Pregunta 30: Per al segon conjunt de dades el coeficient de correlació entre X i Y ha de ser exactament
igual a 0.

Resposta:

Ha de ser un conjunt de dades on la dispersió de les dades sigui màxima, és a dir que no es pugui
esbrinar cap mena de relació, perquè la covariància sigui 0. Qualssevol 4 valors que estiguin en els vèrtexs
d’un quadrat acompliran això, ja que les desviacions respecte a la mitjana es cancel·laran entre elles. Per
exemple:

X Y
1 1
1 -1
-1 -1
-1 1
Exercici 6: Contesta en un full a part – Transformació de dades (6 punts)
A l’empresa Palauet de la Música SA la mitjana dels salaris pagats per mes és de 2000 euros i la
desviació estàndar és de 1000 euros. A més sabem que la mediana és de 1800 euros, el primer quartil és de
1200 euros i el tercer quartil és de 2300 euros. Durant l’any l’empresa fa una pujada de 100 euros a tots
els treballadors. Posteriorment sobre el nou sou apujat en 100 euros es dóna una pujada de 10%.

Pregunta 31: Troba la mitjana, la mediana i la desviació estàndar dels sous d’aquesta empresa després
de les pujades.

Resposta:

Mitjana: (2000 + 100) × 1, 10 = 2310. Mediana= (1800 + 100) × 1, 10 = 2090. Desviació estàndar =
1000 × 1, 10 = 1100.
Pregunta 32: Troba el nou rang interquartı́lic després de las pujades.

Resposta:

Rang interquartı́lic= (2300 − 1200) × 1, 10 = 1210.

Exercici 7: Contesta en un full a part – Càlcul de la desigualtat (5 punts)


En una empresa tenim la següent distribució de treballadors i salaris:
El 20% de la plantilla són manobres amb els salaris més baixos i representen un 10% de la despesa en
salaris de l’empresa.
Els següents en l’escala salarial (guanyen més que els manobres però menys que la resta) són els auxiliars
administratius, que representen un 30% de la plantilla i representen un 20% de la despesa salarial.
A continuació venen els oficials administratius que representen un 30% de la plantilla i un 30% de la
despesa salarial.
Per últim tenim els caps de secció i encarregats, que són els que guanyen més i que representen un 20%
de la plantilla i un 40% de la despesa salarial.

Pregunta 33: Calcula un ı́ndex de Lorenz-Gini.

Resposta:

L’ı́ndex s’obté sumant les diferències entre plantilla acumulada i despesa salarial acumulada (excloent el
grup dels que guanyen més perquè s’haurà a acumulat el 100% tant de la plantilla i de la despesa salarial):
(0, 2 − 0, 1) + (0, 5 − 0, 3) + (0, 8 − 0, 6)
= 0, 3333
0, 2 + 0, 5 + 0, 8

Pregunta 34: Interpreta l’ı́ndex de Lorenz-Gini obtingut: Hi ha desigualtat en la distribució de salaris


d’aquesta empresa?

Resposta:
L’ı́ndex indica una certa desigualtat en la distribució de salaris però moderada, perquè l’ı́ndex està més
a prop de 0 que d’1.

Exercici 8: Contesta en un full a part – Índex de preus al consum (5 punts)


La evolució dels preus del béns de consum classificat en aliments no elaborats, productes energètics i
resta de béns i serveis, vé donat pels següents ı́ndexs:

Any Aliments no Productes Resta de


elaborats energètics béns i serveis
2000 100 100 100
2001 103 102 102
2002 105 104 103
2003 107 106 104

A més a més s’ha fet una Enquesta de Pressupostos Familiars l’any 2003, i s’han obtingut els següents
percentatges de despesa:

Any Aliments no Productes Resta de


elaborats energètics béns i serveis
2003 25% 20% 55%

Es demana:

Pregunta 35: Calcula el valor que tindria un ı́ndex de preus al consum l’any 2003, amb base a l’any 2000.

Resposta:

Calculem la mitjana ponderada:

107 ∗ 0, 25 + 106 ∗ 0, 20 + 104 ∗ 0, 55 = 105, 15

Pregunta 36: El que has calculat, és un ı́ndex de Paasche o de Laspeyres? Perquè?

Resposta:

És un ı́ndex de Paasshe, perquè utilitza les ponderacions corresponent a l’any corrent.

You might also like