Professional Documents
Culture Documents
Solucions orientatives
En l’estudi de mercat de “El triangle de les Bermudas”, el gerent del centre comercial Barcelona Glòries estava
interessat en conèixer una mica millor els seus clients per tal de poder derivar-ne algunes decisions estratègics
de futur. En l’apartat 3 del cas pràctic s’analitza el comportament de compra a partir d’una mostra representativa
de 531 visitants.
En aquesta primera PAC ens volem centrar en les variables de Satisfacció dels clients, posant èmfasi en la
satisfacció amb el pàrquing. A partir de les dades contingudes en el fitxer en format Excel
“Dades_CasPractic1.xls” (que haureu d’importar amb el R-Commander) en què es basa el cas pràctic de “El
triangle de les Bermudas”, es demana que contesteu de forma raonada les següents qüestions:
Pregunta 1:
Realitzeu un histograma de la variable de Satisfacció general (SATISF_GEN) i de la variable Nivell de qualitat
percebuda del pàrquing (P34_5), i la corresponent anàlisi descriptiva per ambdues variables. Comenteu els
principals resultats obtinguts en relació a les mesures de centre, de dispersió i de forma de la distribució.
150
frequency
100
50
0
2 4 6 8 10
SATISF_GEN
Pàgina 1 de 4
PAC1. ANÀLISI UNIVARIANT
150
100
frequency
50
0
0 2 4 6 8 10
P34_5
Pel que fa a la Satisfacció General (SATISF_GEN) la mitjana és força elevada (7.24) i s’assembla molt a la
mediana (7) per la qual cosa podem afirmar que no hi hauran valors extrems (les respostes possibles es troben
entre 0 i 10). La distribució és lleugerament asimètrica cap a l’esquerra, com confirmen la forma de l’histograma
i el coeficient de simetria (skewness=-0.56): la freqüència de puntuacions baixes és inferior a la freqüència de
puntuacions altes.
El nivell de qualitat percebuda del pàrquing (P34_5) té una mitjana encara més elevada (8.04) amb un valor
molt proper a la mediana (8). Com podem observar en l’histograma la distribució és molt asimètrica a l’esquerra,
amb un coeficient de simetria de -1.24. Això també es pot comprovar fixant-nos en què el primer quartil se situa
en el 7 i per tant el 75% dels valors es troben per sobre d’aquest valor elevat.
Pregunta 2:
El gerent del centre comercial vol saber si el seu client intern és eminentment jove o gran. Aquesta important
informació podria fer reorientar la seva estratègia a l’hora d’obrir nous negocis. En aquest sentit, es planteja
contrastar la següent hipòtesi: el client tipus té una edat mitjana de 32 anys o, alternativament, aquesta mitjana
és més gran de 32 anys. En aquesta pregunta es demana que ajudeu al gerent a contrastar aquesta hipòtesi,
amb un nivell de significació de 0,05. A quina conclusió s’arriba? Raoneu la resposta.
Nota: Plantegeu les hipòtesis nul·la i alternativa, trobeu l'estadístic de contrast i el seu valor-p, i resoleu el contrast.
Pàgina 2 de 4
PAC1. ANÀLISI UNIVARIANT
data: EDAD
t = 5.6228, df = 530, p-value = 0.00000001521
alternative hypothesis: true mean is greater than 32
95 percent confidence interval:
34.08626 Inf
sample estimates:
mean of x
34.95104
Resolem el contrast a partir del valor P, que és 0.000000001521, és a dir, pràcticament igual a zero. Atès que
és més petit que el nivell de significació, 0,05, rebutgem la hipòtesi nul·la, i podem afirmar que la mitjana
d'edat és més gran de 32 anys.
Pregunta 3:
Amb l’objectiu d’entendre millor el seu client, i en concret l’edat d’aquest client, es planteja analitzar si hi pot
haver o no diferències entre sexes pel que fa referència a l’edat. Vol respondre la següent qüestió: les dones
que visiten el centre comercial tenen la mateixa edat (mediana) que els homes? En aquesta pregunta es
demana que doneu resposta a aquesta qüestió a partir de la realització d'un diagrama de caixa de la variable
(EDAD) pels homes i un altre per les dones. Comenta els resultats obtinguts.
Nota: Per a respondre aquesta qüestió heu de tenir present que en la base de dades, la variable sexe (SEXO) s’ha de
convertir de Numèrica a Factor (SEXOR)
La mediana de l'edat és superior per les dones que pels homes mentre que la mitjana és superior pels homes
(35.11) que per les dones (34.83). A més, les edats de les dones són menys disperses que les edats dels
homes, atès que els quartils 1 y 3 es troben més propers en el grup de les dones que no pas en el grup dels
homes. Inicialment, doncs, s'observen diferències entre sexes pel que fa a l'edat.
Pàgina 3 de 4
PAC1. ANÀLISI UNIVARIANT
Pregunta 4:
Per complementar el resultat de la pregunta anterior es planteja ara analitzar si hi pot haver o no diferències
entre sexes pel que fa referència a l’edat mitjançant un contrast d’hipòtesis (assumiu igualtat de variàncies entre
els grups). Comenteu el resultat obtingut.
Nota: Per a respondre aquesta qüestió heu de tenir present que s’han de dividir la mostra en dues, una corresponent als
homes i l’altra a les dones. En la base de dades, la variable sexe (SEXO) s’ha de convertir de Numèrica a Factor (SEXOR)
El nivell de significació és de 0,05.
A partir del resultat obtingut, observem que el valor P (0,783), és més gran que 0,05, i per tant no podem rebutjar
la hipòtesis nul·la. En conseqüència, no podem dir que hi hagi diferències entre la edat dels homes i les dones
que visiten el centre comercial.
Pregunta 5:
Un cop analitzat el perfil del client des de la perspectiva de l’edat i del sexe, ara volia saber si els clients eren
tant del “barri” com visitants que venien de fora a comprar, és a dir, clients d’altres parts de Barcelona. Donat
que no tenia aquesta informació de forma directa a partir d’una pregunta en l’enquesta, ho va aproximar a partir
de la variable “utilització del pàrquing” (P14_M23). Si el percentatge era superior al 70%, això li donaria indicis
que realment tenia una clientela que era majoritàriament de fora del barri; si no, si aquest percentatge era
inferior al 70%, li podria donar a entendre que es tractava d’un client que tant venia de lluny com del propi barri.
Per tal de respondre aquesta qüestió es demana que analitzeu la variable “utilització del pàrquing” (anàlisi
descriptiva), i que resolgueu el següent contrast d’hipòtesis:
data: rbind(.Table)
number of successes = 319, number of trials = 531, p-value = 0.0000007128
alternative hypothesis: true probability of success is less than 0.7
95 percent confidence interval:
0.0000000 0.6361715
sample estimates:
probability of success
0.6007533
El valor P del contrast (més petit que 0,05) ens indica que hem de rebutjar la hipòtesis nul·la, i per tant podem
afirmar que el percentatge d’utilització del pàrquing és menor del 70%. En conseqüència, el gerent té indicis de
que no hi ha una majoria de clients que vinguin de fora del barri.
Pàgina 4 de 4