You are on page 1of 4

08.

581 Anàlisi Multivariant


Curs 2018-19 / 1r semestre

Solucions orientatives

Prova d’avaluació continuada 1. ANÀLISI UNIVARIANT

En l’estudi de mercat de “El triangle de les Bermudas”, el gerent del centre comercial Barcelona Glòries estava
interessat en conèixer una mica millor els seus clients per tal de poder derivar-ne algunes decisions estratègics
de futur. En l’apartat 3 del cas pràctic s’analitza el comportament de compra a partir d’una mostra representativa
de 531 visitants.

En aquesta primera PAC ens volem centrar en les variables de Satisfacció dels clients, posant èmfasi en la
satisfacció amb el pàrquing. A partir de les dades contingudes en el fitxer en format Excel
“Dades_CasPractic1.xls” (que haureu d’importar amb el R-Commander) en què es basa el cas pràctic de “El
triangle de les Bermudas”, es demana que contesteu de forma raonada les següents qüestions:

Pregunta 1:
Realitzeu un histograma de la variable de Satisfacció general (SATISF_GEN) i de la variable Nivell de qualitat
percebuda del pàrquing (P34_5), i la corresponent anàlisi descriptiva per ambdues variables. Comenteu els
principals resultats obtinguts en relació a les mesures de centre, de dispersió i de forma de la distribució.
150
frequency

100
50
0

2 4 6 8 10

SATISF_GEN

Pàgina 1 de 4
PAC1. ANÀLISI UNIVARIANT

150
100
frequency

50
0

0 2 4 6 8 10

P34_5

mean sd cv skewness kurtosis 0% 25% 50% 75% 100% n NA


SATISF_GEN 7.24385 1.22902 0.1696642 -0.5592759 1.955936 2 7 7 8 10 529 2
P34_5 8.03675 1.90588 0.2371452 -1.2414870 2.364380 0 7 8 10 10 517 14

Pel que fa a la Satisfacció General (SATISF_GEN) la mitjana és força elevada (7.24) i s’assembla molt a la
mediana (7) per la qual cosa podem afirmar que no hi hauran valors extrems (les respostes possibles es troben
entre 0 i 10). La distribució és lleugerament asimètrica cap a l’esquerra, com confirmen la forma de l’histograma
i el coeficient de simetria (skewness=-0.56): la freqüència de puntuacions baixes és inferior a la freqüència de
puntuacions altes.

El nivell de qualitat percebuda del pàrquing (P34_5) té una mitjana encara més elevada (8.04) amb un valor
molt proper a la mediana (8). Com podem observar en l’histograma la distribució és molt asimètrica a l’esquerra,
amb un coeficient de simetria de -1.24. Això també es pot comprovar fixant-nos en què el primer quartil se situa
en el 7 i per tant el 75% dels valors es troben per sobre d’aquest valor elevat.

Pregunta 2:
El gerent del centre comercial vol saber si el seu client intern és eminentment jove o gran. Aquesta important
informació podria fer reorientar la seva estratègia a l’hora d’obrir nous negocis. En aquest sentit, es planteja
contrastar la següent hipòtesi: el client tipus té una edat mitjana de 32 anys o, alternativament, aquesta mitjana
és més gran de 32 anys. En aquesta pregunta es demana que ajudeu al gerent a contrastar aquesta hipòtesi,
amb un nivell de significació de 0,05. A quina conclusió s’arriba? Raoneu la resposta.

Nota: Plantegeu les hipòtesis nul·la i alternativa, trobeu l'estadístic de contrast i el seu valor-p, i resoleu el contrast.

Pàgina 2 de 4
PAC1. ANÀLISI UNIVARIANT

One Sample t-test

data: EDAD
t = 5.6228, df = 530, p-value = 0.00000001521
alternative hypothesis: true mean is greater than 32
95 percent confidence interval:
34.08626 Inf
sample estimates:
mean of x
34.95104

H0: mitjana edat = 32


H1: mitjana edat > 32

Resolem el contrast a partir del valor P, que és 0.000000001521, és a dir, pràcticament igual a zero. Atès que
és més petit que el nivell de significació, 0,05, rebutgem la hipòtesi nul·la, i podem afirmar que la mitjana
d'edat és més gran de 32 anys.

Pregunta 3:
Amb l’objectiu d’entendre millor el seu client, i en concret l’edat d’aquest client, es planteja analitzar si hi pot
haver o no diferències entre sexes pel que fa referència a l’edat. Vol respondre la següent qüestió: les dones
que visiten el centre comercial tenen la mateixa edat (mediana) que els homes? En aquesta pregunta es
demana que doneu resposta a aquesta qüestió a partir de la realització d'un diagrama de caixa de la variable
(EDAD) pels homes i un altre per les dones. Comenta els resultats obtinguts.

Nota: Per a respondre aquesta qüestió heu de tenir present que en la base de dades, la variable sexe (SEXO) s’ha de
convertir de Numèrica a Factor (SEXOR)

La mediana de l'edat és superior per les dones que pels homes mentre que la mitjana és superior pels homes
(35.11) que per les dones (34.83). A més, les edats de les dones són menys disperses que les edats dels
homes, atès que els quartils 1 y 3 es troben més propers en el grup de les dones que no pas en el grup dels
homes. Inicialment, doncs, s'observen diferències entre sexes pel que fa a l'edat.

Pàgina 3 de 4
PAC1. ANÀLISI UNIVARIANT
Pregunta 4:
Per complementar el resultat de la pregunta anterior es planteja ara analitzar si hi pot haver o no diferències
entre sexes pel que fa referència a l’edat mitjançant un contrast d’hipòtesis (assumiu igualtat de variàncies entre
els grups). Comenteu el resultat obtingut.

Nota: Per a respondre aquesta qüestió heu de tenir present que s’han de dividir la mostra en dues, una corresponent als
homes i l’altra a les dones. En la base de dades, la variable sexe (SEXO) s’ha de convertir de Numèrica a Factor (SEXOR)
El nivell de significació és de 0,05.

Two Sample t-test

data: EDAD by SEXOR


t = 0.276, df = 529, p-value = 0.7826
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.793798 2.380277
sample estimates:
mean in group H mean in group M
35.11947 34.82623

A partir del resultat obtingut, observem que el valor P (0,783), és més gran que 0,05, i per tant no podem rebutjar
la hipòtesis nul·la. En conseqüència, no podem dir que hi hagi diferències entre la edat dels homes i les dones
que visiten el centre comercial.

Pregunta 5:
Un cop analitzat el perfil del client des de la perspectiva de l’edat i del sexe, ara volia saber si els clients eren
tant del “barri” com visitants que venien de fora a comprar, és a dir, clients d’altres parts de Barcelona. Donat
que no tenia aquesta informació de forma directa a partir d’una pregunta en l’enquesta, ho va aproximar a partir
de la variable “utilització del pàrquing” (P14_M23). Si el percentatge era superior al 70%, això li donaria indicis
que realment tenia una clientela que era majoritàriament de fora del barri; si no, si aquest percentatge era
inferior al 70%, li podria donar a entendre que es tractava d’un client que tant venia de lluny com del propi barri.
Per tal de respondre aquesta qüestió es demana que analitzeu la variable “utilització del pàrquing” (anàlisi
descriptiva), i que resolgueu el següent contrast d’hipòtesis:

H0: el percentatge d’utilització del pàrquing és del 70%


H1: el percentatge d’utilització del pàrquing és menor que el 70%

Comenteu els resultats.


Nota: Observeu que s’ha de fer un contrast d’hipòtesis de proporcions, unilateral (Test Binomial Exacte). La variable
P14_M23 s’ha de reconvertir en factor (P14_M23R) i s’han de reordenar els seus valors. El nivell de significació és de 0,05.

Frequency counts (test is for first level):


P14_M23R
Si No
319 212

Exact binomial test

data: rbind(.Table)
number of successes = 319, number of trials = 531, p-value = 0.0000007128
alternative hypothesis: true probability of success is less than 0.7
95 percent confidence interval:
0.0000000 0.6361715
sample estimates:
probability of success
0.6007533

El valor P del contrast (més petit que 0,05) ens indica que hem de rebutjar la hipòtesis nul·la, i per tant podem
afirmar que el percentatge d’utilització del pàrquing és menor del 70%. En conseqüència, el gerent té indicis de
que no hi ha una majoria de clients que vinguin de fora del barri.

Pàgina 4 de 4

You might also like