You are on page 1of 10

Grau en Ciències Empresarials-Management.

Curs 2019-20
Examen d'Estadística (segon trimestre)

Nom i cognom ....................................................................................................................................

Instruccions: L 'examen consta de 3 exercicis. La puntuació màxima total és de 100 punts. Teniu 2 hores
per resoldre l'examen. Expliqueu sempre les passes que feu. No separeu els fulls d’aquest examen. Les
solucions de l’examen seran publicades en l’aula global.

Exercici 1. (45 punts)


Disposem d’una base de dades amb 101 observacions on es recullen algunes característiques individuals
(Gènere, Edat, Renda neta mensual, Tendència política , metres quadrats de l’habitatge principal i consum en
calefacció de l’últim mes). Considerem que es tracta d’una mostra aleatòria provinent d’una població més
gran. Començarem per descriure la variable metres quadrats (dades$metres2).

> summary(dades$metres2)
Min. 1st Qu. Median Mean 3rd Qu. Max.
50.00 64.00 75.00 91.52 106.00 198.00
> sd(dades$metres2)
[1] 40.25583

a) (5 punts) Calcula un interval de confiança del 99% per a la mitjana poblacional dels metres quadrats.
Interpreta’l.

b) (10 punts) Examinem ara la variable Renda. La mitjana en la mostra és 2361,199€ i la desviació típica en la
mostra és 2165,262. Pensem que la mitjana de la renda en la població és de 2500. Desmenteixen les nostres
dades aquesta última afirmació? Ens estan dient les dades que la mitjana de renda en la població
probablement és menor que 2500? Fes un contrast d’hipòtesis adequat per donar resposta a aquestes
preguntes. Pots utilitzar un nivell de significació del 5%.

1
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre)

c) (15 punts) Ens interessa també comprovar si i ha diferències de renda entre homes i dones. Les mitjanes i
desviacions típiques de la renda agrupades per gènere són:

ni Xi si

Homes 47 2469,523 2335,343


Dones 54 2266,916 2023,114

Fes un contrast d’hipòtesis on la hipòtesi nul·la és que no hi ha diferències en la mitjana de Renda entre homes
i dones, contra l’alternativa que diu que la mitjana dels homes és major. El nivell de significació és el 5%.

2
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre)

d) (15 punts) També ens agradaria saber si la variable “Tendència política” està relacionada amb la Renda.
Disposem de les següents mitjanes i variàncies de la renda dels individus, classificats segons la seva
tendència política (votants d’esquerra, de centre o de dreta):

Esquerra Centre Dreta


ni 42 25 34
1212,637 2367,123 3775,655
Xi
Vari 1801617 3961879 5347100

Fes un contrast Anova per saber si les mitjanes de renda són diferents en les tres categories de votants en la
població. (Assumeix normalitat i homogeneïtat de variàncies).

3
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre)

Exercici 2. (25 punts)


a) (5 punts) Suposem que volem calcular un interval de confiança del percentatge de votants d’esquerra en la
població. Quina hauria d’haver estat la grandària de la mostra si es desitja que el marge d’error de l’interval
de confiança del 96% sigui com a màxim de 5 punts percentuals (5%)? Suposem que estem prou convençuts
que el percentatge de votants d’esquerres de la població estarà al voltant del 40%. Mostreu els càlculs.

b) (5 punts) Calcula el percentatge d’individus (en la mostra actual) que voten un partit d’esquerra (les dades
les pots obtenir del darrer apartat de l’exercici 1). Calcula també un interval de confiança del percentatge de
votants d’esquerres en la població. Utilitza un nivell de confiança del 96%.

4
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre)

c)(15 punts) A la vista de la següent informació (són freqüències absolutes), creus que hi ha algun tipus de
relació entre el Gènere i la Tendència política? Planteja un contrast adequat.

Home Dona TOTAL


Centre 7 18 25
Dreta 16 18 34
Esquerra 24 18 42
TOTAL 47 54 101

5
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre)

Exercici 3. (30 punts)


Per acabar d’examinar aquestes dades ens fixarem ara en la relació entre la renda (variable dades$Renda) i el
consum mensual en calefacció (variable dades$Consum_gas).

a) (10 punts) Escriu la recta de regressió. Estima els coeficients de regressió. Pots utilitzar la següent
informació incompleta (mod1 és la regressió lineal entre dades$Consum_gas i dades$Renda) :

> c(mean(dades$Renda),mean(dades$Consum_gas))
[1] 2361.1988 114.0542

> c(sd(dades$Renda),sd(dades$Consum_gas))
[1] 2165.262 48.014

> summary(mod1)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) ??? ??? 14.546 < 2e-16 ***
dades$Renda ??? ??? 7.656 1.3e-11 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 38.25 on 99 degrees of freedom


Multiple R-squared: 0.3719, Adjusted R-squared: 0.3655
F-statistic: 58.61 on 1 and 99 DF, p-value: 1.302e-11

6
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre)

b) (10 punts) La capacitat explicativa de l’anterior model és limitada. A més, hi ha altres factors que
probablement també poden influir en el consum de gas. Els metres quadrats de l’habitatge és un d’ells.
Hem estimat el model Consum_gas = β0 + β1 Renda + β2metres2 + error. Els resultats es mostren
incomplets.

> mod2 <- lm(dades$Consum_gas ~ dades$Renda + dades$metres2)


> summary(mod2)

Call:
lm(formula = dades$Consum_gas ~ dades$Renda + dades$metres2)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 15.233110 4.868090 3.129 0.00231 **
dades$Renda 0.001580 0.001138 ??? ???
dades$metres2 1.038969 0.061202 16.976 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 19.36 on 98 degrees of freedom


Multiple R-squared: 0.8406, Adjusted R-squared: 0.8373
F-statistic: 258.4 on 2 and 98 DF, p-value: < 2.2e-16

La capacitat explicativa d’aquest model és millor i dades$metres2 és altament significativa. És la variable


dades$Renda estadísticament diferent de 0? Fes el contrast oportú i respon la pregunta. Comenta el resultat
comparant-lo amb el de l’apartat anterior.

7
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre)

c) (10 punts) Ampliem el model introduint la variable Edat. Es una variable amb 4 categories ( 18-30 , 31-45,
46-60, més de 60). Per introduir l’efecte de l’edat en el model hem creat 3 noves variables: dades$Edat2 que
pren el valor 1 si l’individu té entre 18 i 30 anys i 0 en cas contrari. La variable dades$Edat3 pren el valor 1 si
l’individu té entre 31 i 45 anys i 0 en cas contrari. Per últim la variable dades$Edat4 pren el valor 1 si l’individu
té més de 60 anys i 0 en cas contrari. Els resultats d’estimar aquest model es mostren a continuació:

> summary(mod3)

Call:
lm(formula = dades$Consum_gas ~ dades$Renda + dades$metres2 +
dades$Edat2 + dades$Edat3 + dades$Edat4)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 17.285602 5.370692 3.219 0.00176 **
dades$Renda 0.002387 0.001167 2.045 0.04363 *
dades$metres2 1.070247 0.063195 16.936 < 2e-16 ***
dades$Edat2 -11.542786 5.496581 -2.100 0.03838 *
dades$Edat3 -11.792086 6.342501 -1.859 0.06609 .
dades$Edat4 -1.814528 5.780689 -0.314 0.75429
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 19.06 on 95 degrees of freedom


Multiple R-squared: 0.8503, Adjusted R-squared: 0.8424
F-statistic: 107.9 on 5 and 95 DF, p-value: < 2.2e-16

Segons aquest model quant pagarà de mitjana un individu amb una renda de 2500€, un pis de 90 metres
quadrats, i 44 anys?

I un individu de 25 anys, amb un pis de 60 metres quadrats i una renda de 1500€?

8
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre)

9
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre)

10

You might also like