You are on page 1of 7

CRIMINOLOGIA.

ANÀLISI DE DADES CURS 2017-2018


BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 2: SOLUCIONS

Pràctica 2. Solucions als exercicis proposats1

a) Dos dels Ajuntaments de la Comunidad de Madrid, Alcalá de Henares i Alcorcón, estan


preocupats per què darrerament els ha arribat que la Policia Municipal tenia molt mala
premsa en el seu municipi. Per comprovar-ho volen comparar la popularitat de la seva
Policia Municipal amb la dels altres dos cossos de seguretat, la Policia Nacional i la Guàrdia
Civil. El seu objectiu és esbrinar si la puntuació que la població del seu municipi atorga a la
Policia Municipal és significativament més baixa que la mitjana atorgada conjuntament als
altres dos cossos de seguretat. Ajuda’ls a trobar una resposta amb un 95% de confiança
(municipio, P12PM, P12CNP i P12GC).

En primer lloc hem de construir una variable que sigui la mitjana de la puntuació atorgada,
conjuntament, a la Policia Nacional i a la Guàrdia Civil. Per fer-ho utilitzem la següent sintaxi:

DadesCAM$P12CNP_GC<-(DadesCAM$P12CNP+DadesCAM$P12GC)/2

Com que probablement haurem de comprovar les condicions d’aplicació, fem també la
variable diferència entre aquesta que acabem de construir i la variable P12PM:

DadesCAM$resta<-DadesCAM$P12CNP_GC-DadesCAM$P12PM

Per avaluar si el nombre de casos supera els 30 creuem (demanant-ne, per exemple,
descriptius) la variable “resta” amb el municipi, de manera que obtenim:
$`municipio: Mun < 100.000 hab `
Mean.resta St. Deviation.resta Valid N.resta
0.4213115 1.5422893 305.0000000

$`municipio: Alcala de Henares `


Mean.resta St. Deviation.resta Valid N.resta
0.6052632 1.2536496 19.0000000

$`municipio: Alcobendas `
Mean.resta St. Deviation.resta Valid N.resta
-0.03333333 1.77750494 15.00000000

$`municipio: Alcorcon `
Mean.resta St. Deviation.resta Valid N.resta
0.1666667 1.2478553 36.0000000

$`municipio: Fuenlabrada `
Mean.resta St. Deviation.resta Valid N.resta
0.6184211 1.4162866 38.0000000

$`municipio: Getafe `
Mean.resta St. Deviation.resta Valid N.resta
0.00000 1.91345 32.00000

$`municipio: Leganes `
Mean.resta St. Deviation.resta Valid N.resta
0.6636364 1.6751300 55.0000000

$`municipio: Madrid capital `


Mean.resta St. Deviation.resta Valid N.resta
0.7082192 1.5323895 730.0000000

1
Ajenjo Cosp, Marc (2018) Pràctiques en Deducer d’inferència estadística aplicada al grau de
Criminologia. Departament de Sociologia, UAB, pp: 43-49.

43
CRIMINOLOGIA. ANÀLISI DE DADES CURS 2017-2018
BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 2: SOLUCIONS
$`municipio: Mostoles `
Mean.resta St. Deviation.resta Valid N.resta
0.312500 1.078267 40.000000

$`municipio: Torrejon de Ardoz `


Mean.resta St. Deviation.resta Valid N.resta
0.5322581 2.7626542 31.0000000

Veiem que en el cas d’Alcalá de Henares (n=19) ens caldrà comprovar la normalitat, però no
així per a Alcorcón (n=36).

Alcalá de Henares

Per avaluar la normalitat d’un subcol·lectiu, recordem que així li hem d’indicar en la finestra on
fem l’anàlisi:

En la taula de sota comprovem la normalitat i veiem que podem assumir que la variable
diferència és normal (p-valor=0,349); de manera que podrem fer el test paramètric.
Shapiro-Wilk normality test
W p-value
resta 0.9468827 0.3492825

Ara bé, aquest test paramètric no l’hem de fer al conjunt de la base de dades, sinó només als
residents al municipi d’Alcalà. Per fer-ho la millor manera és crear prèviament un subfitxer a
partir del menú Data: Subset, i dient-li:

44
CRIMINOLOGIA. ANÀLISI DE DADES CURS 2017-2018
BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 2: SOLUCIONS

La sintaxi que això genera és la següent (després podrem modificar aquesta sintaxi per repetir
el procediment en altres municipis):

ALCALA<-subset(DadesCAM,municipio=="Alcala de Henares")

Un cop fet això, ja li fem el test paramètric, que ens dóna el següent resultat:
Paired t-test

data: ALCALA$P12PM and ALCALA$P12CNP_GC


t = -2.1045, df = 18, p-value = 0.04965
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.209502944 -0.001023372
sample estimates:
mean of the differences
-0.6052632

Tot i que ens trobem en el límit, podem acceptar amb un 95% de confiança (p-valor<0,050)
que a Alcalá de Henares la valoració que es fa a la Policia Municipal és diferent de la que es fa
al conjunt dels altres cossos de seguretat. A més, podem assegurar que la valoració de la
Policia Municipal és inferior.

Alcorcón

Tal i com hem vist, ara no és estrictament necessari comprovar la normalitat (n>30), de
manera que farem directament el test paramètric. Si que ens cal, però, generar un subfitxer
només amb els residents a Alcorcón. L’alternativa de fer-ho directament per la consola seria:

ALCORCON<-subset(DadesCAM,municipio=="Alcorcon")

I fent el test paramètric corresponent obtindrem:

45
CRIMINOLOGIA. ANÀLISI DE DADES CURS 2017-2018
BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 2: SOLUCIONS
Paired t-test

data: ALCORCON$P12PM and ALCORCON$P12CNP_GC


t = -0.8014, df = 35, p-value = 0.4283
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.5888802 0.2555468
sample estimates:
mean of the differences
-0.1666667

De manera que no podem acceptar amb un 95% de confiança (p-valor=0,428) que a Alcorcón
la valoració que es fa a la Policia Municipal sigui diferent de la que es fa al conjunt dels altres
cossos de seguretat.

b) Fes el mateix per a tots els municipis que hi ha representats a l’enquesta.

Per fer-ho el millor és seleccionar-ne cadascun per separat i fer-los un a un. En aquest cas no
té massa sentit fer-ho pel conjunt de municipis menors de 100.000 habitants, en tant que el
cos de Policia Municipal és diferent en cadascun dels municipis englobats sota l’epígraf
<100.000 habitants.

Alcobendas

En tant que la mostra és petita (n=15) abans de fer el test hem de mirar la normalitat. En la
taula de sota comprovem que podem assumir que la variable diferència és normal (p-
valor=0,464); de manera que podrem fer el test paramètric.
Shapiro-Wilk normality test
W p-value
resta 0.9460368 0.464328

Directament des de la consola crem un fitxer amb només els casos d’Alcobendas:

ALCOBENDAS<-subset(DadesCAM,municipio=="Alcobendas")

I fent el test paramètric corresponent obtindrem:


Paired t-test

data: ALCOBENDAS$P12PM and ALCOBENDAS$P12CNP_GC


t = 0.0726, df = 14, p-value = 0.9431
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.9510161 1.0176828
sample estimates:
mean of the differences
0.03333333

De manera que no podem acceptar amb un 95% de confiança (p-valor=0,943) que a


Alcobendas la valoració que es fa a la Policia Municipal sigui diferent de la que es fa al conjunt
dels altres cossos de seguretat.

Fuenlabrada

Tampoc cal comprovar la normalitat (n>30), de manera que farem directament el test
paramètric. Si que ens cal, però, generar un subfitxer només amb els residents a Fuenlabrada.
Des de la consola li direm:

FUENLABRADA<-subset(DadesCAM,municipio=="Fuenlabrada")

I fent el test paramètric corresponent obtindrem:

46
CRIMINOLOGIA. ANÀLISI DE DADES CURS 2017-2018
BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 2: SOLUCIONS
Paired t-test

data: FUENLABRADA$P12PM and FUENLABRADA$P12CNP_GC


t = -2.6917, df = 37, p-value = 0.01061
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.0839429 -0.1528992
sample estimates:
mean of the differences
-0.6184211

De manera que podem acceptar amb un 95% de confiança (p-valor=0,011) que a Fuenlabrada
la valoració que es fa a la Policia Municipal és diferent de la que es fa al conjunt dels altres
cossos de seguretat. A més, podem assegurar que la valoració de la Policia Municipal és
inferior.

Getafe

Tampoc cal comprovar la normalitat (n>30), de manera que farem directament el test
paramètric. Des de la consola, creem, en primer lloc, el subfitxer només amb els residents a
Getafe:

GETAFE<-subset(DadesCAM,municipio=="Getafe")

I fent el test paramètric corresponent obtindrem:


Paired t-test

data: GETAFE$P12PM and GETAFE$P12CNP_GC


t = 0, df = 31, p-value = 1
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.6898722 0.6898722
sample estimates:
mean of the differences
0

No podem acceptar amb un 95% de confiança (p-valor=1,000) que a Getafe la valoració que es
fa a la Policia Municipal sigui diferent de la que es fa al conjunt dels altres cossos de seguretat.

Leganés

La mostra és de 55 casos, de manera que tampoc cal comprovar la normalitat. Des de la


consola, creem, en primer lloc, el subfitxer només amb els residents a Leganés:

LEGANES<-subset(DadesCAM,municipio=="Leganes")

I fent el test paramètric corresponent obtindrem:


Paired t-test

data: LEGANES$P12PM and LEGANES$P12CNP_GC


t = -2.9381, df = 54, p-value = 0.004848
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.1164874 -0.2107853
sample estimates:
mean of the differences
-0.6636364

Podem acceptar amb un 95% de confiança (p-valor=0,005) que a Leganés la valoració que es fa
a la Policia Municipal és diferent de la que es fa al conjunt dels altres cossos de seguretat. A
més, podem assegurar que la valoració de la policia municipal és inferior.

47
CRIMINOLOGIA. ANÀLISI DE DADES CURS 2017-2018
BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 2: SOLUCIONS

Madrid capital

La mostra és molt gran, de 730 casos, de manera que passem directament a fer el test
paramètric. Des de la consola, creem, en primer lloc, el subfitxer només amb els residents a la
ciutat de Madrid:

MADRID<-subset(DadesCAM,municipio=="Madrid capital")

I fent el test paramètric corresponent obtindrem:


Paired t-test

data: MADRID$P12PM and MADRID$P12CNP_GC


t = -12.4871, df = 729, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.8195659 -0.5968724
sample estimates:
mean of the differences
-0.7082192

Podem acceptar amb un 95% de confiança (p-valor<0,001) que els residents a la ciutat de
Madrid no valoren de la mateixa manera la Policia Municipal que els altres dos cossos de
seguretat. A més, podem assegurar que la valoració de la Policia Municipal és inferior.

Móstoles

Tampoc cal comprovar la normalitat (n=40). Des de la consola, creem, en primer lloc, el
subfitxer només amb els residents a Móstoles:

MOSTOLES<-subset(DadesCAM,municipio=="Mostoles")

I fent el test paramètric corresponent obtindrem:


Paired t-test

data: MOSTOLES$P12PM and MOSTOLES$P12CNP_GC


t = -1.833, df = 39, p-value = 0.07445
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.6573466 0.0323466
sample estimates:
mean of the differences
-0.3125

No podem acceptar amb un 95% de confiança (p-valor=0,074) que a Móstoles la valoració que
es fa a la Policia Municipal sigui diferent de la que es fa al conjunt dels altres cossos de
seguretat.

Torrejón de Ardoz

Tampoc cal comprovar la normalitat (n=31). Des de la consola, creem, en primer lloc, el
subfitxer només amb els residents a Torrejón de Ardoz:

TORREJON<-subset(DadesCAM,municipio=="Torrejon de Ardoz")

I fent el test paramètric corresponent obtindrem:

48
CRIMINOLOGIA. ANÀLISI DE DADES CURS 2017-2018
BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 2: SOLUCIONS
Paired t-test

data: TORREJON$P12PM and TORREJON$P12CNP_GC


t = -1.0727, df = 30, p-value = 0.292
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.5456078 0.4810917
sample estimates:
mean of the differences
-0.5322581

No podem acceptar amb un 95% de confiança (p-valor=0,292) que a Torrejón de Ardoz la


valoració que es fa a la Policia Municipal sigui diferent de la que es fa al conjunt dels altres
cossos de seguretat.

49

You might also like