Professional Documents
Culture Documents
Pràctica 2 - Solucions
Pràctica 2 - Solucions
En primer lloc hem de construir una variable que sigui la mitjana de la puntuació atorgada,
conjuntament, a la Policia Nacional i a la Guàrdia Civil. Per fer-ho utilitzem la següent sintaxi:
DadesCAM$P12CNP_GC<-(DadesCAM$P12CNP+DadesCAM$P12GC)/2
Com que probablement haurem de comprovar les condicions d’aplicació, fem també la
variable diferència entre aquesta que acabem de construir i la variable P12PM:
DadesCAM$resta<-DadesCAM$P12CNP_GC-DadesCAM$P12PM
Per avaluar si el nombre de casos supera els 30 creuem (demanant-ne, per exemple,
descriptius) la variable “resta” amb el municipi, de manera que obtenim:
$`municipio: Mun < 100.000 hab `
Mean.resta St. Deviation.resta Valid N.resta
0.4213115 1.5422893 305.0000000
$`municipio: Alcobendas `
Mean.resta St. Deviation.resta Valid N.resta
-0.03333333 1.77750494 15.00000000
$`municipio: Alcorcon `
Mean.resta St. Deviation.resta Valid N.resta
0.1666667 1.2478553 36.0000000
$`municipio: Fuenlabrada `
Mean.resta St. Deviation.resta Valid N.resta
0.6184211 1.4162866 38.0000000
$`municipio: Getafe `
Mean.resta St. Deviation.resta Valid N.resta
0.00000 1.91345 32.00000
$`municipio: Leganes `
Mean.resta St. Deviation.resta Valid N.resta
0.6636364 1.6751300 55.0000000
1
Ajenjo Cosp, Marc (2018) Pràctiques en Deducer d’inferència estadística aplicada al grau de
Criminologia. Departament de Sociologia, UAB, pp: 43-49.
43
CRIMINOLOGIA. ANÀLISI DE DADES CURS 2017-2018
BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 2: SOLUCIONS
$`municipio: Mostoles `
Mean.resta St. Deviation.resta Valid N.resta
0.312500 1.078267 40.000000
Veiem que en el cas d’Alcalá de Henares (n=19) ens caldrà comprovar la normalitat, però no
així per a Alcorcón (n=36).
Alcalá de Henares
Per avaluar la normalitat d’un subcol·lectiu, recordem que així li hem d’indicar en la finestra on
fem l’anàlisi:
En la taula de sota comprovem la normalitat i veiem que podem assumir que la variable
diferència és normal (p-valor=0,349); de manera que podrem fer el test paramètric.
Shapiro-Wilk normality test
W p-value
resta 0.9468827 0.3492825
Ara bé, aquest test paramètric no l’hem de fer al conjunt de la base de dades, sinó només als
residents al municipi d’Alcalà. Per fer-ho la millor manera és crear prèviament un subfitxer a
partir del menú Data: Subset, i dient-li:
44
CRIMINOLOGIA. ANÀLISI DE DADES CURS 2017-2018
BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 2: SOLUCIONS
La sintaxi que això genera és la següent (després podrem modificar aquesta sintaxi per repetir
el procediment en altres municipis):
ALCALA<-subset(DadesCAM,municipio=="Alcala de Henares")
Un cop fet això, ja li fem el test paramètric, que ens dóna el següent resultat:
Paired t-test
Tot i que ens trobem en el límit, podem acceptar amb un 95% de confiança (p-valor<0,050)
que a Alcalá de Henares la valoració que es fa a la Policia Municipal és diferent de la que es fa
al conjunt dels altres cossos de seguretat. A més, podem assegurar que la valoració de la
Policia Municipal és inferior.
Alcorcón
Tal i com hem vist, ara no és estrictament necessari comprovar la normalitat (n>30), de
manera que farem directament el test paramètric. Si que ens cal, però, generar un subfitxer
només amb els residents a Alcorcón. L’alternativa de fer-ho directament per la consola seria:
ALCORCON<-subset(DadesCAM,municipio=="Alcorcon")
45
CRIMINOLOGIA. ANÀLISI DE DADES CURS 2017-2018
BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 2: SOLUCIONS
Paired t-test
De manera que no podem acceptar amb un 95% de confiança (p-valor=0,428) que a Alcorcón
la valoració que es fa a la Policia Municipal sigui diferent de la que es fa al conjunt dels altres
cossos de seguretat.
Per fer-ho el millor és seleccionar-ne cadascun per separat i fer-los un a un. En aquest cas no
té massa sentit fer-ho pel conjunt de municipis menors de 100.000 habitants, en tant que el
cos de Policia Municipal és diferent en cadascun dels municipis englobats sota l’epígraf
<100.000 habitants.
Alcobendas
En tant que la mostra és petita (n=15) abans de fer el test hem de mirar la normalitat. En la
taula de sota comprovem que podem assumir que la variable diferència és normal (p-
valor=0,464); de manera que podrem fer el test paramètric.
Shapiro-Wilk normality test
W p-value
resta 0.9460368 0.464328
Directament des de la consola crem un fitxer amb només els casos d’Alcobendas:
ALCOBENDAS<-subset(DadesCAM,municipio=="Alcobendas")
Fuenlabrada
Tampoc cal comprovar la normalitat (n>30), de manera que farem directament el test
paramètric. Si que ens cal, però, generar un subfitxer només amb els residents a Fuenlabrada.
Des de la consola li direm:
FUENLABRADA<-subset(DadesCAM,municipio=="Fuenlabrada")
46
CRIMINOLOGIA. ANÀLISI DE DADES CURS 2017-2018
BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 2: SOLUCIONS
Paired t-test
De manera que podem acceptar amb un 95% de confiança (p-valor=0,011) que a Fuenlabrada
la valoració que es fa a la Policia Municipal és diferent de la que es fa al conjunt dels altres
cossos de seguretat. A més, podem assegurar que la valoració de la Policia Municipal és
inferior.
Getafe
Tampoc cal comprovar la normalitat (n>30), de manera que farem directament el test
paramètric. Des de la consola, creem, en primer lloc, el subfitxer només amb els residents a
Getafe:
GETAFE<-subset(DadesCAM,municipio=="Getafe")
No podem acceptar amb un 95% de confiança (p-valor=1,000) que a Getafe la valoració que es
fa a la Policia Municipal sigui diferent de la que es fa al conjunt dels altres cossos de seguretat.
Leganés
LEGANES<-subset(DadesCAM,municipio=="Leganes")
Podem acceptar amb un 95% de confiança (p-valor=0,005) que a Leganés la valoració que es fa
a la Policia Municipal és diferent de la que es fa al conjunt dels altres cossos de seguretat. A
més, podem assegurar que la valoració de la policia municipal és inferior.
47
CRIMINOLOGIA. ANÀLISI DE DADES CURS 2017-2018
BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 2: SOLUCIONS
Madrid capital
La mostra és molt gran, de 730 casos, de manera que passem directament a fer el test
paramètric. Des de la consola, creem, en primer lloc, el subfitxer només amb els residents a la
ciutat de Madrid:
MADRID<-subset(DadesCAM,municipio=="Madrid capital")
Podem acceptar amb un 95% de confiança (p-valor<0,001) que els residents a la ciutat de
Madrid no valoren de la mateixa manera la Policia Municipal que els altres dos cossos de
seguretat. A més, podem assegurar que la valoració de la Policia Municipal és inferior.
Móstoles
Tampoc cal comprovar la normalitat (n=40). Des de la consola, creem, en primer lloc, el
subfitxer només amb els residents a Móstoles:
MOSTOLES<-subset(DadesCAM,municipio=="Mostoles")
No podem acceptar amb un 95% de confiança (p-valor=0,074) que a Móstoles la valoració que
es fa a la Policia Municipal sigui diferent de la que es fa al conjunt dels altres cossos de
seguretat.
Torrejón de Ardoz
Tampoc cal comprovar la normalitat (n=31). Des de la consola, creem, en primer lloc, el
subfitxer només amb els residents a Torrejón de Ardoz:
TORREJON<-subset(DadesCAM,municipio=="Torrejon de Ardoz")
48
CRIMINOLOGIA. ANÀLISI DE DADES CURS 2017-2018
BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 2: SOLUCIONS
Paired t-test
49