You are on page 1of 4

CRIMINOLOGIA.

ANÀLISI DE DADES CURS 2017-2018


BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 1: SOLUCIONS

Pràctica 1. Solucions als exercicis proposats1

a) Podem assegurar que més d’un 20% de la població de la Comunidad de Madrid té


instal·lada una alarma a casa? Respon-ho amb un 95% de confiança. (P1005)
$P1005
------------------------------------------------------------
-- Frequencies --
-- --
Value # of Cases % Cumulative %
1 Si 328 21.97 21.97
2 No 1165 78.03 100.00
-- --
-- Case Summary --
-- --
Valid Missing Total
# of cases 1493 8 1501
-- --
-- --
------------------------------------------------------------

En la taula anterior comprovem que es compleixen les condicions d’aplicació del test, que són
que les freqüències esperades siguin superiors a 5. Fem els càlculs pertinents i veiem que són
de 298,6 i de 1.194,4. Com que en les freqüències veiem que el Si es troba en primer lloc, en
canviem l’ordre i fem el test:
1-sample proportions test without continuity correction
p 95% CI Lower 95% CI Upper X-squared df p-value
P1005 0.2196919 0.199424 0.2413985 3.618386 1 0.05714429
HA: two.sided
H0: p = 0.2

La significació és 0,057, de manera que no podem afirmar amb un 95% de confiança (p-
valor=0,057) que la instal·lació de la alarma prengui un valor diferent al 20%. És a dir, el
21,97% observat no és significativament diferents del 20%.

b) Podem assegurar que més d’un 10% de la població de la Comunidad de Madrid ha estat
víctima d’un delicte en el darrer any? Respon-ho amb un 95% de confiança. (P16)
$P16
------------------------------------------------------------
-- Frequencies --
-- --
Value # of Cases % Cumulative %
1 Si 199 13.3 13.3
2 No 1301 86.7 100.0
-- --
-- Case Summary --
-- --
Valid Missing Total
# of cases 1500 1 1501
-- --
-- --
------------------------------------------------------------

1
Ajenjo Cosp, Marc (2018) Pràctiques en Deducer d’inferència estadística aplicada al grau de
Criminologia. Departament de Sociologia, UAB, pp:33-36.

33
CRIMINOLOGIA. ANÀLISI DE DADES CURS 2017-2018
BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 1: SOLUCIONS

En la taula anterior comprovem les condicions d’aplicació del test. Fent els càlculs pertinents
veiem que les freqüències esperades són de 150,0 i 1.350,0, de manera que podem seguir
amb el test. Tal i com passa en l’anterior exemple, haurem de situar el Si en la segona posició i
fer el test:
1-sample proportions test without continuity correction
p 95% CI Lower 95% CI Upper X-squared df p-value
P16 0.1326667 0.116435 0.150775 17.78519 1 2.473014e-05
HA: two.sided
H0: p = 0.1

La significació és molt petita (de l’odre de 0,0000247); de manera que podem afirmar amb un
95% de confiança (p-valor<0,001) que els madrilenys que han estat víctimes d’un delicte no
són el 10% (és a dir, en termes de significació estadística, el 13,3% observat és diferent del
10%). A partir del mateix interval de confiança podem afirmar que més d’un 10% han estat
víctimes d’un delicte.

c) Podem assegurar que més de la meitat de la població de la Comunidad de Madrid creu


que la inseguretat a la seva Comunitat Autònoma, respecte de l’any passat, ha empitjorat?
Quin es el risc d’error si fem aquesta afirmació? (P4_CAM). Observa com ha estat formulada
la pregunta
$P4_CAM
------------------------------------------------------------
-- Frequencies --
-- --
Value # of Cases % Cumulative %
1 Mejorado 255 17.9 17.9
2 Igual 310 21.7 39.6
3 Empeorado 862 60.4 100.0
-- --
-- Case Summary --
-- --
Valid Missing Total
# of cases 1427 74 1501
-- --
-- --
------------------------------------------------------------

En la taula anterior comprovem que la variable té més de dues categories. Per tant, en primer
lloc, generem la variable amb només dues categories, els que consideren que ha empitjorat, i
els que no. Per fer-ho agrupem els que creuen que ha millorat amb els que opinen que segueix
igual, i deixem els que creuen que ha empitjorat en segon lloc.

A continuació comprovem que es compleixen les condicions d’aplicació del test En aquest cas
les dues freqüències esperades coincideixen (713,5) i són clarament superiors a 5. Fem el test:
1-sample proportions test without continuity correction
p 95% CI Lower 95% CI Upper X-squared df p-value
P4_CAMrec 0.6040645 0.5784436 0.6291266 61.8143 1 3.774242e-15
HA: two.sided
H0: p = 0.5

La significació torna a ser molt petita, de manera que podem afirmar amb gairebé un 100% de
confiança (p-valor<0,001) que els que creuen que ha empitjorat no són la meitat (és a dir, que
un 60,4% és significativament diferent d’un 50%). Llegint l’interval de confiança podem
assegurar que més de la meitat de la població creu que la situació ha empitjorat.

El risc d’error d’aquest afirmació és molt i molt petit (3,774242e-15).

34
CRIMINOLOGIA. ANÀLISI DE DADES CURS 2017-2018
BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 1: SOLUCIONS

d) A partir de les tres variables que fan referència a l’avaluació de cadascun dels cossos de
seguretat, genera una nova variable que sigui la valoració global als cossos de seguretat.
Podem assegurar que la població de la Comunidad de Madrid aprova els cossos de
seguretat? I que els hi posa més d’un 6? I més d’un 6,5? (P12PM, P12CNP i P12GC)

Primer hem hagut de crear la variable sumant les tres variables inicials i dividint entre tres. En
la consola hem escrit:

DadesCAM$VAL_total <- (DadesCAM$P12PM+DadesCAM$P12CNP+DadesCAM$P12GC)/3

Comprovem que es compleixen les condicions d’aquest test simplement fent descriptius de la
nova variable, on veiem que hi ha més de 30 casos (1.301).
$`strata: all cases `
Mean.VAL_total St. Deviation.VAL_total Valid N.VAL_total
6.508839 2.052897 1301.000000

De fet, ens demana tres tests diferents.

Podem assegurar que aproven?


One Sample t-test
mean of x 95% CI Lower 95% CI Upper t df p-value
VAL_total 6.508839 6.397184 6.620495 26.51029 1300 3.724705e-124
HA: two.sided
H0: mean = 5

Sí, sí que ho podem assegurar. Podem assegurar amb un 95% de confiança que la nota és
diferent de 5 (p-valor<0,001), i que, tal i com mostra l’interval de confiança, és superior (en
termes de significació estadística, la mitjana observada de 6,51 és diferent de 5). De fet, llegint
aquest interval de confiança ja podríem respondre a les dues preguntes següents.

Podem assegurar que treuen més d’un 6?


One Sample t-test
mean of x 95% CI Lower 95% CI Upper t df p-value
VAL_total 6.508839 6.397184 6.620495 8.9403 1300 1.301664e-18
HA: two.sided
H0: mean = 6

Sí, sí que ho podem assegurar. Podem assegurar amb un 95% de confiança que la nota és
diferent de 6 (p-valor<0,001), és superior (tal i com passa abans, la mitjana observada de 6,51
és diferent de 6).

Podem assegurar que treuen més d’un 6,5?


One Sample t-test
mean of x 95% CI Lower 95% CI Upper t df p-value
VAL_total 6.508839 6.397184 6.620495 0.1553073 1300 0.8766031
HA: two.sided
H0: mean = 6.5

No, no ho podem assegurar, ja que el p-valor és clarament superior a 0,05 (0,877). De fet,
veiem com l’interval de confiança conté clarament el valor 6,5 (evidentment no podem dir que
la mitjana observada de 6,51 sigui diferent de 6,50).

e) Habitualment l’aspecte pitjor valorat dels cossos de seguretat és la seva eficàcia. Des del
govern municipal d’Alcobendas hi ha la preocupació, precisament, per l’opinió que tenen els
residents sobre l’eficàcia de la seva policia municipal. Podem assegurar amb un 95% de
confiança que aquests residents atorguen més d’un 6 a l’eficàcia de la policia municipal?
Respon el mateix per als residents d’Alcalá de Henares. (P13PM_EFIC i municipi)

35
CRIMINOLOGIA. ANÀLISI DE DADES CURS 2017-2018
BLOC 2 PRÀCTIQUES EN DEDUCER. PRÀCTICA 1: SOLUCIONS

Opinió dels residents a Alcobendas sobre l’eficàcia de la seva policia municipal.

Si creuem el municipi amb l’opinió sobre l’eficàcia de la policia municipal veurem que en el cas
d’Alcobendas el nombre de respostes a la pregunta és clarament inferior a 30 (15). Per aquest
motiu demanem tant el test de normalitat com el de comparació d’una mitjana observada i
una de teòrica (que només llegirem si es compleix la normalitat).
$`strata: all cases `
Mean.P13PM_EFIC St. Deviation.P13PM_EFIC Valid N.P13PM_EFIC
7.066667 1.791514 15.000000

One Sample t-test


mean of x 95% CI Lower 95% CI Upper t df p-value
P13PM_EFIC 7.066667 6.074559 8.058774 2.305972 14 0.03692958
HA: two.sided
H0: mean = 6

Shapiro-Wilk normality test


W p-value
P13PM_EFIC 0.8894879 0.06587416

Llegim en primer lloc la normalitat, la darrera taula. Com que el p-valor es troba per sobre de
0,05 (0,066) podem assumir el supòsit de normalitat, de manera que podem llegir el resultat
del test.

A partir del segon test podem assegurar (p-valor=0,037) que la Policia Municipal d’Alcobendas
no té una nota de 6. A més, podem assegurar que la nota es troba entre 6,07 i 8,06 (en la
mostra ha estat de 7,07), de manera que podem tranquil·litzar el consistori, en el sentit
d’assegurar-los que la nota supera els 6 punts.

Opinió dels residents a Alcalá de Henares sobre l’eficàcia de la seva policia municipal.

En aquest cas, creuant municipi i opinió sobre l’eficàcia de la Policia Municipal veiem que el
nombre de respostes d’Alcalá de Henares també és clarament inferior a 30 (19), de manera
que tornem a demanar la normalitat i el test.
$`strata: all cases `
Mean.P13PM_EFIC St. Deviation.P13PM_EFIC Valid N.P13PM_EFIC
4.947368 2.344584 19.000000

One Sample t-test


mean of x 95% CI Lower 95% CI Upper t df p-value
P13PM_EFIC 4.947368 3.817315 6.077422 -1.956984 18 0.06604267
HA: two.sided
H0: mean = 6

Shapiro-Wilk normality test


W p-value
P13PM_EFIC 0.8541956 0.007856356

En llegir la normalitat veiem que no es compleix el supòsit, en tant que el p-valor és clarament
inferior a 0,05 (0,008). Així doncs no podem realitzar el test i no podem ajudar al consistori
d’Alcalá de Henares en cap sentit. Tot i així, podem transmetre la nostra preocupació perquè
els indicis apunten que la perspectiva no és bona, en tant que la puntuació mitjana en la
mostra de 19 individus ha estat clarament inferior a 6 (4,95).

36

You might also like