You are on page 1of 71

GUA DE MANEJO

DE SPSS

Laboratorio de Psicologa
Instituto de Psicologa
Universidad del Valle

0
Pgina
Contenido

Captulo 1: Introduccin al SPSS .................................................................................................... 2


Captulo 2: Importacin de archivos de Excel a SPSS................................................................... 8
Captulo 3: Vistas de SPSS ............................................................................................................. 12
Captulo 4: Porcentajes y frecuencias en SPSS ............................................................................ 19
Captulo 5: Segmentar archivo ...................................................................................................... 45
Captulo 6: Transformar: Recodificar variables .......................................................................... 49
Captulo 7: Medidas de tendencia central, dispersin y posicin ............................................... 53
Captulo 8: Medidas de posicin .................................................................................................... 66
Captulo 9: Calcular variables ....................................................................................................... 69

1
Pgina
Captulo 1: Introduccin al SPSS

El Statistical Package for the Social Sciences (SPSS) 1 es un programa informtico diseado
para realizar anlisis estadsticos, tanto a nivel descriptivo como a nivel inferencial muy
usado en las ciencias sociales. Este programa permite realizar anlisis y grficos
estadsticos sin tener que conocer la mecnica de los clculos ni la sintaxis de los comandos
del sistema, facilitando el procesamiento de datos.

Para ingresar al programa puede hacerlo de dos formas (Figura 1 y Figura 2):

1)

Haciendo Clic en el
cono de acceso
directo que se
encuentra en el
escritorio de su
computador
IBM SPSS
Statistics 23

Figura 1: Forma de acceder a SPSS N 1


2
Pgina

1
Esta gua fue realizada con la versin 23 de IBM Statistics SPSS, sin embargo, la estructura y
funciones del programa son similares a la de versiones anteriores.
2) Luego, clic en Todas las
aplicaciones o Todos los programas
1) Haz clic en el botn
Inicio (Dependiendo el tipo de sistema
operativo del ordenador

3) Busque y seleccione
la opcin IBM SPSS
Statistics

4) Finalmente, busque y
seleccione la opcin IBM
SPSS Statistics 23

Figura 2: Forma de acceder a SPSS N 2


3
Pgina
Figura 3: Inicio de IBM SPSS Statistics 23
Una vez se ha ingresado al programa se despliega una opcin de ayuda que indica algunas
rutas a seguir. Para ingresar nuevos datos, se selecciona la opcin Nuevo conjunto de
datos y se da clic en Aceptar (Figura 4).

4
Pgina

Figura 4: Ingresar nuevos datos


En el caso de tener algn archivo de datos previo que se desee abrir, basta con revisar el panel de
Archivos recientes y seleccionar el archivo en el cul se va a seguir trabajando. Si el archivo
no aparece en el listado, se puede ir a la opcin Abrir otro archivo, dar clic en Aceptar y
buscar el documento en las opciones que se encuentran en la ventana que aparece inmediatamente
despus. Finalmente se da clic en el botn Abrir (Figura 5).

Figura 5: Abrir archivos existentes

La versin 23 de SPSS y las anteriores cuentan con opciones de ayuda para facilitar el uso del
programa. Se pueden llevar a cabo diferentes tutoriales de los que se encuentran en las Guas de
aprendizaje para informarse mejor sobre las posibilidades en el procesamiento de datos que tienen el
software. Basta con escoger la opcin que sea de inters profundizar, dar clic en el botn Aceptar y
SPSS lo redirigir a la pgina web del programa para que pueda obtener mayor asistencia. (Figura 6)
5
Pgina
Figura 6: Guas de aprendizaje de SPSS

6
Pgina

Figura 7: Apariencia de la ventana de inicio de SPSS en versiones anteriores (versin 21)


Cuando se ha iniciado a trabajar en un nuevo conjunto de datos se abre la hoja de SPSS en la que se
introduce la informacin. Esta hoja es muy similar en apariencia a una hoja de clculo (como la de
Excel), sin embargo, el SPSS presenta un formato de base de datos que contiene campos -variables- en
lugar de celdas (Figura 8).

Figura 8: Apariencia de la hoja de datos de SPSS

Adems de la hoja de SPSS, otra de las ventanas que se despliega es el visor de resultados (Figura 9).
En l se muestran todas las operaciones que se han realizado en el programa durante el tiempo que se lo
ha usado.

7
Pgina

Figura 9: Visor de resultados


Captulo 2: Importacin de archivos de Excel a SPSS

Existen varias maneras de ingresar archivos en SPSS, dos de las ms usadas son: a) la importacin de
archivos desde Excel (Figura 10) y b) el ingreso directamente al editor (desde un archivo anterior o
desde la creacin de un nuevo archivo).

8
Pgina

Figura 10: Importacin de archivos desde Excel


Despus de dar clic en la opcin Abrir aparecer una ventana en la cual se muestra la ubicacin del
archivo y se puede configurar varios aspectos (Figura 11):

Figura 11: Apertura de origen de datos de Excel

Antes de abrir el archivo se debe tener en cuenta que es posible que la base de datos tenga varias hojas
de clculo, por lo que se debe seleccionar la hoja en la cual estn los datos que desea importar. Por
ejemplo, en la Figura 11 se escogi la Hoja 1 de la base de datos Base Sumas Taller 2 SPSS. Despus
de esto se debe dar clic en Aceptar.

9
Pgina
Figura 12: Seleccin de hoja de clculo de Excel que se importar a SPSS.

10
Pgina

Figura 13: Vista de base de datos importada de Excel a SPSS


Importante:
Antes de importar archivos desde Excel se deben tener en cuenta las siguientes
recomendaciones:

La longitud del nombre no debe exceder los 64 caracteres (8 caracteres en la versin 11y
anteriores)
Cada nombre de variable debe ser nico; no se permiten duplicados. Los nombres de variables
no distinguen maysculas de minsculas.
Debe comenzar con una letra. Los dems caracteres pueden ser letras, dgitos, puntos o los
smbolos @, #, _ $.
Los nombres de variables no pueden terminar en punto
Se deben evitar los nombres de variable que terminan con subrayado (para evitar conflictos con
las variables creadas automticamente por algunos procedimientos).
No se pueden utilizar espacios en blanco ni caracteres especiales (por ejemplo, , !, *)
No pueden utilizarse las palabras: ALL, LT, AND, NE, BY, NOT, EQ, OR, GE, TO, GT,
WITH, LE.
El archivo no debe tener negrilla.
Ni las celdas ni las letras y/o nmeros de la base de datos deben tener colores.
Es recomendable que los datos perdidos (missing) tengan un cdigo en la base de Excel.
El archivo debe tener el mismo color de fuente (negro) y adems el mismo formato.
Es necesario que la primera fila sea la nica con los nombres de las variables y no haya celdas
combinadas.

11
Pgina
Captulo 3: Vistas de SPSS

En la vista de datos (Figura 12) de SPSS se ingresan los datos con los que se construir la base. Esta
vista, como se mencion antes tiene apariencia similar a una base de datos de Excel. Sin embargo,
las casillas del editor de datos no pueden contener frmulas. Aqu las filas representan casos y las
columnas variables.

Figura 14: Vista de datos


Para definir campos en SPSS se debe seleccionar en la parte inferior izquierda la opcin Vista de
variables (Figura 15), una vez seleccionada aparecer la pantalla donde se podrn modificar las
variables.

12
Pgina
Figura 15: Vista de variables

La vista de variables (Figura 16) contiene descripciones de los atributos o caractersticas de cada
variable del archivo de datos. En este punto (Figura 14) las filas corresponden a las variables y las
columnas son los atributos o caractersticas de las variables.

Figura 16: Filas y Columnas en vista de variables

La columna Tipo especifica el tipo datos que contiene la variable. Los valores de estas variables, en
funcin del tipo seleccionado sern visualizados segn un patrn determinado y slo
estarn disponibles para estas variables aquellas operaciones que son esperables para el tipo de que
13

se trate en cada caso. Las opciones que se presentan en esta columna son las siguientes:
Pgina
Figura 17: Tipo de Variable

Numrico. Variable cuyos valores son nmeros. Los valores se muestran en el formato
numrico estndar, utilizando los delimitadores decimales especificados en la
Configuracin Regional del Panel de control.
Coma. Define una variable numrica cuyos valores se muestran con comas de separacin
cada tres posiciones y con un punto como separador de la parte decimal. El editor de datos
acepta los valores numricos para las variables con comas con o sin las comas.
Punto. Define una variable numrica cuyos valores se muestran con puntos de separacin
cada tres posiciones y con una coma como separador de la parte decimal.
Notacin cientfica. Define una variable numrica cuyos valores se muestran con una E
intercalada y un exponente con signo que representa una potencia de base diez. El editor de
datos acepta para estas variables valores numricos con o sin el exponente. El exponente
puede ir precedido de E o D con un signo opcional, o por el signo solamente. Por ejemplo,
123, 1,23E2, 1,23D2, 1,23E+2, o incluso 1,23+2.
Fecha. Es una variable numrica cuyos valores se muestran en uno de los diferentes
formatos de fecha-calendario u hora-reloj. Seleccione una plantilla de la lista desplegable.
Puede introducir las fechas utilizando como delimitadores: barras, guiones, puntos, comas o
14

espacios en blanco. El rango de siglo para los aos de dos dgitos se toma de las opciones de
Pgina

configuracin (Men Edicin, Opciones, pestaa Datos).


Dlar. Define una variable numrica cuyos valores contienen un signo de dlar, un punto
como separador de la parte decimal y mltiples comas como separadores de miles.
Moneda personalizada. Variable numrica cuyos valores se muestran en uno de los formatos
de moneda personalizados que se hayan definido previamente en la pestaa Moneda del
cuadro de dilogo Opciones del men Edicin.
Cadena. Es una variable cuyos valores no son numricos y, por ello, no se utilizan en los
clculos. Pueden contener cualesquiera caracteres hasta la longitud definida. Las maysculas
y las minsculas son consideradas diferentes. Tambin son conocidas como variables
alfanumricas.
La columna Anchura le permite ajustar el ancho de las columnas de la hoja Vista de datos.
La columna Decimales le permiten ajustar el nmero de decimales de las columnas de la hoja Vista
de datos.
En la columna Etiqueta se nombra la variable. Es decir, se da el nombre que usted desea aparezca
en las salidas (resultados).
En la columna Valores se ingresan los valores posibles de la variable como usted los ha definido.
Por ejemplo, el sexo puede tomar dos valores Masculino y Femenino. Si usted los tiene codificados
como 1 masculino y 2 femenino debe (Figura 18):

15
Pgina
Figura 18: Etiquetas del valor
La columna Perdidos Se trata de valores que no son considerados a la hora de realizar
determinados anlisis estadsticos. Los valores perdidos pueden ser:

Del sistema. Cualquier casilla en blanco de la matriz de datos correspondiente a una


variable de tipo numrico. Se pueden identificar mediante un punto individual en dicha
casilla.
Del usuario. Son aquellos que define el usuario por diferentes motivos, entre los que
podemos destacar los que se definen para que no se distorsionen los anlisis estadsticos.
Para definir estos valores, se deber pulsar en Vista de variables, la casilla
correspondiente a la columna Perdidos de la variable a definir, y luego pulsar en los
puntos suspensivos.

La columna Columnas modifica el ancho de la columna en la que se presentan los datos. Los anchos
de columna tambin se pueden cambiar en la Vista de datos pulsando y arrastrando los bordes de la
columna.
La columna Alineacin Controla la presentacin de los valores de los datos y/o de las etiquetas de
valor en la Vista de datos. La alineacin por defecto es derecha para las variables numricas e
izquierda para las variables de cadena. Esta configuracin afecta slo a la presentacin en la Vista
de datos

Finalmente la columna Medida presenta 3 tipos valores: Escala, Ordinal y Nominal.


Escala. Se emplea para datos numricos de una escala de intervalo o de proporcin
(por ejemplo, edad, ingresos). Las variables de escala deben ser numricas.
Ordinal. Para datos de cadena (alfanumricos) o numricos. Los valores numricos
representan categoras diferentes con un cierto orden intrnseco, por ejemplo: 1 = bajo;
2 = medio; 3 = alto. Para variables de cadena ordinales, se asume que el orden
alfabtico de los valores de cadena indica el orden correcto de las categoras. Por
ejemplo, en una variable de cadena cuyos valores sean bajo, medio, alto, se interpreta
el orden de las categoras como alto, bajo, medio (orden que no es el correcto). Por
norma general, se puede indicar que es ms fiable utilizar cdigos numricos para
16

representar datos ordinales.


Nominal. Para datos de cadena (alfanumricas) o valores numricos que representan
Pgina

categoras diferentes sin un orden intrnseco. Por ejemplo: 1 = Hombre; 2 = Mujer.


Pgina
17
Pgina
18
Captulo 4: Porcentajes y frecuencias en SPSS

Los porcentajes son medidas relativas que establecen una relacin de parte-todo (que siempre es 100) y
permiten comparar grupos de diferente tamao (N).
Estos se calculan usualmente como:

Pi = (Ni/N)*100
Pi = es el porcentaje de la i-sima categora
Ni = es la frecuencia absoluta de la i-sima categora
N = corresponde al nmero total de elementos o base

Por ejemplo, si se tiene una muestra de 40 personas -40 podra ser nuestro N- y 30 de ellas son mujeres y
10 hombres, para determinar el porcentaje de las primeras en el grupo, entonces se tiene que:

N = 40
N1 = 30 (la categora 1 corresponde a mujeres)
N2 = 10 (la categora 2 corresponde a hombres)

Entonces:
P1 (porcentaje de mujeres) = (N1/N)*100 = (30/40)*100 = 75%
Los resultados muestran que el 75% de los sujetos del grupo son mujeres.
As que:
P2 (porcentaje de hombres) = (N2/N)*100 = (10/40)*100 = 25%
El 25% son hombres.

Podemos suponer que tenemos datos sobre los 40 sujetos, por ejemplo, tenemos su orientacin poltica
as:
19
Pgina

Tabla 1:
Frecuencias absolutas de orientacin poltica y gnero

En la Tabla 1 hay 30 mujeres y 10 hombres, 20 son de izquierda, 10 de centro y 10 de derecha. Hay 5


mujeres en centro y 5 hombres en derecha. El clculo de porcentajes permiti establecer que el 75% son
mujeres y el 25% hombres. Para comparar la orientacin poltica en funcin del gnero, teniendo en
cuenta que el nmero de hombres y mujeres es diferente, se podra usar porcentajes para comparar.

En este caso, si se quiere averiguar la distribucin de la orientacin poltica en las mujeres tengo que:
Pj/i (porcentaje de categora j en la categora i) = (Nj/i / Ni)*100
P1/1 (porcentaje de izquierda 1 dado que se es mujer 1 )= (20/30)*100 = 66,6%
P2/1 (porcentaje de centro 2 dado que se es mujer 1 )= (5/30)*100 = 16,7%
P3/1 (porcentaje de derecha 2 dado que se es mujer 1 = (5/30)*100 = 16,7%
En el caso de los hombres:
P1/2 (porcentaje de izquierda 1 dado que se es hombre 2 )= (0/10)*100 = 0%
P2/2 (porcentaje de centro 2 dado que se es hombre 2 )= (5/10)*100 = 50%
P3/2 (porcentaje de derecha 2 dado que se es hombre 2 )5/10)*100 = 50%

En este ejemplo hemos cambiado la base sobre la que se calcula el porcentaje. En el primer caso la base
era 40 (# de sujetos); para los clculos de hombre y mujer hemos usado como base 30 (# de mujeres) y 10
(# de hombres). Esto sugiere que debemos tener cuidado sobre la base que se ha tomado para poder
interpretar los datos.
20

SPSS brinda diversas maneras de calcular y representar porcentajes. La primera forma se trata de la
Pgina

funcin Frecuencias.
Forma 1
Se calcular la distribucin de las variables sociodemogrficas presentes en la base 002 14 FEBRERO
2016, para lo cual se deben seleccionar las opciones Analizar > Estadsticos descriptivos > Frecuencias Comentario [JCBB1]: Hay que
cambiar esta por la base de datos
(Figura 19) chilena, ya que no se tiene
autorizacin para dejar esta en la base
de datos general. Por lo tanto, algunos
pantallazos no se pueden usar.

Figura 19. Uso de la funcin frecuencias

Una vez seleccionada la funcin, aparecer el cuadro de dilogo Frecuencias (ver Figura 2), en cual se
seleccionar la(s) variable(s) a la(s) cual(es) se le(s) desea realizar el anlisis de frecuencias y porcentajes.
La forma de hacerlo es arrastrando la variable, de la lista de las variables, al cuadro del lado derecho
Variables. Igualmente, se debe seleccionar la opcin Mostrar tablas de frecuencias para que los
resultados incluyan la tabla con el anlisis de frecuencia. Si se quiere generar en el mismo paso un grfico,
se puede seleccionar la opcin Grficos y aparecer la interfaz Frecuencias: Grficos (ver Figura 20)

21Pgina
Figura 20. A: Funcin Frecuencias para representar las variables municipio, tipo de encuesta, sexo,
edad, estrato socioeconmico y educacin. B: Funcin Frecuencia: Grficos.

Las opciones de grficos propuestas corresponden a Ninguna -sugiere que no se realizar un grfico-
Grficos de barras, Grficos de sectores e Histogramas. Para el caso de la variables nominales y
ordinales analizadas, los grficos adecuados son las barras y los sectores (en este caso, se escogen las
barras). Para establecer qu representarn las barras se encuentra la opcin Valores del grfico que
muestra las opciones: Frecuencias -conteo del nmero de casos - y Porcentajes -representa la relacin
(Ni/N)*100, donde N es el nmero total de casos observados en la variable seleccionada. Usualmente,
el estadstico que se trabaja es el porcentaje. Para finalizar se selecciona Continuar y Aceptar.

Como resultado de la operacin se genera un nuevo archivo Resultados 1 donde aparecern ocho tablas y
siete grficos:
22
Pgina
Figura 21. Hoja de resultados con las tablas y grficas generadas mediante la funcin Frecuencias

La primera tabla que se encuentra en la hoja de resultados es la llamada Estadstico. En esta se presenta el
nmero de casos Validos, que corresponde al nmero de casos en los que se tiene informacin, si no hay
informacin se considera un dato Perdido. Para cada una de las variables analizadas hay 1917 casos
(sujetos) con informacin y no se presentan casos perdidos.

Tabla 2:
Estadsticos de las variables municipio, tipo de encuesta, sexo, edad, estrato socioeconmico, educacin
terminada.
23
Pgina
La dems tablas muestran la frecuencia de cada categora (Ni) y el porcentaje (Pi). En la columna
Porcentaje Vlido se reporta el valor porcentual a partir de los casos en los que se posee informacin y
Porcentaje se tiene en cuenta la cantidad de valores perdidos. Para la variable Municipio, por ejemplo, el
nmero de casos (1917) no difiere del nmero de casos vlidos (1917), por lo que los porcentajes son
iguales en ambas columnas (ver Tabla 3). Sin embargo, si se tuvieran (16) casos perdidos los clculos de
la columna Porcentaje seran diferentes a los de Porcentaje vlido, ya que se el valor en la primera se
calculara sobre el total de casos, mientras que en la segunda sobre 1901 (ver Tabla 4). La columna
Porcentaje acumulado solo se aplica para las variables que tienen orden (ordinales y escala).

Tabla 3:
Distribucin de los municipios sin casos perdidos.

24
Pgina
Tabla 4:
Distribucin de los municipios con casos perdidos.

Forma 2:

El ejemplo anterior aplica cuando se calculan los porcentajes de una sola variable, pero en algunos casos
se puede hacer cruces de variables para establecer relaciones entre las variables, para ello se usar la
funcin Tablas Personalizadas. Para lo cual se seleccionar la ruta Analizar > Tablas > Tablas
personalizadas...

25

Figura 22. Uso de la funcin Tablas personalizada


Pgina
Al realizar la seleccin se podr trabajar con la interfaz de las Tablas personalizadas, sta permite
desplazar las variables que se encuentran a la izquierda en la lista Variables a las columnas y las filas en
el espacio de trabajo. Esta funcin facilita pre-visualizar como se genera la tabla.

Figura 23. Interfaz de la funcin Tablas personalizadas

Por ejemplo, para cruzar Educacin terminada y los guerrilleros son vctimas del conflicto armado. Se
puede arrastrar la Educacin terminada a la opcin Filas y los guerrilleros son vctimas del conflicto
armado A las columnas

26
Pgina
Figura 24. Seleccin de las variables en las filas y columnas

Una vez seleccionadas las dos variables la interfaz mostrar una tabla con filas y columnas con el
Recuento como estadstico, como la intencin es poder comparar la Educacin terminada y los
guerrilleros son vctimas del conflicto armado, se recomienda el uso del porcentaje. Para ello se debe
activar la opcin Definir N% Estadsticos de resumen (si la opcin no se encuentra activa, se puede
seleccionar con el cursor el Gnero, la tabla se coloreara de amarillo y se resaltara con amarillo la opcin
Recuento).

Figura 25. Seleccin Estadsticos de resumen


Al activar Definir N% Estadsticos de resumen se activara una nueva interfaz.

27
Pgina
Figura 26. Interfaz de Estadsticos de resumen
En la interfaz aparece la opcin Estadsticos, con una lista de posibles anlisis estadsticos, en la derecha
se observa la opcin Visualizacin que muestra el estadstico Recuento activo. A su vez en la tabla
aparecer como etiqueta Recuento y el formato de nmeros enteros (nnnn) con 0 decimales. Para
seleccionar el porcentaje se debe buscar en la lista de Estadsticos la opcin de % del N de fila (en este
caso se selecciona la fila para que el programa calcule los porcentajes de cada nivel de Educacin
terminada para calcular el N de cada nivel de educacin). Una vez seleccionado el % del N de fila se da
clic en Aplicar a seleccin y luego Aceptar.

28
Pgina
Figura 27. Interfaz de Estadsticos de resumen

Como resultado se genera una tabla que cruza las variables Educacin terminada y los guerrilleros son
vctimas del conflicto armado, que permite observar la relacin entra las dos y comparar entre el nivel de
educacin. En la tabla se puede notar que la sumatoria de los porcentajes en las fila de cada una de los
niveles de la variable EDUCACIN TERMINADA debe dar 100%. Por ejemplo la sumatoria de los
porcentajes en la fila de NINGUNA es 100% (36.7+ 22.4+ 24.5+ 14.3+ 2.0= 99.9%, por aproximacin
100%). Esto mismo calcula el programa en los otros niveles de la variable (PRIMARIA,
BACHILLERATO, TCNICO/TECNOLGICO, PROFESIONAL, POSTGRADO, NS/NR ) debido a
que seleccionamos % del N de fila para calcular los porcentajes de cada fila.

Tabla 5: Cruce de variables educacin terminada y los guerrilleros son vctimas del conflicto armado

Una forma alternativa de realizar el cruce entre dos variables es a travs de la opcin Analizar>
Estadsticos descriptivos > tablas cruzadas

29
Pgina
Figura 28. Tablas Cruzadas

En la interfaz de tablas cruzadas, deber seleccionar una variable para las filas, en este caso Educacin
terminada y una variable para las columnas para el anlisis en curso los guerrilleros son vctimas del
conflicto armado. Esta opcin elaborar una tabla, las filas correspondern a los niveles que toma la
variable Educacin terminada ((PRIMARIA, BACHILLERATO, TCNICO/TECNOLGICO,
PROFESIONAL, POSTGRADO, NS/NR ), y en las columnas se observa los niveles que toma la variable
los guerrilleros son vctimas del conflicto armado (Totalmente en desacuerdo, desacuerdo, de acuerdo,
completamente de acuerdo, NS/NR), es decir, es una tabla cruzada de 6 x 5, seis valores en la variable de
las filas y cinco valores en la variable de la columna.

Figura 29. Interfaz de tablas cruzadas


30
Pgina
Para determinar la informacin que se presentar en las casillas de la tabla seleccionamos la opcin
Casillas, una vez seleccionado se activa la interface para establecer los contenidos de tabla, en recuentos
se selecciona Observado que corresponde a la frecuencia absoluta y en Porcentajes seleccionamos Fila
para que los porcentajes se calculen por cada nivel de la variable Educacin alcanzada. Despus de los
pasos anteriores seleccionamos continuar.

Figura 30. Interfaz tablas cruzadas seleccin casillas

Para finalizar seleccionamos Mostrar los grficos de barras agrupadas, lo cual nos presentara el grfico
de frecuencias y seleccionamos Aceptar

31

Figura 31. Finalizar el anlisis


Pgina
Dando como resultado en las salidas, los anlisis encontrados por el otro procedimiento pero en una
presentacin diferente:

Tabla 6:
Resumen de procesamiento de casos en tablas cruzadas

Tabla 7:
Tabla cruzada educacin terminada y los guerrilleros son vctimas del conflicto armado

Otro ejemplo de tablas personalizadas sera, cruzar Los guerrilleros son vctimas del conflicto armado y
Los soldados del Ejrcito Colombiano son vctimas del conflicto armado. Se puede arrastrar Los
guerrilleros son vctimas del conflicto armado a la opcin Filas y Los soldados del Ejrcito Colombiano
son vctimas del conflicto armado a las columnas 32
Pgina
Figura 32. Seleccin de las variables en las filas y columnas

Una vez seleccionadas las dos variables la interfaz mostrar una tabla con filas y columnas con el
Recuento como estadstico. Como la intencin es poder comparar la Los guerrilleros son vctimas del
conflicto armado y Los soldados del Ejrcito Colombiano son vctimas del conflicto armado, se
recomienda el uso del porcentaje. Para ello se debe activar la opcin Definir N% Estadsticos de resumen
(si la opcin no se encuentra activa, se puede seleccionar con el cursor la variable de la fila y en la tabla se
colorer de amarillo la opcin Recuento).

33
Pgina

Figura 33. Seleccin Estadsticos de resumen


En la interfaz aparece la opcin Estadsticos, con una lista de posibles anlisis estadsticos, en la derecha
se observa la opcin Visualizacin que muestra el estadstico Recuento activo. A su vez en la tabla
aparecer como etiqueta Recuento y el formato de nmeros enteros (nnnn) con 0 decimales. Para
seleccionar el porcentaje se debe buscar en la lista de Estadsticos la opcin de % del N de fila se da clic
en Aplicar a seleccin y luego Aceptar

Figura 34. Interfaz de Estadsticos de resumen

Como resultado se genera una tabla que cruza las variables Los guerrilleros son vctimas del conflicto
armado y Los soldados del Ejrcito Colombiano son vctimas del conflicto armado, que permite
observar la relacin entra las dos y comparar. En la tabla se puede notar que la sumatoria de los
porcentajes en las fila de cada una de los niveles de la variable Los guerrilleros son vctimas del
34

conflicto armado debe dar 100%. Por ejemplo la sumatoria de los porcentajes en la fila de
Pgina
COMPLETAMENTE EN DESACUERDO es 100% (64.2+ 12.5+ 6.9+ 14.7+ 1.7= 100%). Esto mismo
calcula el programa en los otros niveles de la variable.

Tabla 8:
Cruce de las variables Los guerrilleros son vctimas del conflicto armado y Los soldados del Ejrcito
Colombiano son vctimas del conflicto armado

Otra forma de representar el cruce de dos variables es a travs de grficos, para ellos se puede seguir la
ruta Grficos > Generador de Grficos

Figura 35. Ruta para generar un grfico

Al hacer la seleccin se presentara la interfaz de generador de grficos que permite la construccin de


diversos tipos de representaciones, para el caso de este ejercicio seleccionar en Elegir en Galera barras
agrupadas.
35
Pgina
Figura 36. Interfaz del generador de grficos

El grfico tendr 3 cuadros con lneas punteadas que definirn las caractersticas del grfico final Eje
x?, Agrupar en X: establecer color y Eje y?, en el primero Eje x? se seleccionar la variable principal
que se desea comparar en este caso SEXO, para ello s arrastra la Variables al recuadro, esta seleccin
genera que el eje x del grafico se divida en cuatro grupos de barras, Masculino, Femenino, Otros y
NS/NR. Una vez seleccionada la variable principal (Sexo) se seleccionara la variable a comparar (Puedo
tener como vecino a una persona desmovilizada de la guerrilla) y se desplaza Agrupar en X, est
seleccin har que cada SEXO (Masculino, Femenino, Otros y NS/NR) se produzcan barras e Igualmente
para los valores de la variable Puedo tener como vecino a una persona desmovilizada de la guerrilla.

36
Pgina

Figura 37. Seleccin de las variables en la interfaz del generador de grficos


Como se puede ver en la Figura 19, en el eje Y aparece el estadstico Recuento, esto quiere decir que el
grfico presentara las frecuencias absolutas o frecuencia de ocurrencia, para comparar vamos a usar los
porcentajes. Para que el grfico represente los porcentajes se utiliza la interfaz Propiedades del
elemento (ver Figura 20) y desplegamos Estadsticos y seleccionamos Porcentaje (?), esto activara la
opcin Establecer parmetros (ver figura 20 derecha). Al seleccionar Establecer parmetros se activara el
cuadro Propiedades del elemento: Establecer parmetros.

Figura 38. Propiedades del elemento

Al desplegar la pestaa Denominador para calcular el porcentaje se pueden observar tres opciones:
Total global, Total para cada categora del eje X, y Total para cada categora de la variable de la
leyenda. Si se selecciona Total global los porcentajes se calcularan sobre el nmero total de casos; en
Total para cada categora del eje X, como habamos seleccionado la variable Sexo para el eje X, los
porcentajes se calcularan sobre cada categora de la variable sexo, en este caso Femenino (100%)
masculino (100%) Otros (100%) y NS/NR (100%). Finalmente, si se selecciona Total para cada
categora de la variable de la leyenda los porcentajes se calculan sobre los valores de la variable
Puedo tener como vecino a una persona desmovilizada de la guerrilla. Como intentamos comparar
los Sexos, seleccionamos la opcin Total para cada categora del eje X .
37
Pgina
Figura 39. Denominador para calcular el porcentaje

Finalmente se sigue la ruta Continuar > Aplicar > Aceptar

Figura 40. Generar el grfico


38
Pgina

Generando:
Grfico 1. Cruce entre sexo y Puedo tener como vecino a una persona desmovilizada de la guerrilla

Grfico 2. Cruce entre educacin terminada y Los guerrilleros sin vctimas del conflicto armado
39
Pgina
Generador de grficos de barras apiladas

Cruce de EDUCACIN TERMINADA vs Puedo tener como vecino a una persona desmovilizada de la
guerrilla, para ellos se puede seguir la ruta Grficos > Generador de Grficos.

Figura 41: Pasos para generar grficos de barras apiladas

Al hacer la seleccin se presentara la interfaz de generador de grficos que permite la construccin de


diversos tipos de representaciones, para el caso de este ejercicio seleccionar en Elegir en Galera barras
apiladas

Figura 42. Interfaz del generador de grficos

El grfico tendr 3 cuadros con lneas punteadas que definirn las caractersticas del grfico final Eje
40

x?, Agrupar en X: establecer color y Eje y?, en el primero Eje x? se seleccionar la variable principal
Pgina

que se desea comparar en este caso EDUCACIN TERMINADA, para ello se arrastra la Variables al
recuadro. Esta seleccin genera que el eje x del grfico se divida en seis grupos de barras, primaria,
bachillerato, tcnico/tecnolgico, profesional, postgrado, ns/nr. Una vez seleccionada la variable principal
(Educacin Terminada) se seleccionara la variable a comparar (Puedo tener como vecino a una persona
desmovilizada de la guerrilla) y se desplaza Agrupar en X, est seleccin har que cada categora de la
Educacin Terminada (primaria, bachillerato, tcnico/tecnolgico, profesional, postgrado, ns/n) se
produzcan barras e Igualmente para los valores de la variable Puedo tener como vecino a una persona
desmovilizada de la guerrilla.

Figura 43. Seleccin de las variables en la interfaz del generador de grficos

Como se puede ver en la Figura 24 en el eje Y aparece el estadstico Recuento, esto quiere decir que el
grfico presenta las frecuencias absolutas o frecuencia de ocurrencia, para comparar vamos a usar los
porcentajes. Para que el grfico represente los porcentajes se utiliza la interfaz Propiedades del
elemento y desplegamos Estadsticos y seleccionamos Porcentaje (?), esto activara la opcin Establecer
parmetros. Al seleccionar Establecer parmetros se activara el cuadro Propiedades del elemento:
Establecer parmetros.
41
Pgina
Figura 44. Propiedades del elemento

Al desplegar la pestaa Denominador para calcular el porcentaje se pueden observar tres opciones:
Total global, Total para cada categora del eje X, y Total para cada categora de la variable de la
leyenda. Si se selecciona Total global los porcentajes se calcularan sobre el nmero total de casos; en
Total para cada categora del eje X, como habamos seleccionado la variable EDUCACIN
TERMINADA, para el eje X, los porcentajes se calcularan sobre cada categora de la variable, en este
caso primaria (100%), bachillerato (100%), tcnico/tecnolgico (100%), profesional (100%), postgrado
(100%), ns/nr (100%). Finalmente, si se selecciona Total para cada categora de la variable de la
leyenda los porcentajes se calculan sobre los valores de la variable Puedo tener como vecino a una
persona desmovilizada de la guerrilla. Como intentamos comparar los niveles de educacin,
seleccionamos la opcin Total para cada categora del eje X

42
Pgina
Figura 45. Denominador para calcular el porcentaje
Finalmente se sigue la ruta Continuar > Aplicar > Aceptar.

Figura 46. Generar el grfico

Generando:
43
Pgina
Grfico 2. Cruce entre Educacin alcanzada y Puedo tener como vecino a una persona desmovilizada de
la guerrilla

44
Pgina
Captulo 5: Segmentar archivo

SPSS tambin permite realizar anlisis de datos dividiendo el archivo segn la variable que se defina, de
esta manera se obtienen estadsticos diferenciados para cada uno los niveles de la variable de inters. Para
hacer esto se debe ingresar en la opcin Datos Segmentar archivo.

Figura 47. Segmentar archivo

Al seleccionar Segmentar archivo, se abre una interfaz en la que aparece al lado derecho los nombres de
variables con las que se est trabajando y al lado izquierdo tres opciones: Analizar todos los casos, no
crear grupos; Comparar los grupos y Organizar los resultados por grupos. Como es de inters ver la
opinin con respecto a proposicin Los guerrilleros son vctimas del conflicto armado en funcin de la
Educacin, se selecciona la segunda opcin y se arrastra al recuadro Grupos basados en: la variable
Educacin terminada. Finalmente se da clic en Aceptar. 45
Pgina
Figura 48. Interfaz de la segmentacin del archivo.

Cuando se ha realizado esto, se puede proceder a analizar la opinin con respecto a Los guerrilleros son
vctimas del conflicto armado, para lo que se puede emplear la opcin Analizar Estadsticos
Descriptivos Frecuencias.

Figura 49. Estadsticos de la proposicin Los guerrilleros son vctimas del conflicto armado

Un vez realizada el anlisis, en la hoja de resultados se muestran los anlisis para cada nivel de la variable
EDUCACIN TERMINADA en una seccin de la tabla (ver Tabla 8) y en un grfico aparte (ver Figura
31).
46

Tabla 8: Opinin con respecto a Los guerrilleros son vctimas del conflicto armado para cada nivel de
Pgina

educacin terminada.
Pgina
47
48
Pgina

Figura 50. Grficos de opinin sobre la proposicin Los guerrilleros son vctimas del conflicto armado
Captulo 6: Transformar: Recodificar variables

Mediante esta funcin SPSS permite reemplazar los valores iniciales de una variable por otros, dando dos
opciones para hacerlo: Recodificar en la misma variable y Recodificar en distintas variables. En la
primera opcin, el programa modifica los datos dentro de la misma variable reemplazando los antiguos
por los que se le indican, mientras que en la segunda, crea una nueva variable en la que se asignan valores
nuevos teniendo en cuenta los viejos. Cuando no se quiere perder la informacin inicial, es recomendable
usar la segunda opcin de recodificacin. El procedimiento a seguir en SPSS es el siguiente:
Transformar Recodificar en distintas variables y se da clic en la opcin.

Figura 51. Recodificar en distintas variables

En este caso se reemplazarn los valores de las variables Los guerrilleros son vctimas del conflicto
49

armado y Las vctimas tienen responsabilidad en el proceso de reconciliacin, de la siguiente manera:


Pgina
Tabla 9: Valores antiguos y nuevos

Figura 52. Reemplazo de los valores de Los guerrilleros son vctimas del conflicto armado y Las vctimas
tienen responsabilidad en el proceso de reconciliacin

Para iniciar, se deben pasar de la lista del lado izquierdo al cuadro Variable numrica -> Variable de
resultado las variables que se desean recodificar, asignarles nombre en donde dice Variable de resultado
(la etiqueta es opcional) y dar clic en cambiar. Finalizado este procedimiento, se ingresa en el botn
valores antiguos y nuevos y se indican cmo sern reemplazados los valores.
50
Pgina
Figura 53. Valores antiguos a nuevos de las variables.

Se finaliza el procedimiento dando clic en Continuar y Aceptar. Al final de la base de datos se generan
las nuevas variables recodificadas.

51
Pgina
Figura 54. Nuevos valores de las variables recodificadas

52
Pgina
Captulo 7: Medidas de tendencia central, dispersin y posicin

Para realizar el anlisis de Media, Mediana y Desviacin Tpica de las variables a00AP1, a00AP2,
a00AP3 y a00AP4, se utiliza la opcin de Tablas Personalizadas. Para lo cual se seleccionar la ruta
Analizar > Tablas > Tablas personalizadas.

Figura 55. Uso de la funcin Tablas personalizada

Se arrastra las variables a00AP1, a00AP2, a00AP3 y a00AP4 a las Filas y en las columnas se deja para los
estadsticos de media, medina y Desviacin Tpica (DT) para cada una de las variables.

53
Pgina
Figura 56. Seleccin de las variables en las filas y columnas

Una vez seleccionadas las variables la interfaz mostrar una tabla con filas y columnas con el Media
como estadstico. La intencin es realizar anlisis de medidas de tendencia central de cada una de las
variables, se debe activar la opcin Definir N% Estadsticos de resumen (si la opcin no se encuentra
activa, se puede seleccionar con el cursor las filas, para que la tabla sea coloreada de amarillo y se
resaltara con amarillo la opcin media).

54
Pgina
Figura 57. Seleccin Estadsticos de resumen
En la interfaz aparece la opcin Estadsticos, con una lista de posibles anlisis estadsticos, en la derecha
se observa la opcin Visualizacin que muestra el estadstico de Media activo. A su vez en la tabla
aparecer como etiqueta media y el formato nnnn con 0 decimales. Para seleccionar la mediana y DT se
debe buscar en la lista de Estadsticos la opcin de mediana y Desviacin estndar. Una vez
seleccionados las otras dos opciones, se da clic en Aplicar a seleccin y luego Aceptar

55
Pgina

Figura 58. Interfaz de Estadsticos de resumen


Como resultado se genera una tabla que muestra los estadsticos de media, medina y DT para cada una de
las variables a00AP1, a00AP2, a00AP3 y a00AP4.

Tabla 10: Media, Mediana y DT

El ejemplo anterior aplica cuando se calculan Las medidas de Tendencia Central de cuatro variables, pero
en algunos casos se puede hacer cruces de variables para establecer relaciones entre las variables, para ello
se usar la funcin Tablas Personalizadas. Para lo cual se seleccionar la ruta Analizar > Tablas >
Tablas personalizadas.

Figura 59. Uso de la funcin Tablas personalizada

Por ejemplo, se puede cruzar la variable pausa ubicada en las filas y las variables a00AP1, a0cAP1,
56

abcAP1 en las columnas y calcular Media, mediana y DT


Pgina
Figura 60. Seleccin de las variables en las filas y columnas

Una vez seleccionadas las variables la interfaz mostrar una tabla con filas y columnas con Media como
estadstico. La intencin es realizar anlisis de medidas de tendencia central sobre la variables variables
a00AP1, a0cAP1, abcAP1 en relacin con las categoras de la variable PAUSA, se debe activar la opcin
Definir N% Estadsticos de resumen (si la opcin no se encuentra activa, se puede seleccionar con el
cursor las filas)

Figura 61. Seleccin Estadsticos de resumen


57
Pgina
En la interfaz aparece la opcin Estadsticos, con una lista de posibles anlisis estadsticos, en la derecha
se observa la opcin Visualizacin que muestra el estadstico de Media activo. A su vez en la tabla
aparecer como etiqueta media y el formato nnnn con 0 decimales. Para seleccionar la mediana y DT se
debe buscar en la lista de Estadsticos la opcin de mediana y Desviacin estndar. Una vez
seleccionados las otras dos opciones, se da clic en Aplicar a seleccin y luego Aceptar.

Figura 62. Interfaz de Estadsticos de resumen

Como consejo de organizacin de la tabla, se recomienda dar en la parte inferior de Estadsticos de


resumen dar click en posicin la opcin de filas.

58
Pgina

Figura 63. Organizar de columnas a filas las medidas de tendencia central


Como resultado se genera una tabla que muestra los estadsticos de media, medina y DT para cada una de
las variables a00AP1, a0cAP1, abcAP1, en relacin con las categoras de la variable PAUSA.

Tabla 10:
Media, Mediana y DT de las variables a00AP1, a0cAP1, abcAP1, en relacin con las categoras de la
variable PAUSA

Otra forma de representar medidas de tendencia central es a travs de grficos, en este caso medias para
las variables abcAP1, abcAP2, abcAP3 y abcAP4 ellos se puede seguir la ruta Grficos > Generador de
Grficos (Figura 45).

Figura 64. Ruta para generar un grfico

Al hacer la seleccin se presentara la interfaz de generador de grficos que permite la construccin de


diversos tipos de representaciones, para el caso de este ejercicio seleccionar en Elegir en Galera lneas
simples
59
Pgina
Figura 65. Interfaz del generador de grficos

El grfico tendr 2 cuadros con lneas punteadas que definirn las caractersticas del grfico final Eje
x? y Eje y?, Para que aparezca en el Eje x? las variables las abcAP1, abcAP2, abcAP3 y abcAP4 se
deben juntas por funcin agregar en el Eje y? generando la variable INDEX para el Eje x? (variables
abcAP1, abcAP2, abcAP3 y abcAP4 juntas por funcin agregar). Por lo tanto se debe arrastrar las
variables al Eje y? para que se despliega el cuadro que dice Crear grupo de resumen (al lado derecho
de la figura 47) para crear la Categora INDEX para el eje X. Y se da clic en Aceptar.

60

Figura 66. Crear la Categora INDEX. Para pasarla al eje Y


Pgina
Como se puede observar en la figura 47 en el Eje x? se cre la variable INDEX (abcAP1, abcAP2,
abcAP3 y abcAP4 juntas) Y en el Eje y se calcula la media de cada una de los niveles que tiene la
variable INDEX. Finalmente se dice Aceptar para generar el grafico.

Figura 67. Generador de grafico de lneas a partir de las variables agrupadas en INDEX

Generando:

61
Pgina
Ahora vamos a representar un cruce de variables, para ver las medias de las variables abcAP1, abcAP2,
abcAP3 y abcAP4 cruzadas con PAUSA a partir de Grficos > Generador de Grficos.

Figura 68. Ruta para generar un grfico

Al hacer la seleccin se presentara la interfaz de generador de grficos que permite la construccin de


diversos tipos de representaciones, para el caso de este ejercicio seleccionar en Elegir en Galera lneas
simples.

Figura 69. Interfaz del generador de grficos

El grfico tendr 2 cuadros con lneas punteadas que definirn las caractersticas del grfico final Eje
x? y Eje y?, ?, en el primero Eje x? se seleccionar la variable a comparar PAUSA, para ello se
arrastra la Variables al recuadro Por lo tanto se debe arrastrar las variables (abcAP1, abcAP2, abcAP3 y
62

abcAP4 )al Eje y? para que se despliega el cuadro que dice Crear grupo de resumen (al lado derecho
Pgina

de la figura 47) para crear la Categora INDEX Y se da clic en Aceptar.


Figura 70. Crear la Categora INDEX. Para pasarla al eje Y

Como se puede observar en la figura 47 en el Eje x? se cre la variable INDEX (abcAP1, abcAP2,
abcAP3 y abcAP4 juntas) Y en el Eje y se calcula la media de cada una de los niveles que tiene la
variable INDEX. Finalmente en establecer color esta la variable PAUSA. Aceptar para generar el
grafico.

63
Pgina

Figura 71. Generador de grafico de lneas a partir de las variables agrupadas en INDEX y Pausa
Generando:

Grfico 3: Media de abc en las aplicaciones 1, 2, 3 y 4 en cada pausa.

Otra forma de representar variables de tipo escala es a travs de Histogramas. En este caso se usar uno
para la variable abcAP4. Para ellos hay que seguir la ruta Grficos > Generador de Grficos. Al hacer la
seleccin se presentara la interfaz de generador de grficos que permite la construccin de diversos tipos
de representaciones, para el caso de este ejercicio se debe seleccionar en Elegir en Galera la opcin
Histogramas. Una vez seleccionada, se ubica la variable que se quiere graficar en el eje X. A este tipo de
grficos se les puede aadir la curva de distribucin normal. Para mostrar dicha curva, se debe habilitar en
Propiedades del elemento la opcin Mostrar curva normal y clic en Aplicar. Finalmente, para generar
el grfico se da clic en Aceptar.

64
Pgina
Figura 71. Realizacin de
un histograma

Como resultado se obtienen el siguiente grfico:

Grfico 4: Distribucin de la variable abcAP4.


65

Para graficar mediante histograma la variable a00AP4, se realiza el mismo procedimiento anterior y como
Pgina

resultado se obtiene:
Grfico 5: Distribucin de la variable a00AP4

Captulo 8: Medidas de posicin

SPSS tambin permite representar grficamente medidas de posicin, tales como los cuartiles, a partir de
los diagramas de caja. Para representa la variable abcAP4 mediante esa funcin se debe ir a Grficos
Generador de grficos y se selecciona la opcin Diagrama de caja, ubicada en la parte inferior
izquierda de la interfaz de grficos. Una vez seleccionado, aparecern tres opciones de este tipo de
diagramas: diagrama de caja simple, diagrama de caja agrupado y diagrama de caja 1-D. Como se
quiere graficar una sola variable se escoge la primera opcin, con doble clic o arrastrndola a la parte
superior. La variable que se desea graficar se ubica en el eje Y. Para finalizar se da clic en Aceptar
66
Pgina
Figura 72. Realizacin del
diagrama de caja de la
variable abcAP4.

Como resultado se obtienen el siguiente grfico:

Grfico 6: Diagrama de caja de la variable abcAP4.


67

Si se quisiera discriminar la distribucin teniendo en cuenta la pausa se realiza el mismo procedimiento


Pgina

anterior y se aade la variable pausa en el eje X de la siguiente manera (ver Figura 50).
Figura 73. Realizacin del diagrama de caja de la variable abcAP4 y la pausa.

Como resultado se obtiene lo siguiente:

68

Grafico 7. Diagrama de caja de la variable abcAP4 en funcin de la pausa.


Pgina
Captulo 9: Calcular variables

El software permite operar con las variables que se tienen en la base de datos y hacer clculos sobre
ellas. Mediante la funcin Calcular variable, SPSS permite sumar, restar, calcular promedios,
desviaciones y dems, sobre la informacin que se posee. Para calcular el promedio de las diferentes
aplicaciones de la variable abc (abcAP1, abcAP2, abcAP3 y abcAP4), por ejemplo, se debe ir a
Transformar Calcular variable y dar doble clic. Cuando se selecciona, se abre una ventana en la que
se muestra al lado izquierdo un recuadro donde se debe nombrar la nueva variable que se va a crear,
debajo de eso, el listado de variables de la base de datos con la que estamos trabajando y al lado derecho
las opciones para realizar los clculos (ver Figura 52).

Figura 74. Calcular variable

En el recuadro denominado Expresin numrica se configura la frmula de la operacin que se quiere


hacer con las variables de inters. Para facilitar la realizacin SPSS da opciones de operar mediante
69

Grupo de funciones, en las cuales se encuentra el listado de operaciones preconfiguradas que el


Pgina

programa puede realizar. Como el fin de este ejemplo es calcular el promedio de las aplicaciones de abc,
se busca la opcin Estadsticas. Una vez seleccionada, en el recuadro Funciones y variables especiales
aparecen algunos estadsticos de tendencia central y de dispersin tales como media (Mean), mediana
(Median), desviacin estndar (Sd), varianza (Variance) y otras. Para calcular el promedio se selecciona
MEAN. Cuando se ha hecho esto, en el recuadro Expresin numrica aparece la funcin que
seleccionamos. Para que el programa haga el clculo debemos ingresar el nombre de las variables entre
parntesis, separndolos con coma (ver Figura 53). Para finalizar se da clic en Aceptar.

Como resultados del clculo, en la base de datos se crea una nueva variable con el nombre que le
asignamos, en este caso Promedio que contiene los valores de la operacin que solicitamos

Figura 75. Variable promedio calculada.

70
Pgina