You are on page 1of 24

MINI-MANUAL DE USO DEL PROGRAMA SPSS

PARA WINDOWS
ESPECIALMENTE DISEADO PARA LOS ALUMNOS DEL CURSO
TERICO-PRCTICO DE ESTADSTICA BSICA

Facultad de Medicina (UCLM)


Albacete, abril 2008

Gema Vega

ELEMENTOS DE LA VENTANA SPSS


- VENTANA DE LA APLICACIN: contiene la aplicacin SPSS
- VENTANAS SECUNDARIAS: el SPSS utiliza cinco tipos de ventanas secundarias: la que
contiene los datos (New data), la de resultados (Output), la de instrucciones (syntax), la de los
grficos utilizados durante la sesin y la de edicin de stos (chart carousel window y chart window).
- DATA EDITOR WINDOW (NEW DATA): contiene el archivo de los datos activo y permite
modificarlos.
* Esta ventana se abre automticamente al iniciar la sesin.
* La informacin de esta ventana se guarda con extensin .SAV

- OUTPUT WINDOW: contiene el resultado de los anlisis estadsticos, as como otras


informaciones que presenta el sistema, como son los mensajes de error, por ej.
* Esta ventana se abre automticamente al iniciar la sesin.
* La informacin de esta ventana se guarda con extensin .SPO

Gema Vega

- CHART CAROUSEL WINDOW: contiene los grficos que se realizan durante una sesin.
* Esta ventana se abre automticamente la primera vez que se genera un grfico.
* La informacin de esta ventana se guarda con extensin .CHT

Gema Vega

- CHART WINDOW: permite editar los datos de la ventana carousel.


* Esta ventana se abre a travs de la ventana carousel de grficos.
* La informacin de esta ventana se guarda con extensin .CHT

- SYNTAX WINDOW: contiene instrucciones y procedimientos que permiten manipular el


contenido de la ventana de datos y generar la informacin que aparece en la ventana de resultados.
* El sistema permite configurar la apertura automtica de la ventana de instrucciones
al iniciar la sesin (EDIT/ PREFERENCES)
* La informacin de esta ventana se guarda con extensin .SPS

Gema Vega

**
Pueden tenerse abiertas simultneamente una ventana de datos, una ventana de carousel de
grficos y varias de resultados, de sintaxis y de editor de grficos.
*

Recomendamos que las ventanas secundarias se organicen en mosaico (MAYUS + F4)

- BARRA DE MENUS: casi todas las acciones que realiza la aplicacin pueden activarse a partir de
un sistema de barra de mens y mens desplegables.

- BARRA DE HERRAMIENTAS: permite ejecutar rpidamente las funciones de uso ms


frecuentes.

- BARRAS DE DESPLAZAMIENTO: desplazan el texto de las ventanas secundarias de


instrucciones y resultados.
- LINEA DE ESTADO: informa sobre el estado en el que se halla el proceso de datos y si existe
alguna restriccin relativa a los casos que intervienen (por ejemplo si se han seleccionado algunos
que cumplan una condicin, vendr un texto con "filter on" indicndonos que los anlisis que
realicemos slo se efectuarn en esos casos). Adems cuando se posiciona el puntero del ratn sobre
una funcin de la barra de herramientas, en la lnea de estado aparece una descripcin de la funcin
que realiza.

Gema Vega

Barra de Mens

Barra de Herramientas
Barra de
Desplazamiento

Caso NO
Seleccionado

Barra de
Desplazamiento

Barra de Estado

- File: permite crear, recuperar y grabar archivos. Tambin contiene la opcin Exit que sirve
para salir de la aplicacin.

- Edit: permite editar el texto de la ventana de resultados y de instrucciones, realizar funciones de


bsqueda y cambio. Tambin contiene el men de REFERENCES que permite personalizar
diferentes aspectos del funcionamiento del programa.

Gema Vega

- Data: permite definir variables y realizar cambios globales en la ventana de datos.

- Transform: contiene procedimientos de creacin y modificacin de variables.

- Statistics: contiene los diferentes procedimientos de anlisis estadstico.

- Graph: contiene opciones de representacin grfica.

Gema Vega

- Utilities: permite configurar diferentes aspectos de la aplicacin (por ej. Tipo de letra), crear y
activar grupos de variables, obtener informacin sobre los datos y consultar y seleccionar
variables a instrucciones.

- Window: permite controlar diferentes atributos de las ventanas de la aplicacin (por ej. disposicin
en cascada o en mosaico) y cambiar la ventana activa.

- Help: proporciona informacin sobre diferentes aspectos del funcionamiento del programa.

Gema Vega

CUADROS DE DILOGO
El programa solicita informacin del usuario a travs de los Cuadros de Dilogo que a
parecen cuando se selecciona un elemento del men.
Existe un conjunto de botones de comando y cuadros de lista que aparecen en la mayor
parte de los cuadros de dilogo:
1. OK: Ejecuta las opciones del cuadro del dilogo que se ha seleccionado. Directamente
pasaremos a la ventana de resultados donde nos mostrar la orden y el resultado correspondiente si
es un anlisis o un grfico. Si fuera una orden de definir o de transformar una variable slo aparecer
la orden en dicha ventana.
2. PASTE: Inserta la orden en la ventana de sintaxis. NO LA EJECUTA!
3. RESET: Elimina las especificaciones que se han hecho en la utilizacin previa de dicho
cuadro de dilogo.
4. CLOSE: Cierra el cuadro de dilogo sin ejecutar ninguna orden.
5. HELP: Abre una ventana de ayuda especfica para la realizacin de las rdenes de ese
cuadro de dilogo.

Botones de Comando

Cuadro de Lista

Cuadro de Lista

Adems de los botones de comando en el cuadro de dilogo existen dos Cuadros de Lista.
Estos cuadros suelen contener listas de archivos o de variables. Existen dos tipos de cuadros de lista
de variables: los que contiene a todas las variables y los que slo contiene las variables
seleccionadas. Las variables se seleccionan del primer cuadro al "picar" una o varias a la vez con el
ratn y, posteriormente volver a hacer "clic" sobre el botn con la flecha. Pasarn de una ventana a
la otra. Tambin es posible quitar alguna variable de la lista de variables seleccionadas realizando la
misma operacin pero en sentido inverso.
***
Las opciones de los cuadros aparecen atenuadas cuando no tiene sentido seleccionarlas. Casi
siempre es porque la orden no est completa.
*
Los puntos suspensivos "... " a continuacin de un texto de un botn indican que si se pulsa
dicho botn aparecer otro nuevo cuadro de dilogo con ms opciones.
**** Os recomiendo que os acostumbris a utilizar la opcin PASTE y de esa manera tendris la
posibilidad de guardar en distintos ficheros o archivos de instrucciones con extensin .SPS, que
pueden ser muy tiles en distintas ocasiones.
Segn esto, la propuesta de modo de trabajo es:
1 seleccionar un men de la barra de mens (por ejemplo: statistics),
2 elegir un elemento de la ventana que se despliega al seleccionar el men (summarize,
frecuencies).
3 configurar el cuadro de dilogo y finalizar con PASTE y
4 despus de pulsar PASTE, la instruccin aparece en la ventana de sintaxis, pero no ha
sido ejecutada. Para ser ejecutada habr que seleccionarla si hay otras ("ennegrecerla con el
ratn") y posteriormente hacer "clic" sobre el botn con una flecha que aparece en la barra
de herramientas de esta ventana.
Gema Vega

10

*** El nico cuadro de dilogo que no ofrece la opcin PASTE es el de DEFINE VARIABLE. Si queris
guardar la orden, la nica opcin que a mi se me ocurre es seleccionndola con el ratn
("ennegrecindola" hasta el ltimo punto) en la ventana de resultados (OUTPUT) y con el men EDIT
de la barra de mens dais la orden de COPY. Posteriormente os vais a la ventana de sintaxis
(haciendo "clic" directamente sobre la barra de herramientas o a travs del men Window donde os
da la opcin de cambiar la ventana activa). Una vez en esa ventana, nuevamente entris en el men
EDIT y ponis PASTE, teniendo en cuenta que os copiar dicha orden en el punto donde est el
cursor. (Para que la orden se pueda ejecutar hay que quitar las "flechas" que aparecen al principio de
cada lnea).

LECTURA DE DATOS
La lectura de los datos se realiza con el men FILE de la barra de mens. Dentro de la
ventana que se despliega al elegir este men tenemos varias opciones. Utilizaremos la opcin OPEN y
posteriormente DATA. Dentro de este cuadro de dilogo existen varias opciones: nombre del fichero
(donde sale una lista de nombres de ficheros que tiene la condicin de tener la extensin .sav, que
por defecto es la que aparece), tipo de fichero (donde por defecto siempre aparece los ficheros de
SPSS con extensin .sav), directorios (donde aparece la posicin de directorio y subdirectorio de
donde "cuelgan" los ficheros que aparecen en la ventana de nombre de fichero) y unidades (donde te
da la opcin de leer de distintos discos: c:\, a:\,...etc.). Si lo que se quiere es abrir una base de datos
con extensin .SAV del SPSS, no hace falta modificar nada de la ventana desplegable de tipo de
fichero y lo nico es que hay que hacer "clic" para seleccionar el fichero que queramos

Se activa
aqu

Pero si queremos abrir ficheros con otra extensin habr que elegir primero en esta ventana
desplegable la extensin de los ficheros que queremos. Si queremos ficheros de la versin de
MS_DOS de SPSS, la extensin es .SYS, si es de DBASE la extensin es .DBF y de Excel, la extensin
es .XLS.

Gema Vega

11

Se elige en FILE

Se localiza el archivo y se escoge


arrastrndolo con el ratn de izquierda a
derecha

En el caso de que el fichero que queramos abrir sea ASCII, directamente en el men FILE da
la opcin de leer datos desde ASCII ("Read ASCII Data"). Aqu la orden ser distinta:

Gema Vega

12

GUARDAR EL TRABAJO DE CADA SESIN


Hay que distinguir entre las distintas posibles ventanas que disponemos en el programa.
Podremos guardar la matriz de datos (con extensin .sav), el fichero de rdenes (con extensin .sps),
el fichero de resultados ( con extensin .lst) y los grficos (con extensin .cht). Para guardar estos
distintos ficheros tenemos que tener activa dicha ventana y entrar en el men FILE y hacer clic sobre
SAVE FILE si ya lo hemos guardado con anterioridad, con lo que guardar el archivo con el mismo
nombre que estaba antes. En el caso de que sea la primera vez que se vaya a guardar dicho fichero,
te abrir una ventana de dilogo donde se deber escoger el directorio y subdirectorio oportuno,
adems de ponerle un nombre a dicho fichero, al cual le aadir la extensin oportuna dependiendo
del fichero que se est guardando. Otra posibilidad, es que queramos guardar el fichero en otro
disco o otro directorio/subdirectorio, para lo cual habr que hacer "clic" en SAVE AS, donde se abrir
una ventana de dilogo igual a la comentada anteriormente.
Como sabis, ventana de matriz de datos slo hay una en activo; pero de las dems
ventanas es posible tener varias abiertas al mismo tiempo. Os recomiendo que, tanto la ventana de
resultados como la de sintaxis tengis "unas de sucio" que ser la que por defecto os abre el
programa al inicializarlo y donde expresar todas las rdenes y resultados que se realicen durante la
sesin y, "otras de limpio" donde iris copiando las rdenes y resultados que queris guardar.
Tambin os recomiendo que cada vez que copies un resultado o una orden en dichos ficheros, lo
guardis; pues pudiera ser que se fuera la luz o que alguien tocara en vuestro ordenador y perdierais
lo que habis hecho. Una buena prctica es que cada vez que uno modifica algo o, se levanta de la
silla, se guarde lo que ha hecho, pues se puede tropezar con el cable! no?

DEFINICION Y ATRIBUTOS DE UNA VARIABLE


Se accede al men en "DATA" / "DEFINE VARIABLE" o "picando" dos veces en la columna de
la variable en la matriz de datos.

ATRIBUTOS:
1. NOMBRE: para asignar un nombre a una variable hay que seguir una serie de normas:*
LONGITUD: entre 1- 8 caracteres
* 1er CARACTER: una letra de A-Z (NO )
* CARACTERES RESTANTES:
letras: A-Z; n: del 0-9;signos:_ . $
* PALABRAS PROHIBIDAS: ALL,BY,TO,WITH,EQ,NE,LT,LE,GT,AND,OR,NOT

2. ESCALA DE MEDIDA: Categrica o Numrica


3. FORMATO: Numrica: Se indica como (Fa.d), siendo "F" la indicacin de que es un nmero real,
la "a" el nmero total de caracteres que ocupar la variable cuando se escriban (con el punto y
decimales) y la "d" indicara el nmero de decimales. Siempre tener en cuenta que se deben de poner
el mnimo n de decimales posible.
Alfanumrica (string). Acordaros que en los listados de cada cuadro de dilogo las
variables string vendrn indicadas por un signo ">"
Fecha/hora
(hay distintas modalidades de poner las fechas).

4. ETIQUETAS: Descripcin de la variable.

Si es numrica, se debe de poner la escala de medida.


Si la variable es categrica, adems de poner la etiqueta a la variable, hay que etiquetar cada
valor o cdigo de las distintas categoras de la variable. (Por ejemplo en la variable Raza: el valor "0"
le corresponde la etiqueta "raza blanca", al "1" "la raza negra" y al "2" "la raza amarilla")

5. VALORES MISSING: cdigos asignados a los valores desconocidos o a los valores no evaluables.

A veces el contenido de un caso en una variable no es un valor vlido. Esto puede ser por
Gema Vega
13

varias razones: porque sea un error en la transcripcin de los datos, porque no se haya recogido el
valor que toma esa variable en ese caso o porque realmente no se pueda saber dicho valor. En
cualquiera de estas circunstancias la realidad es que se desconoce ese valor y, por tanto no se puede
utilizar para realizar los anlisis. El programa tiene que reconocer a estos valores como "missing
values". Para ello tenemos dos posibilidades: 1 dejar el espacio en blanco y el programa por defecto
lo reconoce como missing (posibilidad que no os recomiendo porque nunca sabremos si es que se te
ha olvidado poner ese valor por error o realmente reconoces dicho valor como perdido). Y 2: darle
un valor en concreto que el programa reconozca como missing una vez informado de ello. Ese valor
se codifica al definir la variable y tiene que cumplir la condicin de que sea un valor tal, que la
variable en cuestin nunca pueda tomar.(Por ejemplo en el caso de la variable edad el nmero "-9").
A pesar de lo que os he dicho en el manual del programa recomiendan que se dejen los espacios en
blanco antes que darles un valor a los missing.

CODIFICACION DE LAS VARIABLES CUALITATIVAS:


El objetivo de codificar una variable es representar de forma simplificada las diferentes
categoras de las variables cualitativas (dicotmicas o no dicotmicas: nominales y ordinales). Los
cdigos que se asignan a cada categora son arbitrarios pero deben de cumplir dos condiciones:
simplificar su representacin e identificarle de manera inequvoca.
As pues una variable cualitativa se puede codificar como numrica o alfabtica (string) en
funcin del tipo de cdigos que queramos poner a cada categora; aunque como ya os dije, habra
que acostumbrarse ya a codificarles como numricas o, ms bien os recomiendo que lo hagis. Si son
dicotmicas (0/1) y las no dicotmicas con las categoras a partir del "0" en adelante. Por supuesto,
tenis que tener presente que aunque la variable la codifiquis como numrica, tal nmero no
expresa ninguna cantidad.
Por ejemplo, la variable sexo se puede codificar como string M/V o numrica 0/1.

APPLY DATA DICTIONARY


Dentro del men FILE, existe una posibilidad que es APPLY DATA DICTIONARY, que es una forma
alternativa de definir variables. Aplica el diccionario de un archivo SPSS de datos al archivo de datos
que se tenga en activo. Esta operacin se realiza solo para variables cuyo nombre y formato es igual
en ambos archivos. La orden quedar as: APPLY DICTIONARY FROM = 'NOMBRE.SAV'.

SELECT CASES
A esta orden se accede desde la barra de mens haciendo clic en el men DATA y luego
seleccionando SELECT CASES. Se abrir una ventana de dilogo donde aparecen diferentes formas
de seleccionar los datos para realizar los siguientes anlisis. Estas opciones son:
1- Seleccionar todos los casos (que es la que aparece por defecto): ALL CASES
2- Seleccionar una submuestra de los casos de forma aleatoria: RANDOM SAMPLE OF CASES.
Tenemos la opcin de elegir un nmero determinado de casos o una proporcin de ellos.
3- Seleccionar una submuestra segn el valor o rango de una variable: BASED ON TIME OR
CASE RANGE
4- Seleccionar una submuestra segn un valor de una variable ya existente: USE FILTER
VARIABLE
5- Seleccionar una submuestra si cumplen alguna condicin: IF CONDITION IS SATISFIED.
Esta condicin la expresamos en otra ventana que entraremos al hacer clic sobre la orden IF, donde
tendremos que crear la expresin lgica de la condicin que ponemos (ver la parte correspondiente a
elementos que constituyen una expresin lgica).
Una vez que ya hemos construido la orden para seleccionar los casos, tenemos que
especificar si los no seleccionados queremos que los borre de la matriz de datos (UNSELECTED
Gema Vega

14

CASES ARE DEJETED: orden poco o nada recomendable) o por el contrario, simplemente que no los
tenga en cuenta de forma temporal para los futuros anlisis que realicemos (UNSELECTED CASES
ARE FILTERED). A esta ltima posibilidad la denominamos FILTRADO DE CASOS, cuando
simplemente queremos excluir temporalmente del anlisis a los sujetos que no cumplen determinada
condicin. Para ello es necesario:
1 Disponer de una variable de seleccin que tome el valor "0" para los sujetos que no
cumplen la condicin (los excluidos) y un valor diferente del "0" (1 por ejemplo) para aquellos que si
la cumplen, es decir, para los sujetos que realmente queremos seleccionar.
2 Se activa un filtro para seleccionar solo aquellos pacientes que en la anterior variable
creada tomen el valor "1".
Esto lo realiza el programa simplemente conque nosotros pongamos la condicin en la
ventana correspondiente y posteriormente demos a OK. Una vez ejecutada la orden, en la barra de
estado aparecer un mensaje "FILTER ON", indicando que slo trabajar a partir de ese momento
con los casos seleccionados. Adems en la matriz de datos aparecer el nmero de registro tachado
en los casos no seleccionados.
Cuando se quiera volver a seleccionar a todos los casos volveremos a DATA/SELCT CASES/ y
pondremos ALL CASES. En este momento la orden que aparecer ejecutada ser "FILTER OFF" y
desaparecer el mensaje de la barra de estado.

SORT CASES
A esta orden se accede escogiendo el men DATA de la barra de mens y sirve para ordenar
los datos segn los valores de la variable o variables criterio que se establezcan. Si se especifica una
lista de variables, primero se ordenan segn los valores de la primera variable, a continuacin segn
los de la 2 y as sucesivamente. Por defecto la ordenacin es ascendente, para ordenarlo de forma
descendente, hay que especificarlo.

VENTANA UTILITIES
Esta ventana tiene varias opciones que son muy tiles (de ah su nombre claro!).
1- VARIABLES: donde se puede ver las distintas variables (formato, etiquetas y missing
values) de la base de datos activa.
2- FORMAT: da la opcin de cambiar el tipo de letra
3- OUTPUT PAGE TITLE: pone un ttulo al trabajo que aparecer en la primera lnea de
cada hoja del "output". El texto del ttulo puede tener una longitud mxima de 58 caracteres.
4- OUTPUT PAGE SUBTITLE: pone un subttulo al trabajo que aparecer en la segunda
lnea de cada hoja del "output". El texto del subttulo puede tener una longitud mxima de 64
caracteres.
5- *(Coment): permite insertar un texto entre las instrucciones SPSS con objeto de
documentar el trabajo.

ELEMENTOS, ESTRUCTURA Y ORDEN DE EJECUCION DE UNA EXPRESION LOGICA


Consideramos expresiones lgicas cuando queremos dar una informacin condicionada.
Normalmente las utilizamos en las rdenes de transformar variables o cuando seleccionamos datos
que cumplan una condicin. Vamos a comentar los elementos que constituyen una expresin lgica:
Expresin Aritmtica:
Constantes
Variables
Operadores aritmticos (ver COMPUTE)
Funciones (ver COMPUTE)
Gema Vega

15

Operadores de relacin:
"
"
"
"
"
"

="
<>
<"
>"
<=
>=

-->Igual
" -->Diferente
-->Menor que
-->Mayor que
" -->Menor o igual
" -->Mayor o igual
Operadores Lgicos:
" AND " --> y (insercin)
" OR " --> o ( reunin)
" NOT " --> no (negacin)

Estructura de una expresin lgica:


(exp.arit. ope.rel. exp.arit.) [op. lgico (exp.arit. op.rel. exp.arit)...]

Orden de ejecucin de una expresin lgica:


1
2
3
4
5
6

Expresiones situadas en parntesis


Expresiones aritmticas
Operadores de relacin
Operador lgico NOT
Operador lgico AND
Operador lgico OR

Ejemplo:
SELECT IF (SEXO = 1 AND EDAD <= 40 AND PESO/TALLA**2 > 25).
Donde sexo, edad, peso y talla son diferentes variables, el "=", "<=" y ">" son expresiones
de relacin, la divisin peso/talla**2 es una expresin matemtica y "AND" es un operador lgico. Lo
que queremos seleccionar son los varones con edad menor o igual a 40 aos y que adems tengan
una masa corporal inferior a 25 Kg/m2

TRANSFORMACION DE DATOS
COMPUTE
Dentro del men "Transform" existe una posibilidad que es "COMPUTE". Esta orden permite
crear una variable o modifica el valor de una variable ya creada, a partir de una expresin en la que
puede intervenir: variables existentes, constantes, operadores aritmticos y funciones.
-->Dentro de los operadores aritmticos tenemos: sumar (+), restar(-), multiplicar (*),
dividir (/) y elevar a una potencia (**) que habr que poner detrs el nmero de la potencia a la que
se eleva.
Orden en que se procesa una expresin aritmtica:
1 Las expresiones situadas en parntesis
2 Las funciones
3 Las operaciones con la siguiente jerarqua:
1) Exponenciacin (**)
2) Producto (*) y Cociente (/)
3) Suma (+) y Resta (-)
Cuando dos operadores tiene una misma jerarqua el Sistema efecta las operaciones de
izquierda a derecha.
Ejemplos:
4 + 3*2 - 6/2 =7 -->Primero la multiplicacin,2 la divisin 3 la suma y 4
la resta
(4+3)*2 - 6/2 = 11 --> Primero la suma del parntesis, 2 la multiplicacin,
Gema Vega

16

3 la divisin y 4 la resta
-->Dentro de las funciones,
frecuentemente utilizadas son:
*Funciones aritmticas:
- ABS (arg)
- RND(arg)
- TRUNC(arg)
- SQR(arg)
- EXP(arg)
- LG10(arg)
- LN(arg)

se dispone de un amplio grupo de ellas, entre otras, las ms


Valor absoluto
Redondeo
Parte entera
Raz cuadrada
Exponencial del nmero "E"
Logaritmo Decimal
Logaritmo Neperiano,...etc.

*Funciones Estadsticas:
- SUM[.n](arg) Suma de diferentes variables
- MEAN[.n](arg) Media
- SD[.n](arg) Desviacin Estndar
- VAR[.n](arg) Varianza
- MIN[.n](arg) Mnimo, ...etc.
*Funciones Fecha: Saber que las fechas se almacenan internamente como el nmero de
segundos transcurridos desde las 0 horas del da 14/10/1581, con formato de 20 caracteres
- DATE.DMY(d,m,a)
A partir del da, mes y ao retorna la fecha.
- CTIME.DAYS(arg)
Transforma en das la diferencia entre dos fechas
- XDATE.MDAY(arg)
Retorna el da del mes
- XDATE.MONTH(arg) Retorna el mes del ao
- XDATE.YEAR(arg)
Retorna el ao en cuatro dgitos, ... etc.
*Funciones de valor missing:
- NVALID (agr) Retorna el nmero de valores validos de una lista de variables
- MISSING(arg) Retorna el valor 1 (verdadero) si la variable es missing y el valor 0
cuando tiene missing, ... etc.
Vamos a poner ejemplos de alguna de las funciones anteriormente expuestas:
--> Tratamiento de Fechas:
Supongamos que tenemos dos variables FI (fecha de ingreso) y FA (fecha de alta) y queremos
calcular el nmero de segundos, das y semanas transcurridas entre esas dos fechas. Para ello
tendremos que crear otras tres variables nuevas: SEGHOSP, DIAHOSP y SEMHOSP. Lo haremos
de la siguiente forma:
COMPUTE SEGHOSP= FA - FI.
COMPUTE DIAHOSP= CTIME.DAYS(FA-FI).
COMPUTE SEMHOSP= TRUNC((CTIME.DAYS(FA-FI))/7).
Luego, tendris que poner las etiquetas respectivas a cada variable con DEFINE VARIABLE
--> Clculo de la edad de un sujeto que contest a un cuestionario el da 6 de Octubre de
1991, suponiendo que tenemos la fecha de nacimiento (FN):
Podemos hallar la edad en das, semanas, meses o aos, creando las variables EDAD_DIA,
EDAD_SEM, EDAD_MES Y EDAD_ANO. Lo haremos de la siguiente forma:
COMPUTE EDAD_DIA=CTIME.DAYS(DATE.DMY(6,10,91)-FN).
COMPUTE EDAD_SEM=TRUNC(CTIME.DAYS(DATE.DMY(6,10,91)-FN)/7).
COMPUTE EDAD_MES=TRUNC(CTIME.DAYS(DATE.DMY(6,10,91)-FN)/30).
COMPUTE EDAD_ANO=TRUNC(CTIME.DAYS(DATE.DMY(6,10,91)-FN)/365).
La orden TRUNC se utiliza para tomar slo los nmeros enteros.
Dentro de la orden COMPUTE tenemos la opcin IF que sirve para poner una condicin a la
Gema Vega

17

ejecucin de esta orden, es decir, la orden de COMPUTE slo se ejecutar cuando se cumpla dicha
condicin que se expresar como una "expresin lgica" (mirar el apartado de expresin lgica). Al
final la orden quedar: IF (expresin lgica) NOMBRE DE NUEVA VARIABLE= EXPRESION
ARITMETICA. Por ejemplo: IF (PESO > 65) MASA=PESO/TALLA**2. Queremos decir que slo cree la
nueva variable masa corporal para aquellos pacientes que pesen ms de 65 Kg

RECODE
A esta orden se llega por el men Transform, haciendo clic sobre recode. Tenemos dos
posibilidades en esta recodificacin. Uno, recodificando en la misma variable y el segundo, hacer la
recodificacin creando otra variable. Para ello hay que escoger la correspondiente orden en la
ventana desplegable que aparece al hacer clic sobre recode. Os recomiendo que siempre mantengis
la informacin original en la variable original, pues luego la podis utilizar para nuevas
recodificaciones o para otros anlisis que se os ocurran posteriormente. Por ejemplo, si tenis la
variable edad en aos y la queris clasificar en distintas categoras, lo haris con esta orden; pero es
importante que mantengas la informacin de la edad "intacta" para nuevas categorizaciones o para
otros anlisis. Por eso os recomiendo que utilicis la opcin de "INTO DIFFERENT VARIABLE".
En este tipo de orden que trata de cambiar unos valores por otros, tendris que dar la
informacin correspondiente al valor antiguo (el actual) y el valor nuevo (el que queris que tome en
la nueva variable). Para ello existe una opcin que pone "OLD AND NEW VALUE", en la cual tenis
que entrar para dar esta informacin. Si estis utilizando la opcin de recodificar en la misma
variable, al poner el "new value" tiene que ser en el mismo formato que la variable de partida; pero si
por el contrario estis utilizando la opcin de "different variable", el nuevo valor puede ser en formato
diferente.
En el caso de las variables numricas, tenemos una serie de claves que se pueden utilizar
para facilitar la orden que queremos dar para el "old-value":
LO:
Valor ms bajo de la variable
HI:
Valor ms alto de la variable
THRU: Permite especificar el intervalo de valores
MISSING:
Valor missing de cada variable. La palabra clave missing, hace referencia
tanto a los user-missing como a los system-missing
SYSMIS:
Simboliza slo el valor de system-missing
ELSE: Simboliza el resto de los valores no especificados, incluso los missing. En el caso de
las variables categricas, esta clave es la nica que podra utilizarse.
Tenemos un problema en las variables creadas por la orden COMPUTE en funcin de otras
variables, pues la precisin de esta nueva variable es muy alta. Por ejemplo si creamos la variable
MASA CORPORAL a partir del peso y la talla (nos aparecern muchos decimales) y posteriormente
queremos codificar esta nueva variable para definir obesos y no obesos, diferenciando en el valor 25.
En este caso deberemos poner la orden desde el menor hasta el 25 ser 0 y a partir de 25 ser 1 (LO
THRU 25 = 0)(25 THRU HI = 1), en este caso todos los enfermos con masa corporal inferior o igual a
25 sern codificados con el "0" y cualquier valor mayor de 25 (25,00003 por ejemplo) ser codificado
como "1".
Para codificar el nuevo valor ("new-value"), en el caso de las numricas la clave SYSMIS,
sustituye los old values en missing. Y la clave COPY, replica los valores originales (old) en los nuevos
sin codificarlos. En las variables string, esta clave es la nica que se puede utilizar.
La orden de recodificar la variable en diferente variable se puede ejecutar para varias
variables al mismo tiempo, poniendo para cada variable el nuevo nombre de la variable y su etiqueta
correspondiente; pero siempre con la salvedad de que la recodificacin ser en todas las variables
igual. Por ejemplo, imaginaros que tenis varias variables categricas codificadas en alfanumrico
S/N (SI/NO), como por ejemplo HTA (hipertensin arterial), DM (Diabetes Mellitus), ACVA (Accidente
cerebro vascular) y CI (cardiopata Isqumica) y, queris cambiarlas a numricas 1/0; pues entrareis
en TRANSFORM/RECODE/IN DIFFERENT VARIABLE y una vez en el cuadro de dilogo vais
Gema Vega

18

escogiendo HTA y le dais el nuevo nombre que puede ser por ejemplo HTAN (de numrica) y le
ponis la etiqueta "HTA en nmeros" y le dais al CHANGE. Luego escogis DM y le dais el nuevo
nombre DMN y ponis la etiqueta "DM numrica" y as con las otras dos ACV-->ACVAN y CI-->CIN y
CHANGE cada vez. Veris que en la ventana se van quedando las rdenes de crear las nuevas
variables. Ahora hay que darle la orden del cambio, de la recodificacin. Para ello entramos en OLD
AND NEW VALUES y ponemos que al old value "S" le corresponde el new value 1 y hacemos clic en
ADD, comprobando que la orden aparece reflejada en la ventana de abajo. Posteriormente ponemos
que el old value "N" le corresponde el new value 2 y volvemos a dar a ADD. Antes de cerrar la
ventana de dilogo con CONTINUE, decimos que queremos pasar las variables de string a numricas
(abajo a la derecha).
AUTOMATIC RECODE Cambia los valores de una variable (numrica o alfanumrica) por
valores numricos consecutivos y asigna los valores de la variable recodificada a una nueva variable.
No hace falta darle formato, siempre empieza a codificar desde el nmero 1 y siempre arrastra las
etiquetas que hubiera en el "old value" de la variable original. Por ejemplo imaginaros que tenemos
una variable con las distintas provincias espaolas, pero codificadas por el cdigo postal y a cada
cdigo se le puso su etiqueta del nombre de la provincia correspondiente. Si recodificamos esta
variable de forma automtica aparecer una nueva variable desde el valor 1 hasta el total de
provincias y a cada valor mantendr la etiqueta del nombre de la provincia.

COUNT
Cuenta el nmero de veces que se presenta un valor o un conjunto de valores en una lista de
variables y asigna el valor del recuento a una nueva variable. Las variables generadas mediante esta
orden se inicializan con el valor "0", a diferencia de las variables numricas generadas con COMPUTE
y AUTORRECODE, que se inicializan con el valor system missing.
Vamos a poner un ejemplo que me parece que no os habis enterado de nada. Imaginaros
que tenemos 6 variables que expresan distintos hbitos de salud, tres hbitos positivos y 3 negativos.
Los positivos sern H1(Prctica de deporte), H2 (Dieta equilibrada) y H3 (Descanso regular), estas
variables son categricas, pero estn codificadas como numricas con valores 0(nunca),
1(Ocasionalmente) y 2(Habitualmente). Los 3 hbitos negativos son H4 (Consumo de alcohol), H5
(Consumo de cafena) y H6 (Consumo de Tabaco), para estas variables que tambin son categricas,
pero que tambin estn codificadas como numricas, los valores 0,1 y 2 corresponden a Nulo (0),
Moderado (1) y Alto (2). Pues bien, hemos recogido estos 6 hbitos de salud y ahora nos interesa
saber en general cuantos practican hbitos positivos habitualmente, cuantos ocasional o
habitualmente y cuantos no han contestado a las preguntas de los seis hbitos en general, por
ejemplo. Para ello creamos tres nuevas variables (HPOS_H, HPOS_OH y HPOS_M) y daremos la
siguiente orden:
COUNT HPOS_H= H1 TO H3 (3).
COUNT HPOS_OH= H1 TO H3 (2,3).
COUNT HPOS_M= H1 TO H6 (MISSING).
Hay que tener cuidado al dar la orden COUNT con los valores missing de las variables de
donde se quieren contar los resultados, pues al hacer count esta orden no crea missing aunque lo
sean.

Gema Vega

19

RESUMEN DE INSTRUCCIONES Y MENUS DE LA LECTURA DE DATOS,


DEFINICION DE VARIABLES Y CREACION DE ARCHIVOS SPSS:
INSTRUCCION
DATA LIST
GET TRANSLATE
LIST

MENU
File /Read ASCII
File / Open / Data
Statistics /Summarize / List Cases

VARIABLE LABEL
VALUE LABEL
MISSING VALUES

Data /Define Variable


Data /Define Variable
Data /Define Variable

DISPLAY DICTIONARY
SAVE
GET FILE
APPLY DICTIONARY
TITLE,SUBTITLE

Utilities / File Info


File / Save as (tipo SPSS)
File / Open / Data (tipo SPSS)
File / Apply Data Dictinary
Utilities / Output Page Titles

RESUMEN DE INSTRUCCIONES Y MENUS:TRANSFORMACION DE DATOS


INSTRUCCION
COMPUTE
FORMATS
RECODE
AUTORECODE
COUNT

Gema Vega

MENU
Transform / Compute
Data / Define Variables
Transform / Recode
Transform / Automatic Recode
Transform / Count

20

ESTADSTICA DESCRIPTIVA
CUANTITATIVA
Como ya sabeis, las variables cuantitativas vienen definidas por la "n", una medida de
centralizacin y una medida de dispersin. Dentro de las medidas de centralizacin dijimos que la
mejor es la media, siempre y cuando la variable se distribuyera como una distribucin normal de
campana de Gauss; pero que tambin existan otras medidas de centralizacin como la mediana (el
valor que divide la muestra dejando el 50% a cada lado) y la moda (el valor ms repetido). Como
medidas de dispersin tenamos: el rango, la varianza y la desviacin tpica (siendo esta ltima la
mejor).
Adems tambin podamos saber si la distribucin era simtrica o asimtrica al relacionar la
media con la mediana y ver como se distribuan los casos segn los percentiles.
En la orden STATISTICS/SUMMARIZE/EXPLORE: se examinan los datos con tcnicas de
"Anlisis de datos" entre las que incluyen grficos, los principales estadsticos de centralizacin y
dispersin, adems de los percentiles. Dentro de los grficos puedes representar la variable como
BOXPLOT, histogramas (HISTOGRAM) y como tronco y hojas (STEM-AND-LEAF). Tambin realiza las
pruebas de normalidad de Shapiro-Wilks y de Kolmogorov-Smirnov (NPPLOT). No os he hablado de
estas pruebas estadsticas, pero simplemente sirven para demostrar que la distribucin sigue una
distribucin normal de Gauss y por tanto podemos atribuirle todas sus propiedades. En estos test la
H0 sera que se distribuye segn una normal y si la rechazamos con una seguridad >= al 95% (es
decir con una probabilidad de equivocarnos menor o igual que el 5% o 0,05), es que estamos
demostrando que no se distribuye segn una normal y por tanto no podemos manejarla como tal.
Esta orden tambin da la opcin de hacer estas funciones pero en submuestras, para ello hay
que darle la orden de que te describa por ejemplo la variable edad segn los sexos y te dar toda la
informacin que le hayamos pedido para sexo=1 (hombre, por ejemplo) y posteriormente para
sexo=0 (mujer).

DESCRIPTIVES
Esta orden tambin se despliega del men STATISTICS y describe las variables cuantitativas
con ndices estadsticos. Al acceder a esta ventana existen varias posibilidades:
Donde se puede modificar el formato de la tabla. Cuando la informacin que
- FORMAT:
se pide sobrepasa una lnea en el output de salida, es mejor poner format=serial, pues te expone la
informacin correspondiente a cada variable en varias columnas
INCLUDED
Incluye los valores missing
- MISSING:
LISTWISE
Excluye del anlisis los casos que tengan algn valor missing
en cualquiera de las variables especificadas.
media
- STATISTICS: MEAN:
SEMEAN:
error estandart de la media
STDDEV:
desviacin standart
VARIANCE:
varianza
KURTOSIS:
apuntamiento
SKEWNESS:
asimetra
RANGE: amplitud. Rango
MINIMUN:
mnimo valor que toma la variable
MAXIMUN:
mximo valor que toma la variable
SUM:
suma de todos los valores
DEFAULT:
media, desv. standart, mnimo y mximo
ALL:
calcula todos los estadsticos anteriores
- SORT: Permite manipular el orden de presentacin de la informacin, en funcin del
nombre de las variables o del valor de los diferentes estadsticos. En ambos casos la ordenacin
puede ser de tipo ascendente (A) o descendente (D).
Gema Vega

21

CUALITATIVA-CATEGORICA

FRECUENCIES
Esta orden es otra opcin que da el men STATISTICS /SUMMARIZE. Se utiliza para las
variables cualitativas fundamentalmente, aunque tambin son tiles para sacar listados de tablas de
frecuencias en las variables cuantitativas y adems te da la opcin de hacer alguna estadstica de
centralizacin y dispersin.
Con respecto a las variables cualitativas, ordenas los distintos valores y te da las tablas de
frecuencias, porcentajes simples, vlidos (sin los missing) y los acumulados (bastante tiles) y
adems te da opciones de representaciones grficas (tipo diagrama de barras o histograma)
CROSSTABS
Construye tablas de contingencia que representa la distribucin conjunta de dos o ms
variables categricas. Se accede a esta orden, nuevamente con el men STATISTICS/SUMMARIZE.
Dentro de la ventana de dilogo tenemos varias opciones: tenemos que elegir la variable que formar
las columnas y la que formar las filas. Si elegimos varias, aparecer una tabla para cada variable de
las columnas con cada una de las variables de las filas. Adems tenemos distintas opciones para
modificar o completar la orden de CROSSTABS:
- CELLS: Permite manipular la informacin que aparece en las casillas de la tabla: tenemos la
opcin que en la tabla aparezca el valor real de cada casilla (el experimental u observado), el valor
esperado (terico), el porcentaje de filas (la incidencia de enfermedad y no enfermedad en expuestos
y no expuestos), el porcentaje de columnas (la prevalencia de exposicin y no exposicin en
enfermos y no enfermos) y el porcentaje del total de casos (probabilidad condicionada).
- FORMATS: Permite manipular algunos aspectos relacionados con el formato de la
presentacin de la tabla. Acordaros que solo podremos cambiar el orden de colocacin de los
distintos valores que tomen las variables de las filas y no de las columnas que siempre aparecern en
orden creciente de izq. a derecha. Por lo tanto, tenis que tener muy claro que para poder hallar el
Riesgo Relativo bien, en la casilla de arriba a la izquierda de la tabla de 2x2 hay que poner los
expuestos enfermos.
- STATISTICS: Con esta opcin escogemos el estadstico que consideramos para realizar en
cada caso. Dentro de las ms utilizadas estn
- CHISQ: Prueba de independencia de ji cuadrado y de tendencia lineal. En tablas de
2x2 efecta la correccin de Yates (la de sumar o restar 0,5 a la diferencia del numerador de la
ecuacin de la ji cuadrado (O - E)2/E os acordabais! no?) y, en caso de que fuera necesario aplicar
tambin da los resultados del test exacto de Fischer (cuando al menos el 20% de las celdas tienen un
valor esperado igual o inferior a 5, os acordabais tambin! no?)
- CORR: coeficiente de correlacin de Pearson (r) y de Spearman, para dos variables
medidas en escalas de intervalo.
- KAPPA: coeficiente de correlacin de Kappa: para variables que tengan las mismas
categoras.
- RISK: Clculo del riesgo relativo y de la odds ratio en las tablas 2x2. Acordaros que
para que salgan bien los resultados en la casilla de arriba a la izquierda tienen que estar los
expuestos y enfermos (incidencia de expuestos). Para que os salga bien tenis que codificar
correctamente las variables. Tambin nos aporta el intervalo de confianza al 95% (IC95%) de estos
dos parmetros que, aunque estoy casi segura de que sabis lo que significa, os lo voy a repetir sin
que os ofendis por ello. El IC95% del RR por ejemplo, significa que aunque en la muestra nos haya
salido un RR con un valor "X", en la poblacin podemos asegurar con una seguridad del 95% que el
valor no ser seguro el "X" pero que estar comprendido en ese intervalo IC95%.
Para las variables con varias categoras de niveles distintos de exposicin se debe de hacer la
ji cuadrado de tendencia (que si es estadsticamente significativo quiere decir que adems de existir
Gema Vega
22

una relacin entres esas variables, la proporcin de expuestos y enfermos aumenta segn va
aumentando el nivel de exposicin) y los riesgos relativos entre los distintos niveles de exposicin
teniendo una categora como nivel de referencia que normalmente es la categora con exposicin
nula o de menor exposicin). Esto no lo da el programa y hay que construir varias tablas de 2x2 con
cada nivel de exposicin y el de referencia para hacer los RR de dos en dos. (Insisto tener en cuenta
que arriba a la izquierda tienen que aparecer los expuestos y enfermos, o por el contrario el RR que
os de no es el correcto). Todo esto os lo hace el EPIINFO ms cmodamente. Os lo recomiendo!

RELACION ENTRE UNA VARIABLE CUALITATIVA Y UNA CUANTITATIVA


COMPARACIN DE MEDIAS
En este caso estamos midiendo una misma variable cuantitativa (la edad por ejemplo) en dos
submuestras distintas (segn el sexo: mujeres/hombres) y lo que queremos saber es si la media de
esa variable es distinta en cada una de las submuestras (si la edad media de los hombres es distinta
de la edad media de las mujeres). Para ello primero tenemos que saber si dicha variable se comporta
como una distribucin normal de Gauss y as saber si tenemos que hacer test paramtricos o no
paramtricos.
La comprobacin de la normalidad lo hacemos a travs de dos ventanas de dilogo:
- STATISTISC/SUMMARIZE/EXPLORE: donde nos da la posibilidad de ver por grficos la
distribucin de la dicha variable segn las submuestra de las categoras de otra variables (la
distribucin de la edad segn sean mujeres o hombres) y los estadsticos oportunos (KosmogorovSmirnov y Shapiro-Wilks)
-STATISTICS/NPARAMETRICS/K-S: donde podemos hacer la prueba de Kosmogorov-Smirnov
de la edad, pero previamente tendremos que seleccionar las distintas categoras con SELECT CASES
(los hombres por un lado y las mujeres por otro).

Gema Vega

23

CLASIFICACION DE LOS PROCEDIMIENTOS SPSS DE DESCRIPCION DE


VARIABLES

Error! Marcador no
definido.

CATEGORICAS

CUANTITATIVAS

EN LA MUESTRA TOTAL FRECUENCIES

EXAMINE; DESCRITIVES

EN SUBMUESTRAS

EXAMINE ..BY..; MEANS

Gema Vega

CROSSTABS

24

You might also like