You are on page 1of 22

ACTUALIZACIÓN DE SPSS

Universidad Católica Sedes Sapientiae

UCSS, Agosto 2013
TALLER DE ACTUALIZACIÓN DE SPSS

1.

¿Qué es un software estadístico? Es aquel software que se usa para resolver los problemas que surgen diariamente en las empresas y organismos oficiales utilizando el análisis estadístico. Genera la información que necesita para tomar las mejores decisiones, presentando los resultados en forma de tablas o gráficos.

2.

¿Qué es PASW 18? Es un software estadístico que ofrece un rápido entorno de modelamiento visual desde lo más simple hasta lo más complejo. Permite sacar provecho a los datos utilizando una completa gama de herramientas. Es una herramienta para el análisis y administración de datos capaz de producir gráficos y reportes estadísticos rápidos con una gran variedad de técnicas estadísticas especializadas. Diseñado en un entorno gráfico de modo que pueda accederse a todos los procedimientos señalando y pulsando el ratón.

3.

¿No era un curso de SPSS? Es verdad, SPSS (originalmente, Statistical Package for the Social Sciences) fue adquirida por IBM y pasó a llamarse PASW (Predictive Analytics SoftWare).

4.

¿Por qué usar PASW 18? • • • • Por su facilidad de uso. Está ampliamente difundido. Permite trabajar con grandes cantidades de datos. Resultados fáciles de exportar a Excel y Word.

5.

¿Cuándo puedo usar PASW 18? • En toda investigación donde se recogen datos, estos deben de analizarse. El PASW es una herramienta poderosa para este fin. • Cuando en el proceso de la formulación de algún proyecto se consiguen datos de alguna institución (INEI, municipalidades, ONG, etc.). Esta información se debe procesar de acuerdo a los requerimientos propios para una buena toma de decisiones.

6.

¿Esta capacitación sólo sirve para la versión 18? En realidad NO, las funciones más utilizadas del SPSS se pueden encontrar de la misma forma en cualquiera de las versiones anteriores.

-2-

sexo.Taller de PASW 18 CONCEPTOS BÁSICOS DE ESTADÍSTICA DESCRIPTIVA Definición de Estadística: Estadística es la ciencia que nos proporciona un conjunto de métodos y técnicas que pueden servir para: Recolección de datos Clasificación de datos Presentación de datos Análisis e interpretación de datos Variable: Es una característica que puede tomar diferentes valores. Número de cigarrillos vendidos en una actividad. Ejemplo: Cantidad de alumnos. Ejemplo: clase social. Variable cuantitativa Continua: Puede tomar cualquier valor dentro de un rango. d. Coeficiente de inteligencia de una persona. Tipos de Variable: a. Fallecidos en el hospital durante la última noche.) o una cualidad no medible (estado civil.). p. m. pero sin ningún tipo de ordenación entre o clasificación. es no numérico. Variable cualitativa Ordinal: Es aquella cuyos valores se expresan en categorías pero se busca una clasificación de orden. g. Cantidad de errores en una guía de ejercicios. -3- . k. Ejemplo: Promedio ponderado de un estudiante. t. etc. h. nivel de educación. i. Ejercicio: Para cada caso mencionado a continuación. indique variable y tipo: a. b2. Promedio ponderado de un egresado. Marca de refresco consumido Estado civil de una persona Escala de sueldos de una empresa Edad Calificación obtenida en un examen Salario Religión practicada por cada individuo Grado de acuerdo o desacuerdo con la política fiscal Preferencia política Cantidad de acciones vendidas diariamente en la Bolsa de Valores de Lima Temperatura registrada durante un mes Los números de la ruleta Tiempo de servicio de los empleados de una empresa Número de cheques girados diariamente en un mes Lugar de nacimiento de las personas que viven en Lima. a2. f. Puede ser medible (peso. nacionalidad. a1. u. o. Variable cuantitativa Discreta: Es aquella que se representa mediante los números naturales y no pueden tomar ningún valor entre dos consecutivos. b. q. b. l. j. Porcentaje de fallecidos por atropellos durante la última noche. b1. etc. etc. Variable cualitativa Nominal: Es aquella variable cuyos valores se expresan en categorías y se cuentan el número de observaciones pertenecientes a cada categoría. Variable Cualitativa: Son aquellas variables cuyos valores se expresan mediante palabras. etc. Ejemplo: estado civil. s. ingreso. n. c. se expresa por cualquier número real. r. por tanto. Variable Cuantitativa: Son aquellas variables cuyos valores se expresan por una cantidad. e.

de acuerdo a algunos criterios. Distrito de procedencia de los alumnos. -4- . estas tablas son conocidas como Tabla de Distribución de Frecuencias (TDF). en alguna forma simple que permita ver rápidamente todas las características posibles para obtener conclusiones útiles.Universidad Católica Sedes Sapientiae v. es indispensable organizarlos en un cuadro o tabla resumen de las observaciones originales. que permita a simple vista darse cuenta del conjunto de elementos presentados y de evidenciar sus variaciones y características. Ejemplo: GRÁFICOS ESTADÍSTICOS Un gráfico es la representación auxiliar de los datos o información estadística. TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS Cuando se tiene un conjunto de datos. Si los datos disponibles son numerosos. este debe ser expresado. Representación gráfica de una variable cualitativa Gráfico de barras simples Se representan en el eje de las abscisas las distintas modalidades de la variable y se levantan sobre ellas las barras de bases iguales y cuya altura será igual a la frecuencia absoluta o relativa correspondiente.

por medio de sectores circulares. Las medidas de tendencia central representan los fenómenos por sus valores medios. alrededor de los cuales se concentran los datos. la mediana y la moda.Es la medida de tendencia central más conocida por poseer propiedades matemáticas importantes.3% MEDIDAS DE TENDENCIA CENTRAL Los datos cuantitativos. Los cálculos de esas medidas posibilitan representar un conjunto de datos relativos a la observación de determinado fenómeno de forma resumida.8% Educación 22.2% Economía 16. También se le conoce simplemente como media o promedio. LA MEDIA ARITMÉTICA Definición. presentados en tablas y gráficos.. Pero es conveniente presentar medidas que muestren la información de manera resumida. Las principales medidas son: la media aritmética.Taller de PASW 18 7 6 6 5 5 4 4 3 3 2 1 0 Educación Eonomía Administración Contabilidad Gráfico circular o de sectores Es la representación gráfica de un conjunto de datos en un círculo. constituyen la información básica del problema.7% Administración 33. x= ∑x i =1 n i n LA MEDIANA -5- . Es utilizado principalmente cuando se pretende comparar cada valor de la variable con el total. Ejemplo: Contabilidad 27.

2. 7. generalmente la media. En general. como aquel valor que se presenta con mayor frecuencia. se define la moda (Mo) de este conjunto de valores.Dado un conjunto de n observaciones x1. como aquel valor que no es superado ni supera a más de la mitad de las n observaciones. Se expresa en las mismas unidades que los datos originales. si tiene más de dos modas se llama multimodal.Universidad Católica Sedes Sapientiae Definición.Dado un conjunto de n observaciones x1. …. 6. 4.. Procesamiento. x2. x2. 1.Cuantifica el grado de dispersión de los valores de una distribución de frecuencias respecto a su media aritmética.xn de la variable o característica x. Si tiene dos modas se llama bimodal. Se expresa en unidades (de los datos originales) elevadas al cuadrado. mayor será el valor de la varianza. La idea de dispersión se relaciona con la mayor o menor concentración de los datos en torno a un valor central. Varianza. arregladas en orden de magnitud creciente o decreciente. Establecer necesidades de la información Definición del problema y de los objetivos de la investigación. 3. se define la mediana (Me) de este conjunto de valores. Fuentes de información Planes de tabulación y de cuestionarios Diseño de la muestra Trabajo de campo. MEDIDAS DE DISPERSIÓN Una medida de tendencia central sólo proporciona una cantidad limitada de información. 5. También es conocida como desviación típica. sistematización y análisis de la información. ….. Informe Final -6- .Es la raíz cuadrada de la varianza. Si el conjunto de datos tiene una sola moda se llama unimodal. 8.xn de la variable o característica x. necesitamos una información adicional acerca de la dispersión de los datos alrededor de la medida de tendencia central. Para describir una distribución en forma más completa. N = i =1 N − µ2 Desviación Estándar. EL PROCESO DE INVESTIGACIÓN 1. 2 ∑ (x i − µ ) ∑ x i2 i =1 N N σ2 = 2.. LA MODA Definición.. Mientras mayor sean las dispersiones de las observaciones.

Taller de PASW 18 INTRODUCCIÓN AL PASW 18 1. Ejecución de SPSS en el entorno Windows Una vez que se encuentre en el entorno de trabajo Windows para ejecutar el paquete estadístico SPSS: Inicio / Programas.sav y están en formato SPSS.spo Si ejecutó desde el botón Inicio. es posible que exista un icono de acceso directo en la pantalla. 2.sps (archivos de sintaxis)  Archivos de resultados: tienen extensión . simplemente tendrá que hacer doble clic con el botón izquierdo del ratón sobre él. Otra forma sería haciendo doble clic sobre el icono correspondiente a cualquier archivo de tipo SPSS:  Archivos de datos: tienen extensión . Pasos básicos a seguir con PASW 18 -7- . En este caso para ejecutar el paquete SPSS.  Archivos de texto: tienen extensión . Si hacemos clic en Cancelar se pasa directo a la ventana Editor de Datos. aparece la presentación del programa: ./ SPSS Inc / Pasw Statistics 18 / Pasw Statistics 18 En muchas ocasiones.

• Seleccionar un procedimiento estadístico para analizar los datos con el sistema de menús o para crear un gráfico.Las filas son casos. . .Universidad Católica Sedes Sapientiae • Introducir los datos en SPSS.Abrir un archivo creado anteriormente. . Las ventanas de SPSS son las que se detallan a continuación: • Editor de datos. . Para variables cadena. LOTUS 1-2-3.spo. SPSS dará una relación de los archivos de su directorio con extensión . Seleccionar las variables para el análisis: las variables que podemos usar en cada procedimiento se muestran en un cuadro de diálogo del que se seleccionan.Introducir nuevos datos. Además de los archivos guardados en formato SPSS. Es la ventana que se abre automáticamente cuando se inicia una sesión de SPSS. Archivos de datos Para abrir un archivo de datos guardado en formato SPSS. Proporciona dos vistas de los datos: Vista de datos: muestra los valores de datos reales o las etiquetas de valor definidas: . siendo éste un valor único de una variable para cada caso. Los resultados aparecen en una ventana de resultados y se pueden guardar como archivos con extensión . . 4. En ella se muestra el contenido del archivo de datos con el que estemos trabajando.Crear una consulta mediante el asistente de captura de base de datos. . las casillas del editor de datos no pueden contener fórmulas. las casillas se convierten en valores perdidos (missing) por el sistema. Con la versión actual de SPSS (18) se puede tener más de un archivo de datos abierto al mismo tiempo.sav. Cada fila representa un caso u observación. Los gráficos se pueden modificar en la ventana del editor de gráficos. Ventanas de SPSS. seleccionar en el menú principal Archivo/ Abrir/ Datos Por defecto. A diferencia de una hoja de cálculo. Para variables numéricas. Con el editor de datos podemos crear nuevos archivos o modificar los existentes.Las columnas son variables.Ejecutar una consulta creada anteriormente.No hay casillas vacías en los límites del archivo de datos. Buscar y seleccionar el archivo que desee abrir. Es posible: . un espacio en blanco se considera un valor válido. se pueden abrir archivos de EXCEL. • • 3. Ejecutar el procedimiento y ver los resultados. dBASE y archivos delimitados por tabuladores sin necesidad de convertirlos a un formato intermedio ni de introducir información sobre la definición de los datos. -8- . Cada columna representa una variable o característica que se mide.Las casillas contienen valores numéricos o de cadena.

En este se muestran los resultados como texto normal en lugar de tablas pivote interactivas. Permite editar los resultados mostrados en las tablas pivotes de diferentes maneras. Visor de borrador. Editor de resultados de texto. gráficos y resultados estadísticos obtenidos con SPSS. . • • • • • Visor de resultados.Las filas son variables. Aquí: . -9- . Permite editar todos los gráficos y diagramas generados por SPSS. Editor de tablas pivote. En él se muestran todas las tablas.Taller de PASW 18 Vista de variables: contiene descripciones de las características de cada variable del archivo de datos. Editor de gráficos. Permite editar los resultados de texto que no aparecen en las tablas pivote.Las columnas son características de las variables.

_ o $. Además. coreano). Barra de menús. francés. inglés. ruso. tailandés) y 32 caracteres en los idiomas de dos bytes (por ejemplo. GT. Las palabras reservadas son: ALL. árabe. Informa acerca de la segmentación del archivo. • • • COMENZAR A TRABAJAR CON SPSS Creación de un archivo de datos nuevo Para crear un archivo de datos nuevo: Archivo / Nuevo / Datos. Barra de herramientas. Informa acerca de la existencia de una variable de ponderación de los casos que aparecen en el archivo de datos. Segmentado. OR. Permite crear y modificar los procesos estadísticos creados. Barra de estado. Suministra información sobre el estado en que se encuentra SPSS. Para definir una variable se pueden seguir dos procedimientos: • Haciendo doble clic con el botón izquierdo del ratón cuando el puntero del mismo se encuentra situado en la palabra var del extremo superior de la columna (en la vista de datos). Editor de procesos. ?. puntos o los símbolos @. sigue con el nombre del fichero que estamos utilizando y el nombre de la ventana activa y termina con los botones de minimizar. Ponderado. pulsar en la pestaña vista de variables. japonés. No se pueden utilizar espacios en blanco ni caracteres especiales (por ejemplo. existen un conjunto de elementos. creándose de esta forma un archivo de datos. #. ' y *). Definición de variables Una vez que nos encontramos en la ventana de edición de datos de SPSS podemos abrir un archivo de datos creado con anterioridad o crear un nuevo archivo de datos. a través de los cuales se pueden ejecutar todos los posibles comandos que proporciona el paquete. BY. español. Las palabras reservadas no se pueden utilizar como nombres de variable. Muestra el icono de SPSS que sirve como botón de control.Universidad Católica Sedes Sapientiae • • Editor de sintaxis. Los nombres de variable no pueden terminar en punto. • • . LT. LE. Sesenta y cuatro bytes suelen equivaler a 64 caracteres en idiomas de un solo byte (por ejemplo. Proporciona un acceso rápido y fácil a las tareas más comunes de cada ventana de SPSS. hebreo. comunes a todas ellas que configuran la apariencia general de SPSS: • Barra de títulos. La longitud del nombre no debe exceder los 64 bytes. En el caso en que queramos crear un archivo de datos nuevo. TO. italiano. maximizar y cerrar la ventana. WITH. dígitos. EQ. griego. Además de las distintas ventanas con las que se puede trabajar en SPSS. Recoge las denominaciones de los menús de SPSS. GE. AND. • Filtrado. chino. aporta la siguiente información acerca de los casos: 5. alemán.10 - . !. NE. Permite pegar la sintaxis de comandos de los procedimientos generados en los cuadros de diálogo. el primer paso que deberemos seguir es el de definir las variables de las que se va a constituir el archivo. El nombre debe comenzar por una letra. Informa acerca de la existencia de una selección de los casos que aparecen en el archivo de datos. Se deben evitar los nombres de variable que terminan con subrayado (para evitar conflictos con las variables creadas automáticamente por algunos procedimientos). Los demás caracteres pueden ser letras. NOT. • • Para la especificación del nombre de las variables se debe tener en cuenta: • • • • • Cada nombre de variable debe ser único.

11 - . 1. SPSS intenta dividir las líneas aprovechando los subrayados. 1. Los valores de estas variables.Taller de PASW 18 • Los nombres de variable se pueden definir combinando de cualquier manera caracteres en mayúsculas y en minúsculas. pestaña Datos) Dólar. Define una variable numérica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez. una coma para la separación de los decimales y múltiples puntos. o por el signo solamente. Notación científica. El editor de datos acepta los valores numéricos para las variables con comas o sin las comas. Si se pulsa el botón tipo y luego en los puntos suspensivos que aparecen en la casilla tenemos un cuadro de diálogo en el que se presentan los siguientes tipos de variables posibles: o o Numérico. Variable numérica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj. guiones. habrá que definir las especificaciones de la variable: • Tipo. Opciones. El exponente puede ir precedido de E o D con un signo opcional. Seleccione una plantilla de la lista desplegable. en función del tipo seleccionado serán visualizadas según un patrón determinado y sólo estarán disponibles para estas variables aquellas operaciones que son esperables para el tipo de que se trate en cada caso. esta distinción entre mayúsculas y minúsculas se conserva en lo que se refiere a la visualización. con o sin puntos. los puntos y los cambios de minúsculas a mayúsculas. 123. puntos. Por ejemplo.23+2.23D2. Fecha. El rango de siglo para los años de dos dígitos se toma de las opciones de configuración (Menú Edición. El editor de datos acepta valores numéricos para este tipo de variables. • Una vez se haya determinado el nombre de la variable. Moneda personalizada. Define una variable numérica cuyos valores se muestran con comas de separación cada tres posiciones y con un punto como separador de la parte decimal. Variable numérica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestaña Moneda del cuadro de diálogo Opciones del menú Edición. Define una variable numérica cuyos valores se muestran con puntos de separación cada tres posiciones y con una coma como separador de la parte decimal. Define una variable numérica cuyos valores contienen un signo de dólar. o incluso 1.23E+2. Puede introducir las fechas utilizando como delimitadores: barras. Especifica el tipo datos que contiene la variable. comas o espacios en blanco. El editor de datos acepta valores numéricos en formato estándar o en notación científica. Variable cuyos valores son números. Coma.23E2. o o o o o Punto. o en notación científica. 1. o en notación científica. Cuando es necesario dividir los nombres largos de variable en varias líneas en los resultados. El editor de datos acepta para estas variables valores numéricos con o sin el exponente. Los caracteres definidos en .

Se considera que son válidos todos los valores de cadena. aparecen por defecto. Sólo pueden especificarse rangos para las variables numéricas. . • • • • Valores perdidos. Variable cuyos valores no son numéricos y. . no se utilizan en los cálculos. Las etiquetas de variable pueden contener espacios y caracteres reservados que no se admiten en los nombres de variable. Si es tipo numérica. Etiqueta de variable. Se trata de valores que no son considerados a la hora de realizar determinados análisis estadísticos. Cualquier casilla en blanco de la matriz de datos. Se pueden introducir hasta tres valores perdidos (individuales) de tipo discreto. Las mayúsculas y las minúsculas son consideradas diferentes. Cadena. Especifica el número de decimales de la variable. incluidos los valores vacíos o nulos. Puede asignar etiquetas de valor descriptivas a cada valor de una variable. o • Anchura. Si la variable es tipo cadena.Del sistema. Este proceso es especialmente útil si el archivo de datos utiliza códigos numéricos para representar categorías que no son numéricas (por ejemplo. Puede asignar etiquetas de variable descriptivas de hasta 256 caracteres de longitud (128 caracteres en los idiomas de doble byte).Del usuario. Recoge una breve descripción de la variable. por defecto aparecen 0 decimales. Por defecto aparecen 8 caracteres. Decimales. por ello. 2 decimales. Los valores de datos que se especifican como perdidos por el usuario aparecen marcados para un tratamiento especial y se excluyen de la mayoría de los cálculos. Define los valores de los datos definidos como perdidos por el usuario.Universidad Católica Sedes Sapientiae la moneda personalizada no pueden emplearse para la introducción de datos pero sí los mostrará el editor de datos. También son conocidas como variables alfanuméricas. Se visualiza en vista de datos. Pueden contener cualesquiera caracteres hasta la longitud definida. acercando el cursor al nombre de la variable. a no ser que se definan explícitamente como perdidos. es posible que quiera distinguir los datos perdidos porque un encuestado se niegue a responder de los datos perdidos porque la pregunta no afecta a dicho encuestado. Existen dos tipos de valores perdidos: . Determina el número de caracteres máximo que contiene los valores de la variable.12 - . un rango de valores perdidos o un rango más un valor de tipo discreto. códigos 1 y 2 para hombre y mujer). Etiqueta de valor). Por ejemplo.

Una vez definidas las variables. Nota: Para variables de cadena ordinales. 1 = hombre. para elegir el ancho deseado para una columna y Alineación. 2 = mujer). medio y alto. bajo. 1 = bajo. Debemos pulsar en la vista de variables la casilla correspondiente a Columna. sólo tendremos que situarnos en Archivo / Guardar y el contenido del archivo se habrá guardado con el mismo nombre y ubicación donde se guardó con anterioridad. Las variables de escala deben ser numéricas. Ejercicio: . para la introducción de datos (en la pestaña vista de datos) simplemente habrá que situar el cursor en la primera celda de la columna y comenzar a digitar los distintos valores con el teclado de acuerdo con las especificaciones de cada variable definida y pulsar ENTER o moviéndonos con el cursor. 2 = medio. hemos de especificar si nos encontramos ante una variable: . En el caso en que se trate de cambios en un archivo que ya ha sido guardado con anterioridad.Taller de PASW 18 • Columna y alineación.Escala: aquélla en la que puede cuantificarse la distancia entre sus valores.Ordinal: aquélla en la que puede establecerse un determinado orden entre los valores. . categoría laboral o división de la compañía). por ejemplo la variable peso. se asume que el orden alfabético de los valores de cadena indica el orden correcto de las categorías. se puede indicar que es más fiable utilizar códigos numéricos para representar datos ordinales. Las variables nominales pueden ser valores de cadena (alfanuméricos) o numéricos que representen diferentes categorías (por ejemplo. nos situamos en Archivo /Salir . Una variable cualitativa o atributo va a tener una escala nomina u ordinal. si queremos cambiar la justificación de los datos. Por norma general. • Introducción de datos y utilización de datos ya creados. Una variable cuantitativa va a tener un nivel de medida tipo escala. 3 = alto). Las variables ordinales pueden ser valores de cadena (alfanuméricos) o numéricos que representen diferentes categorías (por ejemplo. y a continuación se cerrará la sesión de SPSS. Finalmente. para salir de SPSS. Nivel de medida de la variable. por ejemplo. la variable consumo con los valores bajo. alto. medio (orden que no es el correcto). Por ejemplo. se interpreta el orden de las categorías como alto. • - Nominal: Los valores de datos representan categorías sin un orden intrínseco (por ejemplo. Borrar algún caso o variable: Ir a un caso en el Editor de datos: Buscar un valor de datos en el Editor de datos: Guardar datos y salir de SPSS Para guardar un archivo de datos creado tendremos que situarnos en: Archivo/ Guardar como nos aparecerá un cuadro de diálogo en el cual deberemos indicar el nombre del archivo que queremos guardar. así como el lugar donde queremos guardarlo. Finalmente. medio. en una variable de cadena cuyos valores sean bajo. Insertar un nuevo caso entre los casos existentes: Insertar una nueva variable entre variables existentes: Mover variables.13 - • • • • • • • .

funciones estadísticas. y guárdalo con el nombre EDAD. 2. mujer). hombre. da los atributos necesarios..Universidad Católica Sedes Sapientiae La siguiente tabla nos muestra la edad de 48 trabajadores de una determinada empresa. la etiqueta de la nueva variable. Menú Transformar/ Calcular. 1. b) Crea una nueva variable situada entre las dos anteriores en el archivo. En la vista de variables. funciones aritméticas. funciones de distribución. teniendo en cuenta que se refiere al sueldo mensual que cobran en la empresa (en soles).SAV. Este nombre lo introduciremos en la celda Variable de destino. .. 2.14 - . funciones de variables aleatorias y funciones de valores perdidos. opcionalmente. La variable sexo es cualitativa y utilizamos una escala nominal (1. funciones de cadena. funciones lógicas. Los datos son los siguientes: Hombres 32 55 48 39 37 39 48 46 36 56 40 31 32 37 43 47 51 42 62 53 40 43 33 32 Mujeres 50 49 37 30 44 33 26 37 35 54 34 31 60 30 34 27 26 33 35 28 41 26 41 31 a) Crea un archivo con la definición anterior de las variables y los datos. Especificar el tipo de variable que queremos crear y. funciones de fecha y hora. denominada SUELDO y le das los valores que quieras. Asignar un nombre a la nueva variable. CREACIÓN O TRANSFORMACIÓN DE VARIABLES Este comando nos va a permitir crear nuevas variables o transformar las ya existentes mediante el uso de operadores aritméticos. La variable edad es cuantitativa y mostramos sus valores.

operadores aritméticos.. Al presionar dicho botón aparece un cuadro de diálogo. En Expresión numérica tendremos que escribir la expresión a través de la cual se determina los distintos valores que toma esta nueva variable. Con el botón "Si. a) Para recodificar los valores de una variable en la misma variable: Elegir los menús: Transformar/ Recodificar/ En las mismas variables.. Hacer clic en el botón "Aceptar" del cuadro de diálogo de Calcular variable.. deberemos seleccionar la opción Incluir si el caso satisface la condición y establecer la condición que ha de cumplir un determinado caso para que el valor correspondiente de la nueva variable sea calculado. definida como el doble de la edad actual.sav): Calcula una nueva variable denominada futuro. Esta nueva variable sólo deberá generarse para aquellos hombres de edad comprendida entre 20 y 45 años.. etc. Ejemplo 1: (Archivo 200. Seleccionar las variables que se deseen recodificar. deberán ser del mismo tipo (numéricas o de cadena). Seleccionar las variables que se deseen recodificar." podemos establecer una expresión condicional. sustituyendo así los valores originales. Si se seleccionan varias variables. Menú Datos / Ordenar casos. en los que no se cumpla la condición la nueva variable no tomará ningún valor y. Entonces. MANIPULACIÓN DE ARCHIVOS a) Ordenar datos Permite ordenar todos los casos de un archivo.. operadores lógicos. Esto es útil para añadir o combinar categorías en una variable. RECODIFICAR VARIABLES Permite modificar los valores de las variables recodificándolos. utilizando como criterio una o más variables. Una vez seleccionado un grupo concreto de funciones. De esta forma. deberán ser del mismo tipo (numéricas o de cadena). como resultado de ello. aparecerá en pantalla un cuadro de diálogo: . o bien generar una nueva variable. Para ello tenemos una serie de botones con dígitos del 0 al 9.15 - . En aquellos casos. Pulsar en Valores antiguos y nuevos y especificar cómo recodificar los valores. b) Para recodificar los valores de una variable en una nueva variable: Elegir los menús: Transformar/ Recodificar/ En distintas variables. seleccionaremos una función determinada.. tendremos un valor perdido del sistema. Si se seleccionan varias variables. Introducir el nombre de una (nueva variable) de los resultados para cada variable seleccionada y pulsar Cambiar. Pulsar en Valores antiguos y nuevos y especificar cómo recodificar los valores. Además. 5. tenemos un conjunto de funciones que nos permitirán realizar distintas operaciones. El resultado de la recodificación puede guardarse en la misma variable. la nueva variable sólo se calculará para aquellos casos en los cuales se cumpla la condición. 4.Taller de PASW 18 3. Finalmente haremos clic en el botón "Continuar".

Calcula a continuación las medias aritméticas de cada grupo. las varianzas y las desviaciones típicas de tal forma que aparezcan todos los resultados en una sola tabla para facilitar su comparación. Las opciones que podemos seleccionar en el cuadro de diálogo son: • Analizar todos los casos. hay dos opciones más que se activan cuando seleccionamos Comparar los grupos u Organizar los resultados por grupos: • Ordenar los archivos según variable de agrupación: El archivo es ordenado en función de los valores de las variables que aparecen en la lista Grupos basados en. a continuación. De esta manera. si queremos que los casos los ordene de menor a mayor (ascendente) o de mayor a menor (descendente). la variable o variables que se van a tener en cuenta cuando existan determinados casos que tengan para dicha variable el mismo valor. • Ejemplo 3: (Archivo 200. Asimismo. Comparar los grupos: Los resultados obtenidos tras la ejecución de un determinado procedimiento se presentan juntos para que puedan ser comparados. Menú Datos / Segmentar archivo o emplear el botón de la barra de herramientas: Segmentar un archivo es un procedimiento que crea un nuevo grupo cada vez que aparece un nuevo valor de la variable que se emplea para segmentar el archivo de datos. Sin embargo. Segmentar archivos. c) • • Finalmente. Podríamos estudiar el peso y la edad por separado en los hombres y en las mujeres. si se selecciona esta opción se dejará de realizar los distintos análisis estadísticos para cada uno de los posibles grupos en que estuviera segmentado el archivo. teniendo en cuenta el orden en que dichas variables aparecen en la lista.16 - . no crear los grupos: Analiza todos los casos juntos. . El archivo ya está ordenado: El archivo ya está ordenado por las variables que aparecen en la lista Grupos basados en.sav): Separa los datos en grupos en función de la variable sexo. Con los archivos muy grandes esta opción tiene la ventaja de que nos permite ahorrar bastante tiempo de procesamiento. habrá que especificar el "Orden de clasificación". pasando a realizarse sobre el total de casos. Por ejemplo. la variable que va a constituir el criterio de ordenación principal y.Universidad Católica Sedes Sapientiae Deberemos introducir en el cuadro "Ordenar por". Organizar los resultados por grupos: Los resultados de cada grupo se presentan por separado para cada grupo en que esté segmentado el archivo. tiene el inconveniente de que puede aparecer un gran número de grupos inútiles en el supuesto de que el archivo no esté ordenado en el orden correcto. para la variable Edad. en primer lugar. pensemos que tenemos las variables peso. Seleccionaremos esta opción cuando el archivo de datos no esté ordenado según los valores de las variables de agrupación. es decir. en un nuevo conjunto de datos o en un nuevo archivo. Este comando nos va a permitir dividir nuestro archivo de datos en distintos grupos de elementos.sav): Ordena los casos por la edad en orden ascendente y en el caso de que tengan varios encuestados la misma edad. Ejemplo 2: (Archivo 200. Menú Datos / Agregar / Variable de segmentación: /Variables agregadas: Función /Crear archivo El resultado de la agrupación puede aparecer en el archivo activo. edad y sexo. por el sexo en orden ascendente. b) Agrupar datos Esta opción permite agrupar casos basándose en los valores de una variable de agrupación y crear un nuevo archivo donde habrá un caso por cada grupo.

Muestra aleatoria de casos: Selecciona una muestra aleatoria basándose en un porcentaje aproximado del número total de casos o en un número exacto de casos. es seleccionado. Si se satisface la condición: Se establece una condición para incluir o no en la selección a cada uno de los casos. Las características de la submuestra de datos dependerán de la forma en que la hayamos escogido.17 - • • • . la opción Seleccionar casos del menú Datos nos permitirá trabajar con un subconjunto de casos o submuestra en lugar de con el total. una vez . aparecerá en pantalla un cuadro de diálogo en el que existen 5 opciones: • Todos los casos: Esta es la opción por defecto. Basándose en el rango del tiempo o de los casos: Sirve para seleccionar una muestra de sujetos adyacentes. todos los procedimientos estadísticos que realicemos serán aplicados sobre el conjunto de todos los casos. Si hemos filtrado nuestro archivo de datos de tal forma que sólo estamos considerando determinados casos y queremos de nuevo trabajar con todos los casos. Si no la cumple. Menú Datos / Seleccionar casos o pulsar el botón de la barra de herramientas: De esta forma. Si escogemos esta opción.Taller de PASW 18 d) Seleccionar submuestras de datos En definitiva. será necesario que seleccionemos esta opción. para seleccionar del elemento 5 al 15. Por ejemplo. Si un caso cumple la condición. no es seleccionado.

es posible colapsar una escala de evaluación de nueve categorías en tres categorías que representen: bajo. Crear puntos de corte. pero debe evitarse este procedimiento en lo posible. Con los archivos de datos que contengan un gran número de casos. Los casos no seleccionados serán borrados de forma permanente de la ventana Ejemplo 4: Selecciona aquellas mujeres que tengan una edad comprendida entre 25 y 45 años (¡¡¡no elimines los casos no seleccionados!!!). puede utilizar una variable de escala con el peso para crear una variable categórica nueva que contenga intervalos de peso. haríamos clic en el botón Rango y. puesto que asume que los valores de los datos representan algún tipo de orden lógico que puede ser utilizado para agrupar los valores con sentido. puede limitar la cantidad de casos que se van a explorar. Transformar/ Agrupación Visual/ Seleccionar la variable numérica de escala u ordinales para la que se desea crear nuevas variables categóricas (por ej.Universidad Católica Sedes Sapientiae seleccionada esta opción. Usar variable de filtro: Utiliza como variable para el filtrado la variable escogida del archivo de datos. Aplicar. ya que influirá en la distribución de los valores que serán utilizados en los cálculos posteriores en la Agrupación Visual. en el nuevo cuadro de diálogo teclearíamos 5 como Primer caso y 15 como Último caso. e) AGRUPACIÓN VISUAL La agrupación visual está diseñada para ayudar a "categorizar" datos de escala en rangos categóricos (por ejemplo. Poner el nombre a la nueva variable (xpeso) 3. GENERANDO ANÁLISIS DESCRIPTIVOS CON SPSS Tablas de Frecuencia Simples (Para variables discretas con pocos valores distintos y atributos) Procedimiento: Analizar / Estadísticos descriptivos / Frecuencias. Se seleccionan todos los casos que tomen para dicha variable un valor distinto de cero o que no sean valores perdidos del sistema.18 - . Aceptar. Hay tres opciones: a) Generar intervalos de la misma amplitud b) A través de percentiles c) A través de puntos de corte en la media y en desviaciones típicas seleccionadas 4. Como alternativa. Como resultado de esta operación aparecerá el cuadro de diálogo Frecuencias: . posteriormente. • Colapsar un número elevado de categorías ordinales en un conjunto menor de categorías. basado en la agrupación de los valores contiguos de las variables existentes para dar lugar a un número limitado de categorías diferentes. La Agrupación Visual requiere que las variables sean numéricas. Determina la media aritmética y desviación típica de la variable Edad. peso). edad en rangos de 10 años). medio y alto. Poner etiqueta a los intervalos que van a crearse. 5. Por ejemplo. Nota: Las variables de cadena no se muestran en la lista de variables origen. 2. El procedimiento: 1. la limitación del número de casos que se va a explorar puede ahorrar tiempo. Por ejemplo. Su objetivo es el de ayudar en el proceso de creación de variables nuevas. Puede utilizarse para: • Crear variables categóricas a partir de variables de escala continuas. • El resultado puede ser: • • • Los casos no seleccionados son descartados (aparecen tachados) Los casos seleccionados se copian en un nuevo conjunto de datos.

SALARIOS1. GRÁFICOS Nos proporcionan una idea del comportamiento global de una determinada variable. Igualmente. en la que se introducirán los valores de las frecuencias o ponderaciones de cada uno de los valores de la variable que se desee ponderar. hay que crear una nueva variable categórica a partir de la variable de interés. medio y alto. para crear una variable categórica nueva que contenga intervalos de peso. Ponderaciones En algunos casos se dispone de los datos ya tabulados. como el peso. nos podemos encontrar con una variable ponderada por una serie de valores de ponderación que tienen que coincidir necesariamente con las frecuencias absolutas o relativas de la variable. sino que será suficiente con ponderar los distintos valores de la variable con sus frecuencias absolutas o relativas.Taller de PASW 18 Habrá que seleccionar en el recuadro de la izquierda. Después seleccionar la opción Mostrar tablas de frecuencias y pulsar el botón Aceptar. antes de acceder al menú de Frecuencias (como en el caso anterior). Colapsar un número elevado de categorías ordinales en un conjunto menor de categorías. haciendo un clic en la flecha azul situada entre estos los dos recuadros. de modo que la elaboración de una tabla de frecuencias con SPSS no será necesaria. el primer paso que se debe seguir es crear una variable de tipo numérica mediante los procedimientos expuestos en el tema anterior que denominaremos frecuencia o ponderación según los casos.19 - . que contenga los intervalos. la variable o variables de las cuales se desee elaborar la tabla de frecuencias y desplazarla al recuadro de Variables. El cuadro de dialogo de la agrupación visual permite: • Crear variables categóricas a partir de variables de escala continuas. Por ejemplo. El visor de resultados de SPSS mostrará la tabla de frecuencias que se ha elaborado. Por ejemplo. por ejemplo. Para ponderar una variable. es posible colapsar una escala de evaluación de nueve categorías en tres categorías que representen: bajo. le damos nombre a la nueva variable que vamos a crear. . puede utilizar una variable de escala. Además nos aparece el valor mínimo y máximo de la variable. Para la introducción de estos datos en el editor de datos de SPSS no es necesario repetir un mismo valor tantas veces como indique su frecuencia absoluta. El SPSS nos proporciona una amplia gama de representaciones gráficas. • Una vez seleccionada la variable de interés (ej: salarios). Para ello utilizaremos la opción vista ya Transformar / Agrupación visual. Tablas de Frecuencia con datos agrupados en intervalos (para variables continuas o discretas con muchos valores distintos) Para la elaboración de tablas de frecuencias con datos agrupados en intervalos.

En primer lugar. La altura de cada barra será por defecto igual a la media aritmética de todos los valores que toma dicha variable1. Veamos algunos ejemplos: Gráficos > Cuadros de diálogo antiguos Este menú nos brinda la posibilidad de generar una gran gama de representaciones gráficas. los siguientes aspectos: . Los segmentos de cada barra representan categorías de la variable apilada. pulsamos en el botón "Definir" del cuadro de diálogo. Entonces. • Valores individuales de los casos: Se resume una única variable. deberemos seleccionar alguna de las siguiente opciones: • Simple: Generará una barra distinta para cada uno de los valores de la variable o para cada una de las modalidades del atributo. al utilizar determinados procedimientos estadísticos del SPSS (del menú Analizar) que incluyen gráficos relacionados con la técnica seleccionada.: Nos va a permitir crear 3 clases distintas de diagramas de barras.20 - . entre otros. surgirá en pantalla un cuadro de diálogo que incluye. o bien indirectamente.. Cada barra representa un caso individual. • Resúmenes para distintas variables: Se resumen dos o más variables. Cada barra representa una de las variables. • Apilado: Crea un gráfico en el que los segmentos de barras aparecen apilados unos sobre otros. Una vez elegido el tipo de gráfico y de datos. Aparece una barra para cada valor de la variable de eje de categorías. En relación con el cuadro "Los datos del gráfico son".Universidad Católica Sedes Sapientiae Para obtenerlas tenemos varias alternativas: bien directamente usando el menú Gráficos. el significado de las opciones se detalla a continuación: • Resúmenes para grupos de casos: Se resumen las categorías (valores o modalidades) de una sola variable o atributo. Describiremos algunas de ellas: • Barras.. La altura de cada barra viene determinada por el valor que toma la variable que está siendo representada en cada caso individual. • Agrupado: Crea un gráfico que resume las categorías de una variable dentro de las categorías de otra variable.

que también se denominan diagramas de tarta o de pastel.Taller de PASW 18 • En el cuadro "Las barras representan" tendremos que indicar si queremos representar frecuencias absolutas.: El programa SPSS nos permite generar 3 tipos distintos de gráficos de líneas. existen varias alternativas: a) Menú: Analizar > Estadísticos descriptivos > Descriptivos: Introducimos la/s variable/s para las que queremos calcular estas medidas. • Líneas.. Varianza. También podemos calcular algún percentil específico introduciendo el número que queremos calcular en el cuadro de Percentiles y pulsando Añadir. Las opciones ya han sido explicadas anteriormente en el diagrama de barras. Medidas de forma: con ellas podemos estudiar la asimetría y curtosis.. Máximo y Error tipo de la media (es una estimación de la variabilidad muestral de la media). eliminando los valores perdidos). • Sectores. la opción "Los valores son puntos medios de grupos" calcula los estadísticos del valor percentil y la mediana bajo el supuesto de que sus datos han sido agrupados y que los valores . Moda y Suma (es la suma de los valores de todos los casos para una determinada variable. • • • Finalmente. el tipo de gráfico de líneas que se quiere llevar a cabo. aparecerá en pantalla un cuadro de diálogo que nos ofrece algunos de los estadísticos vistos en teoría. Múltiple: Gráfico que permite comparar la distribución de valores entre diferentes grupos. Analizar > Estadísticos descriptivos > Frecuencias: Introducimos en el cuadro "Variable" las variables sobre las cuales queremos calcular estas medidas. Distribución: Podemos calcular los índices de asimetría y curtosis. Para ello habrá que seleccionar alguna de las tres opciones siguientes: • • • Simple: Gráfico que muestra una sola línea.. la desviación típica y el rango o recorrido. y por defecto presenta los valores que dividen a la distribución en 10 grupos de igual tamaño (deciles). Los marcadores vendrán definidos por otra variable distinta. Medidas de dispersión: El programa SPSS nos proporciona las siguientes: la varianza. De esta manera.. Mediana. Tendencia central: Podemos seleccionar entre Media.21 - .: Empleando esta opción podremos generar diagramas de sectores. Rango. la mediana y la moda. Puede modificarse el nº de grupos introduciendo otro valor entre 2 y 100 (centiles). Hay que establecer. La opción "Guardar valores tipificados como variables" genera una/s variable/s en la ventana Editor de datos que contiene/n los valores tipificados de las variable/s que hayamos situado en el cuadro "Variables". Mínimo. Lo normal será escoger "Resúmenes para grupos de casos" dado que esta opción genera un gráfico en el que cada sector representa al porcentaje de valores de una determinada categoría. ESTADÍSTICOS DESCRIPTIVOS El programa SPSS nos da la posibilidad de estudiar las características de las variables que estemos analizando a través del cálculo de las siguientes medidas: • • • Medidas de tendencia central: Entre ellas cabe destacar: la media aritmética. Dispersión: En este cuadro encontramos: Desviación Típica. b) Menú. Para proceder al cálculo de estas medidas. porcentajes u otra función resumen. en el cuadro “Variables” y pulsamos “Opciones”. • En el cuadro "Eje de categorías" debemos elegir la/s variable/s que vamos a representar. surgirá en pantalla un cuadro de diálogo: • Valores percentiles: Podemos calcular los cuartiles y percentiles. Damos a Estadísticos. en primer lugar. Líneas verticales: Gráfico que presenta líneas verticales que conectan los marcadores dentro de cada categoría. De esta forma.

seleccione esta opción para estimar la mediana y los percentiles para los datos originales no agrupados.Universidad Católica Sedes Sapientiae presentes en los datos son puntos medios de los grupos. Por ejemplo. si las edades de todas las personas entre treinta y cuarenta años se codifican como 35.22 - . .