Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) o Autora: Dra.

Josefa Mar´n Fern´ ndez ı a Departamento de Estad´stica e Investigaci´ n Operativa ı o Facultad de Matem´ ticas a Universidad de Murcia Junio de 2004

1

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

2

´ Indice de contenidos
1. Normas generales de SPSS. Gesti´ n de ficheros, casos y variables o 1.1. Introducci´ n . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 1.2. Barra de men´ s . . . . . . . . . . . . . . . . . . . . . . . . . . u 1.3. Presentaci´ n de nuestro ejemplo . . . . . . . . . . . . . . . . . o 1.4. Definici´ n de la primera variable de nuestro ejemplo . . . . . . o 1.5. Grabaci´ n de ficheros de datos . . . . . . . . . . . . . . . . . . o 1.6. Definici´ n del resto de las variables de nuestro ejemplo . . . . . o 1.7. Introducci´ n de los datos a trav´ s del teclado . . . . . . . . . . o e 1.8. Lectura de ficheros de datos propios de SPSS . . . . . . . . . . 1.9. Edici´ n y modificaci´ n de los datos . . . . . . . . . . . . . . . o o 1.10. Modificaci´ n de la apariencia del editor de datos . . . . . . . . o 1.11. Impresi´ n de los datos . . . . . . . . . . . . . . . . . . . . . . o 1.12. Importaci´ n de ficheros de datos . . . . . . . . . . . . . . . . . o 1.13. Transformaci´ n de variables . . . . . . . . . . . . . . . . . . . o 1.13.1. Modificaci´ n sin utilizar el condicional . . . . . . . . . o 1.13.2. Modificaci´ n condicional de variables . . . . . . . . . . o 1.13.3. Clasificaci´ n, codificaci´ n o categorizaci´ n de variables o o o 1.13.4. Clasificaci´ n autom´ tica de variables . . . . . . . . . . o a 1.13.5. Ordenaci´ n de los resultados de una variable . . . . . . o 1.13.6. Ordenaci´ n por rangos . . . . . . . . . . . . . . . . . . o 1.13.7. Otras modificaciones . . . . . . . . . . . . . . . . . . . 1.14. Ordenaci´ n de los casos (filas) . . . . . . . . . . . . . . . . . . o 1.15. Ponderaci´ n de los casos . . . . . . . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 4 5 5 6 9 10 14 15 15 17 17 18 18 19 21 22 23 24 25 26 26 27 29 29 29 29 30 30 31 32 32 34 36 36 38 39 43 48 49 50 51 52 52 53 53 54 56 58

2. Estad´stica descriptiva unidimensional ı 2.1. Distribuci´ n de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 2.2. Observaciones sobre la presentaci´ n, modificaci´ n y grabaci´ n de los resultados en la ventana del visor de o o o SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1. C´ mo guardar y recuperar una ventana del visor de resultados de SPSS . . . . . . . . . . . . . . o 2.2.2. C´ mo controlar la visualizaci´ n de la informaci´ n sobre variables y valores de datos en las tablas o o o pivote y en los titulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.3. C´ mo establecer el aspecto de las tablas pivote por defecto . . . . . . . . . . . . . . . . . . . . . o 2.2.4. C´ mo cambiar las especificaciones del visor de resultados de SPSS por defecto . . . . . . . . . . o 2.3. Medidas descriptivas de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1. Mediante la opci´ n Analizar ⇒Estad´sticos descriptivos ⇒Frecuencias . . . . . . . . . . . . . o ı 2.3.2. Mediante la opci´ n Analizar ⇒Estad´sticos descriptivos ⇒Descriptivos . . . . . . . . . . . . . o ı 2.3.3. Mediante la opci´ n Analizar ⇒Estad´sticos descriptivos ⇒Explorar . . . . . . . . . . . . . . . o ı 2.4. Representaciones gr´ ficas unidimensionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a 2.4.1. C´ mo cambiar las especificaciones de las representaciones gr´ ficas por defecto . . . . . . . . . . o a ´ 2.4.2. Creaci´ n de diagramas de barras, l´neas, areas y sectores . . . . . . . . . . . . . . . . . . . . . . o ı ´ 2.4.3. Edici´ n y modificaci´ n de diagramas de barras, l´neas, areas y sectores . . . . . . . . . . . . . . o o ı 2.4.4. Creaci´ n de histogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 2.4.5. Edici´ n y modificaci´ n de histogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o o 2.4.6. Otras funciones sint´ ticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 2.4.7. Cuadro de di´ logo de T´tulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a ı 2.4.8. Cuadro de di´ logo de Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a 2.4.9. Sobre la Plantilla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3. Relaci´ n entre dos variables o 3.1. Relaci´ n entre variables cuantitativas. Diagrama de dispersi´ n o o 3.2. Edici´ n y modificaci´ n del diagrama de dispersi´ n . . . . . . o o o 3.3. Correlaci´ n simple . . . . . . . . . . . . . . . . . . . . . . . o 3.4. Regresi´ n lineal . . . . . . . . . . . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

3

4. Probabilidad. Variables aleatorias 4.1. Funci´ n de distribuci´ n (probabilidad acumulada) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o o 4.2. Inversa de la funci´ n de distribuci´ n (percentiles o cuantiles) . . . . . . . . . . . . . . . . . . . . . . . . o o 5. Contrastes param´ tricos e 5.1. Contraste para una media. Intervalo de confianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2. Comparaci´ n de dos medias con muestras independientes . . . . . . . . . . . . . . . . . . . . . . . . . . o 5.2.1. Ejemplo de edici´ n de unos datos para hacer la comparaci´ n de dos medias con muestras indepeno o dientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3. Comparaci´ n de dos medias con muestras relacionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . o 6. Contrastes no param´ tricos e 6.1. Contraste sobre una proporci´ n . . . . . . . . . . . . . . . . . . . . . . . . . o 6.2. Contraste χ2 de Pearson sobre proporciones . . . . . . . . . . . . . . . . . . 6.3. Contraste χ2 sobre independencia de dos variables . . . . . . . . . . . . . . 6.3.1. Ejemplo de edici´ n de una tabla de contingencia en el editor de datos o 6.4. Contraste de las rachas sobre aleatoriedad de la muestra . . . . . . . . . . . . 6.5. Contraste de Kolmogorov–Smirnov sobre bondad de ajuste. Normalidad . . . 6.6. Contraste de homogeneidad con 2 muestras independientes . . . . . . . . . . 6.7. Contraste de homogeneidad con m´ s de dos muestras independientes . . . . . a 6.8. Contraste de homogeneidad con 2 muestras relacionadas . . . . . . . . . . . 6.9. Contraste de homogeneidad con m´ s de dos muestras relacionadas . . . . . . a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61 61 63 66 66 67 69 70 73 73 73 75 78 79 80 80 82 83 85

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

4

1.
1.1.

Normas generales de SPSS. Gesti´ n de ficheros, casos y variables o
Introducci´ n o

Las pr´ cticas se van a realizar con el programa SPSS para Windows, versi´ n 11.0 (en espa˜ ol). Para ejecutar el a o n programa debemos seleccionar Inicio ⇒Programas ⇒SPSS 11.0 para Windows. La primera vez que se ejecuta el programa aparece la ventana de la Figura 1, en la que es conveniente marcar la opci´ n No volver a mostrar este cuadro de di´ logo. As´, o a ı

Figura 1: Ventana inicial de SPSS 11.0 para Windows

cuando volvamos a ejecutar el programa SPSS para Windows lo primero que aparecer´ ser´ la ventana b´ sica de esta a a a aplicaci´ n, o para ser m´ s precisos, la ventana del editor de datos (Figura 2). Como en cualquier otra aplicaci´ n Windows, o a o

Figura 2: Ventana del editor de datos

la ventana del editor de datos puede modificarse en cuanto al tama˜ o y a la disposici´ n de sus elementos. Se trata de una n o ventana t´pica de una aplicaci´ n Windows que, de arriba a abajo, consta de los siguientes elementos: ı o En la primera l´nea aparece la barra de t´tulo con el men´ de control, el nombre de la ventana y los botones de ı ı u minimizar, maximizar y cerrar. En la segunda l´nea est´ la barra de menus con los 10 men´ s que luego comentaremos. ı a ´ u La tercera l´nea es la barra de herramientas donde, mediante botones con iconos, se representan algunas de las opı eraciones m´ s habituales. Si pasamos el puntero del rat´ n por cualquiera de ellos, aparecer´ en la pantalla un texto a o a indicando la funci´ n que se activa. Esta barra es personalizable. o

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

5

´ Despu´ s aparece la l´nea de edicion de datos que, a su vez, est´ dividida en dos partes, como posteriormente veremos. e ı a

El grueso de la ventana est´ ocupado por dos “carpetas”. La que habitualmente aparece encima es la carpeta denoma inada Vista de datos y la que habitualmente aparece debajo es la carpeta denominada Vista de variables. Posteriormente veremos c´ mo editar y modificar estas carpetas; es decir, c´ mo editar y modificar los datos, y c´ mo definir las o o o variables. Vista de datos: Muestra los valores de datos reales o las etiquetas de valor definidas. Vista de variables: Muestra la informaci´ n de definici´ n de variable, que incluye las etiquetas de la variable definio o da y de valor, tipo de dato (por ejemplo, de cadena, fecha y num´ rico), escala de medida (nominal, ordinal o e de escala) y los valores perdidos definidos por el usuario. En ambas vistas, se puede a˜ adir, modificar y eliminar la informaci´ n contenida en el archivo de datos. n o ´ La ultima l´nea de la ventana (de arriba a abajo) es la barra de estado, en la que el sistema proporciona diversos ı mensajes. Esta barra est´ dividida en varias zonas de avisos. La primera est´ reservada para informaciones de tipo a a general y en la segunda aparece lo relativo al procesador de SPSS. Cuando no hay operaci´ n en marcha aparece el o mensaje El procesador est´ preparado. En caso contrario aparecer´ el nombre del comando que en ese momento se a a est´ ejecutando e informaci´ n adicional como, por ejemplo, el n´ mero de casos procesados. e o u

1.2.

´ Barra de menus

A continuaci´ n se da un resumen de lo que se puede encontrar en la barra de menus: o ´ Archivo: Mediante este men´ se pueden abrir, crear o grabar los diferentes ficheros que SPSS emplea, ya sean de datos, u instrucciones, resultados o procesos. Igualmente, es posible controlar las tareas de impresi´ n. o Edici´ n: Permite realizar las tareas habituales de edici´ n: modificar, borrar, copiar, pegar, seleccionar, etc. o o Ver: Permite controlar diversos par´ metros de visualizaci´ n en pantalla. a o Datos: Este men´ permite insertar variables, as´ como efectuar modificaciones en los ficheros de datos: seleccionar, a˜ adir, u ı n ponderar, etc. Transformar: Aqu´ se encuentran todas las opciones relativas a la modificaci´ n y generaci´ n de nuevas variables. ı o o Analizar: Mediante este men´ se accede a los diferentes an´ lisis estad´sticos que se pueden realizar con los datos. u a ı Gr´ ficos: Permite la creaci´ n y edici´ n de diversos tipos de gr´ ficos de alta resoluci´ n. Algunos de ellos son tambi´ n a o o a o e accesibles a trav´ s de determinadas t´ cnicas estad´sticas. e e ı Utilidades: Entre otras, posibilita mostrar informaci´ n sobre los ficheros de SPSS, las variables o el tratamiento de cono juntos de variables. Ventana: Dispone de las funciones habituales para controlar las ventanas. ?: Proporciona ayuda al usuario en el formato t´pico de Windows. ı Para salir del programa se selecciona la opci´ n Archivo ⇒Salir o se pulsa el bot´ n de la esquina superior derecha de la o o ventana ( bot´ n × ). o

1.3.

Presentaci´ n de nuestro ejemplo o

Para ilustrar las cuestiones que se van a ir discutiendo a lo largo de las pr´ cticas, utilizaremos el conjunto de datos de a la Figura 3, que se refieren al estudio de diversas variables en una muestra de libros de una biblioteca universitaria. De momento no introduciremos ning´ n dato; s´ lo leeremos lo concerniente al fichero de datos que posteriormente crearemos. u o Las variables son: materia (disciplina cient´fica a la que pertenece el libro); precio (en euros); entrada (fecha de entrada del ı libro en la biblioteca); altura (en cent´metros); peso (en gramos); pr´ stamo (n´ mero de veces que se ha prestado el libro ı e u ´ ´ en el ultimo a˜ o); y las tres ultimas corresponden a la opini´ n de tres expertos respecto de la encuadernaci´ n de los libros n o o (1=muy mala, 2=mala, 3=regular, 4=buena, 5=muy buena).

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

6

Figura 3: Datos que, posteriormente, vamos a introducir y grabar con el nombre Libros.sav

1.4.

Definici´ n de la primera variable de nuestro ejemplo o

Antes de introducir los datos, tenemos que definir las variables. Para explicar este apartado vamos a hacer la definici´ n o de la primera de las variables de nuestro ejemplo. Esta primera variable es la disciplina cient´fica a la que pertenece cada ı libro y la denominaremos materia. Se trata de una variable cualitativa nominal. Para facilitar la introducci´ n de los resulo tados de esta variable vamos a codificarla de la siguiente forma: E=estad´stica, G=geograf´a, I=inform´ tica, L=literatura, ı ı a H=historia. Para definirla seguimos los siguientes pasos: Seleccionamos la carpeta Vista de variables haciendo clic en su correspondiente pesta˜ a (parte inferior del editor de n datos). Nos aparece, entonces, la ventana de la Figura 4.

Figura 4: Vista de variables

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

7

En la casilla intersecci´ n de la fila correspondiente a nuestra variable (fila 1) con la columna correspondiente a o Nombre escribimos el nombre de nuestra primera variable, que es, como ya hemos dicho, materia Para los nombres de variable se aplican las siguientes normas: • El nombre debe comenzar por una letra. Los dem´ s caracteres pueden ser letras, d´gitos, puntos o los s´mbolos a ı ı ´ @, #, o < • Los nombres de variable no pueden terminar en punto. • Se deben evitar los nombres de variable que terminan con subrayado (para evitar conflictos con las variables creadas autom´ ticamente por algunos procedimientos). a • La longitud del nombre no debe exceder de los ocho caracteres. • No se pueden utilizar espacios en blanco ni caracteres especiales (por ejemplo, !, ?, ’ y *). ´ • Cada nombre de variable debe ser unico. • Los nombres de variable no distinguen may´ sculas de min´ sculas. u u En la carpeta Vista de Variables (Figura 4) hacemos clic en la parte derecha de la casilla intersecci´ n de la fila correo spondiente a nuestra variable (fila 1) con la columna correspondiente a Tipo. Aparece, entonces, el cuadro de di´ logo a de la Figura 5. Aqu´ se especifica el tipo de datos de cada variable. Por defecto se asume que todas las variables ı

Figura 5: Cuadro de dialogo para definir el tipo de variable

nuevas son num´ ricas. Se puede utilizar esta opci´ n para cambiar el tipo de datos. El contenido de este cuadro de e o di´ logo depende del tipo de datos seleccionado. Para algunos tipos de datos, hay cuadros de texto para el ancho y el a n´ mero de decimales; para otros, simplemente se puede seleccionar un formato de una lista desplegable de ejemplos. u Los tipos de variables disponibles son: Num´ rica: En este formato, la separaci´ n decimal se hace mediante una coma (abajo). En la anchura de los datos e o cuenta el signo (+ o -), si es que lo vamos a poner, y cuenta la coma de la separaci´ n decimal. o Coma: Se emplea cuando queremos que la coma sea el separador de los miles y el punto el separador de los decimales. Punto: Se emplea cuando se quiere que el punto sea el separador de los miles y la coma el separador de los decimales. Notaci´ n cient´fica: Los valores de la variable se muestran con una E (o una D) intercalada y un exponente con o ı signo que representa una potencia de base diez. El editor de datos acepta para estas variables valores num´ ricos e con o sin el exponente. El exponente puede aparecer precedido por una E o una D con un signo opcional, o bien s´ lo por el signo. En este formato 347E-5 significa 347 multiplicado por 10 elevado a -5; es decir, o 1 347 × 10−5 = 347 × 100000 = 0 00347. Por ejemplo, es lo mismo 123; 1,23E2; 1,23D2; 1,23E+2 e incluso 1,23+2. Fecha: Mediante este formato es posible introducir las variables temporales. Comentaremos m´ s sobre este tipo a cuando definamos la variable entrada. D´ lar: A un valor num´ rico dado se le a˜ ade el s´mbolo del d´ lar en los diferentes formatos que aparecen en la o e n ı o ventana desplegable.
´ Moneda personalizada: Si a trav´ s de la opci´ n Edicion ⇒Opciones ⇒Carpeta de Moneda de la barra de men´ s se e o u han creado formatos espec´ficos para este tipo de variables, mediante esta opci´ n se puede elegir uno de ellos. ı o

´ Cadena: Variable cuyos resultados no son num´ ricos. En su definici´ n debe especificarse unicamente su longitud e o m´ xima. Con este tipo de variables, y a diferencia de lo que ocurr´a con los nombres de las variables, s´ hay a ı ı diferencia entre emplear may´ sculas o min´ sculas u u

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

8

En nuestro ejemplo (definici´ n de la variable materia), activamos Cadena del cuadro de di´ logo (Figura 5), ya que o a los resultados de esta variable no son num´ ricos. Al lado de Caracteres indicamos un 1, pues los resultados tienen e ´ una longitud de un s´ lo d´gito (E, G, I, L o H). Pulsamos el bot´ n Aceptar para volver a la Vista de Variables (Figura o ı o 4). En la carpeta Vista de Variables (Figura 4) nos situamos en la casilla intersecci´ n de la fila correspondiente a nuestra o variable (fila 1) con la columna correspondiente a Etiqueta para escribir una explicaci´ n de la variable, que, en el caso o de nuestra variable materia podr´a ser disciplina cient´fica del libro. ı ı Aunque los nombres de variable s´ lo pueden tener un m´ ximo de 8 caracteres, las etiquetas de variable pueden tener o a hasta 256 caracteres. No s´ lo se puede poner una explicaci´ n o etiqueta al nombre de la variable sino tambi´ n a cada uno de sus valores o o o e ´ resultados. Esto es particularmente util si el archivo de datos utiliza c´ digos num´ ricos para representar categor´as o e ı no num´ ricas (por ejemplo, los c´ digos 1 y 2 para hombre y mujer). Las etiquetas de valor pueden tener una longitud e o m´ xima de 60 caracteres. a Para poner etiquetas a los resultados de la variable materia, en la carpeta Vista de Variables (Figura 4) hacemos clic en la parte derecha de la casilla intersecci´ n de la fila correspondiente a nuestra variable (fila 1) con la columna o correspondiente a Valores. Aparece, entonces, el cuadro de di´ logo de la Figura 6. a

Figura 6: Cuadro de dialogo para definir etiquetas de valores

A continuaci´ n, junto a Valor escribimos el primero de los resultados de la variable materia (por ejemplo, E) y junto o a Etiqueta de valor escribimos lo que le corresponde (estad´stica). Despu´ s pulsamos el bot´ n Anadir con lo que la ı e o ˜ declaraci´ n queda incorporada a la lista. Se hace lo mismo con el resto de los valores (ver, otra vez, la Figura 6). o Una vez finalizado el proceso se pulsa Aceptar. En la Figura 3 del apartado 1.3 podemos ver que para el libro n´ mero 25 no se sabe el resultado de la variable u materia. Esto significa que dicho resultado es un valor perdido o ausente. En SPSS tenemos la posibilidad de definir ´ los valores de los datos especificados como perdidos por el usuario. A menudo es util para saber por qu´ se pierde e informaci´ n. Por ejemplo, puede desear distinguir los datos perdidos porque un entrevistado se niega a responder, o o datos perdidos porque la pregunta no afectaba a dicho entrevistado. Los valores de datos especificados como perdidos por el usuario aparecen marcados para un tratamiento especial y se excluyen de la mayor´a de los c´ lculos. ı a Nosotros vamos a representar los valores perdidos de nuestra variable materia por un asterisco (*). Para ello, en la carpeta Vista de Variables (Figura 4) hacemos clic en la parte derecha de la casilla intersecci´ n de la fila correspondio ente a nuestra variable (fila 1) con la columna correspondiente a Perdidos y nos aparece el cuadro de di´ logo de la a Figura 7. En dicho cuadro de di´ logo debemos se˜ alar la opci´ n Valores perdidos discretos y dentro del primer campo a n o

Figura 7: Cuadro de dialogo para definir los valores perdidos de una variable

escribir un asterisco (*). A continuaci´ n pulsamos el bot´ n Aceptar. o o • Se pueden introducir hasta tres valores perdidos (individuales) de tipo discreto, un rango de valores perdidos o un rango m´ s un valor de tipo discreto. a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

9

• S´ lo pueden especificarse rangos para las variables num´ ricas. o e • No se pueden definir los valores perdidos para variables de cadena larga (variables de cadena cuyos resultados tengan m´ s de 8 caracteres). a • Para las variables de cadena, se considera que son v´ lidos todos los valores de cadena, incluidos los valores a vac´os o nulos, a no ser que se definan expl´citamente como perdidos. Para definir como perdidos los valores ı ı vac´os o nulos de una variable de cadena, se escribe un espacio en blanco en uno de los campos de Valores ı perdidos discretos. En la carpeta Vista de Variables (Figura 4) tenemos la opci´ n de cambiar el formato de columna de la variable. Esto o se refiere al n´ mero de d´gitos necesarios para que en la matriz de datos se vean tanto los resultados de la variable u ı como el nombre de dicha variable. En el caso de la variable materia sus resultados tienen un s´ lo d´gito pero su o ı nombre ocupa 7 d´gitos. Por tanto, debemos poner un formato de columna igual o mayor que 7. Nosotros pondremos ı 7. Para ello, hacemos clic en la parte derecha de la casilla intersecci´ n de la fila correspondiente a nuestra variable o con la columna correspondiente a Columnas y vemos que aparecen unas peque˜ as flechas grises que nos sirven para n aumentar o disminuir el n´ mero de d´gitos. Por defecto, se nos ofrecen 8 d´gitos. Nosotros bajaremos a 7, pulsando u ı ı una vez la flecha que indica hacia abajo. Con esta opci´ n se controla el ancho de columnas en la carpeta Vista de datos. Los anchos de columna tambi´ n se o e pueden cambiar en dicha carpeta pulsando y arrastrando los bordes de la columna. Los formatos de columna afectan s´ lo a la presentaci´ n de valores en la mencionada carpeta. Al cambiar el ancho de columna no se cambia el ancho o o de una variable, definido en Tipo. Si el ancho real de un valor es m´ s ancho que la columna, aparecer´ n asteriscos a a (*) en la carpeta Vista de datos.
´ La opci´ n se˜ alada como Alineacion en la carpeta Vista de Variables (Figura 4) controla la presentaci´ n de los valores o n o de los datos y/o de las etiquetas de valor en la Vista de datos. La alineaci´ n por defecto es derecha para las variables o num´ ricas e izquierda para las variables de cadena. Esta configuraci´ n afecta s´ lo a la presentaci´ n en la Vista de e o o o datos.

Si queremos, por ejemplo, que los resultados de nuestra variable materia aparezcan alineados a la derecha, entonces en la carpeta Vista de Variables (Figura 4) hacemos clic en la parte derecha de la casilla intersecci´ n de la fila correo ´ spondiente a nuestra variable con la columna correspondiente a Alineacion. Aparece, entonces, una peque˜ a flecha n gris que, al pulsar, nos ofrece las tres opciones: Izquierda, Derecha, Centrado; de las cuales elegimos Derecha. La opci´ n se˜ alada como Medida en la carpeta Vista de Variables (Figura 4) se refiere al tipo de variable: Escala=variable o n cuantitativa (discreta o continua), Nominal=cualitativa nominal, u Ordinal=cualitativa ordinal. Para se˜ alar que nuestra variable materia es cualitativa nominal, en la carpeta Vista de Variables (Figura 4) hacen mos clic en la parte derecha de la casilla intersecci´ n de la fila correspondiente a nuestra variable con la columna o correspondiente a Medida. Aparece, entonces, una peque˜ a flecha gris que, al pulsar, nos ofrece las tres opciones n mencionadas, de las cuales elegimos Nominal. En esta variable no se ofrece la posibilidad de elegir Escala debido a que ya se ha se˜ alado que la variable es de tipo Cadena, es decir, cualitativa. n

1.5.

Grabaci´ n de ficheros de datos o

Figura 8: Cuadro de di´ logo para grabar un fichero de datos a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

10

Aunque s´ lo hemos definido una variable y ni siquiera hemos introducido sus resultados, si no queremos perder el o trabajo realizado hasta ahora (debido a un corte de electricidad o cualquier otra causa), podemos grabar el que ser´ nuestro a fichero de datos denominado Libros.sav Si de la barra de men´ s se selecciona la opci´ n Archivo se observa que hay dos opciones para la grabaci´ n de ficheros u o o de datos: Guardar y Guardar como. Al igual que en otras muchas aplicaciones Windows, la opci´ n Guardar sirve para grabar un fichero de datos que ya o ´ estaba previamente grabado, con las modificaciones introducidas desde la ultima vez que se grab´ . Las modificaciones o que se introduzcan en una sesi´ n en un fichero de datos s´ lo tienen efecto durante esa sesi´ n, y al finalizarla o cerrar el o o o programa se pierden, a no ser que se graben mediante esta opci´ n. En cualquier caso, al cerrar el programa SPSS, si se han o introducido modificaciones en el fichero de datos, el sistema siempre env´a una pregunta al usuario con objeto de confirmar ı si se quieren grabar o no los cambios realizados. La opci´ n Guardar como se utiliza al ir a grabar por primera vez un fichero o al ir a modificar algunos de sus par´ metros o a de grabaci´ n. Al activarla aparece un cuadro de di´ logo como el de la Figura 8. En el mismo debemos especificar, mediante o a los procedimientos habituales, el nombre del fichero, la unidad y la carpeta de la misma en la que queremos que se grabe. Con respecto a la posibilidad de grabar el fichero con un tipo distinto al de SPSS para Windows, esto lo veremos posteriormente. En consecuencia, en Tipo del cuadro de di´ logo de la Figura 8 dejamos inalterada la opci´ n seleccionada a o por defecto que es la de un fichero de datos de SPSS para Windows (.sav). En este cuadro de di´ logo vemos que tambi´ n a e aparece una opci´ n desactivada, que es la que permite optar entre grabar o no los nombres de las variables cuando el o formato de grabaci´ n elegido es el correspondiente a las hojas de c´ lculo. o a Ha llegado pues el momento de que procedamos a grabar (en la unidad A:) nuestro fichero de datos con el nombre
Libros.sav

1.6.

Definici´ n del resto de las variables de nuestro ejemplo o

El procedimiento descrito en el apartado 1.4 debe realizarse con el resto de las variables de nuestro ejemplo. Como es similar en todas ellas, a continuaci´ n s´ lo vamos a presentar lo que de espec´fico tienen algunas. o o ı En una primera fase vamos a dejar la variable precio sin definir, para aprender posteriormente a insertar una variable entre otras dos ya existentes. Veamos lo relativo a la variable fecha de entrada del libro en la biblioteca, que vamos a denominar entrada: ♦ En primer lugar, seleccionamos la carpeta Vista de variables haciendo clic en su correspondiente pesta˜ a (parte inferior n del editor de datos) (Figura 4). ♦ En la casilla intersecci´ n de la fila correspondiente a nuestra variable (fila 2) con la columna correspondiente a o Nombre escribimos entrada ♦ Hacemos clic en la parte derecha de la casilla intersecci´ n de la fila correspondiente a nuestra variable (fila 2) con o la columna correspondiente a Tipo. En el cuadro de di´ logo que aparece seleccionamos Fecha y de las opciones que a se muestran seleccionamos, por ejemplo, el formato dd.mm.aaaa, que es el quinto que se ofrece (ver Figura 9). Luego pulsamos Aceptar.

Figura 9: Cuadro de dialogo para definir el tipo fecha

♦ En cuanto a las variables de este tipo, hay que tener en cuenta varias cuestiones: • Las variables de fecha creadas con Definir fechas no deben confundirse con las variables con formato de fecha, que se definen en Vista de variables del Editor de datos (como en el presente ejemplo). Las variables de fecha se emplean para establecer la periodicidad de los datos de series temporales; mientras que las variables con formato de fecha representan fechas y horas mostradas en varios formatos de fecha y hora. Las variables de fecha son n´ meros enteros sencillos que representan el n´ mero de d´as, semanas, horas, etc., a partir de un u u ı punto inicial especificado por el usuario. Internamente, la mayor´a de las variables con formato de fecha se ı almacenan como el n´ mero de segundos transcurridos desde el 15 de octubre de 1582. u

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

11

¤ § ´ Observaci´ n ¥ o ¿Por que la referencia es la fecha 15 de octubre de 1582? ¦

El actual calendario, aunque retocado en 1582, fue ideado en el a˜ o 532 d.C. por el monje y astr´ nomo Dionisio “el n o diminuto”. Dionisio calcul´ (aunque se equivoc´ en, al menos, 4 a˜ os) que Jesucristo naci´ el 25 de diciembre del o o n o a˜ o 753 A.U.C. (“ab urbe condita” o desde la fundaci´ n del Imperio Romano). Dionisio hizo que el 1 de enero del n o a˜ o 1 (no del a˜ o cero) coincidiese con el 1 de enero del a˜ o 754 A.U.C. (no el nacimiento de Jes´ s sino 7 d´as n n n u ı despu´ s, que coincid´a con la fiesta de la Circuncisi´ n). e ı o Cuando Dionisio ide´ nuestro actual calendario estaba vigente el calendario Juliano. Este calendario se estableci´ en o o ´ el a˜ o 45 a.C. En el, cada a˜ o ten´a 365’25 d´as, por lo que cada 4 a˜ os hab´a uno con 366 d´as (bisiesto). Pero n n ı ı n ı ı cada a˜ o se a˜ ad´a 11 minutos y “pico” al a˜ o solar y por tanto cada 1000 a˜ os se a˜ ad´an 7 d´as al a˜ o solar. n n ı n n n ı ı n Por orden del papa Gregorio XIII se reuni´ un comit´ en 1578 para dar soluci´ n al desajuste de 10 d´as que ya o e o ı exist´a entre el a˜ o civil y el a˜ o solar. El papa promulg´ las nuevas reglas en una bula papal el d´a 24 de febrero ı n n o ı de 1582. Desaparecieron del calendario del 5 al 14 de octubre de 1582 (al d´a 4 de octubre de 1582 le sigui´ el d´a ı o ı 15 de octubre de 1582). A partir de ese 15 de octubre de 1582 no ha habido m´ s reformas en el calendario. Este a calendario, llamado Gregoriano, ya estableci´ que los a˜ os tienen 365’2422 d´as. Tambi´ n estableci´ que cada 4 o n ı e o a˜ os hay uno bisiesto menos para los que sean divisibles por 100, a excepci´ n de los a˜ os que sean divisibles por n o n 400. El a˜ o Gregoriano se aparta del solar s´ lo por 25’96 segundos. n o

• Los valores de a˜ o de dos d´gitos de las variables con formato de fecha del editor de datos poseen un valor n ı ´ de siglo basado en los fijados en Edicion ⇒Opciones ⇒Carpeta de Datos de la barra de men´ s (ver Figura u 10). El valor fijado por defecto es el de 1933 a 2032. Los valores autom´ ticos se basan en el a˜ o actual, con a n principio 69 a˜ os antes y final 30 a˜ os despu´ s de esa fecha. Por ejemplo, si en el a˜ o 2002 se introduce una n n e n fecha como 10-10-29, se almacena internamente como el 10-10-2029, y la fecha 10-10-65 se almacena como el 10-10-1965. Si se tiene alguna duda, es conveniente indicar siempre el a˜ o con cuatro d´gitos. n ı

Figura 10: Carpeta de Datos, dentro de la opci´ n Edici´ n ⇒ Opciones o o

♦ Como el nombre que se le ha dado a la variable podr´a no ser suficientemente expl´cito, deber´amos poner una ı ı ı etiqueta explicativa a esta segunda variable. Para ello, en la carpeta Vista de variables, concretamente en la casilla intersecci´ n de la fila correspondiente a nuestra variable (fila 2) con la columna correspondiente a Etiqueta, escribimos o fecha de entrada del libro en la biblioteca. ♦ No es preciso especificar el formato de columna en Columnas de la carpeta Vista de variables dado que al seleccionar el formato de fecha dd.mm.aaaa el ancho de la columna impl´cito ser´ de 10 (los puntos tambi´ n cuentan). ı a e ♦ As´, la variable entrada ha sido completamente definida. Ahora se puede volver a grabar el que ser´ nuestro fichero ı a de datos denominado Libros.sav (Archivo ⇒ Guardar). A continuaci´ n resumiremos lo que hay que hacer para definir la variable altura: o ♥ En la casilla intersecci´ n de la fila correspondiente a nuestra variable con la columna correspondiente a Nombre (de o la carpeta Vista de variables) escribimos altura

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

12

♥ Hacemos clic en la parte derecha de la casilla intersecci´ n de la fila correspondiente a nuestra variable con la columna o correspondiente a Tipo. Si seleccionamos Coma entonces la separaci´ n de los miles se escribir´ con una coma y la separaci´ n de los decimales o a o se escribir´ con un punto. Si seleccionamos Punto entonces la separaci´ n de los miles se escribir´ con un punto y la a o a separaci´ n de los decimales se escribir´ con una coma. o a Debido a que la introducci´ n de los resultados (apartado 1.7) la haremos mediante el teclado num´ rico, y en dicho o e teclado no est´ la separaci´ n decimal mediante la coma, pero s´ est´ la separaci´ n decimal mediante el punto, a o ı a o entonces elegiremos la opci´ n Coma. En Anchura debemos escribir 4 (pues son dos cifras para la parte entera m´ s una o a coma m´ s un decimal) y en Cifras decimales escribimos 1 a ♥ Ahora pondremos una etiqueta explicativa a esta tercera variable. Para ello, en la casilla intersecci´ n de la fila correo spondiente a nuestra variable con la columna correspondiente a Etiqueta, escribimos altura del libro, en cent´metros. ı ♥ Los resultados de la variable altura tienen 4 d´gitos y su nombre ocupa 6 d´gitos. Por tanto, vamos a poner un ı ı formato de columna con una anchura igual a 6. Para ello, hacemos clic en la parte derecha de la casilla intersecci´ n o de la fila correspondiente a nuestra variable con la columna correspondiente a Columnas y seleccionamos un 6. ♥ Volvemos a grabar los datos en Libros.sav (Archivo ⇒ Guardar). Veamos ahora lo correspondiente a la variable peso: ♠ En Nombre escribimos peso ♠ En Tipo seleccionamos Num´ rica. Como los resultados de la variable peso tienen, como m´ ximo, tres d´gitos, sin e a ı decimales, entonces en Anchura escribimos un 3 y en Cifras decimales escribimos un 0. ♠ En Etiqueta escribimos peso del libro, en gramos. ♠ En Columnas seleccionamos 4 (pues as´ se ver´ el nombre completo de la variable y sus resultados). ı a ♠ Volvemos a grabar los datos en Libros.sav El resumen de lo correspondiente a la definici´ n de la variable n´ mero de veces que se ha prestado el libro en el ultimo o u ´ a˜ o es: n 2 En Nombre escribimos pr´ stamo e 2 En Tipo seleccionamos Num´ rica. Como los resultados de la variable pr´ stamo tienen, como m´ ximo, dos d´gitos, e e a ı sin decimales, entonces en Anchura escribimos un 2 y en Cifras decimales escribimos un 0. 2 En Etiqueta escribimos n´ mero de veces que se ha prestado el libro en el ultimo a˜ o. u n ´ 2 En Columnas seleccionamos 8 (pues as´ se ver´ el nombre de la variable y sus resultados). ı a 2 Volvemos a grabar los datos en Libros.sav Ahora s´ lo nos quedan las tres variables relativas a la opini´ n de tres expertos sobre la encuadernaci´ n de los libros. o o o Este es el t´pico caso en que un grupo de variables comparten una misma estructura, por lo que definiremos la primera de ı las tres variables y luego copiaremos y pegaremos todos los atributos. De hecho, una vez que se han definido los atributos de definici´ n de variables correspondientes a una variable, se o pueden copiar uno o m´ s atributos y aplicarlos a una o m´ s variables. Las posibilidades son: a a ´ Copiar un unico atributo (por ejemplo, etiquetas de valor) y pegarlo en la misma casilla de atributo para una o m´ s a variables. Copiar todos los atributos de una variable y pegarlos en una o m´ s variables. a Crear varias variables nuevas con todos los atributos de una variable copiada. Para ello: • En la carpeta Vista de variables, se selecciona el n´ mero de fila de la variable que tiene los atributos que se u quieren utilizar en las nuevas variables. Se resaltar´ o iluminar´ la fila entera. a a
´ • Se selecciona la opci´ n Edicion ⇒Copiar o

´ • Se hace clic en el n´ mero de la fila vac´a situada bajo la ultima variable definida en el archivo de datos. u ı

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

13

´ • Se selecciona la opci´ n Edicion ⇒Pegar variables o

• Se indica el n´ mero de variables que se quieren crear y se introduce un prefijo y un n´ mero inicial para las u u nuevas variables. Los nombres de las nuevas variables se compondr´ n del prefijo especificado, m´ s un n´ mero a a u secuencial que comienza con el n´ mero indicado. u • Se pueden cambiar o completar los nombres y/o las etiquetas de las nuevas variables. ´ En consecuencia, para definir las tres ultimas variables de nuestro ejemplo, seguiremos los siguientes pasos: 1. Definimos la primera de las tres variables: En Nombre escribimos opini´ n1 o En Tipo seleccionamos Num´ rica con una Anchura igual a 1 y un n´ mero de Cifras decimales igual a 0. e u En Etiqueta escribimos opini´ n del primer experto respecto de la encuadernaci´ n del libro. o o En Valores asignamos las siguientes etiquetas de resultados: 1=muy mala, 2=mala, 3=regular, 4=buena, 5=muy buena. En Columnas seleccionamos 8 (para que se vea el nombre completo de la variable). En Medida seleccionamos Ordinal 2. En la carpeta Vista de variables, se selecciona el n´ mero de fila de la variable opini´ n1, con lo que la fila entera u o quedar´ iluminada. a
´ 3. Se selecciona la opci´ n Edicion ⇒Copiar o

4. Se hace clic en el n´ mero de la fila vac´a situada bajo opini´ n1 u ı o
´ 5. Se selecciona la opci´ n Edicion ⇒Pegar o

6. Se cambia el Nombre de esta nueva variable que se denominar´ opini´ n2. Se modifica un poco la Etiqueta de esta a o nueva variable que ahora ser´ : opini´ n del segundo experto respecto de la encuadernaci´ n del libro. a o o 7. Lo que se ha hecho para crear la variable opini´ n2 se hace ahora para crear la nueva variable opini´ n3 cuya etiqueta o o se modificar´ de la siguiente forma: opini´ n del tercer experto respecto de la encuadernaci´ n del libro. a o o 8. Volver a grabar todo en Libros.sav El resultado de todo el proceso anterior en la carpeta Vista de variables es lo que aparece en la Figura 11.

Figura 11: Ventana del editor de datos con las variables definidas

Para terminar este apartado, recordaremos que en cualquier momento se pueden cambiar las especificaciones declaradas en la definici´ n de cualquier variable. Siempre es posible, por ejemplo, aumentar la longitud de una variable, introducir o nuevos c´ digos para los valores ausentes o perdidos, a˜ adir o modificar etiquetas, etc. o n Pero si los datos ya han sido introducidos, y sobre todo si son muchos, hay otras serie de posibles modificaciones que son menos recomendables, como cambiar el tipo asignado a las variables, disminuir su longitud o modificar valores ausentes.

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

14

1.7.

Introducci´ n de los datos a trav´ s del teclado o e

En la carpeta Vista de datos de la ventana del editor de datos se observa que las variables definidas est´ n activas, aunque a las casillas correspondientes a sus datos o resultados est´ n vac´as. a ı En este punto podemos comenzar con la introducci´ n de los datos. Tan entretenida tarea se puede realizar pr´ cticamente o a de cualquier forma y orden: sujeto a sujeto, variable a variable, seleccionando una porci´ n de matriz, etc. § cualquiera o En ¤   £ de las formas que elijamos, la tecla ¢Intro ¡activa la casilla inmediatamente inferior y la tecla del tabulador, , activa la ¦ ¥ siguiente casilla de la derecha. Nosotros introduciremos los datos por columnas (variables). Si hemos probado ya a introducir algunos datos, entonces antes de introducir los resultados de nuestro ejemplo vamos a limpiar la ventana del editor borrando toda la matriz. Para ello, la seleccionamos entera usando la t´ cnica de se˜ alar e n ´ y arrastrar y elegimos la opci´ n Edicion ⇒Eliminar de la barra de men´ s. Pero antes de hacerlo tengamos en cuenta lo o u siguiente: ´ ´ Si comenzamos la selecci´ n desde la primera casilla (caso 1, variable 1) hasta la ultima, al ejecutar la opci´ n Edicion o o ⇒Eliminar habremos eliminado todos los valores previamente introducidos; pero tanto las variables como los sujetos (casos) siguen igualmente activos. La prueba de ello es que en todas las casillas de variables num´ ricas aparecer´ la coma e a indicando que son valores ausentes definidos por el sistema. Por el contrario, si comenzamos la selecci´ n en el bot´ n de encabezamiento del primer caso (el marcado con el 1), lo o o que se selecciona es toda la matriz excepto los encabezamientos de las variables, y el resultado es una matriz s´ lo definida o en lo que se refiere a las variables; el resto est´ completamente vac´o. a ı Se˜ alado esto, procedemos a borrar lo que tengamos en la ventana del editor de datos de la manera que nos guste, y n pasamos a introducir los 30 casos. Para ello recomiendo hacer lo siguiente: 1. Recomiendo introducir los datos por columnas (variables), para ir grabando los datos en Libros.sav cada vez que introduzcamos una nueva columna (variable). 2. Recomiendo tambi´ n, en las variables num´ ricas (todas menos la primera) utilizar el teclado num´ rico (el que est´ a e e e a la derecha). Para que este teclado est´ activo debe estar encendida la luz que hay junto a Bloq.Num.. e 3. La fecha de entrada de los libros se puede introducir de cualquiera de las siguientes maneras: 3-5-95, 3 5 1995, 3/5/95, 3.5.95, 03-5-95, 03 5 1995, 03/5/95, 03.5.95, 3-05-95, 3 05 1995, 3/05/95, 3.05.95, · · · , 03-05-1995, 03 05 1995, 03/05/1995, 03.05.1995; pero independientemente de cu´ l haya sido el escogido, la apariencia en el editor es a 03.05.1995, pues es la que hemos elegido en Tipo. Como vemos, para las variables de tipo fecha, al introducir los datos se puede utilizar como separador el punto, el gui´ n, el espacio en blanco o la barra inclinada; pero no se puede o utilizar, por ejemplo, el punto y coma, ni los dos puntos. ´ Recomiendo introducir las fechas con el separador /, pues este est´ en el teclado num´ rico (por ejemplo, teclearemos a e 3/5/95). Una vez hechas estas consideraciones introducimos nuestros datos (menos los resultados de la variable precio, que los a˜ adiremos posteriormente). Al final debemos tener la matriz de datos de la Figura 12. No olvidemos grabar ahora el n

Figura 12: Ventana del editor rellena con los datos del ejemplo (menos la variable precio)

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

15

fichero de datos en Libros.sav. Despu´ s podemos cerrar la sesi´ n de trabajo abandonando el programa con la opci´ n Archivo e o o ⇒Salir o pulsando el bot´ n de la esquina superior derecha de la ventana ( bot´ n × ). o o

1.8.

Lectura de ficheros de datos propios de SPSS

Para leer datos grabados mediante SPSS hay que elegir Archivo ⇒Abrir ⇒Datos o pulsar el primer icono de la barra de ´ herramientas. Si se ha trabajado recientemente con el archivo de datos que se quiere abrir, es muy probable que este se encuentre en la lista de archivos que hay al desplegar el men´ Archivo ⇒Datos usados recientemente (ver Figura 13). Si se u encuentra aqu´ el nombre del fichero, se puede tambi´ n abrir haciendo clic sobre dicho nombre. Para practicar, podemos ı e

Figura 13: Men´ Archivo u

abrir ahora otro fichero de datos, que no sea Libros.sav.

1.9.

Edici´ n y modificaci´ n de los datos o o
£  £  £   Para moverse por la ventana del editor de datos se emplean las teclas de las flechas de movimiento, ¢← ¡,¢→ ¡, ↑ y ¢ ¡ £   § ¤ £   ↓ . Como ya hemos dicho, la tecla cambia a la casilla contigua de la derecha y la tecla ¢Intro ¡cambia a la tecla ¦ ¥ ¢ ¡   £     £   £ £ ´ contigua de abajo. Para ir a la primera variable se pulsa ¢Ctrl ¡+¢← ¡. Para ir a la ultima variable ¢Ctrl ¡+¢→ ¡. Para ir   £   £ £ £   al principio se pulsa ¢Ctrl ¡+¢Inicio ¡. Para ir al final, ¢Ctrl ¡+¢Fin ¡. Para ir a un caso concreto se elige la opci´ n Datos ⇒Ir a caso o se emplea el octavo icono de la barra de herramientas. o Para corregir un dato se selecciona la casilla correspondiente. El valor en cuesti´ n aparecer´ en la barra de edici´ n o a o £   de datos. Se escribe el valor corregido y se pulsa ¢Intro ¡. Para seleccionar un caso (fila) se hace clic sobre el n´ mero del caso. Para seleccionar una variable (columna) se u hace clic sobre el nombre de ella. Para seleccionar un rect´ ngulo de datos se hace clic en la casilla de la esquina y a se arrastra hasta la otra esquina.
´ Para buscar un dato de una cierta variable, se selecciona la variable y se elige Edicion ⇒Buscar o bien se emplea el d´ cimo icono de la barra de herramientas. e

En este apartado trataremos sobre cualquier tarea de modificaci´ n de los datos de un fichero dado. o

Por ejemplo, si buscamos los libros cuya altura es igual 25 cent´metros veremos que son los casos (libros) numerados ı con el 6 y el 22. Para insertar un nuevo caso entre otros ya existentes, hacemos clic sobre el n´ mero del caso siguiente (para seu leccionarlo) y elegimos Datos ⇒Insertar caso, o bien empleamos el und´ cimo icono de la barra de herramientas, o e bien pulsamos el bot´ n auxiliar del rat´ n (el derecho) y elegimos la opci´ n Insertar casos en el men´ contextual que o o o u aparece. Si queremos insertar nuevos casos al final de los ya existentes, basta con introducirlos de la forma indicada en el apartado 1.7. Para ir a una variable concreta se elige la opci´ n Utilidades ⇒Variables y en el cuadro de di´ logo que aparece (Figura o a 14) se selecciona la variable deseada y se pulsa el bot´ n Ir a. Tambi´ n aparece este cuadro de di´ logo pulsando el o e a bot´ n del noveno icono de la barra de herramientas. o

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

16

Figura 14: Cuadro que aparece con Utilidades ⇒ Variables

Para insertar una variable entre otras ya existentes, hacemos clic sobre el nombre de la variable siguiente (para seleccionarla) y elegimos Datos ⇒Insertar variable, o bien empleamos el duod´ cimo icono de la barra de herramientas, e o bien pulsamos el bot´ n auxiliar del rat´ n y elegimos la opci´ n Insertar variables en el men´ contextual que aparece. o o o u Esto se puede hacer tanto en la carpeta Vista de datos como en la carpeta Vista de variables. Si queremos insertar nuevas variables al final de las ya existentes, basta con definirlas e introducir los datos de la forma indicada en los apartados 1.4 y 1.7. Nosotros vamos a insertar la variable precio entre las variables materia y entrada. Para ello: • En la carpeta Vista de variables seleccionamos a variable entrada haciendo clic sobre su nombre. • Elegimos la opci´ n Datos ⇒Insertar variable. o • Una nueva variable es generada, con un nombre gen´ rico (var00001), y con el tipo y formato preestablecido e por el sistema (ver Figura 15).

Figura 15: Carpeta Vista de Variables con una nueva variable insertada

En la carpeta Vista de datos se puede observar que la columna correspondiente tiene 30 datos ausentes (ver Figura 16).

Figura 16: Carpeta Vista de datos con una nueva variable insertada

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

17

• En la carpeta Vista de variables definimos ahora la variable (ver el apartado 1.4) con las siguientes especificaciones: ◦ ◦ ◦ ◦
Nombre (de variable): precio Tipo: Num´ rica, Anchura: 3, Decimales: 0 e Etiqueta (de variable): precio del libro, en euros Columnas: 6

• En la carpeta Vista de datos introducimos ahora los resultados de esta variable de la forma indicada en el apartado 1.7. Dichos resultados se encuentran, como ya sabemos, en la Figura 3. Para cambiar las especificaciones de una variable se procede de forma an´ loga a la definici´ n inicial de las a o variables (ver los apartados 1.4 y 1.6). Recordemos que, una vez que hemos introducido los datos, no es conveniente cambiar ciertas especificaciones como el tipo (de cadena a num´ rico, etc.) o disminuir la longitud. Para comprobar e las especificaciones de cada variable se puede revisar el diccionario seleccionando la opci´ n Utilidades ⇒Variables. o Entonces aparece el cuadro de di´ logo de la Figura 14. Tambi´ n aparece este cuadro de di´ logo pulsando el bot´ n a e a o del noveno icono de la barra de herramientas. ´ Otras funciones t´picas de todos los editores, y por supuesto de este, son borrar, copiar, mover y deshacer. Mover ı consiste en seleccionar, cortar, situarse en otro sitio y pegar. Copiar consiste en seleccionar, copiar, situarse en otro sitio y ´ ´ pegar. Deshacer es eliminar la ultima acci´ n de borrar, cortar o pegar. Estas funciones est´ n en el men´ Edicion. Deshacer o a u tambi´ n est´ en el quinto icono de la barra de herramientas. e a

1.10.

Modificaci´ n de la apariencia del editor de datos o

Es posible modificar la apariencia del editor de datos o su modo de operar. Para ello seleccionamos Ver de la barra de men´ s y hacemos clic en la opci´ n deseada del men´ que aparece (Figura 17). Estas opciones son: u o u

Figura 17: Men´ Ver u

Barra de estado: Sirve para mostrar (cuando est´ se˜ alado con un a n sistema.

) u ocultar (cuando no lo est´ ) la barra de estado del a

Barras de herramientas: Sirve para mostrar u ocultar, personalizar y crear nuevas barras de herramientas. En las barras de herramientas puede incluirse cualquier herramienta disponible, incluso la de cualquier acci´ n de men´ . Adem´ s o u a pueden contener herramientas personalizadas que ejecutan otras aplicaciones, que ejecutan archivos de sintaxis de comandos o archivos de procesos. Fuentes: Si se elige esta opci´ n se abre un cuadro de di´ logo similar al de todas las aplicaciones Windows, que permite o a seleccionar las fuentes, estilos y tama˜ os. n Cuadr´cula: Sirve para mostrar (cuando est´ se˜ alado) u ocultar (cuando no lo est´ ) la cuadr´cula que separa las diferı a n a ı entes casillas del editor de datos. Etiquetas de valor: Sirve para mostrar (cuando est´ se˜ alado) u ocultar (cuando no lo est´ ) las etiquetas de las variables a n a en el editor de datos. Variables (o Datos): Sirve para ver la carpeta Vista de variables o la carpeta Vista de datos. Por ejemplo, en la Figura 18 se puede ver el aspecto del editor de datos cuando est´ activada (se˜ alada con a n opci´ n Etiquetas de valor y no est´ activada la opci´ n Cuadr´cula. o a o ı ) la

1.11.
tas.

Impresi´ n de los datos o

Para imprimir los datos hay que seleccionar la opci´ n Archivo ⇒Imprimir o usar el tercer icono de la barra de herramieno Imprimamos ahora todos los datos del fichero Libros.sav.

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

18

Figura 18: Editor de datos mostrando las etiquetas de las variables (y sin la cuadr´cula) ı () Par´ ntesis e < LT Menor que ∗∗ Exponenciaci´ n o > GT Mayor que ∗ Multiplicaci´ n o <= LE Menor o igual que / Divisi´ n o >= GE Mayor o igual que & AND Operador Y + Suma = EQ Igual que | OR Operador O − Resta ∼= NE No igual que ∼ NOT Operador NO (a) Operadores aritm´ ticos e (b) Operadores relacionales (c) Operadores l´ gicos o Cuadro 1: Operaciones aritm´ ticas, relacionales y l´ gicas que se pueden realizar con SPSS e o

1.12.

Importaci´ n de ficheros de datos o

Acabamos de ver en los apartados anteriores los procedimientos que se emplean para generar los ficheros de datos propios de SPSS para Windows. En el apartado 1.8 vimos como leer (importar) este tipo de ficheros de datos. Pero en algunas ocasiones podemos disponer de datos ya grabados en un fichero generado por una aplicaci´ n inform´ tica distinta o a de SPSS. Si se desea analizar estad´sticamente tal informaci´ n no es preciso crear un fichero SPSS para tal fin, sino que ı o basta con que se proceda a la importaci´ n del mismo. No vamos a explicar aqu´ detalladamente la forma de importaci´ n o ı o de estos ficheros (esto se puede consultar en la ayuda de SPSS), pero s´ vamos a decir que es posible la importaci´ n de: ı o Archivos de datos grabados en c´ digo ASCII, con o sin tabulaci´ n (con la opci´ n Archivo ⇒Leer datos de texto). o o o Archivos de otros paquetes estad´sticos, como Systat (se selecciona Archivo ⇒Abrir ⇒Datos y en el cuadro de di´ logo ı a que aparece se indica Systat(*.sys) en Tipo de archivos). Archivos de hojas de c´ lculo, como Lotus, Excel o formato SYLK (se selecciona Archivo ⇒Abrir ⇒Datos y en Tipo a de archivos se indica Lotus(*.w*), Excel(*.xls) o SYLK(*.slk), respectivamente). Archivos de sistemas de gesti´ n de bases de datos, como dBASE (se selecciona Archivo ⇒Abrir ⇒Datos y en el o cuadro de di´ logo que aparece se indica dBASE(*.dbf) en Tipo de archivos). a Por supuesto, ficheros de datos SPSS creados en otros entornos y sistemas operativos (se selecciona Archivo ⇒Abrir ⇒Datos y en Tipo de archivos se indica SPSS/PC+(*.sys) si est´ n generados por SPSS en su versi´ n para MS-DOS; a o o se indica SPSS portable(*.por) si se trata de ficheros port´ tiles creados en otros entornos como Macintosh o VMS). a ´ Adicionalmente, y mediante ODBC, se pueden capturar y manejar datos de Access, Excel o FoxPro de las ultimas versiones (se selecciona Archivo ⇒Abrir base de datos ⇒Nueva consulta).

1.13.

Transformaci´ n de variables o

En este apartado vamos a ver el modo de generar nuevas variables mediante transformaciones efectuadas sobre los valores de las variables ya definidas. Siempre que realicemos transformaciones en nuestro fichero Libros.sav grabaremos estos nuevos datos en un fichero nuevo que se denominar´ Libros2.sav a En el Cuadro 1 se encuentran recogidos los operadores aritm´ ticos, relacionales y l´ gicos que est´ n permitidos. Tanto e o a las expresiones aritm´ ticas como las l´ gicas se eval´ an de izquierda a derecha. Todas las expresiones entre par´ ntesis se e o u e eval´ an antes que las que est´ n fuera de los par´ ntesis y ante varios operadores en el mismo nivel, el orden de preferencia u a e (de mayor a menor) es el que figura en el Cuadro 1 (de arriba a abajo). Para construir una nueva variable mediante transformaciones de otras ya existentes, se tiene que elegir la opci´ n o Transformar ⇒Calcular con lo que se abre el cuadro de di´ logo de la Figura 19. En esta ventana tenemos cinco partes a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

19

Figura 19: Cuadro de di´ logo para transformar variables a

fundamentales: arriba a la izquierda est´ el lugar para escribir el nombre de la nueva variable (Variable de destino:), debajo a aparece la lista de variables existentes, arriba a la derecha est´ el lugar destinado a la definici´ n de la nueva variable a o ´ (Expresion num´ rica:), debajo hay una calculadora y la lista de funciones que se pueden utilizar (Funciones:). e En primer lugar se asigna un nombre a la variable que queremos generar, escribiendo el mismo en el cuadro Variable de destino. Normalmente se va a tratar de una variable nueva, pero tambi´ n cabe la posibilidad de especificar una de las ya e existentes. En tal caso la modificaci´ n consistir´ en sustituir los valores antiguos de la variable con los nuevos resultantes o a de la transformaci´ n num´ rica que se efect´ e. Por defecto, la nueva variable ser´ num´ rica. Si se quiere especificar otro o e u a e tipo y a˜ adir etiquetas, debe emplearse el m´ todo explicado en los apartados 1.4 y 1.6. n e Una vez que se ha asignado el nombre a la variable, el siguiente paso es definir la expresi´ n num´ rica que va a permitir o e ´ calcular los valores de la misma. Tal expresi´ n se escribe en el cuadro Expresion num´ rica y puede constar de los siguientes o e elementos: nombres de variables del fichero original, constantes, operadores y funciones. Para escribir dicha expresi´ n o ´ esta se puede teclear directamente pero es recomendable emplear la calculadora, la lista de variables y la lista de funciones y o haciendo doble clic sobre la variable o funci´ n). o (pulsando los correspondientes botones Una vez que hemos terminado de escribir la expresi´ n (utilizando, como hemos dicho, la calculadora, la lista de o variables y la lista de funciones), pulsamos en Aceptar. Si SPSS encuentra un error en nuestra expresi´ n nos lo indica o convenientemente. Entonces debemos editar nuestra expresi´ n y corregir el error, pulsando la tecla Aceptar de nuevo. o Inmediatamente vamos a ver ejemplos, pero no vamos a describir cada una de las funciones, pues hay muchas. Como he dicho en otros apartados, remito a las ayudas que el sistema proporciona. 1.13.1. Modificaci´ n sin utilizar el condicional o

Una de las variables del fichero Libros.sav es la altura de cada libro, medida en cent´metros, cuyos resultados vienen ı expresados con una cifra decimal. Si, por ejemplo, quisi´ ramos expresar la altura en mil´metros (para quitar los decimales) e ı bastar´a con multiplicar por 10. Como en este caso no es necesario generar una nueva variable, en el recuadro Variable de ı ´ destino se escribe el nombre de la misma (altura). A continuaci´ n, en el recuadro Expresion num´ rica ponemos: altura*10 o e (recordar que es mejor no teclearlo sino utilizar la calculadora del cuadro de di´ logo y la lista de variables). Tras pulsar el a bot´ n Aceptar, el sistema pregunta si queremos que desaparezcan los resultados anteriores de la variable altura para que o sean sustituidos por los nuevos valores; a lo que nosotros contestaremos que S´. ı Lo conveniente ahora es cambiar la definici´ n de la variable altura (ver los apartados 1.4 y 1.6), poniendo Tipo=Num´ rio e ca, Anchura=3, Decimales=0 y Etiqueta=altura del libro, en mil´metros. No olvidemos ahora grabar estos nuevos datos en un ı fichero con el nombre Libros2.sav Hecho esto, en la ventana del editor de datos tendr´amos lo que aparece en la Figura 20. ı

Figura 20: Ventana del editor con la nueva variable altura

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

20

´ Siguiendo ahora con el fichero Libros2.sav, en el consta una variable de tipo fecha, que es la fecha de entrada del libro a la biblioteca. Si quisi´ ramos saber el tiempo transcurrido entre esta fecha y la fecha actual podr´amos crear una nueva e ı variable, a la que podr´amos llamar estancia con el resultado de la diferencia entre la fecha actual (supongamos que sea ı 17/12/2002) y la variable entrada. Para ello, seleccionamos Transformar ⇒Calcular. En Variable de destino escribimos estancia (ver Figura 19). Ahora tenemos que expresar la diferencia entre la fecha 17/12/2002 y las fechas de la variable entrada. Pero la fecha 17/12/2002 no se puede escribir directamente, sino que tenemos que utilizar una de las funciones del sistema, concretamente la fun˜ ci´ n DATE.DMY(d´a,mes,ano) que devuelve, en formato de fecha de SPSS, el valor de la fecha correspondiente al d´a, mes y o ı ı ´ a˜ o indicados. Por tanto, en Expresion num´ rica pondremos (con ayuda de la lista de variables y de la lista de funciones) n e lo siguiente: DATE.DMY(17,12,2002)-entrada. Despu´ s de pulsar el bot´ n Aceptar obtendremos en la carpeta de datos, a e o ´ continuaci´ n de nuestra ultima variable (opini´ n3), los resultados de la nueva variable estancia (ver Figura 21). Podemos o o volver a grabar estos nuevos datos en Libros2.sav Como vemos, los valores de la variable estancia son muy grandes, y esto se debe a que ambas fechas figuran en SPSS como el n´ mero de segundos transcurridos desde el 15 de octubre de 1582. Obviamente, la resta nos proporciona el resulu tado en segundos. Como estas cantidades son complicadas de manejar, vamos a realizar ahora una nueva transformaci´ n o para medir dicha diferencia en d´as. Para realizar esto, SPSS dispone de una funci´ n, que es CTIME.DAYS(valor tiempo), que ı o devuelve el n´ mero de d´as, incluyendo fracciones de d´a, que hay en valor tiempo. Por tanto, generamos una nueva variable, u ı ı que llamaremos d´as, que ser´ el resultado de poner (con ayuda de la lista de variables y de la lista de funciones) en el ı a ´ recuadro Expresion num´ rica lo siguiente: CTIME.DAYS(estancia). El resultado de esta variable se encuentra en la columna e d´as de la Figura 21. ı Si todav´a nos parecen grandes los valores de esta nueva variable, podemos proporcionar el resultado en a˜ os. Para ello, ı n ´ ˜ creamos una nueva variable, que llamaremos anos, que ser´ el resultado de la siguiente Expresion num´ rica: dias/365.2422 a e (que es recomendable poner con ayuda de la calculadora del cuadro de di´ logo, de la lista de variables y de la lista de a ˜ funciones), pues el a˜ o tiene 365 2422 d´as. Los valores de esta nueva variable aparecen en la columna anos de la Figura n ı 21. En la l´nea de edici´ n de datos se puede observar que el verdadero resultado (el almacenado por SPSS) tiene m´ s de ı o a dos cifras decimales. Si queremos que en la matriz de datos aparezcan m´ s de dos decimales tenemos que modificar los a ˜ Decimales de la variable anos se˜ alando el n´ mero de decimales deseado. Hagamos o no esta modificaci´ n, es conveniente n u o colocar una etiqueta a esta nueva variable, para que sepamos en todo momento qu´ es lo que mide; por ejemplo, podemos e escribir en Etiqueta lo siguiente: a˜ os de estancia del libro en la biblioteca. n Llegado este punto voy a hacer una aclaraci´ n sobre la coma decimal que hemos tenido que escribir cuando hemos o dividido por 365 2422. Es conveniente escribir la coma decimal mediante la tecla de la separaci´ n decimal que aparece o en la calculadora pues aunque en ella est´ escrita una coma, realmente se escribe un punto al pulsar. Por tanto, si en el a ´ recuadro Expresion num´ rica del cuadro de di´ logo de la Figura 19 queremos escribir un n´ mero con decimales sin emplear e a u la calculadora, tenemos que escribir siempre un punto como separador decimal.

Figura 21: Ventana del editor con las nuevas variables estancia, d´as y a˜ os ı n

Aunque lo he hecho por su inter´ s pedag´ gico, no es l´ gico conservar las variables estancia y d´as, por lo que podemos e o o ı ˜ ´ eliminarlas de la matriz de datos, dejando unicamente la variable anos. Recordemos que para eliminar una variable primero ´ se selecciona dicha variable (pulsando en su nombre) y luego se elige Edicion ⇒Eliminar o se pulsa el bot´ n auxiliar del o rat´ n y del men´ contextual que aparece se elige Eliminar. o u ˜ Otra opci´ n para generar directamente la variable anos, sin tener que generar las variables estancia y d´as es poner o ı directamente (con ayuda de la calculadora del cuadro de di´ logo, de la lista de variables y de la lista de funciones) en a ´ Expresion num´ rica todas las operaciones que hemos realizado: (CTIME.DAYS(DATE.DMY(17,12,2002)-entrada))/365.2422 e ˜ ´ Por ultimo, si queremos que la nueva variable anos aparezca en el editor de datos junto a la variable entrada, a su derecha (ver Figura 22) insertamos primero una variable vac´a (que autom´ ticamente se llamar´ var0001) entre las ı a a ˜ variables entrada y altura; luego seleccionamos la variable anos, la cortamos, seleccionamos var0001 y pegamos (para

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

21

hacer este proceso consultar el apartado 1.9). Ahora podemos volver a grabar los datos en Libros2.sav. Para ver todas las funciones de fecha y hora disponibles se puede consultar la Ayuda de SPSS.

Figura 22: Ventana del editor con la variable a˜ os junto a la variable entrada n

1.13.2.

Modificaci´ n condicional de variables o

En el apartado anterior hemos descrito las posibilidades que brinda el cuadro de di´ logo correspondiente a la opci´ n a o
Transformar ⇒Calcular; pero hemos hecho caso omiso a un bot´ n: el de Si... condicional, que sirve para activar la modifio

caci´ n condicional de las variables. Tal posibilidad debe emplearse cuando se quiere que las modificaciones especificadas o en la expresi´ n num´ rica no afecten a todos los casos, sino s´ lo a aquellos que re´ nan una serie de caracter´sticas. Tales caro e o u ı acter´sticas se especifican mediante expresiones condicionales, de forma que los nuevos valores s´ lo van a ser calculados ı o para los individuos que satisfagan una serie de condiciones l´ gicas. o Par tal fin, una vez seleccionada la opci´ n Transformar ⇒Calcular, debe pulsarse el bot´ n Si..., con lo que se abre el o o cuadro de la Figura 23. Este cuadro tiene una apariencia similar al inicial, con la diferencia de que el cuadro de texto sirve

Figura 23: Cuadro de di´ logo para hacer la modificaci´ n condicional de una variable a o

para especificar las expresiones condicionales. El uso de dicho cuadro y las normas de sintaxis de este tipo de expresiones son las mismas que para las num´ ricas, por lo que me voy a limitar a exponer sucintamente algunos ejemplos. e Supongamos que, en el ejemplo que venimos manejando, quisi´ ramos calcular el producto de la altura por el peso e s´ lo para los libros de estad´stica. Entonces, en el cuadro de di´ logo de la Figura 23, hay que activar la opci´ n Incluir si el o ı a o ´ caso satisface la condicion. A continuaci´ n hay que poner (como siempre, con ayuda de la lista de variables) en el recuadro o en blanco la expresi´ n: materia=’E’. Observemos que el dato E va entre dos comillas simples. Poner estas comillas o es obligatorio siempre que el resultado sea una cadena de caracteres. (En el teclado del ordenador esta comilla simple est´ situada en la primera fila superior de teclas, sin contar la fila de funciones F1, F2, etc., y habitualmente est´ en la a a misma tecla que el signo de interrogaci´ n.) Despu´ s se pulsa el bot´ n Continuar y volvemos al cuadro de di´ logo de la o e o a ´ Figura 19. En este cuadro de di´ logo, junto a Variable de destino escribimos, por ejemplo, robustez; y debajo de Expresion a num´ rica ponemos altura*peso (como ya he dicho varias veces, con ayuda de la calculadora de este cuadro de di´ logo y e a de la lista de funciones). Tras pulsar Aceptar obtenemos en el editor de datos una nueva columna con la nueva variable calculada s´ lo para los casos en los que la variable materia es igual a estad´stica (ver Figura 24). El resto de los casos o ı est´ n en blanco (son valores perdidos o ausentes). a Ser´a conveniente ahora volver a grabar el fichero de datos Libros2.sav. ı Supongamos ahora que una determinada transformaci´ n queremos que se realice s´ lo para los libros de estad´stica o o ı cuyo precio sea menor que 100 euros; entonces la expresi´ n condicional que hay que poner en el recuadro en blanco del o cuadro de di´ logo de la Figura 23 ser´a (ver el Cuadro 1): materia=’E’ AND precio LT 100 o tambi´ n: materia=’E’ & a ı e precio<100 (el uso de los espacios en blanco es optativo).

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

22

Figura 24: Ventana del editor con la nueva variable robustez

§ ¤ Observaci´ n ¥ ha comprobado que esta versi´ n de SPSS tiene un fallo al hacer este tipo de transformaciones condicionales con m´ s de o Se o a ¦

una condici´ n. Concretamente, en el ejemplo inmediatamente anterior no hace caso de la segunda condici´ n, es decir, hace el o o producto de la altura por el peso para todos los libros de estad´stica, sin tener en cuenta si su precio es menor o mayor que 100 ı euros.

1.13.3.

Clasificaci´ n, codificaci´ n o categorizaci´ n de variables o o o

Despu´ s de haber visto c´ mo es posible generar nuevas variables mediante transformaciones num´ ricas (condicionales e o e o no), vamos ahora a discutir la manera de cambiar el plan de codificaci´ n de una variable determinada. o La recodificaci´ n de variables puede ser necesaria por varios motivos: porque se ha visto que el plan de codificaci´ n o o inicial es err´ neo, porque ha habido una ampliaci´ n en la muestra y por consiguiente han aparecido nuevos valores que no o o estaban inicialmente contemplados, porque puede facilitar la realizaci´ n de determinados an´ lisis estad´sticos posteriores, o a ı porque se quiere combinar categor´as y definir intervalos, etc. ı Antes de pasar a un ejemplo, digamos que la recodificaci´ n se puede llevar a cabo de dos maneras: 1) se puede o recodificar guardando el nuevo plan de codificaci´ n en la misma variable (con lo que se perder´ n los antiguos valores), o a o 2) se puede mantener la variable original en su estado inicial y generar una nueva variable cuyos valores van a ser el resultado de aplicar el nuevo plan de codificaci´ n a los de la antigua (de esta manera el fichero va a contar con dos variables o que representan el mismo fen´ meno pero con dos planes de codificaci´ n distintos). Nosotros vamos a ver un ejemplo de o o este segundo caso. Supongamos que en nuestro fichero Libros2.sav queremos definir unos intervalos para que la variable pr´ stamo sea una e variable ordinal. Podemos hacer la siguiente asignaci´ n: o
valor nuevo 1 2 3 4 valor antiguo desde el menor hasta 10 entre 11 y 20 entre 21 y 30 entre 31 y el mayor valor

Los pasos a seguir son los siguientes: primero seleccionamos la opci´ n Transformar ⇒Recodificar ⇒En distintas variables. o Entonces aparece el cuadro de di´ logo de la Figura 25. En este cuadro de di´ logo seleccionamos la variable que queremos a a

Figura 25: Cuadro de di´ logo para recodificar una variable a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

23

recodificar (haciendo doble clic sobre ella en la lista de variables que hay a la izquierda o haciendo un clic y luego pulsando ), es decir, seleccionamos la variable pr´ stamo. En Variable de resultado escribimos pres cat debajo de Nombre y e el bot´ n o Clasificaci´ n de la variable pr´ stamo en cuatro categor´as en Etiqueta. Despu´ s pulsamos el bot´ n Cambiar y a continuaci´ n o e ı e o o el bot´ n Valores antiguos y nuevos, con lo que nos aparece el cuadro de di´ logo de la Figura 26. En este cuadro tenemos que o a

Figura 26: Cuadro de di´ logo para hacer la asignaci´ n de nuevos c´ digos a o o

hacer la asignaci´ n deseada de forma muy similar a como hicimos la asignaci´ n de etiquetas de valor de una variable: o o ´ En Valor nuevo, junto a Valor escribimos 1. En Valor antiguo seleccionamos Rango: Del menor hasta y en este escribimos 10 (esto significa desde el menor valor de la variable hasta 10). Luego pulsamos el bot´ n Anadir, con lo que este o ˜ cambio queda reflejado en el cuadro que hay bajo Antiguo → Nuevo. En Valor nuevo, junto a Valor escribimos 2. En Valor antiguo seleccionamos Rango: y escribimos 11 hasta 20. A continuaci´ n pulsamos el bot´ n Anadir. o o ˜ En Valor nuevo, junto a Valor escribimos 3. En Valor antiguo seleccionamos Rango: y escribimos 21 hasta 30. A continuaci´ n pulsamos el bot´ n Anadir. o o ˜ En Valor nuevo, junto a Valor escribimos 4. En Valor antiguo seleccionamos Rango: hasta el mayor y escribimos 31 (esto quiere decir desde 31 hasta el mayor) . A continuaci´ n pulsamos el bot´ n Anadir. o o ˜ Una vez concluida la asignaci´ n, pulsamos Continuar, con lo que el sistema nos devuelve al cuadro de la Figura 25. En este o cuadro pulsamos el bot´ n Aceptar. Como consecuencia, en el editor de datos tenemos una columna m´ s con la variable o a pres cat. Como esta variable s´ lo toma los valores 1, 2, 3 y 4, debemos cambiar un poco su definici´ n. Concretamente, o o debemos seleccionar un 0 en Decimales, un 1 en Anchura, y Ordinal en Medida. El editor de datos aparecer´a como en la Figura ı 27.

Figura 27: Ventana del editor con la nueva variable pres cat

1.13.4.

Clasificaci´ n autom´ tica de variables o a

La opci´ n Categorizar variables del men´ Transformar asigna autom´ ticamente datos num´ ricos a un n´ mero discreto de o u a e u categor´as o clases. Este procedimiento crea nuevas variables que contienen los datos categ´ ricos. Los datos se categorizan ı o seg´ n grupos de percentiles; cada grupo contiene aproximadamente el mismo n´ mero de casos. Por ejemplo, una especiu u ficaci´ n de cuatro grupos asignar´a un valor de 1 a los casos situados bajo el cuantil al 25 % (primer cuartil), 2 a los casos o ı entre el cuantil al 25 % y el cuantil al 50 % (segundo cuartil o mediana), 3 a los casos situados entre el cuantil al 50 % y el cuantil al 75 % (tercer cuartil) y 4 a los casos por encima del cuantil 75 %. An´ logamente, una especificaci´ n de tres a o

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

24

grupos asignar´a un valor de 1 a los casos situados bajo el cuantil al 33’33 % (un tercio del total de datos), 2 a los casos ı situados entre el cuantil al 33’33 % y el cuantil al 66’67 % (dos tercios del total de datos) y 3 a los casos por encima del cuantil 66’67 %. ´ Por ejemplo, si hacemos la clasificaci´ n autom´ tica de la variable pr´ stamo en tres categor´as obtenemos la ultima o a e ı columna que aparece en la Figura 28. Observamos que SPSS le asigna, autom´ ticamente, un Nombre y una Etiqueta a esta a

Figura 28: Ventana del editor con la clasificaci´ n autom´ tica de la variable pr´ stamo en tres categor´as o a e ı

nueva variable, as´ como una Anchura y un nivel de Medida Ordinal. Si queremos, podemos cambiar este Nombre. Lo que ı s´ debemos cambiar es la etiqueta o explicaci´ n de la variable, ya que est´ en ingl´ s (ntiles of pr´ stamo) y, para nosotros, ı o a e e no es muy explicativa. La cambiamos por Clasificaci´ n autom´ tica de la variable pr´ stamo en tres categor´as. Tambi´ n o a e ı e ´ podemos cambiar la Anchura de esta nueva variable, asign´ ndole un 1, ya que los posibles resultados son: 1, 2 o 3. a 1.13.5. Ordenaci´ n de los resultados de una variable o

Este tipo de modificaci´ n consiste en la ordenaci´ n ascendente o descendente del conjunto de valores de una variable. o o ´ Es aplicable tanto a variables num´ ricas como no num´ ricas. En estas ultimas el criterio es el orden alfab´ tico de los e e e caracteres donde las may´ sculas preceden a las min´ sculas. u u ´ Esto se realiza tras seleccionar Transformar ⇒Recodificacion autom´ tica. Al hacerlo se abre el cuadro de di´ logo de la a a Figura 29.

Figura 29: Cuadro de di´ logo para la recodificaci´ n autom´ tica a o a

Supongamos, por ejemplo, que queremos ordenar los resultados de la variable pr´ stamo en orden ascendente. En el e cuadro de di´ logo de la Figura 29 ponemos pr´ stamo en el recuadro Variable → Nuevo nombre (haciendo doble clic en a e el nombre de la variable o haciendo un clic en ella y luego pulsando el bot´ n o ). A continuaci´ n escribimos junto a o Nuevo nombre el nombre deseado, por ejemplo ord pres, y pulsamos en Nuevo nombre. Despu´ s seleccionamos Recodificar e ´ empezando por: Menor valor. Por ultimo pulsamos Aceptar. El resultado es doble: por un lado, se abre (tal vez por primera vez) la ventana del visor de resultados con los valores de la variable pr´ stamo ordenados de menor a mayor (Figura 30). e En esta ocasi´ n no nos interesa esta informaci´ n, por lo que podemos cerrar la ventana del visor (pulsando el bot´ n × o o o ). Observamos, entonces, que el sistema nos pregunta si queremos guardar los resultados (¿Desea guardar el contenido del Visor de resultados en Resultados1?), a lo que nosotros responderemos que No. (En el apartado 2.2 daremos m´ s a informaci´ n sobre la ventana del visor de resultados de SPSS). o Por otro lado, en la carpeta Vista de variables del editor de datos aparece la nueva variable ord pres (Figura 31). Observamos que SPSS le asigna, autom´ ticamente, una Etiqueta a esta nueva variable (que coincide con la etiqueta de a la variable pr´ stamo), as´ como una Anchura (igual a 2) y un nivel de Medida (Ordinal). Si queremos, podemos cambiar e ı alguna de estas caracter´sticas de la nueva variable. Como la etiqueta de la nueva variable ord pres es la misma que la de ı

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

25

Figura 30: Ventana del visor de resultados con los datos de la variable pr´ stamo ordenados e

Figura 31: Editor de datos con la nueva variable ord pres, generada por recodificaci´ n aut´ matica de la variable pr´ stamo o o e

la variable pr´ stamo, es conveniente cambiarla; por ejemplo, podemos ponerle como nueva etiqueta: Ordenaci´ n de la e o variable pr´ stamo de menor a mayor. e 1.13.6. Ordenaci´ n por rangos o § ¤ Observaci´ n ¥ apartado se entiende cuando se ha estudiado (en teor´a) el concepto de ordenaci´ n por rangos. Si no se ha estudiado dicho o Este ı o ¦
concepto, es mejor no leer este apartado.

En el apartado anterior hemos ordenado de menor a mayor (o de mayor a menor) los resultados de una variable. Ahora ordenaremos por rangos los casos de la variable original. Para hacer la ordenaci´ n por rangos hay que seleccionar la opci´ n Transformar ⇒Asignar rangos a los casos y aparecer´ el o o a cuadro de di´ logo de la Figura 32. En este cuadro, lo primero es seleccionar la variable cuyos valores se van a ordenar por a

Figura 32: Cuadro de di´ logo para asignar rangos a los casos de una variable a

´ rangos. En este caso, aunque siempre se genera una nueva variable, no hace falta especificar su nombre, pues este va a ser autom´ ticamente asignado por SPSS anteponiendo una r al nombre original. Igualmente, el sistema va a dotar a la nueva a variable de una etiqueta en la que se especifica el m´ todo de ordenaci´ n adoptado. e o Si lo que se quiere es una ordenaci´ n por rangos de la variable pr´ stamo seg´ n el criterio ascendente, se selecciona la o e u variable (haciendo clic sobre su nombre o etiqueta y despu´ s sobre el bot´ n e o ) y se pulsa Aceptar. Entonces se abre la

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

26

ventana del visor de resultados con los valores de la nueva variable pr´ stamo ordenados por rangos. Como no nos interesa e esta informaci´ n, cerramos la ventana del visor (pulsando el bot´ n × ) y contestamos No a la pregunta ¿Desea guardar el o o contenido del Visor de resultados en Resultados1?. Por otro lado, en la carpeta Vista de variables del editor de datos aparece la nueva variable rpr´ stam (Figura 33) que contiene la ordenaci´ n por rangos de la variable pr´ stamo. Como siempre, e o e podemos cambiar el nombre de la variable rpr´ stam o cualquier otra especificaci´ n de ella. Por ejemplo, recomendar´a e o ı cambiar la Etiqueta: RANK of PRESTAMO por Ordenaci´ n por rangos de la variable pr´ stamo. Como los resultados de o e esta nueva variable tienen, como m´ ximo, una cifra decimal, ocupando un espacio total de cuatro d´gitos, es conveniente a ı cambiar la Anchura por 4 y los Decimales por 1. En Medida deber´amos se˜ alar Ordinal. La nueva variable aparece en la Figura ı n 33. Como vemos, es una ordenaci´ n ascendente por rangos simples (el valor m´ s bajo de la variable original es el primero o a de la nueva), donde los empates han sido resueltos hallando la media aritm´ tica de los rangos consecutivos que tendr´an si e ı no estuviesen empatados.

Figura 33: Editor de datos con la nueva variable rpr´ stam, generada mediante ordenaci´ n por rangos de la variable e o

pr´ stamo e Este es el procedimiento establecido por defecto. Si queremos realizar otro tipo de ordenaciones, se debe recurrir al empleo del resto de los componentes del cuadro de la Figura 32. Por ejemplo, si pulsamos el bot´ n Empates y en el o cuadro de di´ logo que aparece seleccionamos Rangos secuenciales para valores unicos entonces el resultado es una variable a ´ exactamente igual a la obtenida mediante recodificaci´ n autom´ tica. o a 1.13.7. Otras modificaciones

La opci´ n Contar apariciones del men´ Transformar permite generar una nueva variable cuyos valores vienen dados, para o u cada caso, por el n´ mero de veces que se da un valor o conjunto de valores determinado en una lista de variables del fichero u de trabajo original. En definitiva, el sistema cuenta las ocurrencias de un valor en una o varias variables y el resultado pasa a ser el valor de la nueva variable. La opci´ n Reemplazar valores perdidos del men´ Transformar permite generar nuevas variables en las que los valores o u perdidos o ausentes que hubiese en las originales ser´ n sustituidos por estimaciones (esto se entender´ mejor cuando se a a haya estudiado la parte de Estimaci´ n de Par´ metros). o a

1.14.

Ordenaci´ n de los casos (filas) o

La opci´ n Datos ⇒Ordenar casos cambia el orden de los casos (las filas) del archivo de datos bas´ ndose en los valores o a de una o m´ s variables de ordenaci´ n. Se puede ordenar los casos en orden ascendente o descendente. El cuadro de di´ logo a o a que aparece es el de la Figura 34.

Figura 34: Cuadro de di´ logo para hacer una reordenaci´ n de los casos a o

Si se selecciona m´ s de una variable de ordenaci´ n, los casos se ordenar´ n por variable dentro de las categor´as de a o a ı la variable anterior de la lista Ordenar por:.

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

27

Para las variables de cadena, las letras may´ sculas preceden a las min´ sculas correspondientes en orden. Por ejemu u plo, el valor de cadena “No” precede a “no”. Si de nuestro fichero de datos Libros2.sav seleccionamos la variable precio para ponerla en el recuadro Ordenar por: entonces se produce la reordenaci´ n de los 30 casos que aparece en la Figura 35. o

Figura 35: Editor de datos con la reordenaci´ n de los casos seg´ n la variable precio o u

§ ¤ Observaci´ n ¥ datos de este apartado no se grabar´ n en el fichero Libros2.sav sino en un nuevo fichero, cuyo nombre se dar´ . o Los a a ¦ La opci´ n Datos ⇒Ponderar casos proporciona a los casos diferentes ponderaciones para el an´ lisis estad´stico. o a ı ´ Los valores de la variable de ponderaci´ n deben indicar el n´ mero de observaciones representadas por casos unicos o u en el archivo de datos. Los casos con valores perdidos, negativos o cero para la variable de ponderaci´ n se excluyen del an´ lisis. o a Los valores fraccionarios son v´ lidos; se usan exactamente donde adquieren sentido y, con mayor probabilidad, a donde se tabulan los casos. Si se aplica una variable de ponderaci´ n, esta seguir´ vigente hasta que se seleccione otra o se desactive la ponderaci´ n. o ´ a o Si se guarda un archivo de datos ponderado, la informaci´ n de ponderaci´ n se guardar´ con el archivo. Se puede desactivar o o a la ponderaci´ n en cualquier momento, incluso despu´ s de haber guardado el archivo de forma ponderada. o e Ponderaciones en las tablas de contingencia: En los procedimientos de tablas de contingencia, las frecuencias de casilla basadas en ponderaciones fraccionales se redondean hasta el valor entero m´ s pr´ ximo. Por ejemplo, una a o frecuencia de casilla de 4’2 basada en una ponderaci´ n fraccional se redondea a 4. o Ponderaciones en los diagramas de dispersi´ n y los histogramas: Los diagramas de dispersi´ n y los histogramas o o tienen una opci´ n para activar y desactivar las ponderaciones de los casos, pero dicha opci´ n no afecta a los casos o o que tienen un valor negativo, un valor 0 o un valor perdido para la variable de ponderaci´ n. Estos casos permanecen o excluidos del gr´ fico incluso si se desactiva la ponderaci´ n desde el gr´ fico. a o a
N§ de palabras N§ de l´neas ı 4 1 5 1 8 2 9 3 10 2 11 7 12 11 13 14 14 3 15 2 16 1 17 1

1.15.

Ponderaci´ n de los casos o

Cuadro 2: Datos que, posteriormente, vamos a introducir y grabar con el nombre PalabrasPorLinea.sav

Vamos ahora a crear un nuevo fichero de datos que tenga en la primera columna los resultados de una variable aleatoria discreta y en la segunda columna sus correspondientes frecuencias absolutas. Por ejemplo, vamos a introducir los datos del Cuadro 2 correspondientes al n´ mero de palabras por l´nea de una p´ gina de un libro. El n´ mero de palabras por l´nea u ı a u ı es la variable y el n´ mero de l´neas es la frecuencia absoluta. u ı Para introducir estos datos hacemos lo siguiente:

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

28

Figura 36: Cuadro de di´ logo para ponderar los casos de una variable a

Figura 37: Ventana del editor de datos con los resultados de la variable palabras

♥ Seleccionamos la opci´ n Archivo ⇒Nuevo ⇒Datos. o ♥ En la carpeta Vista de variables definimos la primera variable con las siguientes especificaciones: Nombre (de variable): palabras; Tipo: Num´ rica, Anchura= 2, Decimales= 0; Etiqueta (de variable): N´ mero de palabras por l´nea e u ı de texto; Columnas= 8; Medida: Escala ♥ En la misma carpeta definimos la segunda variable (que, en realidad, no es una variable, ya que contiene las frecuencias absolutas de los distintos resultados de la variable palabras) con las siguientes especificaciones: Nombre (de variable): frecuenc; Tipo: Num´ rica, Anchura= 2, Decimales= 0; Etiqueta (de variable): Frecuencia absoluta de la e variable palabras; Columnas= 8; Medida: Escala ♥ En la carpeta Vista de datos introducimos los datos de ambas variables a partir del Cuadro 2. ♥ Seleccionamos la opci´ n Datos ⇒Ponderar casos. Nos aparece el cuadro de di´ logo de la Figura 36. En este cuadro o a de di´ logo se activa la opci´ n Ponderar casos mediante, y en Variable de frecuencia se selecciona (mediante la lista de a o ) la columna frecuenc. A continuaci´ n se pulsa en Aceptar y as´ la o ı columnas que hay a la izquierda y el bot´ n o ponderaci´ n queda efectiva. o ♥ Grabamos este nuevo fichero de datos con el nombre PalabrasPorLinea.sav. As´, la apariencia de la carpeta Vista de ı datos ser´ la de la Figura 37. a Este fichero de datos lo utilizaremos en la secci´ n 2.3 para calcular las medidas descriptivas de la variable N´ mero de o u palabras por l´nea. ı

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

29

2.
2.1.

Estad´stica descriptiva unidimensional ı
Distribuci´ n de frecuencias o

A partir de este momento, volvemos a trabajar con el fichero Libros.sav Para obtener la distribuci´ n de frecuencias, las medidas descriptivas de los datos y las representaciones gr´ ficas, se o a selecciona la opci´ n Analizar ⇒Estad´sticos descriptivos ⇒Frecuencias. Entonces aparece el cuadro de di´ logo de la Figura o ı a 38. En este cuadro se selecciona, en primer lugar, la variable o variables objeto del procedimiento. Para ello se marcan las

Figura 38: Cuadro de di´ logo de la opci´ n Analizar ⇒ Estad´sticos descriptivos ⇒ Frecuencias a o ı

mismas en la lista de variables y se pasan al recuadro de la derecha pulsando el bot´ n o . Tambi´ n es posible seleccionar e y pasar directamente haciendo doble clic sobre los nombres (o las etiquetas) de dichas variables. Como podemos ver, la opci´ n Mostrar tablas de frecuencias est´ activada. Esto quiere decir que si s´ lo queremos obtener la distribuci´ n de o a o o frecuencias basta con pulsar Aceptar. Por ejemplo, si del fichero de datos Libros.sav seleccionamos la variable materia y luego pulsamos el bot´ n Aceptar entonces aparece la ventana del visor de resultados de la Figura 39. o

Figura 39: Visor con la distribuci´ n de frecuencias de la variable materia (disciplina cient´fica del libro) o ı

2.2.
2.2.1.

Observaciones sobre la presentaci´ n, modificaci´ n y grabaci´ n de los resultados en la veno o o tana del visor de SPSS
C´ mo guardar y recuperar una ventana del visor de resultados de SPSS o

Antes de cerrar una ventana del visor de resultados, el sistema nos pregunta si queremos guardar los resultados. La forma de guardar esta ventana de resultados es la habitual en una aplicaci´ n Windows; pero la extensi´ n de este documento o o

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

30

ha de ser .spo. Si guardamos una ventana de resultados podremos recuperarla en cualquier otra sesi´ n. Para ello tenemos o que abrir la ventana del visor de resultados (con Archivo ⇒Nuevo ⇒Resultados) y en ella seleccionar Archivo ⇒Abrir. 2.2.2. C´ mo controlar la visualizaci´ n de la informaci´ n sobre variables y valores de datos en las tablas pivote y o o o en los titulares

Ahora que hemos obtenido las dos primeras tablas pivote (las dos tablas que se pueden ver en la ventana del visor de resultados de la Figura 39) quisiera se˜ alar que es posible controlar la visualizaci´ n de la informaci´ n sobre variables n o o ´ y valores de datos en las tablas pivote y en los titulares. Esta tarea se realiza mediante Edicion ⇒Opciones ⇒Carpeta de Etiquetas de los resultados. Entonces aparece el cuadro de di´ logo de la Figura 40. a Se pueden visualizar los nombres de las variables, las etiquetas de las variables, los valores reales de los datos, las etiquetas definidas para estos datos, o una combinaci´ n de estas opciones. Tengamos en cuenta que las etiquetas de las o variables y las etiquetas de los valores pueden facilitar la interpretaci´ n de los resultados; pero tambi´ n es cierto que las o e etiquetas largas pueden crear dificultades en algunas tablas. Por tanto, en cada caso elegiremos las opciones que m´ s nos a convengan. Las opciones de etiquetas de los resultados afectan s´ lo a los nuevos resultados que se producen despu´ s de cambiar o e las selecciones. A los resultados que ya se muestran en el visor no les afectan los cambios en la configuraci´ n. Esta o configuraci´ n s´ lo afecta a los resultados de las tablas pivote. Los resultados de texto no se ver´ n afectados por estas o o a selecciones. Por ejemplo, si queremos que tanto en los t´tulos como dentro de las tablas pivote figuren s´ lo los nombres (y no las ı o etiquetas) de las variables y de sus resultados, tenemos que elegir las cuatro opciones que est´ n seleccionadas en la Figura a 40.

Figura 40: Carpeta de Etiquetas de los resultados, dentro de la opci´ n Edici´ n ⇒ Opciones o o

2.2.3.

C´ mo establecer el aspecto de las tablas pivote por defecto o

Para establecer el aspecto de tabla por defecto, utilizado para los resultados de nuevas tablas pivote, de la barra de ´ men´ s hay que seleccionar Edicion ⇒Opciones ⇒Carpeta de Tablas pivote. Aparece entonces el cuadro de di´ logo de la u a Figura 41. El apartado Aspectos de tabla puede controlar una variedad de atributos de tabla pivote, incluyendo la visualizaci´ n y o el ancho de las l´neas de cuadr´cula; el estilo, tama˜ o y color de la fuente; as´ como los colores de fondo. Se selecciona ı ı n ı un aspecto de tabla de la lista de archivos y se pulsa en Aceptar o Aplicar. Por defecto, la lista muestra los aspectos de tabla guardados en el directorio LOOKS del directorio donde se instal´ el programa. Se puede utilizar uno de los aspectos de o tabla que se incluyen en SPSS o bien crear uno propio en el editor de tablas pivote, para lo cual se hace doble clic sobre la tabla pivote (para poder editarla) y se selecciona Formato ⇒Aspectos de tabla. El bot´ n Examinar permite seleccionar un aspecto de tabla de otro directorio. o El bot´ n Establecer directorio de aspectos permite cambiar el directorio de aspectos por defecto. o El apartado Ajustar los anchos de columna para controla el ajuste autom´ tico de los anchos de columna en las tablas pivote: a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

31

Figura 41: Carpeta de Tablas pivote, dentro de la opci´ n Edici´ n ⇒ Opciones o o

´ Solo las etiquetas: Ajusta el ancho de columna al ancho de la etiqueta de la columna. As´ se generan tablas m´ s ı a compactas, pero no se mostrar´ n los valores de los datos m´ s anchos que la etiqueta (los asteriscos indican valores a a demasiado anchos para ser mostrados). Etiquetas y Datos: Ajusta el ancho de columna al m´ s ancho de entre la etiqueta de columna y el mayor de los valores a de los datos. As´ se generan tablas m´ s anchas, pero se asegura que se mostrar´ n todos los valores. ı a a ´ El apartado Modo de edicion por defecto controla la activaci´ n de las tablas pivote en la ventana del visor o en una ventana o ´ independiente. Por defecto, cuando se pulsa dos veces en una tabla pivote, esta se activa en la ventana del visor. Se puede elegir entre activar las tablas pivote en una ventana independiente o seleccionar una opci´ n de tama˜ o que abra las tablas o n pivote m´ s peque˜ as en la ventana del visor y las m´ s grandes en una ventana independiente. a n a

2.2.4.

C´ mo cambiar las especificaciones del visor de resultados de SPSS por defecto o

´ Para establecer las especificaciones del visor de resultados de SPSS por defecto hay que seleccionar Edicion ⇒Opciones ⇒Carpeta de Visor. Aparece entonces el cuadro de di´ logo de la Figura 42. Las opciones de salida del visor s´ lo afectan a a o

Figura 42: Carpeta de Visor, dentro de la opci´ n Edici´ n ⇒ Opciones o o

los resultados obtenidos tras el cambio de la configuraci´ n. A los resultados que ya se muestran en el visor no les afectan o

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

32

los cambios en la configuraci´ n. o El apartado Estado inicial de los resultados controla los elementos que se muestran y se ocultan autom´ ticamente cada vez a que se ejecuta un procedimiento, adem´ s de la alineaci´ n inicial de los elementos. Se puede controlar la visualizaci´ n de a o o los siguientes elementos: registro, advertencias, notas, t´tulos, tablas pivote, gr´ ficos y resultados de texto (los resultados ı a que no se muestran en las tablas pivote). Todos los elementos de resultados aparecen alineados a la izquierda en el visor. Las selecciones de justificaci´ n s´ lo o o afectar´ n a la alineaci´ n de los resultados impresos. Los elementos con alineaci´ n centrada y a la derecha se identifican a o o por un peque˜ o s´mbolo situado encima y a la izquierda del elemento. n ı Fuente del t´tulo controla el estilo, el tama˜ o y el color de la fuente de los nuevos t´tulos de resultados. ı n ı Fuente del t´tulo de p´ gina controla el estilo, el tama˜ o y el color de la fuente de los nuevos t´tulos de p´ ginas. ı a n ı a ˜ Tamano de p´ gina de los resultados de texto controla el ancho de p´ gina (expresado en n´ mero de caracteres) y el largo a a u de p´ gina (expresado en n´ mero de l´neas) en los resultados de texto. En algunos procedimientos, algunos estad´sticos se a u ı ı muestran s´ lo en formato ancho. o Fuentes de los resultados de texto controla las fuentes utilizadas para los resultados de texto. Los resultados de texto se han dise˜ ado para utilizarlos con Fuentes de paso fijo. Si se selecciona una fuente que no sea de paso fijo, los resultados n tabulares no se alinear´ n adecuadamente. a

2.3.
2.3.1.

Medidas descriptivas de los datos
Mediante la opci´ n Analizar ⇒Estad´sticos descriptivos ⇒Frecuencias o ı

Como ya hemos dicho, para obtener las medidas descriptivas de una muestra de datos se selecciona la opci´ n Analizar o ⇒Estad´sticos descriptivos ⇒Frecuencias. Como tambi´ n hemos dicho, en primer lugar hay que seleccionar, en el cuadro de ı e di´ logo de la Figura 38, la variable o variables de las cuales se quiere calcular sus medidas descriptivas, y a continuaci´ n a o se pulsa en el bot´ n Estad´sticos. Entonces aparece el cuadro de di´ logo de la Figura 43. En este cuadro tenemos: o ı a

Figura 43: Cuadro de di´ logo para seleccionar las medidas descriptivas o estad´sticos a ı

Valores percentiles. Si se quieren calcular los cuartiles hay que activar Cuartiles. Si se desea calcular los valores que dividen la muestra ordenada en n partes iguales hay que activar Puntos de corte para 2 grupos iguales. Por defecto, si se activa esta opci´ n, se calculan los deciles (en 2 hay un 10). Para obtener otros percentiles hay que activar o Percentiles y especificar el porcentaje. Para lograr una lista de ellos se pulsa, tras cada uno de ellos, el bot´ n Anadir; o ˜ para cambiar alguno de ellos se pulsa el bot´ n Cambiar; y para borrar alguno de los especificados se pulsa el bot´ n o o Borrar. Hay que tener en cuenta una cuesti´ n importante: el sistema no calcula los percentiles de la misma forma en que o lo hemos explicado en clase, pero el c´ lculo es correcto en ambos casos, pues lo importante es que verifique su a definici´ n: un percentil (o cuantil) al r % es aquel valor que deja a su izquierda el r % de las observaciones y a su o derecha el (100 − r) % restante. Tendencia central. Los estad´sticos o medidas descriptivas de tendencia central que se calculan son: Media, Mediana, Moda ı y Suma de todos los valores. Dispersi´ n. Los estad´sticos o medidas descriptivas de dispersi´ n que se calculan son: Desv. t´pica (es, en realidad, la o ı o ı cuasidesviaci´ n t´pica S), Varianza (es, en realidad, la cuasivarianza S 2 ), Amplitud (es el rango o recorrido total o ı √ R = xmax − xmin ), M´nimo (xmin ), M´ ximo (xmax ) y E. T. media (error t´pico de la media: S/ n). ı a ı

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

33

Una vez hallada la cuasivarianza, S 2 , (que aqu´ se llama Varianza) podemos hallar la varianza, s2 , ya que: ı n s2 = (n − 1) S 2 n−1 2 S . n En consecuencia, una vez hallada la cuasidesviaci´ n t´pica, S, es posible calcular la desviaci´ n t´pica, s, mediante: o ı o ı s2 = s= n−1 2 S = n n−1 S. n y por tanto

Distribuci´ n. Activando las opciones Asimetr´a y Curtosis se calculan las medidas de forma: coeficientes de asimetr´a y o ı ı curtosis (apuntamiento). Los valores son puntos medios de grupos. Si se han agrupado los datos en intervalos, se pueden estimar los percentiles para los datos originales, es decir, sin agrupar, suponiendo que los casos se distribuyen uniformemente en cada grupo. Por supuesto carece de sentido aplicarlo a variables no agrupadas en intervalos. Se podr´a aplicar a variables ı no agrupadas en intervalos considerando que los intervalos tienen una amplitud unitaria (por supuesto, los percentiles no coinciden con los calculados de la forma anterior).

Figura 44: Medidas descriptivas o estad´sticos de la variable altura ı

Con los datos del fichero Libros.sav, en el cuadro de di´ logo de la Figura 38 seleccionamos la variable altura, dejamos a activada (marcada) la opci´ n Mostrar tablas de frecuencias y pulsamos el bot´ n Estad´sticos. En el cuadro de di´ logo que o o ı a aparece (Figura 43) seleccionamos todas los estad´sticos o medidas descriptivas, excepto Puntos de corte para 2 grupos ı iguales, Percentiles y, por supuesto, Los valores son puntos medios de grupos. Pulsamos Continuar y luego Aceptar. Entonces, en la ventana del visor de resultados aparecen dos tablas: una con las medidas descriptivas o estad´sticos (tabla de la Figura ı 44) y otra con la distribuci´ n de frecuencias (tabla de la Figura 45). o Retomamos ahora los datos del n´ mero de palabras por l´nea de una p´ gina de un libro: u ı a
palabras por l´nea ı frecuencia absoluta 4 1 5 1 8 2 9 3 10 2 11 7 12 11 13 14 14 3 15 2 16 1 17 1

que estaban grabados en el fichero PalabrasPorLinea.sav. Recordemos que en dicho fichero tambi´ n est´ grabada la pone a deraci´ n que hicimos en el apartado 1.15: los datos de la primera columna (que contiene los resultados de la variable) o est´ n ponderados mediante la segunda columna (que tiene las correspondientes frecuencias absolutas). a Vamos a obtener las principales medidas descriptivas de la variable palabras y la tabla con la distribuci´ n de frecueno cias. Para ello, en el cuadro de di´ logo de la Figura 38 seleccionamos la variable palabras para ponerla en el recuadro a Variables. En este cuadro de di´ logo tenemos que dejar activada la opci´ n Mostrar tablas de frecuencias pues queremos que a o

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

34

Figura 45: Distribuci´ n de frecuencias de la variable altura o

aparezca la distribuci´ n de frecuencias. En este mismo cuadro de di´ logo pulsamos el bot´ n Estad´sticos y aparece el cuadro o a o ı ´ de di´ logo de la Figura 43. En el seleccionamos los estad´sticos o medidas descriptivas que deseemos, por ejemplo, los a ı cuartiles, los deciles, la media, la cuasivarianza, el valor m´nimo y el valor m´ ximo. Por supuesto, la opci´ n Los valores ı a o son puntos medios de grupos tiene que estar desactivada pues los valores que aparecen en la primera columna del fichero de datos PalabrasPorLinea.sav no son las marcas de clase de unos intervalos, sino que son los resultados reales de la variable en la muestra. Tras pulsar el bot´ n Continuar en el cuadro de la Figura 43; y el bot´ n Aceptar en el de la Figura 38 nos o o aparece, en la ventana del visor de resultados, la tabla con la distribuci´ n de frecuencias (tabla de la Figura 46) y la tabla o con los estad´sticos seleccionados (tabla de la Figura 47). En este ejemplo, como la cuasivarianza es S 2 = 5 76, entonces ı la varianza es: n−1 2 47 s2 = S = 5 76 = 5 64 . n 48

Figura 46: Distribuci´ n de frecuencias de la variable palabras o

2.3.2.

Mediante la opci´ n Analizar ⇒Estad´sticos descriptivos ⇒Descriptivos o ı

Las medidas descriptivas se pueden obtener tambi´ n mediante la opci´ n Analizar ⇒Estad´sticos descriptivos ⇒Descriptivos. e o ı Nos aparece entonces el cuadro de di´ logo de la Figura 48. Si se seleccionan las variables y a continuaci´ n se pulsa en a o Aceptar, entonces se calculan s´ lo las siguientes medidas descriptivas: N (tama˜ o muestral), M´nimo, M´ ximo, Media y o n ı a Desv. t´pica (cuasidesviaci´ n t´pica). Con el fin de obtener otros estad´sticos se pulsa el bot´ n Opciones... del cuadro de ı o ı ı o ´ di´ logo de la Figura 48 y entonces aparece el cuadro de la Figura 49. En este cuadro, lo unico que es distinto de lo que a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

35

Figura 47: Medidas descriptivas o estad´sticos de la variable palabras ı

Figura 48: Cuadro de di´ logo de la opci´ n Analizar ⇒Estad´sticos descriptivos ⇒Descriptivos a o ı

aparece en el cuadro de la Figura 43 es lo siguiente: ´ Orden de visualizacion: Por defecto, las variables se muestran en el orden en que se hayan seleccionado. Si se desea, se pueden mostrar las variables alfab´ ticamente, por medias ascendentes o por medias descendentes. e Las diferencias de este procedimiento (Analizar ⇒Estad´sticos descriptivos ⇒Descriptivos) con el procedimiento anterior ı (Analizar ⇒Estad´sticos descriptivos ⇒Frecuencias) son: ı En este procedimiento, en la lista de variables del cuadro de di´ logo s´ lo nos aparecen las que son cuantitativas. En a o el otro aparecen todas. Con este procedimiento, si se eligen varias variables, los resultados se muestran en una misma tabla. Adem´ s, las a variables se pueden ordenar por el tama˜ o de sus medias (en orden ascendente o descendente), alfab´ ticamente o n e por el orden en el que se seleccionen las variables (el valor por defecto). Adem´ s, este procedimiento calcula valores tipificados (puntuaciones z=[x-Media]/Desviaci´ n t´pica). Cuando se a o ı ´ guardan las puntuaciones z, estas se a˜ aden a los datos en la carpeta Vista de datos de la ventana del editor de datos, n quedando disponibles para los gr´ ficos, el listado de los datos y los an´ lisis. Cuando las variables se registran en a a

Figura 49: Cuadro de di´ logo de las Opciones dadas en Analizar ⇒Estad´sticos descriptivos ⇒Descriptivos a ı

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

36

unidades diferentes, una transformaci´ n de este tipo (puntuaci´ n z) pondr´ las variables en una escala com´ n para o o a u una comparaci´ n visual m´ s f´ cil. o a a 2.3.3. Mediante la opci´ n Analizar ⇒Estad´sticos descriptivos ⇒Explorar o ı

Una tercera forma de obtener las medidas descriptivas es mediante la opci´ n Analizar ⇒Estad´sticos descriptivos ⇒Explorar. o ı ´ ´ Con este procedimiento se generan estad´sticos de resumen y representaciones gr´ ficas, o para todos los casos o de forma ı a separada para grupos de casos. Existen numerosas razones para utilizar este procedimiento: para inspeccionar los datos, identificar valores at´picos, obtener descripciones, comprobar supuestos y caracterizar diferencias entre subpoblaciones ı (grupos de casos). La inspecci´ n de los datos puede mostrar que existen valores inusuales, valores extremos, discono tinuidades en los datos u otras peculiaridades. La exploraci´ n de los datos puede ayudar a determinar si son adecuadas o las t´ cnicas estad´sticas que est´ teniendo en consideraci´ n para el an´ lisis de los datos. La exploraci´ n puede indicar que e ı a o a o necesita transformar los datos si la t´ cnica necesita una distribuci´ n normal. O bien, el usuario puede decidir que necesita e o utilizar pruebas no param´ tricas. e Cuando seleccionamos la opci´ n Analizar ⇒Estad´sticos descriptivos ⇒Descriptivos nos aparece entonces el cuadro de o ı di´ logo de la Figura 50. a

Figura 50: Cuadro de di´ logo de la opci´ n Analizar ⇒Estad´sticos descriptivos ⇒Explorar a o ı

A partir de nuestro fichero Libros.sav, vamos a obtener las principales medidas descriptivas o estad´sticos de la variı able precio para cada uno de los cinco grupos (E=estad´stica, G=geograf´a, I=inform´ tica, L=literatura, H=historia) de ı ı a la variable materia. Para ello, en el cuadro de di´ logo de la Figura 50 seleccionamos la variable precio para ponerla en a Dependientes y la variable materia para ponerla en Factores; activamos la opci´ n Mostrar ... Estad´sticos y pulsamos el bot´ n o ı o Aceptar. Entonces obtenemos la tabla de la Figura 51. La opci´ n Analizar ⇒Estad´sticos descriptivos ⇒Explorar ofrece muchas m´ s posibilidades, que se pueden consultar en o ı a la Ayuda de SPSS.

2.4.

Representaciones gr´ ficas unidimensionales a

Una de las formas de obtener las representaciones gr´ ficas m´ s usuales de las distribuciones de frecuencias es seleca a cionar Analizar ⇒Estad´sticos descriptivos ⇒Frecuencias. Como hemos dicho anteriormente, en primer lugar hay que elegir, ı en el cuadro de di´ logo de la Figura 38, la variable o variables de las cuales se quiere obtener su representaci´ n gr´ fica, a o a y a continuaci´ n hay que pulsar el bot´ n Gr´ ficos. Entonces aparece el cuadro de di´ logo de la Figura 52. En este cuadro o o a a tenemos: Tipo de gr´ fico. Los gr´ ficos de sectores muestran la contribuci´ n de las partes a un todo. Cada sector de un gr´ fico de a a o a ´ este tipo corresponde a un grupo, definido por una unica variable de agrupaci´ n. Los gr´ ficos de barras muestran la o a frecuencia de cada valor o categor´a distinta como una barra diferente, permitiendo comparar las categor´as de forma ı ı visual. Los histogramas tambi´ n cuentan con barras, pero se representan a lo largo de una escala de intervalos iguales. e La altura de cada barra es el recuento de los valores que est´ n dentro del intervalo para una variable cuantitativa. a Una curva normal superpuesta en un histograma ayuda a juzgar si los datos est´ n normalmente distribuidos. a Valores del gr´ fico. Para los gr´ ficos de barras se puede etiquetar el eje vertical con las frecuencias (absolutas) o los a a porcentajes.

Con los datos del fichero Libros.sav vamos a obtener el diagrama de barras de frecuencias absolutas de la variable altura. Para ello, en el cuadro de di´ logo de la Figura 38 seleccionamos la variable altura para ponerla en el recuadro a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

37

Figura 51: Medidas descriptivas de la variable precio para cada uno de los grupos definidos por la variable materia

Figura 52: Cuadro de di´ logo para seleccionar el tipo de gr´ fico a a

Variables. En este cuadro de di´ logo desactivamos la opci´ n Mostrar tablas de frecuencias pues no queremos que aparezca la a o distribuci´ n de frecuencias. En este mismo cuadro de di´ logo pulsamos el bot´ n Gr´ ficos y aparece el cuadro de di´ logo o a o a a de la Figura 52. En el apartado Tipo de gr´ fico seleccionamos Gr´ ficos de barras; y en el apartado Valores del gr´ fico elegimos a a a Frecuencias. Tras pulsar Continuar y Aceptar nos aparece, en la ventana del visor de resultados, el gr´ fico de la Figura 53. a

Volvamos otra vez a los datos del n´ mero de palabras por l´nea de una p´ gina de un libro: u ı a
palabras por l´nea ı frecuencia absoluta 4 1 5 1 8 2 9 3 10 2 11 7 12 11 13 14 14 3 15 2 16 1 17 1

grabados en el fichero PalabrasPorLinea.sav. Vamos a obtener el diagrama de barras de porcentajes de la variable palabras. Para ello, en el cuadro de di´ logo a de la Figura 38 seleccionamos la variable palabras para ponerla en el recuadro Variables. En este cuadro de di´ logo a desactivamos la opci´ n Mostrar tablas de frecuencias pues no queremos que aparezca la distribuci´ n de frecuencias. En o o este mismo cuadro de di´ logo pulsamos el bot´ n Gr´ ficos y aparece el cuadro de di´ logo de la Figura 52. En el apartado a o a a Tipo de gr´ fico seleccionamos Gr´ ficos de barras; y en el apartado Valores del gr´ fico elegimos Porcentajes. Tras pulsar Continuar a a a y Aceptar nos aparece, en la ventana del visor de resultados, el gr´ fico de la Figura 54. a § ¤ Observaci´ n ¥ aspecto de cualquier gr´ fica se puede modificar y mejorar a gusto del usuario (consultar el apartado 2.4.3). Concretamente, las o El a ¦
representaciones gr´ ficas de las Figuras 53 y 54 han sido modificadas con el editor de gr´ ficos. a a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

38

Figura 53: Diagrama de barras de frecuencias absolutas de la variable altura

Figura 54: Diagrama de barras de porcentajes de la variable palabras

2.4.1.

C´ mo cambiar las especificaciones de las representaciones gr´ ficas por defecto o a

Ahora que hemos hecho nuestros primeros gr´ ficos, quisiera se˜ alar que las especificaciones generales de las repa n ´ resentaciones gr´ ficas se pueden cambiar mediante Edicion ⇒Opciones ⇒Carpeta de Gr´ ficos. Nos aparece entonces el a a cuadro de di´ logo de la Figura 55. Los distintos apartados de este cuadro de di´ logo son: a a Plantilla gr´ fica. Los gr´ ficos nuevos pueden utilizar tanto las opciones seleccionadas aqu´, como las opciones de un a a ı archivo de plantilla gr´ fica. Se puede pulsar en Examinar para seleccionar un archivo de plantilla gr´ fica. a a Relaci´ n de aspecto del gr´ fico. Este apartado sirve para fijar la relaci´ n ancho-alto del marco exterior de los nuevos o a o gr´ ficos. Se puede especificar una relaci´ n ancho-alto entre los valores 0 1 y 10. Los valores inferiores a 1 generan a o gr´ ficos que son m´ s altos que anchos. Los valores mayores que 1 producen gr´ ficos que son m´ s anchos que altos. a a a a Un valor de 1 produce un gr´ fico cuadrado. (La relaci´ n que yo habitualmente utilizo es de 1 5 sino no hay leyendas a o en los gr´ ficos, y de 1 8 si las hay.) En este cuadro de di´ logo la separaci´ n decimal hay que ponerla con una coma a a o abajo. Fuente. Aqu´ se fija la fuente utilizada para todo el texto en los nuevos gr´ ficos. Por defecto es Arial. ı a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

39

Figura 55: Carpeta de Gr´ ficos, dentro de la opci´ n Edici´ n ⇒ Opciones a o o

Tramas de relleno y estilos de l´nea. Se hace la asignaci´ n inicial de colores y tramas para nuevos gr´ ficos: ı o a Recorrer los colores y despu´ s las tramas utiliza la paleta por defecto de 14 colores y luego a˜ ade tramas a los e n colores si es necesario. Recorrer las tramas s´ lo utiliza tramas para diferenciar los elementos de los gr´ ficos y no utiliza color. o a Marco. Controla la visualizaci´ n de los marcos interno y externo en los nuevos gr´ ficos. o a L´neas de cuadr´cula. Controla la visualizaci´ n de las l´neas de cuadr´cula en el eje de escala (eje vertical) y en el eje de ı ı o ı ı categor´as (eje horizontal) de los nuevos gr´ ficos. ı a 2.4.2. ´ Creaci´ n de diagramas de barras, l´neas, areas y sectores o ı

Adem´ s de con la opci´ n Analizar ⇒Estad´sticos descriptivos ⇒Frecuencias, las representaciones gr´ ficas tambi´ n se a o ı a e pueden obtener a partir del men´ Gr´ ficos de la barra de men´ s de SPSS. Este men´ brinda muchas posibilidades, por lo u a u u que voy a dedicar esta secci´ n y las tres siguientes a explicar esta opci´ n con m´ s detenimiento. o o a En esta secci´ n se van a dar con m´ s detalle las explicaciones correspondientes a los diagramas de barras pues las o a ´ posibilidades de los otros tres tipos de diagramas (l´neas, areas y sectores) son similares. ı Para obtener el diagrama de barras de la distribuci´ n de frecuencias de una variable se selecciona Gr´ ficos ⇒Barras. o a Con esta opci´ n aparece el cuadro de di´ logo de la Figura 56. o a

Figura 56: Cuadro de di´ logo para hacer un diagrama de barras mediante Gr´ ficos ⇒ Barras a a

Las alternativas que se ofrecen se refieren a dos aspectos: En la mitad superior de cuadro de di´ logo se nos presentan tres tipos de iconos seg´ n la forma general del diagrama a u de barras: Simple. Las barras representan elementos del mismo conjunto.

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

40

Figura 57: Cuadro de di´ logo para hacer un diagrama de barras Simple con la opci´ n Res´ menes para grupos de casos a o u

Agrupado. Las barras, agrupadas, representan elementos de distintos conjuntos. Apilado. Las barras, apiladas, representan elementos de distintos conjuntos. En la mitad inferior de cuadro de di´ logo, en Los datos del gr´ fico son, se puede seleccionar la estructura de los datos: a a ´ Resumenes para grupos de casos. Cada barra representa la frecuencia de cada categor´a de una variable. ı Si en el cuadro de la Figura 56 elegimos el icono Simple y en Los datos del gr´ fico son activamos la opci´ n a o Resumenes para grupos de casos, entonces aparece el cuadro de di´ logo de la Figura 57. En este cuadro de ´ a di´ logo, en Eje de categor´as se selecciona la variable cuya distribuci´ n de frecuencias se desea representar. Por a ı o defecto, haciendo clic en Aceptar, se obtiene la gr´ fica en que cada barra representa la frecuencia absoluta de a cada categor´a. Sin embargo, se pueden seleccionar otros tipos de frecuencias en Las barras representan: ı N§ de casos. Frecuencia absoluta de cada categor´a. ı N§ acumulado de casos. Frecuencia absoluta acumulada de cada categor´a. ı % de casos. Porcentaje de casos de cada categor´a sobre el total. ı % acumulado de casos. Porcentaje acumulado de casos de cada categor´a. ı Otra funci´ n de resumen. El eje vertical, as´ como la altura de cada barra se asocia a otra variable que es o ı especificada en el recuadro Variable. Haciendo clic en el bot´ n Cambiar resumen se accede al cuadro de o di´ logo de la funci´ n de resumen, que se examinar´ en el apartado 2.4.6. a o a Por ejemplo, en el cuadro de di´ logo de la Figura 56 seleccionamos el icono Simple; en Los datos del gr´ fico a a son activamos la opci´ n Resumenes para grupos de casos; pulsamos Definir; en Eje de categor´as del nuevo cuadro o ´ ı de di´ logo (Figura 57) ponemos la variable materia; y en Las barras representan seleccionamos % de casos. a Entonces obtenemos el diagrama de barras de porcentajes correspondiente a la variable materia, que es el gr´ fico de la Figura 58. a Como novedad sobre lo ya expuesto, los diagramas de barras agrupadas y apiladas ofrecen la posibilidad de seleccionar una nueva variable para determinar las barras dentro de cada grupo o de cada apilamiento (ver la Figura 59); esto se realiza a trav´ s de Definir grupos por (o Definir las pilas por) respectivamente, apareciendo tal e variable y sus valores en la leyenda adjunta al diagrama ya obtenido. Por ejemplo, en el cuadro de di´ logo de la Figura 56 seleccionamos el icono Agrupado; en Los datos del gr´ fico a a son activamos la opci´ n Resumenes para grupos de casos; en Eje de categor´as ponemos la variable materia; y en o ´ ı Definir grupos por seleccionamos la variable opini´ n1, entonces obtenemos el diagrama de barras de frecuencias o absolutas de la Figura 60. Si ahora hacemos lo mismo cambiando la opci´ n Agrupado por Apilado entonces o obtenemos el diagrama de barras de frecuencias absolutas de la variable materia con barras apiladas en grupos definidos por la variable opini´ n1, que es el gr´ fico de la Figura 61. o a ´ Resumenes para distintas variables. Cada barra representa una misma modalidad de dos o m´ s variables. Para a poder seleccionar esta opci´ n es necesario que los resultados de esas variables est´ n clasificados en las mismas o e categor´as. ı Si en el cuadro de la Figura 56 elegimos el icono Simple; en Los datos del gr´ fico son activamos la opci´ n a o Resumenes para distintas variables y pulsamos Definir; entonces, en el cuadro de di´ logo que aparece (Figura ´ a 62), debemos seleccionar las variables para colocarlas en el recuadro Las barras representan. Esto se consigue haciendo doble clic sobre los nombres (o etiquetas) de dichas variables. Por defecto, haciendo clic en Aceptar, cada barra representa la media aritm´ tica de cada variable. Si queremos cambiar la funci´ n que representa cada e o

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

41

Figura 58: Diagrama de barras de porcentajes de la variable materia

Figura 59: Cuadro de di´ logo para hacer un diagrama de barras Agrupado con la opci´ n Res´ menes para grupos de casos a o u

Figura 60: Diagrama de barras de la variable materia en grupos definidos por la variable opini´ n1 o

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

42

Figura 61: Diagrama de barras de la variable materia apiladas en grupos definidos por la variable opini´ n1 o

Figura 62: Cuadro de di´ logo para hacer un diagrama de barras Simple con la opci´ n Res´ menes para distintas variables a o u

barra, debemos seleccionar (una por una) las variables que est´ n en el recuadro de Las barras representan y a despu´ s pulsar el bot´ n Cambiar resumen (ver el apartado 2.4.6). No es preciso seleccionar el mismo estad´stico e o ı para todas las variables, aunque esta posibilidad no tenga excesivo sentido. Por ejemplo, un diagrama de este tipo con las variables opini´ n1, opini´ n2 y opini´ n3 es el de la Figura 63. o o o En este gr´ fico se han modificado las funciones de resumen para que aparezcan comparadas las medianas de a las tres variables en vez de las medias aritm´ ticas (seleccionar, una por una, cada una de las tres variables, e pulsar Cambiar resumen y elegir Mediana) . En los diagramas de barras agrupadas y apiladas se puede (igual que antes) seleccionar, en Eje de categor´as, ı una nueva variable a partir de la cual se crea un grupo o un apilamiento de barras. En este caso, en la leyenda adjunta al diagrama aparecen las variables seleccionadas en Las barras representan. Valores individuales de los casos. Cada barra representa un caso, lo que quiere decir que en muestras grandes la gr´ fica ser´a muy dif´cil de interpretar. a ı ı Si en el cuadro de di´ logo de la Figura 56 seleccionamos Simple y Valores individuales de los casos y pulsamos a Definir, entonces aparece el cuadro de di´ logo de la Figura 64. En este cuadro, en Las barras representan se a selecciona una variable en el caso de un diagrama simple y el resultado es que cada barra representa el valor que cada caso toma en esa variable. Esto quiere decir que tal variable debe ser cuantitativa. En los casos de diagramas agrupados o apilados hay que seleccionar, evidentemente, m´ s de una variable. a En Etiquetas de las categor´as se puede especificar la etiqueta de cada barra: ı ´ • Numero del caso: Por defecto, cada barra es etiquetada por el n´ mero del caso al que representa. u

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

43

Figura 63: Comparaci´ n de las medianas de las variables opini´ n1, opini´ n2 y opini´ n3 o o o o

Figura 64: Cuadro de di´ logo para hacer un diagrama de barras Simple con la opci´ n Valores individuales de los casos a o

• Variable: Cada barra es etiquetada por el valor que su correspondiente caso adopta en la variable ahora declarada. En la leyenda adjunta al diagrama se muestran los nombres de las variables en los casos de diagramas agrupados o apilados. Por ejemplo, si seleccionamos la variable pr´ stamo en Las barras representan y en Etiquetas de las categor´as e ı dejamos la opci´ n por defecto (Numero del caso) obtenemos el diagrama de barras de la Figura 65. o ´

Se puede observar que en el cuadro de di´ logo inicial (Figuras 57, 59 y 62), excepto cuando se trata de los valores a individuales de los casos (Figura 64), se encuentran dos botones, uno referido a T´tulos y el otro a Opciones; as´ como un ı ı bloque titulado Plantilla, que para pr´ cticamente todos los tipos de gr´ ficas son an´ logos. Estas tres cuestiones se tratar´ n a a a a en los apartados 2.4.7, 2.4.8 y 2.4.9, respectivamente. ´ Los diagramas de l´neas, areas y sectores se realizan de forma totalmente an´ loga a los de barras. De todas formas, se ı a puede construir siempre el diagrama de barras y luego se puede utilizar el editor de gr´ ficos (ver el apartado siguiente) para a cambiar a cualquier otro tipo de gr´ fico (con el men´ Galer´a del editor de gr´ ficos). Por ejemplo, el diagrama de sectores a u ı a de la variable materia es el de la Figura 66. El diagrama de l´neas de porcentajes (pol´gono de porcentajes) de la variable ı ı ´ materia es el gr´ fico de la Figura 67. El diagrama de areas de la variable materia apiladas seg´ n los grupos definidos por a u la variable opini´ n1 es el gr´ fico de la Figura 68. o a 2.4.3. ´ Edici´ n y modificaci´ n de diagramas de barras, l´neas, areas y sectores o o ı

Igual que en el apartado anterior, se van a dar con m´ s detalle las explicaciones correspondientes a los diagramas de a barras. La extrapolaci´ n a los otros tipos de diagramas es sencilla. o Una vez obtenido el diagrama de barras y para proceder a su modificaci´ n hay que editarlo haciendo doble clic dentro o del gr´ fico en el visor de resultados de SPSS. Al hacerlo, entramos en la ventana del editor de gr´ ficos. Una vez que a a estamos en la ventana del editor de gr´ ficos (que es conveniente maximizar) se pueden realizar, entre otras, las siguientes a modificaciones. Para modificar el estilo de las barras hay que seleccionar Formato ⇒Estilos de barra de la barra de men´ s del editor de u gr´ ficos. En el cuadro de di´ logo que aparece (Figura 69) hay que elegir el formato de barras deseado (normal, sombreado a a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

44

Figura 65: Las barras representan los resultados de la variable pr´ stamo para cada caso (libro) e

Figura 66: Diagrama de sectores de la variable materia

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

45

Figura 67: Pol´gono de porcentajes de la variable materia ı

Figura 68: Diagrama de areas de la variable materia apiladas seg´ n los grupos definidos por la variable opini´ n1 u o ´

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

46

Figura 69: Cuadro para cambiar el estilo de las barras de un diagrama de barras

Figura 70: Cuadro para cambiar la trama de relleno de un diagrama de barras

o con efecto de tres dimensiones) y luego hay que pulsar los botones Aplicar a todo y Cerrar. Para cambiar la trama de relleno se seleccionan las barras que se quieren cambiar (haciendo clic sobre una de ellas), se elige la opci´ n Formato ⇒Trama de relleno de la barra de men´ s del editor de gr´ ficos, y en el cuadro de di´ logo que aparece o u a a (Figura 70) se selecciona la trama deseada haciendo clic sobre ella. Cada vez que modifiquemos la trama de relleno de un grupo de barras, tenemos que pulsar en Aplicar. Para hacer efectivas todas las modificaciones de las tramas de relleno hay que hacer clic en Cerrar. Si queremos cambiar el color de cualquier elemento de un diagrama de barras, seleccionamos dicho elemento haciendo ´ clic sobre el, y despu´ s elegimos la opci´ n Formato ⇒Color. En el cuadro de di´ logo que resulta (Figura 71) se activa e o a Relleno o Borde, y se selecciona el color deseado haciendo clic sobre dicho color. Cada vez que modifiquemos el color de un elemento, tenemos que pulsar en Aplicar. Para hacer efectivas todas las modificaciones del color hay que hacer clic en Cerrar. Para modificar el texto y las etiquetas del eje horizontal tenemos que hacer doble clic sobre dicho eje (o seleccionar ˜ la opci´ n Diseno ⇒Ejes ⇒Categor´a de la barra de men´ s del editor de gr´ ficos) y luego hacer los cambios deseados en el o ı u a cuadro de di´ logo que aparece (Figura 72). En este cuadro de di´ logo hay que pulsar el bot´ n Etiquetas para poder cambiar a a o las etiquetas de las categor´as o de los resultados de la variable representada en el eje horizontal. Al pulsar este bot´ n ı o aparece el cuadro de la Figura 73. An´ logamente, para modificar el texto y las etiquetas del eje vertical tenemos que hacer doble clic sobre dicho eje a ˜ (o seleccionar la opci´ n Diseno ⇒Ejes ⇒Escala de la barra de men´ s del editor de gr´ ficos) y luego hacer los cambios o u a deseados en el cuadro de di´ logo que aparece (Figura 74). En este cuadro de di´ logo hay que pulsar el bot´ n Etiquetas para a a o poder cambiar las etiquetas del eje vertical. Al pulsar este bot´ n aparece el cuadro de la Figura 75. o La opci´ n Estilos de etiquetas de barras del men´ Formato permite que aparezca¨ una etiqueta dentro de cada barra. Esta o u y etiqueta muestra el resultado de lo medido en el eje vertical para cada barra (ver Figura 76). Si se utilizan tramas o colores ´ oscuros, el estilo de etiqueta enmarcado proporcionar´ un area clara en la que la etiqueta podr´ leerse con mayor facilidad. a a Las etiquetas de las barras se muestran con el mismo n´ mero de decimales que las etiquetas del eje de escala (eje vertical). u Puede cambiarse el n´ mero de decimales haciendo clic dos veces en el eje vertical y, a continuaci´ n, eligiendo Etiquetas en u o el cuadro de di´ logo Eje de escala (ver Figura 75). a Si queremos modificar la fuente y el tama˜ o de cualquiera de los textos que aparecen en la gr´ fica, debemos seleccionar n a ´ dicho texto (haciendo clic sobre el) y despu´ s elegir la opci´ n Formato ⇒Texto (ver Figura 77). e o ˜ Para modificar el espaciado entre las barras debe seleccionarse Diseno ⇒Espaciado de barras y cambiar las especificaciones del cuadro de di´ logo que aparece (Figura 78). a

Figura 71: Cuadro para cambiar el color de un elemento de un diagrama de barras

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

47

Figura 72: Cuadro para modificar el texto y las etiquetas del eje horizontal de un diagrama de barras

Figura 73: Cuadro para editar las etiquetas del eje horizontal de un diagrama de barras

Figura 74: Cuadro para modificar el texto y las etiquetas del eje vertical de un diagrama de barras

Figura 75: Cuadro para cambiar las etiquetas del eje vertical de un diagrama de barras

Figura 76: Cuadro para que aparezcan etiquetas en las barras de un diagrama de este tipo

Figura 77: Cuadro para cambiar un texto de un diagrama de barras

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

48

Figura 78: Cuadro para modificar el espaciado entre las barras de un diagrama de este tipo

Figura 79: Cuadro para cambiar la leyenda de un diagrama de barras

Si el gr´ fico lleva una leyenda (por ejemplo, en el caso de un diagrama de barras apiladas o agrupadas) y queremos a modificarla, entonces tenemos que hacer doble clic sobre ella para que aparezca el cuadro de di´ logo de la Figura 79. a ˜ Tambi´ n podemos seleccionar la opci´ n Diseno ⇒Leyenda de la barra de men´ s del editor de gr´ ficos. En este cuadro de e o u a di´ logo podemos modificar el t´tulo, la justificaci´ n (a la izquierda, a la derecha o centrada) y las etiquetas de la leyenda. a ı o ´ ˜ An´ logamente, las opciones T´tulo, Nota a pie de p´ gina y Anotacion del men´ Diseno permiten crear y modificar un t´tulo a ı a u ı de la gr´ fica, una nota a pie de p´ gina y una anotaci´ n de la misma, respectivamente. a a o ˜ La opci´ n L´neas de referencia del men´ Diseno permite a˜ adir l´neas de referencia a los gr´ ficos existentes, tanto en o ı u n ı a el eje horizontal (eje de categor´as) como el eje vertical (eje de escala). Es posible a˜ adir, cambiar y eliminar l´neas de ı n ı referencia. ˜ Adem´ s, en el men´ Diseno se pueden activar y desactivar las opciones Marco exterior y Marco interior. El Marco interior a u contiene s´ lo las barras. El Marco exterior contiene todos los elementos de la gr´ fica (barras, ejes, etiquetas, t´tulo, nota a o a ı pie de p´ gina, leyenda, anotaci´ n, etc.). a o Para intercambiar los ejes se selecciona Formato ⇒Intercambiar ejes. As´, entre otras cosas, ocurrir´ que las barras ı a verticales se cambiar´ n por barras horizontales. a 2.4.4. Creaci´ n de histogramas o

Los histogramas no tienen las posibilidades gr´ ficas que ofrecen los diagramas de barras. Adem´ s, no es posible a a obtener el histograma de frecuencias acumuladas (ni los pol´gonos de frecuencias) con datos agrupados en intervalos. ı Para realizar un histograma se selecciona la opci´ n Gr´ ficos ⇒Histograma. Entonces aparece el cuadro de di´ logo de la o a a Figura 80. Tras seleccionar una sola variable (cuantitativa) en el recuadro Variable, con s´ lo hacer clic en Aceptar se obtienen o los resultados por defecto. A la gr´ fica se puede superponer la curva normal con la misma media y desviaci´ n t´pica que nuestra distribuci´ n de a o ı o frecuencias. Para ello se activa la opci´ n Mostrar curva normal. o Por ejemplo, el histograma correspondiente a la variable precio es el de la Figura 81.

Figura 80: Cuadro de di´ logo para hacer un histograma a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

49

Figura 81: Histograma correspondiente a la variable precio (sin modificaciones)

Figura 82: Cuadro para cambiar los intervalos de un histograma

2.4.5.

Edici´ n y modificaci´ n de histogramas o o

Una vez obtenido el histograma y para proceder a su modificaci´ n hay que editarlo haciendo doble clic dentro del o gr´ fico en el visor de resultados de SPSS. Al hacerlo, entramos en la ventana del editor de gr´ ficos. Una vez que estaa a mos en la ventana del editor de gr´ ficos (que es conveniente maximizar) se pueden realizar, entre otras, las siguientes a modificaciones. En primer lugar, hay que decir que mientras que en el diagrama de barras al eje horizontal se le llamaba eje de categor´as, ahora se le llama eje de intervalo. ı Es importante tambi´ n se˜ alar que es posible cambiar los intervalos en se divide el rango de valores de la variable. Para e n ˜ ello se hace doble clic sobre dicho eje (o se selecciona Diseno ⇒Ejes ⇒Intervalo ⇒Aceptar) y en el cuadro de di´ logo que a aparece (Figura 82) se activa la opci´ n Personalizado del grupo Intervalos y despu´ s se pulsa en Definir. Aparece entonces el o e ´ nuevo cuadro de di´ logo de la Figura 83. En este cuadro se tiene que seleccionar una de las opciones del grupo Definicion a para indicar de qu´ manera se desea especificar los intervalos. Es posible especificar tanto el n´ mero de intervalos como la e u amplitud de los mismos. El grupo Rango permite especificar el rango de los valores que se muestran en el eje. Los valores no incluidos en el rango no se muestran en los histogramas. ´ Pulsando en el bot´ n Etiquetas del cuadro de di´ logo de la Figura 82 aparece el cuadro de la Figura 84. En el se o a selecciona una de las opciones del grupo Mostrar para controlar la visualizaci´ n de las etiquetas de los ejes. La opci´ n o o Todas las etiquetas muestra una etiqueta por cada uno de los intervalos representados en el eje horizontal. La opci´ n Cada o n-´ sima etiqueta permite especificar un incremento que determine qu´ intervalos tendr´ n etiqueta. Si se ha optado por omitir e e a ´ algunas de las etiquetas, es posible desactivar la selecci´ n de Marcas de comprobacion para etiquetas omitidas para que los o intervalos sin etiqueta no muestren marcas de comprobaci´ n. El grupo Tipo permite controlar la manera en que se etiquetan o los intervalos. La opci´ n Punto medio etiqueta todos los intervalos con sus respectivos puntos medios. La opci´ n Rango o o etiqueta los intervalos con el rango de valores que abarca cada intervalo. Para controlar la cantidad de d´gitos decimales ı

Figura 83: Cuadro para definir los nuevos intervalos de un histograma

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

50

Figura 84: Cuadro para definir las etiquetas del eje horizontal de un histograma

Figura 85: Cuadro de di´ logo para cambiar la Funci´ n resumen a o

de las etiquetas de los ejes, se introduce el valor deseado en Cifras decimales. Para utilizar comas o puntos como separador de unidades de millar se selecciona Separador de millares. Es posible cambiar el factor de escala introduciendo un nuevo ´ valor en Factor de escala. La lista Orientacion permite controlar la orientaci´ n de las etiquetas (horizontal, vertical, diagonal, o escalonada). 2.4.6. Otras funciones sint´ ticas e

Como se ha dicho, haciendo clic en Cambiar resumen situado en los cuadros de di´ logo de algunos tipos de gr´ ficas (por a a ´ ejemplo, los de las Figuras 57, 59 y 62) se accede al cuadro de di´ logo Funcion de resumen (Figura 85). Aqu´ se presentan a ı las siguientes alternativas, referidas a la variable o variables (por ejemplo, cuando la estructura de los datos corresponde a Resumenes para distintas variables) declaradas en el recuadro en que Cambiar resumen puede tener efecto: ´ Media de los valores. Media aritm´ tica en cada categor´a (o de cada variable). e ı Mediana de valores. Mediana en cada categor´a (o de cada variable). ı Moda de valores. Moda en cada categor´a (o de cada variable). ı ´ Numero de casos. N´ mero efectivo de casos de cada categor´a (o de cada variable). u ı Suma de valores. Suma de los valores en cada categor´a (o de cada variable). ı Desviaci´ n t´pica. Cuasidesviaci´ n t´pica en cada categor´a (o de cada variable). o ı o ı ı Varianza. Cuasivarianza en cada categor´a (o de cada variable). ı Valor m´nimo. M´nimo valor en cada categor´a (o de cada variable). ı ı ı Valor m´ ximo. M´ ximo valor en cada categor´a (o de cada variable). a a ı Suma acumulada. Suma de los valores en cada categor´a y en todas las anteriores a ella. ı Porcentaje por encima. Porcentaje de casos con valores superiores al indicado en el recuadro de Valor en cada categor´a ı (o de cada variable).

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

51

Porcentaje por debajo. Porcentaje de casos con valores inferiores al indicado en el recuadro de Valor en cada categor´a ı (o de cada variable). Percentiles. El valor de los datos por debajo del cual se encuentra el porcentaje de valores especificado en Valor para cada categor´a (o de cada variable). ı ´ Numero por encima. N´ mero de casos con valores superiores al indicado en el recuadro Valor en cada categor´a (o de u ı cada variable). ´ Numero por debajo. N´ mero de casos con valores inferiores al indicado en el recuadro Valor en cada categor´a (o de cada u ı variable). Porcentaje dentro. Porcentaje de casos (en cada categor´a o de cada variable) con valores comprendidos entre los especiı ficados en los recuadros Menor y Mayor, incluidos ellos mismos. ´ Numero dentro. N´ mero de casos (en cada categor´a o de cada variable) con valores comprendidos entre los especificados u ı en los recuadros Menor y Mayor, incluidos ellos mismos. Los valores son puntos medios agrupados. Se obtienen los percentiles considerando que la variable en cuesti´ n repreo senta los puntos medios de los intervalos en que se ha agrupado la variable original. Por ejemplo, seleccionamos la opci´ n Gr´ ficos ⇒Barras. En el cuadro de di´ logo resultante (Figura 56) seleccionamos o a a Simple y Resumenes para grupos de casos. En el cuadro de di´ logo que aparece a continuaci´ n (Figura 57) seleccionamos la ´ a o ´ variable materia (disciplina cient´fica del libro) en Eje de categor´as. En dicho cuadro activamos Otra funcion de resumen y ı ı ´ ponemos la variable pr´ stamo (n´ mero de veces que se ha prestado el libro en el ultimo a˜ o) en Variable. Pulsamos el bot´ n e u n o Cambiar resumen y en el cuadro que aparece (Figura 85) seleccionamos Mediana de valores. El diagrama de barras resultante es el de la Figura 86.

Figura 86: Diagrama de barras de la variable materia respecto de la funci´ n Mediana de la variable pr´ stamo o e

2.4.7.

Cuadro de di´ logo de T´tulos a ı

Haciendo clic en el bot´ n T´tulos del cuadro de di´ logo inicial de cada tipo de gr´ fica (cuadros de di´ logo de las Figuras o ı a a a 57, 59, 62 y 64) se muestra un cuadro como el de la Figura 87. Se escriben el t´tulo, subt´tulo y nota a pie de p´ gina a ı ı a criterio del usuario. El t´tulo se puede escribir en dos l´neas, as´ como la nota a pie de p´ gina; el subt´tulo puede ocupar ı ı ı a ı una sola l´nea. En cuanto a su extensi´ n, y en cualquier caso, cada l´nea (recuadro de texto) admite hasta 72 caracteres. ı o ı

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

52

Figura 87: Cuadro de di´ logo para colocar T´tulos a las representaciones gr´ ficas a ı a

Figura 88: Cuadro de di´ logo para seleccionar las Opciones de las representaciones gr´ ficas a a

2.4.8.

Cuadro de di´ logo de Opciones a

Seleccionando el bot´ n de Opciones del cuadro de di´ logo inicial de algunos tipos de representaciones gr´ ficas (cuadros o a a ´ de di´ logo de las Figuras 57, 59 y 62) nos aparece el cuadro de la Figura 88. En el se controla especialmente el tratamiento a de los valores perdidos. Los elementos son: ´ Excluir casos segun lista. Se excluyen todos aquellos casos que tengan un valor perdido en alguna de las variables declaradas en la gr´ fica. a Excluir casos variable por variable. Se excluyen para cada variable los casos con valores ausentes en ella. Mostrar los grupos definidos por los valores perdidos. En caso de que haya alguna variable de agrupamiento o un eje de categor´as o establecimiento de marcas, etc., se puede representar los grupos de valores perdidos. ı Mostrar el gr´ fico con las etiquetas de caso. Esta opci´ n s´ lo es v´ lida con los diagramas de dispersi´ n. Cada punto del a o o a o diagrama de dispersi´ n es etiquetado por el valor que le corresponde en la variable insertada en el recuadro Etiquetar o los casos mediante del cuadro de di´ logo inicial de este tipo de gr´ ficas. a a 2.4.9. Sobre la Plantilla

Figura 89: Cuadro de di´ logo para usar una Plantilla de un Archivo a

El patr´ n seg´ n el cual se crea una determinada gr´ fica puede ser aplicado a otras de su misma naturaleza o de su o u a misma estructura. En el cuadro de di´ logo inicial de las representaciones gr´ ficas (cuadros de di´ logo de las Figuras 57, 59, 62 y 64) se a a a activa la opci´ n Usar las especificaciones gr´ ficas de y se pulsa el bot´ n Archivo. En el cuadro de di´ logo que aparece (Figura o a o a 89) se selecciona el subdirectorio donde est´ el archivo que contiene la plantilla y despu´ s el archivo de plantilla deseado a e (todos tienen extensi´ n .sct). o

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

53

3.
3.1.

Relaci´ n entre dos variables o
Relaci´ n entre variables cuantitativas. Diagrama de dispersi´ n o o

Figura 90: Cuadro de di´ logo para elegir el tipo de diagrama de dispersi´ n a o ´ Para obtener el diagrama de dispersi´ n o nube de puntos se selecciona la opci´ n Gr´ ficos ⇒Dispersion en la que se preo o a sentan cuatro alternativas (ver la Figura 90): Simple, Superpuesto, Matricial y 3-D. De las cuatro, la que hemos estudiado nosotros es la primera de ellas.

Figura 91: Cuadro de di´ logo para especificar las caracter´sticas de un diagrama de dispersi´ n simple a ı o

Se selecciona, por tanto, en el cuadro de la Figura 90 el icono de la alternativa Simple. A continuaci´ n, haciendo clic en o Definir, se presenta un nuevo cuadro de di´ logo (Figura 91) en el cual se especifican las dos variables: una correspondiente a al eje vertical (Eje Y) y la otra al eje horizontal (Eje X).

Figura 92: Diagrama de dispersi´ n de la variable precio sobre la variable peso o

Por defecto, haciendo clic en Aceptar, se obtiene el diagrama de dispersi´ n en el que cada punto viene representado o por un peque˜ o cuadrado. Por ejemplo, si en el Eje Y seleccionamos la variable precio, en el Eje X seleccionamos peso y n pulsamos en Aceptar entonces el resultado es el gr´ fico de la Figura 92. a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

54

Figura 93: Diagrama de dispersi´ n del precio sobre el peso con marcas distintas seg´ n la variable materia o u

En el recuadro Establecer marcas por del cuadro de la Figura 91 se puede especificar una nueva variable, habitualmente cualitativa, para que cada punto se vea representado por un s´mbolo distinto seg´ n el valor o categor´a que adopte en la ı u ı mencionada variable. Por ejemplo, el diagrama de dispersi´ n de la variable precio sobre la variable peso, seleccionando o la variable materia en Establecer marcas por es el de la Figura 93. En el recuadro Etiquetar los casos mediante se puede seleccionar otra nueva variable para adjuntar a cada punto del diagrama el valor que le corresponde en la variable ahora declarada. Esta opci´ n hace que el gr´ fico parezca muy confuso, o a por lo que es conveniente no utilizarla. Mediante Opciones del cuadro de di´ logo de la Figura 91 podemos especificar el tratamiento de los valores perdidos en a los datos y determinar si se muestran etiquetas para los puntos del diagrama (ver el apartado 2.4.8). Con la opci´ n T´tulos del cuadro de di´ logo de la Figura 91 se pueden definir las l´neas de texto que se colocan en la o ı a ı parte superior o inferior del diagrama (ver el apartado 2.4.7).

3.2.

Edici´ n y modificaci´ n del diagrama de dispersi´ n o o o

Una vez obtenido el diagrama de dispersi´ n y para proceder a su modificaci´ n hay que editarlo haciendo doble clic o o dentro de la representaci´ n gr´ fica en el visor de resultados de SPSS. Al hacerlo, entramos en la ventana del editor de o a gr´ ficos. Una vez que estamos en la ventana del editor de gr´ ficos (que es conveniente maximizar) se pueden realizar, a a entre otras, las siguientes modificaciones. Las posibilidades de modificaci´ n del diagrama de dispersi´ n son similares a las del diagrama de barras (ver apartado o o 2.4.3), por lo que voy a exponer s´ lo lo que de particular tiene el diagrama de dispersi´ n. o o En primer lugar, hay que decir que mientras que en el diagrama de barras al eje horizontal se le llamaba eje de Categor´as, ahora se le llama eje de Escala X. El eje vertical se llama eje de Escala Y. ı

Figura 94: Cuadro para modificar los s´mbolos (marcadores) de un diagrama de dispersi´ n ı o

Una posibilidad de cambio importante es la modificaci´ n de los s´mbolos que aparecen en dicho gr´ fico. Por defecto, o ı a en esta versi´ n de SPSS, los s´mbolos son cuadrados muy peque˜ os. La opci´ n Formato ⇒Marcadores permite cambiar los o ı n o

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

55

s´mbolos del marcador en cualquier gr´ fico (ver Figura 94). Pueden actualizarse el estilo o el tama˜ o del marcador, o bien ı a n ambos a la vez. Las diferencias en el tama˜ o del marcador ser´ n menos obvias en la pantalla que cuando se imprima el n a ´ gr´ fico. Pueden cambiarse unicamente los marcadores en la serie actualmente seleccionada, o bien todos los marcadores a del gr´ fico. a

Figura 95: Cuadro de di´ logo para modificar las opciones de un diagrama de dispersi´ n a o ˜ La opci´ n Diseno ⇒Opciones permite modificar diagramas de dispersi´ n existentes (ver la Figura 95). El grupo Opciones o o ´ de visualizacion permite controlar la visualizaci´ n de los elementos de gr´ ficos opcionales. Si se ha seleccionado la opci´ n o a o Establecer marcas por al crear el diagrama, se puede desactivar la opci´ n Mostrar los subgrupos para que no se muestren los o

subgrupos de los diagramas de dispersi´ n que contienen una variable de control. Cada uno de los valores de la variable de o control constituye un subgrupo y aparece marcado con un s´mbolo diferente en el diagrama de dispersi´ n. ı o La opci´ n Etiquetas de caso controla la visualizaci´ n de las etiquetas de los puntos. El grupo Origen de las etiquetas permite o o ´ controlar c´ mo se etiquetan los puntos. La opci´ n Variable de identificacion etiqueta los casos con las etiquetas de valores de o o la variable de identificaci´ n de casos (o con valores si no se definieron etiquetas). Esta opci´ n no est´ disponible si no se o o a especific´ la variable de identificaci´ n para Etiquetas de caso al crear el diagrama. Numero de caso etiqueta los puntos con o o ´ n´ meros secuenciales de caso en el archivo de datos. u El grupo Girasoles permite mostrar girasoles. Un girasol es un s´mbolo que representa uno o m´ s casos que se encuenı a tran muy pr´ ximos entre s´ dentro de una diagrama de dispersi´ n; los casos se representan como los p´ talos de un girasol, o ı o e ´ que son las l´neas que salen de el. Se puede seleccionar Mostrar girasoles y Opciones de los girasoles para controlar la visualı izaci´ n de los girasoles. Los girasoles no est´ n disponibles si se muestran los subgrupos. No recomiendo la representaci´ n o a o por girasoles, pues, en general, no aclara mucho. Pueden ser de inter´ s cuando las variables toman pocos valores distintos. e El grupo L´nea de referencia para la media en Y permite mostrar una l´nea de referencia a trav´ s del diagrama identificando ı ı e ´ la media de Y. Si se ha optado por mostrar una l´nea de referencia, se puede seleccionar Mostrar trazos de union a las l´neas ı ı para mostrar una l´nea de uni´ n entre cada punto y su l´nea de referencia. ı o ı

Figura 96: Cuadro de di´ logo para visualizar una l´nea de regresi´ n en un diagrama de dispersi´ n a ı o o

El grupo Ajustar l´nea (del cuadro de di´ logo de la Figura 95) permite visualizar una l´nea que se ajusta a la nube de ı a ı puntos. Si se selecciona Total entonces se coloca una l´nea a trav´ s de todos los puntos. Si se ha especificado una variable ı e de control, se puede seleccionar Subgrupos para colocar l´neas a trav´ s de los subgrupos. Si se selecciona Opciones de ajuste ı e ´ aparece el cuadro de di´ logo de la Figura 96. En el se observa que es posible elegir un m´ todo de ajuste y controlar la a e visualizaci´ n de los estad´sticos de regresi´ n. o ı o En el cuadro de di´ logo de la Figura 96 se selecciona un m´ todo de ajuste en el grupo M´ todo de ajuste. Es posible a e e ´ ´ elegir entre lineal, cuadr´ tico o c´ bico. El grupo L´neas de prediccion de la regresion permite controlar la visualizaci´ n de a u ı o los intervalos de confianza de la l´nea de regresi´ n. Se selecciona Media para mostrar los intervalos de predicci´ n de ı o o ´ las respuestas pronosticadas medias. Se selecciona Individual para mostrar los intervalos de predicci´ n para una unica o observaci´ n. Tambi´ n es posible especificar el nivel de confianza. Esto se entender´ mejor cuando se haya estudiado el o e a tema An´ lisis de regresi´ n en la parte de Estad´stica Inferencial. a o ı

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

56

Figura 97: Diagrama de dispersi´ n y recta de regresi´ n de la variable precio sobre la variable peso o o

´ El grupo Opciones de la regresion (del cuadro de di´ logo de la Figura 96) permite controlar los aspectos opcionales de a la visualizaci´ n y la ecuaci´ n de la regresi´ n. Si no se desea incluir un t´ rmino constante en la ecuaci´ n de regresi´ n, hay o o o e o o ´ que desactivar la opci´ n Incluir constante en la ecuacion a fin de obtener la regresi´ n por medio del origen. Se selecciona o o Mostrar R-cuadrado para ver el valor del coeficiente de determinaci´ n en la leyenda del gr´ fico. Esta opci´ n estar´ disponible o a o a ˜ solamente si la leyenda est´ activada (el cuadro de di´ logo Leyenda se encuentra en el men´ Diseno del editor de gr´ ficos). a a u a Por ejemplo, el diagrama de dispersi´ n de la variable precio sobre la variable peso, con la recta de regresi´ n y el o o ´ coeficiente de determinaci´ n visualizados (y con la opci´ n Incluir constante en la ecuacion activada), es el gr´ fico de la Figura o o a 97.

Figura 98: Cuadro de di´ logo obtener coeficientes de correlaci´ n a o

3.3.

Correlaci´ n simple o

Para obtener el coeficiente de correlaci´ n lineal de Pearson (y otros coeficientes de correlaci´ n) se selecciona Analizar o o ⇒Correlaciones ⇒Bivariadas. Nos encontramos (Figura 98) en el recuadro de la izquierda con la lista de variables, de las cuales podemos seleccionar dos o m´ s. Seg´ n sea la naturaleza de las variables, podemos obtener otros coeficientes de a u ´ correlaci´ n en el grupo Coeficientes de correlacion: o Pearson: Calcula el coeficiente de correlaci´ n lineal de Pearson entre cada par de variables cuantitativas. o Tau-b de Kendall: Calcula el coeficiente de correlaci´ n de Kendall entre cada par de variables ordinales (este no lo hemos o estudiado, pero es similar, en su interpretaci´ n, al coeficiente de correlaci´ n de Spearman). o o Spearman: Calcula el coeficiente de correlaci´ n de Spearman entre cada par de variables ordinales. o

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

57

Figura 99: Opciones de Correlaciones Bivariadas ´ En el cuadro de di´ logo de la Figura 98 tambi´ n aparece un apartado, denominado Prueba de significacion, que se entena e der´ cuando se haya estudiado la parte de Estad´stica Inferencial, pues hace un test de hip´ tesis para contrastar la hip´ tesis a ı o o nula de que el coeficiente de correlaci´ n, en toda la poblaci´ n, sea igual a cero. En relaci´ n con esto, la opci´ n Marcar las o o o o correlaciones significativas coloca unos asteriscos junto al coeficiente que no resulte igual a cero en la poblaci´ n al aplicarle o el contraste de hip´ tesis (existe correlaci´ n entre ese par de variables cuando se considera toda la poblaci´ n). o o o Estando situados en el cuadro de di´ logo anterior (Figura 98), pulsando en el bot´ n Opciones nos encontramos con dos a o bloques (Figura 99); el primero se refiere a Estad´sticos: ı

Medias y desviaciones t´picas: Calcula las medias aritm´ ticas (x, y) y las cuasidesviaciones t´picas (Sx , Sy ). A estas ı e ı ´ ultimas, el sistema les llama desviaciones t´picas. Tambi´ n se muestra el n´ mero de casos que no tienen valores ı e u perdidos. Los valores perdidos se consideran seg´ n cada variable individual, sin tener en cuenta la opci´ n elegida u o para la manipulaci´ n de los valores perdidos. o Productos cruzados y covarianzas: Se calcula lo que el sistema llama Suma de cuadrados y productos cruzados, que no es m´ s que la suma de los productos cruzados de las variables corregidas respecto a la media; es decir, a
r k

(xi − x)(yj − y) fij .
i=1 j=1

´ Este es el numerador de la covarianza. Tambi´ n se calcula lo que el sistema llama covarianza, pero que en realidad es la cuasicovarianza (similar a la e covarianza, pero dividiendo por (n − 1) en vez de por n; siendo n el tama˜ o muestral). La cuasicovarianza, Sxy , n est´ relacionada con la covarianza, sxy , de la siguiente manera: a
r k

(xi − x)(yj − y)fij Sxy =
i=1 j=1

n−1

=

n sxy . n−1

De esto se deduce que el coeficiente de correlaci´ n lineal de Pearson se puede calcular de cualquiera de las dos o formas: sxy Sxy r= = . sx sy Sx Sy En el segundo bloque (del cuadro de di´ logo de la Figura 99) se realiza el tratamiento de los valores ausentes, Valores a
perdidos:

´ Excluir casos segun pareja: Por defecto, se excluyen los casos con valores ausentes en alguna (o las dos) de las variables cuyo coeficiente de correlaci´ n se trata de calcular. o ´ Excluir casos segun lista: Se excluyen los casos con valores ausentes en alguna de las variables declaradas en la lista de variables del cuadro de di´ logo inicial. a Por ejemplo, en el cuadro de di´ logo de la Figura 98 seleccionamos las variables peso, precio y altura de nuestro a fichero Libros.sav, elegimos el coeficiente de correlaci´ n de Pearson, y activamos las opciones Medias y desviaciones t´picas y o ı Productos cruzados y covarianzas del cuadro de di´ logo de la Figura 99. Como resultado, en el visor de resultados de SPSS a aparecen las tablas de las Figuras 100 y 101. En la primera tabla se puede ver (entre otras cosas) que la media aritm´ tica e de la variable precio es 54 07 euros y su cuasidesviaci´ n t´pica es S = 21 367 euros. Por tanto, su desviaci´ n t´pica es: o ı o ı s= n−1 S= n 29 21 367 = 21 008 . 30

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

58

Figura 100: Medias y cuasidesviaciones t´picas ı

Figura 101: Coeficiente de correlaci´ n lineal de Pearson (entre otras medidas) o

En la segunda tabla del visor (Figura 101) se pueden ver los resultados del coeficiente de correlaci´ n lineal de Pearson o para cada par de estas variables, as´ como la suma de los productos cruzados y la cuasicovarianza. Tambi´ n se puede ı e ´ observar que el unico (de las tres combinaciones posibles) coeficiente de correlaci´ n lineal que se puede considerar no o nulo en toda la poblaci´ n es el correspondiente a las variables altura y peso, pues r es igual a 0 729 en la muestra de 30 o libros y el p-valor o nivel cr´tico (Sig. (bilateral)) es igual a 0 000 (menor que 0 05). Es decir, las variables altura y peso ı est´ n relacionadas linealmente en la poblaci´ n de todos los libros de la biblioteca. a o

3.4.

Regresi´ n lineal o

Figura 102: Cuadro de di´ logo para realizar la regresi´ n lineal a o

Para obtener la ecuaci´ n de la recta de regresi´ n lineal m´nimo cuadr´ tica de una variable cuantitativa Y sobre otra o o ı a ´ variable cuantitativa X, se selecciona la opci´ n Analizar ⇒Regresion ⇒Lineal. Aparece, entonces, el cuadro de di´ logo de o a la Figura 102. Puesto que hemos obtenido anteriormente que las variables altura y peso est´ n relacionadas linealmente, vamos ahoa ra a encontrar la ecuaci´ n de la recta de regresi´ n m´nimo cuadr´ tica de la variable altura sobre la variable peso (de o o ı a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

59

Figura 103: Cuadro de di´ logo para obtener, entre otras cosas, los coeficientes de regresi´ n a o

Figura 104: Coeficientes de regresi´ n de la recta de regresi´ n de la variable altura sobre la variable peso o o

nuestro fichero de datos Libros.sav). Para ello, en el cuadro de di´ logo de la Figura 102 seleccionamos la variable altura a en Dependiente y la variable peso en Independientes. Pulsamos el bot´ n Estad´sticos y, en el cuadro de di´ logo que aparece o ı a ´ (Figura 103) activamos solamente la opci´ n Estimaciones del grupo Coeficientes de regresion y pulsamos Continuar. Volvemos o al anterior cuadro de di´ logo (Figura 102) y pulsamos Aceptar. As´, en la ventana del visor de resultados tenemos la tabla a ı de la Figura 104, en la cual se hace un contraste de hip´ tesis (que se explicar´ en la parte de Estad´stica Inferencial), pero o a ı lo que a nosotros nos interesa en este momento son los resultados de los coeficientes de regresi´ n, que son: A = 12 257, o B = 1 993E − 02 = 0, 01993, siendo la ecuaci´ n de la recta de regresi´ n m´nimo cuadr´ tica Y = A + B X (donde o o ı a Y =altura y X=peso). Es decir, la ecuaci´ n de dicha recta de regresi´ n es: o o
altura = 12 257 + 0, 01993 peso

Figura 105: Cuadro de di´ logo para guardar algunas medidas, como los valores pronosticados y los residuos o errores a

Si, adem´ s, queremos obtener los valores pronosticados de la variable dependiente a partir de la recta de regresi´ n a o m´nimo cuadr´ tica de la variable dependiente sobre la variable independiente, en el cuadro de di´ logo de la Figura 102 ı a a pulsamos el bot´ n Guardar y, en el cuadro de di´ logo que aparece (Figura 105) activamos Valores pronosticados... No tipificados. o a Tras pulsar Continuar y Aceptar, nos aparece, en la ventana del editor de datos una nueva columna (variable) que contiene dichos valores. Tambi´ n se pueden guardar, entre otras cosas, los residuos o errores (las diferencias entre los valores e pronosticados y los valores reales de la variable dependiente). Para ello, en el cuadro de di´ logo de la Figura 102 pulsamos a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

60

Figura 106: Valores pronosticados de la variable altura a partir de la recta de regresi´ n de dicha variable sobre la variable o

peso el bot´ n Guardar y, en el cuadro de di´ logo que aparece (Figura 105) activamos Residuos... No tipificados. Tras pulsar Continuar o a y Aceptar, nos aparece, en la ventana del editor de datos una nueva columna con dichos residuos o errores en la predicci´ n. o En el ejemplo anteriormente resuelto, los valores pronosticados de la variable altura a partir de la recta de regresi´ n o de la variable altura sobre la variable peso aparecen en la pen´ ltima columna (pre 1) de la Figura 106 y los valores de los u ´ residuos o errores cometidos en la predicci´ n (diferencia entre altura y pre 1) aparecen en la ultima columna (variable o res 1). Como vemos, SPSS asigna unos nombres (por defecto) a estas nuevas variables (pre 1 y res 1). Es conveniente cambiar estos nombres, as´ como ponerles unas etiquetas explicativas. ı

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

61

4.
4.1.

Probabilidad. Variables aleatorias
Funci´ n de distribuci´ n (probabilidad acumulada) o o
Para obtener el resultado de la funci´ n de distribuci´ n, F (t) = P (X ≤ t), con SPSS se tiene que utilizar la opci´ n o o o

Transformar ⇒Calcular, que se ha explicado en la secci´ n 1.13 (secci´ n que es conveniente repasar en este momento). o o Para poder usar la opci´ n Transformar ⇒Calcular es necesario tener abierto un fichero de datos (fichero .sav). Podemos o

´ ´ utilizar cualquier fichero de datos, pero lo m´ s conveniente es crear uno nuevo con una unica variable que tenga un unico a dato. Para ello, seleccionamos la opci´ n Archivo ⇒Nuevo ⇒Datos. Definimos la primera columna d´ ndole s´ lo el nombre; o a o que puede ser, por ejemplo, necesari. En cuanto a las dem´ s especificaciones de esta variable, dejamos las que tienen el a sistema por defecto. Introducimos, en esta primera columna, un s´ lo dato: por ejemplo, el 1 (podr´a ser cualquier cosa). o ı Como los resultados de la funci´ n de distribuci´ n est´ n comprendidos entre 0 y 1, y van a aparecer en la ventana o o a del editor de datos, podemos especificar como tipo de datos por defecto el Num´ rico con una Anchura igual a 8 y con e ´ un n´ mero de Cifras decimales igual a 6. Para ello, seleccionamos Edicion ⇒Opciones ⇒Carpeta de Datos de la barra u ´ de men´ s. En el apartado Visualizacion para nuevas variables num´ ricas del cuadro de di´ logo correspondiente (Figura 10) u e a ponemos un 8 en Ancho y un 6 en Cifras decimales. Recordemos que si seleccionamos Transformar ⇒Calcular nos aparece el cuadro de di´ logo de la Figura 19. Recordemos a tambi´ n que en este cuadro de di´ logo tenemos cinco partes fundamentales: arriba a la izquierda est´ el lugar para escribir e a a el nombre de la nueva variable (Variable de destino:), debajo aparece la lista de variables existentes, arriba a la derecha est´ el a ´ lugar destinado a la definici´ n de la nueva variable (Expresion num´ rica:), debajo hay una calculadora y la lista de funciones o e que se pueden utilizar (Funciones:). En primer lugar se asigna un nombre a la variable que queremos generar, escribiendo el mismo en el cuadro Variable de destino. Recordemos que dicho nombre no puede comenzar por un n´ mero y que no puede llevar s´mbolos especiales u ı (como puntos, guiones, etc.). El siguiente paso es definir la expresi´ n num´ rica que va a permitir calcular los valores de la o e ´ ´ nueva variable. Tal expresi´ n se escribe en el cuadro Expresion num´ rica. Luego pulsamos en Aceptar. En la ultima columna o e de la carpeta Vista de Datos, debajo del nombre de la nueva variable, nos aparece el resultado de dicha expresi´ n num´ rica. o e Entre las funciones que aparecen en este cuadro de di´ logo, las que calculan los resultados de las funciones de distribua ci´ n de diversas variables aleatorias para el valor c; es decir, F (c) = P (X ≤ c), son: o CDF.BERNOULLI(c,p) Calcula el resultado de la funci´ n de distribuci´ n evaluado en c de una variable aleatoria de o o Bernoulli con par´ metro p. a CDF.BINOM(c,n,p) Calcula el resultado de la funci´ n de distribuci´ n evaluado en c de una variable aleatoria binomial o o ´ ´ ´ (n´ mero de exitos) en los n intentos, con una probabilidad de exito p. Cuando n es 1, esta es la misma que la de u CDF.BERNOULLI. CDF.POISSON(c,media) Calcula el resultado de la funci´ n de distribuci´ n evaluado en c de una variable aleatoria de o o Poisson con par´ metro media. a CDF.GEOM(c,p) Calcula el resultado de la funci´ n de distribuci´ n evaluado en c de una variable aleatoria geom´ trica o o e ´ ´ (n´ mero de intentos para obtener un exito) cuando la probabilidad de exito es p. u CDFNORM(valorz) Calcula el resultado de la funci´ n de distribuci´ n evaluado en c de una variable aleatoria normal o o t´pica o est´ ndar. ı a CDF.NORMAL(c,media,desv t´p) Calcula el resultado de la funci´ n de distribuci´ n evaluado en c de una variable ı o o aleatoria normal de par´ metros media y desv t´p. a ı CDF.CHISQ(c,gl) Calcula el resultado de la funci´ n de distribuci´ n evaluado en c de una variable aleatoria chi-cuadrado o o con los grados de libertad gl. CDF.T(c,gl) Calcula el resultado de la funci´ n de distribuci´ n evaluado en c de una variable aleatoria t de Student con los o o grados de libertad gl. CDF.F(c,gl1,gl2) Calcula el resultado de la funci´ n de distribuci´ n evaluado en c de una variable aleatoria F de Snedecor o o con los grados de libertad gl1 y gl2.
Ejemplos

1. Si X ≡ B(70, 0 85), entonces P (X = 50) = P [(X ≤ 50) − (X ≤ 49)] = P (X ≤ 50) − P (X ≤ 49) = F (50) − F (49) = CDF.BIN OM (50, 70, 0,85) − CDF.BIN OM (49, 70, 0,85) = 0 001592

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

62

2. Si X ≡ B(85, 0 55), entonces P (50 ≤ X < 60) = P [(X < 60) − (X ≤ 49)] = P (X < 60) − P (X ≤ 49) = P (X ≤ 59) − P (X ≤ 49) = F (59) − F (49) = CDF.BIN OM (59, 85, 0,55) − CDF.BIN OM (49, 85, 0,55) = 0 272949 3. Si X ≡ N (0, 1), entonces P (|X| ≥ 1 75) = P [(X ≤ −1 75) ∪ (X ≥ 1 75)] = P (X ≤ −1 75) + P (X ≥ 1 75) = P (X ≤ −1 75) + [1 − P (X < 1 75)] = P (X ≤ −1 75) + 1 − P (X ≤ 1 75) = F (−1 75) + 1 − F (1 75) = CDF N ORM (−1,75) + 1 − CDF N ORM (1,75) = 0 080118 4. Si X ≡ N (6 5, 1 85), entonces P (5 ≤ X < 7) = P [(X < 7) − (X < 5)] = P (X < 7) − P (X < 5) = P (X ≤ 7) − P (X ≤ 5) = F (7) − F (5) = CDF.N ORM AL(7, 6,5, 1,85) − CDF.N ORM AL(5, 6,5, 1,85) = 0 397787
Ejercicios Propuestos

4.1. Sea X ≡ B(n = 50, p = 0 25). Calcular: a) P (X ≤ 12). b) P (X ≥ 3). c) P (X < 5). d) P (X > 7). e) P (X = 10). f) P (10 < X < 20). g) P (10 ≤ X < 20). h) P (10 < X ≤ 20). i) P (10 ≤ X ≤ 20). 4.2. Sea X ≡ P(λ = 8). Calcular: a) P (X < 6). b) P (X > 7). c) P (X ≤ 5). d) P (X ≥ 9). e) P (X = 8). f) P (5 < X < 15). g) P (5 ≤ X ≤ 15). 4.3. Sea X ≡ G(p = 0 25). Calcular: a) P (X < 3). b) P (X > 4). c) P (X ≤ 3). d) P (X ≥ 4). e) P (X = 5). f) P (3 ≤ X < 10). 4.4. Sea X una variable aleatoria normal est´ ndar, X ≡ N (0, 1). Calcular: a a) P (X ≤ −0 34) b) P (X > 0 76). c) P (X ≤ 1 45). d) P (X ≥ −0 85). e) P (0 56 < X < 2 65). f) P (|X| > 0 57). g) P (|X| < 1 25).

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

63

4.5. Sea X una variable aleatoria normal de media 5 y desviaci´ n t´pica 1 5, X ≡ N (5, 1 5). Calcular: o ı a) P (X ≤ 6 5). b) P (X > 7 5). c) P (5 5 < X < 7 5). d) P (|X| > 6 5). e) P (|X| < 7 5). 4.6. Sea X una variable aleatoria que sigue una distribuci´ n t de Student con n grados de libertad, X ≡ tn . Calcular: o a) Para n = 10, P (X ≤ 1 45). b) Para n = 15, P (X ≥ 2 5). c) Para n = 7, P (0 57 < X < 3 5). d) Para n = 125, P (|X| > 1 45). e) Para n = 20, P (|X| < 3 5). 4.7. Sea X una variable aleatoria que sigue una distribuci´ n chi-cuadrado con n grados de libertad, X ≡ χ2 . Calcular: o n a) Para n = 12, P (X < 4 8). b) Para n = 20, P (X > 4 8). c) Para n = 4, P (3 3 < X < 9 4). d) Para n = 25, P (|X| > 1 5). e) Para n = 14, P (|X| < 4 5). 4.8. Sea X una variable aleatoria con distribuci´ n F de Snedecor con m y n grados de libertad, X ≡ Fm,n . Calcular: o a) Para m = 7, n = 5, P (X < 2 9). b) Para m = 25, n = 50, P (X ≥ 5). c) Para m = 15, n = 10, P (0 4 < X < 2 4). d) Para m = 12, n = 14, P (|X| < 6 3). e) Para m = 10, n = 8, P (|X| > 3 5).

4.2.

Inversa de la funci´ n de distribuci´ n (percentiles o cuantiles) o o

Para obtener el resultado de la inversa de la funci´ n de distribuci´ n (los percentiles o cuantiles) con SPSS se tiene que o o utilizar la opci´ n Transformar ⇒Calcular. Igual que antes, para poder usar esta opci´ n es necesario tener abierto un fichero o o de datos. Como los resultados de los percentiles pueden ser cualesquiera, y van a aparecer en la ventana del editor de datos, podemos especificar como tipo de datos por defecto el Num´ rico con una Anchoura igual a 8 y con un n´ mero de Decimales e u ´ ´ igual a 4. Para ello, seleccionamos Edicion ⇒Opciones ⇒Carpeta de Datos de la barra de men´ s. En el apartado Visualizacion u para nuevas variables num´ ricas del cuadro de di´ logo correspondiente (Figura 10) ponemos un 8 en Ancho y un 4 en Cifras e a decimales. Entre las funciones que aparecen en el cuadro de di´ logo de la opci´ n Transformar ⇒Calcular (Figura 19) las que calculan a o los resultados de los percentiles o cuantiles son: PROBIT(p) Calcula el valor de a tal que P (X ≤ a) = p, siendo X una variable aleatoria normal t´pica o est´ ndar. ı a IDF.NORMAL(p,media,desv t´p) Calcula el valor de a tal que P (X ≤ a) = p, siendo X una variable aleatoria normal ı de par´ metros media y desv t´p. a ı IDF.CHISQ(p,gl) Calcula el valor de a tal que P (X ≤ a) = p, siendo X una variable aleatoria chi-cuadrado con los grados de libertad gl. IDF.T(p,gl) Calcula el valor de a tal que P (X ≤ a) = p, siendo X una variable aleatoria t de Student con los grados de libertad gl.

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

64

IDF.F(p,gl1,gl2) Calcula el valor de a tal que P (X ≤ a) = p, siendo X una variable aleatoria F de Snedecor con los grados de libertad gl1 y gl2.
Ejemplos

1. Si X ≡ t30 , hallad el valor de a que cumple P (|X| > a) = 0 2. Soluci´ n: o P (|X| > a) = 0 2 ⇒ P [(X < −a) ∪ (X > a)] = 0 2 ⇒ P (X < −a) + (X > a) = 0 2 ⇒ 2P (X > a) = 0 2 (por ser sim´ trica) ⇒ P (X > a) = 0 1 e ⇒ P (X ≤ a) = 0 9 ⇒ F (a) = 0 9 ⇒ a = IDF.T (0,9, 30) = 1 310415 2. Si X ≡ F10,20 , hallad el valor de a que cumple P (|X| ≤ a) = 0 9. Soluci´ n: o P (|X| ≤ a) = 0 9 ⇒ P [−a ≤ X ≤ a] = 0 9 ⇒ P [(X ≤ a) − (X < −a)] = 0 9 ⇒ P (X ≤ a) − P (X < −a) = 0 9 ⇒ P (X ≤ a) = 0 9 ya que P (X < −a) = 0 ⇒ F (a) = 0 9 ⇒ a = IDF.F (0,9, 10, 20) = 1 936738
Ejercicios Propuestos

4.9. Hallar el valor de los siguientes percentiles: Z0 58 , Z0 42 , Z0 999 , Z0 001 .

4.10. Si Z denota la variable aleatoria Normal Est´ ndar, calcular el valor de a para que se verifique: a a) P (Z ≤ a) = 0 725. b) P (Z ≥ a) = 0 875. c) P (|Z| ≤ a) = 0 85. d) P (|Z| ≥ a) = 0 25. 4.11. Si X es una variable aleatoria con distribuci´ n Normal de media 0 5 y desviaci´ n t´pica 0 25, determinar el valor de o o ı a tal que: a) P (X < a) = 0 725. b) P (X > a) = 0 875. 4.12. Calcular el valor de los siguientes percentiles: a) χ2 , 0 01 . 6 b) χ2 , 0 99 . 6 c) χ2 , 0 975 . 72 4.13. Sea X una variable aleatoria que sigue una distribuci´ n chi-cuadrado de Pearson con 15 grados de libertad. Detero minar el valor de a que verifica la siguiente igualdad: a) P (X ≤ a) = 0 05. b) P (X > a) = 0 99. c) P (|X| < a) = 0 5. d) P (|X| ≥ a) = 0 2. 4.14. Calcular el valor de los siguientes percentiles: a) t26 , 0 9 . b) t26 , 0 1 .

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

65

c) t75 , 0 8 . 4.15. Sea X una variable aleatoria que sigue una distribuci´ n t de Student con 20 grados de libertad. Determinar el valor o de a que verifica la siguiente igualdad: a) P (X ≤ a) = 0 99. b) P (X ≥ a) = 0 25. c) P (|X| ≤ a) = 0 9. d) P (|X| ≥ a) = 0 3. 4.16. Calcular el valor de los siguientes percentiles: a) F8 , 6 , 0 975 . b) F25 , 50 , 0 01 . c) F45 , 35 , 0 01 . 4.17. Sea X una variable aleatoria que sigue una distribuci´ n F de Snedecor con 10 grados de libertad en el numerador y o 8 grados de libertad en el denominador. Determinar el valor de a que verifica la siguiente igualdad: a) P (X < a) = 0 9. b) P (X > a) = 0 05. c) P (|X| < a) = 0 98. d) P (|X| ≥ a) = 0 1.

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

66

5.
5.1.

Contrastes param´ tricos e
Contraste para una media. Intervalo de confianza

Figura 107: Cuadro de di´ logo para hacer un test de hip´ tesis sobre una media a o

Para realizar un contraste de hip´ tesis sobre una media se ha de seleccionar Analizar ⇒Comparar medias ⇒Prueba T para o una muestra. Este procedimiento s´ lo realiza el contraste bilateral de la hip´ tesis nula H0 : µ = µ0 frente a la hip´ tesis o o o alternativa H1 : µ = µ0 en el caso en el que la varianza poblacional σ 2 es desconocida. Recordemos que para aplicar esta t´ cnica (test de la t de Student para una muestra) se ha de cumplir que la variable sea Normal o que el tama˜ o muestral sea e n grande (mayor o igual que 30).

Figura 108: Opciones de un test de hip´ tesis sobre una media poblacional o

En el recuadro Contrastar Variables del cuadro de di´ logo que aparece (Figura 107) se selecciona la variable o variables a para las cuales se va a realizar este tipo de contraste. Y en el recuadro Valor de prueba se especifica el valor, µ0 , con el que se compara la media poblacional. Si pulsamos el bot´ n Opciones de dicho cuadro de di´ logo nos aparece el cuadro de la Figura 108. Estas opciones son: o a Intervalo de confianza: Por defecto se muestra un intervalo de confianza al 95 % para la diferencia entre la media poblacional, µ, y el valor de contraste hipot´ tico, µ0 . Se puede introducir un valor entre 1 y 99 para solicitar otro nivel de e confianza. Valores perdidos: Si se desea contrastar varias variables y existen datos perdidos en una o en varias de las variables, se puede indicar qu´ casos deber´ n ser excluidos. e a ´ Excluir casos segun an´ lisis: Cada contraste utiliza todos los casos que tienen datos v´ lidos para la variable cona a trastada. Los tama˜ os muestrales pueden variar de una prueba a otra. n ´ ´ Excluir casos segun lista: Cada contraste utiliza unicamente los casos que tienen datos v´ lidos para todas las varia ables utilizadas en cualquiera de los contrastes solicitados. El tama˜ o muestral es constante en todas las pruen bas.

Figura 109: Estad´sticos en el contraste sobre la media de la variable pr´ stamo ı e

Como el tama˜ o muestral de nuestro fichero Libros.sav es igual a 30, se puede aplicar este procedimiento a cualquier n variable. Dado que la media muestral de la variable pr´ stamo es igual a 13 6, vamos a contrastar la hip´ tesis nula H0 : e o µ = 14 frente a la hip´ tesis alternativa H1 : µ = 14. Los resultados que aparecen en el visor de SPSS son los de las o Figuras 109 y 110. Como el nivel cr´tico, Sig. (bilateral), es igual a 0 824 (claramente mayor que el nivel de significaci´ n α = 0 05) ı o entonces aceptamos la hip´ tesis nula; es decir, la media poblacional de la variable pr´ stamo puede considerarse igual a o e

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

67

Figura 110: Resultados del contraste sobre la media de la variable pr´ stamo e

14. Tambi´ n obtenemos el resultado del estad´stico de contraste: e ı t= los grados de libertad de la t de Student: gl = 29, la diferencia entre la media muestral y el valor con el se compara: Diferencia de medias = x − µ0 = −0 4, y el intervalo de confianza al 95 % para la diferencia entre la media poblacional, µ, y la media hipot´ tica, 14: e Intervalo de confianza para la diferencia = (−4 04, 3 24). ´ De esto ultimo podemos obtener un intervalo de confianza al 95 % para la media poblacional: −4 04 < µ − 14 < 3 24 ⇒ −4 04 + 14 < µ < 3 24 + 14 ⇒ 9 96 < µ < 17 24 . x − µ0 √ = −0 225, S/ n

5.2.

Comparaci´ n de dos medias con muestras independientes o

Para realizar un contraste de hip´ tesis sobre comparaci´ n de dos medias con muestras independientes se tiene que o o seleccionar Analizar ⇒Comparar medias ⇒Prueba T para muestras independientes. Aparece entonces el cuadro de di´ logo de la a Figura 111.

Figura 111: Cuadro de di´ logo para hacer un test de hip´ tesis sobre comparaci´ n de dos medias con muestras independia o o

entes Este procedimiento realiza el contraste bilateral de la hip´ tesis nula H0 : µ1 = µ2 frente a la hip´ tesis alternativa o o H1 : µ1 = µ2 en el caso de muestras independientes y varianzas poblacionales desconocidas, distinguiendo los casos en ´ que estas sean iguales o distintas. Por ello, tambi´ n presenta un contraste de comparaci´ n de varianzas poblacionales, que e o es la Prueba de Levene (un contraste m´ s independiente que otros respecto de la hip´ tesis de normalidad de las variables a o implicadas). Recordemos que para aplicar esta t´ cnica (test de la t de Student para dos muestras) se ha de cumplir que las e variables sean Normales o que los tama˜ os muestrales sean grandes (mayores o iguales que 30). n En Contrastar variables (Figura 111) se especifica la variable (o variables) objeto de estudio. T´ ngase presente que si e ´ ´ se especifica m´ s de una variable, estas ser´ n analizadas individualmente. En el recuadro Variable de agrupacion se ha de a a especificar una variable dicot´ mica o que se vaya a dicotomizar, pues queremos comparar las medias de la variable elegida o ´ en Contrastar variables para los dos grupos definidos por las dos categor´as de la variable especificada en Variable de agrupacion. ı ´ A continuaci´ n se ha de pulsar el bot´ n Definir grupos para especificar los dos grupos en los que se va a dividir esta ultima o o variable (ver Figura 112).

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

68

Figura 112: Cuadro de di´ logo para definir los grupos en una comparaci´ n de dos medias con muestras independientes a o

Los dos grupos se pueden crear bas´ ndose en una variable num´ rica o no num´ rica. Si la variable especificada en a e e
´ Variable de agrupacion es num´ rica (o num´ ricamente codificada) se puede dar, a su vez, dos casos: en el primero la variable e e es ya dicot´ mica, por lo que se activa Usar valores especificados (Figura 112) y se designan los dos grupos (Grupo 1 y Grupo o 2) seg´ n los valores originales. Si la variable num´ rica no es dicot´ mica, el recuadro Punto de corte tiene como objetivo el u e o

especificar el valor de la variable que dar´ lugar a una partici´ n en dos categor´as, una de las cuales ser´ el conjunto de los a o ı a valores menores que el especificado, y la otra el resto de valores. ´ Si la variable especificada en Variable de agrupacion no es num´ rica, el cuadro de di´ logo es como el anterior (Figura e a 112) si exceptuamos Punto de corte. Si la variable es ya dicot´ mica se designan los dos grupos (Grupo 1 y Grupo 2) seg´ n los o u valores originales. Si la variable no es dicot´ mica, se especifican s´ lo dos de las categor´as de dicha variable, quedando o o ı excluidas del an´ lisis el resto de ellas. a Igual que en el caso del contraste sobre una media, en el cuadro de di´ logo de la Figura 111 tambi´ n tenemos la a e posibilidad de activar Opciones, cuya interpretaci´ n es completamente an´ loga a la del contraste mencionado (ver Figura o a 108).

Figura 113: Resultados del contraste sobre comparaci´ n de dos medias con muestras independientes o

Con los datos de nuestro fichero Libros.sav, supongamos que queremos saber si la media del precio de los libros que se prestan poco es igual a la media del precio de los libros que se prestan mucho. Recordemos que los resultados de la variable pr´ stamo est´ n comprendidos entre 1 y 42 , y que su mediana es 11 5. Podemos dicotomizar la variable pr´ stamo e a e considerando que los libros que se prestan poco son los que tienen un resultado menor que 12 y los que se prestan mucho son los que tienen un resultado mayor o igual que 12. Por tanto, en Contrastar variables (de la Figura 111) colocamos precio ´ y en Variable de agrupacion seleccionamos pr´ stamo. Pulsamos, a continuaci´ n, el bot´ n Definir grupos, y en el cuadro que e o o resulta (Figura 112) activamos la opci´ n Punto de corte y escribimos en el recuadro el valor 12 (un grupo est´ formado por o a los valores menores que 12, y el otro por el resto). En el visor de SPSS aparecen los resultados que se muestran en la Figura 113. El tama˜ o muestral del grupo 1 (resultado de pr´ stamo mayor o igual que 12) es de 15, y el tama˜ o muestral del grupo n e n 2 (resultado de pr´ stamo menor que 12) es tambi´ n de 15. Ninguno de estos tama˜ os son grandes (mayores o iguales e e n que 30), pero suponemos que la variable precio es Normal (consultar el apartado 6.5 para comprobar que es cierto). Por tanto, se puede utilizar este procedimiento de comparaci´ n de dos medias poblacionales. Para cada uno de los dos grupos, o la primera tabla de la Figura 113 nos da los resultados de las medias muestrales (Media), las cuasidesviaciones t´picas ı muestrales (Desviaci´ n t´p.) y los errores t´picos de las medias (Error t´p. de la media). El error t´pico de la media es o ı ı ı ı la desviaci´ n t´pica del estad´stico media muestral, que es igual al valor de la cuasidesviaci´ n t´pica dividido por la ra´z o ı ı o ı ı

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

69

cuadrada del tama˜ o muestral. n En cuanto al resultado del contraste de hip´ tesis sobre igualdad de varianzas (Prueba de Levene) el valor del estad´stico o ı de contraste es 2 078 y el nivel cr´tico (Sig.) es 0 161. Como este nivel cr´tico es claramente mayor que el habitual nivel ı ı de significaci´ n, α = 0 05, entonces se puede aceptar la hip´ tesis de igualdad de varianzas poblacionales. Tenemos que o o ver, por tanto, los resultados del contraste de comparaci´ n de medias que hay a continuaci´ n de Se han asumido varianzas o o iguales. El estad´stico de contraste para la comparaci´ n de medias con varianzas desconocidas e iguales es: ı o x1 − x2 = 1 333, t= 2 2 (n1 − 1)S1 + (n2 − 1)S2 1 1 + n1 + n2 − 2 n1 n2 los grados de libertad son: gl = 28, el nivel cr´tico o p-valor es: ı Sig. (bilateral) = 0 193. Como dicho nivel cr´tico es claramente mayor que el habitual nivel de significaci´ n, α = 0 05, debemos aceptar la hip´ tesis ı o o nula; es decir, la media del precio de los libros que se prestan poco es igual a la media del precio de los libros que se prestan mucho. Adem´ s aparece el resultado de la diferencia entre las dos medias muestrales, x1 − x2 (que es igual al numerador a del estad´stico de contraste): ı Diferencia de medias = 10 27, el error t´pico de la diferencia (que es igual al denominador del estad´stico de contraste): ı ı 7 7, y un intervalo de confianza al 95 % para la diferencia de medias poblacionales: −5 505 < µ1 − µ2 < 26 038. 5.2.1. Ejemplo de edici´ n de unos datos para hacer la comparaci´ n de dos medias con muestras independientes o o

Se est´ realizando el estudio de una base de datos e interesa saber si los res´ menes que publica escritos en franc´ s son a u e significativamente diferentes en longitud (n´ mero de palabras) a los escritos en ingl´ s. La muestra estudiada se ha cogido u e al azar y consiste en 30 res´ menes escritos en franc´ s y 30 (independientes de los otros) en ingl´ s. u e e
franc´ s e 70 61 74 80 104 85 65 57 70 47 118 87 68 71 81 59 89 90 74 74 85 67 87 98 79 82 70 89 79 89 67 91 74 57 78 75 75 70 75 72 101 90 80 64 71 78 120 101 62 72 69 74 107 85 69 67 54 72 95 94

ingl´ s e

Hay que realizar un contraste de comparaci´ n de dos medias con muestras independientes. Pero, en primer lugar tenemos o que introducir estos datos en el editor y luego grabarlos en un nuevo fichero. La primera columna (que llamaremos longitud) va a contener todos los resultados de las dos muestras, una debajo de la otra. Y la segunda columna de datos (que llamaremos grupo) va a tener un 1 (para los resultados que provengan de la muestra de res´ menes escritos en franc´ s) o u e un 2 (para los resultados que provengan de la muestra de res´ menes escritos en ingl´ s). u e Para introducir estos datos en el editor de datos de SPSS, en primer lugar seleccionamos Archivo ⇒Nuevo ⇒Datos. En segundo lugar definimos convenientemente las dos variables. A continuaci´ n introducimos los datos de la manera indicada o ´ (ver la Figura 114). Y por ultimo grabamos estos datos en un nuevo fichero llamado LongitudResumenes.sav Ahora ya podemos, con los datos del fichero LongitudResumenes.sav, realizar el contraste mencionado. Para ello, en el cuadro de di´ logo de la Figura 111 se selecciona la variable longitud en el recuadro Contrastar variables; y la variable grupo a ´ en el recuadro Variable de agrupacion. En el cuadro de di´ logo de la Figura 112 se activa Usar valores especificados, y se coloca a un 1 junto a Grupo 1 y un 2 junto a Grupo 2. Los resultados de este contraste se muestran en la tabla de la Figura 115. Observamos que, en el contraste de comparaci´ n de varianzas poblacionales, el nivel cr´tico (Sig.) es igual a 0 003 o ı (menor que el habitual nivel de significaci´ n, α = 0 05) por lo que rechazamos la hip´ tesis de igualdad de varianzas, o o y por tanto aceptamos que las varianzas poblacionales son distintas. Observamos que el nivel cr´tico, Sig. (bilateral), ı para el contraste de comparaci´ n de medias con varianzas desconocidas y distintas es 0 (menor que el habitual nivel de o significaci´ n, α = 0 05) por lo que rechazamos la hip´ tesis de igualdad de medias. Por tanto, aceptamos que la media o o del n´ mero de palabras por resumen escrito en franc´ s es distinta de la media del n´ mero de palabras por resumen escrito u e u en ingl´ s. Adem´ s, como en las muestras se obtiene que la media (muestral) de los de franc´ s es menor que la media e a e (muestral) de los de ingl´ s, entonces debe aceptarse que ocurre lo mismo en las poblaciones respectivas. e

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

70

Figura 114: Datos del fichero LongitudResumenes.sav

Figura 115: Resultados del contraste sobre comparaci´ n de las medias de las longitudes de los res´ menes o u

5.3.

Comparaci´ n de dos medias con muestras relacionadas o

Para realizar un contraste de hip´ tesis sobre comparaci´ n de dos medias con muestras relacionadas se tiene que seleco o cionar Analizar ⇒Comparar medias ⇒Prueba T para muestras relacionadas. Aparece entonces el cuadro de di´ logo de la Figura a 117. Este procedimiento realiza el contraste bilateral de la hip´ tesis nula H0 : µ1 = µ2 frente a la hip´ tesis alternativa o o H1 : µ1 = µ2 en el caso de muestras apareadas. Recordemos que para aplicar esta t´ cnica se ha de cumplir que las e variables sean Normales o que el tama˜ o muestral sea grande (mayor o igual que 30). n Hay que declarar un par de variables en el recuadro Variables relacionadas. Para ello debemos seleccionar (marcar) un ´ par de variables de la lista; veremos como estas quedar´ n escritas autom´ ticamente junto a Variable 1 y Variable 2 del grupo a a Selecciones actuales. Despu´ s pulsamos el bot´ n e o . Igual que en el caso del contraste anterior, en el cuadro de di´ logo de la Figura 117 tambi´ n tenemos la posibilidad de a e

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

71

Figura 116: Resultados del contraste sobre comparaci´ n de dos medias con muestras relacionadas o

Figura 117: Cuadro de di´ logo para hacer un test de hip´ tesis sobre comparaci´ n de dos medias con muestras relaa o o

cionadas activar Opciones, cuya interpretaci´ n es completamente an´ loga a la del contraste mencionado (ver Figura 108). o a Como el tama˜ o muestral es 30, podemos aplicar este contraste a las variables opini´ n1 y opini´ n2. Los resultados n o o obtenidos se muestran en la Figura 116. En la primera tabla de la Figura 116 aparecen los resultados de los estad´sticos para cada una de las variables. Las ı medias muestrales son x1 = 2 93 y x2 = 3 17; las cuasidesviaciones t´picas muestrales son S1 = 1 413 y S2 = 1 206; los ı √ √ errores t´picos de las medias muestrales son S1 / n = 0 258 y S2 / n = 0 220, respectivamente. ı En la segunda tabla de la Figura 116 aparecen los resultados de la correlaci´ n entre las dos variables. El valor del o coeficiente de correlaci´ n lineal de Pearson en la muestra es r = 0 007. Tambi´ n aparece en esta tabla el resultado del o e nivel cr´tico para la hip´ tesis nula de igualdad a cero del coeficiente de correlaci´ n lineal poblacional. Este nivel cr´tico ı o o ı (Sig.) es igual a 0 972, claramente mayor que el habitual nivel de significaci´ n, α = 0 05, por lo que podemos aceptar la o hip´ tesis nula. Por tanto, aceptamos que las dos variables, opini´ n1 y opini´ n2, son independientes en la poblaci´ n de o o o o todos los libros. En la tercera tabla de la Figura 116 aparecen los siguientes resultados: la media de la variable diferencia D = X1 − X2 es igual a: Media = d = −0 23, la cuasidesviaci´ n t´pica de la variable diferencia D es igual a: o ı Desviaci´ n t´p. = Sd = 1 851, o ı la desviaci´ n t´pica del estad´stico d es igual a: o ı ı Sd Error t´p. de la media = √ = 0 338, ı n

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

72

un intervalo de confianza para la diferencia de la medias poblacionales es: −0 92 < µ1 − µ2 < 0 46, el estad´stico de contraste para la comparaci´ n de las dos medias poblacionales (con muestras relacionadas) es: ı o t= d = −0 690, S √d n gl = 29, y el nivel cr´tico es: ı Sig. (bilateral) = 0 495. Como dicho nivel cr´tico es claramente mayor que el habitual nivel de significaci´ n, α = 0 05, se puede aceptar la ı o hip´ tesis nula de la igualdad de las medias poblacionales de las dos variables. Por tanto, aceptamos que son iguales las o medias (poblacionales) de las opiniones de los dos primeros expertos en encuadernaci´ n. o

los grados de libertad son:

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

73

6.
6.1.

Contrastes no param´ tricos e
Contraste sobre una proporci´ n o

Para hacer un contraste de hip´ tesis sobre una proporci´ n poblacional se selecciona Analizar ⇒Pruebas no param´ trio o e cas ⇒Prueba Binomial. Si la variable estudiada no es dicot´ mica, debe dicotomizarse como veremos a continuaci´ n. Se o o

Figura 118: Cuadro de di´ logo para el contraste sobre una proporci´ n a o

especifican, como de costumbre, las variables a tratar en Contrastar variables teniendo presente que no tienen por qu´ ser e originariamente dicot´ micas (Figura 118). Dada la naturaleza del contraste, se examinan las variables de una en una. Si se o hace clic en Aceptar, las variables han de ser dicot´ micas y, por defecto, se obtienen los resultados del contraste en el caso o en que la proporci´ n poblacional esperada sea igual a 0 5. o Si la variable no es dicot´ mica, en Definir la dicotom´a se activa la opci´ n Punto de corte y en el recuadro adjunto se escribe o ı o ´ el valor de corte, de forma que los inferiores o iguales a el se agrupar´ n en la primera categor´a y el resto en la otra. Si a ı no queremos que las proporciones de ambas categor´as sean iguales (0 5), se puede especificar en el recuadro Contrastar ı ´ proporcion la proporci´ n (o probabilidad) esperada poblacional de la primera categor´a. o ı Supongamos que queremos contrastar la hip´ tesis nula de que la proporci´ n poblacional de libros que se prestan 15 o o veces o menos cada a˜ o es igual a 0 4. Para ello, en Contrastar variables elegimos la variable pr´ stamo; activamos la opci´ n n e o ´ Punto de corte y en el recuadro adjunto escribimos 15; en Contrastar proporcion escribimos , 4 (se ha de omitir el cero que hay delante de la coma decimal) y luego pulsamos Aceptar. Los resultados aparecen en la Figura 119. Como vemos, junto al nivel cr´tico (Sig. asint´ t.) aparece la palabra unilateral; esto significa que la hip´ tesis alternativa que se ha considerado ı o o es que la proporci´ n poblacional sea mayor que 0 4 (recordemos que la hip´ tesis alternativa debe ser compatible con o o los resultados de la muestra). Como el nivel cr´tico es 0 003 (claramente menor que el habitual nivel de significaci´ n, ı o α = 0 05) entonces se rechaza la hip´ tesis nula y por tanto se acepta la alternativa; es decir, se acepta que la proporci´ n o o poblacional de libros que se prestan anualmente 15 veces o menos es mayor que 0 4.

Figura 119: Contraste sobre una proporci´ n para la variable pr´ stamo o e

6.2.

Contraste χ2 de Pearson sobre proporciones

Para realizar este contraste se selecciona Analizar ⇒Pruebas no param´ tricas ⇒Chi-cuadrado. Este procedimiento tabula e una variable en categor´as y calcula un estad´stico chi-cuadrado. Esta prueba de bondad de ajuste compara las frecuencias ı ı observadas y esperadas en cada categor´a para contrastar si todas las categor´as contienen la misma proporci´ n de valores ı ı o o si cada categor´a contiene una proporci´ n de valores especificada por el usuario. ı o En el recuadro Contrastar variables del cuadro de di´ logo inicial (Figura 120) se seleccionan las variables objeto de a estudio. Haciendo clic en Aceptar se considera, por defecto, que cada categor´a de la variable tiene la misma frecuencia ı esperada. Con el fin de especificar el rango de valores que ser´ n objeto de an´ lisis, en Rango esperado se presentan dos alternativas: a a Obtener de los datos: Por defecto, cada valor de la variable es considerado una categor´a. ı

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

74

Figura 120: Cuadro de di´ logo para el contraste chi-cuadrado sobre proporciones a

Usar rango especificado: En caso de que se quiera analizar s´ lo un determinado rango de valores, se especifica en los reo cuadros de texto Inferior y Superior los valores, enteros, entre los que est´ n aquellos que interesan al usuario, incluidos a ellos mismos. En el grupo Valores esperados tenemos dos opciones: Todas las categor´as iguales: Por defecto, todas las categor´as tienen la misma frecuencia esperada (misma proporci´ n). ı ı o ´ Valores: Si no fuese este el caso, el usuario tiene la posibilidad de especificar en el recuadro de texto adjunto las frecuencias absolutas esperadas. Tambi´ n se pueden especificar los porcentajes o las frecuencias relativas (proporciones) e esperadas. Hay que ser cuidadoso con el orden en que se especifican las frecuencias, pues corresponden a los valores de la variable en orden ascendente. Si introducimos frecuencias absolutas esperadas, la suma de todas ellas debe ser igual al tama˜ o muestral; si son frecuencias relativas o proporciones, la suma de todas ellas debe ser igual a 1 (en n este caso la separaci´ n decimal se hace con una coma); y si son porcentajes, la suma debe ser igual a 100. o Por ejemplo, en Contrastar variables seleccionamos la variable opini´ n1 de nuestro fichero de datos Libros.sav. Recordeo mos que esta variable tiene 5 resultados distintos: 1, 2, 3, 4 y 5. Supongamos que queremos contrastar la hip´ tesis nula de o que las proporciones de estos resultados, en la poblaci´ n, son 0 2, 0 25, 0 15, 0 25 y 0 15, respectivamente; es decir: o P (X = 1) = 0 2, P (X = 2) = 0 25, P (X = 3) = 0 15, P (X = 4) = 0 25, P (X = 5) = 0 15

En el grupo Rango esperado debemos activar Obtener de los datos. En el grupo Valores esperados debemos seleccionar Valores. A continuaci´ n debemos especificar las frecuencias (o los porcentajes o las proporciones) esperadas. Si queremos especificar o las proporciones (probabilidades) esperadas, hacemos lo siguiente:
˜ En Valores escribimos 0, 2 y pulsamos Anadir. Esto significa que la proporci´ n (o probabilidad) esperada para el o primer resultado de la variable (que es 1) es igual a 0, 2 (por tanto, el porcentaje esperado es el 20 %). ˜ En Valores escribimos 0, 25 y pulsamos Anadir. Esto significa que la proporci´ n (o probabilidad) esperada para el o segundo resultado de la variable (que es 2) es igual a 0, 25 (por tanto, el porcentaje esperado es el 25 %). ˜ En Valores escribimos 0, 15 y pulsamos Anadir. Esto significa que la proporci´ n (o probabilidad) esperada para el o tercer resultado de la variable (que es 3) es igual a 0, 15 (por tanto, el porcentaje esperado es el 15 %). ˜ En Valores escribimos 0, 25 y pulsamos Anadir. Esto significa que la proporci´ n (o probabilidad) esperada para el o cuarto resultado de la variable (que es 4) es igual a 0, 25 (por tanto, el porcentaje esperado es el 25 %). ˜ En Valores escribimos 0, 15 y pulsamos Anadir. Esto significa que la proporci´ n (o probabilidad) esperada para el o quinto resultado de la variable (que es 5) es igual a 0, 15 (por tanto, el porcentaje esperado es el 15 %).

Si se quiere especificar los porcentajes esperados, hacemos lo mismo pero en vez de escribir 0, 2; 0, 25; 0, 15; 0 25 y ´ 0, 15 se escribe 20, 25, 15, 25 y 15. Por ultimo, si se quiere especificar las frecuencias absolutas esperadas, tecleamos los siguientes valores: 6; 7, 5; 4, 5; 7, 5 y 4, 5 (pues 6 es el 20 % de 30, 7 5 es el 25 % de 30 y 4 5 es el 15 % de 30). Los resultados se muestran en la Figura 121. Como el nivel cr´tico (Sig. asint´ t.) es igual a 0 996 (claramente mayor que el ı o habitual nivel de significaci´ n, α = 0 05) aceptamos la hip´ tesis nula. Pero esa conclusi´ n no es muy fiable porque para o o o aplicar el contraste χ2 de Pearson de bondad de ajuste es conveniente que haya como m´ ximo un 20 % de frecuencias a esperadas menores que 5; sin embargo, en este ejemplo hay un 40 % de frecuencias esperadas menores que 5.

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

75

Figura 121: Resultados del contraste chi-cuadrado sobre proporciones para la variable opini´ n1 o

6.3.

Contraste χ2 sobre independencia de dos variables

Para obtener los resultados del contraste χ2 de Pearson sobre independencia de variables aleatorias se selecciona
Analizar ⇒Estad´sticos descriptivos ⇒Tablas de contingencia. ı

Figura 122: Cuadro de di´ logo de la opci´ n Tablas de contingencia a o

Como se ve en la Figura 122, podemos seleccionar las variables que constituyen las Filas por un lado, y las Columnas por otro. El que se especifique m´ s de una variable de cada tipo no implica que se vayan a tratar todas conjuntamente, sino que a se procesan las posibles combinaciones de dos en dos. Por defecto, haciendo clic en Aceptar, y sin m´ s especificaciones, se a obtienen las tablas de contingencia (o de doble entrada) con las frecuencias absolutas conjuntas y marginales. Por ejemplo, si en Filas seleccionamos la variable opini´ n1 y en Columnas la variable opini´ n2 obtenemos en el visor de resultados de o o SPSS las tablas de las Figuras 123 y 124.

Figura 123: Tabla–resumen de casos de las variables opini´ n1 y opini´ n2 o o

En el cuadro de di´ logo de la Figura 122 podemos seleccionar una variable de control en el tercer recuadro en blanco. a Por cada categor´a de esta tercera variable (la de control) se presenta una tabla de contingencia simple de las dos variables ı especificadas en Filas y Columnas. Es posible especificar m´ s de una variable de control. En el caso de que hubiese, por a ejemplo, dos variables de control, se producir´a una tabla de contingencia simple de las dos variables cuya relaci´ n se ı o quiere examinar por cada combinaci´ n de categor´as de las dos variables de control. o ı

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

76

Figura 124: Tabla de contingencia de las variables opini´ n1 y opini´ n2 o o

Por ejemplo, si en Filas seleccionamos la variable opini´ n1, en Columnas la variable opini´ n2 y en el recuadro de las o o variables de control seleccionamos la variable materia, obtenemos, en el visor de resultados, la tabla de la Figura 125.

Figura 125: Tabla de contingencia de opini´ n1 y opini´ n2 con la variable control materia o o

En el cuadro de di´ logo de la Figura 122 hay dos opciones m´ s, que son: a a Mostrar los gr´ ficos de barras agrupados: Se obtiene el gr´ fico de barras de la variable declarada en Filas, agrupado a a seg´ n la variable de Columnas. u Suprimir tablas: No se muestra ninguna tabla, sino s´ lo los estad´sticos (en el caso de que por lo menos alguno de ellos o ı haya sido solicitado). En el cuadro de di´ logo de la Figura 122 nos quedan tres botones por explicar: Estad´sticos, Casillas y Formato. a ı

Figura 126: Cuadro de di´ logo de la opci´ n Estad´sticos a o ı

Si pulsamos el bot´ n Estad´sticos nos aparece el cuadro de di´ logo de la Figura 126. En este cuadro se pueden elegir los o ı a coeficientes de correlaci´ n que deseemos calcular. Tambi´ n con esta opci´ n se realizan tests de hip´ tesis para contrastar o e o o

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

77

la hip´ tesis de que el coeficiente de correlaci´ n en toda la poblaci´ n sea igual a cero. De entre todo lo que aparece, nos o o o interesa marcar la opci´ n Chi-cuadrado, que proporciona los resultados del contraste χ2 de Pearson sobre independencia de o las dos variables implicadas. Por ejemplo, en Filas seleccionamos la variable opini´ n1, en Columnas la variable opini´ n2 y al pulsar el bot´ n Eso o o tad´sticos seleccionamos Chi-cuadrado. Obtenemos, entonces las tablas de las Figuras 123, 124 y 127. ı

Figura 127: Contraste χ2 de Pearson sobre independencia de las variables opini´ n1 y opini´ n2 o o

Comentaremos los resultados: En primer lugar, los contrastes Raz´ n de verosimilitud y Asociaci´ n lineal por lineal no o o los hemos estudiado. En lo concerniente al contraste Chi-cuadrado de Pearson sobre independencia de las dos variables, el valor (muestral) del estad´stico χ2 es 13 659; los grados de libertad (gl) son 16, que es el resultado de la siguiente ı multiplicaci´ n: (n´ mero de filas-1)×(n´ mero de columnas-1); y el p-valor o n´vel cr´tico (Sig. asint. bilateral) es 0 624 o u u ı ı (mayor que el habitual nivel de significaci´ n, α = 0 05), por lo que deber´amos aceptar la hip´ tesis nula de independencia o ı o de las variables opini´ n1 y opini´ n2. Pero hay que tener en cuenta la observaci´ n que aparece en la parte inferior de la o o o tabla, en la que se nos hace notar que el 100 % (m´ s del 20 %) de las frecuencias esperadas (eij ) son inferiores a 5; por a lo tanto, no podemos aplicar este contraste. Adem´ s, hay frecuencias esperadas menores que 1 (la menor es 0 33). En a consecuencia, no podemos hacer caso de los resultados de este contraste para las variables seleccionadas, ya que no se cumplen las condiciones para poder aplicar dicho procedimiento. Si pulsamos el bot´ n Casillas del cuadro de di´ logo de la Figura 122 nos aparece el nuevo cuadro de di´ logo de la o a a Figura 128. En este cuadro nos encontramos con tres bloques de opciones aditivas. En el bloque Frecuencias tenemos:

Figura 128: Cuadro de di´ logo para especificar m´ s cosas sobre las casillas de las tablas de contingencia a a

Observadas: Por defecto muestra las frecuencias absolutas observadas. Esperadas: Son las frecuencias absolutas esperadas baja la hip´ tesis de independencia entre ambas variables (´ tiles para o u realizar el test de independencia chi-cuadrado). En el bloque Porcentajes tenemos: Fila: Porcentaje de casos en cada casilla respecto de casos totales de la fila. Columna: An´ logo por columnas. a Total: Porcentaje de casos en cada casilla sobre el total de la tabla. En el bloque Residuos s´ lo explicar´ que la opci´ n No tipificados presenta los resultados de las diferencias entre frecuencias o e o absolutas observadas y las frecuencias absolutas esperadas. Respecto del ejemplo que estamos comentando, si en Frecuencias seleccionamos Observadas y Esperadas; en Porcentajes seleccionamos Total; y en Residuos seleccionamos No tipificados; entonces obtenemos los resultados de la Figura 129. Si pulsamos el bot´ n Formato del cuadro de di´ logo de la Figura 122 nos aparece el nuevo cuadro de di´ logo de la o a a Figura 130. En este cuadro s´ lo es posible reordenar las filas: o Ascendente: Se presentan los valores de la variable en orden ascendente (es la opci´ n por defecto). o Descendente: Al contrario de la anterior.

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

78

Figura 129: Nueva tabla de contingencia de las variables opini´ n1 y opini´ n2 o o

Figura 130: Cuadro de di´ logo para especificar el formato de las tablas de contingencia a

6.3.1.

Ejemplo de edici´ n de una tabla de contingencia en el editor de datos o

Supongamos que queremos saber si, en una determinada poblaci´ n, son independientes las variables “uso de la bibo lioteca” y “preferencia sobre distintos tipos de pel´cula”, seg´ n los datos de la siguiente muestra: ı u
uso de la biblioteca alto medio bajo pel´culas ı b´ licas e 16 6 4 pel´culas ı de aventuras 8 10 8 pel´culas ı melodram´ ticas a 2 4 12

En primer lugar tenemos que introducir estos datos. Para ello, se selecciona Archivo ⇒Nuevo ⇒Datos. Se crean dos variables, que se pueden denominar uso y pel´cula, de manera que entre ambas reflejen todas las posibles combinaciones ı entre sus modalidades. Los resultados de la variable uso ser´ n: 1 (=“alto uso”), 2 (=“medio uso”) y 3 (=“bajo uso”). Los a resultados de la variable pel´cula ser´ n: 1 (=“b´ licas”), 2 (=“aventuras”) y 3 (=“melodram´ ticas”). Adem´ s hay que crear ı a e a a otra variable, que llamaremos frecuenc con las frecuencias absolutas observadas en cada combinaci´ n de modalidades. o Como se ha de reflejar todas las posibles combinaciones de los resultados de las dos variables, la matriz de datos ha de ser la de la Figura 131. No olvidemos grabar ahora este fichero de datos con el nombre Contingencia.sav. A continuaci´ n, desde la ventana del Editor de datos, hay que seleccionar Datos ⇒Ponderar casos. En el cuadro de o di´ logo resultante (Figura 133) hay que activar la opci´ n Ponderar casos mediante y hay que seleccionar la variable frecuenc a o en el recuadro Variable de frecuencia. A partir de aqu´ se puede hacer todo lo anteriormente expuesto: Seleccionamos la opci´ n Analizar ⇒Estad´sticos descripı o ı tivos ⇒Tablas de contingencia. En el cuadro de di´ logo de la Figura 122 seleccionamos la variable uso en Filas y la variable a pel´cula en Columnas. Pulsamos el bot´ n Estad´sticos y en el cuadro que aparece (Figura 126) activamos Chi-cuadrado. En el ı o ı cuadro de di´ logo de la Figura 122 podemos tambi´ n pulsar el bot´ n Casillas y activar (Figura 128) las opciones Esperadas a e o (Frecuencias) y No tipificados (Residuos). Los resultados se muestran en las Figuras 132 y 134.

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

79

Figura 131: Datos del fichero Contingencia.sav

Figura 132: Tabla de contingencia entre uso y pel´cula ı

Seg´ n los resultados (Figura 134), el nivel cr´tico (Sig. asint. (bilateral)) es igual a 0 002 (claramente menor que el u ı habitual nivel de significaci´ n, α = 0 05) por lo que rechazamos la hip´ tesis nula de que las variables uso y pel´cula son o o ı independientes. Por tanto, aceptamos que dichas variables son dependientes.

6.4.

Contraste de las rachas sobre aleatoriedad de la muestra

El contraste de las rachas sobre aleatoriedad de una muestra se realiza mediante Analizar ⇒Pruebas no param´ tricas e ⇒Rachas. Esta prueba no puede utilizarse si los valores de la variable han sido ordenados en el archivo de datos. En Contrastar variables (Figura 135) se declaran las variables a analizar. Si hacemos clic en Aceptar, por defecto, las variables no dicot´ micas se dicotomizan convenientemente a trav´ s de su mediana. De no ser tal criterio, el usuario puede establecer o e otros haciendo uso de las opciones de Punto de corte, de forma que en la primera categor´a se agrupan los valores menores ı que el de corte especificado. Aplicamos lo expuesto a la variable precio dicotomizada en funci´ n de la mediana. La conclusi´ n (Figura 136) es que o o podemos aceptar la hip´ tesis nula de aleatoriedad de los resultados muestrales de la variable precio, ya que el nivel cr´tico o ı (Sig. asint´ t. bilateral) es igual a 0 353 (mayor que el habitual nivel de significaci´ n, α = 0 05). o o

Figura 133: Cuadro de di´ logo para ponderar casos a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

80

Figura 134: Contraste chi-cuadrado sobre independencia entre las variables uso y pel´cula ı

Figura 135: Cuadro de di´ logo para el contraste de las rachas sobre aleatoriedad de la muestra a

6.5.

Contraste de Kolmogorov–Smirnov sobre bondad de ajuste. Normalidad

Para hacer este contraste se selecciona Analizar ⇒Pruebas no param´ tricas ⇒K-S de 1 muestra (Figura 137). Como siempre, e en Contrastar variables son declaradas las variables que individualmente ser´ n sometidas a an´ lisis. Por defecto, haciendo a a clic en Aceptar, la distribuci´ n con la que se compara la observada es la Normal definida por la misma media y desviaci´ n o o t´pica que la emp´rica. En el caso de que no sea tal la distribuci´ n que el usuario desea tomar como segundo miembro de ı ı o la hip´ tesis nula, se ofrecen otras tres opciones: Uniforme, Poisson y Exponencial. o Veamos ahora si se puede aceptar que las variables precio, altura, peso y pr´ stamo siguen una distribuci´ n Normal. e o A la vista de los resultados (Figura 138) se puede aceptar que las cuatro variables son normales, ya que el nivel cr´tico ı (Sig. asint´ t. bilateral) es, en los cuatro casos, mayor de el habitual nivel de significaci´ n, α = 0 05. o o

6.6.

Contraste de homogeneidad con 2 muestras independientes

En general, el procedimiento que vamos a explicar se aplica cuando la variable es cuantitativa o cualitativa ordinal pero no es Normal y, adem´ s, los tama˜ os muestrales no son grandes; caso en el que no se puede usar la t´ cnica del apartado a n e 5.2. El cuadro de di´ logo inicial se logra con Analizar ⇒Pruebas no param´ tricas ⇒2 muestras independientes (Figura 139). a e ´ En Contrastar variables se especifica la variable (o variables) objeto de estudio. Si se especifica m´ s de una variable, estas a ´ ser´ n analizadas individualmente. En el recuadro Variable de agrupacion se ha de especificar una variable (con resultados a num´ ricos) dicot´ mica pues queremos comparar las distribuciones de la variable elegida en Contrastar variables para los e o ´ dos grupos definidos por las dos categor´as de la variable especificada en Variable de agrupacion. A continuaci´ n se ha de ı o pulsar el bot´ n Definir grupos para especificar los dos grupos que queremos comparar (ver Figura 140). En el grupo Tipo o

Figura 136: Contraste de las rachas sobre aleatoriedad de los resultados muestrales de la variable precio

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

81

Figura 137: Cuadro de di´ logo para el contraste de Kolmogorov–Smirnov sobre bondad de ajuste a

Figura 138: Ejemplo del contraste de Kolmogorov–Smirnov sobre bondad de ajuste

de prueba se presentan, adem´ s del contraste U de Mann–Whitney ya conocido, otros como: Reacciones extremas de Moses, Z de a Kolmogorov–Smirnov y Rachas de Wald–Wolfowitz.

Supongamos que queremos saber si la distribuci´ n de la variable precio es la misma en el grupo en que la variable opio ni´ n1 vale 2 (“mala encuadernaci´ n” seg´ n el criterio del primer experto) que en el grupo en que la variable opini´ n1 vale o o u o 4 (“buena encuadernaci´ n” seg´ n el criterio del primer experto). Para ello, en Contrastar variables (Figura 139) colocamos la o u ´ variable precio y en el recuadro Variable de agrupacion elegimos la variable opini´ n1. Pulsamos Definir grupos y, en el cuadro o que aparece, escribimos 2 en Grupo 1 y 4 en Grupo 2. Pulsamos Continuar y en el cuadro inicial s´ lo dejamos seleccionada la o opci´ n U de Mann–Whitney. Tras pulsar Aceptar obtenemos los resultados de la Figura 141. Como el nivel cr´tico (Sig. asint´ t. o ı o bilateral) es igual a 0 063 (mayor que el habitual nivel de significaci´ n, α = 0 05) podr´amos aceptar la hip´ tesis nula de o ı o homogeneidad; es decir, el precio es el mismo en el grupo de libros cuya encuadernaci´ n es mala (seg´ n el criterio del o u primer experto) que en el grupo de libros cuya encuadernaci´ n es buena (seg´ n el criterio del primer experto. o u Si tuvi´ semos que introducir, en el editor de datos de SPSS, los resultados de dos muestras independientes para come probar si las dos poblaciones son homog´ neas, habr´a que hacerlo de forma totalmente an´ loga a la manera descrita en e ı a el apartado 5.2.1: la primera columna va a contener todos los resultados de las dos muestras, una debajo de la otra; y la segunda columna de datos va a tener un 1 para los resultados que provengan de la muestra primera, o un 2 para los resultados que provengan de la muestra segunda.

Figura 139: Cuadro de di´ logo para el contraste de homogeneidad con dos muestras independientes a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

82

Figura 140: Cuadro de di´ logo para definir los grupos en un contraste de homogeneidad con dos muestras independientes a

Figura 141: Ejemplo de un contraste de homogeneidad con dos muestras independientes

6.7.

Contraste de homogeneidad con m´ s de dos muestras independientes a

El cuadro de di´ logo inicial se logra con Analizar ⇒Pruebas no param´ tricas ⇒K muestras independientes (Figura 142). En a e

Figura 142: Cuadro de di´ logo para el contraste de homogeneidad con m´ s de dos muestras independientes a a

´ Contrastar variables se especifica la variable (o variables) objeto de estudio. Si se especifica m´ s de una variable, estas ser´ n a a analizadas individualmente. Se comparan las distribuciones de la variable elegida en Contrastar variables para los distintos ´ grupos definidos por las categor´as de la variable especificada en Variable de agrupacion. A continuaci´ n se ha de pulsar el ı o bot´ n Definir rango para especificar los grupos que queremos comparar (Figura 143). o En el grupo Tipo de prueba (Figura 142) se presenta, adem´ s del contraste H de Kruskal–Wallis, el test de la Mediana (que a prueba si las k muestras independientes proceden de poblaciones con la misma mediana). Supongamos que queremos saber si la distribuci´ n de la variable precio es la misma en los cinco grupos en que tenemos o dividida la variable opini´ n1 (1=muy mala, 2=mala, 3=regular, 4=buena, 5=muy buena). Para ello, en Contrastar variables o ´ colocamos la variable precio y en el recuadro Variable de agrupacion elegimos la variable opini´ n1. Pulsamos Definir rango o y, en el cuadro que aparece (Figura 143), escribimos 1 en M´nimo y 5 en M´ ximo. Pulsamos Continuar y en el cuadro inicial ı a dejamos seleccionada la opci´ n H de Kruskal–Wallis. Tras pulsar Aceptar obtenemos los resultados de la Figura 144. Como el o nivel cr´tico (Sig. asint´ t.) es igual a 0 745 (mayor que el habitual nivel de significaci´ n, α = 0 05) aceptamos la hip´ tesis ı o o o nula de homogeneidad; es decir, la distribuci´ n de la variable precio es la misma en las cinco categor´as; es decir, el precio o ı no depende de la calidad de la encuadernaci´ n de los libros. o Si tuvi´ semos que introducir, en el editor de datos de SPSS, los resultados de k muestras independientes para come

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

83

Figura 143: Cuadro de di´ logo para definir los grupos en un contraste de homogeneidad con m´ s de dos muestras indea a

pendientes

Figura 144: Ejemplo de un contraste de homogeneidad con m´ s de dos muestras independientes a

probar si las k poblaciones son homog´ neas, habr´a que hacerlo de forma totalmente an´ loga a la manera descrita en el e ı a apartado 5.2.1: los resultados de las k muestras se ponen todos en la primera columna (una muestra debajo de otra) pero en esta ocasi´ n la variable grupo tendr´a por resultados: 1, 2, 3, . . . , k, dependiendo de a qu´ muestra pertenece cada resultado o ı e de los que est´ n en la columna primera. a

Figura 145: Cuadro de di´ logo para el contraste de homogeneidad con dos muestras dependientes a

6.8.

Contraste de homogeneidad con 2 muestras relacionadas

En general, el procedimiento que vamos a explicar se aplica cuando las variables son cuantitativas o cualitativas ordinales pero no son Normales y, adem´ s, los tama˜ os muestrales no son grandes; caso en el que no se puede usar la t´ cnica a n e del apartado 5.3. El cuadro de di´ logo inicial de este procedimiento se logra con Analizar ⇒Pruebas no param´ tricas ⇒2 muestras relaa e ´ cionadas (Figura 145). En primer lugar debemos seleccionar (marcar) un par de variables de la lista; veremos como estas quedar´ n escritas autom´ ticamente junto a Variable 1 y Variable 2. Despu´ s pulsamos el bot´ n a a e o . En Tipo de prueba se presentan, adem´ s del conocido contraste de homogeneidad de Wilcoxon, el contraste de los Signos y el de McNemar (que s´ lo a o es v´ lido cuando ambas variables son dicot´ micas). a o A partir de la muestra de datos contenida en el fichero Libros.sav, veamos si la opini´ n de los expertos 2 y 3 respecto de o

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

84

Figura 146: Ejemplo del contraste de Wilcoxon sobre homogeneidad con dos muestras dependientes

la encuadernaci´ n de los libros se puede considerar la misma en la poblaci´ n total de libros. Notemos que, efectivamente, o o las dos muestras son dependientes, pues realmente son la misma muestra (a la cual se le ha observado dos variables distintas). Para ello, en el cuadro de di´ logo de la Figura 145 marcamos las variables opini´ n2 y opini´ n3, pulsamos el a o o bot´ n o y dejamos seleccionada la opci´ n Wilcoxon. Tras pulsar Aceptar obtenemos los resultados de la Figura 146. Como o el nivel cr´tico (Sig. asint. bilateral) es 0 148 (mayor que el habitual nivel de significaci´ n, α = 0 05) entonces se puede ı o aceptar la hip´ tesis de homogeneidad; es decir, que no hay diferencia de criterio entre los expertos 2 y 3 respecto de la o encuadernaci´ n de los libros. o

Figura 147: Cuadro de di´ logo para el contraste de homogeneidad con m´ s de dos muestras dependientes a a

Figura 148: Ejemplo del contraste de Friedman sobre homogeneidad con m´ s de dos muestras dependientes a

Dra. Josefa Mar´n Fern´ ndez • Manual de SPSS 11.5 para Windows (aplicado a las Ciencias de la Documentaci´ n) ı a o

85

6.9.

Contraste de homogeneidad con m´ s de dos muestras relacionadas a

El cuadro de di´ logo inicial se logra con Analizar ⇒Pruebas no param´ tricas ⇒K muestras relacionadas (Figura 147). a e Para declarar las variables que ser´ n objeto de an´ lisis debemos seleccionarlas (marcarlas) en la lista que aparece a a en el cuadro de di´ logo. Despu´ s pulsamos el bot´ n a e o . En Tipo de prueba se presentan, adem´ s del conocido contraste a de homogeneidad de Friedman, el contraste W de Kendall y el Q de Cochran (que s´ lo es v´ lido cuando todas las variables o a seleccionadas son dicot´ micas). o A partir de la muestra de datos contenida en el fichero Libros.sav, veamos si la opini´ n de los tres expertos en la o encuadernaci´ n de los libros se puede considerar la misma en la poblaci´ n. En el cuadro de di´ logo de la Figura 147 o o a y dejamos seleccionada la opci´ n Friedman. o marcamos las variables opini´ n1, opini´ n2 y opini´ n3, pulsamos el bot´ n o o o o Los resultados aparecen en la Figura 148. Debido a que el nivel cr´tico (Sig. asint´ t.) es 0 289 (mayor que el habitual nivel ı o de significaci´ n, α = 0 05) entonces se puede aceptar la hip´ tesis de homogeneidad; es decir, que no hay diferencia de o o criterio entre los tres expertos respecto de la encuadernaci´ n de los libros. o

Sign up to vote on this title
UsefulNot useful