You are on page 1of 10

PRCTICAS DE ESTADSTICA DESCRIPTIVA INTRODUCCIN AL MANEJO DE STATGRAPHICS

Statgraphics es un software diseado para facilitar el anlisis estadstico de datos y que utilizaremos a lo largo del curso. El objetivo de esta prctica es que te familiarices con los distintos mens y opciones que Statgraphics proporciona para la descripcin estadstica de datos. Para ello, se propone la siguiente actividad guiada. Debes leer este documento detenidamente y realizar con el programa procedimientos que se describen.

I. INTRODUCCIN Y CONCEPTOS BSICOS


Estudiaremos cmo hacer que Statgraphics proporcione un anlisis descriptivo de un conjunto de datos; es decir, que proporcione los valores de los estadsticos ms importantes, que tabule los datos de distintas formas y que realice grficos que expliquen la distribucin de los datos. El programa trabaja en un entorno Windows y se puede arrancar de tres formas: Ejecutando el programa sgwin.exe Haciendo doble clic sobre el icono correspondiente Desde el men Inicio, seleccionar sucesivamente Programas/Statgraphics Plus 5.1/ Sgwin Aparece la pantalla principal:

Como es habitual, para salir del programa seleccionamos en la barra de men ARCHIVO...SALIR DE STATGRAPHICS o, simplemente, se cierra la ventana principal de la aplicacin pulsando el aspa que hay en el marco, arriba ala derecha. En la pantalla principal de Statgraphics, podemos distinguir los siguientes elementos: 1. Barra de men 2. Barra de herramientas 3. Barra de tareas

1.1. Barra de mens

esta barra siempre est disponible, y permite acceder a todas las opciones que ofrece el programa. Para desplegar un men: o bien al hacer clic con el ratn sobre cada una de las palabras que componen la barra, o bien pulsar la tecla Alt. Observa queaparece subrayada una letra la palabra que etiqueta cada men. La combinacin Alt+Esa letra despliega el men correspondiente. Por ejemplo de ca +Letra Inicial de nombre del men. Por ejemplo, Alt+a abre el men Archivo A lo largo de este curso no usaremos todos los mens; de momento nos interesamos por: Archivo: permite realizar operaciones de carcter general: abrir, cerrar o grabar ficheros, imprimir y salir de Statgraphics. Edicin: est asociado a opciones de edicin: cortar, copiar, pegar, deshacer... Descripcin: contiene opciones para describir un conjunto de datos. Pulsa con le ratn cada uno de ellos y mira qu opciones despliegan.

1.2. Barra de herramientas

Asocia iconos (botones) con algunas de las opciones ms frecuentemente utilizadas de la barra de men. Si se seala con el ratn cualquier botn de la barra, aparecer una breve descripcin de la funcin asociada.

1.3. Barra de tareas

El trabajo con Statgraphics implica hacer distintos tipos de anlisis estadsticos con datos. Adems, el programa ofrece informacin sobre esos anlisis y permite almacenar y editar los resultados obtenidos como resultado del estudio. Statgraphics genera automticamente una serie de ventanas en la que se recoger toda la informacin a la que nos referamos antes: Ventana de datos: hoja de clculo que contiene los datos que se van analizar. Inicialmente se llama <Sin nombre>, puesto que an no hay datos en el sistema.. Statadvisor: herramienta que interpreta de forma sencilla los resultados obtenidos. Statreporter: aqu podemos copiar los resultados del anlisis estadstico en un fichero con formato *.rtf (rich text format) compatible con OpenOffice, MSOffice,.... Podemos editar la informacin contenida en esta ventana igual que al trabajar con un procesador de textos. Sin Nombre Comentarios: Permite teclear una pequea descripcin del Statfolio (ver abajo). Statgallery: Los resultados del anlisis estadstico aparecen organizados en marcos. En esta ventana podemos guardar el contenido de esos marcos en otro marco. As, la informacin queda organizada en algo que se parece a una presentacin con diapositivas. Podemos modificar la disposicin de los paneles del Statgallery sin ms que desplazar con el ratn las barras horizontales y verticales. El conjunto de estos elementos se llama Statfolio. Un poco ms adelante volveremos sobre esto.

2.- INTRODUCIR DATOS EN STATGRAPHICS.


Para realizar anlisis tenemos que proporcionar datos a Statgraphics. Podemos, o bien hacerlo desde el teclado, o bien abrir un fichero que los contenga. 2.1. Asignar datos manualmente. Columnas calculadas. Cada columna contendr los valores que toma una variable estadstica. Para poder analizar una variable (es decir, los valores que toma) es necesario definir dicha variable. Para ello: Seleccionar la columna en la que introduciremos los datos: hacer clic sobre la etiqueta de la columna (Inicialmente Col_1)

Pulsar con el botn derecho del ratn sobre la columna seleccionada. Aparecer un men del que seleccionamos la opcin Modificar Columna:

En esta pantalla escribiremos el nombre de la variable (mximo 32 caracteres, sin espacios en blanco, signos especiales y utilizando siempre una letra como primer carcter), y el tipo de variable (Numrica si vamos a analizar nmeros). Llama a esta variable EJEMPLO. Pulsar ACEPTAR y teclea los valores de la variable EJEMPLO (copialos o inventa 14 valores).

Statgraphics permite introducir columnas calculadas, esto es, crear una nueva variable (columna) como

transformacin de otras variables (columnas) previamente definidas. Para obtener una columna calculada realizamos las siguientes operaciones: Seleccionar la columna donde queremos que aparezcan los datos calculados. Hacer clic con el botn derecho del ratn y elegir la opcin Generar datos del men que aparece. Componer, en la ventana que aparece, la expresin para el clculo de los nuevos datos: (en este caso multiplicaremos por 2 la variable EJEMPLO).

Al pulsar ACEPTAR aparecer en la ventana de datos el clculo deseado.

Los ficheros de datos generados pueden almacenarse para anlisis posteriores. Para ello, en el men ARCHIVO seleccionaremos ARCHIVO...GUARDAR...GUARDAR DATOS / ARCHIVO...GUARDAR COMO....GUARDAR DATOS COMO y elegir el nombre y la ubicacin deseada para el archivo. (Podrn recuperarse posteriormente con la opcin ARCHIVO...ABRIR ... ABRIR DATOS).

2.2 Abrir/cargar un fichero de datos.


Hay dos opciones: usar la barra de mens: ARCHIVO...ABRIR...ABRIR DATOS.... altura-2.sf3. Observa que podas haber abierto tambin un Statgallery, Statreporter,... Utilizar el atajo de la barra de herramientas. La tabla de datos aparecer en pantalla.

3.- PRIMER ANLISIS.


Una vez abiertos los datos, en la barra de mens, sigue la ruta DESCRIPCIN..DATOS NUMRICOS...ANLISI UNIDIMENSIONAL

Observa que los datos aparecen en una ventana que ahora se llama altura-2.sf3. Realizar un anlisis descriptivo de la variable ALTURA. Para ello, pulsa DESCRIPCIN...DATOS NUMRICOS...ANLISIS UNIDIMENSIONAL. Selecciona DATOS..ALTURA...ACEPTAR. Observa que ha aparecido una nueva ventana llamada Anlisis Unidimensional ALTURA con cuatro marcos que contienen los resultados del anlisis.

3.1. Organizar y guardar los resultados del anlisis.


Statgraphics no slo proporciona un anlisis de los datos; tambin ayuda con la interpretacin. A la vez, ofrece cierta informacin sobre los procedimientos utilizados y las conclusiones que podemos extraer. Statadvisor: Pincha un marco cualquiera de la ventana de Anlisis Unidimensional y ve a la ventana Statadvisor. Vers que el sistema ha generado una serie de comentario que explican el contenido de dicho marco. Repite la operacin con otro marco. Statreporter: Sita el ratn sobre uno de los marcos, pulsa el botn derecho y selecciona Copiar anlisis a Statreporter. Ve a la ventana Statreporter. Observa que los resultados obtenidos en el anlisis unidimensional han sido transferidos a un fichero de texto en el que puedes editar el texto y aadir comentarios o imgenes. Adems, puedes guardar este fichero: ARCHIVO...GUARDAR...GUARDAR STATREPORTER. Statgallery: Sita el ratn sobre uno de los marcos, pulsa el botn derecho y selecciona la opcin Copiar ventana a galera. Accede a la ventana Statgallery. Vers que no has copiado nada. Sita el ratn en uno de los marcos, pulsa el botn derecho del ratn, Copiar. Vers que aparece el marco que habas seleccionado en la pgina del anlisis en el marco del Statgallery. De nuevo, puedes guardar este fichero: ARCHIVO...GUARDAR...GUARDAR STATGALLERY Statfolio: Es el conjunto formado por los anlisis que hayas realizado junto con los statreporter/statgallery que hayas generado. Para guardarlos como un todo, selecciona Adems, puedes guardar este fichero: ARCHIVO...GUARDAR...GUARDAR STATFOLIO, de modo que en futuras sesiones puedas restaurar tu trabajo exactamente en el punto en el que lo dejaste.

3.2 Analizar subconjuntos de datos.


A veces queremos estudiar un subconjunto de los valores que toma una variable estadstica. Para hacer esa seleccin, es necesario decirle al sistema cmo distinguir los elementos de ese subconjunto. Por ejemplo, con el fichero de datos con el que venimos trabajando, queremos estudiar la altura de individuos menores de 14 aos. En el cuadro de dilogo que aparece al seguir la ruta DESCRIPCIN...DATOS NUMRICOS...ANLISIS UNIDIMENSIONAL, selecciona DATOS..ALTURA. Adems, hay otra casilla: SELECCIN. Si en esa casilla elegimos , por ejemplo, EDAD=17, el anlisis unidimensional se restringe a la altura de los individuos de 17 aos. Otras opciones seran EDAD<>17 significa EDAD diferente de 17 aos. EDAD <=17 significa EDAD menor o igual que 17 aos (=> es mayor o igual). Hay ms opciones que no veremos: Otra opcin es escribir COLOR OJOS=Marron. Fjate que al ser una variable cualitativa, escribimos su valor entre comillas. En ese caso, como es de esperar, el anlisis se restringe a la alturas de los individuos de ojos marrores. Realiza dos anlisis sobre la altura, uno con poblacin que tiene 13 aos o ms y otro con los individuos que no tienen los ojos marrones.

4.- DESCRIPCIN DE DATOS Y REPRESENTACIONES GRFICAS.


Veremos cmo presentar, resumida, la informacin ms importante de un conjunto de datos. Para ello se calculan medidas centrales (media, mediana...) y se da una medida de lo dispersos que estn estos datos respecto de las medidas centrales (varianza, desviacin tpica,...). Adems, se representan los datos grficamente para detectar valores atpicos, tendencias o agrupaciones. Las opciones de anlisis descriptivo de que dispone Statgraphics estn incluidas en el men DESCRIPCIN de la barra de men. Cierra todos los anlisis que hayas realizado previamente. Abre (si no lo est) el fichero altura-2.sf3, con datos relativos a las variables altura, color de ojos, peso, talla de zapatos, estatura del padre y sexo de una serie de individuos. Realiza un anlisis descriptivo de la variable ALTURA (tal y como hicimos en 3). Por defecto Statgraphics muestra 4 marcos: Resumen de Procedimiento, Resumen estadstico para la variable de

estudio, Grfico de dispersin y grfico de cajas y bigotes. Esto no agota todas las opciones que podemos seleccionar; al pulsar cada uno de los botones Opciones tabulares y Opciones grficas aparecen todas

IMPORTANTE: seleccionar un opcin aade un marco a la ventana de anlisis con la informacin correspondiente. Al colocar el puntero del ratn en cada marco y pulsar el botn derecho, el men Opciones de ventana da acceso a opciones que permiten obtener informacin ms detallada del anlisis que llevamos a cabo. En cada marco las opciones son diferentes.

4.1 Opciones Tabulares: resmenes de procedimiento y estadstico, percentiles, tabla de


frecuencias y diagramas de tallos y hojas.
La informacin que aparece a continuacin es accesible desde el botn Opciones tabulares. Resumen de procedimiento: haz doble click sobre este marco y lee la informacin que proporciona. Resumen estadstico Proporciona hasta 19 estadsticos de los datos. Para saber qu estadsticos calcula Statgraphics y visualizarlos, lleva el ratn a dicha ventana, pulsa el botn derecho Opciones de ventana: Selecciona Moda y des-chequea Suma. Pulsa ACEPTAR. Observa que ahora s aparece valor del estadstico moda en el marco (y que ha desaparecido Suma).

Percentiles: proporcionan informacin sobre cmo estn distribuidos los datos. El percentil de orden k de un conjunto de datos es un valor que es mayor que el k % de los valores que toma la variable. El resultado para la variable ALTURA es el siguiente: ----------------------------------------------------------------------------------------------------Percentiles para ALTURA
1,0% = 90,0 5,0% = 100,0 10,0% = 109,0 25,0% = 123,0 50,0% = 143,0 75,0% = 166,0 90,0% = 175,0 95,0% = 180,0 99,0% = 185,0

Para calcular el valor de un cuantil cualquiera, por ejemplo, el 40, el botn derecho del ratn en el correspondiente marco e introduce el dato correspondiente. Tabla de frecuencias: permite resumir la distribucin de los datos contenidos en una variable. Al igual que los dems marcos en que se desglosa el anlisis de los datos, la tabla de frecuencias se visualiza a travs del men Opciones Tabulares. Como resultado, Statgraphics crea una serie de intervalos que constituyen una particin del rango de los datos estudiados. Selecciona esta opcin para obtener Tabla de Frecuencias para ALTURA ----------------------------------------------------------------------------------------------------------------Lmite Lmite Frecuencia Frecuencia Frecuencia Clase Inferior Superior Marca Frecuencia Relativa Acumulativa Acum.Rel. ----------------------------------------------------------------------------------------------------------------menor o igual 1 0,0 2 24,0 3 48,0 4 72,0 5 96,0 6 120,0 7 144,0 8 168,0 9 192,0 10 216,0 mayor 240,0 0,0 24,0 48,0 72,0 96,0 120,0 144,0 168,0 192,0 216,0 240,0 12,0 36,0 60,0 84,0 108,0 132,0 156,0 180,0 204,0 228,0 0 0 0 1 8 66 98 97 68 1 0 0 0,0000 0,0000 0,0000 0,0029 0,0236 0,1947 0,2891 0,2861 0,2006 0,0029 0,0000 0,0000 0 0 0 1 9 75 173 270 338 339 339 339 0,0000 0,0000 0,0000 0,0029 0,0265 0,2212 0,5103 0,7965 0,9971 1,0000 1,0000 1,0000

----------------------------------------------------------------------------------------------------------------la tabla nos dar informacin del nmero de datos que tienen su valor dentro de cada intervalo, es decir, la frecuencia frecuencia absoluta de cada intervalo. El porcentaje que esas observaciones representa frente al total se llama frecuencia relativa. El programa presenta tambin las frecuencias acumuladas para cada una de los intervalos. Podemos modificar el nmero de clases) en los que se divide el rango de los datos haciendo clic con el botn derecho del ratn sobre la tabla y seleccionando la opcin OPCIONES DE VENTANA:

Observa que puedes modificar los lmites superior e inferior. La tabla de frecuencias no slo puede aplicarse a datos numricos, sino tambin a variables cualitativas. Para ello se sigue la ruta DESCRIPCIN... DATOS CUALITATIVOS... TABULACIN. Incluir la variable COLOR OJOS...ACEPTAR. Si no apareciera la tabla, pulsa OPCIONES TABULARES y selecciona TABLA DE FRECUENCIAS. El resultado es: Tabla de Frecuencias para COLOR OJOS ----------------------------------------------------------------------------------------------------Frecuencia Frecuencia Frecuencia Clase Valor Frecuencia Relativa Acumulativa Acum.Rel. ----------------------------------------------------------------------------------------------------1 Azul 71 0,2094 71 0,2094 2 Marron 221 0,6519 292 0,8614 3 Negro 16 0,0472 308 0,9086 4 Verde 31 0,0914 339 1,0000 Diagrama de tallos y hojas: en el botn Opciones Tabulares, selecciona la opcin correspondiente.

4.2. Opciones Grficas: Grficos de dispersin y de caja y bigotes. Histograma y densidad suavizada. Diagramas de barras y sectores.

La informacin que aparece a continuacin es accesible desde el botn Opciones Grficas. Grfico de dispersin: permite visualizar la distribucin de los datos. Observa que la variable ALTURA es unidimensional y, sin embargo, los datos estn sobre el plano. Statgraphics desplaza verticalmente y de forma aleatoria cada valor de la variable para que sean visibles: si miras el equipo de tu compaero, o vuelves a hacer el anlisis, la nube ser diferente, pero sobre cada uno de los valores de la variable ALTURA habr siempre el mismo nmero de puntos. A veces es de inters obtener informacin grfica ms detallada de la que proporciona Statgraphics por defecto. Ve a cualquier anlisis en el que aparezca un grfico de dispersin. Haz doble click sobre el grfico, de modo que ocupe toda la pantalla. Observa que algunos botones se activan

Coloca el curso sobre uno de los puntos y djalo pulsado. Vers que aparecen arriba, a la derecha, informacin sobre ese dato (su valor exacto y la posicin que ocupa en la tabla). Tambin podemos colorear puntos (el botn de la brocha) o hacer visible una barra que podemos deslizar para separar la muestra en dos partes (botn derecho del ratn-->localizar,).

Diagrama de caja y bigotes: sirve para visualizar la distribucin de los valores obsservados (concentracin o dispersin, existencia de valores atpicos). Se construye con los percentiles 25%, 50% (mediana) y 75 %. Como medida de la dispersin se Grfico de Caja y Bigotes utiliza el rango intercuartlico (percentil 75 % - percentil 25%) de manera que cualquier dato que se aleje de los percentiles 25 75% una distancia superior a 1,5 veces el rango intercuartlico se considera atpico. Este diagrama se obtiene a travs del 150 160 170 180 190 botn Opciones grficas. ALTURA Se debe observar: la forma de los rectngulos que forman la caja (cuanto ms estrechos sean, indicarn una mayor concentracin de datos); la posicin de la media, marcada con una cruz roja respecto de la mediana, lnea central de la caja es la mediana, (la coincidencia de ambas indica simetra de la distribucin), y, si los hubiera, la existencia de valores ticos (quedan fuera de los segmentos de longitud 1,5 veces el rango intercuartlico colocados a derecha a izquierda). En ocasiones puede ser til observar simultneamente dos diagramas de la caja: por ejemplo para la variable altura en la que se separan los valores de las observaciones en funcin del diferente sexo de los individuos. Esta opcin est disponible en el men DESCRIPCIN... DATOS NUMRICOS... ANLISIS DE SUBGRUPO.... El resultado obtenido (tras seleccionar la opcin de GRFICO DE CAJA Y BIGOTES en el men de opciones grficas) es el siguiente: Observa que, en este caso, para SEXO=2 s hay un dato atpico, que est situado en torno a los 45

cm de altura. Con independencia de este hecho, con esta opcin es posible analizar simultneamente una variable discriminada segn el criterio de seleccin. (Esta misma representacin simultnea de grficos tambin est disponible cuando se quiera observar el histograma de una variable). Histograma (de frecuencias): son representaciones grficas de las tablas de frecuencias estudiadas con anterioridad, donde a cada intervalo o clase en que se divide el rango de los datos, se le asigna una barra cuya altura es proporcional a la frecuencia de aparicin de sus elementos. Para la variable ALTURA tenemos:
Histograma
8

frecuencia

6 4 2 0 150 160 170 180 190

ALTURA Diagrama de barras permite obtener informacin sobre las diferentes categoras en que puede dividirse una variable cualitativa. As por ejemplo en el fichero altura-2.sf3 podemos analizar el color de los ojos, de nuevo, a travs de sin ms que hacer DESCRIPCIN... DATOS CUALITATIVOS... TABULACIN, y seleccionar la opcin DIAGRAMA DE BARRAS de las Opciones Grficas.

Podemos, adems, cruzar dos variables. Por ejemplo, el color de los ojos por sexos: seleccionar el men DESCRIPCIN... DATOS CUALITATIVOS... TABULACIN CRUZADA. Seleccionar las variables COLOR DE OJOS y SEXO, y activar la opcin del DIAGRAMA DE BARRAS de las Opciones Grficas. Activa en Opciones Grficas la opcin Grfico de Mosaico, tambin muy descriptiva. Diagrama de sectores: da informacin sobre el peso relativo de las categoras en que se divide una variable. Para mostrarlo, sigue la ruta DESCRIPCIN...DATOS CUALITATIVOS ...TABULACIN y selecciona la variable COLOR OJOS. Activa la opcin de DIAGRAMA DE SECTORES en Opciones Grficas. El diagrama de sectores contiene informacin similar a la de la tabla de frecuencias o el diagrama de barras.