You are on page 1of 4

ESTADSTICA 1

er
Curso
PRCTICA 1. INTRODUCCIN AL MANEJO DE STATGRAPHICS.
ESTADSTICA DESCRIPTIVA
OBJETIVOS:
Conocer los fundamentos del programa Statgraphics.
Realizar un anlisis descriptivo de variables cualitativas y cuantitativas.
Los datos de esta prctica estn en los ficheros: Cardata.sgd, Pasajeros.sgd, Municipios.sgd,
Robles.sgd y Gasolina.sgd.
INTRODUCCIN AL MANEJO DE STATGRAPHICS
1.- INICIO DEL PROGRAMA STATGRAPHICS
Ventana de la aplicacin: Mens, iconos, barra de herramientas y de estado.
Hoja de clculo: Contiene los datos.
2.- DATOS Y VARIABLES
2.1. Abrir un fichero de datos: File / Open / Open Data Source STATGRAPHICS.
Abrir Cardata.sgd
2.2. Insertar nuevas filas o columnas: Se selecciona la lnea y se pulsa el botn derecho /
Insert.
2.3. Crear nuevas variables: Se pueden introducir nuevos datos manualmente, o bien definirlos
a partir de otros ya existentes (transformacin de variables), 1) seleccionando la columna y
pulsando el botn derecho / Modify Column / Formula, o 2) generarlos pulsando el botn derecho
del ratn / Generate Data.
2.4. Ordenar la tabla de datos segn una variable: desde el botn secundario / Sort File.
Ejemplos: 1) crear la variable accel
2
y colocarla en una nueva columna, 2) seleccionar en una
nueva columna la potencia de los coches japoneses Select(horsepower; origin=3), y 3) encontrar
el coche con ms peso.
3.- TRASLADO DE TEXTOS Y GRFICOS
Para copiar un anlisis completo en el StatReporter se pulsa el botn derecho y se elige Copy
Analysis to StatReporter. El programa traslada, sin necesidad de la opcin Paste, todos los
paneles al StatReporter y, restaurando ste, se puede aadir o modificar texto.
Para trasladar parte del anlisis a la Galera, se pulsa el botn derecho sobre el panel y se
marca Copy Pane to StatGallery. Hay que restaurar StatGallery y utilizar la opcin Paste.
4.- ALMACENAMIENTO
Para guardar por primera vez el conjunto de todos los datos y anlisis: File / Save As / Save
StatFolio As.
Si se quiere guardar solamente el conjunto de datos: File / Save As / Save Data As. De manera
anloga se procede con StatReporter o StatGallery. Los componentes de un StatFolio pueden
tener distinto nombre o el mismo, distinguindose en este caso por la extensin
correspondiente.
1
ESTADSTICA 1
er
Curso
ESTADSTICA DESCRIPTIVA
5.- DESCRIPCIN DE DATOS UNIVARIANTES
5.1. Variables cualitativas: Realizar un estudio tabular y grfico de la variable origin.
Describe / Categorical Data / Tabulation. Comentar la tabla de frecuencias y los diagramas de
barras y sectores. Probar las opciones (botn secundario) de anlisis, de ventana y grficas de
cada ventana.
Retornar a Tabulation desde la barra de herramientas y probar en (Select) las opciones:
first(30), last(20) y exclude(3). Realizar el anlisis slo con los coches de ms de 4
cilindros (cylinders>4), o slo con los coches del ao 1980 (year=80), o con los coches de marca
Ford.
Obtener un diagrama de Pareto para origin: SPC/ Quality Assessment/ Pareto Analysis.
5.2. Variables cuantitativas: Realizar un estudio descriptivo de la variable accel. Describe /
Numeric Data / One-Variable Analysis. Realizar los 4 primeros anlisis numricos, el diagrama
de cajas y el histograma.
Manejar las opciones de ventana para aadir ms estadsticos, modificar el n de clases y los
percentiles.
Histograma: Para variar la escala y el n de clases, y ver los diagramas acumulados y los
polgonos de frecuencias, pulsar botn derecho Pane Options y para cambiar el aspecto usar
las Graphics Options. Localizar percentiles de forma aproximada con el polgono de
frecuencias relativas acumuladas. Para realizar el grfico simultneo de histograma y
polgono de frecuencias, usar StatGallery.
En el Diagrama de Cajas (Grfico de Caja y Bigotes) identificar puntos extremos y hacerlo
con respecto a otra variable, make: Picar en el icono de Identify (?) y seleccionar.
Realizar un diagrama de varillas para cylinders.
Dibujar los datos temporales del n de pasajeros (fichero Pasajeros.sgd): Plot / Scatterplots /
X plot (elegir lneas en opcin de ventana del Grfico de Series de Tiempo) o bien Plot / Time
Sequence Plot / X plot. Comentar propiedades.
5.3. Transformacin de una variable cuantitativa en cualitativa (fichero Cardata.sgd): Un
consumo es alto si mpg<30, y bajo en caso contrario. Considerar la variable X (bajo, alto).
Realizar un anlisis descriptivo de mpg y de X.
6.- DESCRIPCIN DE DATOS BIVARIANTES
6.1. Asociacin entre atributos: Analizar la relacin entre las variables origin y cylinders.
Describe / Categorical Data / Crosstabulation. Observar la tabla de contingencia, el diagrama de
barras mltiple y el grfico de mosaico.
6.2. Asociacin entre un atributo y una variable numrica: Analizar la relacin entre las
variables mpg y cylinders. Plot / Exploratory Plots / Box-and-Whisker Plots / Multiple
Samples.
6.2. Asociacin entre variables numricas: Analizar la relacin entre las variables weight y
mpg. Plot / Scatterplots / X-Y Plot.
2
ESTADSTICA 1
er
Curso
EJERCICIOS
Ejercicio 1.1.: En el archivo Municipios.sgd estn algunos datos de municipios de la provincia
de Crdoba: distancia a la capital (variable DistanciaCapital), altitud sobre el nivel del mar
(variable Altitud), nmero de habitantes (variable Poblacin), nmero de habitantes por km
2
(variable Densidad), nmero de centros de educacin primaria y secundaria (variables
CentrosPrimaria y CentrosSecundaria), nmero de farmacias (variable Farmacias) y nmero de
bibliotecas (variable Biblioteca).
a) Calcular la mediana, el rango, el coeficiente de asimetra y el coeficiente de apuntamiento de
la variable Densidad; la desviacin tpica y el rango intercuartlico de la variable Altitud para
los municipios que tienen exactamente una farmacia; la Poblacin mediana de aquellos
municipios que tienen una altitud inferior a 400 metros, y la Distancia media a Crdoba de
aquellos municipios que tienen una poblacin superior a 6500 habitantes.
b) El 30% de los municipios tiene una densidad de poblacin superior a x habitantes/km
2
. El
80% de los municipios tiene una densidad inferior a y habitantes/km
2
. Cunto valen x e y?
c) Encontrar el municipio con menor poblacin.
d) Encontrar un histograma que describa apropiadamente la distribucin de la poblacin.
e) Obtener la tabla de frecuencias relativas de la variable Bibliotecas. Un municipio se considera
que est cerca de la capital Crdoba si dista de ella menos de 50 Km., lejos si dista ms de 90
Km. y en caso contrario la distancia es intermedia. Hallar la tabla de frecuencias absolutas de
la nueva variable categrica X (cerca, intermedia, lejos).
f) Transformar la variable poblacin de forma que se reduzca la asimetra de su distribucin y
se acerquen sus puntos atpicos.
g) Identifica los municipios atpicos respecto la variable Densidad y el ms atpico respecto de
la variable -2*log(DistanciaCapital/Altitud). Repetir el mismo ejercicio excluyendo al
municipio ms alejado de la capital.
h) Analizar la relacin entre Altitud y Poblacin, entre Bibliotecas y Poblacin, y entre
Bibliotecas y Farmacias.
Ejercicio 1.2.: Los datos que aparecen en el fichero Robles.sf3 se refieren a un estudio realizado
sobre un robledal cercano a una planta industrial. Se ha seleccionado una muestra de 38 robles de
dos variedades (A y B), ubicados en cuatro zonas distintas (1, 2, 3 y 4). La mitad de ellos han
sido sometidos a cierto tratamiento y se han codificado con 1, los no tratados se han codificado
con 0. Sobre cada rbol se han medido las concentraciones de ocho elementos qumicos en sus
hojas: hierro, manganeso y zinc (metales pesados); calcio y magnesio (metales alcalinotrreos);
potasio (metal alcalino); y fsforo y nitrgeno (no metales). La variable num denota el nmero
asignado al roble en la muestra.
a) Calcular el coeficiente de variacin y la mediana de la variable nitrgeno, y el rango y la
desviacin tpica de la variable potasio.
b) Obtener la tabla de frecuencias absolutas de la variable variedad y la tabla de frecuencias
absolutas acumuladas de la variable zona.
3
ESTADSTICA 1
er
Curso
c) El 72% de los robles de la zona 2 tienen una concentracin de potasio inferior a x, y el 30%
de los robles de variedad B tienen una concentracin de fsforo superior a y. Cul es el valor
de x e y?
d) Estudiar si existen puntos atpicos para magnesio, log(magnesio) y calcio. Si existen,
identificar los robles ms atpicos y las zonas donde estn situados.
e) Hallar la proporcin de robles con concentracin de nitrgeno menor que 3.5.
f) Calcular la concentracin mediana de potasio de todos los robles, slo de aquellos robles que
tienen una concentracin de calcio menor de 2.5 y slo de los robles de variedad A.
g) Hallar la media de las concentraciones mximas por metales pesados en rboles de la
variedad A, y la media de las concentraciones mximas por metales pesados en rboles
tratados.
Describe / Numeric Data / Rowwise Statistics
h) Analizar la asociacin entre hierro y nitrgeno, y entre tratamiento y variedad. Comparar
grficamente la concentracin de zinc en un roble de la variedad A con la de uno de variedad
B de la muestra.
i) Crear una nueva variable como la desviacin tpica de las concentraciones de hierro,
manganeso, zinc y calcio, y hallar su media.
Ejercicio 1.3.: En el fichero de datos Cardata.sgd aparecen 26 marcas de coches. Halla el n
mnimo de marcas que recojan al menos el 70% de los coches de la muestra.
Ejercicio 1.4.: En el fichero de datos Gasolina.sgd aparece el consumo mensual de gasolina en
Espaa, en miles de toneladas, desde enero de 1945 hasta diciembre de 1999. Realizar el anlisis
estadstico ms adecuado.
4

You might also like