You are on page 1of 29

UNIDAD

Anlisis Estadstico Bsico y


Estadstica Aplicada con SPSS

Estructura de contenidos:
Anlisis Estadstico Bsico y Estadstica Aplicada con SPSS.
1. Medidas descriptivas de datos.
2. Creacin de tablas personalizadas.
3. Representacin de grficos.
4. Anlisis de preguntas de respuesta simple.
5. Tablas de contingencias.
6. Coeficiente de correlacin de Pearson.
7. Anlisis de regresin.

11

Estimado participante:
Esta sesin de aprendizaje tiene como objetivo,

explicar el anlisis

descriptivo y grfico de los datos de la muestra, adems aplicar las opciones


avanzadas con SPSS para realizar correlacin y regresin de variables, tablas
de contingencia y pruebas de hiptesis.

MEDIDAS DESCRIPTIVAS DE LOS DATOS

Ahora que ya conocemos como obtener la frecuencia de la muestra


estadstica, debemos tambin aprender a obtener las medidas descriptivas de
los datos.
Los conceptos tericos que usaremos en el anlisis se encuentran detallados
en las lecturas modulares, por ello te pido agenciarte de ellos.

Ejercicio:
Siguiendo con los datos del archivo Libros.sav, realizar un anlisis estadstico
descriptivo de la variable Precio.
Solucin:

Selecciona

el

men

Analizar/

Estadsticos

descriptivos/Frecuencias.

En la ventana Frecuencias, agregue la variable precio para su


anlisis.

Pgina |2

Haz clic en el botn Estadsticos y en la ventana Frecuencias:


Estadsticos se muestran varias medidas estadsticas las cuales se
seleccionan las que son convenientes para el anlisis:

Haz clic en el botn Continuar y luego en el botn Aceptar

El resultado ser:

Pgina |3

Donde:
o
o
o
o
o
o
o

El precio promedio de los libros es de 178.87


La asimetra es 1.192, es decir es asimtricamente positiva.
El precio menor en los libros es 68
El precio mayor en los libros es 400
El percentil 20, indica que el 20% de los libros tienen precios
menores que 104.60
El percentil 25 (o primer cuartil) quiere decir que el 25% de los
libros tienen precios menores a 121.75
El percentil 50 (tambin es la mediana), indica que el 50% de
los libros tienen precios menores a 160.50

CREACIN DE TABLAS PERSONALIZADAS

Muchos procedimientos de SPSS generan resultados en forma de tablas. Sin


embargo SPSS ofrece funciones especiales diseadas para generar informes
personalizados. Cuyos diseos son muy tiles para el anlisis de encuestas y
estudios de mercado.

Pgina |4

Ejercicio:
Crear una tabla que resuma la materia con la antigedad (vejez) de los
libros, del archivo de datos Libros.sav. Es decir crear una tabla de doble
entrada con estas variables.

Solucin:

Selecciona

el men Analizar/Tablas/Tabla personalizada.

Ahora, arrastra con el mouse las variables vejez (a filas) y materia


(a columnas) y colcalos en los recuadros Filas y Columnas
respectivamente.

Pgina |5

Haz clic en el botn Aceptar y obtendrs el resultado. FACIL Y


SIMPLE. VERDAD!

REPRESENTACIONES GRFICAS EN SPSS

Es otra forma de representar las distribuciones de frecuencias. Que en


muchos casos se consigue comprender mejor y rpido un resultado.
Forma1: Crear un Grfico desde el botn Grficos de la Distribucin de
Frecuencias

Pgina |6

Ejercicio: Crear un grfico de barras que represente la frecuencia de las


alturas de los libros. Use el archivo de datos Libros.sav.
Solucin:

Selecciona

el

men

Analizar/Estadsticos

descriptivos/Frecuencias.

Agrega la variable de las cuales se quiere obtener su representacin


grfica (altura), y a continuacin se pulsa el botn Grficos. Elige el
tipo de grfico:

Haz clic en el botn Continuar y luego en el botn Aceptar

El resultado ser:

Pgina |7

Forma2: Crear un Grfico interactivo desde el men Grficos


Ejercicio: Realiza un grfico del ao de vejez con la materia.
Solucin:

Ingresa al men: Grficos / Generador de grficos dentro de la


ficha Galera haz clic en la Opcin: Sectores/Polar.
Y en la ficha Grupos/ID de puntos activa la opcin Variable de
panel de filas.
Arrastra las variables a graficar, tal como se indica en la ventana:

Pgina |8

El resultado es el siguiente:

Importante:
Muy sencillo, el proceso para crear grficos a traves de estas 2 formas. Intente
volver a practicarlo, para lograr destreza. Continuaremos con Estadstica Aplicada.

Pgina |9

ANLISIS DE PREGUNTAS DE RESPUESTA SIMPLE

Es posible que al recolectar los datos tengas varias respuestas para la misma
pregunta, a este tipo de sucesos se les denomina Preguntas de Respuesta
mltiple. Sin embargo la principal dificultad que tiene este tipo de preguntas
es la forma de estructurar las respuestas de manera que toda la informacin
pueda ser empleada en los anlisis.
De igual forma la correlacin es una prueba de hiptesis que debe ser
contrastada a partir del coeficiente de correlacin que cuantifica la correlacin
entre dos variables.
Asimismo, el anlisis de regresin es una tcnica estadstica que estudia la
relacin entre variables. Se emplea para pronosticar valores de una variable
criterio (Y: dependiente) desde las puntuaciones de una variable predictora
(X: independiente).
Toda esta informacin ser trabajada en esta ltima sesin de aprendizaje.
Pues EMPECEMOS

Generalmente las preguntas de respuesta mltiple se logran realizar de dos


formas diferentes denominadas: Abiertas y Cerradas.

a) Preguntas abiertas: Son preguntas que permite al individuo ingresar


libremente todas las respuestas que considere convenientes.
Por ejemplo:
Cuntas marcas de gaseosas conoces?
a)

d)

g)

b)

e)

h)

c)

f)

i)

b) Preguntas cerradas: Son preguntas que permite al individuo seleccionar


de un listado de alternativas las opciones que considere pertinentes; para
este tipo de preguntas el nmero de respuestas est delimitado por el
nmero de opciones que el investigador incluya en el listado.

P g i n a | 10

Por ejemplo:
Cul de las siguientes marcas de
gaseosas conoces?
a) Coca Cola

d) Kola Real

b) Inca Kola

e) Cassinelli

c) Concordia

f)

Guaran Backus

Ejercicio:
Se encuest a 15 personas en la provincia de Trujillo, para conocer su opinin
acerca de que ciudades considera ms inseguras, para ello se us la siguiente
pregunta, cuyos resultados fueron tabulados en la tabla que se muestra ms
abajo:
1) Qu distrito de Trujillo es ms inseguro?

Las respuestas se recogieron en la siguiente tabla:


Caso
1

dist1
Florencia de Mora

dist2
El Porvenir

dist3
La Esperanza

dist4
Trujillo

dist5

dist6

Huanchaco

Vctor Larco
2

La Esperanza

Trujillo

Florencia de Mora

Herrera

Trujillo

Florencia de Mora

La Esperanza

Laredo

Trujillo

Florencia de Mora

Moche

Herrera

Poroto

Florencia de Mora

Trujillo

La Esperanza

El Porvenir

Moche

Florencia de Mora

Trujillo

La Esperanza

El Porvenir

Herrera

La Esperanza

Trujillo

El Porvenir

Florencia de Mora

El Porvenir

Trujillo

Huanchaco

Moche

El Porvenir

Laredo

La Esperanza

Vctor Larco

Vctor Larco

Florencia de Mora

Trujillo

10

El Porvenir

Florencia de Mora

11

Salaverry

Florencia de Mora

12

Trujillo

La Esperanza

13

El Porvenir

Florencia de Mora

Vctor Larco
Herrera
Florencia de Mora

El Porvenir

Vctor Larco
14

Florencia de Mora

Trujillo

La Esperanza

Herrera

Poroto

Vctor Larco
15

Trujillo

Florencia de Mora

Herrera

P g i n a | 11

Laredo

De la tabla anterior se observar que el mximo de respuestas es 6 (distritos) y


corresponden a las respuestas del caso 5 por lo tanto se deben crear 6 variables
en SPSS.
Solucin:

Crear las variables del archivo.


o Active la vista de variables e ingresa las variables y sus
atributos
o En la columna Valores, asigne las etiquetas respectivas a la
variable Sexo, segn la ventana indicada:

Tambin se deben usar etiquetas para los valores de las variables


distrito. Observar la siguiente ventana:

P g i n a | 12

El resultado final del archivo de datos ser:

Active la Vista de datos e ingresa los datos al archivo de SPSS.

Guarda el archivo de datos. Haz clic en el botn Guardar archivo y


asgnele un nombre al archivo.

Ingresa al Men: Analizar, Opcin: Respuestas mltiples y


seleccionar la Opcin: Definir conjuntos de variables. Se debe
mostrar la siguiente ventana.

P g i n a | 13

Donde:
o

Selecciona y agregue las variables que contienen las


respuestas de la pregunta (distrito1, distrito2, distrito6) al
recuadro Variables del conjunto.

Selecciona la opcin: Categoras y en los recuadros se debe


ingresar el rango de posibles respuestas: Rango:1 hasta: 11.

Despus de especificar la codificacin de las variables, se debe


definir el nombre y la etiqueta del conjunto de datos,
ingresando los caracteres en las respectivas casillas.

Finalmente haz clic en el botn Aadir para agregar la variable


agrupada

Distritos,

al

recuadro

Conjunto

de

respuestas

mltiples. Esta nueva variable se identifica como: $Distritos.


o

Finalmente hacer clic en el botn Cerrar.

Elabore la tabla de distribucin de frecuencias para la pregunta con


respuestas mltiples. Seguir la siguiente secuencia:

P g i n a | 14

Haz clic en el men Analizar, Opcin Respuesta Mltiple y


clic en la opcin Frecuencias

Del cuadro Conjunto de respuestas mltiples selecciona la


variable creada en el paso 3 y trasladarlo al cuadro: Tablas
para:

La casilla Excluir los casos segn lista dentro de las categoras se activa para
omitir los casos que se encuentran con valores fuera del rango establecido para
la variable. En nuestro ejemplo no usamos esta opcin.

Ahora haz un clic en el botn Aceptar y el resultado es el siguiente:

P g i n a | 15

Observe como los resultados se obtiene ya agrupados por distrito, a partir de


respuestas mltiples que responde el encuestado.

TABLAS DE CONTINGENCIA

Son aquellas tablas de doble entrada que clasifica la muestra de acuerdo a un


doble criterio. A travs de ellas se alcanza obtener una descripcin
cuantitativa de las distintas cualidades vicariantes de la muestra, en forma de
frecuencias y porcentajes. La caracterstica ms importante de ellas es el
contraste de homogeneidad o independencia que propone, como hiptesis a
rechazar, que ambos criterios de clasificacin son independientes.

P g i n a | 16

Ejercicio:
Se desea medir la asociacin entre los niveles de ansiedad y gnero en
una muestra de 38 estudiantes. Para ello tenemos en el archivo de datos
Tabla de Contingencia.sav
Solucin:
a) Disee la tabla de contingencia:

Selecciona el men: Analizar, Opcin: Estadsticos Descriptivos,


Opcin: Tablas de Contingencia

Colocar las variables ansiedad (en Filas) y sexo (en columnas)


respectivamente:

Luego hacer clic en el botn Estadsticos y activar la casilla Chicuadrado y luego haz clic en el botn Continuar.

P g i n a | 17

Al regresar a la ventana Tablas de contingencia, se accede a la opcin


Casillas: y activa las casillas: Observadas y Esperadas.

P g i n a | 18

Finalmente cerrar todas las ventanas y observar

los siguientes

resultados:

b) Interpretacin y anlisis de los resultados:


El Chi cuadrado terico es 5.99 (con 2 grados de libertad y = 0.05) y es
menor que 9.646 (Chi cuadrado esperado), por lo tanto se dice que las

P g i n a | 19

mujeres (2) tienen menores niveles de ansiedad que los hombres


(1). Tambin se logra comparar 0.008 (Sig. asinttica bilateral) con 0.05
y se llega a la misma conclusin.
El uso de Chi-cuadrado no se aplica cuando se tiene que ms del 25% de las
observaciones esperadas son menores que 5.

COEFICIENTE DE CORRELACIN DE PEARSON

La correlacin es una prueba de hiptesis que debe ser sometida a contraste y


el coeficiente de correlacin cuantifica la correlacin entre dos variables,
cundo sta existe.
Ejercicio:
Utilice el archivo de datos Correlacin.sav para calcular el coeficiente de
correlacin de la siguiente serie de datos de estatura y peso de los alumnos
de una clase:

Alumno Estatura Peso Alumno Estatura Peso Alumno Estatura Peso


1

1.25

32

11

1.25

33

21

1.25

33

1.28

33

12

1.28

35

22

1.28

34

1.27

34

13

1.27

34

23

1.27

34

1.21

30

14

1.21

30

24

1.21

31

1.22

32

15

1.22

33

25

1.22

32

1.29

35

16

1.29

34

26

1.29

34

1.30

34

17

1.30

35

27

1.30

34

1.24

32

18

1.24

32

28

1.24

31

1.27

32

19

1.27

33

29

1.27

35

10

1.29

35

20

1.29

33

30

1.29

34

Solucin:

Abra el archivo Correlacin.sav.

Selecciona en el men: Analizar, la opcin: Correlaciones y luego


clic en la opcin: Bivariadas

Agregue las variables a analizar su relacin: estatura y peso.

P g i n a | 20

Haz clic en el botn Aceptar y el resultado es el siguiente:

Como el coeficiente de correlacin de Pearson entre estatura y peso es de


82.8%, entonces la relacin existente entre estas dos variables es elevada.
Otra herramienta muy importante en SPSS, es el ANALISIS DE REGRESION.

P g i n a | 21

ANLISIS DE REGRESIN

El anlisis de regresin es una tcnica estadstica que estudiar la relacin


entre variables. Se emplea para pronosticar valores de una variable criterio
(Y: dependiente) a partir de datos histricos de una variable predictora (X:
independiente).
Para definir la recta hay que determinar los valores de los parmetros de a
y b.
Ejercicio:
Calcular la ecuacin de regresin de los datos de altura y peso de los
alumnos de una clase. Considera que la altura es la variable independiente
X y el peso es la variable dependiente Y. Usa el archivo de datos
Regresin.sav

Alumno Estatura Peso Alumno Estatura Peso Alumno Estatura Peso


1

1.25

32

11

1.25

33

21

1.25

33

1.28

33

12

1.28

35

22

1.28

34

1.27

34

13

1.27

34

23

1.27

34

1.21

30

14

1.21

30

24

1.21

31

1.22

32

15

1.22

33

25

1.22

32

1.29

35

16

1.29

34

26

1.29

34

1.30

34

17

1.30

35

27

1.30

34

1.24

32

18

1.24

32

28

1.24

31

1.27

32

19

1.27

33

29

1.27

35

10

1.29

35

20

1.29

33

30

1.29

34

Solucin:

Abra el archivo Regresin.sav


Selecciona el men: Analizar, la opcin: Regresin y clic en la
opcin: Lineal
Agregue la variable estatura(al recuadro de independientes) y la
variable peso (al recuadro de dependientes).

P g i n a | 22

Los resultados son:

P g i n a | 23

Ahora obtendr la ecuacin de la regresin lineal, sabiendo que es:


Y=b+ax
La ecuacin a usar en nuestro ejercicio ser:
+ 40.265*X

Y = -17.714

Podemos predecir los pesos de los siguientes datos:

Estatura

Peso

1,20

30,6

1,21

31,0

1,26

33,0

Muy bien, espero que todo lo


aprendido en todas nuestras sesiones,
le hayan servido para medir la
importancia de nuestro curso en tu
formacin profesional. Muchas gracias
y nos veremos muy pronto.

P g i n a | 24

PRACTICA GUIADA
Crear una tabla que resuma la profesin con los ingresos, del archivo de datos
Profesionales.sav. Es decir crear una tabla de doble entrada con estas
variables.
Solucin:
Selecciona el men Analizar/Tablas/Tabla personalizada.
Ahora arrastra con el mouse las variables Ingreso (a filas) y Profesin (a
columnas) y colquelo en los recuadros Filas y Columnas respectivamente.

Haz clic en el botn Aceptar y obtendrs el resultado

P g i n a | 25

Ahora crearemos un grfico de barras que represente la frecuencia de las


edades actuales de los profesionales.
Selecciona el men Analizar/Estadsticos descriptivos/Frecuencias.
Agregue la variable de las cuales se quiere obtener su representacin grfica
(Edad), y a continuacin se pulsa el botn Grficos. Elige el tipo de grfico:

Haz clic en el botn Continuar y luego en el botn Aceptar, el resultado ser

P g i n a | 26

Ahora se desea medir la asociacin entre las profesiones e ingresos en una


muestra de 33 profesionales. Para ello usaremos el archivo de datos
Profesionales.sav.
Selecciona el men: Analizar, Opcin: Estadsticos Descriptivos, Opcin:
Tablas de Contingencia

Coloque las variables Profesin (en Filas) e Ingreso (en columnas)


respectivamente:

Luego hacer clic en el botn Estadsticos y activar la casilla Chi-cuadrado y


luego haz clic en el botn Continuar.
Al regresar a la ventana Tablas de contingencia, se accede a la opcin
Casillas: y activa las casillas: Observadas y Esperadas.
Finalmente cerrar todas las ventanas y observe los siguientes resultados:

P g i n a | 27

P g i n a | 28

AUTOEVALUACIN:
Ahora demuestra lo aprendido:
1. Responda V (Verdadero) o F (Falso), marca con X: V

a. Las frecuencias solo se representan cuantitativamente


( )
(
b. La media es un ndice de dispersin
( )
(
c. Podemos insertar grficos en 3D, en el SPSS
( )
(
d. El error tpico de la muestra debe ser >10%, para rechazarlo
( )
(
Es un indicador de dispersin de una muestra:
a. Moda

)
)
)
)

b. Media
c. Asimetra
d. Cuartiles
e. Desviacin estndar
2. Al crear una tabla personalizada en SPSS, consigues usar:
a. 2 variables
b. 1 variable
c. Ninguna variable
d. Todas las anteriores.

P g i n a | 29

You might also like