You are on page 1of 4

Anlisis de Datos I Anlisis bivariante en el SPSS

Carmen Ximnez 1
Estadstica descriptiva bivariada en el SPSS

1. NDICES DE ASOCIACIN LINEAL
2. COMBINACIONES LINEALES
3. REGRESIN LINEAL SIMPLE
4. 2 VARIABLES CUALITATIVAS, 1 CUANTITATIVA y 1 2 CUALTITATIVAS
___________________________

Bibliografa: Tema 3 (pg. 33-51) del cuaderno de prcticas de SPSS (Ximnez y Revuelta, 2011)
Ejercicios: Todos los de la pgina 52 del cuaderno de prcticas de SPSS (con el archivo practicas.sav)

En este esquema resumiremos cmo llevar a cabo los anlisis descriptivos con dos variables revisados en la
segunda parte de la asignatura con el SPSS. Para realizar anlisis descriptivos bivariantespueden usarselos
procedimientos del SPSS:Correlaciones, Regresin lineal y Tablas de contingencia.


1. NDICES DE ASOCIACIN LINEAL

Para obtener la covarianza y la correlacin de Pearson se utiliza EL PROCEDIMIENTO CORRELACIONES
del SPSS:

Analizar -> Correlaciones -> Bivariadas




Con estas selecciones se obtiene el siguiente resultado:


Correlaciones
1.000 -.050 -.018
. .482 .803
2991.500 -399.650 -1.152
15.033 -2.008 -.006
200 200 200
-.050 1.000 .857**
.482 . .000
-399.650 21325.595 148.490
-2.008 107.164 .746
200 200 200
-.018 .857** 1.000
.803 .000 .
-1.152 148.490 1.408
-.006 .746 .007
200 200 200
Correlacin de Pearson
Sig. (bilateral)
Suma de cuadrados y
productos cruzados
Covarianza
N
Correlacin de Pearson
Sig. (bilateral)
Suma de cuadrados y
productos cruzados
Covarianza
N
Correlacin de Pearson
Sig. (bilateral)
Suma de cuadrados y
productos cruzados
Covarianza
N
Edad
Peso
Estatura
Edad Peso Estatura
La correlacin es significativa al nivel 0,01 (bilateral).
**.

Lo primero es
trasladar a este
cuadro las variables
para las que se
desee obtener un
coeficiente de
correlacin lineal.
Por ejemplo, edad,
peso y estatura

Desde este men se
pueden obtener tres:
el de Pearson (r
xy
),
el de Kendall y el de
Spearman. Los dos
ltimos sirven para
variables ordinales.
Seleccionar si se desea
obtener la matriz de
varianzas-covarianzas
En esta tabla aparecen resumidas las matrices de
varianzas-covarianzas (S) y de correlaciones (R).

Cada casilla contiene la correlacin (sealada en
negrita) y la covarianza (sealada en cursiva) entre
el cruce de cada 2 variables (edad con edad, edad
con peso, edad con estatura, etc.).

De esta tabla podemos deducir que:

r
edad, peso
=-0,050; S
edad, peso
=-2,008
r
edad, estatura
=-0,018; S
edad, estatura
=-0,006
r
peso, estatura
= 0,857; S
peso, estatura
= 0,746

S
2
edad
=15,033
S
2
peso
=107,164
S
2
estatura
=0,007

Es decir, a partir de esta tabla podemos conocer las
covarianzas, las correlaciones y las varianzas para
todas las variables incluidas (en este caso tres
variables).
Anlisis de Datos I Anlisis bivariante en el SPSS

Carmen Ximnez 2
La representacin grfica de la relacin lineal entre variables se hace desde el men Grficos ->Dispersin:

Peso
100 90 80 70 60 50 40 30
E
s
t
a
t
u
r
a
2.00
1.90
1.80
1.70
1.60
1.50



2. COMBINACIONES LINEALES

Para obtener combinaciones lineales del tipo T = X + Y; T = AX + BY; puede usarse el men Transformar
-> Calcular (ya visto anteriormente). Veamos un ejemplo para la variable X = respon + emocio:


Analizar -> Estadsticos descriptivos -> Descriptivos
46.1250 4.6882 21.979
48.6250 4.9747 24.748
94.7500 8.1480 66.389
Respon
Emocio
X
Media Desv. tp. Varianza


3. REGRESIN LINEAL SIMPLE

Para obtener la regresin de Y sobre X, se utiliza EL PROCEDIMIENTO REGRESIN del SPSS:
Analizar -> Regresin -> Lineal



Con estas selecciones el resultado que ofrece el Visor del SPSS es el siguiente:
Pulsar para definir los ejes del
diagrama

Con estas selecciones el resultado es:
Calculando los descriptivos para las tres variables se observa como se
cumplen las propiedades Y X T + = ;
XY Y X T
S 2 S S S
2 2 2
+ + = :


Primero se definen las variables que hacen de CRITERIO y PREDICTORA:
Desde aqu se
pueden guardar los
valores
pronosticados por
el modelo (las Y
i
)
y los residuos (las
Y
i
-Y
i
) para cada
sujeto del fichero.
Anlisis de Datos I Anlisis bivariante en el SPSS

Carmen Ximnez 3
Variables introducidas/eliminadas
b
Estatura
a
. Introducir
Modelo
1
Variables
introducidas
Variables
eliminadas Mtodo
Todas las variables solicitadas introducidas
a.
Variable dependiente: Peso
b.

Resumen del modelo
b
.857
a
.734 .733 5.3510
Modelo
1
R R cuadrado
R cuadrado
corregida
Error tp. de la
estimacin
Variables predictoras: (Constante), Estatura
a.
Variable dependiente: Peso
b.

ANOVA
b
15656.269 1 15656.269 546.792 .000
a
5669.326 198 28.633
21325.595 199
Regresin
Residual
Total
Modelo
1
Suma de
cuadrados gl
Media
cuadrtica F Sig.
Variables predictoras: (Constante), Estatura
a.
Variable dependiente: Peso
b.

Coeficientes
a
-118.375 7.565 -15.648 .000
105.437 4.509 .857 23.384 .000
(Constante)
Estatura
Modelo
1
B Error tp.
Coeficientes no
estandarizados
Beta
Coeficientes
estandarizados
t Sig.
Variable dependiente: Peso
a.


Estadsticos descriptivos
200 58.295 78.675
200 .000 28.489
200 58.295 107.164
Unstandardized Predicted Value
Unstandardized Residual
Peso
N Media Varianza

Para obtener una representacin grfica del ajuste del modelo: Grficos -> Interactivos -> Diagramas de dispersin:


1.60 1.70 1.80 1.90
Estatura
40
50
60
70
80
90
P
e
s
o
W
W
W
W
W
W
W
W
W
WWW
W
W
W
W
W
W
W
W
W
W
WWW
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
WW
WW
W
W
W
W
WW
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
WW
W
W
W
W
W
WW
WW
W
W
W
W
WW
W
WWW
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
WW
WW
WW
WW
W
W
W
W
W
W
W
W WW
W
W
W
WW
W
W
W
W
WW
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
WWW
W
W
W
W
W
W
W
W
1Peso = -118.37 + 105.44 * estatura
R-cuadrado = 0.73

Esto es el coeficiente de
determinacin, r
2
XY
o la
proporcin de varianza en
comn entre peso y estatura.
Esto se ver en la asignatura de
segundo curso Anlisis de Datos II

Los coeficientes A y B del modelo pronosticado en
directas se ven en esta columna: siendo A =-118,375
y B =105,437. Luego:
Peso
i
=-118,375 +105,437 estatura
i
En esta columna aparece el modelo
en tpicas: z
peso
=0,857 z
estatura


Con estas selecciones el resultado es:
Estos son los descriptivos para el criterio, Y (peso),
los pronsticos (Y) y los residuos (Y Y).

Puede comprobarse que: S
2
Y
=S
2
Y
+S
2
Y-Y
; es
decir: 107,164 =78,675 +28,489
Anlisis de Datos I Anlisis bivariante en el SPSS

Carmen Ximnez 4
4. Dos variables cualitativas: PROCEDIMIENTO TABLAS DE CONTINGENCIA
Para elaborar una tabla de contingencia: Analizar -> Estadsticos descriptivos -> Tablas de contingencia:

El resultado obtenido es el siguiente:
Tabla de contingencia Sexo * Tabaquismo
38 43 81
46.9% 53.1% 100.0%
27.5% 69.4% 40.5%
19.0% 21.5% 40.5%
100 19 119
84.0% 16.0% 100.0%
72.5% 30.6% 59.5%
50.0% 9.5% 59.5%
138 62 200
69.0% 31.0% 100.0%
100.0% 100.0% 100.0%
69.0% 31.0% 100.0%
Recuento
% de Sexo
% de Tabaquismo
% del total
Recuento
% de Sexo
% de Tabaquismo
% del total
Recuento
% de Sexo
% de Tabaquismo
% del total
Mujer
Varn
Sexo
Total
No fumador Fumador
Tabaquismo
Total

Sexo
Varn Mujer
R
e
c
u
e
n
t
o
100
80
60
40
20
0
Tabaquismo
No fumador
Fumador

Una variable cualitativa y otra cuantitativa
Grficos

->

Lneas

->

Simple (Resmenes para grupos de casos):

Tabaquismo
Fumador No fumador
M
e
d
i
a

P
e
s
o
59
59
58
58
57
57

Una variable cuantitativa y dos cualitativas
Grficos -> Lneas -> Mltiple (Resmenes para grupos de casos):

Tabaquismo
Fumador No fumador
M
e
d
i
a

P
e
s
o
80
70
60
50
40
Sexo
Mujer
Varn

Seleccionar para
obtener un
diagrama de
barras para
las variables
Desde aqu pueden obtenerse las
frecuencias conjuntas relativas (en
porcentajes) para las filas, las
columnas y para el total:
INTERPRETACIN:
Globalmente, los resultados indican que la mayor parte de los sujetos
son varones y no fuman (el 50%).
Las distribuciones condicionales indican que, hay un 27,5% de los no
fumadores que son mujeres(frente al 53,1%de las fumadoras); y de los
varones el 84% son no fumadores. En cuanto a las mujeres, el 46,9%
son no fumadoras y dentro de los fumadores el 69,4% son mujeres.

Este grfico representa la media de la variable
peso para fumadores y no fumadores. Se ve que
los no fumadores tienen un peso medio mayor
que los fumadores.
Este grfico es igual al
anterior pero
segmentando por Sexo.