You are on page 1of 30

REGRESIÓN CON VARIABLES

DICOTÓMICAS
TEMA 1
(CONTINUACIÓN)

1
INTRODUCCIÓN
• Variable dependiente cuantitativa.
• Variable independiente cualitativa:
– Dicotómica: regresión simple.
– Más de dos condiciones: regresión múltiple.
• Codificación: dummy.
• Variable: ficticia.
• 1 = presencia; 0 = ausencia.
• Ejemplo: 1 = mujer; 0 = hombre (ausencia de la
cualidad de ser mujer).
2
SUPUESTOS DEL MODELO
1. Linealidad: se cumple seguro, al formarse dos
nubes de puntos.
Valores Y
10

5
Valores
Y
0
0 0,5 1 1,5

b  pendiente  Y M  Y V
3
SUPUESTOS DEL MODELO
2. Homocedasticidad: S2 de ambos grupos (0 y 1)
han de ser semejantes.
3. Normalidad: muestras del grupo 0 y del grupo
1 han de provenir de poblaciones con
distribución normal.
4. Independencia de errores: incorrelación de
las puntuaciones de Y en los distintos niveles
de X porque son gente distinta.

4
ECUACIÓN DE REGRESIÓN
• Las fórmulas hasta ahora vistas para calcular la a y
la b siguen siendo útiles.

• Además:

a Y0
b  Y1 Y 0

5
ECUACIÓN DE REGRESIÓN: EJEMPLO
Estos son los resultados obtenidos en una prueba de
expresión lingüística por mujeres (X=0) y hombres
(X=1).
X Y
0 7
0 6
0 7
0 8
0 9
1 3
1 5
1 4
1 5
1 3 6
ECUACIÓN DE REGRESIÓN: EJEMPLO
1. Calcular la ecuación de regresión en puntuaciones
directas utilizando las nuevas fórmulas.

2. Interpretar los parámetros.

3. Calcular la ecuación de regresión en puntuaciones directas


utilizando las fórmulas clásicas.

4. Calcular la ecuación de regresión en puntuaciones directas


suponiendo que ahora las mujeres fueran codificadas con
un 1 y los hombres, con un 0.

7
ECUACIÓN DE REGRESIÓN: EJEMPLO
1. Calcular la ecuación de regresión en puntuaciones
directas utilizando las nuevas fórmulas.

Y0 
 Y 0

37
 7, 4
n0 5

Y1 
 Y 1

20
4
n1 5
a  Y 0  7,4
b  Y 1  Y 0  4  7,4  3,4
^ ^
Y  a  bX  Y  7,4  3,4 X
8
ECUACIÓN DE REGRESIÓN: EJEMPLO
2. Interpretar los parámetros.

- a es el valor medio en Y cuando X = 0.


7,4 es el resultado medio obtenido en la prueba de
expresión lingüística en el grupo de las mujeres.

- b es el cambio en el valor medio de Y en el grupo de X = 1


en comparación con el grupo X =0.
El resultado medio es 3,4 puntos menor en hombres que
en mujeres (concretamente, el resultado medio en
hombres es 4).

9
ECUACIÓN DE REGRESIÓN: EJEMPLO
3. Calcular la ecuación de regresión en puntuaciones
directas utilizando las fórmulas clásicas.
X Y x y x*y x2 y2
0 7 -0,5 1,3 -0,65 0,25 1,69
0 6 -0,5 0,3 -0,15 0,25 0,09
0 7 -0,5 1,3 -0,65 0,25 1,69
0 8 -0,5 2,3 -1,15 0,25 5,29
0 9 -0,5 3,3 -1,65 0,25 10,89
1 3 0,5 -2,7 -1,35 0,25 7,29
1 5 0,5 -0,7 -0,35 0,25 0,49
1 4 0,5 -1,7 -0,85 0,25 2,89
1 5 0,5 -0,7 -0,35 0,25 0,49
1 3 0,5 -2,7 -1,35 0,25 7,29

5 57 Sumatorio -8,5 2,5 38,1


10
ECUACIÓN DE REGRESIÓN: EJEMPLO
3. Calcular la ecuación de regresión en puntuaciones
directas utilizando las fórmulas clásicas.
a  Y  b X  a  5,7  3,4 * 0,5  7,4

Y
 Y  57  5,7
N 10

X
X 5

 0,5
N 10
S 2,058
b  rXY Y  0,871  3,4
SX 0,527

rXY 
 ( X  X )(Y  Y )   8,5  0,871
2,5 38,1
 ( X  X )  (Y  Y )
2 2

SY 
 (Y  Y )  38,1  2,058
2

N 1 10  1 ^ ^
Y  a  bX  Y  7,4  3,4 X
SX 
 ( X  X )2 
2,5
 0,527
N 1 10  1 11
ECUACIÓN DE REGRESIÓN: EJEMPLO
4. Calcular la ecuación de regresión en puntuaciones directas
suponiendo que ahora las mujeres fueran codificadas
con un 1 y los hombres, con un 0.
X Y
1 7
1 6
1 7
1 8
1 9
0 3
0 5
0 4
0 5
0 3 12
ECUACIÓN DE REGRESIÓN: EJEMPLO
4. Calcular la ecuación de regresión en puntuaciones directas
suponiendo que ahora las mujeres fueran codificadas
con un 1 y los hombres, con un 0.

Y1 
 Y 0

37
 7, 4
n0 5

Y0 
 Y 1

20
4
n1 5
a Y0  4
b  Y 1  Y 0  7,4  4  3,4
^ ^
Y  a  bX  Y  4  3,4 X
13
BONDAD DE AJUSTE
2 2 2 2
R XY  b *S / S X Y
2
RXY  (Y 1  Y 0 ) 2 * p * q / SY2

p = proporción de n1 respecto al total de la muestra.


q = proporción de n0 respecto al total de la muestra.
p+q=1

14
BONDAD DE AJUSTE: EJEMPLO
• Con los datos iniciales, calcular la bondad de
ajuste utilizando las dos fórmulas propuestas,
e interpretar el resultado.

15
BONDAD DE AJUSTE
2 2 2 2 2 2 2
R XY  b * S / S  3,4 * 0,527 / 2,058  0,758
X Y

2
RXY  (Y 1  Y 0 ) 2 * p * q / SY2 
(4  7,4) 2 * 0,5 * 0,5 / 2,058 2  0,682

Proporción, del total de variabilidad de Y, explicada


por X.
El 75,8% de la variabilidad de la expresión
lingüística es explicada por el sexo.
16
VALIDACIÓN DEL MODELO
2
R /k
F 2
(1  R ) /( N  k  1)

17
VALIDACIÓN DEL MODELO
– F  F( , k , N  k 1)  Se rechaza la Hipótesis nula.
Las variables están relacionadas. El modelo es
válido.

– F  F( , k , N  k 1)  Se acepta la Hipótesis nula.


Las variables no están relacionadas. El modelo no
es válido.

(k = número de variables independientes)

18
VALIDACIÓN DEL MODELO: EJEMPLO
• Con los datos iniciales, concluir acerca de la
validación del modelo.

19
VALIDACIÓN DEL MODELO: EJEMPLO
2
R /k
F 2

(1  R ) /( N  k  1)
 0,871 / 1
2
 25,3
1   0,871 /10  1  1
2

20
VALIDACIÓN DEL MODELO:
EJEMPLO
F( ,k , N  k 1)  F( 0.05,1,8)  5,318
F  F( ,k , N  k 1)  25,3  5,318
Conclusión: Se rechaza la Hipótesis nula. Las
variables X e Y están relacionadas. El modelo
es válido. Existe relación estadísticamente
significativa entre el sexo y el resultado en la
prueba de expresión lingüística
21
SIGNIFICACIÓN
• Del coeficiente de correlación:

rXY
t
2
1 r XY
N 2

22
SIGNIFICACIÓN
• De la pendiente de la recta:

b
t
2
S res

 X  X 
2

b
t
2 2
S (1  R ) /( N  2)
Y
p*q
23
SIGNIFICACIÓN
• Por contraste de medias:

Y 0 Y1
t
2 1 1
S   
res
 n0 n1 

24
SIGNIFICACIÓN
– t  t( , N  2 )  Se rechaza la Hipótesis nula. El
modelo es válido. La pendiente es
estadísticamente distinta de 0. Existe, por tanto,
relación entre las variables.

– t  t ( , N  2 )  Se acepta la Hipótesis nula. El


modelo no es válido. La pendiente es
estadísticamente igual a 0. No existe, por tanto,
relación entre las variables.

25
SIGNIFICACIÓN: EJEMPLO
Aplica las diferentes fórmulas de la t y concluye
acerca de la significación.

26
SIGNIFICACIÓN: EJEMPLO
rXY  0,871
t   5,035
1   0,871
2 2
1 r XY
N 2 10  2
b  3,4
t   5,015
S 2
res
1,15
 X  X  2,5
2

 Y  2
  X 2
 2 2
 363  57  (3,4) 2 5  5 
 Y  2

N
 b  X 
2


2

N   10 
2  10    1,15
S res 
N  k 1 10  1  1

27
SIGNIFICACIÓN: EJEMPLO
X Y x y x*y x2 y2 Y2 X2
0 7
-0,5 1,3 -0,65 0,25 1,69 49 0
0 6
-0,5 0,3 -0,15 0,25 0,09 36 0
0 7
-0,5 1,3 -0,65 0,25 1,69 49 0
0 8
-0,5 2,3 -1,15 0,25 5,29 64 0
0 9
-0,5 3,3 -1,65 0,25 10,89 81 0
1 3
0,5 -2,7 -1,35 0,25 7,29 9 1
1 5
0,5 -0,7 -0,35 0,25 0,49 25 1
1 4
0,5 -1,7 -0,85 0,25 2,89 16 1
1 5
0,5 -0,7 -0,35 0,25 0,49 25 1
1 3
0,5 -2,7 -1,35 0,25 7,29 9 1

5 57 Sumatorio -8,5 2,5 38,1 363 5

28
SIGNIFICACIÓN: EJEMPLO

b  3,4
t   6,641
2 2 2
S (1  R ) /( N  2)
Y 2,058 (1  0,759) /(10  2)
p*q 0,5 * 0,5

Y 0 Y1 7,4  4
t   5,015
1 1 1 1
2
S    1,15  
res
 n0 n1  5 5

29
SIGNIFICACIÓN
t( , N  2 )  t( 0.05,10 2 )  t( 0.05,8)  2,306

t  t( , N  2 )  5  2,306

Conclusión: se rechaza la hipótesis nula. El modelo es


válido. Existe relación estadísticamente significativa entre
las variables sexo y resultado en la prueba de expresión
lingüística.

30

You might also like