Professional Documents
Culture Documents
1. Introduccin.
2. La ecuacin de la recta.
3. El criterio de mnimos cuadrados.
4. Representacin grfica.
5. Coeficientes de regresin estandarizados.
6. El coeficiente de determinacin.
7. Introduccin a la regresin mltiple.
Concepto
El establecimiento de una correlacin entre
dos variables es importante, pero esto se
considera un primer paso para predecir una
variable a partir de la otra. (U otras, en el
caso de la regresin mltiple.)
Claro est, si sabemos que la variable X est
muy relacionada con Y, ello quiere decir que
podemos predecir Y a partir de X. Estamos ya
en el terreno de la prediccin.
(Evidentemente si, X no est relacionada con
Y, X no sirve como predictor de Y.)
Concepto
(2)
rendimiento
inteligencia
rendimiento
inteligencia
Rendimiento (Y)
Y Y
i 1
Inteligencia (X)
'
sea mnimo
Rendim (Y)
10
9
4
6
11
10
9
8
7
6
RENDIM
5
4
3
80
INTELIG
90
100
110
120
130
'
Y
Y
i i
es mnimo
i 1
Ordenada
origen
A Y BX
Pendiente
XY nXY
B
X nX
2
X
120
100
90
110
Y
10
9
4
6
XY
1200
900
360
660
X2
14400
10000
8100
12100
SUMA
3120
SUMA
44600
PROMEDIO PROMEDIO
105
7.25
N
4
Luego
Y=-85+015X
Ordenada
origen
Pendiente
a0
xy
b
x
2
IMPORTANTE: B=b
Es decir, la pendiente en
puntuaciones diferenciales es la
MISMA que en puntuaciones
directas
a 0
Ordenada
origen
Pendiente
z z
z
x
2
x
zy
IMPORTANTE: Como
veremos, la pendiente en
puntuaciones tpicas
COINCIDE con el ndice de
correlacin de Pearson
R
.703a
R cuadrado
.495
R cuadrado
corregida
.242
Error tp. de la
estimacin
2.398
Ord. y
pendiente
(punt.directas)
Modelo
1
(Constante)
INTELIG
Ord. y pendiente
Coeficientesa
Coeficientes no
estandarizados
B
Error tp.
-8.500
11.324
.150
.107
(punt.tpicas)
Coeficientes
estandarizad
os
Beta
.703
t
-.751
1.399
Sig.
.531
.297
xy
Bb
x
2
sxy
Y por el tema
anterior
Y por el tema de
variabilidad
Se deduce
que
xy
sx2
Bb
rxy
sx s y
2
x
xy
xy
x x
2
sxy
n sxy rxy sx s y r s y
xy
2
sx2
sx2
sx
n
B b rxy
b rxy
sy
sx
sy
1
rxy rxy
sx
1
A Y rxy
sy
sx
Yi
Puntuaciones observadas
Puntuaciones predichas
Error de prediccin
Yi
Yi Yi
con la recta de
regresin de Y sobre X
2
y
(Y Y )
2
(
Y
Y
)
es mnimo
s y2
2
(
Y
Y
)
s y2. x
(
Y
Y
)
i i
Que despejando
sale
rxy2 1
s y2. x
s y2
2
xy
r 1
2
xy
s y2. x
s y2
Yi Yi (Yi Yi )
Esta expresin indica que la puntuacin observada por el sujeto isimo es igual a la puntuacin predicha para dicho sujeto ms un
error de prediccin.
Se puede demostrar que las puntuaciones predichas y los errores de
prediccin son independientes, con lo que podemos sealar
s y2 s y2 ' s y2. x
s y2
Varianza total de Y
s y2 '
s y2. x
sy
De la transparencia anterior, tenemos
Y sabamos que
luego
rxy2 1
rxy2
s y2. x
s y2
s y2 s y2. x
s
s y2 ' s y2. x
2
y
s y2
s y2
X 1 ' A B2 X 2 B3 X 3 ... Bk X k
X 2 , X 3 ,...
Variables
predictoras
s
Recta
B rxy y
sx
regresin
X 1 ' A B2 X 2 B3 X 3 ... Bk X k
s1.3
s2.3
X 1 ' A B2 X 2 B3 X 3 ... Bk X k
En puntuaciones diferenciales, recordad que A vala 0 en la recta de
regresin; lo mismo se aplica en la ecuacin de regresin.
x1 ' b2 x2 b3 x3 ... bk xk
Y aplicando la misma lgica, el valor de los pesos es el
mismo que el que tenamos en puntuaciones directas
b2 B2
b3 B3
etctera
R
.904a
R cuadrado
corregida
.634
R cuadrado
.817
Error tp. de la
estimacin
1.744
R1.23 0 '904
Como en el caso de 1
2
predictor:
Coeficientesa
Modelo
1
(Constante)
ANSIED
NEUROT
Coeficientes no
estandarizados
B
Error tp.
11.288
2.221
-1.139
.510
.365
.421
Coeficientes
estandarizad
os
Beta
-1.293
.502
R1.23
2
t
5.082
-2.233
.868
Sig.
.037
.155
.477
sx'
2
x1
Y A BX (Y Y ')
Y A BX e
Observado = Predicho + Error
estimacin
en trminos
generales
Y B0 B1 X 1 e
Y B0 B1 X 1 ... Bk X k e
Y: Variable dependiente
X1, X2, ..., variables independientes (predictoras de Y)
e: error aleatorio
B1, B2, ..., son los pesos que determinan la contribucin
de cada variable independiente.