Professional Documents
Culture Documents
9.16. Introduccin
El anlisis de regresin mltiple es una tcnica en la que se utilizan diversas variables
independientes para estimar el valor de una variable dependiente desconocida; por lo tanto, cada una
de estas variables de prediccin explica parte de la variacin total de la variable dependiente.
Adems, el anlisis de correlacin mltiple mide la intensidad total de la asociacin entre todas
estas variables.
Para estimar la variable dependiente podemos utilizar ms de una variable independiente y, de esta
manera, intentar aumentar la precisin de la estimacin. Este proceso conocido como anlisis de
regresin y correlacin mltiple, est basado en las mismas suposiciones y procedimientos del
anlisis de regresin y correlacin simple.
Considerar el caso del corredor inmobiliario que desea relacionar el nmero de inmuebles que la
firma vende en un mes con la cantidad de publicidad mensual. Ciertamente, podemos encontrar una
ecuacin de estimacin sencilla que relacione a estas dos variables. Podemos hacer ms precisa la
ecuacin incluyendo en el proceso de estimacin el nmero de vendedores que emplea cada mes?
Probablemente la respuesta sea si. Y ahora, como empleamos tanto el nmero de vendedores como
los gastos de publicidad para predecir las ventas mensuales de casas, debemos usar regresin
mltiple, no simple, para determinar la relacin.
La principal ventaja de la regresin mltiple es que nos permite usar ms informacin disponible
para estimar la variable dependiente. En algunas ocasiones, la correlacin entre dos variables puede
resultar insuficiente para determinar una ecuacin de estimacin confiable. Sin embargo, s
agregamos los datos de ms variables independientes, podemos determinar una ecuacin de
estimacin que describa la relacin con mayor precisin.
1
9.17. Regresin lineal mltiple: dos variables independientes
Consideremos el caso en el que una variable dependiente Y, se relaciona en forma lineal a dos
variables independientes X1 y X2 ( Y podra ser el ingreso, X1 la escolaridad y X2 la experiencia
laboral).
Y b0 b1 X 1 b2 X 2
Esta ecuacin nos da el valor estimado de Y , de la variable dependiente para cualquier par de
valores especificados de las variables independientes. Los valores b0 , b1 y b2 se denomina
coeficientes de regresin estimados o coeficientes de regresin parcial.
EJEMPLO 93. La SAT est tratando de estimar la cantidad mensual de impuestos no pagados
descubiertos por su departamento de auditoria. En el pasado, la SAT estimaba esta cantidad sobre la
base del nmero esperado de horas de trabajo de auditorias de campo. En los ltimos aos, sin
embargo, las horas de trabajo de auditorias de campo se han vuelto un factor de prediccin errtico
de los impuestos reales no pagados. Como resultado de ello, la SAT est buscando otro factor con el
cual pueda mejorar la ecuacin de estimacin.
El departamento de auditorias tiene un registro del nmero de horas que sus computadoras usan para
detectar impuestos no pagados. Podramos combinar esta informacin con los datos referentes a las
horas de trabajo de auditorias de campo y obtener una ecuacin de estimacin ms precisa para los
impuestos no pagados descubiertos cada mes? En la siguiente tabla se presentan esos datos
correspondientes a los ltimos 10 meses.
MES j Y X1 X2 * * * * R E G R E S I O N M U LT I PLE * * * *
Enero 1 29 45 16 Estadsticos descriptivos
Febrero 2 24 42 14 Media s Etiqueta
Marzo 3 27 44 15 Y 27.200 1.814 IMPUESTOS NO PAGADOS (millones $)
AUDITORIA CAMPO (cientos horas
Abril 4 25 45 13 X1 44.100 1.197
trabajo)
Mayo 5 26 43 13 X2 14.700 1.160 COMPUTADORA (cientos horas)
Junio 6 28 46 14
Julio 7 30 44 16
Agosto 8 28 45 16
Setiembre 9 28 44 15 Nmero de Casos = 10
Octubre 10 27 43 15
Correlacin, 1-cola Sig:
Y X1 X2
2
* * * * R E G R E S I O N M U LT I PLE * * * *
Variable Dependiente
Ecuacin Nmero 1 IMPUESTOS NO PAGADOS (millones $)
Y
3
EJEMPLO 94. Los datos que siguen muestran el nmero de habitaciones, el nmero de baos y los
precios a los cuales se vendieron recientemente ocho casas unifamiliares en cierto distrito.
a) Obtener una ecuacin lineal que permita predecir el precio de venta promedio de una casa
unifamiliar del distrito dado en trminos del nmero de habitaciones y del nmero de baos.
b) Estimar el precio de venta promedio de casas de 3 habitaciones y 2 baos
j Y X1 X2 * * * * R E G R E S I O N M U LT I PLE * * * *
1 88.8 3 2 Estadsticos descriptivos
2 84.3 2 1 Media s Etiqueta
3 93.8 4 3 Y 89.625 5.154 PRECIO (miles $)
4 84.2 2 1 X1 3.125 1.126 N HABITACIONES
5 89.7 3 2 X2 2.000 0.756 N BAOS
6 84.9 2 2
7 98.4 5 3
8 92.9 4 2
Nmero de Casos = 8
4
EJEMPLO 95. Un reporte de ventas muestra el nmero de vestidos vendidos, el nmero de horas trabajadas
y los meses de experiencia, de 10 vendedoras de medio tiempo seleccionadas al azar del departamento de
vestidos de una gran tienda.
a) Ajustar una ecuacin de la forma Y b0 b1 X 1 b2 X 2 a estos datos.
b) Utilizar la ecuacin obtenida para predecir las ventas realizadas por una vendedora de medio tiempo
que trabaja 5 horas y que tiene 3 meses de experiencia.
j Y X1 X2 * * * * R E G R E S I O N M U LT I PLE * * * *
1 4 6 0 Estadsticos descriptivos
2 2 4 2 Media s Etiqueta
3 16 16 4 Y 10.300 5.851 VESTIDOS VENDIDOS
4 10 10 6 X1 10.200 4.566 HORAS TRABAJADAS
5 12 12 8 X2 7.500 5.401 MESES DE EXPERIENCIA
6 8 8 10
7 14 12 12
8 18 16 14
9 16 14 16 Nmero de Casos = 10
10 3 4 3
* * * R E G R E S I O N M U LT I PLE * * * *
Variable Dependiente
Ecuacin Nmero 1 VESTIDOS VENDIDOS
Y
5
EJEMPLO 96. Considerar el estudio de la relacin entre escolaridad, experiencia laboral e ingreso
anual. En la tabla se presentan los datos de veinte personas seleccionadas aleatoriamente.
a) Estimar una ecuacin de regresin mltiple
b) Predecir los ingresos anuales de alguien con 11 aos de escolaridad y 20 aos de experiencia laboral.
j Y X1 X2 * * * * R E G R E S I O N M U LT I PLE * * * *
1 5.0 2 9 Estadsticos descriptivos
2 9.7 4 18 Media s Etiqueta
3 28.4 8 21 Y 24.417 9.788 INGRESO (miles $ por ao)
4 8.8 8 12 X1 12.050 4.478 ESCOLARIDAD (aos)
5 21.0 8 14 X2 12.650 5.461 EXPERIENCIA LABORAL (aos)
6 26.6 10 16
7 25.4 12 16
8 23.1 12 9
9 22.5 12 18 Nmero de Casos = 20
10 19.5 12 5
11 21.7 12 7
12 24.8 13 9 Correlacin, 1-cola Sig:
13 30.1 14 12 Y X1 X2
14 24.8 14 17
15 28.5 15 19 Y 1.000 0.846 0.268
16 26.0 15 6 . 0.000 0.127
17 38.9 16 17 X1 0.846 1.000 -0.107
18 22.1 16 1 0.000 . 0.327
19 33.1 17 10 X2 0.268 -0.107 1.000
20 48.3 21 17 0.127 0.327 .
* * * R E G R E S I O N M U LT I PLE * * * *
Variable Dependiente
Ecuacin Nmero 1 INGRESO (miles $ por ao)
Y
6
EJEMPLO 97. Una empresa quiere saber si tendra posibilidades de satisfacer su nivel de inversin
requerido para el prximo ao, dado que el banco le ha ofrecido facilitarle no ms de 38 millones de
soles. Se conoce que tiene que colocar el prximo ao 35 y 11 millones de unidades 1 y 2,
respectivamente. En los ltimos 6 aos las inversiones requeridas para los 2 nicos productos que
fabrica la empresa son:
a) Calcular la lnea de regresin que mejor se ajuste.
b) Contestar la interrogante de empresa.
j Y X1 X2 * * * * R E G R E S I O N M U LT I PLE * * * *
1 11 9 4 Estadsticos descriptivos
2 36 36 9 Media s Etiqueta
3 26 17 11 Y 22.500 9.690 INVERSION (Millones de S/.)
4 30 28 14 X1 20.500 9.975 UNIDADES 1 (Millones)
5 17 13 21 X2 11.167 5.845 UNIDADES 2 (Millones)
6 15 20 8
Nmero de Casos = 6
* * * R E G R E S I O N M U LT I PLE * * * *
Variable Dependiente
Ecuacin Nmero 1 INVERSION (Millones de S/.)
Y
7
EJEMPLO 98. A partir del ejemplo 93, suponer que el departamento de auditoras de la SAT agrega a
su modelo la informacin correspondiente a las recompensas pagadas a informantes. La SAT desea
incluir esta tercera variable independiente X3 , ya que percibe una cierta relacin entre estos pagos y
la evasin de impuestos descubierta. En la tabla se recogi la informacin correspondiente a los
ltimos diez meses.
j Y X1 X2 X3 * * * * R E G R E S I O N M U LT I PLE * * * *
1 29 45 16 71 Estadsticos descriptivos
2 24 42 14 70 Media s Etiqueta
3 27 44 15 72 Y 27.200 1.814 IMPUESTOS NO PAGADOS (millones $)
71 AUDITORIA CAMPO (cientos horas
4 25 45 13 X1 44.100 1.197
trabajo)
5 26 43 13 75 X2 14.700 1.160 COMPUTADORA (cientos horas)
6 28 46 14 74 X3 72.500 2.273 RECOMPENSA INFORMANTES (miles $)
7 30 44 16 76
8 28 45 16 69
9 28 44 15 74 Nmero de Casos = 10
10 27 43 15 73
Correlacin, 1-cola Sig:
Y X1 X2 X4
Y 1.000 0.502 0.771 0.404
. 0.070 0.004 0.123
X1 0.502 1.000 0.184 -0.061
0.070 . 0.305 0.433
X2 0.771 0.184 1.000 -0.105
0.004 0.305 . 0.386
X4 0.404 -0.061 -0.105 1.000
0.123 0.433 0.386 .
Variable Dependiente
Ecuacin Nmero 1 IMPUESTOS NO PAGADOS (millones $)
Y
Bloque Nmero 1. Mtodo: Enter X1 X2 X3
Variable(s) Entradas en Etapa Nmero
1.. X3 RECOMPENSA INFORMANTES (miles $)
2.. X2 COMPUTADORA (cientos horas)
3.. X1 AUDITORIA CAMPO (cientos horas trabajo)
Anlisis de Correlacin Anlisis de Varianza
R 0.99167 gl Suma de cuadrados Media de Cuadrados
R2 0.98340 Regresin 3 29.10878 9.70293
R2 ajustado 0.97511 Error 6 0.49122 0.08187
Error Estndar syx 0.28613
F = 118.51727 Signif F = 0.0000
Anlisis de Regresin: ------------------Variables en la
Ecuacin------------------
Variable b sb Beta t Sig t
X1 0.596972 0.081124 0.394097 7.359 0.0003
X2 1.176838 0.084074 0.752425 13.998 0.0000
X3 0.405109 0.042234 0.507753 9.592 0.0001
Constante -45.796348 4.877651 -9.389 0.0001
8
EJEMPLO 99. La informacin anexa se ha obtenido de una muestra aleatoria de inquilinos de
departamentos en una ciudad determinada. Se intenta predecir el alquiler (en $ por mes) basndonos
en el tamao del departamento (N de habitaciones) y su distancia del centro de la ciudad (en
Kilmetros).
a) Determinar la ecuacin de regresin que mejor se ajuste.
b) Si alguien busca un departamento con 4 habitaciones y a 12 Kilmetros de la ciudad, qu
alquiler espera pagar?
j Y X1 X2 * * * * R E G R E S I O N M U LT I PLE * * * *
1 230 2 1 Estadsticos descriptivos
2 880 6 1 Media s Etiqueta
3 300 3 2 Y 356.667 262.958 ALQUILER ($/mes)
4 340 4 3 X1 3.000 1.789 N HABITACIONES
5 200 2 10 X2 3.500 3.391 DISTANCIA (Kilmetros)
6 190 1 4
Nmero de Casos = 6
* * * R E G R E S I O N M U LT I PLE * * * *
Variable Dependiente
Ecuacin Nmero 1 ALQUILER ($/mes)
Y