You are on page 1of 33

Multicolinealidad:

No hay relaciones perfectamente lineales entre las variables explicativas. No existe multicolinealidad perfecta. Aunqu
variables económicas o financieras muestran algún grado de relación entre sí, ello no produce excesivas dificultades, exc
cuando se llega a una situación de dependencia total, que es lo que se excluyó al afirmar que las variables explicativas s
linealmente dependientes.

- En resumen, el supuesto de no multicolinealidad requiere que en la FRP se incluya solamente


las variables que no sean funciones lineales exactas de alguna variable del modelo.
- En la práctica, cuando se recopilan datos para el análisis empírico, no hay una garantía
de que no existirán correlaciones entre las regresoras
… en conclusión lo que se quiere es que no haya relación exacta entre las regresoras

¿qué pasa si las regresoras están correlacionadas?

Es un hecho que muchas variables explicativas presentan un alto grado de colinealidad

EJEMPLO:
X2 X3 X3*
10 50 52
15 75 75
18 90 97
24 120 129
30 150 152

- ES EVIDENTE QUE HAY COLINEALIDAD PERFECTA ENTRE X2 Y X3 r23 = 1.0000


r23* = 0.9959

1 DIAGRAMA DE BELLENTINE, QUE NOS AYUDA A OBSERVAR EL NUIVEL DE MULTICOLINEALIDAD


SE MIDE POR LA MARGNITUD DE LA INTERSECCIÓN
3 CAUSAS
Existen diversas fuentes de multicolinealidad… ...puede deberse a los siguientes factores:

1 El método de recolección de información


2 Restricciones en el modelo o en la población objeto de muestreo
3 Especificación del modelo
4 Un modelo sobredeterminado
5 sobre todo en los datos de series de tiempo

4 Estimación en presencia de multicolinealidad perfecta

… SI DOS VARIABLES X, SON MULTICOLINEALES, NO SE PODRA HACER EL SUPUESTO DE Q LA OTRA X PERMANECE CONST

6 CONSECUENCIAS
Multicolinealidad: ¿tanto para nada? Consecuencias teóricas de la multicolinealidad

Consecuencias prácticas
1 Aunque los estimadores de MCO son MELI, presentan varianzas y covarianzas grandes que dificultan la estimac
2 Debido a la consecuencia 1, los intervalos de confianza tienden a ser mucho más amplios, lo cual propicia una a
3 También debido a la consecuencia 1, la razón t de uno o más coefi cientes tiende a ser estadísticamente no sign
4 Aunque la razón t de uno o más coefi cientes sea estadísticamente no signifi cativa, R2, la medida global de bon
5 Los estimadores de MCO y sus errores estándar son sensibles a pequeños cambios en los datos.

Una R2 alta pero pocas razones t signifi cativas

En casos de alta colinealidad es posible encontrar, que uno o más coefi cientes parciales de pendiente son, de m
con base en la prueba t. Aun así, R2 en tales situaciones puede ser muy alto

En realidad, ésta es una de las señales de multicolinealidad: valores t no significativos pero un R2 g


CASO: 10
Table 10.3

Y X2 X3
1 2 4
2 0 2
3 4 12
4 6 0
5 8 16

Tcalculado debe ser mayor al Ttables

Y^ = 1.193902 + 0.4463415 X2 + 0.0030488


p= 0.263 0.137 0.975
ee = 0.7736 0.1848 0.085
Tc= 1.54 2.42 0.04
Tt= 4.30

R^2 = 81.01%
r 23 = 55.23%

Fc= 4.27
Ft= 19.00

INTERPRETACION
T estudent no son significados
R2 es algo
Tercera señal no se esta cumpliendo

CASO: 10.1 CONSUMO, INGRESO Y RIQUEZA

Table 10.5
Data on Consumption Expenditure,
Income and Wealth
(MILES DE DOLARES)
Y = Consumption Expenditure, $
X2 = Income, $
X3 = Wealth, $
Y X2 X3
70 80 810
65 100 1009
90 120 1273
95 140 1425
110 160 1633
115 180 1876
120 200 2052
140 220 2201
155 240 2435
150 260 2686

Y^ =
p=
ee =
Tc =
Tt =
R^2 =
R^2 A =
r 23 =
Fc =
Ft=
cov (b2, b3) =

INTERPRETACION

CASO: 10.2 (TABLA 10.7)

A continuación consideraremos un grupo concreto de datos sobre gasto de consumo real (C),
ingreso personal disponible real (Yd), riqueza real (W) y tasa de interés real (I) para Estados Unidos
de 1947 a 2000. Los datos originales se presentan en la tabla 10.7.
Y^ =
p=
ee =
t =
R^2 =
R^2 A =

F =
cov (b2, b3) =

INTERPRETACION
Los resultados demuestran que todos los coefi cientes estimados son muy signifi cativos desde
el punto de vista estadístico, pues sus valores p son muy pequeños. Los coefi cientes estimados
se interpretan como sigue: la elasticidad del ingreso es ≈ 0.80, lo que indica que, cuando las
demás variables se mantienen constantes, si el ingreso aumenta 1%, la media del gasto de con-
sumo aumenta alrededor de 0.8%. El coefi ciente de riqueza es ≈ 0.20, lo que signifi ca que si
la riqueza aumenta 1%, la media del consumo se incrementa sólo 0.2%, de nuevo cuando las
demás variables se mantienen constantes. El coefi ciente de la variable tasa de interés indica que,
a medida que la tasa de interés aumenta un punto porcentual, el gasto de consumo disminuye
0.26%, ceteris paribus.

Todas las regresoras tienen signos que concuerdan con las expectativas previas, es decir, el
ingreso y la riqueza tienen efecto positivo en el consumo, pero la tasa de interés produce un
efecto negativo.

¿Hay que preocuparse por el problema de la multicolinealidad en este caso? Al parecer no,
porque todos los coefi cientes tienen los signos correctos, cada coefi ciente es muy signifi cativo
estadísticamente en lo individual y el valor F también es estadísticamente muy signifi cativo, lo
que indica que, en conjunto, todas las variables tienen efecto signifi cativo en el gasto de consumo.
El valor R2 también es muy alto.

7 Detección de la multicolinealidad
1. La multicolinealidad es una cuestión de grado y no de clase
2. Como la multicolinealidad se refiere a la condición de las variables explicativas que son no estocásticas por s

1. Una R2 elevada pero pocas razones t significativas


2. Altas correlaciones entre parejas de regresoras.
3. Examen de las correlaciones parciales (correlaionar la Y con cada X)
4. Regresiones auxiliares (correlacionar cada X con cada X, y ver sus R^2) luego hallar sus F, si Fc > Ft … hay colinealidad
5. Valores propios e índice de condición K = ( 100 - 1000) y IC = ( 10 - 30 )
6. Tolerancia y factor de inflación de la varianza FIV = R^2 ES MAYOR A 10 ES MALO
7. Diagrama de dispersión

Ejemplo ampliado: los datos Longley (tabla 10.8)

Los datos de la tabla 10.8, y son series de tiempo de 1947 a 1962, donde
Y = número de personas con trabajo (en miles)
X1 = índice implícito de deflación de precios para el PIB,
X2 = PIB (en millones de dólares)
X3 = número de desempleados (en miles),
X4 = número de personas enlistadas en las fuerzas armadas
X5 = población no institucionalizada mayor de 14 años de edad
X6 = año (igual a 1 para 1947, 2 para 1948 y 16 para 1962).

0 COMENTARIO DE LA REGRESIÓN:

1 estadistico t
Tt= 2.26
Tc=

2 estadistico R^2
R^2 =
CORRELACIÓN
3 estadistico F
Ft =
Fc =

4 CORRELACIONES ALTAS X1 X2 X2 X5
X1 X5 X2 TIME
X1 TIME X5 TIME
5 MATRIZ DE CORRELACIONES graph matrix y x2 x3

5 Tolerancia y factor de inflación de la varianza

SI EL VALOR DEL VIF ES SUPERIOR A LA UNIDAD Y LA TOLERANCIA ES CERCANA A CERO SE CONFIRMA LA MULTICOLINE
FIV
VIF 519.90

TOLERANCIA

INTERPRETACIÓN:

SI HAY PRESENCIA DE MULTICOLINEALIDAD

8 Medidas correctivas
No hacer nada.. La multicolinealidad es la voluntad de Dios, no un problema con los MCO ni con la técnica esta

Procedimientos de reglas prácticas

1. Información a priori.
2. Combinación de información de corte transversal y de series de tiempo.
3. Eliminación de una(s) variable(s) y el sesgo de especifi cación.
4. Transformación de variables. forma en primeras diferencias porque no se hace la regresión so
5. Datos nuevos o adicionales otra muestra con menor colinealidad
6. Reducción de la colinealidad en las regresiones polinomiales
7. Otros métodos de remediar la multicolinealidad. análisis de factores y el de componentes principale

CORRELACIONES

Ahora que establecimos que existe un problema de multicolinealidad, ¿qué acciones correctivas
pueden llevarse a cabo? Reconsidere el modelo original.

En primer lugar, el PIB puede expresarse no en términos nominales, sino en términos reales,
lo cual se realiza al dividir el PIB nominal entre el índice de defl ación del precio implícito.
En segundo lugar, en vista de que la población no institucional mayor de 14 años aumenta con el tiempo
debido al crecimiento natural de la población, estará muy correlacionada con el tiempo , la variable X6 del mod
. Por tanto, en lugar de conservar esas dos variables, mantenemos la variable X5 y desechamos X6.
En tercer lugar, no hay ninguna razón de peso para incluir X3, el número de personas desempleadas; quizá la ta
fuese una mejor medida de las condiciones del mercado de trabajo; sin embargo, no hay ningún dato al respec
Por consiguiente, eliminamos la variable X3.
INTERPRETACION
ealidad perfecta. Aunque todas las
excesivas dificultades, excepto
as variables explicativas son
TRA X PERMANECE CONSTANTE, YA QUE AL VARIAR UNA LA OTRA TAMBIÉN LO HARÁ.

MCO Minimos cuadrados ordinarios


MELI Mejores estimadores Lineales e insesgados

que dificultan la estimación precisa.


ios, lo cual propicia una aceptación más fácil de la “hipótesis nula cero” (es decir, que el verdadero coefi ciente poblacional es cero).
estadísticamente no signifi cativa.
, la medida global de bondad de ajuste, puede ser muy alta.

es de pendiente son, de manera individual, no significativos estadísticamente

gnificativos pero un R2 global alto y un valor F signifi cativo


Table 10.4

YY XX2
1 2
2 0
3 4
4 6
5 8

X3 .+U
tc > tt =
tc < tt =

Ho = 0 SI ESTAN DENTRO DEL AREA


H1 =/ 0 SI ESTAN FUERA DEL AREA

ados Unidos
indica que,

de consumo.
son no estocásticas por supuestos, es una característica de la muestra y no de la población

200000 400000 600000

c > Ft … hay colinealidad entre las X seleccionadas X1

600000

400000 X2

200000

REGRESIÓN

4000

3000

2000

1000

15

10

0
800 1000 1200 2000

ORRELACIÓN
NFIRMA LA MULTICOLINEALIDAD ENTRE LAS VARIABLES

METODO PARA HALLAR LA TOLERANCIA


Variable Tolerancia
dependiente Valor de R2 (TOL) = 1 −
R2
X1 0.9926 0.0074
X2 0.9994 0.0006
X3 0.9702 0.0298
X4 0.7213 0.2787
X5 0.9970 0.0030
X6 0.9986 0.0014

INTERPRETACION
MCO ni con la técnica estadística en general

o se hace la regresión sobre las variables originales, sino sobre las diferencias de los valores sucesivos de dichas variables.

componentes principales, o como la regresión en cadena,

correctivas

enta con el tiempo


o , la variable X6 del modelo
echamos X6.
desempleadas; quizá la tasa de desempleo
hay ningún dato al respecto.
e poblacional es cero).
XX3
4
2
0
12
16
200000 400000 600000 1000 2000 3000 4000 0 5 10 15
1200

X1 1000

800
00

00 X2

00
5000

4000
X3
3000

2000
00

00
X4
00

00
130000

X5 120000

110000
15

10
TIME
5

0
800 1000 1200 2000 3000 4000 5000 110000 120000 130000
as variables.
Table 10.8
Longley Data

obs Y X1 X2 PBI X3 X4 X5
1947 60323 830 234289 282.275904 2356 1590 107608
1948 61122 885 259426 293.136723 2325 1456 108632
1949 60171 882 258054 292.578231 3682 1616 109773
1950 61187 895 284599 317.987709 3351 1650 110929
1951 63221 962 328975 341.969854 2099 3099 112075
1952 63639 981 346999 353.719674 1932 3594 113270
1953 64989 990 365385 369.075758 1870 3547 115094
1954 63761 1000 363112 363.112 3578 3350 116219
1955 66019 1012 397469 392.755929 2904 3048 117388
1956 67857 1046 419180 400.745698 2822 2857 118734
1957 68169 1084 442769 408.458487 2936 2798 120445
1958 66513 1108 444546 401.214801 4681 2637 121950
1959 68655 1126 482704 428.689165 3813 2552 123366
1960 69564 1142 502601 440.105954 3931 2514 125368
1961 69331 1157 518173 447.859118 4806 2572 127852
1962 70551 1169 554894 474.67408 4007 2827 130081
TIME
1 Y = número de personas con trabajo (en miles)
2 X1 = índice implícito de defl ación de precios para el PIB,
3 X2 = PIB (en millones de dólares)
4 X3 = número de desempleados (en miles),
5 X4 = número de personas enlistadas en las fuerzas armadas
6 X5 = población no institucionalizada mayor de 14 años de edad y
7 X6 = año (igual a 1 para 1947, 2 para 1948 y 16 para 1962).
8
9
10
11
12
13
14
15
16
GUJARATI CAP.10

1 10.5. Considere el siguiente modelo:

donde Y = consumo, X = ingreso y t = tiempo. El modelo anterior postula que el gasto


de consumo en el tiempo t es función no sólo del ingreso en el tiempo t, sin también del
ingreso en periodos anteriores. Por tanto, el gasto de consumo en el primer trimestre de
2000 es función del ingreso en ese trimestre y en los cuatro trimestres de 1999. Tales
modelos se denominan modelos de rezago distribuido y los veremos en un capítulo
posterior.

a) ¿Esperaría multicolinealidad en tales modelos y por qué?


Si existe multicolinealidad
b) Si espera colinealidad, ¿cómo resolvería el problema?
Eliminar varaibles
Nuenas variables

2 En los datos que comprenden series de tiempo económicas, como PNB, oferta monetaria,
precios, ingreso, desempleo, etc., suele sospecharse la presencia de multicolinealidad.
¿Por qué?
por que todas la variables estan relacionadas

3 Establezca si las siguientes afi rmaciones son verdaderas, falsas o inciertas, y justifi que la
respuesta.

a) A pesar de la multicolinealidad perfecta, los estimadores de MCO son MELI.


b) En los casos de alta multicolinealidad, no es posible evaluar la signifi cancia individual de uno o más coefi cientes de r
c) Si una regresión auxiliar muestra que una R2i particular es alta, hay evidencia clara de alta colinealidad.
d ) Las correlaciones altas entre parejas de regresoras no sugieren una alta multicolinealidad.
e) La multicolinealidad es inofensiva si el objetivo del análisis es sólo la predicción.
f ) Entre mayor sea el FIV, ceteris paribus, más grandes serán las varianzas de los estimadores de MCO.
g) La tolerancia (TOL) es una medida de multicolinealidad mejor que el FIV.
h) No podrá obtener un valor R2 elevado en una regresión múltiple si todos los coefi cientes
parciales de pendiente no son estadísticamente signifi cativos, en lo individual, con base en la prueba t usual.
F
no o más coefi cientes de regresión parcial. F
colinealidad. F

prueba t usual.
1 10.29. La tabla 10.14 proporciona información sobre los automóviles de pasajeros nuevos vendidos
en Estados Unidos como función de diversas variables.

a) Desarrolle un modelo lineal o log-lineal apropiado para estimar una función de demanda
de automóviles en Estados Unidos.
b) Si decide incluir todas las regresoras dadas en la tabla como variables explicativas,
¿espera encontrar el problema de multicolinealidad? ¿Por qué?
c) Si espera lo anterior, ¿cómo resolvería el problema? Plantee los supuestos claramente
y muestre todos los cálculos de manera explícita.

INTERPRETE TODOS LOS RESULTADOS


TRABAJO OPCIONAL

EQUIVALENTE A UN PUNTO EN EL PROMEDIO

10.30. Para evaluar la factibilidad de un salario anual garantizado (impuesto sobre la renta negativo), Rand Corporation
promedio de trabajo) ante un incremento de los salarios por hora.* Los datos de tal estudio se obtuvieron de un
menos de 15 000 dólares al año. Los datos se dividieron en 39 grupos demográfi cos para su análisis. Estos dato
grupos demográfi cos había datos faltantes respecto de algunas variables, los datos de la tabla se refi eren sólo
análisis se dan al fi nal de la tabla.

a) Realice la regresión de las horas promedio trabajadas durante un año sobre las variables
suministradas en la tabla e interprete su regresión.
b) ¿Existe evidencia de multicolinealidad en los datos? ¿Cómo sabe?
c) Calcule las medidas del factor infl acionario de la varianza (VFI) y de la TOL para las
diversas regresoras.
d) Si existe un problema de multicolinealidad, ¿qué acciones correctivas, si acaso hay
alguna, tomaría?
e) ¿Qué sugiere este estudio sobre la viabilidad de un impuesto sobre la renta negativo?
enta negativo), Rand Corporation valoró en un estudio la respuesta de la oferta de trabajo (horas
de tal estudio se obtuvieron de una muestra nacional de 6 000 familias cuyo jefe (varón) ganaba
fi cos para su análisis. Estos datos se proporcionan en la tabla 10.15. En vista de que para cuatro
atos de la tabla se refi eren sólo a 35 de esos grupos. Las defi niciones de las diversas variables del
Table 10.14
New Passenger Cars Sold, United States

YEAR = Year
Y = New Passenger Cars Sold, Seasonally Unadjusted, Thousands
X2 = New Cars, Consumer Price Index, 1967=100, Seasonally Unadjusted
X3 = Consumer Price Index, All Items, All Urban Consumers, 1967=100,
Seasonally Unadjusted
X4 = Personal Disposable Income, Unadjusted for Seasonal Variation,
Billions of $
X5 = Interest Rate, Finance Company Paper Placed Directly, Percent
X6 = Employed Civilian Labor Force, Unadjusted for Seasonal Variation,
Thousands

YEAR Y X2 X3 X4 X5 X6
1971 10227 112 121.3 776.8 4.89 79367
1972 10872 111 125.3 839.6 4.55 82153
1973 11350 111.1 133.1 949.8 7.38 85064
1974 8775 117.5 147.7 1038.4 8.61 86794
1975 8539 127.6 161.2 1142.8 6.16 85846
1976 9994 135.7 170.5 1252.6 5.22 88752
1977 11046 142.9 181.5 1379.3 5.5 92017
1978 11164 153.8 195.3 1551.2 7.78 96048
1979 10559 166 217.7 1729.3 10.25 98824
1980 8979 179.3 247 1918 11.28 99303
1981 8535 190.2 272.3 2127.6 13.73 100397
1982 7980 197.6 286.6 2261.4 11.2 99526
1983 9179 202.6 297.4 2428.1 8.69 100834
1984 10394 208.5 307.6 2670.6 9.65 105005
1985 11039 215.2 318.5 2841.1 7.75 107150
1986 11450 224.4 323.4 3022.1 6.31 109597
Table 10.15
Hours of work and other data for 35 groups

obs HRS RATE ERSP ERNO NEIN ASSET AGE

1 2157 2.905 1121 291 380 7250 38.5


2 2174 2.97 1128 301 398 7744 39.3
3 2062 2.35 1214 326 185 3068 40.1
4 2111 2.511 1203 49 117 1632 22.4
5 2134 2.791 1013 594 730 12710 57.7
6 2185 3.04 1135 287 382 7706 38.6
7 2210 3.222 1100 295 474 9338 39
8 2105 2.493 1180 310 255 4730 39.9
9 2267 2.838 1298 252 431 8317 38.9
10 2205 2.356 885 264 373 6789 38.8
11 2121 2.922 1251 328 312 5907 39.8
12 2109 2.499 1207 347 271 5069 39.7
13 2108 2.796 1036 300 259 4614 38.2
14 2047 2.453 1213 297 139 1987 40.3
15 2174 3.582 1141 414 498 10239 40
16 2067 2.909 1805 290 239 4439 39.1
17 2159 2.511 1075 289 308 5621 39.3
18 2257 2.516 1093 176 392 7293 37.9
19 1985 1.423 553 381 146 1866 40.6
20 2184 3.636 1091 291 560 11240 39.1
21 2084 2.983 1327 331 296 5653 39.8
22 2051 2.573 1194 279 172 2806 40
23 2127 3.262 1226 314 408 8042 39.5
24 2102 3.234 1188 414 352 7557 39.8
25 2098 2.28 973 364 272 4400 40.6
26 2042 2.304 1085 328 140 1739 41.8
27 2181 2.912 1072 304 383 7340 39
28 2186 3.015 1122 30 352 7292 37.2
29 2188 3.01 990 366 374 7325 38.4
30 2077 1.901 350 209 95 1370 37.4
31 2196 3.009 947 294 342 6888 37.5
32 2093 1.899 342 311 120 1425 37.5
33 2173 2.959 1116 296 387 7625 39.2
34 2179 2.971 1128 312 397 7779 39.4
35 2200 2.98 1126 204 393 7885 39.2
DEP SCHOOL

2.34 10.5 Notas: Horas= horas promedio trabajadas durante el año.


2.335 10.5 Tasa = salario promedio por hora (dólares).
2.851 8.9 IAPE = ingresos anuales promedio de la esposa (dólares).
1.159 11.5 IAPO = ingresos anuales promedio de otros miembros de la familia (dólares).
1.229 8.8 IPAN = ingreso promedio anual no devengado.
2.602 10.7 Valores = bienes familiares promedio (cuentas bancarias, etc.) (dólares).
2.187 11.2 Edad = edad promedio del entrevistado.
2.616 9.3 DEP = número promedio de dependientes.
2.024 11.1 Escolaridad = nivel máximo de escolaridad promedio completado.
2.662 9.5
2.287 10.3
3.193 8.9
2.04 9.2
2.545 9.1
2.064 11.7
2.301 10.5
2.486 9.5
2.042 10.1
3.833 6.6
2.328 11.6
2.208 10.2
2.362 9.1
2.259 10.8
2.019 10.7
2.661 8.4
2.444 8.2
2.337 10.2
2.046 10.9
2.847 10.6
4.158 8.2
3.047 10.6
4.512 8.1
2.342 10.5
2.341 10.5
2.341 10.6
de la familia (dólares).

as, etc.) (dólares).

completado.

You might also like