Professional Documents
Culture Documents
No hay relaciones perfectamente lineales entre las variables explicativas. No existe multicolinealidad perfecta. Aunqu
variables económicas o financieras muestran algún grado de relación entre sí, ello no produce excesivas dificultades, exc
cuando se llega a una situación de dependencia total, que es lo que se excluyó al afirmar que las variables explicativas s
linealmente dependientes.
EJEMPLO:
X2 X3 X3*
10 50 52
15 75 75
18 90 97
24 120 129
30 150 152
… SI DOS VARIABLES X, SON MULTICOLINEALES, NO SE PODRA HACER EL SUPUESTO DE Q LA OTRA X PERMANECE CONST
6 CONSECUENCIAS
Multicolinealidad: ¿tanto para nada? Consecuencias teóricas de la multicolinealidad
Consecuencias prácticas
1 Aunque los estimadores de MCO son MELI, presentan varianzas y covarianzas grandes que dificultan la estimac
2 Debido a la consecuencia 1, los intervalos de confianza tienden a ser mucho más amplios, lo cual propicia una a
3 También debido a la consecuencia 1, la razón t de uno o más coefi cientes tiende a ser estadísticamente no sign
4 Aunque la razón t de uno o más coefi cientes sea estadísticamente no signifi cativa, R2, la medida global de bon
5 Los estimadores de MCO y sus errores estándar son sensibles a pequeños cambios en los datos.
En casos de alta colinealidad es posible encontrar, que uno o más coefi cientes parciales de pendiente son, de m
con base en la prueba t. Aun así, R2 en tales situaciones puede ser muy alto
Y X2 X3
1 2 4
2 0 2
3 4 12
4 6 0
5 8 16
R^2 = 81.01%
r 23 = 55.23%
Fc= 4.27
Ft= 19.00
INTERPRETACION
T estudent no son significados
R2 es algo
Tercera señal no se esta cumpliendo
Table 10.5
Data on Consumption Expenditure,
Income and Wealth
(MILES DE DOLARES)
Y = Consumption Expenditure, $
X2 = Income, $
X3 = Wealth, $
Y X2 X3
70 80 810
65 100 1009
90 120 1273
95 140 1425
110 160 1633
115 180 1876
120 200 2052
140 220 2201
155 240 2435
150 260 2686
Y^ =
p=
ee =
Tc =
Tt =
R^2 =
R^2 A =
r 23 =
Fc =
Ft=
cov (b2, b3) =
INTERPRETACION
A continuación consideraremos un grupo concreto de datos sobre gasto de consumo real (C),
ingreso personal disponible real (Yd), riqueza real (W) y tasa de interés real (I) para Estados Unidos
de 1947 a 2000. Los datos originales se presentan en la tabla 10.7.
Y^ =
p=
ee =
t =
R^2 =
R^2 A =
F =
cov (b2, b3) =
INTERPRETACION
Los resultados demuestran que todos los coefi cientes estimados son muy signifi cativos desde
el punto de vista estadístico, pues sus valores p son muy pequeños. Los coefi cientes estimados
se interpretan como sigue: la elasticidad del ingreso es ≈ 0.80, lo que indica que, cuando las
demás variables se mantienen constantes, si el ingreso aumenta 1%, la media del gasto de con-
sumo aumenta alrededor de 0.8%. El coefi ciente de riqueza es ≈ 0.20, lo que signifi ca que si
la riqueza aumenta 1%, la media del consumo se incrementa sólo 0.2%, de nuevo cuando las
demás variables se mantienen constantes. El coefi ciente de la variable tasa de interés indica que,
a medida que la tasa de interés aumenta un punto porcentual, el gasto de consumo disminuye
0.26%, ceteris paribus.
Todas las regresoras tienen signos que concuerdan con las expectativas previas, es decir, el
ingreso y la riqueza tienen efecto positivo en el consumo, pero la tasa de interés produce un
efecto negativo.
¿Hay que preocuparse por el problema de la multicolinealidad en este caso? Al parecer no,
porque todos los coefi cientes tienen los signos correctos, cada coefi ciente es muy signifi cativo
estadísticamente en lo individual y el valor F también es estadísticamente muy signifi cativo, lo
que indica que, en conjunto, todas las variables tienen efecto signifi cativo en el gasto de consumo.
El valor R2 también es muy alto.
7 Detección de la multicolinealidad
1. La multicolinealidad es una cuestión de grado y no de clase
2. Como la multicolinealidad se refiere a la condición de las variables explicativas que son no estocásticas por s
Los datos de la tabla 10.8, y son series de tiempo de 1947 a 1962, donde
Y = número de personas con trabajo (en miles)
X1 = índice implícito de deflación de precios para el PIB,
X2 = PIB (en millones de dólares)
X3 = número de desempleados (en miles),
X4 = número de personas enlistadas en las fuerzas armadas
X5 = población no institucionalizada mayor de 14 años de edad
X6 = año (igual a 1 para 1947, 2 para 1948 y 16 para 1962).
0 COMENTARIO DE LA REGRESIÓN:
1 estadistico t
Tt= 2.26
Tc=
2 estadistico R^2
R^2 =
CORRELACIÓN
3 estadistico F
Ft =
Fc =
4 CORRELACIONES ALTAS X1 X2 X2 X5
X1 X5 X2 TIME
X1 TIME X5 TIME
5 MATRIZ DE CORRELACIONES graph matrix y x2 x3
SI EL VALOR DEL VIF ES SUPERIOR A LA UNIDAD Y LA TOLERANCIA ES CERCANA A CERO SE CONFIRMA LA MULTICOLINE
FIV
VIF 519.90
TOLERANCIA
INTERPRETACIÓN:
8 Medidas correctivas
No hacer nada.. La multicolinealidad es la voluntad de Dios, no un problema con los MCO ni con la técnica esta
1. Información a priori.
2. Combinación de información de corte transversal y de series de tiempo.
3. Eliminación de una(s) variable(s) y el sesgo de especifi cación.
4. Transformación de variables. forma en primeras diferencias porque no se hace la regresión so
5. Datos nuevos o adicionales otra muestra con menor colinealidad
6. Reducción de la colinealidad en las regresiones polinomiales
7. Otros métodos de remediar la multicolinealidad. análisis de factores y el de componentes principale
CORRELACIONES
Ahora que establecimos que existe un problema de multicolinealidad, ¿qué acciones correctivas
pueden llevarse a cabo? Reconsidere el modelo original.
En primer lugar, el PIB puede expresarse no en términos nominales, sino en términos reales,
lo cual se realiza al dividir el PIB nominal entre el índice de defl ación del precio implícito.
En segundo lugar, en vista de que la población no institucional mayor de 14 años aumenta con el tiempo
debido al crecimiento natural de la población, estará muy correlacionada con el tiempo , la variable X6 del mod
. Por tanto, en lugar de conservar esas dos variables, mantenemos la variable X5 y desechamos X6.
En tercer lugar, no hay ninguna razón de peso para incluir X3, el número de personas desempleadas; quizá la ta
fuese una mejor medida de las condiciones del mercado de trabajo; sin embargo, no hay ningún dato al respec
Por consiguiente, eliminamos la variable X3.
INTERPRETACION
ealidad perfecta. Aunque todas las
excesivas dificultades, excepto
as variables explicativas son
TRA X PERMANECE CONSTANTE, YA QUE AL VARIAR UNA LA OTRA TAMBIÉN LO HARÁ.
YY XX2
1 2
2 0
3 4
4 6
5 8
X3 .+U
tc > tt =
tc < tt =
ados Unidos
indica que,
de consumo.
son no estocásticas por supuestos, es una característica de la muestra y no de la población
600000
400000 X2
200000
REGRESIÓN
4000
3000
2000
1000
15
10
0
800 1000 1200 2000
ORRELACIÓN
NFIRMA LA MULTICOLINEALIDAD ENTRE LAS VARIABLES
INTERPRETACION
MCO ni con la técnica estadística en general
o se hace la regresión sobre las variables originales, sino sobre las diferencias de los valores sucesivos de dichas variables.
correctivas
X1 1000
800
00
00 X2
00
5000
4000
X3
3000
2000
00
00
X4
00
00
130000
X5 120000
110000
15
10
TIME
5
0
800 1000 1200 2000 3000 4000 5000 110000 120000 130000
as variables.
Table 10.8
Longley Data
obs Y X1 X2 PBI X3 X4 X5
1947 60323 830 234289 282.275904 2356 1590 107608
1948 61122 885 259426 293.136723 2325 1456 108632
1949 60171 882 258054 292.578231 3682 1616 109773
1950 61187 895 284599 317.987709 3351 1650 110929
1951 63221 962 328975 341.969854 2099 3099 112075
1952 63639 981 346999 353.719674 1932 3594 113270
1953 64989 990 365385 369.075758 1870 3547 115094
1954 63761 1000 363112 363.112 3578 3350 116219
1955 66019 1012 397469 392.755929 2904 3048 117388
1956 67857 1046 419180 400.745698 2822 2857 118734
1957 68169 1084 442769 408.458487 2936 2798 120445
1958 66513 1108 444546 401.214801 4681 2637 121950
1959 68655 1126 482704 428.689165 3813 2552 123366
1960 69564 1142 502601 440.105954 3931 2514 125368
1961 69331 1157 518173 447.859118 4806 2572 127852
1962 70551 1169 554894 474.67408 4007 2827 130081
TIME
1 Y = número de personas con trabajo (en miles)
2 X1 = índice implícito de defl ación de precios para el PIB,
3 X2 = PIB (en millones de dólares)
4 X3 = número de desempleados (en miles),
5 X4 = número de personas enlistadas en las fuerzas armadas
6 X5 = población no institucionalizada mayor de 14 años de edad y
7 X6 = año (igual a 1 para 1947, 2 para 1948 y 16 para 1962).
8
9
10
11
12
13
14
15
16
GUJARATI CAP.10
2 En los datos que comprenden series de tiempo económicas, como PNB, oferta monetaria,
precios, ingreso, desempleo, etc., suele sospecharse la presencia de multicolinealidad.
¿Por qué?
por que todas la variables estan relacionadas
3 Establezca si las siguientes afi rmaciones son verdaderas, falsas o inciertas, y justifi que la
respuesta.
prueba t usual.
1 10.29. La tabla 10.14 proporciona información sobre los automóviles de pasajeros nuevos vendidos
en Estados Unidos como función de diversas variables.
a) Desarrolle un modelo lineal o log-lineal apropiado para estimar una función de demanda
de automóviles en Estados Unidos.
b) Si decide incluir todas las regresoras dadas en la tabla como variables explicativas,
¿espera encontrar el problema de multicolinealidad? ¿Por qué?
c) Si espera lo anterior, ¿cómo resolvería el problema? Plantee los supuestos claramente
y muestre todos los cálculos de manera explícita.
10.30. Para evaluar la factibilidad de un salario anual garantizado (impuesto sobre la renta negativo), Rand Corporation
promedio de trabajo) ante un incremento de los salarios por hora.* Los datos de tal estudio se obtuvieron de un
menos de 15 000 dólares al año. Los datos se dividieron en 39 grupos demográfi cos para su análisis. Estos dato
grupos demográfi cos había datos faltantes respecto de algunas variables, los datos de la tabla se refi eren sólo
análisis se dan al fi nal de la tabla.
a) Realice la regresión de las horas promedio trabajadas durante un año sobre las variables
suministradas en la tabla e interprete su regresión.
b) ¿Existe evidencia de multicolinealidad en los datos? ¿Cómo sabe?
c) Calcule las medidas del factor infl acionario de la varianza (VFI) y de la TOL para las
diversas regresoras.
d) Si existe un problema de multicolinealidad, ¿qué acciones correctivas, si acaso hay
alguna, tomaría?
e) ¿Qué sugiere este estudio sobre la viabilidad de un impuesto sobre la renta negativo?
enta negativo), Rand Corporation valoró en un estudio la respuesta de la oferta de trabajo (horas
de tal estudio se obtuvieron de una muestra nacional de 6 000 familias cuyo jefe (varón) ganaba
fi cos para su análisis. Estos datos se proporcionan en la tabla 10.15. En vista de que para cuatro
atos de la tabla se refi eren sólo a 35 de esos grupos. Las defi niciones de las diversas variables del
Table 10.14
New Passenger Cars Sold, United States
YEAR = Year
Y = New Passenger Cars Sold, Seasonally Unadjusted, Thousands
X2 = New Cars, Consumer Price Index, 1967=100, Seasonally Unadjusted
X3 = Consumer Price Index, All Items, All Urban Consumers, 1967=100,
Seasonally Unadjusted
X4 = Personal Disposable Income, Unadjusted for Seasonal Variation,
Billions of $
X5 = Interest Rate, Finance Company Paper Placed Directly, Percent
X6 = Employed Civilian Labor Force, Unadjusted for Seasonal Variation,
Thousands
YEAR Y X2 X3 X4 X5 X6
1971 10227 112 121.3 776.8 4.89 79367
1972 10872 111 125.3 839.6 4.55 82153
1973 11350 111.1 133.1 949.8 7.38 85064
1974 8775 117.5 147.7 1038.4 8.61 86794
1975 8539 127.6 161.2 1142.8 6.16 85846
1976 9994 135.7 170.5 1252.6 5.22 88752
1977 11046 142.9 181.5 1379.3 5.5 92017
1978 11164 153.8 195.3 1551.2 7.78 96048
1979 10559 166 217.7 1729.3 10.25 98824
1980 8979 179.3 247 1918 11.28 99303
1981 8535 190.2 272.3 2127.6 13.73 100397
1982 7980 197.6 286.6 2261.4 11.2 99526
1983 9179 202.6 297.4 2428.1 8.69 100834
1984 10394 208.5 307.6 2670.6 9.65 105005
1985 11039 215.2 318.5 2841.1 7.75 107150
1986 11450 224.4 323.4 3022.1 6.31 109597
Table 10.15
Hours of work and other data for 35 groups
completado.