You are on page 1of 249

[Escribir el nombre de la compañía

]

2009
APUNTES DE
INTRODUCCION A LOS
MODELOS
ECONOMETRICOS
[Escribir el subtítulo del documento]
NARCISO GUARAMATO PARRA

2

INTRODUCCION

El presente trabajo tiene como objetivo principal, ayudar a todas aquellas
personas con conocimientos limitados de Estadística y Economía, especialmente a los
alumnos involucrados en esta cátedra. Aportándoles una herramienta que les
proporcione un conocimiento básico de la Econometría.

A lo largo de mi experiencia docente en la Escuela Nacional de Administración y
Hacienda Pública I.U.T, y en la Universidad Santa María, he observado con
preocupación lo difícil y problemático que le resulta al estudiantado, el inicio del
estudio de la Econometría.

Entre los factores que explican esta situación, destacan la deficiencia que traen
algunos alumnos en materias imprescindibles para el estudio del tema, como son la
Estadística y la Economía. La Econometría involucra todo un bagaje de nuevo
vocabulario que dificulta en una primera etapa su entendimiento.

Se ha utilizado la claridad de algunos autores para tratar algunos temas
específicos y mi experiencia enseñando la materia, para lograr un texto donde se
combinen los fundamentos teóricos básicos de la Econometría con unos ejemplos
prácticos, que permitan ver en una forma sencilla sus aplicaciones, usando en varios
de ellos el Software economètrico Eviews

En referencia al contenido del texto, inicialmente, en el capítulo I, se hace
referencia a los conceptos básicos que se deben manejar en la Econometría. En los
capítulos II, III, IV y V se tratan los fundamentos de la regresión mínimo cuadrática. En
los capítulos VI, VII y VIII se tocan las diferentes violaciones a los supuestos del
modelo mínimo cuadrático Y finalmente en los capítulos IX y X se hacen referencia a
algunos temas complementarios.

Es importante señalar que este trabajo, de ninguna manera constituye un
tratado de la materia, debido a que en el mercado existen muchos de una excelente
calidad. Lo que se ha tratado es de que sin abandonar la formalidad en el tratamiento
de los temas, el estudiante pueda tener en sus manos un texto didáctico que le
permita iniciar con éxito el estudio de los modelos econométricos

Finalmente, quiero agradecerle a la Escuela Nacional de Administración y
Hacienda Pública I.U.T. por haberme invitado como profesor de la materia durante los
años 2000 y 2001, y a la Universidad Santa María, donde dicto actualmente
Econometría I y II, y en especial a todos mis alumnos por que me permitieron ordenar
mis apuntes, fuente de este trabajo.


3

CONTENIDO

I ECONOMETRIA

1. Definición de econometría
2. Evolución histórica de la econometría.
3. Modelos
4. Modelos Econométricos
5. Tipos de modelos Econométricos
6. Formas Funcionales.

II MODELO DE REGRESION LINEAL UNIECUACIONAL (MODELO CLASICO)
1. Supuestos
2. Propiedades de la Función de Regresión Muestral (FRM)
3. Mejores Estimadores Linealmente Insesgados (MELI)
4. Teorema de Gauss – Markov
5. Estimación de los Parámetros a través del Método de los Mínimos Cuadrados
Ordinarios
6. Coeficiente de Determinación
7. Coeficiente de Correlación
8. Estimación por Intervalos
9. Prueba de Hipótesis (Significancia Individual del Coeficiente)
10. Presentación Resumida de los Resultados Obtenidos.

III SIGNIFICADO DE LOS COEFICIENTES

1. Pendiente de la Ecuación (Variación Marginal)
2. Elasticidad
3. Modelo Logarítmico
4. Ejercicios

IV MODELO DE REGRESION MULTIPLE

1. Modelo de Regresión Múltiple (2 Variables Explicativas)
2. Prueba F (Significancia Global de los Coeficientes
3. Ejercicios

V MODELO DE REGRESIÓN LINEAL CON k VARIABLES EXPLICATIVAS

1. Supuestos del modelo clásico
2. Estimación de los coeficientes de mínimo cuadrados ordinarios.
3. Propiedades MELI de los estimadores mínimo cuadráticos,
4. Estimador de la varianza de las perturbaciones (
2
o
).
5. Coeficiente de Determinación.
4
6. El caso particular de Regresión Simple.
7. Estimador Máximo Verosimil.

VI MULTICOLINEALIDAD

1. Definición
2. Naturaleza de la Multicolinealidad.
3. Consecuencias de la Multicolinealidad
4. Como Detectar la Multicolinealidad
5. Como solucionar el problema de la Multicolinealidad

VII HETEROCEDASTICIDAD

1. Definición
2. Consecuencias de la Heterocedasticidad
3. Como Detectar la Heterocedasticidad
4. Como Remediar el Problema de la Heterocedasticidad..
5. ESTIMACION POR MINIMOS CUADRADOS GENERALIZADOS (MCG) y
MINIMOS CUADRADOS PONDERADOS (MCP)

VIII AUTOCORRELACION

1. Definición
2. Como Detectar la Autocorrelación
3. Como Solucionar el Problema de la Autocorrelación

IX VARIABLES FICTICIAS, MODELOS DE REZAGOS DISTRIBUIDOS Y MODELOS
AUTORREGRESIVOS

1. Variables Ficticias o Cualitativas (Variables Dummy)
2. Modelo de Rezagos Distribuidos
3. Modelos Autorregresivos

X ESTACIONARIEDAD

XI OTROS TEMAS DE ECONOMETRIA

1. Error de especificación, Definición
2. Omisión de una Variable Relevante
3. Inclusión de Variables irrelevantes
4. Omisión Versus Inclusión de Variables.
5. Evaluación de modelos.

APENDICE

TABLAS

5
BIBLIOGRAFIA
CAPITULO I
1.- DEFINICION DE ECONOMETRIA

A continuación se presentan algunas definiciones de econometría:

“ La econometría
1
es la disciplina que se ocupa de la cuantificación de los
fenómenos económicos y de la verificación de las teorías económicas, con base en los
datos que se disponen sobre las distintas variables y aplicando métodos específicos
basados en la inferencia estadística.”
2


“La econometría se ocupa del estudio de estructuras que permitan analizar
características o propiedades de una variable económica utilizando como causas
explicativas otras variables económicas. Por ejemplo, podría construirse una relación
para explicar el comportamiento de la inflación, utilizando como variables explicativas
el ritmo de crecimiento de la oferta monetaria y algún indicador de la demanda
agregada en la economía. Distintos aspectos del análisis econométrico son:

a) La especificación de la estructura a utilizar, llamada modelo econométrico;
b) El análisis de las propiedades estadísticas de dicho modelo.
c) Su estimación.
d) La utilización de dicho modelo con fines predictivos, y
e) La capacidad de dicho modelo para el análisis de determinadas cuestiones de
política económica.”
3


Samuelson, Koopmans y Stone (1954): '... el análisis cuantitativo de fenómenos
económicos actuales, basado en el desarrollo congruente de teoría y observaciones, y
relacionado por métodos apropiados de inferencia.”

Valavanis (1959): 'El objetivo de la econometría es expresar las teorías económicas
bajo una forma matemática a fin de verificarlas por métodos estadísticos y medir el
impacto de una variable sobre otra, así como predecir acontecimientos futuros y dar
consejos de política económica ante resultados deseables.'

Klein (1962): 'El principal objetivo de la econometría es dar contenido empírico al
razonamiento a priori de la economía.'

Malinvaud (1966): '... aplicación de las matemáticas y método estadístico al estudio de
fenómenos económicos.'

1
El termino “Econometric” fue introducido en el mundo académico a comienzos de la década de 1930´s
con la formación de la “Econometric Society” en al año 1930 en la ciudad de Cleveland, Ohio, USA y
con la fundación en el año 1933 de la revista “Econometrica”.
2
Martin, Guillermina; José María Labeaga y Francisco Mochón. Introducción a la econometría. Prentice
Hall. España.1997. p.5
3
NOVALES; Alfonzo. Econometría. 2da Edic. Mc GRAW HILL. España.1993.
6

Christ (1966): 'Producción de declaraciones de economía cuantitativa que explican el
comportamiento de variables ya observadas, o predicen la conducta de variables aún
no observadas.'

Intriligator (1978): 'Rama de la economía que se ocupa de la estimación empírica de
relaciones económicas.'

Chow (1983): 'Arte y ciencia de usar métodos para la medida de relaciones
económicas.'

“...econometría no significa lo mismo que estadística económica. No es idéntica que lo
que llamamos teoría económica, aunque una parte importante de esta teoría tienen
marcado carácter cuantitativo. No podría tomarse la econometría como sinónimo de
aplicaciones matemáticas en la economía. La Experiencia ha demostrado que unos de
estos tres puntos de vista, estadística, teoría económica y matemáticas, son
condiciones necesarias pero no suficientes para un conocimiento real de las relaciones
cuantitativas en la vida económica moderna. Es la unificación de las tres lo que es
poderoso. Y esta unificación es lo que constituye la econometría…”
4


De las definiciones reseñadas se puede concluir que la econometría nos
proporciona una metodología y un instrumental que permite básicamente alcanzar dos
objetivos: cuantificar o parametrizar la relación existente entre dos o mas variables
económicas. Y en segundo lugar permite realizar estimaciones de una variable en
función de valores estimados o proyectados de otras variables con las cuales está
relacionado.

Es importante señalar que la Econometría nos proporciona una metodología para
alcanzar un fin, en ningún caso puede ser el fin en si mismo. Su uso adecuado
proporciona una poderosa herramienta para el análisis de fenómenos económicos.

Es pertinente tomar en consideración las palabras de Maurice Allais
5
: “Por
desgracia, el abuso de las matemáticas no es el único fallo de los escritos
económicos contemporáneos, que con demasiada frecuencia generan seudoteorías
basadas en la aplicación mecánica, carente de toda comprensión real, de las técnicas
econométricas y estadísticas. Todas estas teorías reúnen las mismas características:
elaboración de modelos de correlación lineal, en realidad seudomodelos,
acompañados por una planopia matemático estadística de factores econométricos sin
domar, totalmente injustificados, que a los ingenuos les parecen teorías científicas,
mientras no suelen ser mas que cáscaras vacías; aplicación ciega y brutal de
programas de correlación lineal y de las pruebas asociadas con ellos, aun cuando
estas pruebas por lo general no son aplicables a los casos estudiados, y empleo de los

4
Frisch, R. (1933) “Editorial”. Econométrica 1, 1-4. Citado por: Vicéns Otero, José. “Econometría y
Contrastación Empírica . Concepto e Historia”. Documento 98/1. Universidad Autónoma de Madrid.
Madrid. 1998. p.12.
5
Economista francés, catedrático de economía en la Ecole Nationale Supérieure des Mines de París y
obtuvo el premio Nobel de Economía en 1988.
7
modelos, con frecuencia usados para un solo país y en período breve, en que las
variables explicativas y los parámetros arbitrarios alcanzan tal número que las
aplicaciones no pueden tener significado real”.
6


2. EVOLUCION HISTORICA DE LA ECONOMETRIA

Para fines explicativos se puede establecer cuatro períodos
7
en la evolución histórica
de la econometría:

Etapa 1: Antecedentes.

Esta primera etapa se inicia con los primeros intentos de medición de los fenómenos
económicos en la Europa del siglo XIX con los trabajos de economía matemática de
Von Thunen, Cournot, Edgeworth, Jevons, Walrras, Pareto, etc. Esta etapa inicial de
caracteriza por comenzar un acercamiento entre la matemáticas y la Economía sin
considerar en forma explícita la relación entre datos económicos y técnicas
estadísticas. Las condiciones comunes de esta etapa se centran en los desarrollos
paralelos de teorías económicas y formalizaciones estadísticas que posteriormente
serían integradas en el área del conocimiento que se define como “Econometría”.

Etapa 2: Desarrollos iniciales.

El comienzo de esta etapa está marcada por la publicación de H. Moore, “Economic
Cycles: their Law and Causes” (1914), que es considerado por como el primer trabajo
econométrico. En el mismo se realizan las primeras estimaciones de las relaciones
económicas implícitas en la demanda a través de las estadísticas económicas de
principios del siglo XX en Inglaterra.

En el desarrollo de esta etapa se pueden detectar un conjunto de trabajos que
cumplen con la metodología econométrica, al menos desde la perspectiva funcional,
sin embargo, no existe evidencia de una escuela formal que aglutine los esfuerzos y
las líneas de investigación. La mayoría de las aportaciones provienen de
individualidades o instituciones aisladas que coinciden en la forma de abordar el
análisis económico aplicado.


Etapa 3: Formalización.

El inicio de esta etapa se ubica a partir de que el 29 de diciembre de 1930 se funda en
Cleveland la Econometric Society, promovida inicialmente por Charles Roos, Ragnar
Frisc e Irvin Fisher. En el desarrollo de esta etapa, aparece la revista “Econométrica”,

6
Szenerg, Micahael, editor. “Grandes Economistas de Hoy”. Editorial Debate S.A. Madrid. 1992. p39.
7
Armenta fraire, leticia. José de la cruz gallegos y Luis alejandro lagunas Toledo. “Modelo de análisis y
Prospectiva Económica Aplicada MAPEA, Un Instrumento de Simulación y Pronostico Econométrico
para los Tomadores de Decisiones”. Editorial Trillas. Mexico. 2001. p.26
8
que se constituye como el principal medio de comunicación de los econometristas
alrededor del mundo y cuyo primer número se publica en 1933. Además se establece
la “Cowles Comisión”, la cual se erigiría como el núcleo central que habría de
configurar la ortodoxia econométrica. A finales de esta etapa se crea también el
“Department of Applied Economics” en la Universidad de Cambridge. El cual, aunque
inicialmente se constituye en 1939 bajo la coordinación indirecta de Keynes, no fue
operativo sino hasta el final de la Segunda Guerra Mundial, cuando Richard Stone
toma la dirección del mismo.

Esta época se caracteriza por un esfuerzo de normalización de las aproximaciones y
metodología econométrica, que trata de dotar a la econometría de un cuerpo de
conocimiento generalmente aceptado.

Etapa 4: Extensión.

Esta cuarta etapa se inicia con la publicación de la Monografía número 10 de la
Cowles Comisión en la que, bajo el título de “Statiscal Inference in Dynamic Economic
Models”, Koopmans, Rubin y Leipnik (1950) establece de una forma sistemática las
normas básicas de elaboración de investigaciones econométricas.

Este compendio de normalización econométrica se vería completado tres años mas
tarde con la publicación, en 1953, de la Monografía número 14 con el título “Studies in
Econometric Methods”.

A partir de estos primeros años de la década de los cincuenta ya podemos considerar
que la econometría es una disciplina madura, al menos en el campo teorico, y prueba
de ello es la aparición de los primeros manuales de econometría como el publicado
por Klein en 1953
8
.

La caracterización básica de la etapa de extensión viene definida desde dos puntos de
vista alternativos. En primer término, desde el campo de la econometría teórica, se
destaca el perfeccionamiento de los métodos de estimación disponibles , así como el
desarrollo de múltiples contrastes y especificaciones alternativas que tratan de
solventar los problemas derivados del incumplimiento de las hipótesis consideradas a
priori. Y en segundo término desde la perspectiva de la econometría aplicada, se
genera un gran desarrollo en la modelización y los primeros esfuerzos sistemáticos de
aplicaciones empíricas.


Etapa 5: Diversidad de enfoques.

El principio de la década de los setenta marca el inicio de la quinta y última de las
etapas y arranca con la publicación del trabajo de Box y Jenkins sobre los modelos
univariantes de series de tiempo (Time Series Analysis) (Time Series Analysis).


8
Klein, L. R. “A Textbook of Econometrics. Prentice Hall. Nueva York. 1953.
9
El período en que se desarrolla esta última etapa, esta condicionada por el aumento
de los precios energéticos y la consiguiente crisis económica que sufrieron la mayoría
de los países desarrollados que, por primera vez, vieron aumentar al unísono sus
niveles de paro e inflación sin que la teoría económica disponible fuera capaz de de
ofrecer una explicación adecuada al respecto.

En lo estrictamente econométrico, los distintos modelos elaborados hasta la fecha
comenzaron a fallar sistemáticamente en sus predicciones, y se puso en duda lo que
hasta el momento había sido el baluarte que sustentaba todos los desarrollos
aplicados, y que era su capacidad predictiva.

Partiendo de esta aparente inutilidad de los desarrollos econométricos para adaptarse
y anticiparse al nuevo orden económico mundial, surgirá un nuevo incentivo para los
económetras que ha marcado todos los desarrollos posteriores de la disciplina y que
podemos asimilar como la característica diferenciadora de esta etapa.

Para solventar los problemas antes señalados se desarrollaron aplicaciones cuya
justificación última es la obtención de buenos resultados empíricos en cualquiera de
las funciones esenciales de los trabajos econométricos (explicación de relaciones
económicas, predicción o simulación de escenarios alternativos); es decir, la economía
toma un cariz estrictamente funcional y las distintas alternativas metodológicas y
aplicaciones prácticas se empiezan a juzgar por su capacidad explicativa o predictiva.

En este contexto empieza a surgir múltiples fuentes de crítica a la modelización
tradicional , representada por los grandes modelos macroeconométricos de
ecuaciones simultaneas, y que sirvieron como incentivo para el desarrollo de nuevos
contrastes, especificaciones alternativas y nuevas técnicas para abordar el análisis
económico aplicado. Esta diversidad de planteamientos constituye el segundo de los
factores diferenciadores que delimitan esta última etapa de la historia econométrica.

Por último, los inicios del siglo XXI, el instrumental teórico sobre análisis econométrico
ha sido fortalecido por un desarrollo exponencial de la tecnologías informáticas, las
cuales han aportado poderosas herramientas computacionales que han permitido el
uso de sistemas de resolución muy complejos en períodos muy cortos, Asimismo, los
lenguajes de programación amigables han facilitado a los investigadores la posibilidad
de generar sus propias herramientas de cómputo, lo que ha diversificado
enormemente las posibilidades de aplicación teórica.




10
1914
Etapa 1
H.Moore
Economic Cycles:
their Law and Causes
Etapa 2
1930
Econometric Society
Revista Econométrica
Cowles Commision
Etapa 3
1959
Monografía Nº 10
Etapa 4
1970
Box-Jenkis
Time Series Analysis
Etapa 5
EVOLUCION HISTORICA
DE LA ECONOMETRIA


3. MODELOS.


Un Modelo es una representación simplificada de la realidad, en el cual se
señalan los aspectos principales o fundamentales para su análisis.

En forma particular un modelo económico se define como una expresión lógica,
verbal, gráfica o matemática de las relaciones entre variables económicas.
9


Los modelos económicos se pueden clasificar en:

a) Cuantitativos:
i) Opinión de expertos.
ii) Encuestas
b) Causales.
i) Econométricos.
ii) Vectores Autorregresivos (VAR).
c) Series de Tiempo.
i) Box –Jenkis (ARIMA).
ii) Función de transferencia.

Un modelo económico-matemático es un conjunto de relaciones que
representan un proceso económico, expresadas en forma matemática.
10



9
López Casuso, Rafael. “Cálculo de Probabilidades e Inferencia Estadística”. 3ra. Edic. Universidad
Católica Andrés Bello. Caracas.2000.p.483.
10
López Casuso, Rafael. Ob.cit. p484.
11
La econometría se basa en los modelos económicos-matemáticos, en el cual una
variable dependiente (efecto) está en función de un(as) variable(s) independiente(s)
(causa). Esquemáticamente se escribe: X = ƒ( Y, Z) , que se puede leer: la variable
X está en función de dos variables Y y Z.


El modelo matemático fundamental es el de la línea recta:

Y = mX + b


Donde: Y = variable dependiente o variable endógena



m
b
Y = mX+b




X = variable independiente o variable exógena
m = pendiente
b = Intercepto (punto donde la recta corta el eje de las
ordenadas).

4. MODELOS ECONOMETRICOS.

El modelo básico o llamado también “Modelo Clásico”, es muy parecido al
modelo de la línea recta:

X Y | o + =

Donde:
= o Coeficiente intercepto
11
.

= | Coeficiente pendiente,

11
Es de uso generalizado en econometría. El uso de letras griegas para señalar los coeficientes
(constantes), por ejemplo: alfa = o ; beta = | , gamma = ¸ ; delta = o ; épsilon = c ; theta = u
lamda = ì ; pi = t ; ro = µ ; sigma = o etc.
12
Y = Variable dependiente ó explicada, y
X = Variable independiente ó explicativa.

A diferencia de los modelos matemáticos, en la cual se analiza la dependencia
de una variable (dependiente) con respecto a otra (independiente), el modelo
econométrico debe explicar todas las posibles causas que afecten a una variable
determinada.

Así por ejemplo si queremos estimar una función del gasto en consumo de
alimentos (C) con respecto al ingreso disponible (Y), con base en una muestra de 500
familias, especificaríamos el modelo de la siguiente forma:

Y C | o + = (3.1)

Se espera que no todas las 500 observaciones queden exactamente sobre la
línea recta porque, además del ingreso, existen otras variables que afectan el gasto en
consumo. Por ejemplo, el tamaño de la familia, el precio de los bienes de consumo, el
precio de los bienes sustitutivos o complementarios, etc.

Para dar cabida a relaciones inexactas entre las variables, la econometría
plantea especificar la función de la siguiente forma:


i i i
u X C + + = | o (3.2)

donde u , es conocida como el término de perturbación, o de error, es una
variable aleatoria (estocástica) que tiene propiedades probabilísticas claramente
definidas. El término de perturbación o variable estocástica ( u ) puede representar
claramente todos aquellos factores que afectan el gasto de consumo pero que no son
considerados en el modelo. En otras palabras la variable u absorbe todas aquellas
variables que explican el comportamiento de la variable dependiente pero que no
están planteadas en el modelo, ya sea por que no son cuantificables o medibles, o
bien sencillamente por que el investigador considera que no son importantes en el
modelo.

Las razones fundamentales que justifican la incorporación del término de
perturbación aleatoria al modelo econométrico son, básicamente los siguientes:
12


a) Si existe alguna teoría que determine el comportamiento de la variable
dependiente, ésta suele ser incompleta. Por lo tanto, la variable aleatoria podría ser
utilizada como un sustituto de todas las variables excluidas del modelo.



12
Díaz Fernández, Montserrat y María del Mar Llorente Marrón. Econometría. Ediciones Pirámide.
Madrid.1998. p.27
13
b) Aun sabiendo cuáles son las variables relevantes en la especificación del
modelo, es muy probable que no haya datos sobre todas ellas. En el análisis empírico,
es muy común que los datos que todos deseamos tener no siempre estén disponibles.

c) Es posible que la influencia individual de variables poco relevantes en el
comportamiento de la variable dependiente sea insignificante y no sistemática y que,
por razones de coste, no justifique su introducción explícita en el modelo. Cuando esto
suceda, el efecto combinado de dichas variables podría ser tratado como una variable
aleatoria.

d) Aun incluyendo satisfactoriamente las variables relevantes en el modelo, es
preciso tener en cuenta el carácter aleatorio de la conducta humana. La variable
aleatoria u podría reflejar también dicho comportamiento.

e) El modelo econométrico deberá ser sencillo en su estructura (principio de
parcimonia), incorporando en su especificación las variables más relevantes. Si se
puede explicar el comportamiento de la variable dependiente con dos o tres variables,
y si además nuestra teoría no es lo suficientemente sólida, representaremos por u a
todas las demás.

U Y C + + = | o
U
U
Y
C


En el caso del modelo planteado (3.2), este se puede leer de la siguiente forma:
el gasto de consumo depende en forma lineal del ingreso disponible y de otras
variables, las cuales están contenidas en u .


El subíndice ( ) i que tienen las variables, nos indica que los datos son obtenidos
de una muestra de corte transversal. En el caso de que los datos sean de una serie
cronológica o de tiempo , el subíndice sería una ( ) t :
t
X ,
t
Y ,
t
u .

En el modelo anterior se ha intentado realizar una descripción sobre el
comportamiento general de una relación económica, en otras palabras se ha descrito
un marco teórico. A este tipo de modelo general, lo denominaremos Modelo de
Regresión Poblacional (MRP).
14

En la práctica, en muy raras veces podremos determinar un modelo que
describa el comportamiento general, ya que sería necesario tener todos los datos que
representan la población. Lo más común es que trabajemos con los datos
correspondientes a parte de la población, es decir una muestra, por lo tanto a la hora
de establecer un modelo econométrico, trabajaremos con una Función de Regresión
Muestral (FRM), la cual es muy parecida a la poblacional pero con unas características
propias que la determinan.

i
i
i u X Y FRM
^ ^ ^ ^
: + + = | o


A
i
i
i U X Y FRM
^ ^ ^ ^
: + + = | o
i i i
U X Y FRP + + = | o :
Y
X
i
Y
^
i
Y
i
X




Donde: el símbolo (^) indica que el valor es estimado (calculado) a partir de los datos
de la muestra, es decir oˆ se leería como alfa estimado. uˆ es el valor estimado de la
variable estocástica, y se conoce con el nombre de residual y es el producto de la
diferencia existente entre el valor verdadero de un dato de la variable Y y el valor
estimado del mismo, una vez regresado el modelo. i
i i
Y Y u
^
ˆ ÷ =

La construcción de un modelo implica (i) disponer o elaborar una explicación
previa teórica, básicamente relacionado con la complejidad de relaciones (tipo de
modelo a precisar), (ii) señalar el algoritmo de transformación de unos valores en otros
(especificación) y (iii) a partir de las observaciones, estimar el valor de los parámetros
y señalar sus características para evaluar el ajuste del modelo al fenómeno bajo
estudio.
13


13
Mata Mollejas, Luis y José Niño Díaz. Revisión de los Métodos Cuantitativos en la Economía. Fondo
Editorial Tropykos y Comisión de Estudios de Postgrados. U.C.V. Caracas. 2000. P.39
15
5. TIPOS DE MODELOS

5.1 Según el número de variables:

a) Modelo de regresión simple: este modelo contiene solamente dos variables,
una variable dependiente y una sola variable explicativa.


t t t
u X Y + + = | o


b) Modelo de regresión múltiple: contiene más de una variable explicativa.

t t t t t
u X X X Y + + + + =
3 3 2 2 1 1 0
| | | |


5.2 Según el número de ecuaciones:

a) Modelos uniecuacionales: son los modelos que contienen una sola ecuación

i i i
u P Q + + = | o


b) Modelos de ecuaciones simultáneas: contienen más de una ecuación.

t t t
u INV PIB + + = | o

t t t
TI INV c | ì + + =


5.3 Atendiendo a la forma de las relaciones, los modelos pueden clasificarse en;

a) Modelos lineales. Cuando e habla de modelos lineales, hacemos referencia a
dos sentidos de linealidad: en las variables o en los parámetros. En la práctica, la
linealidad de los parámetros es la más importante, especialmente al momento de
a aplicación de los métodos de estimación de los mismos. La linealidad de las
variables generalmente se consigue facilmente aplicando alguna transformación
al modelo.

b) Modelos no lineales.
16

6. FORMAS FUNCIONALES
A continuación se muestra un cuadro con los principales tipos de modelos con
que generalmente se trabaja en la práctica así como sus representaciones gráficas.


Modelo Ecuación Pendiente
|
.
|

\
|
=
dX
dY

Elasticidad
|
.
|

\
|
=
Y
X
dX
dY
.
Lineal u X Y + + = | o | |
|
.
|

\
|
Y
X
|
Log-Lin
O Log-Log
u LnX LnY + + = | o
|
.
|

\
|
X
Y
|
|
Log-Lin u X LnY + + = | o ( ) Y | ( ) X |
Lin-Log u LnX Y + + = | o
|
.
|

\
|
x
1
| |
.
|

\
|
Y
1
|
Recíproco
u
X
Y + + =
1
| o
|
.
|

\
|
÷
2
1
X
| |
.
|

\
|
÷
XY
1
|
Fuente: Damodar Gujarati, Econometría, Mc Graw Hill.






















17








































U LnX Y + + = | o
U LnX Y + ÷ = | o
X
Y
X
Y
u LnX LnY + + = | o
u LnX LnY + ÷ = | o
X
Y
U X Y + + = | o
U X Y + ÷ = | o
U X X Y + + + =
2
| | o
U X X Y
+ ÷ + =
2
| | o
X
Y
X
Y
U X LnY + + = | o
U X LnY + ÷ = | o
X
Y
U
X
Y + + =
1
| o
U
X
Y + ÷ =
1
| o
18
CAPITULO II

MODELO DE REGRESION LINEAL UNIECUACIONAL (MODELO CLASICO)

1. SUPUESTOS.

1.1. MODELO DE REGRESIÓN LINEAL.

El modelo de regresión es lineal en los parámetros, como se observa a continuación.

u X Y + + = | o

Como se indica en el supuesto los parámetros son los que deben ser lineales
(elevados a la uno) sin importar que forma tomen la variable dependiente y la variable
explicativa

¿Es el modelo lineal en los parámetros? ¿Es el modelo lineal en las variables?
Sí No
Sí MRL MRL
No MRLN MRLN
MRL= Modelo de regresión lineal
MRNL = Modelo de regresión no lineal.


Por ejemplo de los modelos que se presentan a continuación, solo el modelo
b) es un modelo de regresión lineal.

(a)
u X
e Y
+ +
=
| o

(b)
u X
e
Y
+ +
+
=
| o
1
1

(c) u
X
Y + + =
1
ln | o
(d) u X Y + + =
2
| o

1.2. LOS VALORES DE X SON FIJOS EN MUESTREO REPETIDO.

Los valores que toma la variable explicativa (X) son considerados fijos en muestreo
repetido. Más técnicamente, se supone no estocásticos.

Cuando estamos analizando un evento económico lo deseable es que se tengan
diferentes muestras, para poder así observar el comportamiento promedio de los
19
parámetros. Este supuesto nos indica que para todas las muestras analizadas, los
valores que tome(n) la(s) variable(s) explicativa(s), deben ser los mismas para todas
las muestras.

1.3. EL VALOR MEDIO DE LA PERTURBACIÓN u ES IGUAL A CERO.

Dado el valor de X, la media o el valor esperado del término aleatorio de perturbación
u es cero. Técnicamente, el valor de la media condicional de u es cero.
Simbólicamente, se tiene ( ) 0 / =
i
X u E
14
para toda i = 1,2,...,n.


1.4. HOMOCEDASTICIDAD O IGUAL VARIANZA DE u .

Dado el valor de X, la varianza de u es la misma para todas las observaciones. Esto
es, las varianzas condicionales de u son idénticas, Simbólicamente se tiene que

( ) ( ) | |
2
/ / var
i i i i i
X u E u E X u ÷ =
( )
i i
X u E /
2
= por el supuesto 3

2
o =
Donde var significa varianza
15
. Como se observa
2
o no posee ningun subíndice
con lo cual la varianza se considera una constante.

14
La esperanza matemática (también llamada valor esperado) de una variable aleatoria X cuyos valores posibles
n
x x x x ,..., ,
2 1
= y cuya función de probabilidad es ( ) x f , se escribe como ( ) X E y se define como

( ) ( ) ( ) ( )
n n
x f x x f x x f x X E + + + = ...
2 2 1 1


En la ecuación anterior se observa que el valor esperado de X se define como un promedio ponderado de
sus posibles valores, en donde las ponderaciones son las probabilidades que se le asocian.

Al valor esperado de una variable aleatoria a menudo se le denomina como promedio o valor promedio y se
denota por la letra µ . Por ejemplo, ( ) Z Z E µ = y ( ) X X E µ = . El promedio de una variable es una medida de
su tendencia central; si el experimento se realiza un gran número de veces, el promedio es el valor que podemos
esperar que sea la media aritmética de la variable sobre todos los experimentos.

Algunas propiedades de la esperanza matemática son las siguientes propiedades:

a) El valor esperado de una constante es igual a la constante ( ) K K E =
b) ( ) ( ) X KE KX E =
c) ( ) ( ) ( ) ( )
3 2 1 3 2 1
X E X E X E X X X E + + = + +

15
“En el análisis de una serie de datos no podemos conformarnos con el simple conocimiento de los promedios,
sino que es necesario determinar como varían o se dispersan el resto de los valores de la serie con relación al
promedio elegido o seleccionado.

Es decir, un promedio es un valor representativo de un conjunto de datos, pero necesitamos conocer cómo
se alejan o se acercan del mismo, la totalidad de los datos de una serie a fin de considerar la mayor o menor
representatividad del promedio seleccionado.
20

La ecuación anterior establece que la varianza de u para cada X (esto es la
varianza condicional de u ) es algún número positivo constante igual a
2
o .
Técnicamente la ecuación representa el supuesto de Homocedasticidad, o igual


A mayor valor de una medida de variación o de dispersión menos concentrados estarán los datos de una
serie con relación al promedio de la misma y por tanto menor representatividad tendrá el promedio de la
distribución.

A menor valor de una medida de variación o dispersión mas concentrados estarán los datos alrededor del
promedio, siendo éste por tanto más representativo.

Lo ideal o utópico sería que al calcular una medida de variación ésta nos resulte igual a cero, lo cual nos
indicaría que no existe alguna dispersión entre los datos y su promedio, siendo por tanto todos los valores de la
serie iguales y alcanzando el promedio de la misma una representatividad óptima.”
15


Entre las principales medidas de dispersión tenemos a la Desviación Típica o Error Estándar ( ) o y la
Varianza ( )
2
o .

La desviación Típica se define como la raíz cuadrada positiva del promedio aritmético de los cuadrados de
los desvíos con respecto a la media aritmética.

Sean
N
X X X X ,... , ,
3 2 1
los datos de una serie y donde
2 2
2
2
1
,..., ,
|
.
|

\
|
÷
|
.
|

\
|
÷
|
.
|

\
|
÷
÷ ÷ ÷
X X X X X X
N
son
los cuadrados de los desvíos con respecto a la media aritmética.


N
X X X X X X X X
N
2 2
3
2
2
2
1
...
|
.
|

\
|
÷ + +
|
.
|

\
|
÷ +
|
.
|

\
|
÷ +
|
.
|

\
|
÷
=
÷ ÷ ÷ ÷
o



N
X X
i ¿
|
.
|

\
|
÷
=
÷
2
o



N
d
i ¿
=
2
o donde ( ) X X d ÷ =

La varianza se define como el cuadrado de la desviación típica o estándar


N
d
N
X X
i
i
¿
¿
=
|
.
|

\
|
÷
=
÷
2
2
2
o

( ) ( )
2 2
X E X E
x
÷ = o

21
(homo) dispersión (cedasticidad), o igual varianza. Planteado de otra forma, la
ecuación significa que las poblaciones Y correspondientes a diversos valores de X
tienen la misma varianza.

En contraste, cuando la varianza condicional de la población Y varía con X, se
conoce como Heterocedasticidad, o dispersión desigual o varianza desigual.

( )
2
/ var
i i i
X u o =

1.5. NO AUTOCORRELACIÓN ENTRE LAS PERTURBACIONES.

Dado dos valores cualquiera de U, La correlación entre dos
i
u y
j
u cualquiera ( ) j i =
es cero. Simbólicamente

( ) ( ) ( ) ( ) ( )
j j j i i i j i j i
X u E u X u E u E X X u u / / / cov ÷ ÷ =
( )( )
j j i i
X u X u E / / =
0 =

donde i y j don dos observaciones diferentes y donde cov significa covarianza,

Lo que supuesto nos indica es que entre dos o más perturbaciones
(observaciones de la variable aleatoria) no de debe existir ninguna relación.

Cuando el término de perturbación cumple con los supuestos de
homocedasticidad y no autocorrelaciòn se le califica de perturbación esférica.



1.6. LA COVARIANZA ENTRE
i
u Y
i
X ES CERO,

o. Formalmente.


( ) ( ) | | ( ) | |
i i i i i i
X E X u E u E X u ÷ ÷ = , cov
( ) ( ) | |
i i i
X E X u E ÷ = , puesto que ( ) 0 =
i
u E
( ) ( ) ( )
i i i i
u E X E X u E ÷ = , puesto que ( )
i
X E es no estocástica.
( )
i i
X u E = , puesto que ( ) 0 =
i
u E
0 =

Este supuesto establece que la perturbación
i
u y la variable explicativa
X no están correlacionadas. El razonamiento para este supuesto es el siguiente:
Cuando se expresa la FRP, se supone que X y u (la cual puede representar la
influencia de todas las variables omitidas) tienen una influencia separada (y aditiva)
22
sobre Y. Pero si X y u están correlacionadas, no es posible determinar sus efectos
individuales sobre Y. Así si X y u están correlacionadas positivamente, X aumenta
cuando u aumenta y disminuye cuando u disminuye. Similarmente, si X y u están
correlacionadas negativamente X aumenta cuando u disminuye y disminuye cuando
u aumenta. En cualquier caso, es difícil aislar la influencia de X y u sobre Y.

Este supuesto se cumple automáticamente si la variable X no es aleatoria o no
es estocástica.


1.7. NO HAY MULTICOLINEALIDAD PERFECTA.

Es decir, no hay relaciones perfectamente lineales entre las variables explicativas.

( ) 0 cov =
j i
X X donde ( ) j i =

Para poder analizar la relación existente entre la variable dependiente y las
variables explicativas, el investigador debe tener seguridad de que las variables
explicativas son totalmente independientes una de las otras, para poder tener certeza
plena del significado de cada uno de los coeficientes pendientes.

1.8. EL NÚMERO DE OBSERVACIONES n DEBE SER MAYOR QUE EL
NÚMERO DE PARÁMETROS POR ESTIMAR.

Alternativamente, el número de observaciones n debe ser mayor al número de
variables explicativas.


1.9. VARIABLILIDAD DE LOS VALORES DE X.

No todos los valores de X en una muestra dada deben ser iguales, Técnicamente,
var(X), debe ser un número positivo finito.

2. PROPIEDADES DE LA FUNCION DE REGRESION MUESTRAL (FRM)


i i
i u X Y ˆ
^ ^ ^
+ + = | o










23

2.1. Pasa a través de las medias muestrales de Y y X


X
Y
i
i
i U X Y
^ ^ ^ ^
+ + = | o
÷
X
÷
Y


2.2. El valor de la media de los residuos
i
uˆ es igual a cero. Recordemos que
^
ˆ Y Y u ÷ =


3. MEJORES ESTIMADORES LINEALMENTE INSESGADOS (MELI)

Un estimador es considerado el mejor estimador linealmente insesgado
16
(MELI)
cuando cumple las siguientes propiedades:

a) Es lineal, es decir, función lineal de una variable aleatoria, tal como la variable
dependiente Y en el modelo de regresión.

b) Es insesgado, es decir, su valor promedio o esperado, ( ) |
ˆ
E es igual al valor
verdadero, ( ) | | =
ˆ
E


c) Tiene varianza mínima dentro de toda la clase de todos lo estimadores lineales
insesgados; Un estimador insesgado con varianza mínima es conocido como un
estimador eficiente



16
También es conocido con las siglas de ELIO (Estimador Linealmente Insesgado Optimo). O con sus
siglas en ingles BLUE (Best Linear Umblased Estimator)
24



d) Son consistentes, a medida que aumenta el tamaño de la muestra, el
estimador, se va aproximando al parámetro verdadero.

Dado que un estimador es una función matemática de los valores de la muestra,
si sustituimos en dicha función los valores observados, que componen una muestra
concreta, se obtiene un número que es la estimación. El objetivo de la econometría es
que la estimación se aproxime lo más posible al verdadero valor del parámetro que
pretendemos estimar y para ello, el estimador ha de cumplir una serie de propiedades
deseables.

En primer lugar. Convendría que el estimador proporcionara estimaciones
centradas en el verdadero valor del parámetro cuando tenemos diferentes muestras.
Este hecho está relacionado con una propiedad que se conoce como insesgadez. Un
estimador es insesgado si su esperanza matemática coincide con el valor del
parámetro que pretende aproximar. En definitiva, lo que se establece es que la
variable aleatoria estimador tiene una distribución cuya media es el parámetro que se
está estimando.

Otra propiedad conveniente de considerar es la variabilidad o dispersión del
estimador. Puede que un estimador tenga muy poca variabilidad, aun siendo sesgado,
y que otro estimador insesgado posea una gran varianza. El estimador lineal e
insesgado de menor varianza será él óptimo, que se conoce como MELI.

4. TEOREMA DE GAUSS-MARKOV

Dados los supuestos del modelo clásico de regresión lineal, los
estimadores de mínimos cuadrados, dentro de la clase de estimadores lineales
insesgados, tienen varianza mínima, es decir son MELI.

25
Lo que este teorema nos indica es que siempre y cuando se cumplan los
supuestos del modelo clásico (no autocorrelación, no multicolinealidad,
homocedasticidad, etc,), los parámetros estimados mediante el método de los mínimos
cuadrados ordinarios, serán los mejores estimadores linealmente insesgados (MELI),
lo que nos permite a partir de un Modelo de Regresión Muestral realizar conclusiones
válidas sobre una posible relación de causalidad a nivel poblacional.

5. ESTIMACION DE LOS PARAMETROS A TRAVES DEL METODO DE
LOS MINIMOS CUADRADOS ORDINARIOS.

El método consiste en minimizar la sumatoria del cuadrado de los residuales.

Como se sabe, para calcular el mínimo o máximo de una función, se calcula la
primera derivada de la función y se iguala a cero para determinar los valores críticos.

A continuación realizaremos los siguientes pasos:

a) se determinará la función: sumatoria del cuadrado de los residuales a
partir del modelo clásico

u X Y ˆ
^ ^
+ + = | o

X Y u
^ ^
ˆ | o÷ ÷ =


2
^ ^
2
) ( ˆ X Y u | o÷ ÷ =


¿ ¿
÷ ÷ =
2
^ ^
2
) ( ˆ X Y u | o

b) Ahora tenemos una función con dos incógnitas. A continuación realizaremos
las derivadas parciales de la función con respecto a los dos coeficientes, e
igualaremos a cero ambas derivadas.


¿
= ÷ ÷ ÷ =
c
c
0 ) 1 )( ( 2
ˆ
^ ^
^
2
X Y
u
| o
o



¿
= ÷ ÷ ÷ 0 ) ( ) 2 (
^ ^
X Y | o


¿
= ÷ ÷ 0 ) (
^ ^
X Y | o

26
0
^ ^
= ÷ ÷
¿ ¿
X N Y | o

X N Y
^ ^
| o+ =
¿
(1ra ecuación normal)


N
X
N
N
N
Y
^ ^
| o
+ =
¿



÷ ÷
+ = X Y
^ ^
| o



÷ ÷
÷ = X Y
^ ^
| o



¿ ¿
÷ ÷ =
2
^ ^
2
) ( ˆ X Y u | o


¿
= ÷ ÷ ÷ =
c
c
0 )) )( ( 2
ˆ
^ ^
^
2
X X Y
u
| o
|


0 ) )( ( ) 2 (
^ ^
= ÷ ÷ ÷
¿
X X Y | o

0 ) )( (
^ `^
= ÷ ÷
¿
X X Y | o


¿
= ÷ ÷ 0 ) (
2
^ ^
X X YX | o

0
2
^ ^
= ÷ ÷
¿ ¿ ¿
X X YX | o


¿ ¿ ¿
+ =
2
^ ^
X X YX | o (2da ecuación normal)


¿ ¿ ¿
+ ÷ =
÷ ÷
2
^ ^
) ( X X X Y YX | |


¿ ¿ ¿ ¿
+ ÷ =
÷ ÷
2
` ^
X X X X Y YX | |


¿ ¿
+ ÷ =
÷ ÷ ÷ ÷
2
^ ^
X X N X X N Y YX | |
27


¿ ¿
+ ÷ =
÷
÷ ÷
2
^
2
^
X X N X Y N YX | |


¿ ¿
|
|
.
|

\
|
÷ = ÷
÷
÷ ÷
2 2
^
X N X X Y N YX |



÷
÷ ÷
÷
÷
=
¿
¿
2 2
^
X N X
X Y N YX
|





la cual también se puede expresar:


¿
¿
=
2
ˆ
x
yx
| donde ( ) Y Y y
i
÷ = y ( ) X X x
i
÷ =




Supongamos que la función de demanda de un bien Z se pueda aproximar
mediante un modelo de regresión simple donde X representa el precio del bien e Y la
cantidad demandada del mismo. A partir de la información muestral recogida en la
tabla siguiente estimaremos los coeficientes beta de la regresión.

Y X
200 50
300 25
100 75
50 125
75 100
725 375




i i i
u X Y + + = | o (FRP)

0 > |
EJERCICO Nº 1
28

i i i
u X Y ˆ
^ ^
+ + = | o (FRM)


Y X XY
200 50 10.000 2.500
300 25 7.500 625
100 75 7.500 5.625
50 125 6.250 15.625
75 100 7.500 10.000
725 375 38.750 34.375
2
X


145
5
725
= =
÷
Y 75
5
375
= =
÷
X



5 , 2
) 75 )( 5 ( 34375
) 145 )( 75 )( 5 ( 38750
2
^
÷ =
÷
÷
= |

5 , 332 ) 75 )( 5 , 2 ( 145
^
= ÷ ÷ = o


i i
X Y 5 , 2 5 , 332
^
÷ =






A continuación se presentan los datos hipotéticos sobre el gasto de consumo
familiar semanal (Y) y el ingreso familiar semanal (X)


EJERCICIO Nº 2
29
Y($) X($)
70 80
65 100
90 120
95 140
110 160
115 180
120 200
140 220
155 240
150 260



i i i
u X Y + + = | o (FRP)
0 > |
i i i
u X Y ˆ
^ ^
+ + = | o (FRM)




Y($) X($) YX
2
X
70 80 5.600 6.400
65 100 6.500 10.000
90 120 10.800 14.400
95 140 13.300 19.600
110 160 17.600 25.600
115 180 20.700 32.400
120 200 24.000 40.000
140 220 30.800 48.400
155 240 37.200 57.600
150 260 39.000 67.600
1.110 1.700 205.500 322.000


111
10
1110
= =
÷
Y
÷
÷
= = 170
10
1700
X


5091 , 0
) 170 )( 10 ( 322000
) 170 )( 111 )( 10 ( 205500
2
^
=
÷
÷
= |

4545 , 24 ) 170 )( 5091 , 0 ( 111
^
= ÷ = o

i i
X Y 5091 , 0 4545 , 24
^
+ =


30
6. COEFICIENTE DE DETERMINACION( )
2
R

El coeficiente de determinación nos indica el porcentaje de variaciones de la
variable dependiente que son explicados por el modelo. A medida que el porcentaje es
mayor, nos indica en que medida el modelo se ajusta a los datos, motivo por el cual a
este estadístico también se le conoce con el nombre de BONDAD DE AJUSTE.

Sea:
STC = suma total de cuadrados = ( )
¿
÷
2
ˆ
Y Y
i

SCR = suma de cuadrados debida a la regresión (o explicada) = ( )
¿
÷
2
ˆ
Y Y
i

SEC = suma de los errores al cuadrado = ( )
¿ ¿
= ÷
2
2
ˆ
ˆ
i i i
u Y Y

Entonces.

STC = SEC+ SCR

FRM
X
Y
0
i
X
i
Y
=
|
.
|

\
|
÷
÷
Y Y
i
ˆ
Debido a la regresión
i
X | o
ˆ
ˆ +
i
U
ˆ
= Debido al residuo
÷
Y
^
i
Y
( )
total Y Y
i
= ÷


Para medir la capacidad de explicación de la ecuación de regresión requerimos
una medida que indique toda la variación en
i
Y que la regresión puede explicar. Una
medida tal es:

STC
SEC
STC
SEC STC
STC
SCR
R ÷ =
÷
= = 1
2

31

Donde a
2
r se le conoce como el coeficiente de determinación. Si la ecuación de
regresión puede explicar toda la variación de
i
Y (por ejemplo
i i
Y Y =
ˆ
para todas la i), y
0 ˆ =
i
u , por lo que SEC = 0. En este caso SCR = STC y por lo tanto
2
r =1. Puesto que,
I
Y sería una perfecta combinación lineal de. Por lo tanto todos los puntos del diagrama
de dispersión entre
I
Y y
i
X deberán caer sobre la línea.

En el otro extremo, si la ecuación de regresión no explica nada, SEC asume su
valor máximo; es decir SEC = STC. Notemos que SCR = 0 y por lo tanto
2
r = 0. Por tal
motivo, debido a que SCR = 0, debemos tener que
i i
Y Y =
ˆ
para todo i. Esto implica
que.

En los casos más tradicionales, la ecuación de regresión responde para algunos
de los valores de, pero no para todos; el valor de
2
r cae entre cero y la unidad.

Mientras mayor sea la explicación de la ecuación a variaciones de
I
Y (por ejemplo
mientras los puntos caigan más cerca de la línea de regresión), más se acercará
2
r a
la unidad, y conforme se debilite la relación entre
I
Y y, el valor de
2
r se acercará a
cero. Por lo tanto,
2
r indica la fracción de la variable dependiente a la que puede
responder la ecuación estimada; por ejemplo, si
2
r = 0,63 decimos que la relación
estimada puede explicar el 63 por ciento de las variaciones de la variable dependiente.

La fórmula general para el coeficiente de determinación en regresión simple es:

( ) ( )
( ) ( )
( ) ( )
¿ ¿
¿ ¿
¿ ¿
¿
= = =
2 2 2 2
2
2
2
var var
cov
y x
yx yx
x y
yx
X Y
X Y
R
i i
i i


2 2 2
2
ˆ ˆ
Y N Y
X Y N YX
y
yx
R
÷
÷
= =
¿
¿
¿
¿
| |


ejemplo: para el ejercicio anterior


32

Y($) X($) XY
X
2
Y
2
70 80 5.600 6.400 4.900
65 100 6.500 10.000 4.225
90 120 10.800 14.400 8.100
95 140 13.300 19.600 9.025
110 160 17.600 25.600 12.100
115 180 20.700 32.400 13.225
120 200 24.000 40.000 14.400
140 220 30.800 48.400 19.600
155 240 37.200 57.600 24.025
150 260 39.000 67.600 22.500
1.110 1.700 205.500 322.000 132.100



962 , 0
8890
16800
509 , 0
) 111 ( 10 132100
) 170 )( 111 ( 10 205500
509 , 0
2
2
= =
÷
÷
= r

Lo que nos indica que el 96,20% de las variaciones del gasto de consumo familiar
son explicados por el modelo, el otro 3,80% es explicado por otras variables ( )
i


7. COEFICIENTE DE DETERMINACION AJUSTADO ( )
2
R

Se puede fácilmente demostrar que, cuando en un modelo se incluyen nuevas
variables explicativas, el coeficiente
2
R aumenta o como mínimo permanece
inalterado, aunque las nuevas variables no contribuyesen en nada a la explicación de
Y. Por ello, para comparar dos o más modelos con diferentes números de variables
explicativas, se recurre al coeficiente de determinación corregido o ajustado, definido
por:

( )
K N
N
R R
÷
÷
÷ ÷ =
1
1 1
2 2


De acuerdo con la ecuación se hace entendible que para k>1,
2 2
R R < , lo cual implica
que a medida que el número de variables X aumenta, el
2
R aumenta menos que
2
R , y
el
2
R puede ser negativo, aun cuando el
2
R es necesariamente un valor positivo. En
caso de que el
2
R resulte ser negativo en una aplicación, su valor se toma como cero.


8. COEFICIENTE DE CORRELACION (r)

Una cantidad estrechamente relacionada con el coeficiente de determinación,
pero conceptualmente muy diferente de este es el coeficiente de correlación (r), el cual
es una medida del grado de asociación o relación entre dos variables.


33
2
r r ± =

( )
( ) ( )
¿ ¿
¿
= =
2 2
var var
cov
x y
yx
X Y
YX
r

| || |
2 2 2
X N X Y N Y
X Y N YX
r
÷ ÷
÷
=
¿ ¿
¿



Algunas de las propiedades de r son las siguientes:

a) Puede tener signo positivo o negativo, según la relación entre las
variables sea directa o inversa respectivamente. El signo del coeficiente lo determina
el numerador, el cual mide la covarianza muestral entre las dos variables.
b) Cae entre los límites –1 y +1; es decir 1 1 s s ÷ r .
c) Es simétrico por naturaleza; es decir, el coeficiente de correlación entre X
y Y ( )
XY
r es el mismo que entre Y y X ( )
YX
r .

d) Es una medida de asociación lineal solamente; su uso en la descripción
de relaciones no lineales no tiene significado, por ejemplo
2
X Y = puede describir una
relación exacta y r puede ser cero.

En forma referencial se dice que:

Cuando r < 0,30 el Coeficiente de correlación es débil.
Cuando 50 , 0 30 , 0 s s r el Coeficiente de Correlación es mediano.
Cuando 80 , 0 51 , 0 s s r el Coeficiente de Correlación es apreciable.
Cuando 00 , 1 81 , 0 s s r el Coeficiente de Correlación es fuerte.

9. ESTIMACION POR INTERVALOS

Dada una muestra y obtenida una estimación de | mediante el método de los
mínimos cuadrados (MCO), se puede construir un intervalo que arrojará dos valores
entre los cuales se encuentra el parámetro buscado con el nivel de confianza que se
desea. Cuanto más pequeño sea ese intervalo más precisa será la estimación.

( ) ( ) | | o | | | | |
o o
÷ = + s s ÷ 1
ˆ ˆ ˆ ˆ
Pr
2 / 2 /
ee t ee t
34

La ecuación anterior proporciona un intervalo de confianza para | al, el cual
puede ser escrito en forma más compacta como:

( ) | |
o
ˆ ˆ
2 /
ee t ± intervalo de confianza para | al 100(1-o )%.

Donde:

2 / o
t = es el valor de la variable t obtenida de la distribución t para un nivel de
significancia 2 / o y n-k grados de libertad (n = Nº de observaciones; k = Nº de
coeficientes del modelo), normalmente es llamado el valor crítico t a un nivel de
significancia de.

o = nivel de significancia. Es de práctica generalizada, utilizar niveles de
significancia de 1%, 5% y 10%, siendo el más usado, el de 5%.

( ) |
ˆ
ee = error estándar del coeficiente

a su vez ( )
¿
÷
=
2 2
2
1
ˆ
ˆ
X N X
ee o |



( )
( )
2 2
2
2
ˆ ˆ
X N X N
X
ee
÷
=
¿
¿
o o

k n
u
÷
=
¿
2
2
ˆ
ˆ o = varianza estimada de los residuales.

( )| |
¿ ¿
÷ ÷ =
2 2 2 2
1 ˆ Y N Y r u = sumatoria del cuadrado de los
residuales.

Es importante destacar que el intervalo de confianza es proporcional al error
estándar del estimador. Es decir mientras más grande sea el error estándar, más
amplio será el intervalo de confianza. Expresado de otra forma, entre más grande sea
el error estándar del estimador, mayor será la incertidumbre de estimar el verdadero
valor del parámetro desconocido. Así, el error estándar de un estimador es descrito
frecuentemente como una medida de la precisión del estimador, es decir, qué tan
preciso mide el estimador al verdadero valor poblacional.

El significado del intervalo de confianza ( ) | |
o
ˆ ˆ
2 /
ee t ± es el siguiente: de cada 100
intervalos que se formen, ( ) o ÷ 100 contendrán al parámetro o coeficiente poblacional.
35

Ejemplo:

( ) ( ) | | ( )( ) 82 , 337 8890 038 , 0 111 10 132100 962 , 0 1 ˆ
2 2
= = ÷ ÷ =
¿
u
23 , 42
2 10
82 , 337
ˆ
2
=
÷
= o

( )
( )
036 , 0
33000
23 , 42
170 10 332000
1
23 , 42
ˆ
2
= =
÷
= | ee

306 , 2
2 /
=
o
t 05 , 0 % 5 = = o

( )( ) ( )( ) 036 , 0 306 , 2 509 , 0 036 , 0 306 , 2 509 , 0 + s s ÷ |


592 , 0 426 , 0 s s |

La interpretación de este intervalo de confianza es: dado el coeficiente de
confianza de 95%, (1-0,05)%, en el largo plazo, en 95 de cada 100 casos intervalos

como (0,426; 0,592) contendrán el verdadero valor. Es de hacer notar que no se
puede decir que la probabilidad de que el intervalo específico (0,426; 0,592) contenga
el verdadero valor | sea de 95% porque este intervalo es ahora fijo y no aleatorio; por
consiguiente | se encontrará o no dentro de el. La probabilidad de que el intervalo
específicamente fijado incluya al verdadero valor de | es 1 o 0.

10. PRUEBA DE HIPOTESIS (SIGNIFICANCIA INDIVIDUAL DEL
COEFICIENTE O PRUEBA T).

Cuando realicemos una prueba de hipótesis nos estaremos planteando la
siguiente pregunta: ¿es compatible una observación dada o un hallazgo, con algunas
hipótesis planteadas o no?. La palabra compatible, se utiliza aquí en el sentido de que
la observación está lo suficientemente cercana al valor hipotético de tal forma que no
se rechaza la hipótesis planteada.

La hipótesis planteada es conocida como hipótesis nula y está denotada por el
símbolo ( )
0
H . La hipótesis nula es usualmente probada frente a una hipótesis
alternativa denotada por ( )
1
H . La hipótesis alternativa puede ser simple (prueba de
una cola) o compuesta (prueba de dos colas).

Utilizando la metodología de las pruebas de hipótesis, realizaremos la prueba
de la significancia individual de los coeficientes. En términos generales, una prueba de
36
significancia es un procedimiento mediante el cual se verifica si una observación dada
es significativamente igual o diferente a una hipótesis nula planteada.

Procedimiento:

Realizaremos una prueba de dos colas (hipótesis alternativa compuesta), en la
cual trataremos de verificar si nuestros coeficientes estimados ( ) | o, son
significativamente diferentes o no a cero, lo cual nos conduce a plantear las siguientes
hipótesis:

0 :
0 :
1
0
=
=
|
|
H
H


¿Por qué cero?. ¿qué implica que aceptemos la hipótesis nula de que el
coeficiente estimado estadísticamente sea igual a cero?. El valor cero denota no-
existencia, si por ejemplo para el modelo:
i i
i u X Y FRM ˆ :
^ ^ ^
+ + = | o aceptamos la
hipótesis de que 0 = | , esto nos indicaría que no importa que valor tome X, ya que al


multiplicarse por cero, este se anularía, es decir, la variable explicativa no tiene una
presencia real en el modelo. En otras palabras no existe relación entre X y Y.

Seguidamente calcularemos un estadístico t:

( ) |
| |
ˆ
ˆ
ee
t
÷
=

donde | es el valor medio de beta estimado, cuyo valor correspondiente es
aquel que hemos definido previamente en la hipótesis nula, que en nuestro caso es
cero, por lo cual en nuestra situación, el estadístico t calculado quedaría de la
siguiente forma:
( ) |
|
ˆ
ˆ
ee
t =

A continuación este estadístico calculado, lo compararemos con el estadístico,
con n-k grados de libertad y un nivel de significancia, determinado en la tabla de la
distribución t.

En el gráfico que se muestra a continuación, podemos ver tres áreas
claramente definidas, una central, o zona de confianza, o llamada también zona de
aceptación de la hipótesis nula, y dos zonas laterales o colas, llamadas zonas críticas,
o zonas de rechazo.

37
Si la t que hemos calculado cae en la zona central, nuestra decisión es aceptar
la hipótesis nula de que el beta es igual a cero, con lo cual nuestra conclusión sería
que el coeficiente beta no es significativamente diferente de cero. Generalmente está
conclusión se expresa en forma resumida de la siguiente forma: el coeficiente no es
significativo.

Igualmente, si el t calculado cae en alguna de las dos colas, nuestra decisión es
rechazar la hipótesis nula y aceptar la hipótesis alternativa, con lo cual nuestra
conclusión sería: el coeficiente beta si es significativamente diferente a cero. O en
forma resumida el coeficiente si es significativo.
95%
2,5%
2,5%
2 / o
t
2 / o
t
0
H
1
H
1
H
% 5 = o

95%
2,5% 2,5%
0
H
1
H
1
H
% 5 = o
0 :
0 :
1
0
=
=
|
|
H
H
2,306 -2,306

Ejemplo:
38
Puntos porcentuales de la distribución t
0,25 0,10 0,05 0,025 0,01 0,005 0,001
0,50 0,20 0,10 0,05 0,02 0,01 0,00
.
.
.
5 0,727 1,476 2,015 2,571 3,365 4,032 5,893
6 0,718 1,440 1,943 2,447 3,143 3,707 5,208
7 0,711 1,415 1,895 2,365 2,998 3,499 4,785
8 0,706 1,397 1,860 2,306 2,896 3,355 4,501
9 0,703 1,383 1,833 2,262 2,821 3,250 4,297
10 0,700 1,372 1,812 2,228 2,764 3,169 4,144
11 0,697 1,363 1,796 2,201 2,718 3,106 4,025
.
.
.
NOTA: La primera columna corresponde a los
grados de libertad, y la primera fila coresponde a
los niveles de significación


Como se puede ver la tabla t nos indica que el estadístico para una prueba de
dos colas, con un 5% de significancia ) 05 , 0 ( = o y 8 grados de libertad ( ) 2 10 ÷ = ÷ k n
es igual a 2,306.

139 , 14
036 , 0
509 , 0
= = t

Como se puede observar la t calculada (14,139) es mayor que la t de la tabla
(2,306), por la tanto cae en la cola de la derecha, por lo cual rechazamos la hipótesis
nula y aceptamos la hipótesis alternativa de que el beta es diferente de cero, con lo
que concluimos que el coeficiente beta es significativamente diferente a cero, o en
forma resumida, el coeficiente es significativo. Lo que nos indica que si existe una
relación entre el gasto de consumo familiar semanal (Y) y el ingreso familiar semanal
(X).

11. PRESENTACION RESUMIDA DE LOS RESULTADOS OBTENIDOS

Una forma muy práctica de presentar los resultados obtenidos, es la siguiente:


i i
X Y 509 , 0 454 , 24
ˆ
+ =
( ) 414 , 6 ( ) 036 , 0
( ) 813 , 3 ( ) 139 , 14
902 , 0
2
= r

donde el primer número entre paréntesis debajo de cada coeficiente, corresponde
al error estándar del coeficiente, y el segundo paréntesis corresponde a la t calculada
de cada coeficiente.


39
APENDICE 1

RESOLUCION DE EJERCICIO MEDIANTE EL PAQUETE Eviews 5.0
17


A continuación realizaremos el ejercicio de la página 36 a través del paquete
econométrico Eviews 5.0 .

Menú principal
Ventana de comandos
Ventana de
Workfile
Ventana de
Objeto activo


En primer lugar definiremos el tipo de la serie a regresar,.. Como se puede
observar la serie es de corte transversal, con 10 observaciones. A tal fin
seleccionamos: FILE / NEW / WORKFILE , con lo cual aparecerá la ventana de
Workfile Range


17
Para una más amplia explicación, se puede consultar: Pulido, Antonio y Ana María López. Predicción
y Simulación Aplicada a la Economía de Empresas. Ediciones Pirámide S.A.. Madrid. 1999.

Carrascal A, Ursicino, Yolanda González G. Y Beatriz Rodríguez P. Análisis Econométrico con Eviews.
RA – MA Editorial. Madrid. 2001
40


A continuación definimos las variables a utilizar, para lo cual escribimos:Data
INGRESO CONSUMO en la Ventana de Comandos y se introducen los datos de la
serie. Los datos también se pueden traer de Excel mediante un COPY/PASTE, o
mediante la opción de menú FILE/IMPORT:




Para activar los datos escribimos: show consumo ingreso.




41






Una vez introducido los datos podemos visualizar en primer lugar el gràfico de los
datos, para tal fin seleccionamos: VIEW/GRAPH/LINE





42



El gráfico nos da un primer acercamiento al tipo de relación existente entre las
variables.

Para realizar la regresión seleccionamos: PROCS / MAKE EQUATION /OK




43



Finalmente nos aparece la salida final con el modelo ya regresado, en el cual se
muestran todos los datos necesarios para nuestro análisis:

- Número de Observaciones: 10
- Variable dependiente : CONSUMO
- Variable explicativa: INGRESO
- Intercepto : C
- Coeficiente Pendiente: 0,509091
- Coeficiente Intercepto: 24,45455
- Error estándar del coeficiente pendiente: 0,035743
- Estadístico T del coeficiente pendiente: 14,24317
- Error estándar del coeficiente intercepto: 6,413817
- Estadístico T del coeficiente intercepto: 3,812791
- Coeficiente de Determinación ( )
2
R : 0,962062

Un valor importante de destacar es el P-valor (Prob), el cual nos indica el mínimo que
debe tener o para que el coeficiente sea significativo. Por ejemplo el P-valor para el
coeficiente de la variable ingreso es 0,0000, lo que nos indica que a cualquier nivel de
o el coeficiente es significativamente diferente a cero. Generalmente diremos que el
coeficiente es significativo si el P-valor es menor o igual que 0,05.

44

CAPITULO III.
SIGNIIFICADO DE LOS COEFICIENTES

1.PENDIENTE DE LA ECUACIÓN (VARIACIÓN MARGINAL)

¿Cuál es el significado económico del coeficiente pendiente?. La pendiente de
una recta está definida como la tangente del ángulo que forma la recta con el eje de
las ordenadas.
X
Y
CO
CA
1
Y
2
Y
1
X
2
X
1 2
1 2
tg
X X
Y Y
CA
CO
m
÷
÷
= = = u
u

Geométricamente la tangente del ángulo está definida como cateto opuesto (CO)
sobre cateto adyacente. En el gráfico podemos observar que ambos catetos son el
resultado de la diferencia entre dos puntos, así
1 2
Y Y CO ÷ = y
1 2
X X CA ÷ =

Cuando restamos dos valores. Lo que estamos obteniendo es la variación
absoluta entre esos dos valores, por ejemplo si el año pasado nuestro sueldo era de
100.000 Bs. Y ahora es de 120.000 Bs. , la variación absoluta en el sueldo (o en este
caso, el aumento) es de 20.000 Bs.

Lo anterior nos indica que la pendiente es simplemente el número de unidades
en que varía la variable dependiente cuando varía en una unidad la variable
independiente. En economía este concepto se conoce como variación marginal. (costo
marginal, producto marginal, ingreso marginal, etc.)



45
X
Y
X X
Y Y
m
A
A
=
÷
÷
=
1 2
1 2


iación var = A

En una función continua como es el caso de los modelos econométricos, la
pendiente de la ecuación viene definida como la primera derivada de la misma.

dX
dY
m =

Si derivamos el modelo clásico u X Y + + = | o tenemos que:

m
dX
dY
= = |

Lo cual significa que en el modelo clásico el coeficiente beta (el que acompaña a
la X) es la pendiente de la ecuación, y el mismo indica el número de unidades en que
varía la variable dependiente, cuando se incrementa en una unidad la variable
explicativa.

En el ejemplo que hemos estado trabajando
I I
X Y 509 , 0 454 , 24
ˆ
+ = podemos
interpretar que por cada unidad monetaria en que se incrementa X, la variable Y se
incrementará (signo positivo) en 0,509 unidades monetarias. Mas específicamente por
cada dólar en que se incremente el ingreso familiar semanal, el gasto de consumo
familiar se incrementará en 0,509 dólares.

2.ELASTICIDAD

La elasticidad de una función es una medida de variación relativa y nos indica el
grado de sensibilidad de una variable dependiente ante cambios en la variable
explicativa. Su fórmula de cálculo resulta de dividir el cambio relativo o porcentual en
la variable dependiente entre el cambio relativo o porcentual en la variable explicativa.

Para una función discreta la elasticidad viene definida por:

1
1
1 2
1 2
1
1 2
1
1 2
.%. var
.%. var
Y
X
X X
Y Y
X
X X
Y
Y Y
X iación
Y iación
E
÷
÷
=
÷
÷
= =
Para una función continua:

46
Y
X
dX
dY
E =

En el cuadro siguiente se indica el significado de los posibles resultados de la
elasticidad


1 < E
La elasticidad es
inelástica
Si
1 = E
La elasticidad es unitaria

1 => E
La elasticidad es
elástica

Donde el símbolo indica valor absoluto.

Una elasticidad inelástica nos indica que el cambio relativo en la variable
dependiente es menos que proporcional al cambio en la variable explicativa. Por
ejemplo si E = - 0,8 nos indicaría que por cada 1% que aumente la variable explicativa,
la variable dependiente disminuirá en 0,8%, como vemos la disminución de Y es
menor que el aumento de X. Es importante tener presente que el signo positivo o
negativo que tenga el valor de la elasticidad solamente nos señala el sentido de la
relación, directa o inversa, respectivamente,

Una elasticidad unitaria nos indica que las dos variables varían en la misma
proporción.

Una elasticidad elástica nos indica que el cambio relativo en la variable
dependiente es más que proporcional al cambio en la variable explicativa. Por ejemplo
si E = 2,5 nos indica que por cada 1% que aumente la variable explicativa, la variable
dependiente aumentará en 2,5%, como vemos la disminución de Y es mayor que el
aumento de X

Existen dos tipos fundamentales de elasticidad, la puntual y la promedio,. La
puntual calcula la elasticidad en un punto específico de la función, y está definida por:

1
1
ˆ
Y
X
x
dX
dY
E =

Y la promedio:

Y
X
x
dX
dY
E =

47
En el caso del modelo clásico, la primera derivada es: | =
dX
dY
, por lo tanto las
fórmulas quedan de la siguiente forma:

Puntual
i
i
Y
X
E
ˆ
ˆ
| = y promedio
Y
X
E |
ˆ
=
Por ejemplo determine: a) la elasticidad ingreso del consumo familiar cuando el
ingreso familiar es de 300$, y b) determine la elasticidad ingreso promedio del
consumo familiar.

a)
i
i
Y
X
E
ˆ
ˆ
| =

( ) 154 . 177 300 509 , 0 454 , 24
ˆ
= + =
i
Y

862 , 0
154 , 177
300
509 , 0 = = E

Cuando el ingreso es de 300$, por cada 1% que aumente el
mismo, el consumo familiar aumentará en 0,862%.

b) 332 , 0
170
111
509 , 0
ˆ
= = =
X
Y
E |

Cuando el ingreso promedio aumenta en 1% el consumo aumenta
en 0,332%


3. MODELO LOGARITMICO



i
u
i i
e X Y
1
0
|
| =

Este modelo es conocido como el modelo de regresión exponencial, el cual
presenta la dificultad de no ser lineal en los parámetros (
1
| , es de por sí un
exponente), por lo tanto no le es posible aplicar el método de los mínimos cuadrados
ordinarios. Para poder hacerlo, tenemos que transformar la ecuación en una lineal, lo
cual haremos aplicando logaritmos.

( )
i
u
i i
e X Y
1
0
ln ln
|
| =

i
u
i i
e X Y ln ln ln ln
1
0
+ + =
|
|
48

e u X Y
i i i
ln ln ln ln
1 0
+ + = | |


i i i
u X Y + + = ln ln ln
1 0
| |

Este modelo es conocido como el modelo de regresión logarítmico. Esta función
es de mucha utilidad por que el coeficiente
1
| es directamente la elasticidad del
modelo, por lo cual también es conocido como modelo de regresión de elasticidad
constante.

Y
X
dX
dY
E =


u
e X Y
1
0
|
| =

X
e X
e X X e X
dX
dY
u
u u
1
1 1
1 0 1
1 0
1
1 0
|
| |
| |
| | | | = = =
÷ ÷


1
0
1 0 1 0
1
1 1
|
|
| | | |
|
| |
= = =
u
u u
e X
X
X
e X
Y
X
X
e X
E

Si u X Y + + = ln ln ln
1 0
| |


E
Y
X
dX
dY
X
dX
Y
dY
X d
Y d
= = = =
1
ln
ln
|


Para determinar la variación marginal:


Y
X
dX
dY
E = =
1
| , despejando
X
Y
dX
dY
1
| =

Por lo tanto para el modelo logarítmico:



49
Elasticidad
1
|
Variación marginal
dX
dY

X
Y
ó
X
Y
1 1
ˆ
| |




. ELASTICIDADES
18


Una empresa fabricante de automóviles desea estimar la demanda de automóviles
(
t
D ) en función del precio de los mismos (
t
P ), para cual dispone de los datos de
ambas variables de la propia empresa en los últimos 120 meses ( ) 120 ,..., 2 , 1 = t .

Con este objetivo se estiman los siguientes modelos:

a)
t t t
u P D + + =
1 0
o o
b)
t t t
u P D + + = ) ln( ) ln(
1 0
| |
c)
t t t
u P D + + =
1 0
) ln( µ µ
d)
t t t
u P D + + = ) ln(
1 0
¸ ¸

i) ¿Cuál es el signo esperado del coeficiente
1
o del primer modelo?.
ii) Interprete matemática, gráfica y económicamente los coeficientes
0
o y
1
o .
iii) Interprete el significado económico de los coeficientes
1
| ,
1
µ y
1
¸ de los modelos
anteriores.
iv) ¿Cómo podemos obtener las elasticidades precio de la demanda de automóviles
en cada modelo a partir de
1
o ,
1
| ,
1
µ y
1
¸ ?.

Respuesta:

i) A primera vista parece lógico pensar que la demanda de automóviles disminuya
conforme aumente su precio. En tal caso el coeficiente
1
o debería tener signo
negativo. ( ) 0
1
< o
ii) En el modelo (a) tenemos que, matemáticamente, el coeficiente
1
o .es la derivada
de la cantidad demandada respecto al precio:


18
Tomado de: Pérez Amara, Teodosio, Pablo Amorós González y Silvia Relloso Pereda. “Ejercicios de
Econometría Empresarial”. Mc Graw Hill, España. 1993. p.1
EJERCICIO Nº 3
50
t
t
dP
dD
=
1
o

que en términos de incrementos puede expresarse como:

t
t
P
D
A
A
=
1
o

por otro lado, en este modelo, la demanda de automóviles en un determinado
momento del tiempo es una función lineal de los precios en ese mismo período, del
tipo:

PRECIO
C
A
N
T
I
D
A
D

D
E
M
A
N
D
A
D
A
PENDIENTE
1
o
TERMINO CONSTANTE
0
o


Donde
1
o es, gráficamente, la pendiente de la recta y
0
o el punto de corte con
el eje de las ordenadas (eje que en este caso indica la cantidad demandada).

Por lo tanto, económicamente,
1
o mide cuantas unidades variará la cantidad
demandada de vehículos cuando el preció se incrementa en una unidad (consumo
marginal). Como ya se comentó en el apartado anterior, es previsible que dicho
coeficiente tenga signo negativo y que, consecuentemente, si el precio sube una
unidad la cantidad demandada de automóviles decrezca
1
o unidades.

En cuanto a
0
o , ayuda a colocar la función de demanda en el eje de las
ordenadas. Sin embargo, en este caso carece de significado económico.



51
iii) La Interpretación económica del coeficiente
1
| del modelo (b) no es tan inmediata.

Efectivamente,
1
| es la derivada del logaritmo de la demanda respecto al
logaritmo de los precios:

t
t
t
t
t
t
t
t
D
P
P
D
P
D
P d
D d
A
A
=
A
A
= =
ln
ln
ln
ln
1
|

Como consecuencia de este resultado, podemos interpretar económicamente
el coeficiente
1
| de la siguiente manera: cuando los precios crecen 1%, la demanda lo
hará en
1
| %. Nótese que esto no es otra cosa que la elasticidad precio de la demanda
de automóviles:

1 .
| =
A
A
=
t
t
t
t
P D
D
P
P
D
E

Por otra parte, el coeficiente
1
µ del modelo (c) es la derivada del logaritmo de la
demanda con respecto al precio (sin logaritmos):

t
t
t
t
P
D
dP
D d
A
A
= =
ln ln
1
µ

Luego, si los precios suben 1 unidad, la demanda aumenta en
1
µ %. Por lo
tanto, podemos expresar
1
µ como:

( )
t t
t
D P
D
.
1
A
A
= µ

que es una semielasticidad.

En cuanto al coeficiente
1
¸ del modelo (d) , puede expresarse como:

t
t
t
t
P
D
P d
dD
ln ln
1
A
A
= = ¸

y por lo tanto:

t
t
t
P
P
D
|
|
.
|

\
|
A
A
=
1
¸


52

Luego si los precios aumentan en 1%, la demanda variará en
1
¸ unidades.

iv) Sabemos que la elasticidad precio de la función de la demanda se define como:

|
|
.
|

\
|
|
|
.
|

\
|
A
A
=
t
t
t
t
P D
D
P
P
D
E
.


Por lo tanto tenemos que:

1) en el modelo (a) :
t
t
P D
D
P
E
1 .
o =
2) en el modelo (b) :
1 .
| =
P D
E
3) en el modelo (c):
t P D
P E
1 .
µ =
4) en el modelo (d):
t
P D
D
E
1
1 .
¸ =

Si tuviésemos que estimar las elasticidades utilizaríamos los valores estimados
para
1
o ,
1
| ,
1
µ y
1
¸ , en su caso los valores promedios muestrales de
t
P y
t
D


El siguiente cuadro incluye el precio y la oferta total de un bien durante un periodo de
10 años

Años 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975
Precio 47 56 59 65 70 71 76 90 92 105
Oferta 150 140 160 170 150 162 185 165 190 185

a) Estime una función lineal de oferta que le permita encontrar la elasticidad
constante de la función.

b) Encuentre la oferta marginal promedio.

c) Pruebe la significancia individual del coeficiente, a un 5% de significancia.


a) Plantearemos un modelo logarítmico, ya que el coeficiente pendiente es la
elasticidad constante de la función.



EJERCICIO Nº 4
53
t t t
u P O + + = ln ln ln
1 0
| |
0
1
> |
t t t
u P O + + = ln
ˆ ˆ
ln ln
1 0
| |


donde O= oferta y P = precio


años O P lnO lnP lnOlnP lnO^2 lnP^2
1966 150 47 5.0106 3.8501 19.2917 25.1065 14.8236
1967 140 56 4.9416 4.0254 19.8918 24.4198 16.2035
1968 160 59 5.0752 4.0775 20.6942 25.7574 16.6263
1969 170 65 5.1358 4.1744 21.4388 26.3764 17.4255
1970 150 70 5.0106 4.2485 21.2877 25.1065 18.0497
1971 162 71 5.0876 4.2627 21.6868 25.8836 18.1704
1972 185 76 5.2204 4.3307 22.6080 27.2521 18.7553
1973 165 90 5.1059 4.4998 22.9758 26.0707 20.2483
1974 190 92 5.2470 4.5218 23.7259 27.5313 20.4466
1975 185 105 5.2204 4.6540 24.2953 27.2521 21.6593
1657 731 51.0552 42.6449 217.8960 260.7564 182.4085


( )
¿
¿
¿
¿
|
.
|

\
|
÷
÷
=
÷
÷
=
÷ ÷ ÷
÷ ÷ ÷ ÷ ÷ ÷
2
2
2 2
1
ln ln
ln ln ln ln
ˆ
P N P
P O N P O
X N X
X Y N YX
t t t t
|


( )( )
( )
3125 , 0
5498 , 0
1718 , 0
2645 , 4 10 4085 , 182
2645 , 4 1055 , 5 10 896 , 217
ˆ
2
1
= =
÷
÷
= |

÷ ÷ ÷ ÷ ÷ ÷
÷ = = ÷ =
t t
P O X Y ln
ˆ
ln
ˆ
ln
ˆ ˆ
1 0 1 0
| | | |

( ) 7728 , 3 2645 , 4 3125 , 0 1055 , 5
ˆ
ln
0
= ÷ = |

t t
P O ln 3125 , 0 7728 , 3 ln
^
+ =


b) 70836 , 0
1 , 73
7 , 165
3125 , 0
ˆ
1
= = = =
P
O
dP
dO
Omg |
54

c)
( )
¿
¿
¿
¿
|
.
|

\
|
÷
÷
=
÷
÷
=
÷ ÷ ÷
÷ ÷ ÷ ÷ ÷ ÷
2
2
1
2 2
1
2
ln ln
ln ln ln ln
ˆ ˆ
t t
t t t t
O N O
P O N P O
Y N Y
X Y N YX
r | |



( )
5748 , 0
0934 , 0
1718 , 0
3125 , 0
1055 , 5 10 7564 , 260
1718 , 0
3125 , 0
2
2
= =
÷
= r

El 57,48% de las variaciones en el logaritmo de la oferta, son explicados
por variaciones en el logaritmo del precio.


( )| | ( ) ( )
(
(
¸
(

¸

|
.
|

\
|
÷ ÷ = ÷ ÷ =
¿ ¿ ¿
÷ ÷ ÷
2
2 2 2 2 2 2
ln ln 1 1 ˆ
t t
O N O r Y N Y r u

( ) 0397 , 0 0934 , 0 5748 , 0 1 ˆ
2
= ÷ =
¿
u

005 , 0
2 10
0397 , 0
ˆ
ˆ
2
2
=
÷
=
÷
=
¿
K N
u
o


( )
( )
2
2
2
2 2
2
1
ln ln
1
ˆ
1
ˆ
ˆ
¿
¿
|
.
|

\
|
÷
=
÷
=
÷ ÷ ÷
t t
P N P
X N X
ee o o |

( ) 095 , 0
5498 , 0
005 , 0
ˆ
1
= = | es


( )
2891 , 3
095 , 0
3125 , 0
ˆ
ˆ
1
1
= = =
|
|
ee
t

55
95%
2,5%
2,5%
0
H
1
H
1
H
% 5 = o
0 :
0 :
1
0
=
=
|
|
H
H
2,306 -2,306


La t calculada es mayor que el valor crítico (3,2891>2,306), por lo tanto
rechazamos la hipótesis nula y aceptamos la alternativa de que el coeficiente es diferente a
cero, con lo cual concluimos que el coeficiente
1
ˆ
| es significativamente diferente a cero, o
simplemente, el coeficiente es significativo.


Los teóricos cuantitavistas o monetaristas sostienen que el ingreso nacional está
fundamentalmente determinado por la cantidad de dinero. Para probar esta hipótesis,
con los datos que se presentan a continuación, estime un modelo que permita
determinar la elasticidad del ingreso nacional con respecto a la oferta monetaria y
compruebe la significancia individual del parámetro pendiente...



















OFERTA
PNB MONETARIA
TRIMESTRE (MMUS$) (MMMUS$)
1972:01 1127,0 237,5
1972:02 1156,7 242,3
1972:03 1181,4 247,4
1972:04 1219,4 252,9
1973:01 1365,0 257,6
1973:02 1287,8 261,7
1973:03 1319,7 265,3
1973:04 1352,7 268,7
1974:01 1370,9 272,7
1974:02 1391,0 276,5
1974:03 1424,4 279,4
1974:04 1441,3 282,2
EJERCICIO Nº 5
56


Respuesta:

Para determinar la elasticidad del ingreso nacional con respecto a la oferta monetaria
estimamos un modelo logarítmico.



t t t
u LNOM LNPNB + + =
1 0
| |
0
1
> |
t t t
u LNOM LNPNB ˆ
ˆ ˆ
1 0
+ + = | |


OFERTA
PNB MONETARIA
TRIMESTRE (MMUS$) (MMMUS$) LNPNB LNOM LNPNB*LNOM
1972:01 1127,0 237,5 7,0273 5,4702 38,4406 29,9227 49,3831
1972:02 1156,7 242,3 7,0533 5,4902 38,7240 30,1420 49,7494
1972:03 1181,4 247,4 7,0745 5,5110 38,9874 30,3712 50,0479
1972:04 1219,4 252,9 7,1061 5,5330 39,3181 30,6140 50,4969
1973:01 1365,0 257,6 7,2189 5,5514 40,0751 30,8181 52,1127
1973:02 1287,8 261,7 7,1607 5,5672 39,8650 30,9937 51,2755
1973:03 1319,7 265,3 7,1852 5,5809 40,0994 31,1460 51,6265
1973:04 1352,7 268,7 7,2099 5,5936 40,3290 31,2883 51,9821
1974:01 1370,9 272,7 7,2232 5,6084 40,5105 31,4538 52,1749
1974:02 1391,0 276,5 7,2378 5,6222 40,6923 31,6093 52,3854
1974:03 1424,4 279,4 7,2615 5,6326 40,9015 31,7267 52,7295
1974:04 1441,3 282,2 7,2733 5,6426 41,0404 31,8391 52,9009
86,0316 66,8033 478,9833 371,9250 616,8648
2
LNOM
2
LNPNB




2
_______
2
_________ ________
2 2
1
.
ˆ
|
.
|

\
|
÷
|
.
|

\
|
|
.
|

\
|
÷
=
÷
÷
=
¿
¿
¿
¿
LNOM LNOM
LNPNB LNOM N LNPNB LNOM
X N X
Y X N XY
|

5669 , 5
12
8033 , 66
________
= = = |
.
|

\
| ¿
N
LNOM
LNOM

1693 , 7
12
0316 , 86
________
= = = |
.
|

\
| ¿
N
LNPNB
LPNB






57
( )( )
( )
4245 , 1
0355 , 0
0506 , 0
5669 , 5 12 925 , 371
1693 , 7 5669 , 5 12 9833 , 478
ˆ
2 1
= =
÷
÷
= |

( )( ) 7609 , 0 5669 , 5 4245 , 1 1693 , 7
ˆ ˆ ˆ
________
1
_________
1 0
÷ = ÷ = |
.
|

\
|
÷ |
.
|

\
|
= ÷ = LNOM LNPNB X Y | | |


t t
LNOM B LNPN 4245 , 1 7609 , 0
ˆ
+ ÷ =

La elasticidad del ingreso nacional con respecto a la oferta de dinero es igual a 1,4245,
por cada 1% que aumente la oferta monetaria el ingreso nacional aumentará en
1,4245%.

A continuación chequearemos la significancia individual de
1
|


2
_________
2
________ ________
1
2 2
1
2
.
ˆ ˆ
¿
¿
¿
¿
|
.
|

\
|
÷
|
.
|

\
|
|
.
|

\
|
÷
=
÷
÷
=
LNPNB N LNPNB
LNPNB LNOM N LNPNB LNOM
Y N Y
Y X N XY
r | |


( )
9242 , 0
0779 , 0
0506 , 0
4245 , 1
1693 , 7 12 8648 , 616
0506 , 0
4245 , 1
2
2
= =
÷
= r



( )| | ( ) 0059 , 0 0779 , 0 9242 , 0 1 2 1 ˆ
2 2 2
= ÷ = ÷ ÷ =
¿ ¿
Y N Y r u



00059 , 0
2 12
0059 , 0
ˆ
ˆ
2
2
=
÷
=
÷
=
¿
K N
u
u
o



( ) 12899 , 0 0166 , 0
0355 , 0
00059 , 0 1
ˆ
ˆ
2 2
2
1
= = =
÷
=
¿
X N X
ee
u
o |
58
95%
2,5%
2,5%
0
H
1
H
1
H
% 5
= o
0 :
0 :
1
0
=
=
|
1
|
1
H
H
2,228 -2,228



( )
0428 , 11
12899 , 0
0 4245 , 1
ˆ
ˆ
1
1 1
=
÷
=
÷
=
|
| |
ee
t




11,0428>2,228, por lo tanto rechazamos la hipótesis nula y aceptamos la alterna de
que 0
1
= | , con lo que concluimos que
1
| es significativamente diferente a cero. Dado
el resultado anterior podemos afirmar que la oferta monetaria explica el
comportamiento del ingreso nacional, medido a través de una variable proxis como es
el PNB.

CHEQUEO DE LOS RESULTADOS EN EVIEWS

DATOS

59


SALIDA EVIEWS




La siguiente tabla da el rendimiento de maíz por acre (Y), resultante del uso de varias
cantidades de fertilizante en libras por acre (X), producidas en una granja en cada uno
de los años 1971 a 1980.

Año 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980
Y 40 44 46 48 52 58 60 68 74 80
X 6 10 12 14 16 18 22 24 26 32


a) Estime una función lineal de rendimiento del maíz.
b) Encuentre la elasticidad promedio del rendimiento del maíz.
c) Determine la bondad de ajuste.
d) Pruebe la significancia individual del coeficiente, a un 5%.

Respuesta:


t t
X Y 6597 , 1 125 , 27 + =
(1,979) (0,101)
(16,38) (1,704)
971049 , 0
2
= R

EJERCICIO Nº 6
60
Recuerde: el primer paréntesis debajo de cada coeficiente, indica el error estándar del
coeficiente, y el segundo paréntesis, indica el valor del estadístico T calculado.

La siguiente tabla da los datos para una muestra aleatoria de 12 parejas sobre el
número de hijos que tienen (Y), y el número de hijos que habían establecido que
querían en el momento del matrimonio.

PAR. 1 2 3 4 5 6 7 8 9 10 11 12
Y 4 3 0 4 4 3 0 4 3 1 3 1
X 3 3 0 2 2 3 0 3 2 1 3 2

a) Estime una función lineal.
b) Determine la bondad de ajuste.
c) Pruebe la significancia individual del coeficiente, a un 5%.
d) Determine el número de hijos que tendría una pareja que estimaba para el
momento de su matrimonio la concepción de 4 hijos. (Puede redondear el
valor).


Respuesta:


i i
X Y 1429 , 1 2143 , 0 + =
(0,567) (0,249)
(0,378) ( 4,581)
) 6772 , 0
2
= R



El siguiente cuadro incluye el precio y la oferta total de un bien durante un período de
10 años.


Años 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975
Precio 47 56 59 65 70 71 76 90 92 105
Oferta 150 140 160 170 150 162 185 165 190 185


a) Estime una función lineal de oferta, que le permita encontrar la elasticidad
constante.
EJERCICIO Nº 7
EJERCCIO Nº 8
61
b) Encuentre la variación margina de la oferta con respecto al precio, cuando el
precio es de 80.
c) Determine la bondad de ajuste.
d) Pruebe la significancia individual del coeficiente, a un 5%.

Respuesta:


t t
PRECIO OFERTA ln 3125 , 0 7728 , 3 ln + =
(0,406) (0,095)
(9,297) (3,289)
5749 , 0
2
= R



La siguiente información se refiere a 10 años sobre los gastos de inversión y la tasa
de interés real:

Año 1 2 3 4 5 6 7 8 9 10
Inv. 656 804 836 765 777 711 755 747 696 787
Tasa 5 4 4,5 5,5 6 6 6 5 7 6,5

a) Compruebe la hipótesis de que la inversión se relaciona inversamente con la
tasa de interés real.
b) Determine la eficacia marginal del capital.
c) Determine la elasticidad promedio de la inversión.
d) Determine la bondad de ajuste.
e) Pruebe la siginificancia individual del coeficiente, a un 5%.

Respuesta:


i i
TASA INV 7087 , 21 8835 , 873 ÷ =
(106,467) (18,947)
(8,208) (-1,145)

140963 , 0
2
= R


Suponga que usted posee la siguiente información acerca del ahorro (S), y el ingreso
nacional (Y), para el período 1965 –1974.

EJRCICIO Nº 9
EJERCICIO Nº 10
62
Años 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974
S 20 25 25 30 33 38 35 45 43 50
Y 100 110 130 140 160 170 170 200 240 250


a) Estime mediante mínimos cuadrados ordinarios la función de ahorro.
b) Encuentre la elasticidad promedio del ahorro.
c) Pruebe la significancia individual del parámetro a un 5%.


Respuesta:


t t
Y S 184 , 0 734 , 3 + =
(3,271) (0,019)
(1,141) (9,756)
9224 , 0
2
= R






























63
CAPITULO IV
1. MODELO DE REGRESION MULTIPLE (2 VARIABLES EXPLICATIVAS)

Cuando hablamos de un modelo de regresión múltiple, nos estamos refiriendo
a un modelo de regresión con más de una variable explicativa.

t nt n t t t t t
u X X X X X Y + + + + + + + = | | | | | | ...
4 4 3 3 2 2 1 1 0


Para facilidad de la explicación en los puntos siguientes nos referiremos al
modelo con dos variables explicativas:

t t t t
u X X Y + + + =
2 2 1 1 0
| | | : FRP

t t t t
u X X Y ˆ
ˆ ˆ ˆ
2 2 1 1 0
+ + + = | | | : FRM

donde los estimadores mínimos cuadráticos son:

( )
¿ ¿ ¿
¿ ¿ ¿ ¿
÷
÷
=
2
2 1
2
2
2
1
2 1 2
2
2 1
1
ˆ
x x x x
x x y x x y x
|

( )
¿ ¿ ¿
¿ ¿ ¿ ¿
÷
÷
=
2
2 1
2
2
2
1
2 1 1
2
1 2
2
ˆ
x x x x
x x y x x y x
|

2 2 1 1 0
ˆ ˆ ˆ
X X Y | | | ÷ ÷ =

donde ( ) X X x
i
÷ = = desvíos de X; ( ) Y Y y
i
÷ = = desvíos de Y

El coeficiente de Determinación ( )
2
R

¿
¿ ¿
+
=
2
2 2 1 1 2
ˆ ˆ
y
y x y x
R
| |

Errores estándar:

( )
( )
¿ ¿ ¿
¿
÷
=
2
2 1
2
2
2
1
2
2 2
1
ˆ
ˆ
x x x x
x
ee o |


64
( )
( )
¿ ¿ ¿
¿
÷
=
2
2 1
2
2
2
1
2
1 2
2
ˆ
ˆ
x x x x
x
ee o |


Equivalencias entre valores en desvío y valores observados:

¿ ¿
÷ = Y X N Y X y x
1 1 1


¿ ¿
÷ = Y X N Y X y x
2 2 2


¿ ¿
÷ =
2 1 2 1 2 1
X X N X X x x

¿ ¿
÷ =
2
1
2
1
2
1
X N X x

¿ ¿
÷ =
2
2
2
2
2
2
X N X x

¿ ¿
÷ =
2 2 2
Y N Y Y

El siguiente cuadro incluye información acerca de la tasa de inflación observada Y(%),
tasa de desempleo
1
X (%) y tasa de inflación esperada
2
X para los Estados Unidos,
en el período 1970-1982.

Año Y
1
X
2
X
1970 5.92 4.9 4.78
1971 4.30 5.9 3.84
1972 3.30 5.6 3.13
1973 6.23 4.9 3.44
1974 10.97 5.6 6.84
1975 9.14 8.5 9.47
1976 5.77 7.7 6.51
1977 6.45 7.1 5.92
1978 7.60 6.1 6.08
1979 11.47 5.8 8.09
1980 13.46 7.1 10.01
1981 10.24 7.6 10.81
1982 5.99 9.7 8.00



a) Estime una función lineal de inflación para los Estados Unidos.
EJERCICIO Nº 11
65

b) Realice al análisis económico y estadístico del modelo. (5% de nivel de
significancia)

a)
t t t t
u X X Y + + + =
2 2 1 1 0
| | |
0
1
< | 0
2
> |
t t t t
u X X Y ˆ
ˆ ˆ ˆ
2 2 1 1 0
+ + + = | | |


Año (Y) (X1) (X2) (X1)Y (X2)Y (X1)(X2) (X1)^2 (X2)^2 Y^2
1970 5.92 4.90 4.78 29.01 28.30 23.42 24.01 22.85 35.05
1971 4.30 5.90 3.84 25.37 16.51 22.66 34.81 14.75 18.49
1972 3.30 5.60 3.13 18.48 10.33 17.53 31.36 9.80 10.89
1973 6.23 4.90 3.44 30.53 21.43 16.86 24.01 11.83 38.81
1974 10.97 5.60 6.84 61.43 75.03 38.30 31.36 46.79 120.34
1975 9.14 8.50 9.47 77.69 86.56 80.50 72.25 89.68 83.54
1976 5.77 7.70 6.51 44.43 37.56 50.13 59.29 42.38 33.29
1977 6.45 7.10 5.92 45.80 38.18 42.03 50.41 35.05 41.60
1978 7.60 6.10 6.08 46.36 46.21 37.09 37.21 36.97 57.76
1979 11.47 5.80 8.09 66.53 92.79 46.92 33.64 65.45 131.56
1980 13.46 7.10 10.10 95.57 135.95 71.71 50.41 102.01 181.17
1981 10.24 7.60 10.81 77.82 110.69 82.16 57.76 116.86 104.86
1982 5.99 9.70 8.00 58.10 47.92 77.60 94.09 64.00 35.88
100.84 86.50 87.01 677.11 747.47 606.90 600.61 658.40 893.25




654 , 6
13
50 , 86
1
1
= = =
¿
N
X
X

693 , 6
13
01 , 87
2
2
= = =
¿
N
X
X

757 , 7
13
84 , 100
= = =
¿
N
Y
Y

( )( ) 114 , 6 757 , 7 654 , 6 13 11 , 677
1 1 1
= ÷ = ÷ =
¿ ¿
Y X N Y X y x



( )( )
¿ ¿
= ÷ = ÷ = 541 , 72 757 , 7 693 , 6 13 47 , 747
2 2 2
Y X N Y X y x
66

( )( ) 942 , 27 693 , 6 654 , 6 13 90 . 606
2 1 2 1 2 1
= ÷ = ÷ =
¿ ¿
X X N X X x x

( )
¿ ¿
= ÷ = ÷ = 026 , 25 654 , 6 13 61 , 600
2 2
1
2
1
2
1
X N X x

( ) 049 , 76 693 , 6 13 40 , 658
2 2
2
2
2
2
2 ¿ ¿
= ÷ = ÷ = X N X x

( ) 026 , 111 757 , 7 13 25 , 893
2 2 2 2
= ÷ = ÷ =
¿ ¿
Y N Y y


( )
¿ ¿ ¿
¿ ¿ ¿ ¿
÷
÷
=
2
2 1
2
2
2
1
2 1 2
2
2 1
1
ˆ
x x x x
x x y x x y x
|


( )( ) ( )( )
( )( ) ( )
392 , 1
477 , 122 . 1
977 . 561 . 1
942 , 27 049 , 76 026 , 25
942 , 27 541 , 72 049 , 76 114 , 6
ˆ
2 1
÷ =
÷
=
÷
÷
= |


( )
¿ ¿ ¿
¿ ¿ ¿ ¿
÷
÷
=
2
2 1
2
2
2
1
2 1 1
2
1 2
2
ˆ
x x x x
x x y x x y x
|


( )( ) ( )( )
( )( ) ( )
465 , 1
477 , 122 . 1
501 , 644 . 1
942 , 27 049 , 76 026 , 25
942 , 27 114 , 6 025 , 25 541 , 72
ˆ
2 2
= =
÷
÷
= |


2 2 1 1 0
ˆ ˆ ˆ
X X Y | | | ÷ ÷ =

( )( ) ( )( ) 214 , 7 693 , 6 465 , 1 654 , 6 392 , 1 757 , 7
ˆ
0
= ÷ ÷ ÷ = |



T T T
X X Y
2 1
465 , 1 392 , 1 214 , 7
ˆ
+ ÷ =




b)
b.1) Análisis económico: Los signos de los coeficientes están acordes con la hipótesis
inicial. Existe una relación inversa entre la tasa de desempleo y la tasa de inflación
observada. Por cada punto porcentual en que se incrementa la tasa de desempleo, la
67
inflación observada disminuirá en 1,392 unidades porcentuales. Existe una relación
directa entre la tasa de inflación esperada y la tasa de inflación observada. Por cada
unidad porcentual en que se incrementa la tasa de inflación esperada, la tasa de
inflación observada se incrementará en 1,465 unidades porcentuales.

b.2) Análisis estadístico:

b.2.1) Coeficiente de determinación ( )
2
R


¿
¿ ¿
+
=
2
2 2 1 1 2
ˆ ˆ
y
y x y x
R
| |


( )( ) ( )( )
881 , 0
026 , 111
762 , 97
026 , 111
541 , 72 465 , 1 114 , 6 392 , 1
2
= =
+ ÷
= R


El 88,10% de las variaciones en la inflación observada son explicadas por el modelo.

b.2.2.) Prueba de significancia individual de los coeficientes pendientes.


( ) ( ) 312 , 13 026 , 111 881 , 0 1 1 ˆ
2 2
= ÷ = ÷ =
¿ ¿
y R u
t



321 , 1
3 13
212 , 13
ˆ
ˆ
2
2
=
÷
=
÷
=
¿
K N
u
o


( )
( )
¿ ¿ ¿
¿
÷
=
2
2 1
2
2
2
1
2
2 2
1
ˆ
ˆ
x x x x
x
ee o |


( ) 299 , 0 089 , 0
477 , 122 . 1
049 , 76
321 , 1
ˆ
1
= = = | ee




( )
( )
¿ ¿ ¿
¿
÷
=
2
2 1
2
2
2
1
2
1 2
2
ˆ
ˆ
x x x x
x
ee o |
68

( ) 172 , 0 029 , 0
477 , 122 . 1
026 , 25
321 , 1
ˆ
2
= = = | ee

95%
2,5%
2,5%
0
H
1
H
1
H
% 5 = o
2,228 -2,228
0 :
0 :
1
0
=
=
i
i
H
H
|
|
2 , 1 = i

( )
656 , 4
299 , 0
392 , 1
299 , 0
0 392 , 1
ˆ
ˆ
1
1 1
1
÷ =
÷
=
÷ ÷
=
÷
=
|
| |
ee
t


como 228 , 2 656 , 4 ÷ < ÷ , entonces
1
t calculado cae en la cola de la izquierda, en la de
significancia, por lo tanto rechazamos la hipótesis nula y aceptamos la alternativa de
que el coeficiente beta es significativamente diferente de cero.


( )
517 , 8
172 , 0
465 , 1
172 , 0
0 465 , 1
ˆ
ˆ
2
2 2
2
= =
÷
=
÷
=
|
| |
ee
t




como 228 , 2 817 , 8 > , entonces
2
t calculado cae en la cola de la izquierda, en la de
significancia, por lo tanto rechazamos la hipótesis nula y aceptamos la alternativa de
que el coeficiente beta es significativamente diferente de cero.

69

Resumen de los resultados obtenidos.


T T T
X X Y
2 1
465 , 1 392 , 1 214 , 7
ˆ
+ ÷ =
(0,229) (0,172)
(-4,656) (8,517) 881 , 0
2
= R




Dado el siguiente modelo:

2 3
ˆ
0, 0636 1, 446 0, 4898
i i i
Y X X = ÷ + ÷
(0,567) (0,271) (0,197)

N = 10

Se pide efectuar los siguientes contrastes de hipótesis con un nivel de
significación 0, 05 o = :

1.
0 1
1 1
: 0
: 0
H
H
|
|
=
=


2.
0 2
1 2
: 1
: 1
H
H
|
|
=
=


3.
0 3
1 3
: 0, 5
: 0, 5
H
H
|
|
= ÷
= ÷


Solución:

En primer lugar obtendremos el estadístico t de la tabla para un 0, 05 o = y
7 (N =10, k = 3) grados de libertad

EJERCICIO Nº 12
70
Puntos porcentuales de la distribución t
0,25 0,10 0,05 0,025 0,01 0,005 0,001
0,50 0,20 0,10 0,05 0,02 0,01 0,00
.
.
.
5 0,727 1,476 2,015 2,571 3,365 4,032 5,893
6 0,718 1,440 1,943 2,447 3,143 3,707 5,208
7 0,711 1,415 1,895 2,365 2,998 3,499 4,785
8 0,706 1,397 1,860 2,306 2,896 3,355 4,501
9 0,703 1,383 1,833 2,262 2,821 3,250 4,297
10 0,700 1,372 1,812 2,228 2,764 3,169 4,144
11 0,697 1,363 1,796 2,201 2,718 3,106 4,025
.
.
.
NOTA: La primera columna corresponde a los
grados de libertad, y la primera fila coresponde a
los niveles de significación



1.
0 1
1 1
: 0
: 0
H
H
|
|
=
=


El estadístico apropiado para efectuar este contraste de hipótesis:

1
1 1 1
1 1 1 1
ˆ ˆ ˆ
0
ˆ ˆ ˆ
t
|
| | |
| | | |
o o o
÷ ÷
= = =

el cual se distribuye con N K ÷ (10-3=7) grados de libertad. El valor del
estadístico es:
1
1
1
ˆ
0, 0636
0,11
ˆ 0, 567
t
|
|
|
o
= = =
Dado que
1
0,025
0,11 (7) 2, 365 t t
|
= < = aceptamos la hipótesis nula
1
( 0) | = y
concluimos que el parámetro no es significativamente diferente a cero al
nivel de significación 0, 05 o = .

2.
0 1
1 1
: 1
: 1
H
H
|
|
=
=

El estadístico de contrastes es:
2
2 2
2 1 2
ˆ ˆ
1
ˆ ˆ
t
|
| |
| | |
o o
÷ ÷
= =
71

el cual se distribuye como una t de Student con N K ÷ (10-3=7) grados de
libertad.
2
2
2
ˆ
1 1, 446 1
1, 65
ˆ 0, 271
t
|
|
|
o
÷ ÷
= = =
Dado que la distribución es la misma que en l caso anterior, el valor crítico
seguirá siendo el mismo
0,025
( (7) 2, 365) t = y, dado que:
1, 65 2, 365 t = <
aceptamos la hipótesis nula de que
2
| =0, y concluimos que el parámetro
no es significativamente diferente a 1 a un 0, 05 o =

3.
0 3
1 3
: 0, 5
: 0, 5
H
H
|
|
= ÷
= ÷

En este caso el estadístico adecuado es:
2
3 3
3 3 3
ˆ ˆ
0, 5 0, 4898 0, 5
5, 02
ˆ ˆ 0,197
t
|
| |
| | |
o o
÷ ÷ ÷
= = = = ÷
Dado que la distribución sigue siendo la misma que en los casos
anteriores, el valor crítico sigue siendo el mismo Por lo tanto, como:

5, 02 2, 365 t = >

rechazamos la hipótesis nula y aceptamos la alterna de que
3
0, 5 | = ÷ , por
lo tanto concluimos que el coeficiente es significativamente diferente a -
0,5 a un 0, 05 o =



72
2. PRUEBA F (SIGNIFICANCIA GLOBAL DE LOS COEFICIENTES)

Adicionalmente a la prueba de significancia individual, es necesario realizar la
prueba de significancia global, a través de la prueba F, la cual nos permite chequear si
los coeficientes en su conjunto son significativamente iguales o no a una hipótesis nula
determinada. Como en el caso de la significancia individual, la hipótesis que se plantea
es que los coeficientes son iguale a cero: 0
2 1
= = | |

La metodología a aplicar es similar a la utilizada en la prueba T, se calculará un
estadístico F:


( )
( ) ( ) K N R
K R
F
÷ ÷
÷
=
/ 1
1 /
2
2



el cual ser comparará con el estadístico F que nos indique la tabla de la distribución F





95%
5 %
0
H
1
H
% 5 = o
0 :
0 :
2 1 1
2 1 0
= =
= =
| |
| |
H
H
F




73
Si la F calculada es menor que la F que indica la tabla, esta caerá en la región
central, o zona de aceptación de la hipótesis nula, con lo cual, la conclusión sería que
los coeficientes globalmente no son significativamente iguales a cero.

Si la F calculada e mayor que la F de la tabla, esta caerá en la cola de la
derecha o zona de rechazo, o zona de significancia, con lo que la conclusión sería que
los coeficientes globalmente si son significativamente iguales a cero.

Es importante indicar que la T calculada siempre será un valor positivo.

Ejemplo:

95%
5 %
0
H
1
H
% 5 = o
0 :
0 :
2 1 1
2 1 0
= =
= =
| |
| |
H
H
4,10



Para el ejercicio anterior:



( )
( ) ( )
71 , 36
012 , 0
441 , 0
3 13 / 881 , 0 1
1 3 / 881 , 0
= =
÷ ÷
÷
= F


74
Puntos porcentuales de la distribución F
( ti ió )
g. de l
para el
denominador
(N-K) Pr 1 2 3 4
.
.
.
0.25 1.49 1.60 1.60 1.59
10 0.10 3.29 2.92 2.73 2.61
0.05 4.96 4.10 3.71 3.48
0.01
0
10.00 7.56 6.55 5.99
0.25 1.47 1.58 1.58 1.57
11 0.10 3.23 2.86 2.66 2.54
0.05 4.84 3.98 3.59 3.36
0.01 9.65 7.21 6.22 5.67
.
.
.
g. de l. para el numerador (K-1)



Como 10 . 4 71 , 36 > entonces rechazamos la hipótesis nula y aceptamos la alternativa
de que los coeficientes son diferentes a cero, por lo que se concluye que los
coeficientes globalmente si son significativamente diferentes a cero.

Es importante resaltar que existe una relación directa entre el coeficiente de
determinación y el estadístico F calculado, mientras mas alto es
2
R , más alto es F, por
ejemplo si en el ejercicio anterior 1
2
= R , indicando un ajuste perfecto, el estadístico F
sería:

( )
( ) ( )
· = =
÷ ÷
÷
=
0
5 , 0
3 13 / 1 1
1 3 / 1
F

Es decir cuando · =
÷
F
lim
R 1
2




Un investigador estimó una función de COBB-DOUGLAS para el sector agrícola de
Taiwan durante 1958-192, obteniendo los siguientes resultados.


i i i
K L Y ln 4899 , 0 ln 4988 , 1 3384 , 3 ln
^
+ + ÷ =
(2,449) (0,239) (0,102)
T= (-1,363) (6,268) (4,801)
8705 , 0
2
= R
g de l = 12
EJERCICIO Nº 13
75

donde Y= producción; L= factor productivo trabajo y K= factor productivo capital.

Se requiere que analice desde el punto de vista económico y estadístico los resultados
obtenidos

NOTA: El modelo de COBB-DOUGLAS es un modelo de producción en forma
logarítmica que relaciona la producción de un bien con los factores productivos, trabajo
y capital.

Análisis económico:

Primeramente analizaremos los signos de los pendientes, los dos signos son positivos,
lo cual concuerda con la teoría, existe una relación directa entre el uso de los factores
productivos y la producción de un bien.

Como es un modelo logarítmico, los coeficientes pendientes, nos indican las
elasticidades del modelo. El coeficiente 1,4988, representa la elasticidad de la
producción con respecto al factor productivo trabajo, y nos indica que por cada 1% que
aumenta el factor trabajo, la producción aumentará en 1,4988%, un aumento mas que
proporcional. (elástico). El coeficiente 0,4899, representa la elasticidad de la
producción con respecto al factor productivo capital, y nos indica que por cada 1% que
aumenta el factor trabajo, la producción aumentará en 0,4899%, un aumento menos
que proporcional. (inelástico).

Análisis estadístico:

El coeficiente de determinación o bondad de ajuste ( ) 8705 , 0
2
= R nos indica que
el 87,05% de las variaciones en el logaritmo de la producción, son explicadas por el
modelo.

Significancia individual:

268 , 6
1
= t
801 , 4
2
= t
g de l = 12

76
95%
2,5%
2,5%
0
H
1
H
1
H
% 5 = o
2,179 -2,179
0 :
0 :
1
0
=
=
i
i
H
H
|
|
2 , 1 = i

179 , 2 268 , 6 > y 179 , 2 801 , 4 > . En ambos casos la T calculada cae en la cola, es decir
en la zona de significancia o zona de rechazo. Por lo tanto rechazamos la hipótesis
nula y aceptamos la alternativa de que los coeficientes son diferentes a cero.
Finalmente concluimos que ambos coeficientes pendientes si son significativamente
diferente a cero.

Significancia global.

Puntos porcentuales de la distribución F (continuación…)
g. de l
para el
denominador
(N-K) Pr 1 2 3 4 5 6 7
.
.
.
0.25 1.46 1.56 1.56 1.55 1.54 1.53 1.52
12 0.10 3.18 2.81 2.61 2.48 2.39 2.33 2.28
0.05 4.75 3.89 3.49 3.26 3.11 3.00 2.91
0.01 9.33 6.93 5.95 5.41 5.06 4.82 4.64
0.25 1.45 1.55 1.55 1.53 1.52 1.51 1.50
13 0.10 3.14 2.76 2.56 2.43 2.35 2.28 2.23
0.05 4.67 3.81 3.41 3.18 3.03 2.92 2.83
0.01 9.07 6.70 5.74 5.21 4.86 4.62 4.44
.
.
.
g. de l. para el numerador (K-1)


77
95%
5 %
0
H
1
H
% 5 = o
0 :
0 :
2 1 1
2 1 0
= =
= =
| |
| |
H
H
3,89




( )
( ) ( )
( )
( ) ( )
545 , 39
011 , 0
435 , 0
3 15 / 8705 , 0 1
1 3 / 8705 , 0
/ 1
1 /
2
2
= =
÷ ÷
÷
=
÷ ÷
÷
=
K N R
K R
F


Como 89 , 3 545 , 39 > , rechazamos la hipótesis nula y aceptamos la alternativa de que
los coeficientes son diferentes a cero, por lo cual concluimos que los coeficientes,
globalmente si son significativamente diferente a cero.
La compañía petrolífera Campsol
19
desea elaborar un modelo de regresión lineal
trimestral para explicar las ventas totales de gasolina en una gasolinera (
t
G ) en una
función de la renta total de su área (
t
Y ), un índice de precios de gasolina (
t
P ), el
número total de vehículos matriculados en su área (
t
M ) y un índice de cubicaje de los
automóviles de su área (
t
CU ). Para ello dispone de los datos trimestrales observados
durante el período 1980 – 1985 que se muestran a continuación:


19
Ejercicio tomado de Pérez Amaral, Teodosio. Ob.cit. p.18
EJERCICIO Nº 14
78
TRIMESTRE
1980:01 61,26 738,40 2,73 68,56 1,93
1980:02 73,41 737,70 1,76 68,86 1,87
1980:03 75,09 732,10 1,76 68,96 1,77
1980:04 70,75 737,70 2,02 68,88 1,82
1981:01 70,39 750,10 2,06 69,22 1,69
1981:02 73,82 759,60 1,90 69,54 1,84
1981:03 74,45 779,01 2,02 69,65 1,70
1981:04 67,46 789,20 2,41 70,23 1,73
1982:01 67,76 798,40 2,55 70,48 1,73
1982:02 65,47 805,50 2,73 70,62 1,70
1982:03 66,80 808,01 2,56 71,08 1,61
1982:04 65,12 811,01 2,88 71,41 1,49
1983:01 67,09 826,70 2,81 71,46 1,29
1983:02 64,03 839,70 3,05 71,66 1,17
1983:03 63,14 848,60 3,26 72,17 1,01
1983:04 63,15 864,20 3,49 72,36 0,92
1984:01 64,81 873,70 3,35 72,57 0,81
1984:02 64,68 880,90 3,35 72,97 0,77
1984:03 64,58 886,70 3,53 73,16 0,67
1984:04 64,18 906,70 3,67 73,77 0,62
1985:01 64,12 919,70 3,82 74,13 0,56
1985:02 64,37 934,01 3,79 74,56 0,51
1985:03 65,38 956,70 3,91 74,96 0,46
1985:04 62,74 975,40 4,42 75,71 0,44
t
G
t
P
t
Y
t
M
t
CU


a) Utilizando el prograna Eviews estime un modelo de regresión lineal para la venta
de gasolinas.


t t t t t
u CU M P Y G + + + + + =
4 3 2 1 0
| | | | |



b) Estime un modelo de regresión lineal para la venta de gasolinas que permita
determinar la elasticidad constante del modelo.


t
u
t t t t o t
e CU M P Y G
4 3 2 1
| | | |
| =



RESPUESTA:

a)

79






b)


80



A continuación se presentan algunos modelos ya regresados, Para todos se requiere
que se analice: a) desde un punto de vista económico y b) estadísticamente.

1)
t t t
K L Q ln 188 , 0 ln 76 , 0 50 , 0 ln + + =
(0,7073) (0,1386)
9688 , 0
2
= R
N =15

Donde Q= producción, L= trabajo y K = capital





2)
t t t t
L Y I Md 367 , 0 530 , 0 261 , 0 003 , 0 + + ÷ =
(0,009) (0,112) (0,101) (0,102)
8953 . 0
2
= R ; N= 20

donde Md = Oferta monetaria; I= tasa de interés; Y = ingreso nacional; L= tenencia de
activos líquidos.


3)
i i i
I Y S 004 . 0 125 . 0 256 + + ÷ =
(0,044) (0.001)
853 , 0
2
= R
N=12
F=26.11

S= ahorro; Y = ingreso disponible; I = tasa de interés












EJERCICIO Nº 15
81
CAPITULO V
MODELO DE REGRESION LINEAL CON k VARIABLES EXPLICATIVAS
El modelo de regresión múltiple lineal se puede expresar en forma matricial de la
siguiente forma:
u Xβ Y + =

donde


|
|
|
|
|
|
|
|
.
|

\
|
=
|
|
|
|
|
|
|
|
.
|

\
|
=
|
|
|
|
|
|
|
|
.
|

\
|
=
|
|
|
|
|
|
|
|
.
|

\
|
=
n N KN N N
K
K
N
u
u
u
X X X
X X X
X X X
Y
Y
Y
.
.
.
.
.
.
... 1
. ... . .
. ... . .
.. ... . . .
... 1
... 1
.
.
.
2
1
2
1
3 2
2 32 22
1 31 21
2
1
u β X Y
|
|
|



Lo que nos indica que Y es un vector columna ( ) 1 x n cuyos elementos son las
observaciones de la variable dependiente; X es una matriz k x n con la primera
columna de unos (cuando en el modelo se especifica un intercepto) y las otras
columnas con las observaciones de cada una de las variables explicativas (tantas
columnas como X tenga el modelo); β es un vector columna ( ) 1 x k cuyos elementos
son los coeficientes o parámetros del modelo y u es un vector columna ( ) 1 x n cuyos
elementos son los términos de perturbación.

1.SUPUESTOS

1.1 Forma funcional lineal de la relación:


u Xβ Y + =



Debemos recordar que dentro del contexto de la regresión, la linealidad hace
referencia a la manera que los parámetros y la perturbación entran a formar parte de la
ecuación y no necesariamente a la relación entre las variables.



82
1.2. Rango Completo


X es una matriz k x n con rango k

Significa que X tiene rango de columna
20
completo; las columnas son linealmente
independientes (supuesto de no multicolinealidad), y hay al menos k observaciones. Si
el número de observaciones es menor que k, entonces X no puede tener un rango
completo. Por lo tanto se supone que n es al menos del mismo tamaño que k.

1.3. El valor esperado
21
de la perturbación aleatoria debe ser cero para cualquier
observación

.
( ) 0 = X
i
u E


( )
( )
( )
( )
0
1
.
.
.
|
|
|
2
1
=
(
(
(
(
(
(
(
(
¸
(

¸

=
X
X
X
X u
i
u E
u E
u E
E


La parte izquierda de la ecuación afirma, que la media de cada término de
perturbación condicionada a todas las observaciones X, es cero.

Que la media condicionada sea cero, implica que la media no condicionada también
sea cero:

( ) ( ) 0 ) 0 ( ) | ( = = = E X u E E u E
i i


20
El rango columna de una matriz es la dimensión del vector espacio generado por las columnas de la
matriz que sean linealmente independientes.
21
Denotando con x un vector columna de T variables aleatorias:
1 2
( )
T
x X X X ' = 
Cada una de estas variables aleatorias tiene un valor esperado que se denota:
( ), 1, 2,...,
i
E X i T µ = =
Entonces, el vector de esperanzas matemáticas de x se expresa como:
1 1
2 2
( )
( )
( )
T T
E X
E X
E X
µ
µ
µ
µ
| | | |
| |
| |
= =
| |
| |
\ . \ .
 

83


Este supuesto conlleva a que:

a) la ( ) o COV = u X,
22

b) ( ) ( ) ( ) Xβ u Xβ u Xβ X Y = + = + = E E E |






22
Las varianzas y las covarianzas de las variables aleatorias
1 2
, ,...,
t
X X X , se definen como:
2
( ) ( ) , 1, 2,..,
i i i
Var X E X i T µ ( = ÷ =
¸ ¸

( , ) ( )( ) , ; , 1, 2,..., .
i j i i j j
Cov X X E X X i j i j T µ µ ( = ÷ ÷ ¬ = =
¸ ¸

entonce, si se define el vector x - μ y se escribe la eperanza matemática de este vector multiplicado por
su transpueto, esto e:
| |
E ' (x - μ)(x - μ)
se obtiene
| | ( )
1
1
1
2 2
1 2 2
( )
( )
( )( ) ( ) ( ) ( )
( )
T
T
T
T
X
X
E x x E X X X
X
µ
µ
µ µ µ µ µ
µ
÷ ( | |
( |
÷
( |
' ÷ ÷ = ÷ ÷ ÷ =
( |
( |
|
÷
(
\ . ¸ ¸



| |
| | | |
| |
1
2
2
1 1 1
2
2 2 1 1 2 2 2
2
1 1
( ) ( )( )
( )( ) ( ) ( )( )
( )( ) ( )
T
T T
T T
T T T
X E x x
E x x X E x x
E x x X
µ µ µ
µ µ µ µ µ
µ µ µ
| | ÷ ÷ ÷
|
÷ ÷ ÷ ÷ ÷
|
=
|
|
|
÷ ÷ ÷
\ .
 

   
 


puede observarse cómo en esta expresión los elementos de la diagonal principal incluyen las varianzas
de las variables
i
X , mientras que el resto de los elementos incluyen las covarianzas. En concreto, el
elemento ( , ) i i contendrá la varianza de
i
X mientras qu el elemento ( , ) i j contendrá la covarianza
entre
i
X y
j
X .

A esta matriz se le denomina matriz de varianzas y covarianzas del vector x , y se denota como V(x)
o Σ:
| |
' V(x) = E (x - μ)(x - μ) = Σ
La matriz de varianza y covarianzas (Σ) tiene dos propiedades importantes:
- Es simétrica
- Es semidefinida positiva; mas aún, Σ es definida positiva si y solo si los elementos de
x son variable aleatorias no linealmente dependientes (Trívez Bielsa, 2004)
84
1.4. Varianzas y Covarianzas de las perturbaciones (Perturbaciones esféricas)


n i para u Var
i
,..., 1 ) | (
2
= = o X
(supuesto de Homocedasticidad)

( ) j i para u u Cov
j i
= = 0 | , X
(Supuesto de no correlación serial en las perturbaciones)

Estos supuestos implican que:

( ) ( ) I X u u u
2
| o = ' = E Var



( )
|
|
|
|
|
|
|
|
.
|

\
|
=
|
|
|
|
|
|
|
|
.
|

\
|
=
i i i i
i
i
i
i
u u u u u u
u u u u u u
u u u u u u
E u u u
u
u
u
E
...
. . .
. . .
. . .
...
...
...
.
.
.
2 1
2 2 2 1 2
1 2 1 1 1
2 1
2
1





I
2 2
2
2
1 ... 0 0
. ... . .
. ... . .
. ... . .
0 ... 1 0
0 ... 0 1
... 0 0
. ... . .
. ... . .
. ... . .
0 ... 0
0 ... 0
o o
o
o
o
=
|
|
|
|
|
|
|
|
.
|

\
|
=
|
|
|
|
|
|
|
|
.
|

\
|
=


El supuesto de que
( ) I u
2
o = Var
lleva implícito dos supuestos:
85

a) Los elementos fuera de la diagonal de la matriz son iguales a cero. Estos
elementos son las covarianzas entre los términos de perturbación
correspondientes a observaciones diferentes. Al afirmar que estas
covarianzas son iguales a cero, estamos suponiendo que los términos de
perturbación no están correlacionados entre si.
b) La matriz es escalar, es decir, la diagonal principal es constante y está
conformada por las varianzas de los términos de perturbación de las
distintas observaciones. en otras palabras, estamos suponiendo que la
varianza del término de perturbación es constante, ya sea a lo largo del
tiempo o a través de la sección cruzada.

1.5. X es una matriz conocida de n x k de constantes

Al afirmar que X es una matriz conocida de n x k de constantes, estamos diciendo que
las observaciones
i
x que conforman la matriz X son fijas en muestras repetidas, es
decir, si se tuviera la oportunidad de obtener mas de una muestra, los valores de las
variables explicativas deben ser las mismas para todas las muestras..

1.6. Supuesto de normalidad.

Las perturbaciones están normalmente distribuidas, con media cero y varianza
constante.

X |
i
u ~ ( ) I
2
, 0 o N

Resumiendo, los supuestos del modelo clásico son:

Notación escalar Notación matricial
1.- ( ) i todo para u E
i
0 = 1.- 0 ) ( = u E donde u y 0 son vectores n x
1, siendo 0 un vector nulo.
2.-
( )
( )
2 2
0
o =
= =
i
j i
u E
j i u u E

2.- ( ) I uu E
2 ´
o = donde I es una matriz
identidad n x n
3.- X
1
, X
2
, …,X
n
son fijas o no explicativas 3.- Rango Completo. La matriz X, n x k, es
no estocástica, es decir, consiste en un
conjunto de números fijos
4.- No hay relación lineal exacta entre las
variables X, es decir, no hay
multicolinealidad.
El rango de X es K, donde k es el número
de columnas en X y k es menor que el
número de observaciones.
5.- Para la prueba de hipótesis

i
u ~ ( )
2
, 0 o N
5.- EL vector u tiene una distribución
normal multivariada, es decir
u ~ ( ) I N
2
, 0 o



86
2. ESTIMACION DE LOS COEFICIENTES DE MINIMO CUADRADOS ORDINARIOS

Dado el modelo
u Xβ Y + =
el problema consiste minimizar la suma de los
cuadrados de los residuos, es decir minimizar
( )
ˆ
'
¿ ¿
n n
2
2
i i
i=1 i=1
u = Y- X β = u u

( )
¿
=
= + + + =
|
|
|
|
|
|
|
|
.
|

\
|
=
n
i
i n
n
i
u u u u
u
u
u
u u u
1
2 2 2
2
2
1
2
1
2 1
...
.
.
.
... u u
´



si Y Y u
i i
ˆ
÷ = y β X Y
ˆ ˆ
= , tenemos que:

( ) ( ) ( ) ( ) Xβ Y β X Y Y Y Y Y u u
' '
´
÷ ÷ = ÷ ÷ =
ˆ ˆ ˆ


( )( ) β X X β Y X B β X Y Y Y β X Y X β Y u u
' ' ' ' ' ' ' ' ' '
ˆ ˆ ˆ ˆ ˆ ˆ
+ ÷ ÷ = ÷ ÷ = ¬

El segundo y el tercer término son iguales puesto que β X Y
'
ˆ
es de orden 1 x 1 y
Y X β
' '
ˆ
es su traspuesta
23
.

β X X β β X 2Y Y Y u u
' ' ' ' '
ˆ ˆ ˆ
+ ÷ = ¬

Para minimizar una función de varias variables, en este caso u u
'
función de
k
| | |
ˆ
,...
ˆ
,
ˆ
2 1
, la condición de primer orden es que las derivadas parciales sean iguales a
cero. En forma matricial:

0 β X 2X Y 2X
β
u u
' '
'
= + ÷ =
c
c
ˆ
ˆ


Y X β X X
' '
= ¬
ˆ


multiplicando por la inversa de X X
'



23
( )
'
ˆ ˆ
Y X β β X Y
' ' '
=
87
( ) ( ) Y
'
1
' '
1
'
X X X β X X X X
÷ ÷
=
ˆ


Ya que ( ) ( ) ( ) identidad matriz = =
÷
I X X X X
'
1
'


( ) Y X X X β
'
1
'
÷
= ¬
ˆ


Como se puede observar, para hallar los estimadores mínimo cuadráticos es
necesario hallar la inversa de la matriz X X
'
, esta matriz cuadrada de orden k debe ser
no singular
24
, o sea su rango debe ser k. Para que se cumpla esta condición, el rango
de la matriz X debe ser k. Al ser k el número de columnas de la matriz X, para que su
rango sea k deben darse dos condiciones: en primer lugar, el número de filas de la
matriz no puede ser menor que el número de columnas ( ) k n > , sin embargo para
nosotros la condición es más restrictiva ( ) k n > .En segundo lugar las columnas deben
ser linealmente independientes (supuesto de no multicolinealidad perfecta). Si el
número de filas es menor que el número de columnas o si existiese alguna
combinación lineal entre las columnas de X, su rango sería menor que k, puesto que el
rango de una matriz es igual al número de filas o columnas linealmente
independientes. Recordando que las columnas de X son los valores de las variables
explicativas, se justifica el supuesto de que no exista relación lineal exacta entre
ellas
25
.
DEFINICION: el vector de residuales mínimo cuadrados esta definido por:

ˆ
e = y - Xβ

PROPOSICION: ( ) 0 E = e

ˆ ˆ
E(e) = E(y - Xβ´) = E(y) - E(Xβ´) = Xβ - Xβ = 0


PROPOSICION: ' X e = 0

ˆ ˆ
' ' ' ' Xe = X(y - Xβ) = Xy - XXβ

( )
ˆ
(
' ' ' ' ' '
¸ ¸
-1
X e = X(y - Xβ) = X y - X X XX Xy

como ( )
' '
-1
XX XX = I , tenemos que: ' ' ' Xe = Xy - Xy = 0



24
Se dice que una matriz es no singular cuando es una matriz cuadrada que tiene inversa
25
López Casuso, Rafael. “Cálculo de Probabilidades e Inferencia Estadística, con Tópicos de
Econometría”. Universidad Católica Andrés Bello. Caracas. 2000. P.518.
88


3. PROPIEDADES MELI DE LOS ESTRIMADORES MINIMO CUADRATICOS

3.1. INSESGAMIENTO.

( ) β β E =
ˆ


( ) Y X X X β
'
1
'
÷
=
ˆ


como u Xβ Y + =

( ) ( ) u Xβ X X X β
'
1
'
+ = ¬
÷
ˆ


( ) ( ) u X X X Xβ X X X β
'
1
' '
1
'
÷ ÷
+ = ¬
ˆ


dado que ( ) I X X X X
'
1
'
=
÷



( ) u X X X β β
'
1
'
÷
+ = ¬
ˆ


tomando valor esperado en ambos miembros de la igualdad

( ) ( ) ( ) u X X X β E β E
'
1
'
÷
+ =
ˆ


( ) ( ) ( ) ( ) u X X X E β E β E
'
1
'
÷
+ = ¬
ˆ


( ) ( ) ( ) u E X X X β β E
'
1
'
÷
+ = ¬
ˆ



como ( ) 0 u E =

nos queda que

( ) β β E =
ˆ


3.2 MINIMA VARIANZA

Para demostrar que los estimadores mínimos cuadráticos son de mínima varianza, hay
que calcular la varianza de los estimadores, expresándola en términos de la matriz de
covarianzas.
89

Por definición:

( ) ( ) ( )( ) |
.
|

\
|
÷ ÷ = ÷ =
' 2
β β β β E β β E β Var
ˆ ˆ ˆ ˆ


como se vio anteriormente ( ) u X X X β β
'
1
'
÷
+ =
ˆ
( ) u X X X β β
'
1
'
÷
= ÷ ¬
ˆ


( ) ( ) ( ) ( )
1
' ' '
1
'
X X X uu X X X E β Var
÷ ÷
= ¬
ˆ


Dado que la traspuesta de un producto es el producto de las traspuestas con el orden
cambiado y además ( )
1
'
X X
÷
es una matriz simétrica.

( ) ( ) ( ) ( ) = =
÷ ÷ 1
' ' '
1
'
X X X uu E X X X β Var
ˆ


Utilizando el supuesto 1,4, que indica que ( ) I uu E
' 2
o =

( ) ( ) ( )
1
' '
1
'
X X IX X X X β Var
÷ ÷
=
2
ˆ
o

( ) ( )
1
´'
X X β Var
÷
= ¬
2
ˆ
o





( )
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
|
|
|
|
|
|
|
|
.
|

\
|
= ¬
k k k
k
k
Var Cov Cov
Cov Var Cov
Cov Cov Var
| | | | |
| | | | |
| | | | |
ˆ
...
ˆ
,
ˆ ˆ
,
ˆ
. ... . .
. ... . .
. ... . .
ˆ
,
ˆ
...
ˆ ˆ
,
ˆ
ˆ
,
ˆ
...
ˆ
,
ˆ ˆ
ˆ
2 1
2 2 1 2
1 2 1 1
β Var



es decir la ( ) β Var
ˆ
es un matriz en la cual la diagonal principal está conformada por las
Varianzas de los coeficientes estimados y los elementos distintos a la diagonal
principal, son las covarianzas.

A continuación se demostrará que cualquier otro estimador insesgado de β tiene una
mayor varianza que β
ˆ
.
90

En efecto, consideremos otro estimador lineal de β , digamos ( ) | |Y C X X X β
'
1
' *
+ =
÷
ˆ
,
siendo C una matriz de constantes y u Xβ Y + =

( ) | |( ) u Xβ C X X X β
'
1
' *
+ + =
÷
ˆ


( ) ( ) Cu CXβ u X X X Xβ X X X β
'
1
' '
1
' *
+ + + =
÷ ÷
ˆ


( ) Cu u X X X CXβ β β
'
1
' *
+ + + = ¬
÷
ˆ


Para que
*
ˆ
β sea un estimador insesgado de β , se debe cumplir que, ( ) β β E
*
=
ˆ


( ) Cu) u X X X CXβ E(β ) β E(
'
1
' *
+ + + = ¬
÷
ˆ


( ) CE(u) E(u) X X X CXβ β ) β E(
'
1
' *
+ + + = ¬
÷
ˆ


CXβ β ) β E(
*
+ = ¬
ˆ


¬para que ( ) β β E
*
=
ˆ
, 0 CX = ¬


( ) Cu u X X X β β
'
1
' *
+ + = ¬
÷
ˆ


( ) Cu u X X X β β
'
1
' *
+ = ÷ ¬
÷
ˆ


Calcularemos ahora la matriz de varianzas y covarianzas de
*
β
ˆ


( ) ( )( ) |
.
|

\
|
÷ ÷ =
'
* * *
β β β β E β Var
ˆ ˆ ˆ


( ) ( ) ( ) ( ) ( )
|
.
|

\
|
+ + = ¬
÷ ÷
'
'
1
' '
1
' *
Cu u X X X Cu u X X X E β Var
ˆ


( ) ( ) ( ) ( ) ( ) ( )
' ´'
1
' ' '
1
' *
C u X X X u Cu u X X X E β Var + + = ¬
÷ ÷
ˆ


( ) ( ) ( ) ( ) ( ) ( )
' '
1
' ' ' ' '
1
'
1
' ' '
1
' *
C Cuu X X X Cuu C uu X X X X X X uu X X X E β Var + + + = ¬
÷ ÷ ÷ ÷
ˆ


( ) ( ) ( ) ( ) ( ) ( )
'
1
' '
1
'
1
' '
1
' *
IC C X X IX C IC X X X X X IX X X X E β Var
2 2 2 ' 2
ˆ
o o o o + + + = ¬
÷ ÷ ÷ ÷


91
( ) ( ) ( ) ( ) ( ) ( )
|
.
|

\
|
+ + + = ¬
÷ ÷ ÷ ÷
' 2 2 2 2
ˆ
CC X X CX X X CX X X X X X X E β Var
1
'
´'
1
'
1
' '
1
' *
o o o o

dado que ( ) ( ) I X X X X
'
1
'
=
÷
y 0 CX =

( ) ( )
'
1
' *
CC X X β Var
2 2
ˆ
o o + = ¬
÷


( ) ( )
' *
CC β Var β Var
2
ˆ ˆ
o + = ¬

La matriz
'
CC es semidefinida positiva y con eso ( )
*
β Var
ˆ
es por lo menos igual o mas
grande que ( ) β Var
ˆ
. Por lo tanto podemos afirmar que en el modelo clásico de
regresión lineal, el estimador de mínimos cuadrados β
ˆ
es el estimador lineal de
mínima varianza de β



4. ESTIMADOR DE LA VARIANZA DE LAS PERTURBACIONES (
2
o )

Por ser
2
o una medida de las desviaciones de los términos de perturbación con
respecto a su media cero
26
, parecería lógico que un estimador de
2
o se base en los
residuos del modelo, puesto que estos pueden considerarse como representativos de
los términos de perturbación.

Un estimador insesgado de
2
o es:

k n ÷
=
u u
'
ˆ ˆ
ˆ
2
o



en efecto se tiene

β X Y u
ˆ
ˆ ÷ =
si, u Xβ Y + = , y ( ) Y X X X β
'
1
'
÷
=
ˆ


( ) ( ) u Xβ X X X X u Xβ u
'
1
'
+ ÷ + = ¬
÷
ˆ

( ) ( ) u X X X X Xβ X X X X u Xβ u
'
1
' '
1
'
÷ ÷
÷ ÷ + = ¬ ˆ


26
López Casuso, Rafael. Ob.Cit. p.528.
92
( ) u X X X X Xβ u Xβ u
'
1
'
÷
÷ ÷ + = ¬ ˆ

( ) u X X X X u u
'
1
'
÷
÷ = ¬ ˆ

( ) ( ) Μu u X X X X I u
'
1
'
= ÷ = ¬
÷
ˆ

siendo ( ) ( ) X X X X I Μ
1
'
÷
÷ = , entonces la suma del cuadrado de los residuos es:

Μu u Μu Μ u u u
' ' ' '
= =

puesto que Μes una matriz simétrica e idempotente
27



tomando valores esperados:

( ) ( ) Μu u E u u E
' '
= ˆ ˆ

( ) trΜ u u E
' 2
ˆ ˆ o = , traza = tr
28



( ) ( ) | |
'
1
' ' '
X X X X I tr u u E
÷
÷ = ¬
2
ˆ ˆ o

( ) ( ) | |
'
1
' '
n
'
X X X trX trI u u E
÷
÷ = ¬
2
ˆ ˆ o

( ) ( )( ) | |
1
' ' ' '
n
'
X X X X tr trI u u E
÷
÷ = ¬
2
ˆ ˆ o

( ) | | ( ) k n trI trI u u E
k n
'
÷ = ÷ = ¬
2 2
ˆ ˆ o o

luego

( ) ( )
( )
2
2
2
ˆ ˆ
) ˆ ( o
o
o =
÷
÷
=
÷
=
k n
k n
k n
E
u u E
'







27
Una matriz simétrica es una matriz cuadrada | |
nxm
ij
a = A en que
ji ij
a a = para todo j i = .
Se dice que una matriz cuadrada A es idempotente si A
2
= AA = A
28
La traza de una matriz cuadrada es la suma de los elementos de la diagonal.
93
5. COEFICIENTE DE DETERMINACIÓN

Como se vio anteriormente el coeficiente de determinación nos indica el
porcentaje de variaciones de la variable dependiente que son explicados por el
modelo. A medida que el porcentaje es mayor, nos indica en que medida el modelo
se ajusta a los datos, motivo por el cual a este estadístico también se le conoce con el
nombre de BONDAD DE AJUSTE.

Sea:
STC = suma total de cuadrados = ( )
2 ´'
2
ˆ
Y n Y Y Y Y
i
÷ = ÷
¿

SCR = suma de cuadrados debida a la regresión (o explicada) =
( )
2 '
2
ˆ
Y Y Y Y Y
I
÷ = ÷
¿

SEC = suma de los errores al cuadrado = ( ) u u u Y Y
I I I
ˆ ˆ ˆ
ˆ
' 2
2
= = ÷
¿ ¿


Entonces.

STC = SEC+ SCR

Para medir la capacidad de explicación de la ecuación de regresión requerimos
una medida que indique toda la variación en
i
Y que la regresión puede explicar. Una
medida tal es:



STC
SEC
STC
SEC STC
STC
SCR
R ÷ =
÷
= = 1
2


2
2
ˆ ˆ
1
Y n
R
÷
÷ =
Y Y
u u
'
'





6. EL CASO PARTICULAR DE REGRESIÓN SIMPLE
29


En el caso del modelo de regresión simple:

i i i
u x y + + =
2 1
| |


29
Pulido San Román, Anonio y Julián Pérez García. “Modelos Econométricos”. Ediciones
Pirámide.Madrid. 2001. p.182.
94
Procederemos como si fuera un caso particular de la regresión múltiple donde como
ya se ha visto ( ) Y X X X β ' ' =
÷1
ˆ
, donde 2 = k

|
|
.
|

\
|
=
|
|
|
|
|
|
.
|

\
|
|
|
.
|

\
|
= '
¿ ¿
¿
2
1
1
. .
. .
. .
1
. . .
i i
i
n
n
x x
x n
X
X
X
1
X
1 . . . 1
X X

Dado que es una matriz simétrica, coincidirá con su transpuesta y calculando la matriz
conjugada y dividiendo por el valor de la determinante:



( ) ( )
¿ ¿ ¿
÷ = ÷ = '
2
2
2
x x n x x n
i i i
X X

Obtenemos:
( )
( )
( )
(
(
¸
(

¸

÷
÷
÷
=
'
'
= '
¿
¿ ¿
¿
÷
n x
x x
x x n
i
i i
i
2
2
*
1
1
X X
X X
X X
Por su parte

(
¸
(

¸

=
|
|
|
|
|
|
.
|

\
|
|
|
.
|

\
|
= '
¿
¿
i i
i
n
n
y x
y
y
y
x x
.
.
.
. . .
1 . . . 1
1
1
Y X

Resultando

( )
( )
=
(
(
¸
(

¸

(
(
¸
(

¸

÷
÷
÷
= ' ' =
¿
¿
¿
¿ ¿
¿
÷
y x
y
n x
x x
x x n
i
i
i
i i
i
2
2
1
1
ˆ
Y X X X β



( )
( )
(
¸
(

¸

=
|
|
|
|
|
.
|

\
|
÷
÷
÷
÷
=
¿
¿ ¿ ¿
¿
¿ ¿ ¿ ¿
2
1
2
2
2
ˆ
ˆ
|
|
x x n
y x y x n
x x n
y x x y x
i
i i i i
i
i i i i i


95




Un país
30
, que tiene que importar todo el petróleo que consume, está interesado en
realizar una política de construcción de viviendas tal que reduzca el consumo de
petróleo destinado a la calefacción. Se tienen datos referidos a los últimos siete años
de las siguientes variables: consumo anual de petróleo en miles de bidones (Y),
temperatura promedio en invierno, en grados centígrados (X
1
), y cantidades de
aislamiento exigidas en las paredes, en pulgadas (X
2
).

Consumo
Petróleo Temperatura Aislamiento
216 12 6
200 12 8
230 10 6
240 7 8
203 11 4
190 11 3
200 10 7


se pide estimar una ecuación lineal de consumo, el coeficiente de determinación,
pruebas T y F.


u β X Y + =
ˆ



|
|
|
|
.
|

\
|
|
|
|
|
|
|
|
|
|
.
|

\
|
=
|
|
|
|
|
|
|
|
|
.
|

\
|
3
2
1
ˆ
ˆ
ˆ
7 10 1
3 11 1
4 11 1
8 7 1
6 10 1
8 12 1
6 12 1
200
190
203
240
230
200
216
|
|
|




30
Ejercicio tomado de: Martin, Guillermina; José María Labeaga y Francisco Mochón. Ob.Cit. p. 91
EJERCICIO Nº 16
96
|
|
|
.
|

\
|
=
|
|
|
|
|
|
|
|
|
.
|

\
|
|
|
|
.
|

\
|
=
274 431 42
431 779 73
42 73 7
7 10 1
3 11 1
4 11 1
8 7 1
6 10 1
8 12 1
6 12 1
7 3 4 8 6 8 6
10 11 11 7 10 12 12
1 1 1 1 1 1 1
X X
'



( )
|
|
|
.
|

\
|
÷
÷
÷ ÷
=
÷
05 , 0 02 , 0 53 , 0
02 , 0 06 , 0 80 , 0
53 , 0 80 , 0 61 , 11
1
X X
'


|
|
|
.
|

\
|
=
|
|
|
|
|
|
|
|
|
.
|

\
|
|
|
|
.
|

\
|
=
978 . 8
295 . 15
479 . 1
200
190
203
240
230
200
216
7 3 4 8 6 8 6
10 11 11 7 10 12 12
1 1 1 1 1 1 1
Y X
'


( )
|
|
|
|
.
|

\
|
=
|
|
|
.
|

\
|
÷ =
|
|
|
.
|

\
|
|
|
|
.
|

\
|
÷
÷ ÷ ÷
÷ ÷
=
÷
3
2
1
ˆ
ˆ
ˆ
76 , 2
18 , 6
21 , 259
978 . 8
295 . 15
479 . 1
05 , 0 02 , 0 53 , 0
02 , 0 06 , 0 80 , 0
53 , 0 80 , 0 61 , 11
|
|
|
Y X X X
'
1
'


216 201,57 14,43
200 207,09 -7,09
230 213,94 16,06
240 238,01 1,99
203 202,23 0,77
190 199,47 -9,47
200 216,70 -16,70
Y Y
ˆ
u
ˆ

97
( ) 61 , 889
70 , 16
47 , 9
77 , 0
99 , 1
06 , 16
09 , 7
43 , 14
70 , 16 47 , 9 77 , 0 99 , 1 06 , 16 09 , 7 43 , 14
ˆ ˆ
=
|
|
|
|
|
|
|
|
|
.
|

\
|
÷
÷
÷
÷ ÷ ÷ = u u
'


( ) 465 . 314
200
190
203
240
230
200
216
200 190 203 240 230 200 216 =
|
|
|
|
|
|
|
|
|
.
|

\
|
= Y Y
'



29 , 211
7
200 190 203 240 230 200 216
=
|
.
|

\
| + + + + + +
=
|
|
.
|

\
|
=
¿
n
Y
Y
i



( )
5492 , 0
29 , 211 7 465 . 314
61 . 889
1
ˆ ˆ
1
2 2
2
=
÷
÷ =
÷
÷ =
Y n
R
Y Y
u u
'
'



40 , 222
3 7
61 , 889
ˆ ˆ
2
=
÷
=
÷
=
k n
u u
'
o




( ) ( )
|
|
|
.
|

\
|
÷
÷
÷ ÷
=
|
|
|
.
|

\
|
÷
÷
÷ ÷
= =
÷
56 , 11 57 , 4 03 , 117
57 , 4 36 , 14 18 , 177
03 , 117 18 , 177 63 , 581 . 2
05 , 0 02 , 0 53 , 0
02 , 0 06 , 0 80 , 0
53 , 0 80 , 0 61 , 11
40 , 222
ˆ
1
2
X X β
'
o Var


( ) ( ) ( ) 56 , 11
ˆ
; 36 , 14
ˆ
; 63 , 581 . 2
ˆ
3 2 1
= = = ¬ | | | Var Var Var

98
si )
ˆ
( )
ˆ
( | | Var ee =

( ) ( ) ( ) 40 , 3
ˆ
; 79 , 3
ˆ
; 81 , 50
ˆ
3 2 1
= = = ¬ | | | ee ee ee

si
0 :
0 :
1
0
=
=
|
|
H
H


( ) |
|
ˆ
ˆ
ee
t =

812 , 0
40 , 3
76 , 2
; 632 , 1
79 , 3
18 , 6
; 102 , 5
81 , 50
21 , 259
3 2 1
= = ÷ =
÷
= = = ¬ t t t

( )
( )
437 , 2
3 7
5492 , 0 1
1 3
5492 , 0
1
1
2
2
=
÷
÷
÷
=
÷
÷
÷
=
k n
R
k
R
F

Resultados
i
Y
ˆ
=259,21 - 6,18 X
1
+ 2,76 X
2
(50,81) (3,79) (3,40)
(5,102) (-1,632) (0,812)
R
2
= 0,5492
F = 2,437


Comprobación de resultados mediante Eviews



99



Durante el período 1986-1996, la evolución de la producción
31
, Q, capital invertido, K,
y el nivel de empleo, L, en el sector agrario del país Z ha sido recogida en la tabla
siguiente:


p y p g p
capital invertido y nivel de empleo en el sector agrario del paíz Z
durante el período 1986-1996
Produccion Capital Empleo
Año Q K L
1986 80 200 50
1987 95 210 55
1988 100 240 80
1989 120 150 86
1990 150 260 90
1991 165 230 95
1992 180 245 96
1993 175 250 98
1994 170 295 100
1995 190 300 110
1996 195 300 115


Bajo el supuesto de que la relación entre el nivel de producción, capital y empleo
puede expresarse adecuadamente mediante una función de Cobb-Douglas.

t
u
t t t
e L K Q
3 2
1
| |
| =
1996 ,..., 1986 = ¬t

se pide estimar una ecuación de producción tipo Coob-Douglas, el coeficiente de
determinación, pruebas T y F.

Dado que el modelo propuesto no satisface la hipótesis de linealidad se comprobará si
es susceptible de linealización, con objeto de utilizar la técnica de mínimos cuadrados.
La función de producción de Coob-Douglas, se puede expresar en términos
logarítmicos como:

t t t t
u LnL LnK Ln LnQ + + + =
3 2 1
| | |
1996 ,..., 1986 = ¬t

La transformación logarítmica realizada se encuadra en el apartado de modelos doble
logarítmicos o modelos log-log. Suponiendo que el término aleatorio satisface los

31
Ejercicio tomado de: Díaz Fernández, Montserrat y María del Mar Llorente Marrón. Ob.Cit. p.133.
EJERCICIO Nº 17
100
supuestos básicos establecidos en el modelo de regresión, la transformación
propuesta será susceptible de estimación por el método de mínimos cuadrados.

Tomando logaritmos neperianos de las observaciones de las variables consideras
tendremos:

Año LnQ LnK LnL
1986 4,3820 5,2983 3,9120
1987 4,5539 5,3471 4,0073
1988 4,6052 5,4806 4,3820
1989 4,7875 5,0106 4,4543
1990 5,0106 5,5607 4,4998
1991 5,1059 5,4381 4,5539
1992 5,1930 5,5013 4,5643
1993 5,1648 5,5215 4,5850
1994 5,1358 5,6870 4,6052
1995 5,2470 5,7038 4,7005
1996 5,2730 5,7038 4,7449





|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|
=
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|
= ¬
7449 , 4 7038 , 5 1
7005 , 4 7038 , 5 1
6052 , 4 6870 , 5 1
5850 , 4 5215 , 5 1
5643 , 4 5013 , 5 1
5539 , 4 4381 , 5 1
4998 , 4 5607 , 5 1
4543 , 4 0106 , 5 1
3820 , 4 4806 , 5 1
0073 , 4 3471 , 5 1
9120 , 3 2983 , 5 1
2730 , 5
2470 , 5
1358 , 5
1648 , 5
1930 , 5
1059 , 5
0106 , 5
7875 , 4
6052 , 4
5539 , 4
3820 , 4
X Y


( ) ( )
|
|
|
.
|

\
|
÷ ÷
÷ ÷
÷ ÷
=
|
|
|
.
|

\
|
=
÷
1186 , 2 5802 , 1 7839 , 0
5802 , 1 5352 , 3 3237 , 12
7839 , 0 3237 , 12 0869 , 71
0638 , 219 7660 , 268 0093 , 49
7660 , 268 4598 , 330 2527 , 60
0093 , 49 2527 , 60 11
1
X X X X
' '

101

( )
|
|
|
|
.
|

\
|
=
|
|
|
.
|

\
| ÷
=
|
|
|
.
|

\
|
=
÷
3
2
1
ˆ
ˆ
ˆ
9823 , 0
2607 , 0
8541 , 0
4130 , 243
7202 , 298
4587 , 54
|
|
|
Y X X X Y X
'
1
' '

4,3820 4,3703 0,0117
4,5539 4,4766 0,0772
4,6052 4,8795 -0,2744
4,7875 4,8280 -0,0405
5,0106 5,0161 -0,0055
5,1059 5,0373 0,0687
5,1930 5,0640 0,1289
5,1648 5,0895 0,0753
5,1358 5,1525 -0,0167
5,2470 5,2505 -0,0035
5,2730 5,2942 -0,0212
u
ˆ
t
Q n Lˆ
t
LnQ



9508 , 4 5988 , 270 1108 , 0 ˆ ˆ
' '
= = = =
¿
n
Y
Y Y Y u u

( )
8875 , 0
9508 , 4 11 5988 , 270
1108 , 0
1
2
2
=
÷
÷ = R


0139 , 0
3 11
1108 , 0
2
=
÷
= o

|
|
|
.
|

\
|
÷ ÷
÷ ÷
÷ ÷
=
|
|
|
.
|

\
|
÷ ÷
÷ ÷
÷ ÷
=
0293 , 0 0219 , 0 0109 , 0
0219 , 0 0490 , 0 1707 , 0
0109 , 0 1707 , 0 9846 , 0
1186 , 2 5802 , 1 7839 , 0
5802 , 1 5352 , 3 3237 , 12
7839 , 0 3237 , 12 0868 , 71
0139 , 0 )
ˆ
(| Var

( )
|
|
|
.
|

\
|
= =
1713 , 0
2213 , 0
9923 , 0
ˆ
)
ˆ
( | | Var ee

102
735 , 5
1713 , 0
9823 , 0
; 178 , 1
2213 , 0
2607 , 0
; 861 , 0
9923 , 0
8541 , 0
3 2 1
= = = = ÷ =
÷
= t t t

( )
560 , 31
3 11
8875 , 0 1
1 3
8875 , 0
=
÷
÷
÷
F

Resultados generales

LnQ
t
= -0,8541 + 0,2607 LnK
t
+ 0,9823 LnL
t

(0,9923) (0,2213) (0,1713)
(-0,861) (1,178) (5,735)
R
2
= 0,8875
F = 31,560

Comprobación de resultados mediante Eviews













103
7. ESTIMADOR MAXIMO VEROSIMIL

Una forma alternativa de calcular los estimadores beta, es calculando los estimadores
máximo verosimiles
32
, es decir aquellos que son más probables dada la distribución de
los datos muestrales y su implicación sobre la función de densidad conjunta. Para ello
admiimos por el mmomento la hipótesis de nomalidad del término de perturbación.

X | u
i
~ ( ) I σ 0, N
2


Por lo que la función de densidad conjunta, normal multivariante será
33
:

( ) ( )
|
.
|

\
|
' ÷ =
÷
÷
u u

1
exp σ (2π2 u f
2
n/2
2 n/2


Y la función logaritmica de verosimilitud para los valores muestrales , expresando ya u
en función d e y, es decir β
ˆ
X y u ÷ = y denominando β
~
al vector de estimadores
máximo verosímiles.

( ) ( ) β
~
X y β
~
X y

1
lnσ
2
n
ln2π
2
n
L
2
2
÷
'
÷ ÷ ÷ ÷ =

El máximo de esta función respecto a β
~
coincide con el mínimo del tercer sumando,
que es el único que depende de β
~
, pero esta última es precisamente la expresióna
minimizar por el criterio de mínimos cuadrados.

Igualando a cero las derivadas con respecto a β
~
y
2
o , se tiene:

( ) | | 0 β
~
X y X 2

1
β
LnL
= ÷ ' ÷ ÷ =
c
c



32
El método de estimación de máximo verosimilitud se basa en un determinado supuesto acerca de la
muestra de distribución de donde se obtuvo la muestra. La función de máximo verosimilitud es la
función de probabilidad conjunta de la muestra; cuando esta es aleatoria simple, las distintas
observaciones muestrales son independientes entre si y la función de verosimilitud es el producto de los
valores de la función de densidad para cada una de las observaciones.
33
La función de densidad para una normal n-variante tal que
u ~
( ) | | Ω , u E N es:
( ) ( ) ( ) | | ( ) | |
)
`
¹
¹
´
¦
(
¸
(

¸

÷
'
÷ =
÷ ÷
u E u Ω u E - u
2
1
exp Ω 2π u f
1
1/2
n/2

Donde en este caso en particular:
( ) ( ) I
σ
1
Ω 0; u E ; σ Ω
2
1
n
2
= = =
÷


104
( ) ( ) 0 β
~
X y β
~
X y

1

n
σ
LnL
4 2 2
= ÷
'
÷ + ÷ =
c
c


Luego

( ) y X X X β
~
1
' ' =
÷


( ) ( )
n
u u
n
β
~
X y β
~
X y
σ
2
'
=
÷
'
÷
=

Bajo el supuetso de normalidad del término de perturbación, el estimador de máxima
verosimilitud del vector β coincide con el estimador MCO

































105

APENDICE 2
ELEMENTOS BASICOS DE MATRICES

1.- CONCEPTO DE MATRIZ

Se llama “matriz” a un conjunto ordenado de números, variables, funciones, etc.,
dispuestos en m filas y n colummas..

Las lineas horizontales reciben el nombre de filas u las lineas vericales se llaman
columnas. El número de filas puede ser menor, igual o mayor al número de columnas.

|
|
|
|
|
|
.
|

\
|
=
mn m m
n
n
m x m
a a a
a a a
a a a
...
. ... . .
. ... . .
...
...
2 1
2 22 21
1 12 11
A


2.- MATRIZ CUADRADA

Una matriz cuadrada es una matriz que consta del mismo número de filas y columnas
( ) n m = . Al referirse al orden de una matriz cuadrada de orden ( ) n n, , se dice
simplemente que es una matriz cuadrada de orden n .

|
|
.
|

\
|
=
22 21
12 11
s s
s s
S es una matriz cuadrada de orden 2


3.- MATRIZ RECTENGULAR

Es una matriz en que el número de filas, es distinto al número de columnas ( ) m n = .
Todas las matrices que no son cuadradas,son matrices rectangulares.



4.- DIAGONAL PRINCIPAL

En una matriz A ( )
ij
a = , la diagonal principal es el conjunto de elementos
ij
a , tales
que j i = .
106
|
|
|
.
|

\
|
=
0 10 8
5 8 2
5 3 1
A
Diagonal
principal


5.- MATRIZ TRIANGULAR SUPERIOR

Es una matriz en que todos los elementos bajo la diagonal principal son nulos


|
|
|
.
|

\
|
=
6 0 0
5 8 0
5 3 1
A


6.- MATRIZ TRIANGULAR INFERIOR

Es una matriz en que todos los elementos sobre la diagonal principal son nulos

|
|
|
.
|

\
|
=
7 10 8
0 8 2
0 0 1
A


7.- MATRIZ DIAGONAL

Es una matriz cuadrada en que los elementos no diagonales son todos nulos.

|
|
|
.
|

\
|
÷
=
3 0 0
0 0 0
0 0 2
H

8.- MATRIZ ESCALAR

Es una matriz diagonal en la que todos los elementos diagonales son iguales



|
|
|
|
|
.
|

\
|
=
ì
ì
ì
ì
0 0 0
0 0 0
0 0 0
0 0 0
K
107

9.- MATRIZ IDENTIDAD (O UNIDAD)

Es una matriz en que todos los elementos diagonales son iguales a la unidad. Se
simbolizan con
n
I , en que n indica el orden matricial, o simplemente con I .

|
|
|
.
|

\
|
=
1 0 0
0 1 0
0 0 1
3
I


10.- MATRIZ SIMETRICA

Es una matriz cuadrada A=( )
nxn
ij
a en que
ji ij
a a = para todo i, j,

|
|
|
.
|

\
|
÷
÷ =
4 3 1
3 3 2
1 2 1
N

N es una matriz simétrica, ya que cumple que 2
21 12
= = n n ; 1
31 13
= = n n ; 3
32 23
÷ = = n n

11.- VECTOR FILA

Es una matriz formada por una fila, su orden es ( ) n , 1 .

( ) 1 2 0
13
= T

12.- VECTOR COLUMNA

Es una matriz formada por una sola columna. Su orden es ( ) 1 , m







|
|
|
|
|
.
|

\
|
÷
÷
=
87 , 6
05 , 2
67 , 4
33 , 5
41
Y
108

13.- VECTOR NULO

Es un vector (fila o columna) cuyos componentes son todos ceros.

( )
|
|
|
.
|

\
|
= =
0
0
0
0 0 0 0 Y X


14.- MATRIZ NULA

Es una matriz en que todos sus elementos son nulos

|
|
|
.
|

\
|
=
0 0
0 0
0 0
32
O

15. EL RANGO DE UNA MATRIZ

Sea una matriz A de orden mxn que tiene n vectores columnas, cada uno con m
componentes. El mayor número de esos vectores columna de A que forman un
conjunto de vectores linealmente independientes se llama rango de A y se denota
r(A).

16. MATRICES TRASPUESTAS

Cuando se intercambian las filas por las columnas de una matriz A, de forma que su
primera fila pasa a ser su primera columna, y viceversa, obtendremos la traspuesta de
A, que se denota por
'
A o
T
A . En el caso de una matriz cuadrada nxn , esta posee
una traspuesta de la misma dimensión.

Dado
|
|
.
|

\
|
=
4 0 1
9 8 3
A
|
|
|
.
|

\
|
=
4 9
0 8
1 3
'
A


Propiedades de las traspuestas

a) ( ) A A
'
'
= , la traspuesta de la traspuesta es la matriz original.

109
b) ( )
' ' '
B A B A + = + , la traspuesta de una suma, es igual a la suma de las
traspuestas.

c) ( )
' ' '
A B AB = , la traspuesta de un producto es igual al producto de las
traspuestas en orden inverso.


17. SUMA DE MATRICES

Sean las matrices A = ) (
ij
a y B = ) (
ij
b ambas de orden mxn . Se denomina suma de A
y B, y se denota A + B, a la matriz de orden mxn , cuyo elemento genérico es
ij ij
b a + .

A + B = ) (
ij ij
b a +

Ejemplo:

Sean las matrices:

|
|
|
.
|

\
|
÷ =
|
|
|
.
|

\
|
÷
÷
=
1 1 1 0
4 0 1 3
2 1 0 0
1 9 8 7
3 0 1 4
0 2 3 2
B A


|
|
|
.
|

\
|
÷
÷
=
|
|
|
.
|

\
|
+ ÷ + + +
÷ + + +
+ + ÷ + +
= +
0 10 9 7
1 0 2 7
2 1 3 2
1 1 1 9 1 8 0 7
4 3 0 0 1 1 3 4
2 0 1 2 0 3 0 2
B A


Propiedades:

a) A + B = B + A

b) (A + B) + C = A + (B + C)

c) A + 0 = A


18. MULTIPLICACION DE UN ESCALAR POR UNA MATRIZ

Sean la matriz A = ) (
ij
a de orden mxn , y el escalara o . Se denomina producto de
o por A, y se denota mediante o A, a la matriz de orden mxn :

110
) (
1 j
a A o o =

Ejemplo:

Sea el escalar 3 = o y la matriz
|
|
|
.
|

\
|
÷ ÷
÷ =
2 10 5
1 2 0
3 4 1
A , entonces el producto de o por A:

|
|
|
.
|

\
|
÷ ÷
÷ =
|
|
|
.
|

\
|
÷ ÷
÷ =
|
|
|
.
|

\
|
÷ ÷
÷ =
6 30 15
3 6 0
9 12 3
) 2 ( 3 10 3 ) 5 ( 3
1 3 ) 2 ( 3 0 3
3 3 4 3 1 3
2 10 5
1 2 0
3 4 1
3
x
x x
x x x
A o

Propiedades:

d) o (A + B) = o A + o B

e) ( ) o o + A = o A +o A


19.- MULTIPLICACION DE MATRICES

19.1.- Vector fila por vector columna

Sean el vector fila X=( )
n
x x x x ..., , , ,
3 2 1
de orden ) , 1 ( n , y el vector columna


|
|
|
|
|
|
|
|
.
|

\
|
=
n
y
y
y
.
.
.
2
1
Y

de orden ) 1 , (n



El producto XY se obtiene multiplicando cada componente del vector X por la
componente correspondiente del vector Y, y sumando los productos parciales así
obtenidos. Esto es:

111
( ) ( )
¿
=
= + + + =
|
|
|
|
|
|
|
|
.
|

\
|
=
n
i
i i n n
n
n
y x y x y x y x
y
y
y
x x x
1
2 2 1 1
2
1
2 1
...
.
.
.
... X.Y


Comentarios:

a) Para que el producto XY pueda efectuarse, se requiere que los dos vectores
sean conformables. Esto es, ambos deben estar formados por el mismo
número de elementos. En este caso, el orden del vector fila X es ) , 1 ( n y del
vector columna Y es , por lo que el requisito se satisface.
b) El resultado del producto XY es un número real (un escalar) y no un vector.
El orden del producto es (1,1), esto es tantas filas como el vector X y tantas
columnas como el vector Y.

Ejemplo:

Sean los vectores ( ) 4 3 2 1 = X y
|
|
|
|
|
.
|

\
|
÷
=
1
2
1
4
Y

( ) 12 4 6 2 4 ) 1 ( 4 ) 2 ( 3 ) 1 ( 2 ) 4 ( 1
1
2
1
4
4 3 2 1 = + + ÷ = + + ÷ + =
|
|
|
|
|
.
|

\
|
÷
= XY



19.2.- Matriz por vector columna

Dadas la matriz A= ) (
ij
a de orden ) , ( n m y el vector columna Y de orden ) 1 , (n , el
producto AY se obtiene considerando la matriz A ) , ( n m , como integrada por un
conjunto de m vectores fila (de n elementos cada uno), y multiplicando cada uno de
ellos por el vector columna Y.

Sea la matriz A de orden ) , ( n m , y el vector Y de orden ) 1 , (n :
112

|
|
|
|
|
|
.
|

\
|
=
|
|
|
|
|
|
.
|

\
|
=
n mn m m
n
n
y
y
y
a a a
a a a
a a a
.
.
...
. ... . .
. ... . .
...
...
2
1
2 1
2 22 21
1 12 11
Y A

El producto AY se obtiene así:

|
|
|
|
|
|
|
|
|
|
.
|

\
|
=
|
|
|
|
|
|
.
|

\
|
|
|
|
|
|
|
.
|

\
|
=
¿
¿
¿
=
=
=
n
j
j mj
n
j
j j
n
j
j j
n mn m m
n
n
y a
y a
y a
y
y
y
a a a
a a a
a a a
1
1
2
1
1
2
1
2 1
2 22 21
1 12 11
.
.
.
.
...
. ... . .
. ... . .
...
...
AY


Comentarios:

a) Para que el producto AY pueda efectuarse, se requiere que ambos factores
sean conformables. Esto es que el número de columnas de la matriz A sea
igual al número de filas del vector Y. En este caso el orden de la matriz es
) , ( n m y el vector es ) 1 , (n , por lo que el requisito se satisface.
b) El orden del producto AY es ) 1 , (n , esto es un vector columna con tantas
filas como la matriz A y tantas columnas como el vector Y.

Ejemplo:

Sean:

|
|
|
|
|
.
|

\
|
÷
=
|
|
|
.
|

\
|
÷
=
1
2
1
4
0 2 1 3
1 1 0 2
0 1 2 1
Y A

Para efectuar el producto AY, supondremos que la matriz A está formada por los
siguientes vectores filas de orden (1,4):

113
( )
( )
( ) 0 2 1 3
1 1 0 2
0 1 2 1
3
2
1
÷ =
=
=
a
a
a


Multiplicamos cada vector fila de la matriz A por el vector columna Y, es decir que
multiplicamos los componentes correspondientes y sumamos los productos parciales,
como sigue:

( )
( )
( ) 17 ) 1 ( 0 ) 2 ( 2 ) 1 )( 1 ( ) 4 ( 3
1
2
1
4
0 2 1 3
11 ) 1 ( 1 ) 2 ( 1 ) 1 ( 0 ) 4 ( 2
1
2
1
4
1 1 0 2
4 ) 1 ( 0 ) 2 ( 1 ) 1 ( 2 ) 4 ( 1
1
2
1
4
0 1 2 1
3
2
1
= + + ÷ ÷ + =
|
|
|
|
|
.
|

\
|
÷
÷ =
= + + ÷ + =
|
|
|
|
|
.
|

\
|
÷
=
= + + ÷ + =
|
|
|
|
|
.
|

\
|
÷
=
Y
Y
Y
a
a
a


|
|
|
.
|

\
|
=
|
|
|
|
|
.
|

\
|
÷
|
|
|
.
|

\
|
÷
= ¬
17
11
4
1
2
1
4
0 2 1 3
1 1 0 2
0 1 2 1
AY



19.3.- Vector fila por Matriz

a) Para que el producto pueda efectuarse, se requiere que ambos factores
sean conformables. Esto es, que el número de elementos del vector fila sea
igual al número de filas de la matriz.
b) El orden del producto de un vector fila por una matriz, es un vector fila, con
tantas filas como las del vector fila, y tantas columnas como la de la matriz.






114
Sea :
( )
|
|
|
|
|
.
|

\
|
÷
= =
0 1 1
2 1 3
1 0 2
1 2 1
4 3 2 1 A Q

( ) ( ) ( )
|
|
|
|
|
.
|

\
|
|
|
|
|
|
.
|

\
|
|
|
|
|
|
.
|

\
|
÷
|
|
|
|
|
.
|

\
|
=
0
2
1
1
4 3 2 1
1
1
0
2
4 3 2 1
1
3
2
1
4 3 2 1 QA

( ) ) 0 ( 4 ) 2 ( 3 ) 1 ( 2 ) 1 ( 1 ) 1 ( 4 ) 1 ( 3 ) 0 ( 2 ) 2 ( 1 ) 1 ( 4 ) 3 ( 3 ) 2 ( 2 ) 1 ( 1 + + + + ÷ + + + + + = QA

( ) 9 3 18 = QA

19.4.- Matriz por Matriz

Para que la operación de multiplicación de matrices sea posible, se requiere que estas
sean conformables, es decir que consten de un número adecuado de filas y columnas.

En general, para que los factores sean conformables, el primero de ellos debe tener el
mismo número de columnas que el número de filas de la segunda matriz. O sea que si
A es de orden ) , ( n m y B es de orden ) , ( t s , el producto AB puede efectuarse
únicamente si s n = . En caso contrario, cuando s n = , la multiplicación no esta definida
y no puede efectuarse.

El orden de la matriz producto es ) , ( t m , es decir tantas filas como la matriz A y tantas
columnas como la matriz B.

Sean lasa matrices:


|
|
|
.
|

\
|
÷
÷
÷ ÷
=
|
|
.
|

\
|
=
1 0 1
2 1 0
1 2 1
6 5 4
3 2 1
B A

115
( ) ( ) ( )
( ) ( ) ( )
|
|
.
|

\
|
÷
÷
=
|
|
|
|
|
|
|
|
.
|

\
|
|
|
|
.
|

\
|
÷
÷
|
|
|
.
|

\
|
÷
÷
|
|
|
.
|

\
|
|
|
|
.
|

\
|
÷
÷
|
|
|
.
|

\
|
÷
÷
|
|
|
.
|

\
|
=
0 13 10
0 4 4
1
2
1
6 5 4
0
1
2
6 5 4
1
0
1
6 5 4
1
2
1
3 2 1
0
1
2
3 2 1
1
0
1
3 2 1
AB

NOTA: LA MULTIPLICACION DE MATRICES NO ES CONMUTATIVA AB= BA

20.- MATRIZ INDEMPOTENTE

Una matriz idempotente es aquella que es igual a su cuadrado, es decir M
2
= MM = M.
Si M es una matriz idempotente simétrica, entonces M’M = M.

21.- TRAZA DE UNA MATRIZ

La traza de una matriz cuadrada n x n es la suma de los elementos de la diagonal

( )
¿
=
=
n
i
ii
a
1
A tr

Algunos resultados fáciles de comprobar son:

Tr(cA) = c(tr(A))

Tr(A’) = A

Tr(A + B) = tr(A) + tr(B)

Tr(I
n
) = n

Tr(AB) = tr(BA)



22.- DETERMINANTE DE UNA MATRIZ

Toda matriz A cuadrada de orden n lleva asociado un valor numérico llamado
determinante de A y que denotaremos indistintamente por: A det

Las matrices cuadradas más sencillas son 1x1, y su determinante es numéricamente
igual al único elemento de dicha matriz.

116
Dada una matriz 2x2

|
|
.
|

\
|
=
22 21
12 11
a a
a a
A

21 12 22 11
det a a a a ÷ = A

Dada una matriz 3x3

|
|
|
.
|

\
|
=
33 32 31
23 22 21
13 12 11
a a a
a a a
a a a
A

33 21 12 11 32 23 31 22 13 31 23 12 13 32 21 33 22 11
a a a a a a a a a a a a a a a a a a ÷ ÷ ÷ + + = A det




Propiedades:

a) Una matriz cuadrada y su traspuesta tienen el mismo determinante.
b) Si una matriz tiene dos filas o columnas iguales entre si, su determinante es
cero. Una matriz con determinante igual a cero se dice singular.
c) Una matriz con una línea de ceros tiene determinante igual a cero.
d) El determinante del producto de dos matrices cuadradas de igual orden es
igual al producto de sus respectivos determinantes.

e) Si se multiplica una línea de una matriz n x n por una constante, del
determinante queda multiplicado por esa constante. Si se multiplica una
matriz cuadrada por una constante, su determinante queda multiplicado por
dicha constante elevada a la potencia n-ésima

23.- MTRICES INVERSAS

En el conjunto de los números reales, para todo número c= 0 existe un númerob ,
llamado inverso multiplicativo (o recíproco9, que verifica la propiedad

117
1 = = ba ab

Se simboliza ese número b por
1 ÷
a o por
a
1


Análogamente se plantea la posibilidad de que dada una matriz A cualquiera, exista
otra matriz B, conformable con A para la operación de producto, que satisfaga la
relación AB = I, la relación BA = I, o ambas simultáneamente, es decir:

AB = BA = I

En que I es una matriz identidad de orden apropiado. Si esa matriz B existe, diremos
que es una inversa multiplicativa de la matriz A, y se le simbolizará por A
-1
.

Calculo de la inversa a través del método de los cofactores

Para simplificar la explicación supondremos una matriz:

|
|
.
|

\
|
=
22 21
12 11
a a
a a
A

a) Se calcula la determinante de A
b) Se calcula la matriz de cofactores
|
|
.
|

\
|
÷
÷
=
|
|
.
|

\
|
÷
÷
=
11 12
21 22
1
a a
a a
j
22 21
12 11
C C
C C
C
22
22 21
12 11
11
a
a a
a a
C =
|
|
.
|

\
|
=
21
22 21
12 11
12
a
a a
a a
C =
|
|
.
|

\
|
=
12
22 21
12 11
21
a
a a
a a
C =
|
|
.
|

\
|
=
11
22 21
12 11
22
a
a a
a a
C =
|
|
.
|

\
|
=



Es importante destacar que aquellos cofactores en que, impar j i = + son
negativos, como es el caso en nuestro ejemplo con
12
C y
21
C

c) Se calcula la traspuesta deC a la que se suele denominar adjunta de A
A adj C
'
=
|
|
.
|

\
|
÷
÷
=
11 21
12 22
a a
a a
'
C

118
d) Se calcula la inversa, adjA
A
1
A
1
=
÷
, como se puede observar para que
1
A
÷
exista, 0 A = , es decir, A debe ser no singular.

Ejemplo:

Hallar la inversa de
|
|
.
|

\
|
=
0 1
2 3
A

Puesto que 0 2 = ÷ = A , existe la inversa
1
A
÷
. El cofactor de cada elemento es en este
caso una determinante 1x1.

|
|
.
|

\
|
÷
÷
=
|
|
.
|

\
|
÷
÷
=
3 2
1 0
22 21
12 11
C C
C C
C

|
|
.
|

\
|
÷
÷
=
3 1
2 0
A adj

|
|
.
|

\
|
÷
=
|
|
.
|

\
|
÷
÷
÷ = =
÷
2 / 3 2 / 1
1 0
3 1
2 0
2
1
A adj
a
1
A
1


Como se puede observar el orden de la inversa es el mismo que el de la matriz
original.

Ejemplo

Hallar la inversa de
|
|
|
.
|

\
| ÷
=
7 0 3
2 3 0
1 1 4
B

Como 0 99 = = B ,
1
B
÷
existe.

|
|
|
.
|

\
|
÷
÷
÷
=
|
|
|
|
|
|
|
|
.
|

\
|
÷
÷
÷
÷
÷ ÷
÷
÷
=
12 8 5
3 31 7
9 6 21
3 0
1 4
2 0
1 4
2 3
1 1
0 3
1 4
7 3
1 4
7 0
1 1
0 3
3 0
7 3
2 0
7 0
2 3
C

119

|
|
|
.
|

\
|
÷
÷
÷
=
12 3 9
8 31 6
5 7 21
B adj

|
|
|
.
|

\
|
÷
÷
÷
=
|
|
|
.
|

\
|
÷
÷
÷
= =
÷
99 / 12 99 / 3 99 / 9
99 / 8 99 / 31 99 / 6
99 / 5 99 / 7 99 / 21
12 3 9
8 31 6
5 7 21
99
1
B adj
B
1
B
1



Propiedades de las matrices inversas

a) El producto de dos matrices inversas es conmutativo I AA A A
1 1
= =
÷ ÷
.
b) Si una matriz cuadrada tiene inversa, esta es única.
c) La inversa de la matriz inversa es la matriz original A ) (A
1 1
=
÷ ÷
.
d) La inversa de un producto de matrices, es igual al producto de las inversas
en orden contrario.
1 1 1
A B (AB)
÷ ÷ ÷
= .























120
APENDICE 3

CALCULO DE MATRICES CON EXCEL

1. Multiplicación de matrices.

Para que la operación de multiplicación de matrices sea posible, se requiere que estas
sean conformables, es decir que consten de un número adecuado de filas y columnas.

En general, para que los factores sean conformables, el primero de ellos debe tener el
mismo número de columnas que el número de filas de la segunda matriz. O sea que si
A es de orden ) , ( n m y B es de orden ) , ( t s , el producto AB puede efectuarse
únicamente si s n = . En caso contrario, cuando s n = , la multiplicación no esta definida
y no puede efectuarse.

El orden de la matriz producto es ) , ( t m , es decir tantas filas como la matriz A y tantas
columnas como la matriz B.

Dado las siguientes matrices en Excel.





121
Para dar inicio al proceso de multiplicar dos matrices ubicamos el cursor en la celda a
partir de la cual queremos que aparezca el resultado de la multiplicación (area de la
matriz producto) y luego activamos el comando de “Pegar Función”




Con lo que aparecerá una primera ventana de diálogo, en la cual se buscara la función
“MMULT”, la cual está ubicada en la categoría de funciones “Matemáticas y
trigonométricas”:





Seguidamente se abrirá una segunda ventana de diálogo, donde veremos 2 areas
donde se definirán el rango de las dos matrices: Matriz 1 y matriz 2







122




Para definir el rango de la matriz 1 hacemos click en el botón que se encuentra a la
derecha del area


y deslizamos el cursor abarcando toda el area de la matriz en la hoja de cálculo. Para
finalizar, volvemos a hacer click en el botón de la derecha del area














123





Repetimos el mismo procedimiento, pero ahora, para la matriz 2







124









Definidos los rangos de las dos matrices, procedemos a hacer click en el botón
“Aceptar”, con lo cual nos aparecerá el resultado en la celda selecionada.








125


Para completar los valores de la matriz producto, procedemos a asombrear el area
que abarca la misma. Debemos recordar que esta matriz tendrá el mismo número de
filas que la matriz 1 y el mismo número de columnas de la matriz 2. En este ejemplo
sombreamos un área conformado por 7 filas y 7 columnas.






Una vez sombredao el area, procedemos a ubicar el cursor en la barra de formulas y
hacemos click la misma.
126





y se oprime en forma simultanea, en el teclado, los botones de CONTROL, SHIFT y
ENTER




con lo cual aparecerá el resto de los valores de la matriz producto..


127



2 Inversa de una matiz.

El procedimiento para calcular la inversa de una matriz (A
-1
), es similar al de la
multiplicación de matrices. Es importante recordar, que este procedimiento sólo se
puede realizar a matrices cuadradas.

Primeramente selecionamos la celda a partir de la cual queremos la salida de la matriz
inversa y activamos el botón de “Pegar Función” para que seguidamente selecionemos
la función “MINVERSA”




128
Con lo que aparece la ventana de díalogo donde definimos el area de la matriz a la
cual le vamos a calcular la inversa




Hacemos click en el botón a la derecha del área de la matriz y con el cursor
señalamos los valores de la matriz en la hoja de cálculo










129



Definido el área de la matriz, hacemos click en el boton “Aceptar” y obtenemos el valor
bucado en la acelda selecionada





Para obtener el resto de los valores, sombreamos un el área equivalente al orden de la
matriz inversa, la cual es es mismo de la matriz original.



130


Una vez sombredao el area, procedemos a ubicar el cursor en la barra de formulas y
se oprime en forma simultanea, en el teclado, los botones de CONTROL, SHIFT y
ENTER con lo cual aparecerá el resto de los valores de la matriz inversa.





3. Otras operaciones

Otra función importante que trae el Excel es el cálculo de la determinante de una
matriz, cuyo procedimiento es similar a los casos anteriores.



131





























132
CAPITULO VI
MULTICOLINEALIDAD
1. DEFINICION

Uno de los supuestos del modelo clásico es: 0 ) , cov( =
j i
X X , es decir, entre dos
o más variables explicativas del modelo no debe existir ninguna relación. Si se viola
este supuesto, se presenta un hecho que se denomina multicolinealidad.

Se conoce como multicolinealidad a una situación en la que, como
consecuencia de una fuerte interrelación entre las variables explicativas, es difícil
desligar los efectos que cada variable tiene, de forma individual sobre la variable
dependiente.

Por lo tanto podemos indicar que un modelo sufre de multicolinealidad cuando
hay presencia de una relación lineal entre dos o más variables explicativas del modelo,
como por ejemplo:

3 3 2 2 1
X X X | | + =

Es importante resaltar que multicolinealidad solo se refiere al concepto de
relación lineal, ya que ecuaciones no lineales como por ejemplo:

u X X Y + + + =
2
2 1 0
| | |

en las cuales la relación entre las variables explicativas no es lineal (en el ejemplo
anterior, es cuadrática) no violan el supuesto de no multicolinealidad.

Existen dos clases de multicolinealidades, la perfecta y la imperfecta. Existe
multicolinealidad perfecta cuando existe una relación lineal entre dos a más variables
explicativas del modelo, como por ejemplo:
2 1
X X ì = , es decir el comportamiento de
una de las variables explicativas es explicado en un 100% de los casos por otra
variable explicativa. Hay multicolinealidad imperfecta, cuando una variable explicativa,
es explicada en un porcentaje menor al 100% por otra(s) variable(s) explicativa(s), por
ejemplo: v ì + =
2 1
X X , donde v es una variable aleatoria o estocástica.
2. NATURALEZA DE LA MULTICOLINEALIDAD

A pesar que la definición plantea que la multicolinealidad surge cuando existe
una relación lineal entre las variables explicativas, lo más común que suceda en la
práctica, es que al recopilar los datos para las variables explicativas del modelo, nos

133
encontremos que los datos asociados a dos o más variables diferentes, estén
relacionados entre sí, por lo cual, se dice que la multicolinealidad es netamente un
problema muestral, es decir que sucede en la muestra, mas no en la población.

Al ser un problema muestral. Los estimadores mínimos cuadráticos seguirán
siendo, los mejores estimadores linealmente insesgados, es decir seguirán siendo
MELI.


3. CONSECUENCIAS DE LA MULTICOLINEALIDAD

En el caso de la multicolinealidad perfecta, la consecuencia directa es que no
se pueden estimar los coeficientes, Al aplicar las ecuaciones mínimo cuadráticas,
estas nos darán cero sobre cero o lo que es lo mismo, indeterminado. Por ejemplo,
dado el siguiente modelo:

t t t t
u X X Y + + + =
2 2 1 1 0
| | |

y partiendo del supuesto:

2 1
x x ì =

tenemos que:

( ) ( ) ( )
¿ ¿ ¿
¿ ¿ ¿ ¿
¿ ¿ ¿
¿ ¿ ¿ ¿
÷
÷
=
÷
÷
=
2
2 2
2
2
2
2
2 2 2
2
2 2
2
2 1
2
2
2
1
2 1 2
2
2 1
1
ˆ
x x x x
x x y x x y x
x x x x
x x y x x y x
ì ì
ì ì
|

( )
erminado in
x x x
x y x x y x
det
0
0
ˆ
2
2
2
2 2
2
2
2
2
2
2 2
2
2 2
1
= =
÷
÷
=
¿ ¿ ¿
¿ ¿ ¿ ¿
ì ì
ì ì
|


Desde el puntos de vista matricial al haber una relación lineal entre dos o más
columnas de la matriz X, la determinante de la matriz X’X es igual a cero, por lo tanto,
es una matriz singular, y no se puede calcular su inversa, lo cual imposibilita el cálculo
de los coeficientes de la ecuación ( Y X X X
' 1 '
) (
ˆ
÷
= | ).

En el caso de la multicolinealidad imperfecta, tenemos las siguientes consecuencias:

1 A diferencia del caso de multicolinealidad perfecta, si se pueden estimar los
coeficientes.

134
2. Es prácticamente imposible separar los efectos o influencias relativas de las
diferentes variables explicativas sujetas a un fuerte grado de correlación lineal, por lo
que las estimaciones concretas pueden cometer errores muy fuertes al absorber unos
parámetros la influencia de las otras con las que están correlacionadas.

3. Los errores estándar de los coeficientes estimados pueden ser muy grandes,
llevando a aceptar hipótesis nulas indebidamente y despreciar ciertas variables
como explicativas cuando sí lo son. Es decir, los test de significancia individual y
global de los coeficientes del modelo pueden establecer conclusiones
contradictorias.

4. Pequeños cambios en los datos pueden producir grandes variaciones en los
estimadores de los coeficientes.


5. Los coeficientes pueden tener signo opuesto al esperado o una magnitud poco
creíble.

Es importante hacer resaltar que pese a la presencia de multicolinealidad en el
modelo, si este presenta un coeficiente de determinación elevado, el modelo
conservara su capacidad de estimar valores de la variable dependiente.

4. COMO DETECTAR LA MULTICOLINEALIDAD

1. Una primera aproximación para sospechar que un modelo sufre de
multicolinealidad no los da la teoría económica. Por ejemplo el siguiente modelo:

u S Y C + + + =
2 1 0
| | |

el cual nos indica que el consumo(C) de un bien esta en función lineal de los
niveles de ingreso (Y) y de los niveles de ahorro (S), puede esta bien planteado
desde el punto de vista teórico (cuando una persona piensa comprar un vehículo
siempre toma en consideración sus niveles de ingreso, para el pago de las
mensualidades y de sus ahorros para la inicial), Pero a nivel econométrico
sabemos que el ingreso y el ahorro no pueden esta conjuntamente como variables
explicativas dado que la teoría económica nos indica que el ahorro esta en función
directa de los niveles de ingreso.

2. Un segundo método es a través de las pruebas de significancia individual y global.
Si en un modelo estimado se rechaza la hipótesis 0 ... :
2 1 0
= = = =
n
H | | | a través
de la prueba F y algunos coeficientes ( o todos) son individualmente no
significativos, mediante la prueba T. Esto da indicios de un posible problema de
multicolinealidad. Por ejemplo dado el siguiente modelo:


135

i i i
X X Y
2 1
0424 , 0 9415 , 0 7747 , 24
ˆ
÷ + =
(6,7525) (0,8229) (0,0807)
T= (3,6690) (1,442) (-0,5261)

9635 , 0
2
= R g de l = 7

Y = consumo;
1
X = ingreso;
2
X = riqueza

Análisis estadístico:

95%
2,5%
2,5%
0
H
1
H
1
H
% 5 = o
2,365 -2,365
2 , 1 = i
0 :
0 :
1
0
=
=
i
i
H
H
|
|
/



En primer lugar tenemos un coeficiente de determinación bastante alto, el 96,35% de
las variaciones en el consumo son explicadas por el ingreso y la riqueza. Este
resultado nos indica que el modelo se ajusta bastante bien a los datos recolectados.

Comparando la T calculadas con las T de la gráfica, ) 365 , 2 1442 , 1 ( < y, en ambos casos
aceptamos la hipótesis nula de que los coeficientes son iguales a cero, por lo tanto
podemos concluir que ambos coeficientes no son significativamente diferentes a cero.









136
95%
5 %
0
H
1
H
% 5 = o
0 :
0 :
2 1 1
2 1 0
= =
= =
| |
| |
H
H
4,74



( ) ( )
( )
( ) ( )
40 , 96
005 , 0
482 , 0
3 10 / 9635 , 0 1
1 3 / 9635 , 0
/ 1
) 1 /(
2
2
= =
÷ ÷
÷
=
÷ ÷
÷
=
K N R
K R
F


dado que 365 , 2 40 , 96 > rechazamos la hipótesis nula y aceptamos la alternativa de
que los coeficientes betas son diferentes a cero, por lo tanto concluimos que los
coeficientes globalmente son significativamente diferentes de cero.

¿ Cómo se explica que los coeficientes individualmente no sean significativos pero
globalmente si lo sean?. La única explicación posible es la existencia de una
correlación lineal entre las variables explicativas.


3. Un último método de detección de la multicolinealidad es a través de los
coeficientes de correlación de orden cero y parcial entre las variables explicativas.



En el siguiente cuadro se tiene una Información hipotética sobre el gasto de consumo
Y (US$), el ingreso
1
X (US$) y la riqueza
2
X (US$.


EJERCICIO Nº 18
137
70 80 810
65 100 1009
90 120 1273
95 140 1425
110 160 1633
115 180 1876
120 200 2052
140 220 2201
155 240 2435
150 260 2686
Y
1
X
2
X


Se necesita estimar un modelo lineal, y determinar si el mismo presenta
multicolinealidad o no



b)
i i i i
u X X Y + + + =
2 2 1 1 0
| | |
0
1
> | 0
2
> |

i i i i
u X X Y ˆ
ˆ ˆ ˆ
2 2 1 1 0
+ + + = | | |
70 80 810 5600 56700 64800 6400 656100 4900
65 100 1009 6500 65585 100900 10000 1018081 4225
90 120 1273 10800 114570 152760 14400 1620529 8100
95 140 1425 13300 135375 199500 19600 2030625 9025
110 160 1633 17600 179630 261280 25600 2666689 12100
115 180 1876 20700 215740 337680 32400 3519376 13225
120 200 2052 24000 246240 410400 40000 4210704 14400
140 220 2201 30800 308140 484220 48400 4844401 19600
155 240 2435 37200 377425 584400 57600 5929225 24025
150 260 2686 39000 402900 698360 67600 7214596 22500
1110 1700 17400 205500 2102305 3294300 322000 33710326 132100
Y 1
X
2
X
Y X
1
Y X
2 2 1
X X
2
1
X
2
2
X
2
Y


170
10
1700
1
1
= = =
¿
N
X
X

1740
10
17400
2
2
= = =
¿
N
X
X


138
111
10
1110
= = =
¿
N
Y
Y

( )( ) 16800 111 170 10 205500
1 1 1
= ÷ = ÷ =
¿ ¿
Y X N Y X y x


( )( )
¿ ¿
= ÷ = ÷ = 170905 111 1740 10 2102305
2 2 2
Y X N Y X y x

( )( ) 336300 1740 170 10 3294300
2 1 2 1 2 1
= ÷ = ÷ =
¿ ¿
X X N X X x x

( )
¿ ¿
= ÷ = ÷ = 33000 170 10 322000
2 2
1
2
1
2
1
X N X x

( )
¿ ¿
= ÷ = ÷ = 3434326 1740 10 33710326
2 2
2
2
2
2
2
X N X x

( ) 8890 111 10 132100
2 2 2 2
= ÷ = ÷ =
¿ ¿
Y N Y y


( )
¿ ¿ ¿
¿ ¿ ¿ ¿
÷
÷
=
2
2 1
2
2
2
1
2 1 2
2
2 1
1
ˆ
x x x x
x x y x x y x
|


( )( ) ( )( )
( )( ) ( )
9415 , 0
235068000
221325300
336300 3434326 33000
336300 170905 3434326 16800
ˆ
2 1
= =
÷
÷
= |


( )
¿ ¿ ¿
¿ ¿ ¿ ¿
÷
÷
=
2
2 1
2
2
2
1
2 1 1
2
1 2
2
ˆ
x x x x
x x y x x y x
|


( )( ) ( )( )
( )( ) ( )
0424 , 0
235068000
9975000
336300 3434326 33000
336300 16800 33000 170905
ˆ
2 2
÷ =
÷
=
÷
÷
= |


2 2 1 1 0
ˆ ˆ ˆ
X X Y | | | ÷ ÷ =

( )( ) ( )( ) 7747 , 24 1740 0424 , 0 170 9415 , 0 111
ˆ
0
= ÷ ÷ ÷ = |



139


i i i
X X Y
2 1
0424 , 0 9415 , 0 7747 , 24
ˆ
÷ + =




b) Análisis.

b.1) Análisis económico: El signo del coeficiente que acompaña a la variable ingreso
es el esperado y nos indica que por cada dólar adicional de ingreso el consumo
aumentará en 0,9415 dólares. El signo del coeficiente que acompaña a la variable
riqueza no es el esperado lo cual puede indicar que hay cierto problema en los datos.
Este coeficiente tal como está nos indica que por cada dólar adicional de riqueza el
consumo disminuirá en 0,0424 dólares.

b.2) Análisis estadístico:

b.2.1) Coeficiente de determinación ( )
2
R


¿
¿ ¿
+
=
2
2 2 1 1 2
ˆ ˆ
y
y x y x
R
| |


( )( ) ( )( )
9635 , 0
8890
828 , 8570
8890
170905 0424 , 0 16800 9415 , 0
2
= =
÷ +
= R


El 96,35% de las variaciones en la inflación observada son explicadas por el modelo


b.2.2.) Prueba de significancia individual de los coeficientes pendientes.




( ) ( ) 4459 , 324 8890 9635 , 0 1 1 ˆ
2 2
= ÷ = ÷ =
¿ ¿
y R u
t



3494 , 46
3 10
4459 , 324
ˆ
ˆ
2
2
=
÷
=
÷
=
¿
K N
u
o


140
( )
( )
¿ ¿ ¿
¿
÷
=
2
2 1
2
2
2
1
2
2 2
1
ˆ
ˆ
x x x x
x
ee o |


( ) 8229 , 0
235068000
3434326
3494 , 46
ˆ
1
= = | ee


( )
( )
¿ ¿ ¿
¿
÷
=
2
2 1
2
2
2
1
2
1 2
2
ˆ
ˆ
x x x x
x
ee o |

( ) 0807 , 0
235068000
33000
3494 , 46
ˆ
2
= = | ee



95%
2,5%
2,5%
0
H
1
H
1
H
% 5 = o
2,365 -2,365
2 , 1 = i
0 :
0 :
1
0
=
=
i
i
H
H
|
|
/


( )
1441 , 1
8229 , 0
9415 , 0
8229 , 0
0 9415 , 0
ˆ
ˆ
1
1 1
1
= =
÷
=
÷
=
|
| |
ee
T





141
Como, entonces
1
T calculado cae en la zona de aceptación, por lo tanto aceptamos la
hipótesis nula por lo que se concluye que el coeficiente no es significativamente
diferente de cero.


( )
5254 , 0
0807 , 0
0424 , 0
0807 , 0
0 0424 , 0
ˆ
ˆ
2
2 2
2
÷ =
÷
=
÷ ÷
=
÷
=
|
| |
ee
T

Como, entonces
2
T calculado cae en la zona de aceptación, por lo tanto aceptamos la
hipótesis nula por lo que se concluye que el coeficiente no es significativamente
diferente de cero.


Prueba de significancia global


( )
( ) ( )
( )
( ) ( )
6538 , 92
0052 , 0
4818 , 0
3 10 / 9635 , 0 1
1 3 / 9635 , 0
/ 1
1 /
2
2
= =
÷ ÷
÷
=
÷ ÷
÷
=
K N R
K R
F



95%
5 %
0
H
1
H
% 5 = o
0 :
0 :
2 1 1
2 1 0
= =
= =
| |
| |
H
H
4,74

:
Como 74 , 4 6538 , 92 > entonces rechazamos la hipótesis nula y aceptamos la
alternativa de que los coeficientes son diferentes a cero, por lo que se concluye que
los coeficientes globalmente si son significativamente diferentes a cero.


142
Dado los resultados obtenidos en donde tenemos que los dos coeficientes
individualmente no son significativos y globalmente si lo son, se puede sospechar la
existencia de multicolinealidad en el modelo. Por lo cual estimaremos el coeficiente de
correlación entre las dos variables explicativas para reafirmar o no la sospecha.



( ) ( ) ( )( )
9989 , 0
3434326 33000
336300
var var
) cov(
2
2
2
1
2 1
2 1
2 1
2 1
= = = =
¿ ¿
¿
x x
x x
X X
X X
r
X X



El coeficiente de correlación nos da un valor bastante alto lo que indica una fuerte
relación entre las variables explicativas. Lo que reafirma la sospecha de la existencia
de multicolinealidad en el modelo


5. COMO SOLUCIONAR EL PROBLEMA DE MULTICOLINEALIDAD

1. El problema de multicolinealidad se reduce, de forma esencial, a una falta de
información suficiente que permita estimar de forma más o menos exacta los
parámetros individuales. En algunas ocasiones podemos estar interesados en unos
parámetros más que en otros y, si existe un elevado grado de multicolinealidad
entre las variables que forman parte de la regresión, podemos tratar de excluir una
de ellas y estimar los parámetros correspondientes al resto.

Al aplicar esta metodología hay que tener mucho cuidado ya que al excluir o
eliminar una de las variables explicativas se puede correr el riego de que el modelo
se vea afectado en mayor medida que con la presencia de multicolinealidad. Se
puede dar el caso de que la variable eliminada sea importante para explicar el
comportamiento de la variable dependiente, motivo por el cual el nuevo modelo
regresado (sin la variable) pierda capacidad predictiva, lo cual se ve reflejado a
través de una reducción en el valor del coeficiente de determinación y el posible
surgimiento de autocorrelación. Cuando se presenta esta condición se dice que el
modelo está mal especificado.

2. Algunos autores afirman que el problema de multicolinealidad es el mismo que se
presenta cuando se tienen pocos datos, y es el de tener unas varianzas muy
grandes. Por lo tanto, una forma de atenuar (no eliminar) el problema es
aumentando el tamaño de la muestra.

3. Otra metodología que se utiliza, es la transformación de los datos. Entre las
transformaciones más frecuentes se pueden señalar las siguientes: trabajar con
tasas de crecimiento en vez de con valores absolutos; expresar las variables en
diferencias o incrementos; expresar las variables en proporciones; utilizar una
transformación logarítmica de las variables, etc. Se debe tener presente la teoría
económica a la hora de efectuar transformaciones que tengan sentido y que no
143
supongan meramente un juego matemático con las ecuaciones del modelo
econométrico.



En la pagina 82 se estimó una regresión lineal para las ventas para la compañía
petrolífera Campsol, obteniéndose los siguientes resultados.





Como se puede observar se tienen por lo menos tres (3) coeficientes individualmente
no son significativos, pero el Coeficiente de Determinación o Bondad de ajuste arroja
un resultado bastante alto (0,921833) y finalmente la prueba de significancia global
nos indica que los coeficientes son globalmente significativos. Estos resultados nos
dan un primer indicio sobre la existencia de multicolinealidad en el modelo.

Para profundizar en el análisis de la posibilidad de existencia o no de multicolinealidad,
procedemos a chequear la matriz de correlaciones:







EJERCICIO Nº 19
144



En la matriz anterior se puede observar como en todos los casos el coeficiente de
correlación simple entre cada par de variables (r) no es menor de 0,9, Indicando una
fuerte correlación entre todas las variables explicativas del modelo.

En tercer término se puede realizar la regresión de cada regresor frente al resto de las
variables explicativas para así determinar si realmente todas las variables son
multicolineales o alguna de ellas es irrelevante:




















145









146

resumiendo los resultados obtenidos para los coeficientes de determinación:
RENTA 0,993621
PRECIOS 0,917979
VEHICULOS 0,992940
INDICE 0,935342
t
X
2
.... /
2 1 K
X X X
R



Cono se puede observar todos los
2
R dan valores cercanos a 1, lo que nos indica una
fuerte relación entre las variables explicativas.

Por todo lo anterior, podemos decir que hay indicios de la presencia de
multicolinealidad en el modelo. La solución al problema conlleva a la eliminación de
aquellas variables causantes del problema, ya que observa que la relación lineal entre
ellas es muy fuerte. Dado que en este caso, todas las variables explicativas guardan
relación entre ellas, el proceso de eliminación debe hacerse por tanteo hasta lograr un
modelo que cumpla con los requerimientos.

Por ejemplo, una estimación tentativa, sería eliminando las variables. VEHICULOS e
INDICE, cuyo coeficiente de correlación simple es uno de los mas elevado, aunque
hay que hacer la acotación de que como se verá mas adelante puede presentar
problemas de autocorrelación.






147



Se dispone de 20 observaciones
34
relativas al consumo interno (CONS), rentas
salariales agrarias (WA), rentas no salariales no agrarias (RNA) y rentas agrarias (RA),
para el período 1928 –1941 y 1945 –1950 de la economía estaudinense. Con esta
información se va a estimar el modelo de Klein y Goldberger (1955) en el que se
explica el consumo en función de las mencionadas rentas.

Observaciones CONS RA WA RNA
1 55,2 4,39 39,21 17,73
2 62,2 4,60 42,31 20,29
3 58,6 3,25 40,37 18,83
4 56,6 2,61 39,15 17,44
5 51,1 1,67 34,00 14,76
6 51,1 2,44 33,59 13,39
7 54,0 2,39 36,88 13,93
8 57,2 5,08 39,27 14,67
9 62,8 3,93 45,51 17,20
10 65,0 5,48 46,06 15,92
11 63,9 4,37 44,16 17,57
12 67,5 4,51 47,68 18,49
13 71,3 4,90 50,79 18,49
14 76,6 6,37 57,78 19,18
15 86,3 8,42 78,97 19,12
16 95,7 9,27 73,54 19,76
17 98,3 8,87 71,92 17,55
18 100,3 9,30 74,01 19,17
19 103,2 6,95 75,51 20,20
20 108,9 7,15 80,97 22,12


El objetivo de este ejercicio es el análisis de la presencia de colinealidad en el modelo
econométrico señalado, según la siguiente especificación:

i i i i i
u RNA WA RA Cons + + + + =
3 2 1 0
| | | |


Se pide:
a) Estime el modelo anterior por MCO.
b) Detecte por distintas víaas la presencia de multicolinealidad en el modelo.
c) Corrija la multicolinealidad en caso de ser necesario.



34
Ejercicio tomado de Pena Trapero, J. Bernardo, Julio A Estavillo D, María E. Galindo F., María J.
Leceta R. Y María del Mar Zamora S. “Cien Ejercicios de Econometría”. Ediciones Pirámide. Madrid.
1999. P.219.
EJERCICIO Nº 20
148
CAPITULO VII
HETEROCEDASTICIDAD
1. DEFINICION

El supuesto de Homocedasticidad
35
nos indica que:


2
) var( o = = constante U
i


X
Y
AHORRO
INGRESO
GASTO
2
) var( o =
i
U
HOMOCEDASTICIDAD

Lo cual significa nos indica que todos los términos de perturbación tienen la misma
varianza. Sin embargo, puede darse el caso de que no todos los términos de
perturbación tengan la misma varianza. Esta condición de varianza inconstante se
conoce con el nombre de Heterocedasticidad
36
. Como por ejemplo, al estudiar los
niveles de gasto de consumo de las familias a diferentes ingresos disponibles,
podemos encontrar que la varianza en el consumo se eleva con el nivel de ingresos.
Tal es el caso por el cual familias con mayores ingresos pueden tener mayor
flexibilidad respecto al consumo.

Otro ejemplo sería si queremos cuantificar una relación en la que nos preocupe
explicar los gastos en innovación que una empresa realiza, mediante diferentes
variables explicativas como el capital, o la estructura de empleo, es muy probable que

35
homo = igual; cedasticidad = dispersión ¬Homocedasticidad = igual dispersión
36
hetero = diferente; cedasticidad = dispersión ¬Heterocedasticidad = diferente dispersión
149
se produzca una mayor variación en el monto de dichos gastos en empresas de mayor
tamaño, por lo que también es muy probable que los errores generados tras realizar la
regresión presenten un problema de Heterocedasticidad.

X
Y
AHORRO
INGRESO
GASTO
HETEROCEDASTICIDAD
2
) var(
i i
U o =

Por otra parte, si pretendemos ajustar una regresión con datos regionales per
cápita en la que estamos interesados en contratar la relación entre los gastos de
inversión en estructura y la renta de las regiones, es muy posible que los errores
presenten Heterocedasticidad por el hecho de que para obtener los valores de la
variable dependiente y explicativa hemos dividido los datos agregados por la población
de cada región, por lo que posiblemente las varianzas sean proporcionales a la
población de cada región que se ha utilizado para promediar dichos datos.

El problema de Heterocedasticidad es probablemente más común en la
información de corte transversal que en la información de series de tiempo. En la
información de corte transversal, generalmente se trata con miembros de una
población en un momento dado del tiempo, tal como los consumidores individuales o
sus familias, empresas, industrias, o subdivisiones geográficas tales como estados,
países, ciudades, etc. Además, estos miembros pueden ser de diferentes tamaños
como por ejemplo empresas pequeñas, medianas o grandes o de ingresos bajos,
medios o altos. En las series de tiempo, por el contrario, las variables tienden a ser
datos de magnitud similares por que generalmente se recopila información sobre el

mismo fenómeno o hecho durante un período de tiempo (días, meses, años, etc. Son
ejemplos el PIB, el gasto público, el empleo en Venezuela, durante el período 1960 –
2000.
150

2. CONSECUENCIAS DE LA HETEROCEDASTICIDAD

Para un modelo con perturbaciones heterocedásticas aceptaremos que cada
término del error
i
u está distribuido en forma normal con varianza, donde la varianza
( ) | |
2 2
var
i i i
u E u o = = no es constante entre observaciones. Cuando está presente la
Heterocedasticidad, la estimación de mínimos cuadrados ordinarios da más
ponderación a las observaciones con varianzas de perturbaciones grandes que
aquella con varianza de errores menores. La ponderación ocurre debido a que es
probable que la suma de residuales cuadrados asociada con términos de error de
varianza grande sea considerablemente mayor que la suma de residuales cuadrados
asociada con errores de varianza baja.

( )
¿
÷ = K N u
i i
2 2
o

La línea de regresión se ajustará para minimizar la suma total de residuales
cuadrados, y esto puede lograrse mejor garantizando un ajuste muy bueno en la
porción de los datos de varianza grande. Debido a esta ponderación implícita, los
estimadores de los coeficientes de mínimos cuadrados ordinarios son insesgados y
consistentes, pero no eficientes, es decir los estimadores mínimos cuadráticos en
presencia de Heterocedasticidad no son los mejores estimadores linealmente
insesgados, ya no son MELI.

Hay que recordar que según el teorema de Gauss – Markov. El método de los
mínimos cuadrados supone que las varianzas de los términos de perturbación es
constantes, es decir homocedástica. Por lo tanto si estas varianzas ya no son
constantes, hay Heterocedasticidad, al momento de estimar los coeficientes debemos
utilizar una metodología que contemple este supuesto, como sería el caso del método
de los mínimos cuadrados generalizados
37
.

Lo anterior nos indica que cuando utilizamos el método de los mínimos
cuadrados ordinarios en presencia de Heterocedasticidad, estamos utilizando una
metodología equivocada. Pero sucede que en la realidad normalmente verificamos la
presencia o no de Heterocedasticidad posteriormente a la regresión del modelo, lo
que significa que ya se realizó la estimación de los coeficientes, los errores estándar


de los coeficientes y las pruebas F y T. ¿ qué sucede con estos valores, son validos o
no?.


Si recordamos la ecuación para estimar, por ejemplo, el error estándar de:


37
Ver Gujarati. Ob. cit. P.355
151
( )
¿
÷
=
2 2
1
1
ˆ
~
X N X
ee o |

El problema radica en que la fórmula anterior conducirá a valores sesgados (mayor o
menor al valor verdadero) del error estándar, por lo tanto, si se utiliza este valor, las
pruebas estadísticas (T y F) y los intervalos de confianza serán incorrectas.

3. COMO DETECTAR LA HETEROCEDASTICIDAD

Para detectar el problema de Heterocedasticidad realizaremos la siguiente
metodología:

1. En primer lugar se realiza la regresión normal
i i i
u X Y ˆ
ˆ ˆ
1 0
+ + = | | con la finalidad de
estimar los residuales. Recordando que
i i i
Y Y u
ˆ
ˆ ÷ =

2. A continuación se regresa alguno de los siguientes modelos:


i i i
X u v | | + + = ln ˆ ln
1 0
2
= Prueba de Park


i i
X u v | | + + =
1 0 1
ˆ

i i i
X u v | | + + =
1 0
ˆ

i
i
i
X
u v | | + + =
1
ˆ
1 0
Prueba de Glejser

i
i
i
X
u v | | + + =
1
ˆ
1 0
= valor absoluto

3. Se realiza la prueba T (significancia individual) para el coeficiente pendiente, con
N-K grados de libertad, con el siguiente conjunto de hipótesis


0 :
0 :
1 1
1 0
=
=
|
|
H
H


que sería equivalente a plantear el siguiente conjunto de hipótesis:


( )
( ) sticidad heteroceda u H
dad ocedastici u H
i i
i
= =
= =
2
1
2
0
ˆ var :
hom ˆ var :
o
o



152


OBSERVACIONES PIB EMPLEO
Andalucia 6.895.665 1.834,1
Aragón 1.747.221 412.3
Asturias 1.338.540 351.2
Baleares 1.150.586 252.9
Canarias 1.830.265 446.4
Cantabria 660.038 162.3
Castilla y León 2.980.371 841.6
Castilla-La Mancha 1.846.983 528.3
Cataluña 9.511.088 2.222,9
Comunidad Valenciana 4.949.357 1.276,7
Extramadura 963.305 302.6
Galicia 2.752.518 1.012,8
Madrid 7.935.591 1.636,0
Murcia 1.240.645 317,0
Navarra 840.372 183.9
País Vasco 3.251.025 708.5
La Rioja 384.298 90.3
Ceuta y Melilla 135.876 29.7


Se quiere estimar la relación existente entre el empleo y el PIB en las comunidades
autónomas españolas. Para ello se utilizan los datos del valor añadido bruto al costo
de factores (precios corrientes, en millones de pesetas) y el número de ocupados
(medias anuales en miles de personas) para el año 1991, que aparecen en la siguiente
tabla:

Existe la posibilidad de que haya Heterocedasticidad en la varianza de las
perturbaciones dependiendo directamente de la variable empleo o alguna
transformación de ésta.

Se pide verificar la existencia de Heterocedasticidad.
38



En primer lugar establecemos el modelo:


i i i
u EMP PIB + + =
1 0
| |
0
1
> |
i i i
u EMP PIB ˆ
ˆ ˆ
1 0
+ + = | |

regresando mediante el método de los mínimos cuadrados, tenemos que el modelo
resultante es:


38
Tomado de: Pena Trampero J. Bernardo, julio A. Estavillo D. Y y otros autores. Cien ejercicios de Econometría.
Ediciones Pirámide S.A. Madrid 1999.
EJERCICIO Nº 21
153


i i
EMP B PI 1 , 167 . 4 4 , 413 . 118
ˆ
+ ÷ =
(199,5353)
(20,884) 964613 , 0
2
= R




Para el análisis de la posible heterocedasticidad en el modelo en primer lugar se
realizara el análisis gráfico. De la regresión original se ha obtenido la serie de residuos
que es necesario renombrar, para tal fin generamos la siguiente instrucción:

GENR RESIDUOS = RESID

En primer lugar se realiza la representación gráfica del PIB frente a la variable empleo



Este gráfico permite observar que a niveles bajos de PIB existe pequeña volatilidad en
la ocupación y, sin embargo, la dispersión aumenta a medida que lo hace el PIB:

En segundo lugar, se puede analizar también de forma gráfica la relación existente
entre los residuos y la variable explicativa:

154


Como se puede observar a valores elevados de la variable EMPLEO le corresponde
valores elevados de los residuos. Como conclusión de esta parte, a través del análisis
gráfico se puede sospechar la existencia de heterocedasticidad en el modelo.

4. Contraste de WHITE
39


El contraste de White es uno de los más utilizados para la detección de
Heterocedasticidad dado que no requiere una especificación concreta bajo la
alternativa:

0 1
2 2
0
. . . :
. . . :
H verifique se no H
i todo para H
i
o o =


La forma de realizar el contraste se basa en la regresión de errores mínimo
cuadráticos al cuadrado, que son el indicativo de la varianza de las perturbaciones,
frente a un término independiente, los regresores, sus cuadrados y sus productos
cruzados dos a dos (o de segundo orden). Por ejemplo, partiendo del siguiente
modelo:

i i i i
u X X Y + + + =
2 2 1 1 0
| | |


La regresión auxiliar para realizar este contrates sería:


i i i i i i i i
X X X X X X u c o o o o o o + + + + + + =
2 1 12
2
2 22
2
1 11 2 2 1 1 0
2
ˆ


La interpretación del contrates reside en que si las perturbaciones fueran
homecedásticas, las variables incluidas en la regresión no deberían tener ningún
poder explicativo sobre los residuos al cuadrado y por lo tanto, el
2
R debería ser
pequeño. Por ello, si el valor muestral del estadístico es suficientemente alto como

39
Artículo tomado de: Carrascal Arranz, Ursicino. Ob.cit. p.230
155
para que la probabilidad de rechazar la hipótesis nula siendo cierta sea menor al 5%
rechazaremos la hipótesis nula de Homocedasticidad.


El paquete Eviews incorpora dos versiones de este contraste. Una en la que se
incluyen en la regresión los productos cruzados dos a dos ) (
2 1 12 i i
X X o según la versión
original del test de White, y otra en lo que estos no se incluyen. En la práctica se
realiza el contraste para regresiones mínimo cuadráticas sin productos cruzados


Ejemplo: En el ejercicio anterior queríamos detectar la presencia de
Heterocedasticidad para el modelo:





Utilizando el test de White sin productos cruzados, seleccionamos VIEWS/RESIDUAL
TEST/WHITE HETEROSKEDASTICITY (NO CROSS TERMS)

156


Y obtenemos:




Como se puede observar el valos de
2
R es bajo y es estadístico F es siginificativo a
un 4,9 %, por lo que se rechaza la hipótesis nula de la precensia de Homocedasticidad
en el modelo, lo que aclara los resultados obtenidos con la metodología aplicada
anteriormente, la cual daba resultados un poco ambiguos.


157
4. COMO REMEDIAR EL PROBLEMA DE LA HETEROCEDASTICIDAD

1. El método principal que se utiliza para eliminar la Heterocedasticidad es aplicar el
método de los mínimos cuadrados generalizados, par el cual se necesita conocer
la varianza de cada una de las perturbaciones, hecho esto, que en la práctica es
bastante difícil de conseguir.

2. A falta de conocimiento del verdadero valor de las varianzas de las perturbaciones,
en la práctica, lo que se hace es plantear un supuesto sobre el comportamiento de
las mismas y seguidamente se transforma el modelo de manera que se cumpla el
supuesto de Homocedasticidad. Entre los diferentes supuestos que se pueden
establecer, señalaremos los dos principales:



a) El primer supuesto que se puede hacer es establecer que la varianza de las
perturbaciones es proporcional al cuadrado de la variable explicativa:

2 2 2
i i
X o o =

donde
2
o es la varianza Homocedástica.

bajo esta hipótesis de Heterocedasticidad, si se trata de restablecer la igualdad
de varianza en, se tendría que transformar el modelo dividiendo el modelo original
por, con lo que la especificación a estimar sería

i
i
i i
i
X
u
X X
Y
+ + =
1
0
|
|


comprobación:

( )
( )
2
2
2
2
2
2
var o
o
= = =
|
|
.
|

\
|
=
|
|
.
|

\
|
i
i
i
i
i
i
i
i
X X E
U E
X
u
E
X
u


b) Suponer que la varianza es proporcional al valor de la variable explicativa:

i i
X
2 2
o o =

con lo que el modelo con el mismo propósito que anteriormente resultaría:

i
i
i
i i
i
X
u
X
X X
Y
+ + =
1
0
|
|


158




En el cuadro que se presenta a continuación
40
se muestran los datos referidos a una
encuesta realizada a 16 familias. En los mismos se recoge el comportamiento con
relación al ahorro realizado, S, en función de la renta salarial Y, expresadas ambas
variables en miles de pesetas:




UNIDAD RENTA
FAMILIAR AHORRO DISPONIBLE
1 12,2 38,3
2 14,2 43,5
3 17,9 53,5
4 21,4 60,8
5 23,7 66,4
6 24,9 71,2
7 27,1 77,2
8 31,6 86,1
9 35,4 94,6
10 37,5 102,4
11 40,7 109,9
12 42,5 115,6
13 45,0 121,0
14 47,7 127,0
15 51,0 129,9
16 53,7 134,7




Considerando el modelo de regresión lineal simple como modelo teórico:


i i i
u Y S + + =
1 0
| |



40
Tomado de: Díaz Fernández, Monserrat y María del Mar Llorente Marrón. Ob.Cit. p.255
EJERCICIO Nº 22
159


Trataremos de detectar y en su caso corregir, un posible problema de
heterocedasticidad.

Como primera aproximación al análisis del modelo señalaremos la existencia de
ciertas sospechas acerca de un posible problema de heterocedasticidad. Se trata de
una muestra de corte transversal en las que las variables seleccionadas podrían
presentar una diferente variabilidad. Con objeto de disipar nuestras dudas,
estimaremos en primer lugar el modelo, y trataremos de detectar dicho problema a
través de diferentes criterios.










Los resultados obteniods nos permite valorar positivamente los resultados. La
regresión es estdísticamente significativa de acuerdo con la prueba F (F= 3162.959) e
individualmente los parámetros
0
| y
1
| son estadísticamente significativos con la
prueba t-Student ( 9516 . 5
0
÷ = t ) y, respectivamente. Las variaciones experimentadas
por la variable dependiente del modelo se explican en 99%, aproximadamente, a partir
del comportamiento de la variable xeplicativa seleccionada.

160

Como primera aproximación al estudio de la posible existencia de heterocedasticidad
en el modelo, realizaremos el gráfico de los residuos y la variable explicativa
INGRESO: Para tal fin seleccionamos en Eviews: QUICK/GRAPH/RESID
INGRESO/SCATTER DIAGRAM







Como se puede observar en el gráfico, existe una tendencia que implica una relación
inversa entre los residuales y el ingreso lo cual es indicativo de la precencia de
heterocedasticidad en el modelo.

b) Prueba de Park

i i i
X u Ln v | | + + = ln ˆ
1 0
2



161



De acuerdo con la prueba de Park, la regresión confirma la sospecha de la existencia
de heterocedasticidad, dado que de acuerdo con la prueba t-Student la pendiente del
modelo es estadísticamente significativo a un 5%.

c) Prueba de Glejser

i i i
Y u v | | + + =
1 0
ˆ





i i i
Y u v | | + + = ln ˆ
1 0


162


i i i
Y u v | | + + =
2
1 0
ˆ




i
i
i
Y
u v | | + + =
1
ˆ
1 0


163


En todas las regresiones la pendiente es estadísticamente significativa, siendo el mas
significativo, el coeficiente pendiente de la regresión:
i i i
Y u v | | + + =
2
1 0
ˆ
,
( ) 9051 , 4 = t . En consecuencia, de acuerdo con el criterio de Glejser, diremos que
estamos ante un problema de heterocedasticidad. Dado que este método constituye

ademáaas una solución empírica al problema, retomaremos este resultado al final del
ejercicio con el objeto de transformar el modelo original.

d) Contraste de White



164
Como se puede observar el estadístico F es significativo a 0,1% por lo que se rechaza
la hipótesis nula de la precensia de homocedasticidad en el modelo y aceptando la
alternativa, lo que nos llleva a concluir que ha precensia de heterocedasticidad en el
modelo.

En todas las pruebas realizadas hemos llegado a la misma conclusión: el modelo
presenta un problema de heterocedasticidad. Dado que la resolución del mismo
requiere la adopción de algún supuesto inicial acerca del esquema de comportamiento
de la varianza del término aleatorio, y de los contrastes realizados alguno de ellos
cumple la doble función de detección y propuesta de una solución empírica al
problema. Según vimos en la prueba de glejser, el modelo cuya pendiente era mas
significativa era:
i i i
Y u v | | + + =
2
1 0
ˆ
, lo que sugiere que el esquema según el cual
se genere la varianza del término aleatorio:

( )
4 2 2
i i
Y u E o =






siendo,

2
1
2
0
2
1 1
I
I
I I I
i
Y
u
Y Y Y
S
+ + = | |


la transformación a realizar, dado que

( ) | |
( ) ( )
2 2
4
2
2
2
2
2
1 1
o = = =
|
|
.
|

\
|
i
i
i
i
i
i
u E
Y
u E
Y E
Y
u
E


el nuevo término aleatorio sí es Homocedástico.


165


donde:
I
I
I
I
Y
INVINGRESO
Y
INVINGRESO
Y
S
AHORROT
1
1
2
2
2
=
=
=




utilizando el contraste de White, podemmos ver que en el modelo resultante no hay
evidencia de la precensia de multicolinealidad.


166




5. ESTIMACION POR MINIMOS CUADRADOS GENERALIZADOS
(MCG) y MINIMOS CUADRADOS PONDERADOS (MCP)

Uno de los supuestos del modelo clásico es el de “perturbaciones esféricas”, término
con el cual se engloba los supuestos de homocedasticidad y la de ausencia de
correlación serial (autocorrelación). Como nos indica el teorema de Gauss-Markov,
dado el cumplimiento de los supuestos la estimación mínimo cuadrática me garantiza
Los Mejores Estimadores Linealmente Insesgados. (MELI). ¿Qué sucede cuando uno
de estos supuestos se abandona?.. Como se mencionó anteriormente los estimadores
mínimos cuadráticos dejan de ser eficientes. Por lo tanto se hace necesario buscar
una metodología de estimación de los coeficientes, que contemple en no
cumplimientos del supuesto de perturbaciones esféricas. Los estimadores mínimos
cuadráticos generalizados (MCG) o estimadores Aitken, son los mejores los mejores
estimadores linealmente insesgados del modelo de regresión cuando se considera la
existencia de heterocedasticidad o correlación serial
41
.

Para permitir la presencia tanto de heterocedasticidad como de correlación serial, se
plantea que:

( ) Ω
2 ´
) ( o = = uu E u Cov
(1)
.

41
El tema de correlación serial se desarrolla en el siguiente capítulo.
167
donde Ω es un matriz simétrica positiva definida, de orden n y
2
o es un parámetro
conocido. Este caso se reduce a perturbaciones esféricas si Ω es la matriz identidad
( ) I
2
o = ' u u E pero, de modo más general considera perturbaciones no esféricas.

Cuando Ω es conocida existe un estimador de | con las mismas propiedades que el
estimador mínimo cuadrático bajo los supuestos clásicos. Para encontrar dicho
estimador, hay que tener en cuenta que como Ω es definida positiva, su inversa
-1

también lo es y, por lo tanto, se puede calcular a partir de Ω una matriz P tal que
P P Ω
1
' =
÷
.

Cuando los elementos de Ω en (1) son números conocidos, la matriz P puede
calcularse de acuerdo con que P P Ω
1
' =
÷
y utilizarse para transformar el modelo
clásico: u Xβ Y + = , de la siguiente manera:

( ) ( ) ( ) PU β PX PY + = ,

O bien:

U β X Y
     
+ = (2)
Donde

PU U PX, X PY, Y ÷ ÷ ÷
     


Con: ( ) 0 U E =
 
y

( ) ( ) ( ) ( ) I σ P P P P σ P PΩ σ P U U PE U U E U Var
2 1 2 2
= ' = ' = ' ' = ' =
÷
     


Lo que implica que las perturbaciones en el modelo transformado son esféricas,
además, como el vector de parámetros definido en (2) es el mismo que en el modelo
original, toda la inferencia sobre β en dicho modelo se puede llevar a cabo aplicando
MCO a la ecuación (2).

En concreto el estimador MCO de β en U β X Y
     
+ = es:

( ) ( ) PY P X PX P X Y X X X β
1
1
Y
' ' ' ' = ' ' =
÷
÷
         

( ) Y Ω X X Ω X
1
1
1 ÷
÷
÷
' ' =

y cuya matriz de varianzas es:

( ) ( )
1
1 2
Y
X Ω X σ β Var
÷
÷
' =
 



168
Debido a que, en la práctica, la matriz de covarianzas Ω en general es desconocida y
no observable, para emplear el estimador MCO es necesario construir una matriz de
covarianzas adecuada. En el caso de Heterocedasticidad, la matriz de covarianzas es
de la forma:

|
|
|
|
|
.
|

\
|
= =
2
n
2
2
2
1
2
σ 0
.
σ
0 σ
Ω σ cov(u)

Donde
2
o es la varianza de i-ésimo término de perturbación estocástica, i=1,2,…,n.
Entonces, la inversa usada en el estimador MCG es:

|
|
|
|
|
|
|
|
.
|

\
|
=
2
n
2
2
2
1
1 -
σ
1
0
..
σ
1
0
σ
1


Es decir, la matriz cuyos elementos diagonales son los recíprocos de las varianzas
correspondientes de los términos de perturbación estocástica. Esta es la matriz
inversa que en teoría, debe ser empleada en el estimador MCG para el caso de
heterocedasticidad. Si las n varianzas están dadas, este estimador puede ser
calculado.

Desde otro punto de vista:

|
|
|
|
|
|
|
|
.
|

\
|
= ' =
n
2
1
1 -
σ
1
0
σ
1
0
σ
1
P donde P P Ω

La matriz P es una matriz diagonal cuyos elementos en la diagonal principal son los
recíprocos de las desviaciones estándar correspondientes de los términos de
perturbación, por lo tanto se puede deducir que tanto la variable dependiente como las
variables explicativas son ponderadas en cada observación por el recíproco de la
desviación estándar de la variable dependiente (o término de perturbación estocástica)
en esa observación. Así, en este caso, la estimación MCG puede interpretarse como
169
una estimación MCO para la cual los datos son reemplazados por los datos
transformados:

|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|
=
n
n
2
2
1
1
σ
y
.
.
.
σ
y
σ
y
PY
y
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|
=
n
n
2
2
1
1
σ
x
.
.
.
σ
x
σ
x
PX


Respectivamente. Si la desviación estándar en cada observación
i
o puede suponerse
proporcional a una de las variables explicativas, por ejemplo
1
X , entonces la
transformación que requiere MCG puede ser ejecutada empleando cocientes de
variables adecuadas. Como se puede deducir, de lo que se trata es de ponderar a
cada una de las variables mediante un valor proxis de la desviación estándar. Por
estos motivos, el estimador MCG aplicado a un modelo con perturbaciones
heterocedásticas suele denominarse estimador de mínimo cuadrados ponderados
(MCP)








Ante la próxima reunión de la Comisión de la Unión Europea
42
sobre la concesión de
subvenciones para la explotación agraria dedicadas a verduras y hortalizas, el
Ministerio de Agricultura, Pesca y alimentación ha decidido establecer una función
lineal que explique la producción en función de la superficie cultivada. Para ello
dispone de la información del año 1993, referidas a las variables:


Y: Producción de verduras y hortalizas medidas en Qm
X: Superficie cultivada medida en hectáreas.


42
Tomado de: Pena Trampero, J. Bernardo, Ob.Cit. p.277
EJERCICIO Nº 23
170
OBSERVACIONES Y X
Pimiento 7.338 25.243
Acelga 702 3.283
Ajo 2.063 30.548
Alcahofa 3.341 23.556
Batata 329 1.779
Berenjenas 1.367 4.208
Calabaza y calabacín 2.430 6.739
Cardo 270 1.050
Coliflor 2.747 13.903
Escarola 535 2.504
Guisantes verdes 567 10.398
Habas verdes 890 12.393
Judías verdes 2.473 25.526
Lechuga 9.535 33.797
Melón 8.528 50.514
Pepino 3.357 7.083
Sandía 6.046 23.217



Analice la posible presencia de heterocedasticidad en el modelo, utilizando:

a) Análisis gráfico
b) La Prueba de Glejser.
c) El Contraste de White.




171

CAPITULO VIII
AUTOCORRELACIÓN
1. DEFINICION
U X Y
+ + = | o
X
Y U X Y
+ + = | o
X
Y
( )
0 ; cov
=
j i
U U
( )
0 ; cov
=
j i
U U

Uno de los supuestos del modelo clásico nos indica que: ( ) 0 ; cov =
j i
u u que nos
indica que la covarianza entre las perturbaciones de un modelo debe ser igual a cero,
más concretamente el supuesto indica que no debe existir ninguna relación entre dos
o más observaciones diferentes de la variable estocástica. Si este supuesto no se
cumple, se dice que el modelo presenta problemas de autocorrelación o correlación
serial.

Por lo tanto el término autocorrelación se puede definir como la correlación existente
en el término de perturbación ( u ).

De manera simplificada se puede decir que un modelo presenta problemas de
autocorrelación cuando el término de perturbación (la variable aleatoria) está
absorbiendo algún elemento que es importante para explicar el comportamiento de la
variable dependiente, que no está planteado en forma explícita en el modelo.

Son causas de autocorrelación:

a) Problemas en la especificación del modelo, que pueden ser de 2 tipos: forma
funcional incorrecta y omisión de variables.

En el primer caso se dice que un modelo está mal especificado cuando no tiene la
forma funcional correcta, por ejemplo, la teoría de costos nos indica que la curva de
costo medio está representada por una función cuadrática.

u X X C + + + =
2
2 1 0
| | |
172

pero se ajusta de la siguiente forma:

v o o + + = X C
1 0


Si la primera ecuación es la correcta, la segunda debe presentar problemas de
autocorrelación ya que como se puede observar esta no contempla el efecto
cuadrático que debe tener la curva y por lo tanto, el mismo es absorbido por la
variable estocástica v ,

u X + =
2
2
| v
X
Y
v o o + + = X C
1 0

En segundo lugar, un modelo está mal especificado cuando se omite una variable
explicativa en el modelo que es importante para explicar las variaciones de la
variable dependiente.

Por ejemplo, si tenemos una función en que la demanda de un bien está explicada
por el precio del bien y por el ingreso familiar:

u Y P C + + + =
2 1
| | |

pero se ajusta un modelo en el cual el consumo está en función únicamente del
ingreso:

v o o + + = Y C
1 0


si el primer modelo es el correcto, posiblemente el segundo modelo experimente
problemas de autocorrelación, ya que el término de perturbación absorberá a la
variable precio.

u P + =
1
| v

173
tiempo
0
U U
ˆ
,
tiempo
U U
ˆ
,
tiempo
U U
ˆ
,
tiempo
U U
ˆ
,
Patrones de autocorrelación


b) Una característica relevante de todas las series de tiempo de variable
económicas, es la inercia. Como se sabe toda variable económica (PIB, empleo,
precios, etc.) presenta un comportamiento cíclico (ciclos económicos). Empezando
en el fondo de la recesión, cuando se inicia la recuperación económica, la mayoría
de estas series empieza a moverse hacia arriba. En este movimiento hacia arriba,
el valor de una serie en un punto del tiempo es mayor que su valor anterior, Así
hay un “momentum” construido en ellas y éste continuará hasta que algo suceda
(por ejemplo, un aumento de la tasa de interés o en los impuestos o ambos) para
reducirlo. Por consiguiente, en las regresiones que consideran datos de series de
tiempo, es probable que las observaciones sucesivas sean interdependientes.

2. COMO DETECTAR LA AUTOCORRELACION

En este punto nos centraremos a tratar de detectar la autocorrelación de primer
orden. Es decir, si suponemos que hay presencia de autocorrelación en el modelo,
esta está generada de la siguiente forma:

t t t
u u c µ + =
÷1




174
Este modelo es conocido como esquema autorregresivo de primer orden.
Autorregresivo por que la variable dependiente aparece como variable explicativa,
pero rezagada en el tiempo, y de primer orden, por que el rezago es de solo un
periodo.

µ es el coeficiente de autocorrelación, el cual está comprendido en el intervalo
cerrado | | 1 , 1 ÷ , y el mismo indica al grado de correlación existente entre la perturbación
de un período y la perturbación del período anterior.

Si µ = -1, hay perfecta autocorrelación negativa.
Si µ = 0, no hay autocorrelación.
Si µ = 1, hay perfecta autocorrelación positiva

t
U
ˆ
1
ˆ
÷ t
U
1 = µ
t
U
ˆ
1
ˆ
÷ t
U
1 ÷ = µ


Para detectar autocorrelaciones de primer orden utilizaremos el estadístico de
Durbin – Watson, el cual se basa en los siguientes supuestos:

a) El modelo de regresión incluye el término de intercepto.
b) Las variables explicativas, X, son no estocástica, es decir, son fijas en muestreo
repetido.
c) Las perturbaciones
t
u
se generan mediante un esquema autorregresivo de primer
orden.
d) El modelo no incluye valor(es) rezagado(s) de la variable dependiente como una de
las variables explicativas. Por tanto, la prueba es inaplicable a modelos del
siguiente tipo:
t t t t
u Y X Y + + + =
÷1 3 1 0
| | | donde
1 ÷ t
Y es el valor de Y rezagado un
período. Tales modelos son conocidos como modelos autorregresivos.

e) No hay observaciones faltantes en los datos.
175

La prueba del Durbin – Watson es similar en su tratamiento a las pruebas T y F. Es
decir calcularemos un estadístico, el cual posteriormente compararemos con unos
valores dados por una tabla a fin de aceptar una hipótesis.

El estadístico calculado se define como la razón de la suma de diferencias al cuadrado
de residuales sucesivos entre la suma de los cuadrados de los residuales, y es igual a:

( )
¿
¿
=
=
÷
÷
=
n
t
t
n
t
t t
u
u u
d
1
2
2
2
1
ˆ
ˆ ˆ


obsérvese que el numerador la sumatoria se realiza a partir de la segunda
observación, ya que una observación se pierde al realizar las diferencias consecutivas.
La primera observación no tiene ninguna observación anterior con que realizar la
diferencia.

Manipulando un poco la ecuación podemos encontrar una ecuación que nos
relacione el estadístico Durbin – Watson con el coeficiente de autocorrelación:

( )
¿
¿ ÷ ÷
+ ÷
=
2
2
1 1
2
ˆ
ˆ ˆ ˆ 2 ˆ
t
t t t t
u
u u u u
d


¿
¿ ¿ ¿
+ ÷
=
÷
2
2
1
2
ˆ
ˆ ˆ ˆ 2 ˆ
t
t t t t
u
u u u u
d

donde se utilizó el supuesto de que
¿ ¿ ÷
=
2
1
2
ˆ ˆ
t t
u u , dado que ambos difieren
solamente en una observación, se puede considerar que en muestras grandes son
aproximadamente iguales.


|
|
.
|

\
|
÷ =
÷
=
¿
¿
¿
¿ ¿ ÷ ÷
2
1
2
1
2
ˆ
ˆ ˆ
1 2
ˆ
ˆ ˆ 2 ˆ 2
t
t t
t
t t t
u
u u
u
u u u
d


si definimos que
¿
¿ ÷
=
2
1
ˆ
ˆ ˆ
t
t t
u
u u
µ



176


tenemos que ( ) µ ÷ = 1 2 d

La anterior identidad nos da una aproximación de los valores que puede tomar el
estadístico Durbin – Watson.

Si 1 ÷ = µ 4 = d
Si 0 = µ 2 = d
Si 1 = µ 0 = d


El cuadro nos indica que el estadístico de Durbin - Watson siempre será un valor
positivo y menor o igual que cuatro, pero en el mismo solo se presentan las casos
extremos de perfecta autocorrelación positiva y negativa, y el caso de que no haya
autocorrelación, pero generalmente el estadístico tendrá un valor comprendido entre
estos valores extremos, como podría ser por ejemplo: d = 1,34. Para poder decidir
sobre la existencia o no de autocorrelación dado un valor del Durbin – Watson,
utilizaremos como herramienta complementaria, el gráfico del Durbin – Watson:

0 2 4 dl du 4-du 4-dl
AUTOCORRELACION AUTOCORRELACION
POSITIVA NEGATIVA
NO HAY AUTOCORRELACION
ZONA DE
INDECISION
ZONA DE
INDECISION
LIMITES DEL ESTADISTICO DURBIN - WATSON


Dependiendo de la ubicación del estadístico calculado en el gráfico, podremos decidir
sobre la existencia o no de autocorrelación en base a la siguiente regla:




177

VALOR DEL DURBIN - WATSON RESULTADO
dl d < s 0 Se acepta la presencia de autocorrelación
positiva.
du d dl < < Resultado indeterminado.
du d du ÷ < < 4 No hay autocorrelación.
dl d du ÷ < < ÷ 4 4 Resultado indeterminado.
4 4 s < ÷ d dl Se acepta la presencia de autocorrelación
negativa.


Los valores de los límites dl y du son determinados a través de la tabla del estadístico
Durbin – Watson:

Por ejemplo para un modelo con 3 variables explicativas y 20 observaciones, los
valores de dl y du son:


Estadístico d de Durbin-Watson:puntos de significancia de dl y du
al nivel de significancia del 5%
dl du dl du dl du dl du dl du
.
.
.
17 1.133 1.381 1.015 1.536 0.897 1.710 0.779 1.900 0.664 2.104
18 1.158 1.391 1.046 1.535 0.933 1.696 0.820 1.872 0.710 2.060
19 1.180 1.401 1.074 1.536 0.967 1.685 0.859 1.848 0.752 2.023
20 1.201 1.411 1.100 1.537 0.998 1.676 0.894 1.828 0.792 1.991
21 1.221 1.420 1.125 1.538 1.026 1.669 0.927 1.812 0.829 1.964
22 1.239 1.429 1.147 1.541 1.053 1.664 0.958 1.797 0.863 1.940
23 1.257 1.437 1.168 1.543 1.078 1.660 0.986 1.785 0.895 1.920
.
.
.
K=5 K=1 K=2 K=3 K=4



Con lo cual el gráfico quedaría de la siguiente forma:







178
0 2 4 0,998 1,676 2,324 3.002
AUTOCORRELACION AUTOCORRELACION
POSITIVA NEGATIVA
NO HAY AUTOCORRELACION
ZONA DE
INDECISION
ZONA DE
INDECISION
LIMITES DEL ESTADISTICO DURBIN - WATSON



Dada una muestra de 50 observaciones y de 4 variables explicativas, que
puede usted decir sobre autocorrelación si (a) ¿d = 1,05? (b) ¿d = 1,40? (c) ¿d = 2,50?
(d)¿d = 3,97?.
43


Estadístico d de Durbin-Watson:puntos de significancia de dl y du
al nivel de significancia del 5%
dl du dl du dl du dl du dl du
.
.
.
39 1.435 1.540 1.382 1.597 1.328 1.658 1.273 1.722 1.218 1.789
40 1.442 1.544 1.391 1.600 1.338 1.659 1.285 1.721 1.230 1.786
45 1.475 1.566 1.430 1.615 1.383 1.666 1.336 1.720 1.287 1.776
50 1.503 1.585 1.462 1.628 1.421 1.674 1.378 1.721 1.335 1.771
55 1.528 1.601 1.490 1.641 1.452 1.681 1.414 1.724 1.374 1.768
60 1.549 1.616 1.514 1.652 1.480 1.689 1.444 1.727 1.408 1.767
65 1.567 1.629 1.536 1.662 1.503 1.696 1.471 1.731 1.438 1.767
.
.
.
K=5 K=1 K=2 K=3 K=4

0 2 4 1,378 1,721 2,279 2,622
AUTOCORRELACION AUTOCORRELACION
POSITIVA NEGATIVA
NO HAY AUTOCORRELACION
ZONA DE
INDECISION
ZONA DE
INDECISION
LIMITES DEL ESTADISTICO DURBIN - WATSON


a) d = 1,05 0<1,05<1,378 hay presencia de autocorrelación positiva.

43
Tomado de Gujarati. Ob cit.
EJERCICIO Nº 24
179
b) d = 1,40 1,378<1,40<1,721, no se puede decidir sobre la presencia o no de
autocorrelación.
c) d = 2,50 2,279<2,50<2,622, no se puede decidir sobre la presencia o no de
autocorrelación.
d) d = 3,97 2,262<3,97<4, hay presencia de autocorrelación negativa.




Sea el modelo:
t t t
u X Y + + =
1 0
| | donde Y denota el número de transacciones
comerciales que se realizan en una determinada unidad económica, y X el Producto
Nacional Bruto (PNB), se requiere detectar la presencia o no de autocorrelación en el
modelo, utilizando el estadístico Durbin – Watson.

AÑO Y X
1960 699 776
1961 730 811
1962 763 791
1963 749 825
1964 766 986
1965 858 1206
1966 438 1321
1967 1021 1495
1968 1084 1846
1969 1161 2140
1970 1257 2356
1971 1314 2694
1972 1385 3227
1973 1490 4006
1974 1580 4960
1975 1652 5940
1976 1778 6941

Respuesta:

Primeramente regresamos el modelo, para poder obtener los valores de los
residuales recordando que un residual es igual a la diferencia existente entre el valor
de Y observado y el valor de Y estimado:
t t t
Y Y U
ˆ ˆ
÷ =


t t t
u X Y + + =
1 0
| |
0
1
> |

T T t
u X Y ˆ
ˆ ˆ
1 0
+ + = | |


EJERCICIO Nº 25
180
( )( )
( )
188 , 0
000 . 936 . 58
14 , 753 . 051 . 11
47 , 489 . 2 17 835 . 292 . 164
47 , 101 . 1 47 , 489 . 2 17 054 . 667 . 57
ˆ
2 2 2
1
= =
÷
÷
=
÷
÷
=
¿
¿
X N X
Y X N XY
|


( ) 45 , 633 47 , 2489 188 , 0 47 , 101 . 1
ˆ ˆ
1 0
= ÷ = ÷ = X Y | |




T T
X Y 188 , 0 45 , 633
ˆ
+ =



AÑO Y X XY
1 1960 699.00 776.00 542,424.00 602,176.00
2 1961 730.00 811.00 592,030.00 657,721.00
3 1962 763.00 791.00 603,533.00 625,681.00
4 1963 749.00 825.00 617,925.00 680,625.00
5 1964 766.00 986.00 755,276.00 972,196.00
6 1965 858.00 1,206.00 1,034,748.00 1,454,436.00
7 1966 438.00 1,321.00 578,598.00 1,745,041.00
8 1967 1,021.00 1,495.00 1,526,395.00 2,235,025.00
9 1968 1,084.00 1,846.00 2,001,064.00 3,407,716.00
10 1969 1,161.00 2,140.00 2,484,540.00 4,579,600.00
11 1970 1,257.00 2,356.00 2,961,492.00 5,550,736.00
12 1971 1,314.00 2,694.00 3,539,916.00 7,257,636.00
13 1972 1,385.00 3,227.00 4,469,395.00 10,413,529.00
14 1973 1,490.00 4,006.00 5,968,940.00 16,048,036.00
15 1974 1,580.00 4,960.00 7,836,800.00 24,601,600.00
16 1975 1,652.00 5,940.00 9,812,880.00 35,283,600.00
17 1976 1,778.00 6,941.00 12,341,098.00 48,177,481.00
18,725.00 42,321.00 57,667,054.00 164,292,835.00
2
X




181
AÑO Y
1960 699.00 779.34 -80.34 6,454.19
1961 730.00 785.92 -55.92 24.42 596.34 3,126.82
1962 763.00 782.16 -19.16 36.76 1,351.30 367.03
1963 749.00 788.55 -39.55 -20.39 415.83 1,564.20
1964 766.00 818.82 -52.82 -13.27 176.04 2,789.74
1965 858.00 860.18 -2.18 50.64 2,564.41 4.74
1966 438.00 881.80 -443.80 -441.62 195,028.22 196,956.66
1967 1,021.00 914.51 106.49 550.29 302,816.88 11,340.12
1968 1,084.00 980.50 103.50 -2.99 8.93 10,712.66
1969 1,161.00 1,035.77 125.23 21.73 472.11 15,682.55
1970 1,257.00 1,076.38 180.62 55.39 3,068.27 32,624.31
1971 1,314.00 1,139.92 174.08 -6.54 42.82 30,303.15
1972 1,385.00 1,240.13 144.87 -29.20 852.87 20,988.48
1973 1,490.00 1,386.58 103.42 -41.45 1,718.27 10,696.11
1974 1,580.00 1,565.93 14.07 -89.35 7,983.78 197.96
1975 1,652.00 1,750.17 -98.17 -112.24 12,597.82 9,637.35
1976 1,778.00 1,938.36 -160.36 -62.19 3,867.35 25,714.69
18,725.00 0.00 533,561.24 379,160.78
Y
ˆ t
U
ˆ
1
ˆ ˆ
÷
÷
t t
U U
2
1
)
ˆ ˆ
(
÷
÷
t t
U U
2
ˆ
t
U


Después de haber obtenido los residuales procedemos a calcular el estadístico Durbin
– Watson, para posteriormente ubicarlo en el gráfico.



( )
407 , 1
78 , 160 . 379
24 , 561 . 533
ˆ
ˆ ˆ
1
2
2
2
1
= =
÷
=
¿
¿
=
=
÷
n
t
t
n
t
t t
u
u u
d


Estadístico d de Durbin-Watson:puntos de significancia de dl y du
al nivel de significancia del 5%
dl du dl du dl du dl du dl du
.
.
.
14 1.045 1.350 0.905 1.551 0.767 1.779 0.632 2.030 0.505 2.296
15 1.077 1.361 0.946 1.543 0.814 1.750 0.685 1.977 0.562 2.220
16 1.106 1.371 0.982 1.539 0.857 1.728 0.734 1.935 0.615 2.157
17 1.133 1.381 1.015 1.536 0.897 1.710 0.779 1.900 0.664 2.104
18 1.158 1.391 1.046 1.535 0.933 1.696 0.820 1.872 0.710 2.060
19 1.180 1.401 1.074 1.536 0.967 1.685 0.859 1.848 0.752 2.023
.
.
.
K=5 K=1 K=2 K=3 K=4

182
0 2 4 1,015 1,536 2,464 2,985
AUTOCORRELACION AUTOCORRELACION
POSITIVA NEGATIVA
NO HAY AUTOCORRELACION
ZONA DE
INDECISION
ZONA DE
INDECISION


1,015 <1,407<1,536, el estadístico cae en una zona de indecisión, por lo tanto no se
puede concluir nada sobre la existencia o no de autocorrelación en el modelo.
3. COMO SOLUCIONAR EL PROBLEMA DE AUTOCORRELACION

Dado el siguiente modelo:

t t t
u X Y + + =
1 0
| | (1)

t t t
u u c µ + =
÷1


donde µ = coeficiente de autocorrelación y
t
c es un término de perturbación
estocástica que cumple con todos los supuestos.


Lo anterior nos indica que en el modelo hay presencia de autocorrelación de primer
orden generado bajo un esquema autorregresivo de primer orden. Para solucionar
este problema lo que se hace es transformar el modelo de tal manera que el término
de perturbación quede libre del problema.

Transformación:

Sí la igualdad presentada en (1) es cierta, también es cierta en el período t-1,
por tanto podemos rezagar todo el modelo en un período:


1 1 1 0 1 ÷ ÷ ÷
+ + =
t t t
u X Y | | (2)

Multiplicando (2) por µ a ambos lados de la igualdad, se obtiene:


1 1 1 0 1 ÷ ÷
+ + =
t t
u X Y µ µ| µ| µ (3)

restando (3) de (1):


1 1 1 1 0 0 1 ÷ ÷ ÷
÷ + ÷ + ÷ = ÷
t t t t t t
u u X X Y Y µ µ| | µ| | µ

183

1 1 1 0 1
) ( ) 1 (
÷ ÷ ÷
÷ + ÷ + ÷ = ÷
t t t t t t
u u X X Y Y µ µ | µ | µ



t t t t t
X X Y Y c µ | µ | µ + ÷ + ÷ = ÷
÷ ÷
) ( ) 1 (
1 1 0 1



donde en el último paso se utilizó el supuesto del esquema autorregresivo de primer
orden.

El modelo resultante se conoce como modelo de diferencias generalizadas, en el cual
se hace necesario conocer el verdadero valor del coeficiente de autocorrelación.
Conocer este coeficiente en la práctica se hace muy difícil, por lo cual normalmente la
que se hace es buscar un valor estimado del mismo, con lo cual el modelo quedaría de
la siguiente forma:

t t t t t
X X Y Y c µ | µ | µ + ÷ + ÷ = ÷
÷ ÷
) ˆ ( ) ˆ 1 ( ˆ
1 1 0 1


Para estimar el valor de µ se pueden utilizar varias metodologías, entre las cuales
podemos mencionar:

a) µ basado en el estadístico de Durbin – Watson, para muestras grandes.

( ) µ ÷ = 1 2 d


2
1 ˆ
d
÷ = µ

b) Estimación del µ de Theil–Nagar basado en el estadístico d, para muestras
pequeñas:


2 2
2 2
2
1
ˆ
k n
k
d
n
÷
+ |
.
|

\
|
÷
= µ

donde n = número total de observaciones, k = Número de coeficientes betas y d =
estadístico Durbin-Watson.

c) Procedimiento en dos etapas de Cochrane – Orcutt.

c.1) Primero se estima el modelo original para obtener los residuales.
c.2) Obtenidos los residuales se precede a estimar µ mediante la siguiente
igualdad:

si
t t t
u u c µ + =
÷1
ˆ ˆ

184


¿
¿ ÷
=
2
1
ˆ
ˆ ˆ
ˆ
t
t t
u
u u
µ

En todos los casos mencionados anteriormente se utiliza el valor estimado de µ para
realizar la regresión del modelo de diferencias generalizadas




En la siguiente tabla tenemos los datos sobre importaciones (Y) y el Producto Interno
Bruto (X) para un determinado país.

AÑO Y X
1970 8.5324 23.5138
1971 8.9014 24.2506
1972 8.4803 24.1241
1973 8.8930 25.2862
1974 9.1000 26.2759
1975 9.6888 27.0954
1976 9.7070 27.5747
1977 9.8690 28.1368
1978 9.9479 28.2368
1979 10.3831 29.3655
1980 11.2380 30.8207
1981 11.1803 31.9207
1982 11.3324 32.3333
1983 11.6282 33.7559
1984 12.4099 35.6920
1985 12.4775 36.5885
1986 12.6901 37.2184
1987 13.2535 38.0230
1988 13.9578 39.2874
1989 14.6620 40.0920


EJERCICIO Nº 26
185
AÑO Y X XY
1 1970 8.5324 23.5138 200.6289 552.8983 8.3617 0.1707 0.0292
2 1971 8.9014 24.2506 215.8642 588.0901 8.6138 0.2876 0.1169 0.0137 0.0827
3 1972 8.4803 24.1241 204.5795 581.9741 8.5705 -0.0902 -0.3779 0.1428 0.0081
4 1973 8.8930 25.2862 224.8692 639.3924 8.9682 -0.0753 0.0150 0.0002 0.0057
5 1974 9.1000 26.2759 239.1103 690.4208 9.3069 -0.2069 -0.1316 0.0173 0.0428
6 1975 9.6888 27.0954 262.5212 734.1607 9.5874 0.1014 0.3083 0.0951 0.0103
7 1976 9.7070 27.5747 267.6689 760.3646 9.7514 -0.0444 -0.1458 0.0212 0.0020
8 1977 9.8690 28.1368 277.6823 791.6784 9.9438 -0.0747 -0.0304 0.0009 0.0056
9 1978 9.9479 28.2368 280.8963 797.3157 9.9780 -0.0301 0.0446 0.0020 0.0009
10 1979 10.3831 29.3655 304.9051 862.3338 10.3643 0.0188 0.0489 0.0024 0.0004
11 1980 11.2380 30.8207 346.3638 949.9149 10.8622 0.3758 0.3569 0.1274 0.1412
12 1981 11.1803 31.9207 356.8823 1,018.9305 11.2387 -0.0584 -0.4342 0.1885 0.0034
13 1982 11.3324 32.3333 366.4140 1,045.4449 11.3799 -0.0475 0.0109 0.0001 0.0023
14 1983 11.6282 33.7559 392.5189 1,139.4581 11.8667 -0.2386 -0.1910 0.0365 0.0569
15 1984 12.4099 35.6920 442.9322 1,273.9160 12.5293 -0.1194 0.1191 0.0142 0.0143
16 1985 12.4775 36.5885 456.5317 1,338.7191 12.8361 -0.3587 -0.2392 0.0572 0.1286
17 1986 12.6901 37.2184 472.3066 1,385.2086 13.0517 -0.3615 -0.0029 0.0000 0.1307
18 1987 13.2535 38.0230 503.9385 1,445.7478 13.3270 -0.0735 0.2880 0.0830 0.0054
19 1988 13.9578 39.2874 548.3631 1,543.4967 13.7597 0.1980 0.2715 0.0737 0.0392
20 1989 14.6620 40.0920 587.8270 1,607.3645 14.0351 0.6269 0.4289 0.1839 0.3930
218.3324 619.5915 6,952.8041 19,746.8299 0.0000 1.0602 1.1026
Y
ˆ t
U
ˆ
1
ˆ ˆ
÷ ÷
t t U U
2
1
)
ˆ ˆ
(
÷
÷
t t
U U
2
ˆ
t
U
2
X


La regresión mínimo cuadrática dio como resultado:


t t
X Y 3422 , 0 3147 , 0
ˆ
+ =

El estadístico Durbin-Watson es igual a:

962 , 0
1026 , 1
0602 , 1
= = d

0 2 4 1,100 1,537 2,463 2,900
AUTOCORRELACION AUTOCORRELACION
POSITIVA NEGATIVA
NO HAY AUTOCORRELACION
ZONA DE
INDECISION
ZONA DE
INDECISION


0 <0,962 <1,100 con lo cual se concluye que hay evidencia de autocorrelación positiva
en el modelo.

Para eliminar el problema de autocorrelación, estimaremos el modelo de diferencias
generalizadas:

t t t t t
X X Y Y c µ | µ | µ + ÷ + ÷ = ÷
÷ ÷
) ˆ (
ˆ
) ˆ 1 ( ˆ
1 1 0 1

186

para lo cual tendremos que estimar el valor del coeficiente de autocorrelación, la cual
se realizará a través de la identidad:


¿
¿ ÷
=
2
1
ˆ
ˆ ˆ
ˆ
t
t t
u
u u
µ


337 , 0
0735 , 1
3614 , 0
ˆ = = µ

AÑO
2 1971 0.2876 0.0491 0.0827
3 1972 -0.0902 -0.0260 0.0081
4 1973 -0.0753 0.0068 0.0057
5 1974 -0.2069 0.0156 0.0428
6 1975 0.1014 -0.0210 0.0103
7 1976 -0.0444 -0.0045 0.0020
8 1977 -0.0747 0.0033 0.0056
9 1978 -0.0301 0.0022 0.0009
10 1979 0.0188 -0.0006 0.0004
11 1980 0.3758 0.0071 0.1412
12 1981 -0.0584 -0.0220 0.0034
13 1982 -0.0475 0.0028 0.0023
14 1983 -0.2386 0.0113 0.0569
15 1984 -0.1194 0.0285 0.0143
16 1985 -0.3587 0.0428 0.1286
17 1986 -0.3615 0.1297 0.1307
18 1987 -0.0735 0.0266 0.0054
19 1988 0.1980 -0.0146 0.0392
20 1989 0.6269 0.1241 0.3930
0.3614 1.0735
t
U
ˆ
1
ˆ ˆ
÷ t t
U U
2
ˆ
t
U



Es importante hacer notar como al estimar el valor de µ se pierde una observación.
Teniendo el valor estimado de µ , se procede a estimar el modelo de diferencias
generalizadas.


t t t t t
X X Y Y c | | + ÷ + ÷ = ÷
÷ ÷
) 337 , 0 ( ) 337 , 0 1 ( 337 , 0
1 1 0 1



el cual regresado es igual a:

187

) 337 , 0 ( 353 , 0 0164 . 0 337 , 0
1 1 ÷ ÷
÷ + ÷ = ÷
t t t t
X X Y Y

modelo este que no presenta problemas de autocorrelación.


AÑO Y X X*Y*
0 1970 8.5324 23.5138
1 1971 8.9014 24.2506 6.0260 16.3264 98.3829 266.5521
2 1972 8.4803 24.1241 5.4805 15.9517 87.4234 254.4567
3 1973 8.8930 25.2862 6.0351 17.1564 103.5405 294.3412
4 1974 9.1000 26.2759 6.1031 17.7544 108.3564 315.2190
5 1975 9.6888 27.0954 6.6221 18.2404 120.7895 332.7135
6 1976 9.7070 27.5747 6.4419 18.4436 118.8120 340.1649
7 1977 9.8690 28.1368 6.5977 18.8441 124.3285 355.1002
8 1978 9.9479 28.2368 6.6220 18.7547 124.1941 351.7382
9 1979 10.3831 29.3655 7.0307 19.8497 139.5567 394.0116
10 1980 11.2380 30.8207 7.7389 20.9245 161.9332 437.8351
11 1981 11.1803 31.9207 7.3931 21.5341 159.2031 463.7182
12 1982 11.3324 32.3333 7.5646 21.5761 163.2151 465.5267
13 1983 11.6282 33.7559 7.8092 22.8595 178.5136 522.5579
14 1984 12.4099 35.6920 8.4912 24.3162 206.4732 591.2793
15 1985 12.4775 36.5885 8.2953 24.5603 203.7361 603.2093
16 1986 12.6901 37.2184 8.4852 24.8881 211.1811 619.4156
17 1987 13.2535 38.0230 8.9769 25.4804 228.7360 649.2504
18 1988 13.9578 39.2874 9.4913 26.4736 251.2694 700.8522
19 1989 14.6620 40.0920 9.9582 26.8521 267.3989 721.0358
218.3324 619.5915 141.1631 400.7864 3057.0438 8678.9778
1
337 , 0
÷
÷
t t
Y Y
1
337 , 0
÷
÷
t t
X X
2
* X


















188

En el cuadro que se presenta a continuación
44
se muestran los datos referidos al
número de transacciones comerciales que se realizan en una determinada unidad
económica (Y), y el Producto Nacional Bruto (PNB) para el período 1960 -1976:

Nº DE
AÑO TRANSACCIONES PNB
1960 699 776
1961 730 811
1962 763 791
1963 749 825
1964 766 986
1965 858 1206
1966 438 1321
1967 1021 1495
1968 1084 1846
1969 1161 2140
1970 1257 2356
1971 1314 2694
1972 1385 3227
1973 1490 4006
1974 1580 4960
1975 1652 5940
1976 1778 6941




Considerando el modelo de regresión lineal simple como modelo teórico:


t t t
u PNB Y + + =
1 0
| |



Trataremos de detectar y en su caso corregir, un posible problema de Autocorrelación.

Para realizar el análisis de la posible existencia de autocorrelación en los residuos, es
necesario estimar el modelo original






44
Tomado de: Díaz Fernández, Monserrat y María del Mar Llorente Marrón. Ob.Cit. p.218
EJERCICIO Nº 27
189




A partir de esta estimación, se genera la serie de mínimo cuadráticos correspondientes

Instricciones: GENR RESIDUOS = RESID

a) Contrastes Gráficos

a.1) Diagrama de disperción entre
t
u y
1 ÷ t
u

Instrucciones: QUICK/GRAPH/ SCATTER DIAGRAM/ RESIDUOS RESIDUOS(-1)





190
se puede observar que los puntos se colocan en el diagrama en su gran mayoría
en el primer cuadrante, por lo que puede ser indicativo de ausencia de
autocorrelación

a.2) Gráfico de los residuos en el tiempo.

Instrucciones: QUICK/GRAPH/LINE GRAPH/RESIDUOS






La representación gráfica de los residuos no presenta un comportamiento
sistemático lo cual indica la posible ausencia de autocorrelación en el modelo.

b) Contrate de Durbin – Watson

En la salida de regresión que ofrece el Eviews se puede encontrar el valor del
estadístico de Durbin-Watson el cual es : d= 1,40667

En las tablas podemos obtener los límites inferioe y superior ( ) du dl, , al 95% de
confianza, con un tamaño de muestra igual a 17 y con k igual a 1:






191
Estadístico d de Durbin-Watson:puntos de significancia de dl y du
al nivel de significancia del 5%
dl du dl du dl du dl du dl du
.
.
.
14 1,045 1,350 0,905 1,551 0,767 1,779 0,632 2,030 0,505 2,296
15 1,077 1,361 0,946 1,543 0,814 1,750 0,685 1,977 0,562 2,220
16 1,106 1,371 0,982 1,539 0,857 1,728 0,734 1,935 0,615 2,157
17 1,133 1,381 1,015 1,536 0,897 1,710 0,779 1,900 0,664 2,104
18 1,158 1,391 1,046 1,535 0,933 1,696 0,820 1,872 0,710 2,060
19 1,180 1,401 1,074 1,536 0,967 1,685 0,859 1,848 0,752 2,023
.
.
.
K=5 K=1 K=2 K=3 K=4

0 2 4 1,133 1,381 2,619 2,867
AUTOCORRELACION AUTOCORRELACION
POSITIVA NEGATIVA
NO HAY AUTOCORRELACION
ZONA DE
INDECISION
ZONA DE
INDECISION
1,40667


dado que 381 , 1 40667 , 1 133 , 1 = < = < = du d dl diremos que nos hemos situado en una
zona de indecisión, en la que nada podemos decir acerca de la presencia o no de
autocorrelación en el modelo.

c) Por último dado que suponemos que el esquema de autocorrelación mediante el
cual se genera la variable aleatoria es de primer orden, podemos contrastar la
presencia de autocorrelación, analizando la significatividad estadística del
parámetro µ en la regresión.

t t t
u u c µ + =
÷1






192
El estadístico µˆ no es estadísticamente significativo a un 5%, evidenciando la
ausencia de autocorrelación en el modelo.



Se ha recogido información
45
de la economía española para el período 1985-1997 de
las macromagnitudes consumo público (CP) y producto interior bruto a precios de
mercado (PIBPM), en millones de pesetas, con el objeto de estimar un modelo de
regresión lineal y comprobar la posible presencia de autocorrelación en las
perturbaciones, las series toman los siguientes valores:

AÑO PIBPM CP
1985 28.200.885 4.498.034
1986 32.323.992 4.740.221
1987 36.143.972 5.159.905
1988 40.158.739 5.368.137
1989 45.044.128 5.813.462
1990 50.145.195 6.197.776
1991 54.927.320 6.543.696
1992 59.104.986 6.808.095
1993 60.952.584 6.971.511
1994 64.811.535 6.948.140
1995 69.780.058 7.074.014
1996 73.743.261 7.141.101
1997 77.896.586 7.239.097


A partir de dicha información, contraste el posible incumplimiento de la hipótesis
clásica de no autocorrelación. En caso de detectar dicho problema, trate de corregirlo.

Solución:

Considerando el modelo de regresión lineal simple como modelo teórico:


t t t
u PIBPM CP + + =
1 0
| |



Trataremos de detectar y en su caso corregir, un posible problema de Autocorrelación.


45
Tomado de Pena Trampero, J. Bernardo. Ob.Cit. p.289
EJERCICIO Nº 28
193
Para realizar el análisis de la posible existencia de autocorrelación en los residuos, es
necesario estimar el modelo original




A partir de esta estimación, se genera la serie de mínimo cuadráticos correspondientes

Instricciones: GENR RESIDUOS = RESID

a) Contrastes Gráficos

a.1) Diagrama de disperción entre
t
u y
1 ÷ t
u






194
Se puede observar que los puntos se colocan en el diagrama en el primer y tercer
cuadrante, por lo que puede ser indicativo de presencia de autocorrelación positiva


a.2) Gráfico de los residuos en el tiempo.

Instrucciones: QUICK/GRAPH/LINE GRAPH/RESIDUOS



La presentación gráfica de los residuos presenta un comportamiento sistemático,
posiblemente cíclico que sigue indicando la posible presencia de problemas de
autocorrelación.


b) Contrate de Durbin – Watson

En la salida de regresión que ofrece el Eviews se puede encontrar el valor del
estadístico de Durbin-Watson el cual es : d= 0,343122

En las tablas podemos obtener los límites inferioe y superior ( ) du dl, , al 95% de
confianza, con un tamaño de muestra igual a 13 y con k igual a 1:








195
Estadístico d de Durbin-Watson:puntos de significancia de dl y du
al nivel de significancia del 5%
dl du dl du dl du dl du dl du dl du
.
.
.
11 0,927 1,324 0,658 1,604 0,595 1,928 0,444 2,283 0,316 2,645 0,203 3,005
12 0,971 1,331 0,812 1,579 0,658 1,864 0,512 2,177 0,379 2,506 0,268 2,832
13 1,010 1,340 0,861 1,562 0,715 1,816 0,574 2,094 0,445 2,390 0,328 2,692
14 1,045 1,350 0,905 1,551 0,767 1,779 0,632 2,030 0,505 2,296 0,389 2,572
15 1,077 1,361 0,946 1,543 0,814 1,750 0,685 1,977 0,562 2,220 0,447 2,472
.
.
.
K=5 K=6 K=1 K=2 K=3 K=4



0 2 4 1,010 1,340 2,660 2,990
AUTOCORRELACION AUTOCORRELACION
POSITIVA NEGATIVA
NO HAY AUTOCORRELACION
ZONA DE
INDECISION
ZONA DE
INDECISION
0,343122




dado que 010 , 1 40667 , 1 0 = < = < dl d diremos que existe autocorrelación positiva de
primer orden


c) Por último dado que suponemos que el esquema de autocorrelación mediante el
cual se genera la variable aleatoria es de primer orden, podemos contrastar la
presencia de autocorrelación, analizando la significatividad estadística del parámetro
µ en la regresión.

t t t
u u c µ + =
÷1






196



Como se puede observar el coeficiente pendiente ( 876997 , 0 = µ ) es estadisticamente
significativo a un 5% de significancia, confirmando la existencia de autocorrelación
positiva en el modelo.

SOLUCION

Los instrumentos gráficos analizados y el contrates de Durbin-Watson, han mostrado
la existencia de autocorrelación de primer orden que puede aproximarse por un
esquema AR(1)
46
.

Las opciones a ejecutar en Eviews para estimar un modelo con autocorrelación, son
las mismas que se requieren para estimar el modelo por mínimos cuadradaos
ordinarios, pero añadiendo una serie de diferencias.

Nos situamos en el objeto ecuación en el que hemos estimado por mínimo cuadrados
ordinarios el modelo de consumo.

Pulsamos el botón ESTIMATE de su barra de herramientas para reestimar el modelo
inicial, pero suponiendo un esquema de autocorrelación para las perturbaciones
mediante in proceso AR(1). En el cuadro de diálogo correspondiente a la
especificación incorporamos al lado de las variables ya escritos el término AR(1), tal
como puede verse en la figura a continuación




46
Este esquema se desarrollara con mas detalle en el capítulo X.
197



Esta metodología se basa en el método de Cochrane-Orcutt, el cual es un criterio
de estimación iterativo para obtener estimadores lineales, insesgados y óptimos, bajo
la especificación del modelo MCO. Los resultados que se obtienen son:




Esta estimación muestra los resultados de la repetición 23 veces del proceso
Cochrane-Orcutt para conseguir la convergencia. Cabe destar que la variable PIBPM


198
pasa a ser no significativa, mientras que el proceso autorregresivo es significativo a un
5%.





La tabla a continuación
47
indica el nivel de importaciones de USA y el PNB (ambos en
miles de millones de dólares) desde 1960 hasta 1979

AÑO IMPORTACIONES PNB
1960 23,2 506,1
1961 23,1 523,3
1962 25,2 563,8
1963 26,4 594,7
1964 28,4 635,7
1965 32,1 688,1
1966 37,7 753,1
1967 40,6 796,3
1968 47,7 868,5
1969 52,9 935,5
1970 58,5 982,4
1971 64,2 1063,4
1972 75,9 1171,1
1973 94,4 1306,6
1974 131,9 1412,9
1975 126,9 1528,8
1976 155,4 1702,2
1977 185,8 1899,5
1978 217,5 2127,6
1979 260,9 2368,5



Se pide:

a) Estimar una función que relacione las importaciones con el PNB.
b) Determinar la posible existencia de autocorrelación en el modelo mediante:
b.1) Contrastes Gráficos.
b.2) Contraste de Durbin – Watson.
c) En caso de ser necesario corregir el problema






47
Tomado de: Salvatore, Dominick. “Econometría”. Serie Schaum. McGraw-Hill.. Mexico. 1983. P161

EJERCICIO Nº 29
199

CAPITULO IX
VARIABLES FICTICIAS, MODELOS DE REZAGOS DISTRIBUIDOS Y
MODELOS AUTORREGRESIVOS.
1. VARIABLES FICTICIAS O CUALITATIVAS (VARIABLES DUMMY)

En la especificación del modelo de regresión lineal hemos considerado, hasta
ahora, que las variables seleccionadas son de carácter cuantitativo, es decir, variables
que toman de forma continua valores reales.

Factores como el sexo, estado civil o la localización geográfica constituyen
variables de carácter cualitativo que desempeñan un papel protagonista en el estudio
de los fenómenos económicos, que hasta ahora no hemos considerado en el modelo
de regresión. Cuando queremos construir un modelo econométrico que, por ejemplo,
describa las pautas de consumo con relación a un determinado bien, la consideración
de factores como la localización, rural o urbana, de las unidades familiares o la
situación de la cabeza de familia con relación al empleo, el componente estacional,
además de las variables cuantitativas habituales, constituyen variables a tener en
cuenta para explicar el comportamiento de la variable dependiente.

Los factores de naturaleza cualitativa no sólo se incluyen dentro de la categoría
de variables explicativas, sino que también pueden aparecer en el modelo como
variable a explicar o dependiente. El análisis de la influencia de la localización
geográfica, rural o urbana, en el comportamiento electoral de una determinada
población constituyen un claro ejemplo con relación a esta cuestión. El tratamiento de
estas situaciones requiere la construcción de unas variables artificiales que permitan
cuantificar las variaciones cualitativas de los distintos factores considerados. En
términos econométricos, estas variables se denominan variables ficticias y únicamente
toman los valores de 1 y 0. Tomarán el valor de 1 cuando en el elemento muestral
correspondiente se constate la presencia del atributo considerado, y el valor 0, cuando
aquel no esté presente en la correspondiente unidad muestral. En otras palabras
valores 1 y 0 para denotar la presencia o ausencia, respectivamente, del atributo
considerado.

Estas variables reciben también la denominación de variables binarias o
dicotómicas, con relación a los dos valores que toman, 1 y 0. En ocasiones se utiliza
también la denominación inglesa, variables dummy, para su consideración.
48


Un ejemplo de un modelo que utilice variables ficticias sería:



48
Díaz Fernández, Montserrat. Ob cit.
200

t t t t o t
u D X X Y + + + + =
3 2 2 1 1
| | | |

Donde D es la variable ficticia. Es de uso práctico utilizar la letra D (dummy) para las
variables ficticias y así poder diferenciar a simple vista, una variable cualitativa de una
cuantitativa

Para considerar la interpretación que en un modelo econométrico se debe dar a
los coeficientes de las variables ficticias plantearemos un ejemplo muy sencillo.
Supongamos que tenemos una muestra con los salarios de N individuos y una
característica ocupacional que representa si el individuo es un trabajador es un
profesional universitario o no. Se pretende explicar el nivel de salarios de los
individuos y para ello se plantea la siguiente regresión simple:


i i i
u D Y + + =
1 0
| |

Donde
i
Y es el salario individual y
i
D es una variable ficticia que tomará el valor de 1
si el trabajador es profesional universitario y 0 si el trabajador no es profesional
universitario.

En este ejemplo tan simple,
0
| mide el salario esperado de un trabajador no
profesional universitario, mientras que
1
| mide la diferencia entre los salarios
esperados para el trabajador profesional y el no profesional.

Si en el momento de realizar la prueba de significación individual según la
metodología acostumbrada, concluimos que
1
| no es significativo, estaremos
aceptando que no existen diferencias en los salarios entre trabajadores profesionales y
no profesionales.

Supongamos que en lugar de tener un atributo de calificación con dos
posibilidades o valores distintos, tenemos que dicho atributo recoge la posibilidad de
licenciados universitarios, técnicos superiores, y trabajadores sin educación
universitaria. Consideremos que el salario de los tres tipos de trabajadores puede ser
diferente. Para contrastarlo plantearemos la siguiente especificación:


i i i i
u D D Y + + + =
2 2 1 1 0
| | |

en la que de nuevo
i
Y es el salario del trabajador i y las variables
i
D
1
y, están
definidas:






201



La combinación de valores de las variables es la siguiente

Y con ello los valores esperados para el salario son:



=
i
D
1
1, si el trabajador es
licenciado universitario
0, si no lo es
1, si el trabajador es
técnico superior
0, si no lo es
=
i
D
2
TRABAJADOR
Licenciado 1 0
Técnico Superior 0 1
No universitario 0 0
i
D
1 i
D
2
0
|
i
D
1 i
D
2
si = 0 = 0
1 0
| | + si
i
D
1 i
D
2
= 1 = 0
2 0
| | + si
i
D
1 i
D
2
= 0 = 1
202

donde ahora
0
| mide el salario esperado de un trabajador sin estudios universitarios,
mientras que
1
| mide la diferencia entre los salarios esperados para un licenciado y el
no universitario y
2
| la diferencia entre los salarios esperados para técnicos
superiores y no universitarios
49
.

Cuando se introducen variables ficticias en un modelo de regresión, si
pretendemos considerar m situaciones o el atributo está compuesto de m alternativas,
se debe tener cuidado de introducir m-1 variables ficticias. De lo contrario, se
produciría un problema de multicolinealidad perfecta en el modelo, a menos que a la
vez que introducimos las m variables cualitativas, excluyamos de la especificación la
constante.






En la siguiente tabla se presenta información
50
trimestral (sin ajustar trimestralmente)
sobre venta de acciones de fondos mutuales por parte de la industria de fondos
mutuales durante el periodo 1968-1973.

Valor de acciones de Fondos Mutuales
(Millones de US$)
TRIMESTRES
AÑO I II III IV
1968 1.564 1.654 1.607 1.994
1969 2.129 1.658 1.428 1.503
1970 1.381 1.039 975 1.230
1971 1.304 1.288 1.108 1.446
1972 1.398 1.176 1.099 1.219
1973 1.382 888 933 1.156

Se requiere estimar un modelo que permita determinar si el factor “trimestre” es
relevante para la venta de acciones de fondos mutuales.

Solución:


49
Para un estudio completo del tema, ver: Gujarati. Ob. Cit.
50
Tomado de Gujarati, Damodar. Ob.Cit. p 525
EJERCICIO Nº 30
203
Par determinar si el factor estacional es importante, estimaremos un modelo de la
siguiente forma:


t t
u D D D D VENTAS + + + + =
4 4 3 3 2 2 1 1
| | | |


Donde: D
1
= 1 para el primer trimestre, 0 de lo contrario.
D
2
= 1 para el segundo trimestre, 0 de lo contrario.
D
3
= 1 para el tercer trimestre, 0 de lo contrario.
D
4
= 1 para el cuarto trimestre, 0 de lo contrario.







Como se puede observar en el modelo ya regresado, todos los coeficientes son
significativos al 5%, lo que indica que el factor estacional es importante para la
estimación de la venta de fondos mutuales

2. MODELO DE REZAGOS DISTRIBUIDOS

Cuando se analiza un fenómeno económico, normalmente nos encontraremos que la
relación causa efecto no sucede en el mismo período, por ejemplo, la emisión de
dinero inorgánico por parte del gobierno y su posterior incidencia en la elevación del
nivel general de precios (inflación) no sucede inmediatamente, generalmente, esto

204
sucede con cierto número de períodos de diferencia, por la tanto es importante
especificar en un modelo este hecho. Tal especificación lo podemos realizar a través
de un modelo de rezago distribuido, el cual es un caso particular de las series de
tiempo.

Un modelo de rezagos distribuidos se caracteriza por incluir no solamente los
valores actuales sino además los valores rezagados (pasados) de las variables
explicativas:


t k t k t t t t
u X X X X Y + + + + + + =
÷ ÷ ÷
| | | | o ...
2 2 1 1 0


donde
0
| se conoce como el multiplicador de corto plazo o de impacto, porque da el
cambio en el valor medio de Y que sigue a un cambio unitario en X en el mismo
período de tiempo. Si el cambio en X se mantiene al mismo nivel desde el principio,
entonces ( )
1 0
| | + nos da el cambio en (el valor medio de) Y en el período siguiente,
( )
2 1 0
| | | + + en el que sigue y así sucesivamente. Estas sumas parciales se
denominan multiplicadores intermedios. Finalmente, después de K períodos se obtiene

| | | | | | = + + + + =
¿
=
k
k
i
i
...
2 1 0
0


que se conoce como el multiplicador de rezagos distribuidos de largo plazo o total,
Siempre y cuando la suma | exista.
Los problemas que surgen al aplicar la estimación mínimo cuadrática a los
modelos de rezagos distribuidos son:

a) Se pierden k grados de libertad porque estos modelos solo se pueden
estimar a partir de (n-k) observaciones, si k es grande esto conduce a una
reducción considerable en el número de observaciones efectivas utilizadas.
b) Frecuentemente existe multicolinealidad elevada entre las variables
explicativas, y esto da como resultado estimaciones imprecisas de las.

Usualmente para solventar los problemas antes mencionados, se estiman
modelos alternos, como son los modelos de ajuste parcial. Modelo de expectativas
adaptables y la aproximación polinomial de Almon.
51










51
Ver: Gujarati. Ob.cit. Cap. 17.
205


Ejemplo de modelo de rezagos distribuidos
52


Supóngase que una persona recibe un incremento salarial de US$ 2.000 en su
pago anual y supóngase que se trata de un incremento “permanente” en el sentido de
que se mantiene el incremento en el salario. ¿Cuál será el efecto de este incremento
en el ingreso sobre el gasto de consumo anual de la persona?.

Inmediatamente después del aumento en el ingreso, la gente usualmente no se
apura a gastarse todo el incremento inmediatamente. Así, el beneficiario del ejemplo
puede decidir aumentar su gasto de consumo en US$ 800 durante el primer año
siguiendo el incremento salarial en el ingreso, en US$ 600 en el siguiente año y en
otros US$ 400 un año después y ahorra el resto. A fines del tercer año, el gasto de
consumo anual de la persona habrá aumentado en US$ 1.800. Se puede escribir la
función de consumo como:


t t t t t
u X X X constante Y + + + + =
÷ ÷ 2 1
2 , 0 3 , 0 4 , 0

donde Y es el gasto de consumo y X es el ingreso.

La ecuación anterior muestra que el efecto de un incremento de US$ 2.000 se
propaga, o se distribuye, durante un período de tres años. Por consiguiente modelos
como este se denominan modelos de rezagos distribuidos porque el efecto de una
causa dada ( el ingreso) se propaga durante un número de períodos de tiempo.





52
Gujarati. Ob.cit.

10 ---- ---- ---- ----
20 10 ---- ---- ----
30 20 10 ---- ----
40 30 20 10 ----
50 40 30 20 ----
. . . . .
. . . . .
. . . . .
100 90 80 70 10
GENERACION DE UN BANCO DE DATOS A
PARTIR DE LOS REZAGOS DE X
t
X
1 ÷ t
X
2 ÷ t
X
3 ÷ t
X
n t
X
÷
206





Se desea estimar un modelo
53
. que permita explicar el número de vehículos de
fabricación nacional (FABNAC) a partir de la variable Importaciones de Vehículos
(IMPORT) retardada en número diferente de períodos.


La determinación, desde un punto de vista econométrico, se convierte en un problema
de selección de modelos en el que hay que tener presente que si el número de
retardos es escaso incurrimos en un error de especificación por omisión, mientras que
si es excesivo cometeremos un error de especificación por inclusión.


La selección entre modelos puede llevarse a cabo comparando el coeficiente de
determinación ajustado a cada uno de ellos y/o utilizando algún criterio de información
como el de Akaike o el de Schwarz
54
(ambos calculados por Eviews)


Para tal fin vamos agregando un retardo por vez al modelo y vamos observando los
estadísticos antes señalados.


En la tabla que se presenta a continuación, se recogen para cada uno de los modelos
estimados, el número de retardos utilizados (M), el número total de observaciones (N
*
= N – M), el valor del coeficiente de determinación ajustado (CDA), el criterio de
información de Akaike (AIC) y el criterio de Schwarz (SBC).








53
Tomado de: Carrascal A. Ursicino. Ob.Cit. p.309.
54
- Coeficiente de Determinación ajustado ( )
2
R (Adjusted R-squared):Este coeficiente se obtiene a
partir del R
2
, ponderándolo por los grados de libertad
|
.
|

\
|
÷ ÷
÷
÷ =
1
1
1
2 2
k n
n
R R
La ventaja que presenta este coeficiente frente al R
2
es que permite comparar la capacidad explicativa
de modelos referidos a una misma muestra de la misma variable endógena con distinto número de
variables explicativas.
- El criterio de información de Akaike (Akaike info criterion) y el Criterio de Schwarz (Schwarz criterion),
son dos estadísticos que sirven para analizar la capacidad explicativa de un modelo y permite realizar
comparaciones a este respecto entre modelos anidados.
EJERCICIO Nº 31
207

M T* CDA AIC SBC
0 25 0,782131 19,45869 19,55620
1 24 0,793596 19,48690 19,63416
2 23 0,790627 19,55606 19,75353
3 22 0,770240 19,70695 19,95491
4 21 0,827643 19,49262 19,79105
5 20 0,919698 18,81132 19,15982
6 19 0,966824 18,00576 18,40342
7 18 0,979235 17,59055 18,03573
8 17 0,972380 17,78463 18,27476


Los resultados de la tabla llevan a seleccionar el modelo que incluye siete retardos de
la variable IMPORTACIONES, ya que es el que presenta el mayor coeficiente de
determinación ajustado y el menor valor en los criterios de Akaike y de Schwarz.











208
3. MODELOS AUTORREGRESIVOS

En los diferentes estudios económicos es interesante estudiar el
comportamiento de una variable a través del tiempo. Normalmente el comportamiento
de una variables es explicado por el comportamiento que ha tenido la misma en
períodos pasados, por ejemplo, el consumo de una persona para un período
determinado está influenciado en cierta medida por su patrón de consumo, es decir de
la forma en que viene consumiendo a través del tiempo. Un modelo que refleje esta
situación sería:

t t t
u C C + + =
÷1 1 0
o o

Si el modelo incluye uno o más valores rezagados de la variable dependiente
entre sus variables explicativas, se denomina modelo autorregresivo. En la literatura a
este tipo de modelos también se les conoce como modelos dinámicos puesto que
señalan la trayectoria en el tiempo de la variable dependiente en relación con su(s)
valor(es) pasado(s).

En forma genérica, un modelo autorregresivo se puede esquematizar de la
siguiente forma:


t t t t
u Y X Y + + + =
÷1 2 1 0
| | |

Es importante resaltar que en este tipo de modelos, la aparición de
1 ÷ t
Y como
variable explicativa puede crear algunos problemas estadísticos.
1 ÷ t
Y al igual que, es
estocástico (aleatorio), lo cual significa que se tiene una variable explicativa
estocástica en el modelo. Se debe recordar que la teoría clásica de mínimos
cuadrados se basa en el supuesto de que las variables explicativas o bien sean no
estocásticas o, en caso de serlo, están distribuidas independientemente del término de
perturbación estocástico.

Igualmente la presencia de Y rezagado viola uno de los supuestos en los
cuales se basa la prueba de Durbin-Watson. Por consiguiente, se hace necesario
utilizar un método diferente para comprobar la existencia o no de autocorrelación en
un modelo autorregresivo (por ejemplo, la prueba h de Durbin.






Un investigador utilizando datos anuales
55
para el período 1964-1998 para la
formación bruta de capital fijo (I80) y del producto interior bruto a coste de los factores


55
Tomado de: Carrascal A. Ursicino. Yolanda Gonzalez G. Y Beatriz Rodríguez. “Análisis Econométrico
con Eviews”. RA-MA. Madrid. 2001. p.296.
EJERCICIO Nº 32
209
(PIBCF80) en pesetas constantes de 1980, intentó explicar la producción en función
de la inversión. Para tal fin estimó el siguiente modelo:

t t t t
u PIBCF I PIBCF + + + =
÷1 2 1 0
80 80 80 | | |


obteniéndose los siguientes resultados:




Los resultados muestran la significancia individual de los coeficientes de I80 y
PIBCF80(-1). Como es un modelo autorregresivo, no podemos utilizar el estadístico de
Durbin-Watson para chequear la existencia o no de autocorrelación de primer orden en
el modelo. Para realizar este análisis podemos utilizar el estadístico de la h de Durbin
o el Contraste de Breusch-Godfrey.

El Contraste de Breusch-Godfrey lo realizamos desde la ventana de la ecuación MCO
seleccionando en el menú: VIEW/RESIDUAL TEST/SERIAL CORRELATION LM.














210







En los resultados podemos observar la no significación individual de RESID(-2), lo que
lleva a plantear la existencia de un esquema AR(1)










211



El modelo finalmente estimado permite concluir que el efecto a corto plazo de la
inversión sobre el producto interior bruto es igual a 0,597. Así mismo, esa unidad
adicional de inversión genera efectos sobre el producto interior bruto de los periodos
siguientes, de modo que a largo plazo el efecto de la inversión sobre el PIB se cifra en
3,54 unidades (3,54= 0,5972/(1-0,8314))


4. ANALISIS DE LA ESTABILIDAD ESTRUCTURAL DE LOS COEFICIENTES

En las series de tiempo, una de las hipótesis que suponemos cumple el modelo de
regresión es que los coeficientes se mantienen constantes para todo el período
muestral. Sin embargo, es posible que existan submuestras para las que el
comportamiento del modelo, su estructura, sea diferente, siendo necesario contrastar
esta posibilidad.

Una de las pruebas más populares para identificar un cambio estructural en el modelo,
es la Prueba de CHOW.

Dada una muestra de tamaño N, se dividirá en la unidad temporal en la que se
produce el cambio estructural de los coeficientes, obteniéndose dos submuestras de
tamaño n
1
y n
2
, respectivamente. El contraste de estabilidad en el comportamiento
estructural del modelo se planteará comprobar si los coeficientes se mantienen
constantes para las dos submuestras, o por el contrario, se mantienen constantes para
las dos submuestras.

Dado
t t t
u X Y + + =
1 0
o o con N - k g.l. (1)


t t t
X Y c | | + + =
1 0
con n
1
– k g.l. (2)
212

t t t
X Y v o o + + =
1 0
con n
2
– k g.l. (3)

1 1 1
1 1 0
:
:
o |
o |
=
=
H
H


Si el modelo presenta un comportamiento estable, se estimaría el modelo (1) con una
muestra de N = n
1
+ n
2
, observaciones. Si no presenta un comportamiento estable,
necesariamente hay que estimar un modelo para cada submuestra, es decir los
modelos (2) y (3).

Denominando SRC, a la suma de residuos mínimo-cuadráticos de la muestra de
tamaño N, y SRC
n1
y SRC
n2
, respectivamente, la suma de residuos al cuadrado de
cada submuestra individualmente, se calcula el estadístico F siguiente:

( )
2k n n
SRC SRC
k
SRC SRC SRC
F
2 1
n2 n1
n2 n1 N
÷ +
+
+ ÷
=


A continuación se presenta un modelo en el cual el crédito interno neto (CRED) está
en función de la oferta monetaria (M1). Para el período: enero de 1980 - noviembre de
1998.






213


Observando el gráfico de las variables podemos observar cambios en la pendiente de
la curva del crédito interno neto en los años 1991 y 1993, lo cual puede sugerir que
para esos períodos hubo un cambio estructural en el modelo.

Para analizar en Eviews la estabilidad estructural de los coeficientes a través el test de
Chow, seleccionamos en la barra de herramientas VIEW / STABILITY TESTS /
CHOW BREAK POINT TEST




Lo que da a lugar a un cuadro de dialogo como el que se muestra a continuación:

214


En el mismo deben escribirse los puntos, fechas o números de observaciones en los
que se cree que ha existido el cambio estructural. También se pueden considerar más
de un punto de ruptura, siempre con la precaución de que el número de observaciones
de cada submuestra sea superior a k+1, el número de coeficientes o parámetros a
estima.

En la tabla aparecen los valores estadísticos que calcula Eviews para contrastar un
cambio estructural en junio de 1996. El valor del estadístico F y su probabilidad indican
el rechazo de la hipótesis nula de estabilidad estructural, puesto que la probabilidad de
rechazar dicha hipótesis siendo cierta no supera el 5% (0,05). Por tanto, se concluye
que en el modelo estimado se produce un cambio estructural en junio de 1991.



.













215
CAPITULO X
ESTACIONARIEDAD

Según José Otero
56
, una serie de tiempo o serie cronológica, es una sucesión de
valores observados de una variable referidos a momentos o a periodos de tiempo
diferentes, generalmente regulares. La característica distintiva entre una serie de
tiempo , en contraposición a las observaciones de corte transversal, es que los datos
aparecen ordenados cronológicamente.

Una serie de tiempo está conformada por las siguientes partes
57
:

Y = sistemática + determinista + aleatoria

La variable Y se dice ser estocástica por que su valor en cada momento del tiempo
está en función de una parte conocida bastante predecible y de una parte desconocida
o impredecible. La parte conocida, a su vez, contiene dos elementos: uno sistemático
que recoge patrones de comportamiento del fenómeno de interés (como la
estacionalidad) y otro determinista que recoge características predeterminados de la
serie. La parte puramente aleatoria está formada de eventos no explícitamente
considerados en el modelo o factores estocásticos (tendencia estocástica)

En este capítulo describiremos la metodología para la estimación de un tipo de
modelos estocásticos especialmente útiles para la predicción de series de tiempo, los
modelos ARIMA (Autoregressive Integrated Moving Average) a través de la
metodología desarrollada por Box y Jenkins
58
(1976) para tratar modelos lineales
univariantes. Los cuales están conformados por dos componentes, la parte
autorregresiva, a fin de recoger la parte determinista del modelo, y la partes de
promedios móviles, que pretende reflejar el componente estocástico.
1.PROCESOS ESTOCASTICOS

Un proceso estocástico| |
t
X , para t = 1,2,3,..., se define como una colección de
variables aleatorias,
t
X , ordenadas de acuerdo con el parámetro discreto , que en


nuestro contexto es el tiempo. En otras palabras se asume que cada valor
t
X X X ,..., ,
2 1
en la serie es extraído al azar de una distribución de probabilidad.


56
Otero, José M. “Modelos Econométricos y Predicción de Series Temporales”.Editorial AC. España.
1989. p1.
57
Blanco Odio, Carlos M. “Aspectos Conceptuales Sobre Series de Tiempo”. Banco Central de
Venezuela. Mimeo,1997 p.6.
58
Box, George y Gwilym Jenkis. “Time Series Analysis, Forecasting and Control”. San Francisco, Calif.
Holden Day. 1976.
216
2. CAMINATA ALEATORIA

El ejemplo mas simple de una serie de tiempo estocástica es el proceso de caminata
aleatoria o Random Walk
59
. En el proceso más simple de caminata aleatoria cada
cambio sucesivo en
t
y es extraído en forma independiente de una distribución de
probabilidad con media 0. Por tanto,
t
y está determinado por:

t t t
y y c + =
÷1


con ( ) 0 =
t
E c , ( )
2 2
o c =
t
E y ( ) 0 =
s t
E c c para t = s. Dicho proceso puede ser
representado por los lanzamientos sucesivos de una moneda, donde una cara recibe
un valor de +1 y una cruz recibe un valor de –1.

A menudo, la caminata aleatoria es comparada con la caminata de una persona ebria.
Al dejar el bar, el ebrio se mueve a una distancia aleatoria
t
u en el tiempo t si el o ella
continúa caminando indefinidamente, se alejarán cada vez más del bar. Lo mismo se
dice acerca del precio de las acciones. El precio de las acción hoy es igual al precio de
la acción ayer más un “shock” o innovación aleatoria
60


Consideremos el caso en el que se requiere un pronóstico para un proceso de
caminata aleatoria. El pronóstico está dado por:

( ) ( )
t t t t t t
y E y y y y E y = + = =
+ + + 1 1 1 1
,..., / ˆ c

3. ESTACIONARIEDAD

Cuando se comienza a desarrollar modelos para series de tiempo, se desea saber si
es posible suponer que el proceso estocástico subyacente que generó la series es
invariable con respecto al tiempo. Si las características del proceso estocástico
cambian con el tiempo; es decir, si el proceso no es estacionario, en general será
difícil representar la serie de tiempo durante intervalos de tiempo pasados y futuros
con un modelo algebraico simple. Por el contrario, si el proceso estocástico está fijo en
el tiempo; es decir, si es estacionario, entonces podemos modelar el proceso a través
de una ecuación con coeficientes fijos que pueden estimarse a partir de datos
pasados.



En sentido amplio, se dice que un proceso estocástico es estacionario (o débilmente
estacionario) si su media y su varianza son constantes en el tiempo y si el valor de la
covarianza entre dos períodos depende solamente de la distancia o rezago entre dos
períodos de tiempo y no del tiempo en el cual se ha calculado la covarianza. En otras

59
Pindyck, Robert. Ob.Cit. p.515.
60
Gujarati, Damodar. Ob.Cit. p.702
217
palabras, una serie es estacionaria cuando su distribución de probabilidad no depende
del tiempo. Esto implica que a pesar de sus oscilaciones la serie tiende a converger a
un valor medio fijo, y su varianza es constante.

Las series no estacionarias son aquellas cuya media o varianza cambian con el
tiempo. Cuando sólo la media depende del tiempo se dice que existe tendencia
determinística y cuando es la varianza la que depende del tiempo, se habla de
tendencia estocástica. Es de resaltar que la mayoría de las series económicas
encontradas en la práctica son no estacionarias. Un aspecto importante a considerar
con respecto a las series estacionarias, tiene que ver con la innovaciones, lo que
significa que mientras un shock tiene carácter transitorio en series estacionarias, su
efecto es permanente sobre fenómenos no estacionarios.

Gráfico Nº 1 Gráfico Nº 2














En el gráfico Nº 1
61
se puede observar una serie no estacionaria, en el mismo se
puede
observar claramente una tendencia, lo que es indicativo de que la media no es
constante para toda la serie. En el gráfico Nº 2 se muestra una serie de tiempo
estacionaria

La definición de estacionariedad en sentido estricto implica que las características del
proceso estocástico no sufren alteración al considerar tiempos históricos diferentes

A continuación se presenta un cuadro resumiendo las características principales de
una serie estacionaria y de una no estacionaria:


61
El ejemplo es tomado de Pulido, Antonio y Ana María López. Ob.Cit. y el mismo consiste en una serie
de tiempo que abarca el periodo 1980-1998, con periodicidad mensual de un indicador de renta salarial
real para la economía española.
218
ESTACIONARIA NO ESTACIONARIA
Tiene una media constante y hay una
tendencia de la serie a volver hacia esta
media cuando se ha desviado de ella. Por
tanto tiende a fluctuar alrededor de la media
Tiene un comportamiento divagante, en el
sentido de que no se manatiene sobre un
valor medio a lo largo de su historia.
Tiene autocorrelaciones que decrecen
rapidamente al alejernos en el tiempo
Las autocorrelaciones tienden a uno para
cualquier retardo
Tiene varianza finita e independiente del
tiempo
La varianza depende del tiempo.
Tiene memoria limitada de su
comportamiento pasado. Por tanto los
efectos de un Shock aleatorio son sólo
transitorios y van decreciendo (perdiendo
fuerza) en el tiempo.
El proceso tiene memoria ilimitada y, por
tanto, un shock aleatorio tendrá efectos
permanentes en el proceso.



Muy pocas series económicas de tiempo son estacionarias. Los motivos de la falta de
estacionariedad suelen ser:

a) Se presenta una tendencia.
b) La varianza no es una constante.
c) Hay variaciones estacionales.

La presencia de variaciones estacionales se traduce en una variabilidad de la media
del proceso, lo que es contrario a la hipótesis de estacionariedad. Afortunadamente, es
posible transformar muchas series económicas de tiempo en otras estacionarias,
sometiéndolas a operaciones algebraicas.


4. RAICES UNITARIAS, OPERADOR DIFERENCIA Y ORDEN DE
INTEGRACION DE UNA SERIE DE TIEMPO

es importante destacar la asociación existente entre la noción de serie no estacionaria
y raíz unitaria, para ello consideramos la siguiente representación autorregresiva de la
serie X
t:

t t t
a X X + =
÷1
|
donde
t
a es un ruido blanco




utilizando el operador de retardo ( )
j t t
j
X X B
÷
= obtenemos la siguiente representación:
t t t t
BX a X X | | = + =
÷1


219
t t t
a BX X = ÷ ¬ |

( )
t t
a X B = ÷ ¬ | 1

( )
t t
a X B = ¬| donde ( ) ( ) B B | | ÷ = 1

( )
t t
a X B = | es la representación general de un modelo autorregresivo de orden 1

Obsérvese que ( ) B | es un polinomio de grado 1, cuya raíz viene dada por
|
ì
1
= :
( ) ì
|
| = = ¬ = ÷ B B
1
0 1

Ahora bien, un resultado teórico establece que un modelo como el anterior es
débilmente estacionario si toda raíz ì de ( ) B | cumple con las siguiente condición:

1 > ì
(la raíz está fuera del circulo unitario)

-1 0
1



1 1
1
< ¬ > ¬ |
|

-1 0
1


El caso de mayor interés es cuando , esto es, cuando existe raíz unitaria, y se puede
probar que cuando esto ocurre, la varianza de X
t
no es finita, en otras


palabras, la serie es no estacionaria. De allí que la relación fundamental que siempre
se ha de tener en cuenta es: EXISTENCIA DE RAICES UNITARIAS EQUIVALE A NO
ESTACIONARIEDAD

220
NO ESTACIONARIEDAD
·
EXISTENCIA DE
RAICES
UNITARIAS
¹
CRECIMIENTO EXPLOSIVO


SI 1 = |

t t t
a X X + =
÷1
|

t t t
a X X + =
÷1
= caminata aleatoria
¬proceso integrado
¬no estacionario

Saber que existen raíces unitarias provee de la transformación necesaria para superar
el problema de la no estacionariedad. Considerando nuevamente una representación
autorregresiva para X
t
, si existe raíz unitaria se tiene que:

t t t
a X X + =
÷1
:

t t t
a X X = ÷ ¬
÷1


denotando
1 ÷
÷ = A
t t t
X X X y sustituyendo en la ecuación anterior, resulta:

t t
a X = A ·

La primera diferencia de X
t
es estacionaria, de forma que la no estacionariedad se
supera diferenciando la serie tantas veces como raíces unitarias posea.

En general, diremos que una serie X
t
es integrable de orden d, si debe ser diferenciada
d veces para alcanzar estacionariedad y se denota:

X
t
~ I(d)









221
5. PRUEBA DE ESTACIONARIEDAD BASADA EN EL
CORRELOGRAMA

Una prueba sencilla de estacionariedad está basada en la denominada función de
autocorrelación (ACF). La ACF al rezago k, denotada por
k
µ , se define como:

ianza
k rezago al arianza
k
k
var
. . . cov
0
= =
¸
¸
µ

Puesto que la covarianza y la varianza están medidas en las mismas unidades,
k
µ es
un número sin unidad de medida, o puro. Se encuentra entre –1 y +1, igual que
cualquier coeficiente de correlación, Si se grafica
k
µ frente a k, la gráfica obtenida se
conoce como correlograma.

Para obtener el correlograma en Eviews, seleccionamos VIEWS/CORRELOGRAM.

La ACF de las series estacionarias disminuye sensiblemente a medida que aumenta el
desfase temporal K (gráfico Nº 3). Esto no suele ocurrir con las series estacionarias
(gráfico Nº 4).

Gráfico Nº 3


222
En el gráfico Nº 3 se aprecia como la función de autocorrelación decrece rápidamente,
ya para la observación 2, esta función es cercana a cero, lo cual es indicativo de una
serie estacionaria.


En el caso de un proceso estocástico puramente aleatorio, su autocorrelación en
cualquier rezago mayor que cero es cero.


Gráfico Nº 4


En el gráfico Nº 4 se aprecia que la ACF decrece exponencialmente y de forma lenta,
mientras que la función de autocorrelación parcial presenta un valor significativo en el
retardo uno, con un coeficiente de autocorrelación cercano a la unidad (0,941). Este
gráfico puede considerarse como indicativo de la no estacionariedad.

6. PRUEBA DE RAIZ UNITARIA SOBRE ESTACIONARIEDAD –
PRUEBA DICKEY – FULLER (ADF).

Dado el siguiente modelo autorregresivo de primer orden
62
:
t t t
u Y Y + =
÷1
donde
t
u es el
término de error estocástico que sigue los supuestos del modelo clásico, tiene media
cero, varianza constante y no esta autocorrelacionado. Un término de error con tales
propiedades es conocido también como término de error de ruido blanco (White noise).
Ahora bien si el coeficiente de
1 ÷ t
Y es igual a 1, surge lo que


62
Gujarati, Damodar. Ob.Cit. p.702
223
se conoce como el problema de raíz unitaria es decir, una situación de no
estacionariedad. Por consiguiente al realizar la regresión
t t t
u Y Y + =
÷1
µ y se encuentra
que 1 = µ , entonces se dice que la variable estocástica
t
Y tiene una raíz unitaria.

Si a la ecuación anterior se le resta
1 ÷ t
Y podemos hallar una forma alternativa de
expresarla de muy frecuente utilización:

t t t t t
u Y Y Y Y + ÷ = ÷
÷ ÷ ÷ 1 1 1
µ

( )
t t t
u Y Y + ÷ = A
÷1
1 µ

t t t
u Y Y + = A
÷1
o

donde ( ) 1 ÷ = µ o y A se el operador de primera diferencia
1 ÷
÷ = A
t t
T Y . Si se cumple la
hipótesis nula de 0 = o el modelo se puede escribir de la siguiente forma:
t t
u Y = A , lo
cual nos indica que la primera diferencia de una serie de tiempo de caminata aleatoria
es una serie de tiempo estacionaria porque por supuestos,
t
u es puramente aleatoria.

Lo anterior supone que una serie de tiempo no estacionaria, se puede convertir en
estacionaria diferenciándola. Ahora bien, si una serie de tiempo ha sido diferenciada
una vez y la serie diferenciada resulta estacionaria, se dice que la serie original
(caminata aleatoria) es integrada de orden 1, y se denota por I(1). En forma similar, si
la serie original debe ser diferenciada dos veces (es decir, debe tomarse la primera
diferencia de la primera diferencia) para hacerla estacionaria, se dice que la serie
original es integrada de orden dos, o I(2). En general, si una serie de tiempo debe ser
diferenciada d veces, esta se dice que esta es integrada de orden d, o I(d). En su gran
mayoría las series de tiempo económicas son integrada de orden uno, o I(1).

Para saber si una serie es estacionaria o no, se debe determinar si µˆ es
estadísticamente igual a uno ( ) 1 ˆ :
0
= µ H , o si o
ˆ
es estadísticamente igual a cero
( ) 0
ˆ
:
0
= o H . Lamentablemente, los estadísticos t que se obtengan no siguen una
distribución t de Student aun en muestras grandes.

Bajo la hipótesis nula de 1 = µ , el estadístico t calculado se conoce como el estadístico
t (tau), cuyos valores críticos han sido tabulados por Dickey-Fuller
63
, por lo que a esta
prueba se conoce como la prueba de Dickey-Fuller (DF).

Posteriormente, las tablas con los valores críticos, fueron ampliadas por Mackinnon.


63
A. Dickey y W.A. Fuller. Distribution of the Estimators for Autoregressive Time Series with a Unit
Root”. Journal of the American Statistical Association. Vol. 4 1979.
224
Por razones teóricas y prácticas, la prueba de Dickey-Fuller se aplica a regresiones
efectuadas en las siguientes formas:


t t t
u Y Y + = A
÷1
o

t t t
u Y Y + + = A
÷1 1
o |

t t t
u Y t Y + + + = A
÷1 2 1
o | |

Donde t es la variable tiempo o tendencia. En cada caso, la hipótesis nula es que
0 = o , es decir que hay una raíz unitaria, o lo que es lo mismo, la variable estocástica
no es estacionaria.

Si el término de error
t
u está correlacionado, se modifica la ecuación
t t t
u Y t Y + + + = A
÷1 2 1
o | | de la siguiente forma:


t
m
i
i t t t
u Y Y t Y + A + + + = A
¿
=
÷ ÷
1
1 1 2 1
o o | |

donde, por ejemplo, ( )
2 1 1 ÷ ÷ ÷
÷ = A
t t t
Y Y Y , ( )
3 2 2 ÷ ÷ ÷
÷ = A
t t t
Y Y Y , etc., es decir se utilizan
términos en diferencia rezagados. El número de términos en diferencia rezagados que
deben incluirse con frecuencia se determina empíricamente, siendo la idea incluir
suficientes términos, de tal manera que el termino de error
t
u sea serialmente.
Independiente (ruido blanco). La hipótesis nula es la misma, es decir que existe una
raíz unitaria en
t
Y (o lo que es igual,
t
Y es no estacionaria). Esta prueba se llama
Dickey-Fuller aumentada (ADF)

En el paquete Eviews, se puede obtener fácilmente la prueba de Dickey-Fuller, para tal
fin seleccionamos VIEWS/UNIT ROOT TEST, con lo cual obtenemos el siguiente
cuadro:











225




Como se puede observar, en el cuadro se pueden identificar cuatro áreas: en la
superior izquierda, identificamos que prueba se utilizará, la de Dickey-Fuller
aumentada o la de Phillips-Perron (que se tratará mas adelante). En la inferior
izquierda, indicamos si la prueba se va a realizar sobre la serie en niveles, primeras
diferencias o segundas diferencias de la serie original. En el área superior derecha,
especificamos la forma funcional del modelo a regresar: con intercepto solamente, con
tendencia e intercepto, o finalmente, sin tendencia ni intercepto. Para esta parte
resulta bastante importante ver el gráfico de la serie. Finalmente, en el área inferior
derecho, indicamos el número de rezagos de la variable en diferencias que se va a
utilizar.

Por ejemplo, seleccionando:




Se obtiene el siguiente cuadro

226



El estadístico del test ADF (-2,749934) coincide con el estadístico t de la variable
dependiente retardada IRENTA(-1), incluida como regresor en la ecuación estimada.

La hipótesis nula ( :
0
H existe una raíz unitaria) se acepta si el estadístico t es menor
que los valores críticos de Mackinnon. En este ejemplo, comprobamos que la hipótesis
nula se acepta a cualquiera de las de los tres niveles de significación presentados
(1%, 5% y 10%), es decir, la serie IRENTA, presenta una raíz unitaria, es decir, no es
estacionaria. Adicionalmente, podemos ver que tanto la tendencia como el intercepto
son significativos a un 5%.

Es importante destacar que un requisito para que esta prueba sea válida, es que el
término de perturbación sea un ruido blanco, por lo cual, se hace necesario ver el
correlograma de los residuales




227


Para que sea ruido blanco, los residuales no deben estar autocorrelecionados. En el
correlograma se puede observar que los primeros 6 coeficientes de correlación no son
significativos, con lo cual podríamos interpretar que el término de perturbación
t
u es
un ruido blanco, por lo tanto la prueba del Dickey-Fuller es válida En el caso de que no
fuera un ruido blanco, se realiza una nueva prueba de Dickey-Fuller aumentada,
incluyendo rezagos de la variable en diferencias.


A continuación se presenta un cuadro con el tipo de cambio promedio para Venezuela
para el período 1996-2002. Se pide determinar si la serie es estacionaria o no.

















CUADRO Nº 1
VENEZUELA - TIPO DE CAMBIO PROMEDIO
(millones de US$)
1996 1997 1998 1999 2000 2001 2002
ENERO 290,00 476,84 507,29 568,84 652,15 699,70 761,55
FEBRERO 290,00 474,40 514,64 577,10 658,51 702,58 884,21
MARZO 290,00 478,40 520,90 579,40 666,12 705,52 947,22
ABRIL 360,47 479,25 530,08 587,29 672,01 709,64 876,54
MAYO 468,89 483,27 537,05 595,63 679,53 714,39 965,48
JUNIO 471,25 485,63 542,00 602,13 680,55 716,69 1196,74
JULIO 470,75 491,25 557,39 610,56 685,21 722,00 1328,98
AGOSTO 474,20 495,90 570,19 615,22 688,89 730,82 1373,93
SEPTIEMBRE 476,12 496,79 584,42 624,48 690,08 742,94 1457,20
OCTUBRE 470,01 498,62 571,25 630,19 692,46 743,07 1452,32
NOVIEMBRE 471,57 499,93 569,25 634,15 695,31 744,73 1366,60
DICIEMBRE 474,73 502,80 566,19 643,35 698,34 751,91 1320,67
FUENTE: B.C.V.
EJERCICIO Nº 33
228
En primer lugar debemos observar el gráfico de la serie:

Gráfico Nº 5



En el gráfico Nº 5, se observa que la serie de tiempo muestra una clara tendencia
ascendente, por lo que la media no puede ser constante, lo que evidencia que la serie
no es estacionaria en niveles.

En segundo lugar vemos el correlograma:

Gráfico Nº 6
Correlograma TCP


Observando el correlograma, vemos como la función de autocorrelación decrece

exponencialmente y de forma lenta, mientras que la función de autocorrelación parcial
presenta un valor significativo en el retardo uno, con un coeficiente de
229

autocorrelación cercano a uno (0,93). Este gráfico puede considerarse como indicativo
de la no estacionariedad de la serie, es decir, presenta raíz unitaria.


Para comprobar de forma más exhaustiva esta característica de la serie, procedemos
a aplicar la prueba de raíces unitarias. Seleccionando en el cuadro de diálogo de
aplicación de la prueba ADF (datos en niveles, tendencia, intercepto y tres rezagos).
Eviews nos presenta los siguientes resultados:












230
GRAFICO Nº 7
CORRELOGRAMA DE
LOS RESIDUOS





El estadístico ADF (-3,4181) es menor que el valor crítico de Mackinnon a un 5% de
significación, por lo que se acepta la hipótesis nula, es decir, la serie TCP presenta
raíz unitaria, no es estacionaria.

A continuación se presenta la prueba de Dickey-Fuller para la primera diferencia del
tipo de cambio promedio y el correlograma de los residuales:







231



7. PRUEBA DE PHILLIPS-PERRON (test PP)

Phillips y Perron
64
propusieron en 1988 un método no paramétrico para controlar la
correlación serial de orden elevado en una serie. La prueba de regresión contenida en
el test PP es el proceso autorregresivo de primer orden AR(1):

t t t
Y Y c | o + + = A
÷1


Mientras que la prueba ADF corrige la correlación serial de orden elevado añadiendo
más retardos del término diferenciado de la serie original en el lado derecho de la
ecuación, el test PP realiza una corrección del estadístico t sobre el coeficiente en la
regresión AR(1) para considerar la correlación serial en el término c .

La distribución asintótica del estadístico t del test PP es la misma que la del estadístico
t de la prueba ADF y se contrastan los resultados del test con los valores críticos de
Mackinnon. Igual que en la prueba ADF tenemos que especificar si incluimos una
constante, constante mas término de tendencia o nada en la regresión, para el test PP
además hay que especificar el numero de períodos de correlación serial a incluir.






64
Pulido, Antonio y Ana María López. Ob.Cit. p.271
232





















233
CAPITULO XI
OTROS TEMAS DE ECONOMETRIA
1. ERROR DE ESPECIFICACION. DEFINICION

Hasta el momento los modelos econométricos estudiados, se han basado, en
gran parte, en el supuesto de que el modelo que se va a estimar esté especificado en
forma correcta. Una vez que se asume la especificación correcta del modelo, la
estimación y prueba del mismo se hacen relativamente sencillas. Sin embargo, en
realidad, nunca podemos estar seguros de que un modelo determinado está
especificado en forma correcta. Generalmente se examinan más de una probable
especificación, intentando encontrar la especificación que describa en mejor forma el
proceso bajo estudio.

Los principales errores que se pueden cometer en el momento de especificar un
modelo son:

a) Omisión de una variable relevante.
b) Inclusión de una variable innecesaria.

2. OMISION DE UNA VARIABLE RELEVANTE.

Supongamos que la ecuación ”verdadera” y “correcta” para la demanda de un
bien es la siguiente:


i i i i
u X X Y + + + =
2 2 1 1 0
| | | (2.1)

Donde se especifica que la cantidad demandada del bien ( )
i
Y está en función del
precio de dicho bien ( )
i
X
1
y la publicidad del mismo ( )
i
X
2
.

Ahora bien, por equivocación o ignorancia de la relación verdadera, estimamos
el siguiente modelo:


i i i
u X Y + + =
1 1 0
o o (2.2)

estaremos incurriendo en un error de especificación al omitir una variable relevante
para explicar el comportamiento de la variable dependiente.


Al no especificar la función de demanda tal como se indica en la ecuación (2.1), el
estimador
1
o obtenido en la ecuación (2.2) será sesgado. El sesgo dependerá de la
234

relación existente entre las dos variables explicativas. Precio y publicidad, y del poder
explicativo de la publicidad en función de demanda, es decir el coeficiente. Si la
publicidad está correlacionada positivamente con la demanda, y el precio aparece
correlacionada positivamente con la publicidad, el estimador mínimo cuadrático
1
o
tomará valores mayores que lo realmente debiera, es decir, se sobrestimará.

Esquemáticamente, las consecuencias de omitir una variable explicativa relevante en
el modelo son las siguientes:

a) Si la variable excluida
2
X está correlacionada con la variable incluida,
0
o y
1
o son
sesgados como también inconsistentes. Es decir ( )
0 0
| o = E y, independientemente
del tamaño de la muestra.
b) Aun cuando
1
X y
2
X no estén correlacionadas,
0
o es aun segado, aun cuando
1
o
sea ahora insesgado.
c) La varianza de la perturbación
2
o está incorrectamente estimada.
d) La varianza del coeficiente
1
o es un estimador sesgado de la varianza verdadera
de.
e) En consecuencia, es probable que el intervalo de confianza usual y los
procedimientos de prueba de hipótesis conduzcan conclusiones equivocadas sobre
la significancia estadística de los coeficientes estimados.

Este sesgo de especificación cuantitativamente será igual a:

( )
2 1 1 1
| o | o + = E (2.3)

donde
1
o es igual a la pendiente de la regresión entre las dos variables explicativas


i i i
u X X + + =
2 1 0 1
o o

alternativamente la ecuación (2.3) se puede escribir de la siguiente forma:

( )
2
2
2
2
2 1 2 1
2 1
2
2
2 1
2 1 1
X N X
X X N X X
x
x x
E
÷
÷
+ = + =
¿
¿
¿
¿
| | | | o

Es importante recordar que el especificar mal un modelo puede traer como
consecuencia la presencia de autocorrelación en el modelo, por lo tanto la utilización
del estadístico Durbin-Watson, y el estudio de los residuales pueden ser una
metodología adecuada para sospechar la presencia de un sesgo de especificación por
la omisión de una variable relevante.

235
3. INCLUSION DE VARIABLES IRRELEVANATES.

Ahora supongamos que la función verdadera es la (2.2), y nosotros estimamos
la (2.1), donde, no es significativamente diferente de cero. La consecuencia directa es
que si
1
X y
2
X están correlacionados, la varianza de
1
| será mayor a la varianza de
1
o provocando una perdida en la eficiencia de los estimadores de las variables
relevantes. Este aumento puede incluso llevarnos a aceptar la hipótesis nula al aplicar
el estadístico t para verificar la significación individual de los coeficientes de variables
que realmente son relevantes.

Esquemáticamente las consecuencias de incluir una variable irrelevante son:

a) Los estimadores MCO de los coeficientes del modelo incorrecto son todos
insesgados y consistentes, es decir ( )
0 0
o | = E y.
b) La varianza del error
2
o está correctamente estimada.
c) Los procedimientos usuales de intervalos de confianza y de prueba de hipótesis
continúan siendo válidos.
d) Sin embargo, los estimadores MCO generalmente serán ineficientes, es decir, sus
varianzas generalmente serán más grandes que las del verdadero modelo.

Una forma de comprobar si una variable es irrelevante o no, es la observar el
comportamiento de los errores estándar de las demás variables explicativas antes y
después de incluir la variable en cuestión.

4. OMISION VERSUS INCLUSION DE VARIABLES
65


A continuación se presenta un cuadro resumen en donde se presentan las
posibles situaciones de sesgo de especificación.

DECISION
REALIDAD
(1) Estimado mínim
cuadrático insesgado y
(2) OMISIO DE VARIABL
RELEVANTE:Estima Mco con
restriccione sesgado con meno
varianza que en
(3) INCLUSIODEVARIABL
IRRELEVANT Estimado
MCOinsesgad con varianz
mayor que en
(4) Estimado mínim cuadrátic
insesgado y
i i i
U X Y
+ + =
1 1 0
o o
i i i i
U X X Y
+ + + =
2 2 1 1 0
| | |
i i i
U X Y
+ + =
1 1 0
o o
i i i i
U X X Y
+ + + =
2 2 1 1 0
| | |



65
Martín Guillermina, José María Labeaga y Francisco Mochón. Introducción a la Econometría. Prentice
Hall. España.1997.
236

Ejercicio
66
Nº 34

En un estudio de la demanda de dinero a largo y a corto plazos, Gregory Chow
estimó la siguiente ecuación de demanda (los errores estándar están entre paréntesis
y todos los datos son trimestrales):


t t pt t
R Y Y M 7476 , 0 1321 , 0 069 , 1 1365 , 0
ˆ
÷ ÷ + =
(0,148) (0,139) (0,054)
9965 , 0
2
= R


donde M = logaritmo natural de la reserva total de dinero.

p
Y = logaritmo natural del ingreso permanente.
Y = logaritmo natural del ingreso actual.
R = logaritmo natural de la tasa de interés.

En vista de que Chow ve la ecuación estimada como una ecuación a largo plazo para
la demanda de dinero, concluye que el ingreso permanente es más importante que el
dinero actual como la restricción a largo plazo sobre bienes individuales. (La variable Y
es insignificante, mientras que
p
Y es altamente significativa.) Sin embargo, uno puede
afirmar que la ecuación estimada es de hecho una mala especificación de la ecuación
correcta para la demanda de dinero a largo plazo. Taylor y Newhouse afirman que la
especificación correcta es:


t t t t pt t
M R Y Y M c | | | | | + + + + + =
÷1 5 4 3 2 1


Si la ecuación anterior es correcta, esperaríamos que los coeficientes de la ecuación
estimada de Chow fueran sesgados.

Si la variable
1 ÷ t
M no está disponible, tendremos que especular acerca de
extensión de cualquier sesgo de especificación que esté presente. Sin embargo, en
este ejemplo particular
1 ÷ t
M está disponible, en vista de que implica un rezago de un
período de una variable presente en la ecuación mal especificada. Dado que se sabe
que
1 ÷ t
M y
pt
Y están altamente correlacionados y esperamos que el signo de
1 ÷ t
M
sea positivo cuando se ejecute la ecuación especificada en forma correcta,
predeciríamos que el sesgo es positivo y considerable. En otras palabras, la extensión
de la importancia del ingreso permanente es exagerada debido al error de



66
Pindyck, Robert S. y Daniel L. Rubinfeld. Econometría modelos y pronósticos. Mc Graw Hill.
Mexico.2001.
237
especificación. Esta suposición se corrobora cuando se estima el modelo especificado
en forma correcta. Los resultados son los siguientes:




1
5878 , 0 3325 , 0 3274 , 0 06158 , 0 3067 , 0
ˆ
÷
+ ÷ + + =
t t t pt t
M R Y Y M
(0,143) (0,094) (0,059) (0,067)
9988 , 0
2
= R

El coeficiente
1 ÷ t
M es positivo y significativo, mientras que el coeficiente
pt
Y es positivo
pero es no significativo en el nivel de 5%. Por tanto, la conclusión original debería
revisarse para establecer que el ingreso actual es más importante que el ingreso
permanente para explicar la demanda de dinero a largo plazo.
5. EVALUACION DE MODELOS

En capítulos anteriores, se planteó que para realizar la evaluación de un modelo
econométrico es necesario utilizar el coeficiente de determinación ( )
2
R y las pruebas
T y F . A continuación se completará el proceso de evaluación mediante ciertas
medidas que es posible establecer, bien en la fase de construcción del mismo, o bien,
durante la aplicación del modelo.

a) Medidas sobre los errores: error cuadrático medio, Error medio absoluto y
porcentaje de error.

En referencia a las medidas establecidas sobre los errores o residuos., a parte del
estimador insesgado de la varianza de las perturbaciones
k n
u
i
÷
=
¿
2
2
ˆ
ˆ o se pueden
analizar los errores absolutos y relativos (porcentajes de error), así como las
correspondientes medias y desviaciones típicas.

Dado los supuestos del modelo clásico, se debe cumplir que 0 ˆ =
¿ i
u y por lo tanto
que 0 = u con lo que el error cuadrático medio ( )
2
ˆ u
S coincidirá con la varianza residual
2 2
ˆ
ˆ o =
u
S

( )
n
u
n
u u
S
i i
u
¿ ¿
=
÷
=
2
2
2
ˆ
ˆ ˆ ˆ


Dada la nulidad del error medio, puede interesar conocer el error medio absoluto:



238
n
u
u
i ¿
=
ˆ


o el porcentaje medio del error

n
y
u
i
i
¿
ˆ



b) Representación gráfica de los errores.

Con respecto a la representación gráfica de los errores podemos realizar el dibujo de
la líneas correspondientes a los valores reales y estimados de la variable endógena,
por diferencia entre los cuales quedan representados los residuos o errores de
predicción para el período muestral. También se puede representar los errores sobre
el eje cero de abscisas correspondiente a su valor medio nulo.. El paquete Eviews nos
permite obtener los dos gráficos indicados. Teniendo activo la salida del modelo,
seleccionamos en el menú secundario, Resids.






239
Para analizar la fiabilidad del modelo se toma en cuenta la mayor o menor distancia de
los valores estimados y reales, y observando el error sistemático (puntos situados
principalmente en la zona de sub o sobreestimación).

c) Coeficiente de desigualdad de Theil..

A partir de los valores estimados y reales de la variable endógena, puede definirse el
modelo.

i i
y y | o + = ˆ ( ) 0 > |

para el caso de una predicción perfecta no sólo supondrá que 1
2
= R , sino que deberá
cumplirse que 0 = o y 1 = | , a fin de que coincidan punto a punto ambas series de
valores. Concretamente, el coeficiente de determinación así obtenido no aporta
ninguna información adicional.

Basándose en estos supuestos, Theil establece el “coeficiente de desigualdad” que
nos va a permitir,. Mediante su aplicación, analizar la bondad de predicción. Definimos
U , como el coeficiente de desigualdad entre
i
yˆ e
i
y , a partir de la siguiente expresión
aplicada a los porcentajes de cambio respectivos.

( )
2 2
2
1
ˆ
1
ˆ
1
i i
i i
y
n
y
n
y y
n
U
A + A
A ÷ A
=
¿
¿


El valor del coeficiente esta comprendido entre 0 y 1, excepto en el caso de que tanto
las predicciones como los valores reales sean todos cero, ya que entonces el
coeficiente será indeterminado.

En caso de que 0 = U , implicaría que los valores de predicción coinciden con los
reales, es el caso de predicción perfecta.

En caso de que 1 = U , implicaría una predicción totalmente errónea. Este valor puede
obedecer: i) Predicciones nulas para valores reales distintas a cero; ii) Predicciones no
nulas sobre valores iguales a cero; iii) que las predicciones equivoquen
sistemáticamente el signo del cambio.








240






















TABLAS
241
Puntos porcentuales de la distribución t
Pr 0,25 0,10 0,05 0,025 0,01 0,005 0,001
g de l 0,50 0,20 0,10 0,05 0,02 0,01 0,002
1 1,000 3,078 6,314 12,706 31,821 63, 657 318,310
2 0,816 1,886 2,920 4,303 6,965 9,925 22, 327
3 0,765 1,638 2,353 3,182 4,541 5,841 10, 214
4 0,741 1,533 2,132 2,776 3,747 4,604 7,173
5 0,727 1,476 2,015 2,571 3,365 4,032 5,893
6 0,718 1,440 1,943 2,447 3,143 3,707 5,208
7 0,711 1,415 1,895 2,365 2,998 3,499 4,785
8 0,706 1,397 1,860 2,306 2,896 3,355 4,501
9 0,703 1,383 1,833 2,262 2,821 3,250 4,297
10 0,700 1,372 1,812 2,228 2,764 3,169 4,144
11 0,697 1,363 1,796 2,201 2,718 3,106 4,025
12 0,695 1,356 1,782 2,179 2,681 3,055 3,930
13 0,694 1,350 1,771 2,160 2,650 3,012 3,852
14 0,692 1,345 1,761 2,145 2,624 2,977 3,787
15 0,691 1,341 1,753 2,131 2,602 2,947 3,733
16 0,690 1,337 1,746 2,120 2,583 2,921 3,686
17 0,689 1,333 1,740 2,110 2,567 2,898 3,646
18 0,688 1,330 1,734 2,101 2,552 2,878 3,610
19 0,688 1,328 1,729 2,093 2,539 2,861 3,579
20 0,687 1,325 1,725 2,086 2,528 2,845 3,552
21 0,686 1,323 1,721 2,080 2,518 2,831 3,527
22 0,686 1,321 1,717 2,074 2,508 2,819 3,505
23 0,686 1,319 1,714 2,069 2,500 2,807 3,485
24 0,685 1,318 1,711 2,064 2,492 2,797 3,467
25 0,684 1,316 1,708 2,060 2,485 2,787 3,450
26 0,684 1,315 1,706 2,056 2,479 2,779 3,435
27 0,684 1,314 1,703 2,052 2,473 2,771 3,421
28 0,683 1,313 1,701 2,048 2,467 2,763 3,408
29 0,683 1,311 1,699 2,045 2,462 2,756 3,396
30 0,683 1,310 1,697 2,042 2,457 2,750 3,385
40 0,681 1,303 1,684 2,021 2,423 2,704 3,307
60 0,679 1,296 1,671 2,000 2,390 2,660 3,232
120 0,677 1,289 1,658 1,980 2,358 2,617 3,160
Nota: La pri mera columna corresponde a los grados de
libertad (n-k)
La probabi lidad más baja que aparece en el encabezamiento
de cada columna es el área en una cola; la probabi li dad mas
alta es el área en ambas colas.

242
Puntos porcentuales de la distribución F
g. de l
para el
denominador
(N-K) Pr 1 2 3 4 5 6 7
0.25 5.83 7.50 8.20 8.58 8.82 8.98 9.10
1 0.10 39.90 49.50 53.60 55.80 57.20 58.20 58.90
0.05 161.00 200.00 216.00 225.00 230.00 234.00 237.00
0.25 2.57 3.00 3.15 3.23 3.28 3.31 3.34
2 0.10 8.53 9.00 9.16 9.24 9.29 9.33 9.35
0.05 18.50 19.00 19.20 19.20 19.30 19.30 19.40
0.01 98.50 99.00 99.20 99.20 99.33 99.30 99.40
0.25 2.02 2.28 2.36 2.39 2.41 2.42 2.43
3 0.10 5.54 5.46 5.39 5.34 5.31 5.28 5.27
0.05 10.10 9.55 9.28 9.12 9.01 8.94 8.89
0.01 34.10 30.80 29.50 28.70 28.20 27.90 27.70
0.25 1.81 2.00 2.05 2.06 2.07 2.08 2.08
4 0.10 4.54 4.32 4.19 4.11 4.05 4.01 3.98
0.05 7.71 6.94 6.59 6.39 6.26 6.16 6.09
0.01 21.20 18.00 16.70 16.00 15.50 15.20 15.00
0.25 1.69 1.85 1.88 1.89 1.89 1.89 1.89
5 0.10 4.06 3.78 3.62 3.52 3.45 3.40 3.37
0.05 6.61 5.79 5.41 5.19 5.05 4.95 4.88
0.01 16.30 13.30 12.10 11.40 11.00 10.70 10.50
0.25 1.62 1.76 1.78 1.79 1.79 1.78 1.78
6 0.10 3.78 3.46 3.29 3.18 3.11 3.05 3.01
0.05 5.99 5.14 4.76 4.53 4.39 4.28 4.21
0.01 13.70 10.90 9.78 9.15 8.75 8.47 8.26
0.25 1.57 1.70 1.72 1.72 1.71 1.71 1.70
7 0.10 3.59 3.26 3.07 2.96 2.88 2.83 2.78
0.05 5.59 4.74 4.35 4.12 3.97 3.87 3.79
0.01 12.20 9.55 8.45 7.85 7.46 7.19 6.99
0.25 1.54 1.66 1.67 1.66 1.66 1.65 1.64
8 0.10 3.46 3.11 2.92 2.81 2.73 2.67 2.62
0.05 5.32 4.46 4.07 3.84 3.69 3.58 3.50
0.01 11.30 8.65 7.59 7.01 6.63 6.37 6.18
0.25 1.51 1.62 1.63 1.63 1.62 1.61 1.60
9 0.10 3.36 3.01 2.81 2.69 2.61 2.55 2.51
0.05 5.12 4.26 3.86 3.63 3.48 3.37 3.29
0.01 10.60 8.02 6.99 6.42 6.06 5.80 5.61
g. de l. para el numerador (K-1)





243
Puntos porcentuales de la distribución F (continuación…)
g. de l
para el
denominador
(N-K) Pr 1 2 3 4 5 6 7
0.25 1.49 1.60 1.60 1.59 1.59 1.58 1.57
10 0.10 3.29 2.92 2.73 2.61 2.52 2.46 2.41
0.05 4.96 4.10 3.71 3.48 3.33 3.22 3.14
0.01 10.00 7.56 6.55 5.99 5.64 5.39 5.20
0.25 1.47 1.58 1.58 1.57 1.56 1.55 1.54
11 0.10 3.23 2.86 2.66 2.54 2.45 2.39 2.34
0.05 4.84 3.98 3.59 3.36 3.20 3.09 3.01
0.01 9.65 7.21 6.22 5.67 5.32 5.07 4.89
0.25 1.46 1.56 1.56 1.55 1.54 1.53 1.52
12 0.10 3.18 2.81 2.61 2.48 2.39 2.33 2.28
0.05 4.75 3.89 3.49 3.26 3.11 3.00 2.91
0.01 9.33 6.93 5.95 5.41 5.06 4.82 4.64
0.25 1.45 1.55 1.55 1.53 1.52 1.51 1.50
13 0.10 3.14 2.76 2.56 2.43 2.35 2.28 2.23
0.05 4.67 3.81 3.41 3.18 3.03 2.92 2.83
0.01 9.07 6.70 5.74 5.21 4.86 4.62 4.44
0.25 1.44 1.53 1.53 1.52 1.51 1.50 1.49
14 0.10 3.10 2.73 2.52 2.39 2.31 2.24 2.19
0.05 4.60 3.74 3.34 3.11 2.96 2.85 2.76
0.01 8.86 6.51 5.56 5.04 4.69 4.46 4.28
0.25 1.43 1.52 1.52 1.51 1.49 1.48 1.47
15 0.10 3.07 2.70 2.49 2.36 2.27 2.21 2.16
0.05 4.54 3.68 3.29 3.06 2.90 2.79 2.71
0.01 8.68 6.36 5.42 4.89 4.56 4.32 4.14
0.25 1.42 1.51 1.51 1.50 1.48 1.47 1.46
16 0.10 3.05 2.67 2.46 2.33 2.24 2.18 2.13
0.05 4.49 3.63 3.24 3.10 2.85 2.74 2.66
0.01 8.53 6.23 5.29 4.77 4.44 4.20 4.03
0.25 1.42 1.51 1.50 1.49 1.47 1.46 1.45
17 0.10 3.03 2.64 2.44 2.31 2.22 2.15 2.10
0.05 4.45 3.59 3.20 2.96 2.81 2.70 2.61
0.01 8.40 6.11 5.18 4.67 4.34 4.10 3.93
0.25 1.41 1.50 1.49 1.48 1.46 1.45 1.44
18 0.10 3.01 2.62 2.42 2.29 2.20 2.13 2.08
0.05 4.41 3.55 3.16 2.93 2.77 2.66 2.58
0.01 8.29 6.01 5.09 4.58 4.25 4.01 3.84
g. de l. para el numerador (K-1)



244
Estadístico d de Durbin-Watson:puntos de significancia de dl y du
al nivel de significancia del 5%
n dl du dl du dl du dl du dl du dl du
6 0.610 1.400
7 0.700 1.356 0.467 1.896
8 0.763 1.332 0.559 1.777 0.368 2.287
9 0.824 1.320 0.629 1.699 0.455 2.128 0.296 2.588
10 0.879 1.320 0.697 1.641 0.525 2.016 0.376 2.414 0.243 2.822
11 0.927 1.324 0.658 1.604 0.595 1.928 0.444 2.283 0.316 2.645 0.203 3.005
12 0.971 1.331 0.812 1.579 0.658 1.864 0.512 2.177 0.379 2.506 0.268 2.832
13 1.010 1.340 0.861 1.562 0.715 1.816 0.574 2.094 0.445 2.390 0.328 2.692
14 1.045 1.350 0.905 1.551 0.767 1.779 0.632 2.030 0.505 2.296 0.389 2.572
15 1.077 1.361 0.946 1.543 0.814 1.750 0.685 1.977 0.562 2.220 0.447 2.472
16 1.106 1.371 0.982 1.539 0.857 1.728 0.734 1.935 0.615 2.157 0.502 2.388
17 1.133 1.381 1.015 1.536 0.897 1.710 0.779 1.900 0.664 2.104 0.554 2.318
18 1.158 1.391 1.046 1.535 0.933 1.696 0.820 1.872 0.710 2.060 0.603 2.257
19 1.180 1.401 1.074 1.536 0.967 1.685 0.859 1.848 0.752 2.023 0.649 2.206
20 1.201 1.411 1.100 1.537 0.998 1.676 0.894 1.828 0.792 1.991 0.692 2.162
21 1.221 1.420 1.125 1.538 1.026 1.669 0.927 1.812 0.829 1.964 0.732 2.124
22 1.239 1.429 1.147 1.541 1.053 1.664 0.958 1.797 0.863 1.940 0.769 2.090
23 1.257 1.437 1.168 1.543 1.078 1.660 0.986 1.785 0.895 1.920 0.804 2.061
24 1.273 1.446 1.188 1.546 1.101 1.656 1.013 1.775 0.925 1.902 0.837 2.035
25 1.288 1.454 1.206 1.550 1.123 1.654 1.038 1.767 0.953 1.886 0.868 2.012
26 1.302 1.461 1.224 1.553 1.143 1.652 1.062 1.759 0.979 1.873 0.897 1.992
27 1.316 1.469 1.240 1.556 1.162 1.651 1.084 1.753 1.004 1.861 0.925 1.974
28 1.328 1.476 1.255 1.560 1.181 1.650 1.104 1.747 1.028 1.850 0.951 1.958
29 1.341 1.483 1.270 1.563 1.198 1.650 1.124 1.743 1.050 1.841 0.975 1.944
30 1.352 1.489 1.284 1.567 1.214 1.650 1.143 1.739 1.071 1.833 0.998 1.931
31 1.363 1.496 1.297 1.570 1.229 1.650 1.160 1.735 1.090 1.825 1.020 1.920
32 1.373 1.502 1.309 1.574 1.244 1.650 1.177 1.732 1.109 1.819 1.041 1.909
33 1.383 1.508 1.321 1.577 1.258 1.651 1.193 1.730 1.127 1.813 1.061 1.900
34 1.393 1.514 1.333 1.580 1.271 1.652 1.208 1.728 1.144 1.808 1.080 1.891
35 1.402 1.519 1.343 1.584 1.283 1.653 1.222 1.726 1.160 1.803 1.097 1.884
36 1.411 1.525 1.354 1.587 1.295 1.654 1.236 1.724 1.175 1.799 1.114 1.877
37 1.419 1.530 1.364 1.590 1.307 1.655 1.249 1.723 1.190 1.795 1.131 1.870
38 1.427 1.535 1.373 1.594 1.318 1.656 1.261 1.722 1.204 1.792 1.146 1.864
39 1.435 1.540 1.382 1.597 1.328 1.658 1.273 1.722 1.218 1.789 1.161 1.859
40 1.442 1.544 1.391 1.600 1.338 1.659 1.285 1.721 1.230 1.786 1.175 1.854
45 1.475 1.566 1.430 1.615 1.383 1.666 1.336 1.720 1.287 1.776 1.238 1.835
50 1.503 1.585 1.462 1.628 1.421 1.674 1.378 1.721 1.335 1.771 1.291 1.822
Nota: K = númerode variables explicatorias (Nº de X), n = número de observaciones
K=5 K=6 K=1 K=2 K=3 K=4






245

Estadístico d de Durbin-Watson:puntos de significancia de dl y du
continuación
n dl du dl du dl du dl du dl du dl du
55 1.528 1.601 1.490 1.641 1.452 1.681 1.414 1.724 1.374 1.768 1.334 1.814
60 1.549 1.616 1.514 1.652 1.480 1.689 1.444 1.727 1.408 1.767 1.372 1.808
65 1.567 1.629 1.536 1.662 1.503 1.696 1.471 1.731 1.438 1.767 1.404 1.805
70 1.583 1.641 1.554 1.672 1.525 1.703 1.494 1.735 1.464 1.768 1.433 1.802
75 1.598 1.652 1.571 1.680 1.543 1.709 1.515 1.739 1.487 1.770 1.458 1.801
80 1.611 1.662 1.586 1.688 1.560 1.715 1.534 1.743 1.507 1.772 1.480 1.801
85 1.624 1.671 1.600 1.696 1.575 1.721 1.550 1.747 1.525 1.774 1.500 1.801
90 1.635 1.679 1.612 1.703 1.589 1.726 1.566 1.751 1.542 1.776 1.518 1.801
95 1.645 1.687 1.623 1.709 1.602 1.732 1.579 1.755 1.557 1.778 1.535 1.802
100 1.654 1.694 1.634 1.715 1.613 1.736 1.592 1.758 1.571 1.780 1.550 1.803
150 1.720 1.746 1.706 1.760 1.693 1.774 1.679 1.788 1.665 1.802 1.651 1.817
200 1.758 1.778 1.748 1.789 1.738 1.799 1.728 1.810 1.718 1.820 1.707 1.831
Nota: K = númerode variables explicatorias (Nº de X), n = número de observaciones
K=5 K=6 K=1 K=2 K=3 K=4




































246
BIBLIOGRAFIA

- ARMENTA FRAIRE, LETICIA. JOSE DE LA CRUZ GALLEGOS Y LUIS
ALEJANDRO LAGUNES TOLEDO. Modelo de análisis y Prospectiva Económica
Aplicada MAPEA, Un Instrumento de Simulación y Pronostico Econométrico para
los Tomadores de Decisiones. Editorial Trillas. Mexico. 2001

- AZNAR, ANTONIO Y FRANCISCO JAVIER TRIVEZ. Métodos de Predicción en
Economía. Vol. 1. Editorial Ariel S.A. Barcelona. 1993

- BALTAGI, DAVID H. Econometrics. Springer-Verlag. Germany. 1998.

- BROOKS, CHRIS. Introductory Econometric for Finance. Cambridge University
Press. United Kingdom. 2002

- CARRASCAL A, URSICINO, YOLANDA GONZÁLEZ G. Y BEATRIZ RODRÍGUEZ
P. Análisis Econométrico con Eviews. RA – MA Editorial. Madrid. 2001.

- CHARENZA, WOJCIECH AND DEREK F. DEADMAN. New Directions in
Econometric Practice. Second Edition. Edward Elgar Publishing Limited.
Cheltenham. UK. 1997.

- CHIANG, ALPHA C. Métodos Fundamentales de Economía Matemática. Tercera
Edición. McGraw-Hill. México.1993.

- DAVIDSON, RUSSELL Y JAMES G. MACKINNON. Estimation and Inference in
Econometrics. Oxford University Press. New York. 1993

- DAVISON, JAMES. Econometric Theory. Publishers ltd. USA. 2000

- DÍAZ FERNÁNDEZ, MONTSERRAT Y MARÍA DEL MAR LLORENTE MARRÓN.
Econometría. Ediciones Pirámide. Madrid 1998.

- DHRYMES, PHOEBUS J. Mathematics for Econometrics. Third Edition. Springer -
Verlag New York Inc. 2000.

- FAVERO, CARLOS A. Applied Macroeconometrics. OXFORD University Press.
Great Britain. 2001

- FERNANDEZ ANA, PILAR GONZALEZ, MARTA REGULEZ, PAZ MORAL Y
VICTORIA ESTEBAN. Ejercicios de Econometría. McGraw Hill/Inter5americana de
España, S.A.U. Serie Shaum. España. 2005.

- GOLDBERGER, ARTHUR S. A Course in Econometrics. Harvard University press.
Cambridge, Masachusettts. 1991

247
- GOLDBERGER, ARTHUR S. Introductory Econometrics. Harvard University press.
Cambridge, Masachusettts. 1998

- GREENE, WILLIAM H. Análisis Econométrico. Tercera edición, Prentice Hall.
Madrid.1999.

- GUJARATI, DAMODAR N. Econometría. cuarta edición. Mc. Graw Hill. Mexico.
2004.

- GUJARATI, DAMODAR N. Principios de Econometría. tercera edición. Mc. Graw
Hill. España. 2006.

- HENDRY, DAVID F. Dynamic Econometrics. Oxford University Press. New Cork.
1995.

- HERNÁNDEZ ALONSO, JOSE. Ejercicios de Econometría. Segunda edici

- HYASHI, FUMIO. Econometrics. Pricenton University Press. USA. 2000

- INTRILIGATOR MICHAEL D. Modelos Econométricos, Técnicas y Aplicaciones.
Fondo de Cultura Económica. México.1990.

- JOHNTON, JACK Y JOHN DINARDO. Econometric Methods. Fourth Edition.
McGraw Hill Internacional Editions. Economics Series. Singapore. 1997

- KELEJIAN, HARRY H. Y WALLACE E. OATES. Introducción a la Econometría.
Tercera edición. Harla S.A. México.1989.

- KENNEDY, PETER. Introducción a la econometría. Fondo de Cultura Económica.
México. 1997.

- KLEIMAN, ARIEL Y ELENA K. DE KLEIMAN. Matrices, Aplicaciones Matemáticas
en Economía y Administración. Editorial LIMUSA S.A. México. 2000.

- KMENTA, JAN. Elementos de Econometría. Segunda Edición. VICENS
universidad. España. 1980.

- LEVIN, RICHARD I. Y DAVID S. RUBIN. Estadística para Administradores. Sexta
edición. Prentice Hall. México.1996.

- MADDALA G.S. Econometría. Mc Graw Hill. España.1985.

- MARTÍN, GUILLERMINA; JOSÉ MARÍA LABEAGA Y FRANCISCO MOCHÓN.
Introducción a la Econometría. Prentice Hall. España.1997.

248
- MATA MOLLEJAS, LUIS Y JOSÉ NIÑO DÍAZ. Revisión de los Métodos
Cuantitativos en la Economía. Fondo Editorial Tropykos y Comisión de Estudios de
Postgrados. U.C.V. Caracas. 2000

- NOVALES, ALFONSO. Econometría. Segunda edición. Mc. Graw Hill.
España.1993.

- ORTUZAR S. JUAN DE DIOS. Modelos Econométricos de Elección Discreta.
Ediciones Universidad Católica de Chile.. Santiago, Chile. 2000

- PENA TRAPERO, J. BERNARDO, JULIO A. ESTAVILLO DORADO, MARÍA
ESTHER GALINDO F., MARÍA JOSÉ LECETA REY Y MARÍA DEL MAR ZAMORA
SANZ. Cien Ejercicios de Econometría. Ediciones Pirámide S.A. Madrid.1999.

- PÉREZ AMARAL, TEODOSIO, PABLO AMORÓS GONZÁLEZ Y SILVIA
RELLOSO PEREDA. Ejercicios de Econometría Empresarial. Mc Graw Hill. Madrid.
1993

- PINDIYCK, ROBERT S. Y DANIEL L. RUBENFELD. Econometría, modelos y
pronóstico. Mc. Graw Hill. México. 2001.

- PULIDO, ANTONIO Y ANA MARÍA LÓPEZ. Predicción y Simulación Aplicada a la
Economía de Empresas. Ediciones Pirámide S.A.. Madrid. 1999.

- SALAS, JAVIER. Econometría aplicada a los países en Desarrollo, el caso
mexicano. Fondo de Cultura Económica S.A..México.1990

- SALVATORE, DOMINICK. Econometría. Mc. Graw Hill. Serie Schaum. México.
1985.

- SANCHEZ GONZÁLEZ, CARLOS. Métodos Econométricos. Ariel Economía.
España 1999.

- SCHMIDT, PETER. Econometrics. Marcel Dekker, INC. USA. 1976.

- SOTO NEGRIN, ARMANDO: Iniciación a la Estadística. Editorial José Martí.
Caracas.1982.

- SZENERG, MICAHAEL, editor. Grandes Economistas de Hoy. Editorial Debate S.A
Madrid. 1992.

- TRIVEZ BIELSA, FRANCISCO JAVIER. Introducción a la Econometría. Ediciones
Pirámide. Madrid. 1996.

- VÁSQUEZ, MAURA Y GUILLERMO RAMÍREZ. Aspectos Teóricos del Algebra
Matricial con Aplicaciones Estadísticas. Facultad de Ciencias Económicas y
Sociales, UCV. Caracas.
249

- VIAL, JOAQUIN. “Especificación y Evaluación de Modelos Econométricos”. Serie
Docente Nº 3. Corporación de Investigaciones Económicas para América Latina
(CIEPLAN). Santiago de Chile. 1991.

- WOOLDIGDE, JEFFREY M. Introducción a la Econometría.Thomson Learning.
México, 2001.

- WOOLDIGDE, JEFFREY M. Econometric Análisis of Cross Section and Panel
Data. The MIT Press, Cambridge, Massachusetts. 2001.

INTRODUCCION
El presente trabajo tiene como objetivo principal, ayudar a todas aquellas personas con conocimientos limitados de Estadística y Economía, especialmente a los alumnos involucrados en esta cátedra. Aportándoles una herramienta que les proporcione un conocimiento básico de la Econometría. A lo largo de mi experiencia docente en la Escuela Nacional de Administración y Hacienda Pública I.U.T, y en la Universidad Santa María, he observado con preocupación lo difícil y problemático que le resulta al estudiantado, el inicio del estudio de la Econometría. Entre los factores que explican esta situación, destacan la deficiencia que traen algunos alumnos en materias imprescindibles para el estudio del tema, como son la Estadística y la Economía. La Econometría involucra todo un bagaje de nuevo vocabulario que dificulta en una primera etapa su entendimiento. Se ha utilizado la claridad de algunos autores para tratar algunos temas específicos y mi experiencia enseñando la materia, para lograr un texto donde se combinen los fundamentos teóricos básicos de la Econometría con unos ejemplos prácticos, que permitan ver en una forma sencilla sus aplicaciones, usando en varios de ellos el Software economètrico Eviews En referencia al contenido del texto, inicialmente, en el capítulo I, se hace referencia a los conceptos básicos que se deben manejar en la Econometría. En los capítulos II, III, IV y V se tratan los fundamentos de la regresión mínimo cuadrática. En los capítulos VI, VII y VIII se tocan las diferentes violaciones a los supuestos del modelo mínimo cuadrático Y finalmente en los capítulos IX y X se hacen referencia a algunos temas complementarios. Es importante señalar que este trabajo, de ninguna manera constituye un tratado de la materia, debido a que en el mercado existen muchos de una excelente calidad. Lo que se ha tratado es de que sin abandonar la formalidad en el tratamiento de los temas, el estudiante pueda tener en sus manos un texto didáctico que le permita iniciar con éxito el estudio de los modelos econométricos Finalmente, quiero agradecerle a la Escuela Nacional de Administración y Hacienda Pública I.U.T. por haberme invitado como profesor de la materia durante los años 2000 y 2001, y a la Universidad Santa María, donde dicto actualmente Econometría I y II, y en especial a todos mis alumnos por que me permitieron ordenar mis apuntes, fuente de este trabajo.

2

CONTENIDO
I ECONOMETRIA 1. 2. 3. 4. 5. 6. Definición de econometría Evolución histórica de la econometría. Modelos Modelos Econométricos Tipos de modelos Econométricos Formas Funcionales.

II MODELO DE REGRESION LINEAL UNIECUACIONAL (MODELO CLASICO) 1. Supuestos 2. Propiedades de la Función de Regresión Muestral (FRM) 3. Mejores Estimadores Linealmente Insesgados (MELI) 4. Teorema de Gauss – Markov 5. Estimación de los Parámetros a través del Método de los Mínimos Cuadrados Ordinarios 6. Coeficiente de Determinación 7. Coeficiente de Correlación 8. Estimación por Intervalos 9. Prueba de Hipótesis (Significancia Individual del Coeficiente) 10. Presentación Resumida de los Resultados Obtenidos. III SIGNIFICADO DE LOS COEFICIENTES 1. 2. 3. 4. Pendiente de la Ecuación (Variación Marginal) Elasticidad Modelo Logarítmico Ejercicios

IV MODELO DE REGRESION MULTIPLE 1. Modelo de Regresión Múltiple (2 Variables Explicativas) 2. Prueba F (Significancia Global de los Coeficientes 3. Ejercicios V MODELO DE REGRESIÓN LINEAL CON k VARIABLES EXPLICATIVAS 1. Supuestos del modelo clásico 2. Estimación de los coeficientes de mínimo cuadrados ordinarios. 3. Propiedades MELI de los estimadores mínimo cuadráticos, 4. Estimador de la varianza de las perturbaciones (  ). 5. Coeficiente de Determinación.
2

3

6. El caso particular de Regresión Simple. 7. Estimador Máximo Verosimil. VI MULTICOLINEALIDAD 1. 2. 3. 4. 5. Definición Naturaleza de la Multicolinealidad. Consecuencias de la Multicolinealidad Como Detectar la Multicolinealidad Como solucionar el problema de la Multicolinealidad

VII HETEROCEDASTICIDAD 1. 2. 3. 4. 5. Definición Consecuencias de la Heterocedasticidad Como Detectar la Heterocedasticidad Como Remediar el Problema de la Heterocedasticidad.. ESTIMACION POR MINIMOS CUADRADOS GENERALIZADOS (MCG) y MINIMOS CUADRADOS PONDERADOS (MCP)

VIII AUTOCORRELACION 1. Definición 2. Como Detectar la Autocorrelación 3. Como Solucionar el Problema de la Autocorrelación IX VARIABLES FICTICIAS, MODELOS DE REZAGOS DISTRIBUIDOS Y MODELOS AUTORREGRESIVOS 1. Variables Ficticias o Cualitativas (Variables Dummy) 2. Modelo de Rezagos Distribuidos 3. Modelos Autorregresivos X ESTACIONARIEDAD XI OTROS TEMAS DE ECONOMETRIA 1. 2. 3. 4. 5. Error de especificación, Definición Omisión de una Variable Relevante Inclusión de Variables irrelevantes Omisión Versus Inclusión de Variables. Evaluación de modelos.

APENDICE TABLAS

4

2da Edic. utilizando como variables explicativas el ritmo de crecimiento de la oferta monetaria y algún indicador de la demanda agregada en la economía. llamada modelo econométrico. Alfonzo. y La capacidad de dicho modelo para el análisis de determinadas cuestiones de económica. Guillermina. La utilización de dicho modelo con fines predictivos. basado en el desarrollo congruente de teoría y observaciones. y relacionado por métodos apropiados de inferencia. El análisis de las propiedades estadísticas de dicho modelo.1993. Introducción a la econometría.. Prentice Hall.. USA y con la fundación en el año 1933 de la revista “Econometrica”. Mc GRAW HILL. p. podría construirse una relación para explicar el comportamiento de la inflación. aplicación de las matemáticas y método estadístico al estudio de fenómenos económicos. Su estimación. así como predecir acontecimientos futuros y dar consejos de política económica ante resultados deseables. con base en los datos que se disponen sobre las distintas variables y aplicando métodos específicos basados en la inferencia estadística. 5 1 . 2 Martin. España.' Klein (1962): 'El principal objetivo de la econometría es dar contenido empírico al razonamiento a priori de la economía.1997.DEFINICION DE ECONOMETRIA A continuación se presentan algunas definiciones de econometría: “ La econometría 1 es la disciplina que se ocupa de la cuantificación de los fenómenos económicos y de la verificación de las teorías económicas..” 3 Samuelson. Distintos aspectos del análisis econométrico son: a) b) c) d) e) política La especificación de la estructura a utilizar. Koopmans y Stone (1954): '.” 2 “La econometría se ocupa del estudio de estructuras que permitan analizar características o propiedades de una variable económica utilizando como causas explicativas otras variables económicas. José María Labeaga y Francisco Mochón.5 3 NOVALES...” Valavanis (1959): 'El objetivo de la econometría es expresar las teorías económicas bajo una forma matemática a fin de verificarlas por métodos estadísticos y medir el impacto de una variable sobre otra. el análisis cuantitativo de fenómenos económicos actuales. Por ejemplo. Ohio.' Malinvaud (1966): '.' El termino “Econometric” fue introducido en el mundo académico a comienzos de la década de 1930´s con la formación de la “Econometric Society” en al año 1930 en la ciudad de Cleveland. España. Econometría.BIBLIOGRAFIA CAPITULO I 1.

de las técnicas econométricas y estadísticas. aunque una parte importante de esta teoría tienen marcado carácter cuantitativo.. aplicación ciega y brutal de programas de correlación lineal y de las pruebas asociadas con ellos. Universidad Autónoma de Madrid. son condiciones necesarias pero no suficientes para un conocimiento real de las relaciones cuantitativas en la vida económica moderna. No es idéntica que lo que llamamos teoría económica. en realidad seudomodelos. totalmente injustificados.12. R.' “. Madrid. Es pertinente tomar en consideración las palabras de Maurice Allais 5: “Por desgracia. Citado por: Vicéns Otero. aun cuando estas pruebas por lo general no son aplicables a los casos estudiados. Econométrica 1. Es importante señalar que la Econometría nos proporciona una metodología para alcanzar un fin.' Intriligator (1978): 'Rama de la economía que se ocupa de la estimación empírica de relaciones económicas. y empleo de los 4 Frisch. Su uso adecuado proporciona una poderosa herramienta para el análisis de fenómenos económicos. José. que con demasiada frecuencia generan seudoteorías basadas en la aplicación mecánica. en ningún caso puede ser el fin en si mismo. No podría tomarse la econometría como sinónimo de aplicaciones matemáticas en la economía.Christ (1966): 'Producción de declaraciones de economía cuantitativa que explican el comportamiento de variables ya observadas. que a los ingenuos les parecen teorías científicas. estadística. carente de toda comprensión real.' Chow (1983): 'Arte y ciencia de usar métodos para la medida de relaciones económicas.econometría no significa lo mismo que estadística económica. Todas estas teorías reúnen las mismas características: elaboración de modelos de correlación lineal. Es la unificación de las tres lo que es poderoso. Y esta unificación es lo que constituye la econometría…” 4 De las definiciones reseñadas se puede concluir que la econometría nos proporciona una metodología y un instrumental que permite básicamente alcanzar dos objetivos: cuantificar o parametrizar la relación existente entre dos o mas variables económicas. teoría económica y matemáticas. Y en segundo lugar permite realizar estimaciones de una variable en función de valores estimados o proyectados de otras variables con las cuales está relacionado.. el abuso de las matemáticas no es el único fallo de los escritos económicos contemporáneos. catedrático de economía en la Ecole Nationale Supérieure des Mines de París y obtuvo el premio Nobel de Economía en 1988. Documento 98/1. Concepto e Historia”. 1-4. La Experiencia ha demostrado que unos de estos tres puntos de vista. 6 . 1998. mientras no suelen ser mas que cáscaras vacías. o predicen la conducta de variables aún no observadas. (1933) “Editorial”. 5 Economista francés. p. acompañados por una planopia matemático estadística de factores econométricos sin domar. “Econometría y Contrastación Empírica .

Ragnar Frisc e Irvin Fisher. Un Instrumento de Simulación y Pronostico Econométrico para los Tomadores de Decisiones”. sin embargo. El comienzo de esta etapa está marcada por la publicación de H. p. “Economic Cycles: their Law and Causes” (1914). 2001. en que las variables explicativas y los parámetros arbitrarios alcanzan tal número que las aplicaciones no pueden tener significado real”. 1992. aparece la revista “Econométrica”. Esta etapa inicial de caracteriza por comenzar un acercamiento entre la matemáticas y la Economía sin considerar en forma explícita la relación entre datos económicos y técnicas estadísticas. 6 7 Szenerg. Moore. que es considerado por como el primer trabajo econométrico. con frecuencia usados para un solo país y en período breve. al menos desde la perspectiva funcional.26 7 . “Modelo de análisis y Prospectiva Económica Aplicada MAPEA. promovida inicialmente por Charles Roos. 6 2. Etapa 3: Formalización. La mayoría de las aportaciones provienen de individualidades o instituciones aisladas que coinciden en la forma de abordar el análisis económico aplicado.A. Mexico. Editorial Debate S. En el mismo se realizan las primeras estimaciones de las relaciones económicas implícitas en la demanda a través de las estadísticas económicas de principios del siglo XX en Inglaterra. leticia. El inicio de esta etapa se ubica a partir de que el 29 de diciembre de 1930 se funda en Cleveland la Econometric Society. En el desarrollo de esta etapa se pueden detectar un conjunto de trabajos que cumplen con la metodología econométrica. Esta primera etapa se inicia con los primeros intentos de medición de los fenómenos económicos en la Europa del siglo XIX con los trabajos de economía matemática de Von Thunen. En el desarrollo de esta etapa. editor. Cournot. Walrras. Etapa 2: Desarrollos iniciales. Pareto. Jevons. Micahael. p39. EVOLUCION HISTORICA DE LA ECONOMETRIA Para fines explicativos se puede establecer cuatro períodos 7 en la evolución histórica de la econometría: Etapa 1: Antecedentes. no existe evidencia de una escuela formal que aglutine los esfuerzos y las líneas de investigación. etc. Las condiciones comunes de esta etapa se centran en los desarrollos paralelos de teorías económicas y formalizaciones estadísticas que posteriormente serían integradas en el área del conocimiento que se define como “Econometría”. Madrid. José de la cruz gallegos y Luis alejandro lagunas Toledo. “Grandes Economistas de Hoy”. Editorial Trillas. Edgeworth.modelos. Armenta fraire.

Este compendio de normalización econométrica se vería completado tres años mas tarde con la publicación. no fue operativo sino hasta el final de la Segunda Guerra Mundial. 8 Klein. que trata de dotar a la econometría de un cuerpo de conocimiento generalmente aceptado. El principio de la década de los setenta marca el inicio de la quinta y última de las etapas y arranca con la publicación del trabajo de Box y Jenkins sobre los modelos univariantes de series de tiempo (Time Series Analysis) (Time Series Analysis). se genera un gran desarrollo en la modelización y los primeros esfuerzos sistemáticos de aplicaciones empíricas. Prentice Hall. Rubin y Leipnik (1950) establece de una forma sistemática las normas básicas de elaboración de investigaciones econométricas. la cual se erigiría como el núcleo central que habría de configurar la ortodoxia econométrica. En primer término. El cual. A finales de esta etapa se crea también el “Department of Applied Economics” en la Universidad de Cambridge. “A Textbook of Econometrics. y prueba de ello es la aparición de los primeros manuales de econometría como el publicado por Klein en 1953 8. se destaca el perfeccionamiento de los métodos de estimación disponibles . así como el desarrollo de múltiples contrastes y especificaciones alternativas que tratan de solventar los problemas derivados del incumplimiento de las hipótesis consideradas a priori. La caracterización básica de la etapa de extensión viene definida desde dos puntos de vista alternativos. al menos en el campo teorico. cuando Richard Stone toma la dirección del mismo. Koopmans. 1953.que se constituye como el principal medio de comunicación de los econometristas alrededor del mundo y cuyo primer número se publica en 1933. A partir de estos primeros años de la década de los cincuenta ya podemos considerar que la econometría es una disciplina madura. bajo el título de “Statiscal Inference in Dynamic Economic Models”. Etapa 5: Diversidad de enfoques. desde el campo de la econometría teórica. R. Esta cuarta etapa se inicia con la publicación de la Monografía número 10 de la Cowles Comisión en la que. Y en segundo término desde la perspectiva de la econometría aplicada. aunque inicialmente se constituye en 1939 bajo la coordinación indirecta de Keynes. Etapa 4: Extensión. L. de la Monografía número 14 con el título “Studies in Econometric Methods”. 8 . Además se establece la “Cowles Comisión”. Esta época se caracteriza por un esfuerzo de normalización de las aproximaciones y metodología econométrica. en 1953. Nueva York.

la economía toma un cariz estrictamente funcional y las distintas alternativas metodológicas y aplicaciones prácticas se empiezan a juzgar por su capacidad explicativa o predictiva. por primera vez. y que era su capacidad predictiva. las cuales han aportado poderosas herramientas computacionales que han permitido el uso de sistemas de resolución muy complejos en períodos muy cortos. Por último. En lo estrictamente econométrico. vieron aumentar al unísono sus niveles de paro e inflación sin que la teoría económica disponible fuera capaz de de ofrecer una explicación adecuada al respecto. el instrumental teórico sobre análisis econométrico ha sido fortalecido por un desarrollo exponencial de la tecnologías informáticas. Esta diversidad de planteamientos constituye el segundo de los factores diferenciadores que delimitan esta última etapa de la historia econométrica. especificaciones alternativas y nuevas técnicas para abordar el análisis económico aplicado. lo que ha diversificado enormemente las posibilidades de aplicación teórica. Asimismo. 9 . surgirá un nuevo incentivo para los económetras que ha marcado todos los desarrollos posteriores de la disciplina y que podemos asimilar como la característica diferenciadora de esta etapa. y se puso en duda lo que hasta el momento había sido el baluarte que sustentaba todos los desarrollos aplicados. predicción o simulación de escenarios alternativos).El período en que se desarrolla esta última etapa. es decir. Para solventar los problemas antes señalados se desarrollaron aplicaciones cuya justificación última es la obtención de buenos resultados empíricos en cualquiera de las funciones esenciales de los trabajos econométricos (explicación de relaciones económicas. En este contexto empieza a surgir múltiples fuentes de crítica a la modelización tradicional . Partiendo de esta aparente inutilidad de los desarrollos econométricos para adaptarse y anticiparse al nuevo orden económico mundial. representada por los grandes modelos macroeconométricos de ecuaciones simultaneas. y que sirvieron como incentivo para el desarrollo de nuevos contrastes. los inicios del siglo XXI. los lenguajes de programación amigables han facilitado a los investigadores la posibilidad de generar sus propias herramientas de cómputo. los distintos modelos elaborados hasta la fecha comenzaron a fallar sistemáticamente en sus predicciones. esta condicionada por el aumento de los precios energéticos y la consiguiente crisis económica que sufrieron la mayoría de los países desarrollados que.

10 9 . gráfica o matemática de las relaciones entre variables económicas. Rafael. 9 Los modelos económicos se pueden clasificar en: a) Cuantitativos: i) Opinión de expertos. 3ra. c) Series de Tiempo.483. Un modelo económico-matemático es un conjunto de relaciones que representan un proceso económico.Etapa 5 EVOLUCION HISTORICA DE LA ECONOMETRIA Etapa 3 Econometric Society Revista Econométrica Cowles Commision Box-Jenkis Time Series Analysis Etapa 4 Monografía Nº 10 Etapa 2 H. verbal. en el cual se señalan los aspectos principales o fundamentales para su análisis. 10 López Casuso. p484. Universidad Católica Andrés Bello. i) Econométricos. 10 López Casuso. En forma particular un modelo económico se define como una expresión lógica.cit. Ob. “Cálculo de Probabilidades e Inferencia Estadística”. Rafael. MODELOS. ii) Vectores Autorregresivos (VAR). ii) Función de transferencia.2000. ii) Encuestas b) Causales. Un Modelo es una representación simplificada de la realidad.Moore Economic Cycles: their Law and Causes Etapa 1 1914 1930 1959 1970 3. Caracas.p. i) Box –Jenkis (ARIMA). expresadas en forma matemática. Edic.

  beta . es muy parecido al modelo de la línea recta: Y    X Donde:   Coeficiente intercepto 11. El modelo matemático fundamental es el de la línea recta: Y = mX + b Donde: Y = variable dependiente o variable endógena Y = mX+b m b X = variable independiente o variable exógena m = pendiente b = Intercepto (punto donde la recta corta el eje de las ordenadas).   pi .   theta   lamda . en el cual una variable dependiente (efecto) está en función de un(as) variable(s) independiente(s) (causa).La econometría se basa en los modelos económicos-matemáticos.   épsilon .   sigma etc.   gamma . El modelo básico o llamado también “Modelo Clásico”.   delta .   Coeficiente pendiente. 4. Esquemáticamente se escribe: X = ƒ(Y.Z). 11 . MODELOS ECONOMETRICOS. El uso de letras griegas para señalar los coeficientes (constantes). que se puede leer: la variable X está en función de dos variables Y y Z. 11 Es de uso generalizado en econometría. por ejemplo:   alfa .   ro .

Econometría. ya sea por que no son cuantificables o medibles. Por ejemplo. p. Ediciones Pirámide. la variable aleatoria podría ser utilizada como un sustituto de todas las variables excluidas del modelo. el precio de los bienes de consumo.1) Se espera que no todas las 500 observaciones queden exactamente sobre la línea recta porque. el modelo econométrico debe explicar todas las posibles causas que afecten a una variable determinada.1998. además del ingreso. El término de perturbación o variable estocástica ( u ) puede representar claramente todos aquellos factores que afectan el gasto de consumo pero que no son considerados en el modelo. En otras palabras la variable u absorbe todas aquellas variables que explican el comportamiento de la variable dependiente pero que no están planteadas en el modelo.27 12 12 . etc. en la cual se analiza la dependencia de una variable (dependiente) con respecto a otra (independiente). el precio de los bienes sustitutivos o complementarios. Para dar cabida a relaciones inexactas entre las variables. Montserrat y María del Mar Llorente Marrón. Las razones fundamentales que justifican la incorporación del término de perturbación aleatoria al modelo econométrico son. o bien sencillamente por que el investigador considera que no son importantes en el modelo. especificaríamos el modelo de la siguiente forma: C    Y (3. con base en una muestra de 500 familias. y X = Variable independiente ó explicativa. el tamaño de la familia. básicamente los siguientes: 12 a) Si existe alguna teoría que determine el comportamiento de la variable dependiente. Así por ejemplo si queremos estimar una función del gasto en consumo de alimentos (C) con respecto al ingreso disponible (Y). es conocida como el término de perturbación. A diferencia de los modelos matemáticos. Díaz Fernández. existen otras variables que afectan el gasto en consumo. la econometría plantea especificar la función de la siguiente forma: C i    X i  u i (3. es una variable aleatoria (estocástica) que tiene propiedades probabilísticas claramente definidas. ésta suele ser incompleta.Y = Variable dependiente ó explicada. o de error. Por lo tanto.2) donde u . Madrid.

por razones de coste. el efecto combinado de dichas variables podría ser tratado como una variable aleatoria.b) Aun sabiendo cuáles son las variables relevantes en la especificación del modelo. e) El modelo econométrico deberá ser sencillo en su estructura (principio de parcimonia). en otras palabras se ha descrito un marco teórico. lo denominaremos Modelo de Regresión Poblacional (MRP). c) Es posible que la influencia individual de variables poco relevantes en el comportamiento de la variable dependiente sea insignificante y no sistemática y que. Si se puede explicar el comportamiento de la variable dependiente con dos o tres variables. Yt . no justifique su introducción explícita en el modelo. En el análisis empírico. es muy probable que no haya datos sobre todas ellas. En el modelo anterior se ha intentado realizar una descripción sobre el comportamiento general de una relación económica. el subíndice sería una t  : X t . 13 . nos indica que los datos son obtenidos de una muestra de corte transversal. representaremos por u a todas las demás. es preciso tener en cuenta el carácter aleatorio de la conducta humana.2). d) Aun incluyendo satisfactoriamente las variables relevantes en el modelo. En el caso de que los datos sean de una serie cronológica o de tiempo . A este tipo de modelo general. Cuando esto suceda. es muy común que los datos que todos deseamos tener no siempre estén disponibles. y si además nuestra teoría no es lo suficientemente sólida. ut . C U C  Y U U Y En el caso del modelo planteado (3. las cuales están contenidas en u . este se puede leer de la siguiente forma: el gasto de consumo depende en forma lineal del ingreso disponible y de otras variables. La variable aleatoria u podría reflejar también dicho comportamiento. incorporando en su especificación las variables más relevantes. El subíndice i  que tienen las variables.

por lo tanto a la hora de establecer un modelo econométrico. FRM : Y i     X i  u i ^ ^ ^ ^ Y FRM : Y i     X i  U i ^ ^ ^ ^ ^ Yi FRP : Yi    X i  U i Yi A Xi X Donde: el símbolo (^) indica que el valor es estimado (calculado) a partir de los datos ˆ ˆ de la muestra. ui  Yi  Y i ^ La construcción de un modelo implica (i) disponer o elaborar una explicación previa teórica. ya que sería necesario tener todos los datos que representan la población. una vez regresado el modelo. en muy raras veces podremos determinar un modelo que describa el comportamiento general.39 14 . es decir  se leería como alfa estimado. básicamente relacionado con la complejidad de relaciones (tipo de modelo a precisar). Luis y José Niño Díaz. Lo más común es que trabajemos con los datos correspondientes a parte de la población. es decir una muestra.En la práctica. Revisión de los Métodos Cuantitativos en la Economía. la cual es muy parecida a la poblacional pero con unas características propias que la determinan.V. 13 13 Mata Mollejas. (ii) señalar el algoritmo de transformación de unos valores en otros (especificación) y (iii) a partir de las observaciones. trabajaremos con una Función de Regresión Muestral (FRM). estimar el valor de los parámetros y señalar sus características para evaluar el ajuste del modelo al fenómeno bajo estudio. Caracas. u es el valor estimado de la variable estocástica. P.C. 2000. y se conoce con el nombre de residual y es el producto de la diferencia existente entre el valor verdadero de un dato de la variable Y y el valor ˆ estimado del mismo. U. Fondo Editorial Tropykos y Comisión de Estudios de Postgrados.

Cuando e habla de modelos lineales. especialmente al momento de a aplicación de los métodos de estimación de los mismos. PIBt    INVt  ut INVt    TI t   t 5. b) Modelos no lineales.2 Según el número de ecuaciones: a) Modelos uniecuacionales: son los modelos que contienen una sola ecuación Qi    Pi  ui b) Modelos de ecuaciones simultáneas: contienen más de una ecuación.5. la linealidad de los parámetros es la más importante. hacemos referencia a dos sentidos de linealidad: en las variables o en los parámetros.3 Atendiendo a la forma de las relaciones. La linealidad de las variables generalmente se consigue facilmente aplicando alguna transformación al modelo. En la práctica.1 Según el número de variables: a) Modelo de regresión simple: este modelo contiene solamente dos variables. una variable dependiente y una sola variable explicativa. TIPOS DE MODELOS 5. 15 . los modelos pueden clasificarse en. Yt    X t  ut b) Modelo de regresión múltiple: contiene más de una variable explicativa. Yt   0  1 X 1t   2 X 2t   3 X 3t  ut 5. a) Modelos lineales.

Modelo Ecuación Pendiente  dY     dX  | Elasticidad  dY X  . LnY    LnX  u    X  1 Y   1      XY    16 . Mc Graw Hill. FORMAS FUNCIONALES A continuación se muestra un cuadro con los principales tipos de modelos con que generalmente se trabaja en la práctica así como sus representaciones gráficas.6. Econometría.    dX Y  X   Y  Lineal Log-Lin O Log-Log Y    X  u Y   X LnY    X  u Log-Lin  Y  Y    LnX  u Lin-Log 1    x Recíproco 1  1  Y    u   2  X X  Fuente: Damodar Gujarati.

2 Y    X   X  U Y Y    X  U Y 2 Y     X  X  U Y    X  U X X Y    LnX  U Y Y LnY    LnX  u Y    LnX  U LnY    LnX  u X X Y Y   1 U X Y LnY    X  U Y   1 U X X LnY     X  U X 17 .

como se observa a continuación. MODELO DE REGRESIÓN LINEAL.1.2. Y  e  X  u Y 1 1  e   X  u 1 u X ln Y     Y    2X u LOS VALORES DE X SON FIJOS EN MUESTREO REPETIDO. Y    X  u Como se indica en el supuesto los parámetros son los que deben ser lineales (elevados a la uno) sin importar que forma tomen la variable dependiente y la variable explicativa ¿Es el modelo lineal en los parámetros? ¿Es el modelo lineal en las variables? Sí No MRL MRLN Sí No MRL= Modelo de regresión lineal MRNL = Modelo de regresión no lineal. Los valores que toma la variable explicativa (X) son considerados fijos en muestreo repetido. se supone no estocásticos. El modelo de regresión es lineal en los parámetros. SUPUESTOS. 1. Más técnicamente. solo el modelo b) es un modelo de regresión lineal. (a) (b) (c) (d) 1. Cuando estamos analizando un evento económico lo deseable es que se tengan diferentes muestras. para poder así observar el comportamiento promedio de los 18 .CAPITULO II MODELO DE REGRESION LINEAL UNIECUACIONAL (MODELO CLASICO) 1. MRL MRLN Por ejemplo de los modelos que se presentan a continuación.

si el experimento se realiza un gran número de veces.parámetros. la totalidad de los datos de una serie a fin de considerar la mayor o menor representatividad del promedio seleccionado. Dado el valor de X. El promedio de una variable es una medida de su tendencia central.2. 19 . Simbólicamente. Es decir. Como se observa  2 no posee ningun subíndice con lo cual la varianza se considera una constante.  xn f xn  En la ecuación anterior se observa que el valor esperado de X se define como un promedio ponderado de sus posibles valores. deben ser los mismas para todas las muestras.. se escribe como E  X  y se define como E  X   x1 f x1   x2 f  x2   .. denota por la letra  . pero necesitamos conocer cómo se alejan o se acercan del mismo. Por ejemplo.. 1.. en donde las ponderaciones son las probabilidades que se le asocian. Simbólicamente se tiene que varu i / X i   E u i  E u i  / X i  2  E u i2 / X i por el supuesto 3 2 Donde var significa varianza 15. Técnicamente. xn f  x  . un promedio es un valor representativo de un conjunto de datos... la media o el valor esperado del término aleatorio de perturbación u es cero. sino que es necesario determinar como varían o se dispersan el resto de los valores de la serie con relación al promedio elegido o seleccionado. los valores que tome(n) la(s) variable(s) explicativa(s). x2 . se tiene E u / X i   0 14 para toda i = 1.. el valor de la media condicional de u es cero. el promedio es el valor que podemos esperar que sea la media aritmética de la variable sobre todos los experimentos. la varianza de u es la misma para todas las observaciones.n. Este supuesto nos indica que para todas las muestras analizadas. E Z  Z y E X  X . 1... Esto es.3. EL VALOR MEDIO DE LA PERTURBACIÓN u ES IGUAL A CERO. 14   La esperanza matemática (también llamada valor esperado) de una variable aleatoria X cuyos valores posibles y cuya función de probabilidad es x  x1 .. Algunas propiedades de la esperanza matemática son las siguientes propiedades: a) El valor esperado de una constante es igual a la constante b) E Al valor esperado de una variable aleatoria a menudo se le denomina como promedio o valor promedio y se     KX   KE  X  c) E  X 1  X 2  X 3   E  X 1   E  X 2   E  X 3  15 E K   K “En el análisis de una serie de datos no podemos conformarnos con el simple conocimiento de los promedios. Dado el valor de X.4. las varianzas condicionales de u son idénticas. HOMOCEDASTICIDAD O IGUAL VARIANZA DE u .

 X N  X        2 2 2 son los cuadrados de los desvíos con respecto a la media aritmética. siendo por tanto todos los valores de la serie iguales y alcanzando el promedio de la misma una representatividad óptima. A menor valor de una medida de variación o dispersión mas concentrados estarán los datos alrededor del promedio.  X 2  X  .. X N los datos de una serie y donde           X 1  X  . X 3 ...”15 Entre las principales medidas de dispersión tenemos a la Desviación Típica o Error Estándar Varianza  . Sean X 1 . lo cual nos indicaría que no existe alguna dispersión entre los datos y su promedio. 2   y la La desviación Típica se define como la raíz cuadrada positiva del promedio aritmético de los cuadrados de los desvíos con respecto a la media aritmética.. Lo ideal o utópico sería que al calcular una medida de variación ésta nos resulte igual a cero.La ecuación anterior establece que la varianza de u para cada X (esto es la varianza condicional de u ) es algún número positivo constante igual a  2 .. siendo éste por tanto más representativo.. o igual A mayor valor de una medida de variación o de dispersión menos concentrados estarán los datos de una serie con relación al promedio de la misma y por tanto menor representatividad tendrá el promedio de la distribución.              X 1  X    X 2  X    X 3  X   . Técnicamente la ecuación representa el supuesto de Homocedasticidad..   X N  X          N 2 2 2 2        Xi  X     N 2   d N 2 i donde d  X  X  La varianza se define como el cuadrado de la desviación típica o estándar     Xi  X    2   N 2  x  E  X  E  X 2 2 d N 2 i 20 . X 2 ...

(homo) dispersión (cedasticidad), o igual varianza. Planteado de otra forma, la ecuación significa que las poblaciones Y correspondientes a diversos valores de X tienen la misma varianza. En contraste, cuando la varianza condicional de la población Y varía con X, se conoce como Heterocedasticidad, o dispersión desigual o varianza desigual.

varu i / X i    i2
1.5. NO AUTOCORRELACIÓN ENTRE LAS PERTURBACIONES.

Dado dos valores cualquiera de U, La correlación entre dos u i y u j cualquiera i  j  es cero. Simbólicamente

covu i u j / X i X j   E u i  E u i  / X i u j  E u j  / X j   E u i / X i u j / X j  0

donde i y j don dos observaciones diferentes y donde cov significa covarianza, Lo que supuesto nos indica es que entre dos o más perturbaciones (observaciones de la variable aleatoria) no de debe existir ninguna relación. Cuando el término de perturbación cumple con los supuestos homocedasticidad y no autocorrelaciòn se le califica de perturbación esférica. de

1.6.

LA COVARIANZA ENTRE u i Y X i ES CERO,

o. Formalmente.

 E u i  X i  E  X i  , puesto que E u i  0  E u i X i   E  X i E u i  , puesto que E  X i  es no estocástica.  E u i X i  , puesto que E u i  0 0

covu i , X i   E u i  E u i X i  E  X i 

 

 

Este supuesto establece que la perturbación u i y la variable explicativa X no están correlacionadas. El razonamiento para este supuesto es el siguiente: Cuando se expresa la FRP, se supone que X y u (la cual puede representar la influencia de todas las variables omitidas) tienen una influencia separada (y aditiva)

21

sobre Y. Pero si X y u están correlacionadas, no es posible determinar sus efectos individuales sobre Y. Así si X y u están correlacionadas positivamente, X aumenta cuando u aumenta y disminuye cuando u disminuye. Similarmente, si X y u están correlacionadas negativamente X aumenta cuando u disminuye y disminuye cuando u aumenta. En cualquier caso, es difícil aislar la influencia de X y u sobre Y. Este supuesto se cumple automáticamente si la variable X no es aleatoria o no es estocástica.

1.7.

NO HAY MULTICOLINEALIDAD PERFECTA.

Es decir, no hay relaciones perfectamente lineales entre las variables explicativas.

covX i X j   0

donde i  j 

Para poder analizar la relación existente entre la variable dependiente y las variables explicativas, el investigador debe tener seguridad de que las variables explicativas son totalmente independientes una de las otras, para poder tener certeza plena del significado de cada uno de los coeficientes pendientes. 1.8. EL NÚMERO DE OBSERVACIONES NÚMERO DE PARÁMETROS POR ESTIMAR.
n DEBE SER MAYOR QUE EL

Alternativamente, el número de observaciones n debe ser mayor al número de variables explicativas.

1.9.

VARIABLILIDAD DE LOS VALORES DE X.

No todos los valores de X en una muestra dada deben ser iguales, Técnicamente, var(X), debe ser un número positivo finito.

2. PROPIEDADES DE LA FUNCION DE REGRESION MUESTRAL (FRM)
ˆ Y i     X i  ui
^ ^ ^

22

2.1. Pasa a través de las medias muestrales de Y y X

Y

Y i    Xi U i

^

^

^

^

Y

X

X

ˆ 2.2. El valor de la media de los residuos u i es igual a cero. Recordemos que
ˆ u  Y Y
^

3. MEJORES ESTIMADORES LINEALMENTE INSESGADOS (MELI)
Un estimador es considerado el mejor estimador linealmente insesgado 16 (MELI) cuando cumple las siguientes propiedades: a) Es lineal, es decir, función lineal de una variable aleatoria, tal como la variable dependiente Y en el modelo de regresión.

ˆ b) Es insesgado, es decir, su valor promedio o esperado, E  ˆ verdadero, E   





es igual al valor

c) Tiene varianza mínima dentro de toda la clase de todos lo estimadores lineales insesgados; Un estimador insesgado con varianza mínima es conocido como un estimador eficiente

16

También es conocido con las siglas de ELIO (Estimador Linealmente Insesgado Optimo). O con sus siglas en ingles BLUE (Best Linear Umblased Estimator) 23

d) Son consistentes, a medida que aumenta el tamaño de la muestra, el estimador, se va aproximando al parámetro verdadero. Dado que un estimador es una función matemática de los valores de la muestra, si sustituimos en dicha función los valores observados, que componen una muestra concreta, se obtiene un número que es la estimación. El objetivo de la econometría es que la estimación se aproxime lo más posible al verdadero valor del parámetro que pretendemos estimar y para ello, el estimador ha de cumplir una serie de propiedades deseables. En primer lugar. Convendría que el estimador proporcionara estimaciones centradas en el verdadero valor del parámetro cuando tenemos diferentes muestras. Este hecho está relacionado con una propiedad que se conoce como insesgadez. Un estimador es insesgado si su esperanza matemática coincide con el valor del parámetro que pretende aproximar. En definitiva, lo que se establece es que la variable aleatoria estimador tiene una distribución cuya media es el parámetro que se está estimando. Otra propiedad conveniente de considerar es la variabilidad o dispersión del estimador. Puede que un estimador tenga muy poca variabilidad, aun siendo sesgado, y que otro estimador insesgado posea una gran varianza. El estimador lineal e insesgado de menor varianza será él óptimo, que se conoce como MELI.

4. TEOREMA DE GAUSS-MARKOV
Dados los supuestos del modelo clásico de regresión lineal, los estimadores de mínimos cuadrados, dentro de la clase de estimadores lineales insesgados, tienen varianza mínima, es decir son MELI.

24

Lo que este teorema nos indica es que siempre y cuando se cumplan los supuestos del modelo clásico (no autocorrelación, no multicolinealidad, homocedasticidad, etc,), los parámetros estimados mediante el método de los mínimos cuadrados ordinarios, serán los mejores estimadores linealmente insesgados (MELI), lo que nos permite a partir de un Modelo de Regresión Muestral realizar conclusiones válidas sobre una posible relación de causalidad a nivel poblacional.

5. ESTIMACION DE LOS PARAMETROS A TRAVES DEL METODO DE LOS MINIMOS CUADRADOS ORDINARIOS.
El método consiste en minimizar la sumatoria del cuadrado de los residuales. Como se sabe, para calcular el mínimo o máximo de una función, se calcula la primera derivada de la función y se iguala a cero para determinar los valores críticos. A continuación realizaremos los siguientes pasos: a) se determinará la función: sumatoria del cuadrado de los residuales a partir del modelo clásico

ˆ Y   X  u ˆ u  Y   X ˆ u 2  (Y     X ) 2
ˆ  u 2   (Y     X ) 2
^ ^

^

^

^

^

^

^

b) Ahora tenemos una función con dos incógnitas. A continuación realizaremos las derivadas parciales de la función con respecto a los dos coeficientes, e igualaremos a cero ambas derivadas.

ˆ u 2 
^

 2 (Y     X )(1)  0

^

^

(2) (Y     X )  0

^

^

 (Y     X )  0
25

^

^

Y  N     X  0 Y  N    X
Y
N  X   N N N
^ ^

^

^

^

^

(1ra ecuación normal)

Y    X

^

^

  Y  X

^

^

ˆ  u 2   (Y     X ) 2

^

^

ˆ u 2 
^

 2 (Y     X )( X ))  0
^ ^

^

^

(2) (Y     X )( X )  0

 (Y     X )( X )  0  (YX   X   X
^ ^ ^ ^ 2

`^

^

)0
2

 YX    X    X
^ ^

0
2

 YX    X    X

(2da ecuación normal)
2

 YX  (Y   X ) X    X

^

^

 YX  Y  X   X  X    X  YX  Y N X   X N X    X
26
 

^

`

2

^

^

2

 YX  N Y X   N X

 

^

2

X2

^

 ^    YX  N Y X     X 2  N X 2      

 YX  N Y X  X N X
^ 2  2

 

la cual también se puede expresar:
ˆ 

 yx x
2

donde y  Yi  Y  y x  X i  X 

EJERCICO Nº 1

Supongamos que la función de demanda de un bien Z se pueda aproximar mediante un modelo de regresión simple donde X representa el precio del bien e Y la cantidad demandada del mismo. A partir de la información muestral recogida en la tabla siguiente estimaremos los coeficientes beta de la regresión.
Y 200 300 100 50 75 725 X 50 25 75 125 100 375

Yi    X i  u i (FRP)

 0

27

ˆ Yi     X i  u i (FRM)

^

^

Y 200 300 100 50 75 725

X XY X2 50 10.000 2.500 25 7.500 625 75 7.500 5.625 125 6.250 15.625 100 7.500 10.000 375 38.750 34.375

Y

725  145 5

X 

375  75 5

 
^

^

38750  (5)(75)(145)  2,5 34375  (5)(75) 2

  145  (2,5)(75)  332,5
^

Yi  332,5  2,5 X i

EJERCICIO Nº 2

A continuación se presentan los datos hipotéticos sobre el gasto de consumo familiar semanal (Y) y el ingreso familiar semanal (X)

28

600 25.000 1110 Y  111 10  ^ 1700 X   170 10    ^ 205500  (10)(111)(170)  0.200 150 260 39.5091)(170)  24.600 65 100 6.500 X2 6.600 115 180 20.4545 Yi  24.500 90 120 10.4545  0.5091X i ^ 29 .400 57.600 322.110 1.800 95 140 13.700 205.400 19.000 1.Y($) X($) 70 80 65 100 90 120 95 140 110 160 115 180 120 200 140 220 155 240 150 260 Yi    X i  u i (FRP)  0 ˆ Yi     X i  u i (FRM) ^ ^ Y($) X($) YX 70 80 5.000 140 220 30.400 10.400 40.5091 322000  (10)(170) 2   111  (0.600 67.700 120 200 24.800 155 240 37.000 48.300 110 160 17.600 32.000 14.

COEFICIENTE DE DETERMINACION R 2  El coeficiente de determinación nos indica el porcentaje de variaciones de la variable dependiente que son explicados por el modelo.6. Una medida tal es: R2  SCR STC  SEC SEC  1  STC STC STC 30 . A medida que el porcentaje es mayor. nos indica en que medida el modelo se ajusta a los datos. STC = SEC+ SCR  Y i ˆ  Yi    uˆ 2   2 2 i Y ˆ U i = Debido al residuo Yi FRM ˆ   X i ˆ Y  i  Y   total ^ Yi   ˆ   Y i  Y   Debido a la regresión   Y 0 X X i Para medir la capacidad de explicación de la ecuación de regresión requerimos una medida que indique toda la variación en Yi que la regresión puede explicar. motivo por el cual a este estadístico también se le conoce con el nombre de BONDAD DE AJUSTE. Sea: STC = suma total de cuadrados =  Yˆ  Y  i 2 ˆ SCR = suma de cuadrados debida a la regresión (o explicada) =  Yi  Y SEC = suma de los errores al cuadrado = Entonces.

el valor de r 2 se acercará a cero.63 decimos que la relación estimada puede explicar el 63 por ciento de las variaciones de la variable dependiente. el valor de r 2 cae entre cero y la unidad. si la ecuación de regresión no explica nada. Por lo tanto todos los puntos del diagrama de dispersión entre YI y X i deberán caer sobre la línea. Notemos que SCR = 0 y por lo tanto r 2 = 0. SEC asume su valor máximo. Esto implica que. En el otro extremo. Mientras mayor sea la explicación de la ecuación a variaciones de YI (por ejemplo mientras los puntos caigan más cerca de la línea de regresión). y conforme se debilite la relación entre YI y. Por tal ˆ motivo. Por lo tanto. En los casos más tradicionales. r 2 indica la fracción de la variable dependiente a la que puede responder la ecuación estimada. pero no para todos. YI sería una perfecta combinación lineal de. En este caso SCR = STC y por lo tanto r 2 =1. Si la ecuación de ˆ regresión puede explicar toda la variación de Yi (por ejemplo Yi  Yi para todas la i). la ecuación de regresión responde para algunos de los valores de. debido a que SCR = 0. debemos tener que Yi  Yi para todo i. por ejemplo.Donde a r 2 se le conoce como el coeficiente de determinación. es decir SEC = STC. La fórmula general para el coeficiente de determinación en regresión simple es: 2 R   yx  covYi X i 2   varYi  var X i   y 2  x 2 2   yx yx x y 2 2 2 ˆ R2    yx  ˆ  YX  NYX y  Y  NY 2 2 ejemplo: para el ejercicio anterior 31 . si r 2 = 0. más se acercará r 2 a la unidad. y ˆ u i  0 . por lo que SEC = 0. Puesto que.

600 32.500 10.400 57. se recurre al coeficiente de determinación corregido o ajustado.Y($) 70 65 90 95 110 115 120 140 155 150 1.509 205500  10(111)(170) 16800  0. R 2  R 2 .400 19. En caso de que el R 2 resulte ser negativo en una aplicación.800 37. aun cuando el R 2 es necesariamente un valor positivo.300 17.225 8. para comparar dos o más modelos con diferentes números de variables explicativas.400 10.700 XY 5. 32 . el R 2 aumenta menos que R 2 . COEFICIENTE DE DETERMINACION AJUSTADO R 2  Se puede fácilmente demostrar que.600 6.400 40. su valor se toma como cero.800 13.225 14.20% de las variaciones del gasto de consumo familiar ˆ son explicados por el modelo.600 322.100 r 2  0.025 22. aunque las nuevas variables no contribuyesen en nada a la explicación de Y.100 13. el coeficiente R 2 aumenta o como mínimo permanece inalterado.000 14.700 24. definido por: R 2  1 1 R2  N 1  N K De acuerdo con la ecuación se hace entendible que para k>1.000 48.000 4.80% es explicado por otras variables u i  7.600 24.200 39. 8. el otro 3.110 X($) 80 100 120 140 160 180 200 220 240 260 1.962 2 132100  10(111) 8890 Lo que nos indica que el 96.600 67. Por ello.100 9. cuando en un modelo se incluyen nuevas variables explicativas. el cual es una medida del grado de asociación o relación entre dos variables.509  0.600 20.500 132.000 205. lo cual implica que a medida que el número de variables X aumenta. y el R 2 puede ser negativo.025 12.600 25.400 19.900 4.500 X 2 Y 2 6.000 30. pero conceptualmente muy diferente de este es el coeficiente de correlación (r). COEFICIENTE DE CORRELACION (r) Una cantidad estrechamente relacionada con el coeficiente de determinación.

ˆ ˆ ˆ ˆ Pr   t / 2ee       t / 2ee   1       33 . 9.51  r  0. el coeficiente de correlación entre X y Y rXY  es el mismo que entre Y y X rYX  . c) Es simétrico por naturaleza. En forma referencial se dice que: Cuando Cuando Cuando Cuando r < 0. es decir. 0. 0. 0. según la relación entre las variables sea directa o inversa respectivamente.00 el Coeficiente de Correlación es fuerte.30  r  0.50 el Coeficiente de Correlación es mediano. ESTIMACION POR INTERVALOS Dada una muestra y obtenida una estimación de  mediante el método de los mínimos cuadrados (MCO). su uso en la descripción de relaciones no lineales no tiene significado. por ejemplo Y  X 2 puede describir una relación exacta y r puede ser cero. Cuanto más pequeño sea ese intervalo más precisa será la estimación. b) Cae entre los límites –1 y +1.80 el Coeficiente de Correlación es apreciable. el cual mide la covarianza muestral entre las dos variables. El signo del coeficiente lo determina el numerador. es decir  1  r  1 . d) Es una medida de asociación lineal solamente.81  r  1. se puede construir un intervalo que arrojará dos valores entre los cuales se encuentra el parámetro buscado con el nivel de confianza que se desea.r   r2 r covYX   varY  var X   yx y x 2 2 2 2 r  YX  NYX  Y  NY  X  NX  2 Algunas de las propiedades de r son las siguientes: a) Puede tener signo positivo o negativo.30 el Coeficiente de correlación es débil.

La ecuación anterior proporciona un intervalo de confianza para  al. qué tan preciso mide el estimador al verdadero valor poblacional. entre más grande sea el error estándar del estimador. Expresado de otra forma. el cual puede ser escrito en forma más compacta como: ˆ ˆ   t / 2ee   intervalo de confianza para  al 100(1.  = nivel de significancia. más amplio será el intervalo de confianza. k = Nº de coeficientes del modelo). normalmente es llamado el valor crítico t a un nivel de significancia de. mayor será la incertidumbre de estimar el verdadero valor del parámetro desconocido. Es de práctica generalizada. 100    contendrán al parámetro o coeficiente poblacional. el de 5%. el error estándar de un estimador es descrito frecuentemente como una medida de la precisión del estimador. utilizar niveles de significancia de 1%. ˆ ee  = error estándar del coeficiente ˆ ˆ a su vez ee    2   1  X  NX 2 2 ˆ ˆ ee    ˆ u 2 2 X N  X  NX  2 2 2 ˆ 2  ˆ u 2 nk = varianza estimada de los residuales. Es decir mientras más grande sea el error estándar. Es importante destacar que el intervalo de confianza es proporcional al error estándar del estimador. Donde: t / 2 = es el valor de la variable t obtenida de la distribución t para un nivel de significancia  / 2 y n-k grados de libertad (n = Nº de observaciones.  1 r2   Y 2  NY 2 = sumatoria del cuadrado de los  residuales. siendo el más usado. )%. 5% y 10%. ˆ ˆ El significado del intervalo de confianza   t / 2ee  es el siguiente: de cada 100 intervalos que se formen.  34 . es decir. Así.

036  0.82  42. La palabra compatible.23 10  2 42. Utilizando la metodología de las pruebas de hipótesis.05)%. La hipótesis planteada es conocida como hipótesis nula y está denotada por el símbolo H 0  .306 0. se utiliza aquí en el sentido de que la observación está lo suficientemente cercana al valor hipotético de tal forma que no se rechaza la hipótesis planteada.426. Es de hacer notar que no se puede decir que la probabilidad de que el intervalo específico (0.306 0.509  2.592 La interpretación de este intervalo de confianza es: dado el coeficiente de confianza de 95%.962 132100  10111  0. 0.82 2   ˆ 2  337.0388890  337. (1-0.23  1  2 332000  10170  t / 2  2. en 95 de cada 100 casos intervalos como (0.592) contendrán el verdadero valor.05 0.036 33000 ˆ ee   42.426.306   5%  0. con algunas hipótesis planteadas o no?. Cuando realicemos una prueba de hipótesis nos estaremos planteando la siguiente pregunta: ¿es compatible una observación dada o un hallazgo.592) contenga el verdadero valor  sea de 95% porque este intervalo es ahora fijo y no aleatorio. En términos generales.23  0. por consiguiente  se encontrará o no dentro de el. La probabilidad de que el intervalo específicamente fijado incluya al verdadero valor de  es 1 o 0.Ejemplo: ˆ u 2  1  0.036     0. realizaremos la prueba de la significancia individual de los coeficientes. PRUEBA DE HIPOTESIS (SIGNIFICANCIA INDIVIDUAL DEL COEFICIENTE O PRUEBA T). La hipótesis alternativa puede ser simple (prueba de una cola) o compuesta (prueba de dos colas). La hipótesis nula es usualmente probada frente a una hipótesis alternativa denotada por H 1  . en el largo plazo. una prueba de 35 . 10.509  2.426    0. 0.

¿qué implica que aceptemos la hipótesis nula de que el coeficiente estimado estadísticamente sea igual a cero?. Seguidamente calcularemos un estadístico t: t ˆ   ˆ ee   donde  es el valor medio de beta estimado. por lo cual en nuestra situación. lo compararemos con el estadístico.   son significativamente diferentes o no a cero. podemos ver tres áreas claramente definidas.significancia es un procedimiento mediante el cual se verifica si una observación dada es significativamente igual o diferente a una hipótesis nula planteada. El valor cero denota noˆ existencia. o llamada también zona de aceptación de la hipótesis nula. o zona de confianza. esto nos indicaría que no importa que valor tome X. llamadas zonas críticas. cuyo valor correspondiente es aquel que hemos definido previamente en la hipótesis nula. si por ejemplo para el modelo: FRM : Y i     X i  u i aceptamos la hipótesis de que   0 . En el gráfico que se muestra a continuación. lo cual nos conduce a plantear las siguientes hipótesis: H0 :   0 H1 :   0 ¿Por qué cero?. que en nuestro caso es cero. con n-k grados de libertad y un nivel de significancia. este se anularía. la variable explicativa no tiene una presencia real en el modelo. ya que al ^ ^ ^ multiplicarse por cero. en la cual trataremos de verificar si nuestros coeficientes estimados  . 36 . y dos zonas laterales o colas. es decir. el estadístico t calculado quedaría de la siguiente forma: ˆ  t ˆ ee   A continuación este estadístico calculado. determinado en la tabla de la distribución t. una central. o zonas de rechazo. En otras palabras no existe relación entre X y Y. Procedimiento: Realizaremos una prueba de dos colas (hipótesis alternativa compuesta).

306 Ejemplo: 37 . si el t calculado cae en alguna de las dos colas. Generalmente está conclusión se expresa en forma resumida de la siguiente forma: el coeficiente no es significativo. O en forma resumida el coeficiente si es significativo. Igualmente. nuestra decisión es aceptar la hipótesis nula de que el beta es igual a cero.5% H1 t / 2 H0 t 2.Si la t que hemos calculado cae en la zona central. con lo cual nuestra conclusión sería: el coeficiente beta si es significativamente diferente a cero.5% H1 -2. con lo cual nuestra conclusión sería que el coeficiente beta no es significativamente diferente de cero.5% 2.5% H1 / 2   5% 95% 2.306 H0 H0 :   0 H1 :   0 H1 2.   5% 95% 2. nuestra decisión es rechazar la hipótesis nula y aceptar la hipótesis alternativa.

813 14.764 3.00 Como se puede ver la tabla t nos indica que el estadístico para una prueba de dos colas.571 3.025 0.895 2. .833 2.036 Como se puede observar la t calculada (14.812 2. NOTA: La primera columna corresponde a los grados de libertad.306 2.860 2.711 1.363 1.893 6 0. PRESENTACION RESUMIDA DE LOS RESULTADOS OBTENIDOS Una forma muy práctica de presentar los resultados obtenidos.718 3. . es la siguiente: ˆ Yi  24.454  0.143 3. Lo que nos indica que si existe una relación entre el gasto de consumo familiar semanal (Y) y el ingreso familiar semanal (X).144 11 0. corresponde al error estándar del coeficiente.727 1.20 0. por lo cual rechazamos la hipótesis nula y aceptamos la hipótesis alternativa de que el beta es diferente de cero.106 4. con un 5% de significancia (  0.10 0.718 1.297 10 0.139 0.785 8 0.05 0.896 3. .700 1.Puntos porcentuales de la distribución t 0.306.509 X i 6.139 r 2  0.05 0.05) y 8 grados de libertad n  k  10  2  es igual a 2.902 donde el primer número entre paréntesis debajo de cada coeficiente.25 0.355 4.796 2.509  14. t 0.005 0.397 1.139) es mayor que la t de la tabla (2.250 4.01 0.02 0.365 2.821 3.50 .415 1.306). con lo que concluimos que el coeficiente beta es significativamente diferente a cero.998 3. 5 0.001 0. .015 2.262 2. el coeficiente es significativo.703 1.706 1.01 0.447 3.365 4.476 2.440 1.501 9 0.383 1.208 7 0. o en forma resumida. y el segundo paréntesis corresponde a la t calculada de cada coeficiente.201 2. 11.414 0.707 5.169 4. por la tanto cae en la cola de la derecha.499 4. y la primera fila coresponde a los niveles de significación 0.372 1.036 3.032 5.697 1. 38 .025 .228 2.943 2.10 0.

2001 39 . Yolanda González G. Ediciones Pirámide S. RA – MA Editorial. Antonio y Ana María López. Menú principal Ventana de comandos Ventana de Objeto activo Ventana de Workfile En primer lugar definiremos el tipo de la serie a regresar. Madrid.APENDICE 1 RESOLUCION DE EJERCICIO MEDIANTE EL PAQUETE Eviews 5..0 17 A continuación realizaremos el ejercicio de la página 36 a través del paquete econométrico Eviews 5. 1999. con lo cual aparecerá la ventana de Workfile Range 17 Para una más amplia explicación.. Ursicino. con 10 observaciones. Predicción y Simulación Aplicada a la Economía de Empresas. Análisis Econométrico con Eviews. Carrascal A. Como se puede observar la serie es de corte transversal.. A tal fin seleccionamos: FILE / NEW / WORKFILE . Y Beatriz Rodríguez P. se puede consultar: Pulido.A. Madrid.0 .

40 . Los datos también se pueden traer de Excel mediante un COPY/PASTE. para lo cual escribimos:Data INGRESO CONSUMO en la Ventana de Comandos y se introducen los datos de la serie.A continuación definimos las variables a utilizar. o mediante la opción de menú FILE/IMPORT: Para activar los datos escribimos: show consumo ingreso.

Una vez introducido los datos podemos visualizar en primer lugar el gràfico de los datos. para tal fin seleccionamos: VIEW/GRAPH/LINE 41 .

El gráfico nos da un primer acercamiento al tipo de relación existente entre las variables. Para realizar la regresión seleccionamos: PROCS / MAKE EQUATION /OK 42 .

Coeficiente de Determinación R 2 : 0. Generalmente diremos que el coeficiente es significativo si el P-valor es menor o igual que 0.24317 .Coeficiente Pendiente: 0.Intercepto : C .Variable dependiente : CONSUMO .45455 . lo que nos indica que a cualquier nivel de  el coeficiente es significativamente diferente a cero.Coeficiente Intercepto: 24.Finalmente nos aparece la salida final con el modelo ya regresado. Por ejemplo el P-valor para el coeficiente de la variable ingreso es 0. en el cual se muestran todos los datos necesarios para nuestro análisis: .Error estándar del coeficiente pendiente: 0.812791 .Estadístico T del coeficiente pendiente: 14.035743 .Error estándar del coeficiente intercepto: 6.0000.Número de Observaciones: 10 .Variable explicativa: INGRESO . 43 .413817 .962062   Un valor importante de destacar es el P-valor (Prob). el cual nos indica el mínimo que debe tener  para que el coeficiente sea significativo.Estadístico T del coeficiente intercepto: 3.05.509091 .

CAPITULO III. tg   m  Y CO Y Y  2 1 CA X 2  X 1 Y2 CO Y1  CA X1 X2 X Geométricamente la tangente del ángulo está definida como cateto opuesto (CO) sobre cateto adyacente. la variación absoluta en el sueldo (o en este caso. producto marginal.000 Bs. el aumento) es de 20. por ejemplo si el año pasado nuestro sueldo era de 100. Lo anterior nos indica que la pendiente es simplemente el número de unidades en que varía la variable dependiente cuando varía en una unidad la variable independiente. así CO  Y2  Y1 y CA  X 2  X 1 Cuando restamos dos valores.000 Bs. La pendiente de una recta está definida como la tangente del ángulo que forma la recta con el eje de las ordenadas.PENDIENTE DE LA ECUACIÓN (VARIACIÓN MARGINAL) ¿Cuál es el significado económico del coeficiente pendiente?. ingreso marginal. En economía este concepto se conoce como variación marginal. Y ahora es de 120. (costo marginal. Lo que estamos obteniendo es la variación absoluta entre esos dos valores.) 44 .000 Bs. . En el gráfico podemos observar que ambos catetos son el resultado de la diferencia entre dos puntos. SIGNIIFICADO DE LOS COEFICIENTES 1. etc.

509 dólares. m dY dX Si derivamos el modelo clásico Y    X  u tenemos que: dY  m dX Lo cual significa que en el modelo clásico el coeficiente beta (el que acompaña a la X) es la pendiente de la ecuación. ˆ En el ejemplo que hemos estado trabajando YI  24. Mas específicamente por cada dólar en que se incremente el ingreso familiar semanal. Para una función discreta la elasticidad viene definida por: Y2  Y1 Y  Y X1 Y1 var iación.%. la pendiente de la ecuación viene definida como la primera derivada de la misma. X X1 Para una función continua: 45 . Su fórmula de cálculo resulta de dividir el cambio relativo o porcentual en la variable dependiente entre el cambio relativo o porcentual en la variable explicativa.Y  E  2 1 X 2  X 1 X 2  X 1 Y1 var iación.m Y2  Y1 Y  X 2  X 1 X   var iación En una función continua como es el caso de los modelos econométricos. el gasto de consumo familiar se incrementará en 0. 2. y el mismo indica el número de unidades en que varía la variable dependiente. cuando se incrementa en una unidad la variable explicativa.454  0.509 X I podemos interpretar que por cada unidad monetaria en que se incrementa X.ELASTICIDAD La elasticidad de una función es una medida de variación relativa y nos indica el grado de sensibilidad de una variable dependiente ante cambios en la variable explicativa. la variable Y se incrementará (signo positivo) en 0.%.509 unidades monetarias.

Por ejemplo si E = 2. la variable dependiente aumentará en 2.8 nos indicaría que por cada 1% que aumente la variable explicativa.5 nos indica que por cada 1% que aumente la variable explicativa.5%.E dY X dX Y En el cuadro siguiente se indica el significado de los posibles resultados de la elasticidad Sí E 1 Si E 1 Sí E  1 Donde el símbolo La inelástica elasticidad es La elasticidad es unitaria La elástica elasticidad es indica valor absoluto. la variable dependiente disminuirá en 0. respectivamente. como vemos la disminución de Y es menor que el aumento de X. Una elasticidad unitaria nos indica que las dos variables varían en la misma proporción. Una elasticidad elástica nos indica que el cambio relativo en la variable dependiente es más que proporcional al cambio en la variable explicativa. la puntual y la promedio. Por ejemplo si E = .8%. como vemos la disminución de Y es mayor que el aumento de X Existen dos tipos fundamentales de elasticidad.0. La puntual calcula la elasticidad en un punto específico de la función. directa o inversa.. Es importante tener presente que el signo positivo o negativo que tenga el valor de la elasticidad solamente nos señala el sentido de la relación. Una elasticidad inelástica nos indica que el cambio relativo en la variable dependiente es menos que proporcional al cambio en la variable explicativa. y está definida por: E dY X 1 x ˆ dX Y1 Y la promedio: E dY X x dX Y 46 .

454  0. el cual presenta la dificultad de no ser lineal en los parámetros (  1 .509300  177. por lo tanto no le es posible aplicar el método de los mínimos cuadrados ordinarios. Para poder hacerlo. la primera derivada es: fórmulas quedan de la siguiente forma: dY   . MODELO LOGARITMICO Yi   0 X i1 e ui Este modelo es conocido como el modelo de regresión exponencial. el consumo familiar aumentará en 0.154 E  0. ln Yi  ln  0 X i1 e ui   ln Yi  ln  0  ln X i1  ln e ui 47 .332 E X 170 Cuando el ingreso promedio aumenta en 1% el consumo aumenta en 0. ˆ Puntual E   a) ˆ E Xi ˆ Yi ˆ Yi  24.332% 3.862%.En el caso del modelo clásico.509 300  0. tenemos que transformar la ecuación en una lineal.509 111  0. y b) determine la elasticidad ingreso promedio del consumo familiar.862 177. por cada 1% que aumente el mismo.154 Cuando el ingreso es de 300$. lo cual haremos aplicando logaritmos. es de por sí un exponente). b) ˆ Y  0. por lo tanto las dX Xi ˆX y promedio E   ˆ Yi Y Por ejemplo determine: a) la elasticidad ingreso del consumo familiar cuando el ingreso familiar es de 300$.

despejando  1 dX Y dX X Por lo tanto para el modelo logarítmico: 48 . por lo cual también es conocido como modelo de regresión de elasticidad constante.ln Yi  ln  0   1 ln X i  ui ln e ln Yi  ln  0  1 ln X i  ui Este modelo es conocido como el modelo de regresión logarítmico. Esta función es de mucha utilidad por que el coeficiente  1 es directamente la elasticidad del modelo. E dY X dX Y Sí Y   0 X 1 e u   X 1 e u dY   0 1 X 1 1e u   0 1 X 1 X 1e u  0 1 dX X E  0 1 X  e u X 1 X Y   0 1 X  e u 1 X X  1  0 X 1 e u Si ln Y  ln  0  1 ln X  u dY dY X d ln Y  1  Y  E dX dX Y d ln X X Para determinar la variación marginal: 1  E  dY X dY Y .

Respuesta: i) A primera vista parece lógico pensar que la demanda de automóviles disminuya conforme aumente su precio. el coeficiente  1 . ELASTICIDADES 18 Una empresa fabricante de automóviles desea estimar la demanda de automóviles ( Dt ) en función del precio de los mismos ( Pt ). gráfica y económicamente los coeficientes  0 y  1 .  1 . p. Pablo Amorós González y Silvia Relloso Pereda..  1  0  ii) En el modelo (a) tenemos que.es la derivada de la cantidad demandada respecto al precio: 18 Tomado de: Pérez Amara. ii) Interprete matemática. iii) Interprete el significado económico de los coeficientes  1 . 1 y  1 ?. para cual dispone de los datos de ambas variables de la propia empresa en los últimos 120 meses t  1.1 49 . matemáticamente.120  . Teodosio.2. En tal caso el coeficiente  1 debería tener signo negativo... “Ejercicios de Econometría Empresarial”. 1 y  1 de los modelos anteriores. Mc Graw Hill.Elasticidad Variación marginal dY dX 1 1 ˆ Y Y ó 1 X X EJERCICIO Nº 3 . 1993. iv) ¿Cómo podemos obtener las elasticidades precio de la demanda de automóviles en cada modelo a partir de  1 . España. Con este objetivo se estiman los siguientes modelos: a) Dt   0  1 Pt  ut b) ln( Dt )   0  1 ln( Pt )  ut c) ln( Dt )   0  1 Pt  ut d) Dt   0   1 ln( Pt )  ut i) ¿Cuál es el signo esperado del coeficiente  1 del primer modelo?..

consecuentemente. 50 .1  dDt dPt que en términos de incrementos puede expresarse como: 1  Dt Pt por otro lado. Sin embargo. la demanda de automóviles en un determinado momento del tiempo es una función lineal de los precios en ese mismo período. en este modelo. en este caso carece de significado económico. es previsible que dicho coeficiente tenga signo negativo y que. gráficamente.  1 mide cuantas unidades variará la cantidad demandada de vehículos cuando el preció se incrementa en una unidad (consumo marginal). Por lo tanto. si el precio sube una unidad la cantidad demandada de automóviles decrezca  1 unidades. la pendiente de la recta y  0 el punto de corte con el eje de las ordenadas (eje que en este caso indica la cantidad demandada). del tipo: CANTIDAD DEMANDADA TERMINO CONSTANTE 0 PENDIENTE 1 PRECIO Donde  1 es. ayuda a colocar la función de demanda en el eje de las ordenadas. En cuanto a  0 . Como ya se comentó en el apartado anterior. económicamente.

la demanda aumenta en 1 %. podemos interpretar económicamente el coeficiente  1 de la siguiente manera: cuando los precios crecen 1%. la demanda lo hará en  1 %. Efectivamente.  1 es la derivada del logaritmo de la demanda respecto al logaritmo de los precios: 1  d ln Dt  ln Dt Dt Pt    ln Pt d ln Pt Pt Dt Como consecuencia de este resultado. el coeficiente 1 del modelo (c) es la derivada del logaritmo de la demanda con respecto al precio (sin logaritmos): 1  d ln Dt  ln Dt  dPt Pt Luego. Nótese que esto no es otra cosa que la elasticidad precio de la demanda de automóviles: E D. Dt Pt . puede expresarse como: 1  y por lo tanto: dDt Dt  d ln Pt  ln Pt  1   t  Pt  P   t   D  51 . si los precios suben 1 unidad.Dt  En cuanto al coeficiente  1 del modelo (d) . Por lo tanto.iii) La Interpretación económica del coeficiente  1 del modelo (b) no es tan inmediata. podemos expresar 1 como: 1  que es una semielasticidad. P  Dt Pt  1 Pt Dt Por otra parte.

P    P  t  Pt   D  t     Por lo tanto tenemos que: 1) en el modelo (a) : E D. P   1 Dt Si tuviésemos que estimar las elasticidades utilizaríamos los valores estimados para  1 . c) Pruebe la significancia individual del coeficiente. a un 5% de significancia. 52 . a) Plantearemos un modelo logarítmico. P   1 Pt Dt 2) en el modelo (b) : E D. en su caso los valores promedios muestrales de Pt y Dt EJERCICIO Nº 4 El siguiente cuadro incluye el precio y la oferta total de un bien durante un periodo de 10 años Años 1966 Precio 47 Oferta 150 1967 56 140 1968 59 160 1969 65 170 1970 70 150 1971 71 162 1972 76 185 1973 90 165 1974 92 190 1975 105 185 a) Estime una función lineal de oferta que le permita encontrar la elasticidad constante de la función. b) Encuentre la oferta marginal promedio. iv) Sabemos que la elasticidad precio de la función de la demanda se define como:  Dt E D.  1 . la demanda variará en  1 unidades.P   1 3) en el modelo (c): E D. ya que el coeficiente pendiente es la elasticidad constante de la función.P  1 Pt 1 4) en el modelo (d): E D.Luego si los precios aumentan en 1%. 1 y  1 .

2645 ˆ ˆ ˆ ˆ  0  Y   1 X  ln  0  ln Ot   1 ln Pt   ˆ ln  0  5.4085 ˆ 1  YX  NYX   ln O ln P  N ln O ln P    X  NX   ln P   N  ln P    t t t 2 2 2  t 2 ˆ 1  217.2204 731 51.5218 23.4198 4.8836 4.0752 65 5.70836 dP P 73.4255 18.6263 17.7  1  0.9416 59 5.8918 24.7553 20.8501 19.2877 25.2204 90 5.1718   0.3307 22.2521 42.31254.0106 71 5.1059 92 5.2470 105 5.3125 2 0.6449 217.1358 70 5.2917 25.7728 ln Ot  3.1 53 .0106 56 4.5313 4.3125  0.4085  104.2485 21.10554.7574 4.0876 76 5.6540 24.4998 22.2035 16.2645  3.0552 lnP lnOlnP lnO^2 3.3125 ln Pt ^ b) Omg  dO ˆ O 165.2645 0.4466 21.ln Ot  ln  0   1 ln Pt  ut 1  0 ˆ ˆ ln Ot  ln  0   1 ln Pt  ut donde O= oferta y P = precio años 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 O 150 140 160 170 150 162 185 165 190 185 1657 P lnO 47 5.6593 182.8236 16.7564   lnP^2 14.8960 260.1744 21.2521 4.2627 21.4388 26.5498 182.1704 18.0497 18.7728  0.0254 19.7259 27.6080 27.2483 20.2953 27.0707 4.6868 25.0775 20.896  105.9758 26.1055  0.6942 25.3764 4.1065 4.1065 4.

0397  0.3125   3.3125 0.48% de las variaciones en el logaritmo de la oferta.1055 0.57480.005  0.7564  105.0934 El 57.2891 ˆ ee 1  0.5748 0.3125 260.095 54 .ˆ c) r   1 2  YX  NYX  Y  NY 2 2 ˆ  1  ln O ln P  N ln O ln P t t t   t  ln O  t 2     N  ln Ot    2 r 2  0. son explicados por variaciones en el logaritmo del precio.0397 ˆ   2 N K ˆ u 2  0.5498 t ˆ 1 0.095 0.005 10  2 ˆ ee 1    2 ˆ 1  2 ˆ 2  X  NX 2 1  ln P  t 2     N  ln Pt    2 ˆ es 1   0.1718  0. 2  2      1  r  ln Ot   N  ln Ot         2 ˆ  u  1  r  Y 2 2 2  NY 2    ˆ u 2  1  0.1718 2  0.0934  0.

9 257.5 242.7 1181. OFERTA MONETARIA (MMMUS$) 237.  5% 95% 2.7 1370.9 1391.. o simplemente. Para probar esta hipótesis. el coeficiente es significativo.306 H0 H0 :   0 H1 :   0 H1 2.7 265.306)..3 55 .5% H1 -2.7 272.4 282.4 1441.0 1287.0 1156.4 1219.4 252. con lo cual concluimos que el coeficiente  1 es significativamente diferente a cero.2 TRIMESTRE 1972:01 1972:02 1972:03 1972:04 1973:01 1973:02 1973:03 1973:04 1974:01 1974:02 1974:03 1974:04 PNB (MMUS$) 1127.0 1424.3 268.8 1319.2891>2.5% 2.306 La t calculada es mayor que el valor crítico (3.5 279. estime un modelo que permita determinar la elasticidad del ingreso nacional con respecto a la oferta monetaria y compruebe la significancia individual del parámetro pendiente.6 261.3 247.4 1365.7 1352. EJERCICIO Nº 5 Los teóricos cuantitavistas o monetaristas sostienen que el ingreso nacional está fundamentalmente determinado por la cantidad de dinero.7 276. con los datos que se presentan a continuación. por lo tanto rechazamos la hipótesis nula y aceptamos la alternativa de que el coeficiente es diferente a ˆ cero.

4 1441.5672 5.8391 371.6326 5.4 282.2 LNPNB 7.5110 5.5330 5.9833 LNOM 2 LNPNB 2 29.6923 40.0479 50.7 265.0533 7.5809 5.5 279.0273 7.4702 5.1852 7.4902 5.9 1391.2755 51.2615 7.0 1156.1749 52.1127 51.3 268.2883 31.8181 30.2099 7.5669 12  LNPNB  86.0 1424.3 247.1061 7.7267 31.2378 7.4 1365.3290 40.9015 41.0316  7.8033 LNPNB*LNOM 38. LNPNBt   0   1 LNOM t  u t 1  0 ˆ ˆ ˆ LNPNB     LNOM  u t 0 1 t t TRIMESTRE 1972:01 1972:02 1972:03 1972:04 1973:01 1973:02 1973:03 1973:04 1974:01 1974:02 1974:03 1974:04 PNB (MMUS$) 1127.8 1319.9 257.6084 5.0316 LNOM 5.0994 40.7 276.3831 49.0751 39.6140 30.1460 31.4 252.4 1219.5 242.3854 52.1607 7.2232 7.4406 38.3181 40.9821 52.2189 7.1693 N 12 56 .9937 31.1420 30.7 1370.7295 52.8648  ________  _________  LNOM .3712 30.6222 5.6093 31.0 1287.7 1352.7240 38.Respuesta: Para determinar la elasticidad del ingreso nacional con respecto a la oferta monetaria estimamos un modelo logarítmico.6265 51.4538 31.9009 616.5936 5.6 261.4969 52.8650 40.3 OFERTA MONETARIA (MMMUS$) 237.6426 66.7494 50.9250 49.9874 39.7 272.9227 30.8033  5.0404 478.0745 7.2733 86.7 1181.5105 40.5514 5.LNPNB  N  LNOM  LNPNB   XY  NXY      ˆ 1  2 _______ X 2  NX 2     LNOM 2   LNOM     ________   LNOM      ________   LPNB      LNOM N  66.

1693 0.9833  125.0059  0.0506  1.0166  0.0506   1.925  125.0506 0.7609 ˆ LNPNBt  0.7609  1.00059 12  2 ˆ ˆ ee  1   u2   1 0.4245.4245%.0355  X  NX 2 57 .9242 0.LNPNB  N  LNOM  LNPNB      ˆ  XY  NXY   ˆ r 2  1 1 2 2 _________ 2  Y  NY    LNPNB 2  N  LNPNB    0.56697.4245  0.5669  0.9242 2 0.4245 2 0.ˆ 1    478.0355 371.4245 LNOM t     ________   La elasticidad del ingreso nacional con respecto a la oferta de dinero es igual a 1.4245 ˆ u 2  1 r2   Y 2 u 2  NY 2  1  0.0059  ˆ   N K ˆ u 2  0.1693 r 2  1. por cada 1% que aumente la oferta monetaria el ingreso nacional aumentará en 1.12899 2 0.00059   0.0779 616.8648  127.0779  0.5669 _________ ˆ ˆ ˆ  0  Y   1 X   LNPNB    1  LNOM   7.42455. A continuación chequearemos la significancia individual de  1  ________  ________  LNOM .1693  1.

228 H0 H 0 :   0 H 1 :   0 H1 2.12899 ee  1   11.0428>2. Dado el resultado anterior podemos afirmar que la oferta monetaria explica el comportamiento del ingreso nacional.5% H1 -2. por lo tanto rechazamos la hipótesis nula y aceptamos la alterna de que  1  0 .0428 ˆ 0.5% 2.  5% 95% 2. medido a través de una variable proxis como es el PNB. CHEQUEO DE LOS RESULTADOS EN EVIEWS DATOS 58 . con lo que concluimos que  1 es significativamente diferente a cero.4245  0   11.228 t ˆ  1   1 1.228.

Encuentre la elasticidad promedio del rendimiento del maíz.101) (16.125  1. Determine la bondad de ajuste. Respuesta: Yt  27.38) (1.971049 59 .6597 X t (1.SALIDA EVIEWS EJERCICIO Nº 6 La siguiente tabla da el rendimiento de maíz por acre (Y). resultante del uso de varias cantidades de fertilizante en libras por acre (X). a un 5%.704) R 2  0. Pruebe la significancia individual del coeficiente. Año Y X 1971 40 6 1972 44 10 1973 46 12 1974 48 14 1975 52 16 1976 58 18 1977 60 22 1978 68 24 1979 74 26 1980 80 32 a) b) c) d) Estime una función lineal de rendimiento del maíz. producidas en una granja en cada uno de los años 1971 a 1980.979) (0.

indica el valor del estadístico T calculado. EJERCICIO Nº 7 La siguiente tabla da los datos para una muestra aleatoria de 12 parejas sobre el número de hijos que tienen (Y). indica el error estándar del coeficiente. Determine el número de hijos que tendría una pareja que estimaba para el momento de su matrimonio la concepción de 4 hijos. 60 .6772) EJERCCIO Nº 8 El siguiente cuadro incluye el precio y la oferta total de un bien durante un período de 10 años. (Puede redondear el valor). Pruebe la significancia individual del coeficiente. Y X a) b) c) d) 1 4 3 2 3 3 3 0 0 4 4 2 5 4 2 6 3 3 7 0 0 8 4 3 9 3 2 10 1 1 11 3 3 12 1 2 Estime una función lineal. Respuesta: Yi  0.378) ( 4.581) R 2  0. que le permita encontrar la elasticidad constante.567) (0. Años Precio Oferta 1966 47 150 1967 56 140 1968 59 160 1969 65 170 1970 70 150 1971 71 162 1972 76 185 1973 90 165 1974 92 190 1975 105 185 a) Estime una función lineal de oferta. y el número de hijos que habían establecido que querían en el momento del matrimonio. a un 5%.1429 X i (0.249) (0. PAR. Determine la bondad de ajuste.Recuerde: el primer paréntesis debajo de cada coeficiente. y el segundo paréntesis.2143  1.

b) Encuentre la variación margina de la oferta con respecto al precio.7728  0.5749 EJRCICIO Nº 9 La siguiente información se refiere a 10 años sobre los gastos de inversión y la tasa de interés real: Año Inv.208) (-1. b) Determine la eficacia marginal del capital.467) (18.289) R 2  0. e) Pruebe la siginificancia individual del coeficiente. d) Determine la bondad de ajuste.145) R 2  0. 61 . a un 5%. c) Determine la bondad de ajuste.095) (9. para el período 1965 –1974.5 a) Compruebe la hipótesis de que la inversión se relaciona inversamente con la tasa de interés real. d) Pruebe la significancia individual del coeficiente.8835  21.406) (0.5 4 765 5.140963 EJERCICIO Nº 10 Suponga que usted posee la siguiente información acerca del ahorro (S). Respuesta: ln OFERTAt  3. y el ingreso nacional (Y).947) (8. cuando el precio es de 80.3125 ln PRECIOt (0. Respuesta: INVi  873. a un 5%. Tasa 1 656 5 2 804 4 3 836 4.7087TASAi (106.5 5 777 6 6 711 6 7 755 6 8 747 5 9 696 7 10 787 6.297) (3. c) Determine la elasticidad promedio de la inversión.

141) (9. b) Encuentre la elasticidad promedio del ahorro. Respuesta: St  3.756) R 2  0.019) (1.271) (0.Años S Y 1965 20 100 1966 25 110 1967 25 130 1968 30 140 1969 33 160 1970 38 170 1971 35 170 1972 45 200 1973 43 240 1974 50 250 a) Estime mediante mínimos cuadrados ordinarios la función de ahorro.734  0.9224 62 . c) Pruebe la significancia individual del parámetro a un 5%.184Yt (3.

Yt   0   1 X 1t   2 X 2t   3 X 3t   4 X 4t  .CAPITULO IV 1. nos estamos refiriendo a un modelo de regresión con más de una variable explicativa.. MODELO DE REGRESION MULTIPLE (2 VARIABLES EXPLICATIVAS) Cuando hablamos de un modelo de regresión múltiple.   n X nt  u t Para facilidad de la explicación en los puntos siguientes nos referiremos al modelo con dos variables explicativas: Yt   0   1 X 1t   2 X 2t  u t : FRP ˆ ˆ ˆ ˆ Yt   0   1 X 1t   2 X 2t  u t : FRM donde los estimadores mínimos cuadráticos son: ˆ 1   x y x   x y x x  x  x   x x  1 2 2 2 2 1 2 2 2 1 2 2 2 1 1 2 1 2 2 2 1 2 ˆ 2   x y x   x y x x  x  x   x x  1 2 1 2 ˆ ˆ ˆ  0  Y  1 X 1   2 X 2 donde x   X i  X  = desvíos de X. El coeficiente de Determinación R 2  R2  y  Yi  Y  = desvíos de Y ˆ ˆ  1  x1 y   2  x 2 y y 2 Errores estándar: ˆ ee1    2 ˆ  x  x   x x  2 1 2 2 1 2 x 2 2 2 63 ..

47 13.1 6.24 5.81 8.46 10.9 5.92 6.9 5.44 6.60 11. 64 .6 9.5 7.1 7.6 8.13 3.9 5.99 X1 4.51 5.08 8.84 9.09 10.97 9. tasa de desempleo X 1 (%) y tasa de inflación esperada X 2 para los Estados Unidos.30 3.77 6.23 10.01 10.30 6.7 X2 4.1 5.78 3.84 3.ˆ ee 2    2 ˆ  x  x   x x  2 1 2 2 1 2 x 2 1 2 Equivalencias entre valores en desvío y valores observados:  x y   X Y  NX Y 1 1 1 x 2 y   X 2 Y  NX 2 Y   X 1 X 2  NX 1 X 2 2 1 x x 1 2 x x   X 12  NX 12 2 2   X 2  NX 2 2 2 Y EJERCICIO Nº 11 2   Y 2  NY 2 El siguiente cuadro incluye información acerca de la tasa de inflación observada Y(%). Año 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 Y 5.92 4.47 6. en el período 1970-1982.14 5.45 7.7 7.00 a) Estime una función lineal de inflación para los Estados Unidos.6 4.8 7.

95 110.50 7.01 22.25 50.60 94.68 42.99 100.45 7.18 46.77 6.60 4.83 46.75 9.43 77.757   72.50  6.09 606.90 5.43 45.86 64.66 34.80 11.47 13.50 72.13 59.34 83.54 33.41 82.36 16.61 X1  X N 1  86.50 (X2) 4.84 9.654 13 87.69 47.16 57.25 23.86 35.05 18.01 (X1)Y 29.36 66.10 5.17 104.81 120.10 677.60 9.757   6.79 89.90 5. (5% de nivel de significancia) a) Yt   0   1 X 1t   2 X 2t  u t 1  0  2  0 ˆ   X   X u Yt   0 ˆ1 1t ˆ 2 2t ˆ t Año 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 (Y) 5.53 61.38 35.49 10.09 37.6937.56 38.76 131.757 13  x y   X Y  NX Y 1 1 677.80 46.01 38.01 116.654 7.85 14.51 10.03 50.13 3.43 75.541 2 2 2 65 .89 38.41 37.10 7.84 (X1) 4.71 50.70 7.92 33.51 5.79 135.36 80.40 Y^2 35.30 31.45 102.47  136.11 (X2)Y 28.42 24.00 87.46 10.92 6.08 8.09 10.48 30.21 46.81 17.47 (X1)(X2) (X1)^2 (X2)^2 22.29 42.76 77.114  x y   X Y  NX Y  747.10 10.82 58.70 86.80 7.53 31.01 25.57 77.92 747.33 21.60 11.23 10.30 16.56 181.05 36.14 5.11  136.03 86.60 8.81 8.37 18.97 9.24 5.47 6.01  6.69 44.30 6.84  7.29 41.30 3.90 600.10 6.84 3.b) Realice al análisis económico y estadístico del modelo.97 65.693 13 X2  X N 2  Y  Y N 1  100.56 37.92 4.60 57.44 6.64 71.78 3.53 95.00 658.88 893.90 5.21 92.86 24.

40  136.9422 ˆ 2   x y x   x y x x  x  x   x x  2 2 1 1 2 1 2 2 2 1 2 1 2 ˆ 2  72.477 25. la 66 .654   25.026 2 2   X 2  NX 2  658.9422 ˆ ˆ ˆ  0  Y  1 X 1   2 X 2 ˆ  0  7.54125.942 2 x 2 1   X 12  NX 12  600.942  1.693  27.465 X 2T b) b.942   1.11427.654  1.025  6.122.693 76.x x  X X 1 2 1 2  NX 1 X 2  606.1) Análisis económico: Los signos de los coeficientes están acordes con la hipótesis inicial.561.02676.25  137.693  7.3926.644.02676.122.977  1.465 1.049  72.214 ˆ YT  7.757   111.049 2 x y 2 2 2   Y 2  NY 2  893.392 1.501  1. Existe una relación inversa entre la tasa de desempleo y la tasa de inflación observada.757   1.61  136.214  1.392 X 1T  1.026 2 ˆ 1   x y x   x y x x  x  x   x x  1 2 2 2 2 1 2 2 2 1 2 1 2 ˆ 1  6. Por cada punto porcentual en que se incrementa la tasa de desempleo.11476.90  136.049  27.654 6.54127.049  27.477 25.4656.

762  0.2.2) Análisis estadístico: b.2. la tasa de inflación observada se incrementará en 1.114  1.299 1.122.477 ˆ ee 2    2 ˆ  x  x   x x  2 1 2 2 1 2 x 2 1 2 67 . b.026 El 88.1) Coeficiente de determinación R 2  ˆ ˆ  1  x1 y   2  x 2 y R2  y 2 R2   1.3926.089  0. Existe una relación directa entre la tasa de inflación esperada y la tasa de inflación observada.026  13.465 unidades porcentuales. Por cada unidad porcentual en que se incrementa la tasa de inflación esperada.321 13  3 ˆ ee1    2 ˆ  x  x   x x  2 1 2 2 1 2 x 2 2 2 76.026 97.321  0.46572.inflación observada disminuirá en 1.392 unidades porcentuales.) Prueba de significancia individual de los coeficientes pendientes.312 ˆ   2 N K ˆ u 2  13.881 111. ˆ  u  1  R  y 2 2 t  1  0.881111.541  111.049 ˆ ee1   1.212  1.10% de las variaciones en la inflación observada son explicadas por el modelo. b.2.

656  2.299 0.122.172 ee  2 t2    como 8.228 H0 H0 : i  0 H1 : i  0 i  1. entonces t 2 calculado cae en la cola de la izquierda.25.465  0 1.477   5% 95% 2.2 H1 2.299 ee  1   como  4.392  0  1.029  0.228 t1  ˆ  1   1  1. por lo tanto rechazamos la hipótesis nula y aceptamos la alternativa de que el coeficiente beta es significativamente diferente de cero.5% H1 -2.817  2.656 ˆ 0. ˆ  2   2 1.517 ˆ 0.026 ˆ ee 2   1.392    4.172 0. 68 .5% 2.465    8. en la de significancia. por lo tanto rechazamos la hipótesis nula y aceptamos la alternativa de que el coeficiente beta es significativamente diferente de cero.172 1. en la de significancia. entonces t1 calculado cae en la cola de la izquierda.228 .228 .321  0.

271) (0. 4898 X 3i (0. 05 : 1.392 X 1T  1.5 H1 :  3  0. Solución: En primer lugar obtendremos el estadístico t de la tabla para un   0.Resumen de los resultados obtenidos.197) N = 10 Se pide efectuar los siguientes contrastes de hipótesis con un nivel de significación   0.229) (0.5 2.567) (0. 446 X 2i  0.172) (-4.517) R 2  0.214  1.465 X 2T (0. ˆ YT  7. H 0 : 1  0 H1 : 1  0 H 0 : 2  1 H1 :  2  1 H 0 :  3  0. 0636  1. 3. k = 3) grados de libertad 69 . 05 y 7 (N =10.656) (8.881 EJERCICIO Nº 12 Dado el siguiente modelo: ˆ Yi  0.

NOTA: La primera columna corresponde a los grados de libertad.201 2.785 8 0.00 1.025 .144 11 0.860 2.11 ˆ  0. .20 0.796 2. . y la primera fila coresponde a los niveles de significación 0. 5 0.365 2. . H 0 : 1  1 H1 : 1  1 2.812 2.025 (7)  2.143 3.02 0.711 1.718 3.Puntos porcentuales de la distribución t 0. H 0 : 1  0 H1 : 1  0 El estadístico apropiado para efectuar este contraste de hipótesis: t1  ˆ ˆ ˆ 1  1 1  0 1   ˆ ˆ ˆ    1 1 1 el cual se distribuye con N  K (10-3=7) grados de libertad.383 1.372 1.440 1.718 1.571 3. 05 .697 1.943 2.707 5.501 9 0.764 3.833 2.365 4. El estadístico de contrastes es: t2  ˆ ˆ  2  1  2  1  ˆ ˆ   2 2 70 .11  t0. 0636   0.397 1.706 1.499 4.10 0.447 3.895 2.032 5.262 2.893 6 0.365 aceptamos la hipótesis nula ( 1  0) y 1 concluimos que el parámetro no es significativamente diferente a cero al nivel de significación   0.05 0.001 0.106 4.50 . El valor del estadístico es: t1  ˆ 1 0.01 0.297 10 0.169 4.015 2.700 1.567 1 Dado que t  0.896 3.703 1.005 0.727 1. .363 1.228 2.821 3.306 2.415 1.25 0.250 4.10 0.998 3.476 2.355 4.01 0.025 0.05 0.208 7 0.

02 ˆ ˆ   0. 446  1   1. dado que: t  1. En este caso el estadístico adecuado es: t2  ˆ ˆ 3  3 3  0.025 (7)  2. 65  2. como: t  5. 05 H 0 :  3  0. por lo tanto concluimos que el coeficiente es significativamente diferente a 0. t2  ˆ  2  1 1. y concluimos que el parámetro no es significativamente diferente a 1 a un   0.el cual se distribuye como una t de Student con N  K (10-3=7) grados de libertad.197 3 3 Dado que la distribución sigue siendo la misma que en los casos anteriores.5 H1 :  3  0. 271 2 Dado que la distribución es la misma que en l caso anterior.5 3.365 rechazamos la hipótesis nula y aceptamos la alterna de que 3  0.5    5.5 . el valor crítico seguirá siendo el mismo (t0. 02  2. el valor crítico sigue siendo el mismo Por lo tanto.365 aceptamos la hipótesis nula de que  2 =0. 05 71 . 65 ˆ  0.5 a un   0. 4898  0.365) y.5 0.

a través de la prueba F. es necesario realizar la prueba de significancia global. PRUEBA F (SIGNIFICANCIA GLOBAL DE LOS COEFICIENTES) Adicionalmente a la prueba de significancia individual. se calculará un estadístico F: R 2 / K  1 F 1  R 2 / N  K    el cual ser comparará con el estadístico F que nos indique la tabla de la distribución F   5% 95% 5% H0 F H1 H 0 : 1   2  0 H 1 : 1   2  0 72 . Como en el caso de la significancia individual. la hipótesis que se plantea es que los coeficientes son iguale a cero:  1   2  0 La metodología a aplicar es similar a la utilizada en la prueba T.2. la cual nos permite chequear si los coeficientes en su conjunto son significativamente iguales o no a una hipótesis nula determinada.

012 F 73 . con lo cual. o zona de aceptación de la hipótesis nula.Si la F calculada es menor que la F que indica la tabla.10 H1 H 0 : 1   2  0 H 1 : 1   2  0 Para el ejercicio anterior: 0.881 / 13  3 0. esta caerá en la cola de la derecha o zona de rechazo. Si la F calculada e mayor que la F de la tabla.71 1  0. esta caerá en la región central.441   36.881 / 3  1 0. Es importante indicar que la T calculada siempre será un valor positivo. Ejemplo:   5% 95% 5% H0 4. con lo que la conclusión sería que los coeficientes globalmente si son significativamente iguales a cero. la conclusión sería que los coeficientes globalmente no son significativamente iguales a cero. o zona de significancia.

obteniendo los siguientes resultados.05 0.60 2.47 3. para el numerador (K-1) (N-K) Pr 1 2 3 4 .86 3.96 10.57 2.48 5.36 5.10 0. 10 0.55 1.102) T= (-1.60 2.22 1.8705 g de l = 12 74 .54 3.25 0. de l.66 3. . el estadístico F sería: F 1 / 3  1 0.73 3. . más alto es F.05 0. por lo que se concluye que los coeficientes globalmente si son significativamente diferentes a cero. .71  4.10 entonces rechazamos la hipótesis nula y aceptamos la alternativa de que los coeficientes son diferentes a cero.5   1  1 / 13  3 0 Es decir cuando lim F   R 2 1 EJERCICIO Nº 13 Un investigador estimó una función de COBB-DOUGLAS para el sector agrícola de Taiwan durante 1958-192. por ejemplo si en el ejercicio anterior R 2  1 .4899 ln K i (2.268) (4.Puntos porcentuales de la distribución F ( ti ió ) g. indicando un ajuste perfecto.239) (0.25 0. ln Yi  3.3384  1.71 6.59 2.01 1. de l para el denominador g.56 1.21 11 .61 3.99 1.58 2.49 3.98 7. mientras mas alto es R 2 .29 4.4988 ln Li  0.65 1.801) ^ R 2  0. Es importante resaltar que existe una relación directa entre el coeficiente de determinación y el estadístico F calculado.58 2.67 4.00 1. Como 36.10 0.23 4.92 1.01 0 0.363) (6.10 7.59 6.84 9. .449) (0.

donde Y= producción. la producción aumentará en 0. El coeficiente 0. (inelástico). los coeficientes pendientes. son explicadas por el modelo. y nos indica que por cada 1% que aumenta el factor trabajo. un aumento menos que proporcional. y nos indica que por cada 1% que aumenta el factor trabajo. lo cual concuerda con la teoría.4899. Como es un modelo logarítmico.801 g de l = 12 75 . Se requiere que analice desde el punto de vista económico y estadístico los resultados obtenidos NOTA: El modelo de COBB-DOUGLAS es un modelo de producción en forma logarítmica que relaciona la producción de un bien con los factores productivos. un aumento mas que proporcional. existe una relación directa entre el uso de los factores productivos y la producción de un bien.4988%. L= factor productivo trabajo y K= factor productivo capital. los dos signos son positivos. trabajo y capital. representa la elasticidad de la producción con respecto al factor productivo trabajo.8705 nos indica que el 87. Análisis estadístico: El coeficiente de determinación o bondad de ajuste R 2  0.05% de las variaciones en el logaritmo de la producción. (elástico). Significancia individual: t1  6. nos indican las elasticidades del modelo.4988. representa la elasticidad de la producción con respecto al factor productivo capital. El coeficiente 1.4899%. Análisis económico: Primeramente analizaremos los signos de los pendientes. la producción aumentará en 1.268 t 2  4.

81 6.14 4.25 0.00 4. es decir en la zona de significancia o zona de rechazo.81 1.25 0. para el numerador (K-1) 2 3 4 5 6 7 .51 2.45 3.91 4.86 1.28 2. Por lo tanto rechazamos la hipótesis nula y aceptamos la alternativa de que los coeficientes son diferentes a cero.10 0.92 4.83 4.61 3.06 1.179 6.33 1.05 0. En ambos casos la T calculada cae en la cola. de l.53 2.74 1. Significancia global.93 1.07 1.67 9.56 2.268  2.18 5.5% 2. .49 5.39 3.95 1.54 2.2 H1 2.179 H0 H0 : i  0 H1 : i  0 i  1.75 9.35 3.76 3.11 5.55 2. 76 .41 5.52 2.33 3.56 2.64 1.  5% 95% 2.03 4.48 3.55 2.82 1. de l para el denominador (N-K) Pr 1 g.52 2. .50 2.01 0. .55 2.70 13 .46 3.44 3.21 1.56 3.801  2. Finalmente concluimos que ambos coeficientes pendientes si son significativamente diferente a cero. Puntos porcentuales de la distribución F (continuación…) g.10 0.179 y 4.179 .01 1. .89 6.23 2. 12 0.41 1.05 0.43 3.53 2.5% H1 -2.28 2.18 4.26 5.62 1.

435    39. EJERCICIO Nº 14 La compañía petrolífera Campsol 19 desea elaborar un modelo de regresión lineal trimestral para explicar las ventas totales de gasolina en una gasolinera ( Gt ) en una función de la renta total de su área ( Yt ).cit.  5% 95% 5% H0 3.89 H1 H 0 : 1   2  0 H1 : 1   2  0 F  R 2 / K  1 0.011  Como 39. Teodosio. globalmente si son significativamente diferente a cero. p. por lo cual concluimos que los coeficientes.545 2 1  R /  N  K  1  0. rechazamos la hipótesis nula y aceptamos la alternativa de que los coeficientes son diferentes a cero. un índice de precios de gasolina ( Pt ).89 . el número total de vehículos matriculados en su área ( M t ) y un índice de cubicaje de los automóviles de su área ( CU t ).8705 / 15  3 0.545  3.8705 / 3  1 0. Ob. Para ello dispone de los datos trimestrales observados durante el período 1980 – 1985 que se muestran a continuación: 19 Ejercicio tomado de Pérez Amaral.18 77 .

76 1.56 74.16 73.50 808.47 66.01 789.35 3.81 0.10 759.88 2.56 68.88 69.12 64.70 880.01 826.62 71.56 0.49 1.77 74.90 886.87 1.18 64.01 0.55 2.10 737.40 805.74 Yt 738.96 75.03 63.56 2.60 779.70 1.02 2.09 70.86 68.17 72.92 0.68 64.29 1.96 68.76 2.67 0.51 0.70 975.23 70.20 873.46 0.70 732.81 64.82 3.61 1.82 1.46 67.44 a) Utilizando el prograna Eviews estime un modelo de regresión lineal para la venta de gasolinas.73 1. G   0   1Yt   2 Pt   3 M t   4 CU t  u t b) Estime un modelo de regresión lineal para la venta de gasolinas que permita determinar la elasticidad constante del modelo.41 71.65 70.38 62.06 1.41 2.39 73.01 811.54 69.20 798.05 3.81 3.70 1.01 956.70 750.09 64.41 75.37 65.40 737.58 64.71 CU t 1.97 73.49 3.91 4.70 919.70 934.80 65.17 1.70 906.46 71.70 839.70 848.82 74. Gt   o Yt 1 Pt  2 M t 3 CU t 4 e ut RESPUESTA: a) 78 .73 2.66 72.73 1.36 72.76 65.13 74.77 1.67 3.77 0.73 1.75 70.40 Pt 2.79 3.45 67.TRIMESTRE 1980:01 1980:02 1980:03 1980:04 1981:01 1981:02 1981:03 1981:04 1982:01 1982:02 1982:03 1982:04 1983:01 1983:02 1983:03 1983:04 1984:01 1984:02 1984:03 1984:04 1985:01 1985:02 1985:03 1985:04 Gt 61.48 70.84 1.15 64.22 69.69 1.35 3.42 Mt 68.26 3.57 72.90 2.93 1.60 864.26 73.08 71.62 0.12 67.14 63.53 3.02 2.

b) 79 .

76 ln Lt  0.004 I i (0.101) (0. Si  256  0. Y = ingreso disponible.9688 N =15 Donde Q= producción.102) R 2  0.261I t  0.11 3) S= ahorro.367 Lt (0.009) (0. I= tasa de interés. Y = ingreso nacional.EJERCICIO Nº 15 A continuación se presentan algunos modelos ya regresados.044) (0.530Yt  0.125Yi  0.8953 .1386) R 2  0. L= trabajo y K = capital 2) Mdt  0.853 N=12 F=26. 1) ln Qt  0.188 ln K t (0. I = tasa de interés 80 . N= 20 donde Md = Oferta monetaria.001) R 2  0. Para todos se requiere que se analice: a) desde un punto de vista económico y b) estadísticamente. L= tenencia de activos líquidos.7073) (0.112) (0.50  0.003  0.

 Y   N 1  1 X . 1.    . X es una matriz n x k con la primera columna de unos (cuando en el modelo se especifica un intercepto) y las otras columnas con las observaciones de β cada una de las variables explicativas (tantas columnas como X tenga el modelo).... .     1  X 21 X 22 ..  u   n Lo que nos indica que Y es un vector columna n x 1 cuyos elementos son las observaciones de la variable dependiente.SUPUESTOS 1. . .1 Forma funcional lineal de la relación: Y  X β  u Debemos recordar que dentro del contexto de la regresión. ...    .. X K 2   .    . X K 1   X 32 .    ..   . es un vector columna k x 1 cuyos elementos u son los coeficientes o parámetros del modelo y es un vector columna n x 1 cuyos elementos son los términos de perturbación. la linealidad hace referencia a la manera que los parámetros y la perturbación entran a formar parte de la ecuación y no necesariamente a la relación entre las variables. 81 . ... .     N  u1     u2  u ..CAPITULO V MODELO DE REGRESION LINEAL CON k VARIABLES EXPLICATIVAS El modelo de regresión múltiple lineal se puede expresar en forma matricial de la siguiente forma: Y  X β  u donde  Y1     Y2  Y . .    .  . X 2N X 31 ..  X 3 N . .    .. X KN    1     2  β .

. entonces X no puede tener un rango completo.  X    E ui 1     La parte izquierda de la ecuación afirma. 1..2. 21 Denotando con x un vector columna de T variables aleatorias: x  ( X 1 X 2  XT ) Cada una de estas variables aleatorias tiene un valor esperado que se denota: Entonces. que la media de cada término de perturbación condicionada a todas las observaciones X. 2..  E |    0 . es cero. el vector de esperanzas matemáticas de x se expresa como:   E ( X i ). las columnas son linealmente independientes (supuesto de no multicolinealidad). implica que la media no condicionada también sea cero: E u i   E E (u i | X )   E (0)  0 20 El rango columna de una matriz es la dimensión del vector espacio generado por las columnas de la matriz que sean linealmente independientes.3.1. i  1. Que la media condicionada sea cero. Si el número de observaciones es menor que k.. E ui X  0 X  E u1 |    E u | X  2   u X  .    . El valor esperado 21 de la perturbación aleatoria debe ser cero para cualquier observación . T  E ( X 1 )   1      E ( X 2 )   2                E ( X T )   T  82 . Por lo tanto se supone que n es al menos del mismo tamaño que k. y hay al menos k observaciones. Rango Completo X es una matriz n x k con rango k Significa que X tiene rango de columna 20 completo.

2004) 83 ...μ)(x . el elemento (i.. esto e: se obtiene E (x .. i... mas aún. i  1.μ y se escribe la eperanza matemática de este vector multiplicado por su transpueto. si se define el vector x .. se definen como: Var ( X i )  E ( X i  i ) 2  . X j )  E ( X i  i )( X j   j )  . y se denota como V(x) o Σ: V(x) = E (x .μ) = Σ La matriz de varianza y covarianzas (Σ) tiene dos propiedades importantes:  Es simétrica  Es semidefinida positiva... T .Este supuesto conlleva a que: X . u   o 22u a) la COV  Y X X β X β u X β b) E  |   E      E   22 Las varianzas y las covarianzas de las variables aleatorias X 1 .μ)  ( X 1   1 )     ( X 2   2 )  ( X   ) ( X   )  ( X   ) E  ( x   )( x   )  E  T 1 2 2 T 1       ( X T   T )        ( X 1  1 )2  2  E  ( x2  2 )( x1  1 )  ( X 2   2 )      E  ( xT  T )( x1  1 )    E  ( x1  1 )( xT  T )     E  ( x2  2 )( xT  T )         ( X T   T )2          puede observarse cómo en esta expresión los elementos de la diagonal principal incluyen las varianzas de las variables X i . i  j. i ) contendrá la varianza de X i mientras qu el elemento (i.. mientras que el resto de los elementos incluyen las covarianzas. X 2 . X t .μ)(x . T   Cov( X i . En concreto. 2.   entonce. 2. j ) contendrá la covarianza entre X i y X j .. j  1. Σ es definida positiva si y solo si los elementos de x son variable aleatorias no linealmente dependientes (Trívez Bielsa. A esta matriz se le denomina matriz de varianzas y covarianzas del vector x .

..     0 0 . .  . .   .    u u u u .     2  .  .. ...   E   u1 .... 1  . u u  i 2 i i   i 1  2 0   0 2  . n (supuesto de Homocedasticidad)  0 u u para i  j (Supuesto de no correlación serial en las perturbaciones) Estos supuestos implican que: Var  u   E | X  2 I  u1     u2  . u i   E  . . .. .... 0 0 ........ u 2 I lleva implícito dos supuestos: 84 . 0     0 1 .  .   . . u 2 u i  .      ... . u j | X para i  1.  2 . ... . .    . . ..1...  u   i u2  u1u1 u1u 2 .  0 0  El supuesto de que Var    1 0 .. . 0      I . u1u i     u 2 u1 u 2 u 2 . . ..    .. ...... .    .. Varianzas y Covarianzas de las perturbaciones (Perturbaciones esféricas) X Var (u i | )   2 Cov u i ..4..  . .

E u i   0 2. b) La matriz es escalar. Las perturbaciones están normalmente distribuidas. es decir.Xn son fijas o no explicativas 3. 1... en otras palabras. Al afirmar que estas covarianzas son iguales a cero.  2  Resumiendo. siendo 0 un vector nulo.6. multicolinealidad.Rango Completo. los supuestos del modelo clásico son: 1.   u ~ N 0. estamos suponiendo que los términos de perturbación no están correlacionados entre si. no hay de columnas en X y k es menor que el número de observaciones. estamos diciendo que las observaciones xi que conforman la matriz X son fijas en muestras repetidas. con media cero y varianza X I constante.Para la prueba de hipótesis 5. X2.E uu ´    2 I donde I es una matriz identidad n x n E u i u j   0 i  j 2 E u i    2 3. 2. u i | ~ N 0. es decir. es decir u i ~ N 0.  2 I  85 .E (u )  0 donde u y 0 son vectores n x 1.X1. es decir. es no estocástica. La matriz X. la diagonal principal es constante y está conformada por las varianzas de los términos de perturbación de las distintas observaciones. ya sea a lo largo del tiempo o a través de la sección cruzada.No hay relación lineal exacta entre las El rango de X es K..EL vector u tiene una distribución 2 normal multivariada. Supuesto de normalidad...Notación escalar para todo i Notación matricial 1. 1. consiste en un conjunto de números fijos 4. n x k. 5.. ….. es decir.. donde k es el número variables X. los valores de las variables explicativas deben ser las mismas para todas las muestras.a) Los elementos fuera de la diagonal de la matriz son iguales a cero.5. Estos elementos son las covarianzas entre los términos de perturbación correspondientes a observaciones diferentes. si se tuviera la oportunidad de obtener mas de una muestra.. X es una matriz conocida de n x k de constantes Al afirmar que X es una matriz conocida de n x k de constantes. estamos suponiendo que la varianza del término de perturbación es constante.

ˆ ˆ ˆ  u ' u  Y ' Y  2Y ' Xβ  β ' X ' Xβ         Para minimizar una función de varias variables. ui    ..  u n   ui2 . tenemos que: ˆ' ˆ ' ˆ u ´ u  Y  Y Y  Y  Y  Xβ Y  Xβ  ˆ ˆ ˆ ˆ ˆ ˆ  u ' u  Y '  β ' X ' Y  Xβ  Y ' Y  Y ' Xβ  B ' X ' Y  β ' X ' Xβ ˆ El segundo y el tercer término son iguales puesto que Y ' Xβ es de orden 1 x 1 y ˆ β ' X ' Y es su traspuesta 23.  i 1  . la condición de primer orden es que las derivadas parciales sean iguales a cero.. En forma matricial: u ' u ˆ  2X ' Y  2X ' Xβ  0 ˆ β ˆ  X ' Xβ  X ' Y multiplicando por la inversa de X ' X ˆ ˆ Y ' Xβ  β ' X ' Y 23   ' 86 . ESTIMACION DE LOS COEFICIENTES DE MINIMO CUADRADOS ORDINARIOS Y Dado el modelo  X β u  el problema consiste minimizar la suma de los ˆ  ui2 =  Y . en este caso u ' u función de ˆ ˆ ˆ  1 .. k ..  n 2 2   u12  u 2  .    u   n ˆ ˆ ˆ si u i  Yi  Y y Y  Xβ ....  2 .Xiβ i=1 i=1 n n cuadrados de los residuos.2. es decir minimizar   2 = uu u´ u  u1 u 2  u1     u2   .

sin embargo para nosotros la condición es más restrictiva n  k  .X X ' 1 1 ˆ X ' Xβ  X ' X  X 'Y Ya que X ' X  X ' X   I  matriz identidad  1 ˆ  β  X' X   1 X' Y Como se puede observar.Xy = 0 -1 24 25 Se dice que una matriz es no singular cuando es una matriz cuadrada que tiene inversa López Casuso. para hallar X los estimadores mínimo cuadráticos es X ' necesario hallar la inversa de la matriz . 2000. Recordando que las columnas de X son los valores de las variables explicativas. puesto que el rango de una matriz es igual al número de filas o columnas linealmente independientes. su rango sería menor que k. o sea su rango debe ser k. esta matriz cuadrada de orden k debe ser 24 no singular . Al ser k el número de columnas de la matriz X. Para que se cumpla esta condición. para que su rango sea k deben darse dos condiciones: en primer lugar. DEFINICION: el vector de residuales mínimo cuadrados esta definido por: ˆ e = y . Caracas.518.XXβ -1 ˆ Xe = X(y . Si el número de filas es menor que el número de columnas o si existiese alguna combinación lineal entre las columnas de X. se justifica el supuesto de que no exista relación lineal exacta entre ellas 25 . el número de filas de la matriz no puede ser menor que el número de columnas n  k  . el rango de la matriz X debe ser k.Xβ´) = E(y) . Rafael.Xβ) = Xy . 87 .Xβ = 0 PROPOSICION: Xe = 0 ˆ ˆ Xe = X(y . con Tópicos de Econometría”. tenemos que: Xe = Xy . P.XX  XX  Xy    como XX  XX  = I . Universidad Católica Andrés Bello.Xβ PROPOSICION: E (e)  0 ˆ ˆ E(e) = E(y .E(Xβ´) = Xβ . “Cálculo de Probabilidades e Inferencia Estadística.Xβ) = Xy .En segundo lugar las columnas deben ser linealmente independientes (supuesto de no multicolinealidad perfecta).

2 MINIMA VARIANZA Para demostrar que los estimadores mínimos cuadráticos son de mínima varianza. expresándola en términos de la matriz de covarianzas. hay que calcular la varianza de los estimadores.1. ˆ Eβ β 1 ˆ β  X ' X  X ' Y  como Y  Xβ  u 1 ˆ  β  X ' X  X ' Xβ  u  1 1 ˆ  β  X ' X  X ' Xβ  X ' X  X ' u dado que X ' X  X ' X  I 1 1 ˆ  β  β  X ' X  X ' u tomando valor esperado en ambos miembros de la igualdad ˆ E β  E β  X ' X  X ' u 1     1 ˆ  E β  Eβ   E X ' X  X ' u 1 ˆ  E β  β  X ' X  X ' Eu     como Eu   0 nos queda que ˆ Eβ β 3.3. 88  . PROPIEDADES MELI DE LOS ESTRIMADORES MINIMO CUADRATICOS 3. INSESGAMIENTO.

 A continuación se demostrará que cualquier otro estimador insesgado de β tiene una ˆ mayor varianza que β ...4.  ˆ Cov  2 k  ... . 89 . .  ˆ Var  k         ˆ es decir la Var β es un matriz en la cual la diagonal principal está conformada por las Varianzas de los coeficientes estimados y los elementos distintos a la diagonal principal. . . . .  2    ˆ ˆ Cov 1 ... ˆ   Var β  .... que indica que Euu '    2 I 1 1 ˆ Var β  X ' X  X ' 2 IXX ' X   1 ˆ  Var β   2 X´' X     ˆ  Var 1  ˆ ˆ  Cov  2 ..Por definición: 2 ' ˆ ˆ ˆ Var β  E β  β  E β  β β  β   ˆ    1 1 ˆ ˆ como se vio anteriormente β  β  X ' X  X ' u  β  β  X ' X  X ' u 1 1 ˆ  Var β  E X ' X  X ' uu ' XX ' X           Dado que la traspuesta de un producto es el producto de las traspuestas con el orden cambiado y además X ' X  1 es una matriz simétrica. .   Cov  ...  ˆ ˆ k 1        ˆ ˆ Cov 1 .   . 1  .  .  k   ˆ . .  . ˆ ˆ Cov  k . son las covarianzas. 1 1 ˆ Var β  X ' X  X ' Euu ' XX ' X    Utilizando el supuesto 1.  2 ˆ Var  2    .

E β *  β 1 ˆ  E(β * )  E(β  CXβ  X ' X  X ' u  Cu)   ˆ  E(β * )  β  CXβ  X ' X  X ' E(u)  CE(u) 1 ˆ  E(β * )  β  CXβ ˆ  para que E β *  β .  CX  0 1 ˆ  β *  β  X ' X  X ' u  Cu 1 ˆ  β *  β  X ' X  X ' u  Cu   ˆ Calcularemos ahora la matriz de varianzas y covarianzas de β * ' ˆ ˆ Var β *  E β *  β β *  β   ˆ         ˆ  Var β *  E X ' X       1 X ' u  Cu X ' X   1 ' X ' u  Cu     1 1 ˆ  Var β *  E X ' X  X ' u  Cu u ' XX ' X   u ´'C '        C IC  2 1 1 1 1 ˆ  Var β *  E X ' X  X ' uu ' XX ' X   X ' X  X ' uu ' C '  Cuu ' XX ' X   Cuu ' C ' 1 1 1 1 ˆ  Var β *  E X ' X  X ' 2 IXX ' X   X ' X  X ' 2 IC '  C 2 IXX ' X        ' 90 . se debe cumplir que. consideremos otro estimador lineal de β . siendo C una matriz de constantes y Y  Xβ  u 1 ˆ β *  X ' X  X '  C Xβ  u  1 1 ˆ β *  X ' X  X ' Xβ  X ' X  X ' u  CXβ  Cu 1 ˆ  β *  β  CXβ  X ' X  X ' u  Cu     ˆ ˆ Para que β * sea un estimador insesgado de β . digamos β *  X ' X  X '  C Y .1 ˆ En efecto.

528. 91 . Ob. y β  X ' X  X ' Y ˆ  u  Xβ  u  XX ' X  X ' Xβ  u  1 ˆ  u  Xβ  u  XX ' X  X ' Xβ  XX ' X  X ' u 1 1 26 López Casuso. ESTIMADOR DE LA VARIANZA DE LAS PERTURBACIONES (  2 ) Por ser  2 una medida de las desviaciones de los términos de perturbación con respecto a su media cero 26 . puesto que estos pueden considerarse como representativos de los términos de perturbación. Por lo tanto podemos afirmar que en el modelo clásico de       ˆ regresión lineal. parecería lógico que un estimador de  2 se base en los residuos del modelo.ˆ  Var β *  E  2 X ' X       1 X' X X' X   1   2 CX X ' X    1 ´'    CXX X 2 ' 1   2 CC '    dado que X ' X  X ' X   I y CX  0 1 1 ˆ  Var β *   2 X ' X    2 CC'   ˆ ˆ  Var β *  Var β   2 CC ' ˆ La matriz CC' es semidefinida positiva y con eso Var β * es por lo menos igual o mas ˆ grande que Var β . Rafael. Y  Xβ  u . p.Cit. el estimador de mínimos cuadrados β es el estimador lineal de mínima varianza de β 4. Un estimador insesgado de  2 es: ˆ 2  ˆ ˆ u 'u nk en efecto se tiene ˆ ˆ u  Y  Xβ 1 ˆ si.

ˆ  u  Xβ  u  Xβ  XX ' X  X ' u 1 ˆ  u  u  XX ' X  X ' u 1 ˆ  u  I  XX ' X  X ' u  Μu 1   siendo Μ  I  XX ' X  X . tr  traza 28 ˆ ˆ  Eu ' u    2 tr I  XX '' X  X ' 1     1 ˆ ˆ  Eu ' u    2 trI n  trXX '' X  X ' 1  ˆ ˆ  Eu ' u    2 trI n  tr X ' X ' X '' X   ˆ ˆ  Eu ' u    2 trI n  trI k    2 n  k  luego ˆ E ( 2 )  ˆ ˆ E u ' u  2 n  k  2  n  k  nk   27 Una matriz simétrica es una matriz cuadrada A  a ij   nxm 2 en que a ij  a ji para todo i  j . entonces la suma del cuadrado de los residuos es: 1   u ' u  u ' Μ ' Μu  u ' Μu puesto que Μ es una matriz simétrica e idempotente 27 tomando valores esperados: ˆ ˆ Eu ' u   Eu ' Μu  ˆ ˆ Eu ' u    2 trΜ . 92 . 28 Se dice que una matriz cuadrada A es idempotente si A = AA = A La traza de una matriz cuadrada es la suma de los elementos de la diagonal.

Madrid. A medida que el porcentaje es mayor.5. p. Anonio y Julián Pérez García. 2001. “Modelos Econométricos”.182. Una medida tal es: R2  SCR STC  SEC SEC   1 STC STC STC R2  1 ˆ ˆ u 'u Y ' Y  nY 2 6. COEFICIENTE DE DETERMINACIÓN Como se vio anteriormente el coeficiente de determinación nos indica el porcentaje de variaciones de la variable dependiente que son explicados por el modelo. STC = SEC+ SCR  Y I ˆ  YI    uˆ 2 2 I ˆ ˆ  u 'u Para medir la capacidad de explicación de la ecuación de regresión requerimos una medida que indique toda la variación en Yi que la regresión puede explicar. 93 29 . EL CASO PARTICULAR DE REGRESIÓN SIMPLE 29 En el caso del modelo de regresión simple: y i   1   2 xi  u i Pulido San Román. nos indica en que medida el modelo se ajusta a los datos. Sea: STC = suma total de cuadrados =  Yˆ  Y  i 2  Y ´'Y  nY 2  Yˆ SCR = suma de cuadrados debida a la regresión (o explicada) = Y I  2  Y 'Y  Y 2 SEC = suma de los errores al cuadrado = Entonces. Ediciones Pirámide. motivo por el cual a este estadístico también se le conoce con el nombre de BONDAD DE AJUSTE.

. . .   Xn   X X    X   1 1 . . .     xi . coincidirá con su transpuesta y calculando la matriz conjugada y dividiendo por el valor de la determinante: X X 2   n xi2   xi   n  xi  x 2 Obtenemos:  Por su parte X X    1 X X *   1 X X  2  n  xi  x    xi2    xi    xi   n   X Y 1     x1 .   n .   x n     xi y i   . .  y1     . . .  1      yi   . . donde k  2 ya se ha visto ˆ       1    X n      1 .Procederemos como si fuera un caso particular de la regresión múltiple donde como β X X 1 X Y  . . x x i 2 i     Dado que es una matriz simétrica. . .   y   n Resultando β X X ˆ   1 X Y   n  xi  x  1 2   xi2    xi    xi    y i  n   x i y        xi2  y i   xi  xi y i  2  n  xi  x    n  xi y i   x i  y i 2  n  xi  x     ˆ   1  ˆ    2    94 . 1 X1   .

en grados centígrados (X1). está interesado en realizar una política de construcción de viviendas tal que reduzca el consumo de petróleo destinado a la calefacción.Cit. en pulgadas (X2). Se tienen datos referidos a los últimos siete años de las siguientes variables: consumo anual de petróleo en miles de bidones (Y). Ob. 91 95 . temperatura promedio en invierno. pruebas T y F. p. el coeficiente de determinación. José María Labeaga y Francisco Mochón. que tiene que importar todo el petróleo que consume. Guillermina. y cantidades de aislamiento exigidas en las paredes. Consumo Petróleo 216 200 230 240 203 190 200 Temperatura 12 12 10 7 11 11 10 Aislamiento 6 8 6 8 4 3 7 se pide estimar una ecuación lineal de consumo. Y X β u  ˆ 12 12 10 7 11 11 10 6  8 ˆ 6   1    ˆ 8  2   ˆ  4  3    3  7  216  1     200  1  230  1     240   1  203  1     190  1     200  1 30 Ejercicio tomado de: Martin.EJERCICIO Nº 16 Un país 30.

295     6.479    X ' Y     12 12 10 7 11 11 10   240   15.77 -9.23 199.43 -7.X ' 1  1  1 1 1 1 1 1 1  1 X    12 12 10 7 11 11 10  1  6 8 6 8 4 3 7  1   1  1 12 12 10 7 11 11 10 6  8 6   7 73 42     8    73 779 431  4   42 431 274     3  7  X ' X  1  11.978   2.80  0.02 0.02 0.99 0.61  0.06  0.479   259.05     216     200   1 1 1 1 1 1 1   230   1.61  0.06 1.47 216.05   8.18     2   ˆ    0.02  15.295   6 8 6 8 4 3 7   203   8.47 -16.76    3         Y 216 200 230 240 203 190 200 ˆ Y 201.02     0.80  0.53    0.01 202.21  1   ˆ         0.57 207.09 16.80  0.53 0.80 0.53 0.53   1.09 213.70 96 .06   0.978        190     200   X ' X   1 X ' Y ˆ  11.70 ˆ u 14.94 238.

70   216     200   230    Y ' Y  216 200 230 240 203 190 200   240   314.99 0.02 0.43      7.18  117.80  0.53 0.61  222.53   2.63 .09 16.09   16.56      ˆ ˆ ˆ  Var 1  2.56       97 .18 14.465  203     190     200    Yi Y   n    216  200  230  240  203  190  200     211.29 889.80 0.99   889.61  0.03 4.77      9.61  0.61 2  0.02     177.77  9.06   0.47      16.57   222.05    117.36 .70  1.63  177.581. Var  2  14.57 11. Var  3  11.465  7 211.47  16.29   7   u'u ˆ ˆ R  1 Y ' Y 2  nY 2  1 314.36 4.40   0.5492 2  u'u ˆ ˆ nk  889. 14.06    u'u ˆ ˆ  14.40 73 β X Var ˆ   2   ' X  1  11.581.03      0.43  7.06 1.

21 .81 R2 0.79 3.632 .79 .18 X1 + 2.6.76  6. ee  3  3.102 .812 3.5492 1 R 73 nk   Resultados ˆ Yi =259.76 X2 (50.79) (3.40) (5.40       si H0 :   0 H1 :   0 t ˆ  ˆ ee    t1  259.812) R2 = 0.5492 F = 2.632) (0.ˆ ˆ si ee(  )  Var (  ) ˆ ˆ ˆ  ee  1  50.81) (3.21 2.81. ee  2  3.18  5. t 3   0. t 2   1.437 1  0.102) (-1.40 50.5492 3 1 F  k  12   2.437 Comprobación de resultados mediante Eviews 98 .

. y el nivel de empleo. Q.133.. con objeto de utilizar la técnica de mínimos cuadrados. capital invertido.1996 La transformación logarítmica realizada se encuadra en el apartado de modelos doble logarítmicos o modelos log-log.Cit. Qt   1 K t 2 L 3 e ut t t  1986. Ob. 99 .. La función de producción de Coob-Douglas. K. en el sector agrario del país Z ha sido recogida en la tabla siguiente: p y p g p capital invertido y nivel de empleo en el sector agrario del paíz Z durante el período 1986-1996 Produccion Q 80 95 100 120 150 165 180 175 170 190 195 Capital K 200 210 240 150 260 230 245 250 295 300 300 Empleo L 50 55 80 86 90 95 96 98 100 110 115 Año 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 Bajo el supuesto de que la relación entre el nivel de producción. se puede expresar en términos logarítmicos como: LnQt  Ln 1   2 LnK t   3 LnLt  u t t  1986. el coeficiente de determinación. p. pruebas T y F.... la evolución de la producción 31. capital y empleo puede expresarse adecuadamente mediante una función de Cobb-Douglas. Montserrat y María del Mar Llorente Marrón...1996 se pide estimar una ecuación de producción tipo Coob-Douglas. L. Dado que el modelo propuesto no satisface la hipótesis de linealidad se comprobará si es susceptible de linealización.EJERCICIO Nº 17 Durante el período 1986-1996. Suponiendo que el término aleatorio satisface los 31 Ejercicio tomado de: Díaz Fernández.

2527 49.4998   4.4998 4.9120   4.6052 4.5539 4.supuestos básicos establecidos en el modelo de regresión.4381 5.6870 5.7449    X ' X   X ' X  1  71.1930   5.7839  1.5643 4.5850   4.7449  4.4806 5.2983 5.7839       12.0073  4.0106 5.4543 4.2470 5.3820 4.1358 5.7875 5.5539 4.5215 5.5802  3.7660 219.3471 5.3820     4.0869  12.5607 5.3237  1.0106 5.0093 268.5539   4.5352   0.4598 268.5607 5.5850 4.5013 5.6052 4.3820   4.1930 5.0073 4.1059     5.0093   11     60.0106 5.1648     5.7005 4.6052     4.1358   5.3820 4.4543  4.1059 5.2730 LnK 5.7038 3.1186    100 .7660   49.5539   4.2730    60.7875   5.5013 5. Tomando logaritmos neperianos de las observaciones de las variables consideras tendremos: Año 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 LnQ 4.7038 5.7038 5.5215 5.6870 5.5802 2.6052  4.5643  4.2470     5.2983 5.2527 330.9120 4.4381 5.7005   4.3237  0.3471 5.4806 5.7038 LnL 3.0106   Y     5.1648 5.0638    1  1 1  1 1 X   1  1 1  1 1  1  5. la transformación propuesta será susceptible de estimación por el método de mínimos cuadrados.

9823     ˆ    3   LnQ t 4.0895 5.5988 Y  Y n  4.7839  1.3703 4.0490  0.5988  114.2213 ee(  )  Var      0.8795 4.5539 4.2607     2   0.2470 5.7202   243.7875 5.0373 5.1059 5.8280 5.0687 0.5802     0.4130     X ' X   1 X ' Y ˆ   0.5802 2.1108  0.8541   1    ˆ    0.0035 -0.2744 -0.1358 5.0212 ˆˆ u 'u  0.9846  0.0055 0.0868  12.0219 0.5352 Var (    0.1186    0.0219  3.4587      298.7839   0.0106 5.1525 5.0117 0.0109  0.0293       0.9508 0.1108  0.0405 -0.0772 -0.1707  0.2730 ˆ LnQt 4.4766 4.3820 4.0109      ˆ )  0.0161 5.9508 R2  1 0.2505 5.0753 -0.9923    ˆ ˆ 0.3237  1.2942 ˆ u 0.1707 0.1713     101 .X ' Y  54.0640 5.3237  0.1648 5.8875 2 270.1289 0.1930 5.0167 -0.0139 11  3 2   71.1108 Y 'Y  270.0139  12.6052 4.

861.735 0.2607 LnKt + 0.178) (5.2213) (0.2213 0.1713) (-0.9823 LnLt (0.9823  0.t1   0.9923 0.2607 0.8875 3 1 F 1  0.9923) (0. t 3   5.861) (1.178 .560 Comprobación de resultados mediante Eviews 102 .8541 0.1713 0.560 11  3 Resultados generales LnQt = -0.8875  31.8875 F = 31.735) R2 = 0.8541 + 0. t 2   1.

~ Igualando a cero las derivadas con respecto a β y  2 .7. es calculando los estimadores máximo verosimiles 32. Ω  es: 1/2  1   n/2  f u   2π  Ω exp u . Eu   0.Eu  Ω 1 u  Eu       2 Ω  σ 2  . u i | X ~ N 0. Para ello admiimos por el mmomento la hipótesis de nomalidad del término de perturbación. ~ ~ 1 n n L   ln2π  lnσ 2  2 y  X β y  X β 2 2 2σ    ~ El máximo de esta función respecto a β coincide con el mínimo del tercer sumando. Ω 1  n Donde en este caso en particular: 1 I σ2 103 . 33 32 La función de densidad para una normal n-variante tal que u ~ NEu . ~ que es el único que depende de β . se tiene: ~ LnL 1   2X  y  X β  0 β 2σ    El método de estimación de máximo verosimilitud se basa en un determinado supuesto acerca de la muestra de distribución de donde se obtuvo la muestra. σ 2 I   Por lo que la función de densidad conjunta. es decir u  y  Xβ y denominando β al vector de estimadores máximo verosímiles. cuando esta es aleatoria simple. La función de máximo verosimilitud es la función de probabilidad conjunta de la muestra. normal multivariante será 33: f u   (2π2 n/2 σ 2    n/2  1  exp  2 u u   2σ  Y la función logaritmica de verosimilitud para los valores muestrales . pero esta última es precisamente la expresióna minimizar por el criterio de mínimos cuadrados. las distintas observaciones muestrales son independientes entre si y la función de verosimilitud es el producto de los valores de la función de densidad para cada una de las observaciones. es decir aquellos que son más probables dada la distribución de los datos muestrales y su implicación sobre la función de densidad conjunta. ESTIMADOR MAXIMO VEROSIMIL Una forma alternativa de calcular los estimadores beta. expresando ya u ~ ˆ en función d e y.

~ ~ LnL n 1   2  4 y  Xβ y  Xβ  0 2 σ 2σ 2σ    Luego ~ 1 β  X X  X y σ 2 y  X~  y  X~   u u β β  n n Bajo el supuetso de normalidad del término de perturbación. el estimador de máxima verosimilitud del vector β coincide con el estimador MCO 104 .

etc.MATRIZ RECTENGULAR Es una matriz en que el número de filas..   .. 105 .   .... se dice simplemente que es una matriz cuadrada de orden n . Todas las matrices que no son cuadradas... es distinto al número de columnas n  m  . n  . am 2 . la diagonal principal es el conjunto de elementos aij .. variables. a1n   . El número de filas puede ser menor. Las lineas horizontales reciben el nombre de filas u las lineas vericales se llaman columnas. s S   11 s  21 s12   es una matriz cuadrada de orden 2 s 22   3.. .. tales que i  j .DIAGONAL PRINCIPAL En una matriz A  aij  .   .MATRIZ CUADRADA Una matriz cuadrada es una matriz que consta del mismo número de filas y columnas m  n  .. funciones...  a11   a 21  .   a m1 a12 a 22 . . . a mn  Am x m 2..CONCEPTO DE MATRIZ Se llama “matriz” a un conjunto ordenado de números.APENDICE 2 ELEMENTOS BASICOS DE MATRICES 1.. Al referirse al orden de una matriz cuadrada de orden n. 4. a 2 n  . igual o mayor al número de columnas.son matrices rectangulares.. dispuestos en m filas y n colummas.

MATRIZ DIAGONAL Es una matriz cuadrada en que los elementos no diagonales son todos nulos.MATRIZ ESCALAR Es una matriz diagonal en la que todos los elementos diagonales son iguales  0 0 0    0  0 0 K  0 0  0   0 0 0    106 .. 1 3 5   A   2 8 5  8 10 0    5.MATRIZ TRIANGULAR SUPERIOR Diagonal principal Es una matriz en que todos los elementos bajo la diagonal principal son nulos  1 3 5   A   0 8 5  0 0 6   6.. 2 0 0    H  0 0 0   0 0  3   8..MATRIZ TRIANGULAR INFERIOR Es una matriz en que todos los elementos sobre la diagonal principal son nulos  1 0 0   A   2 8 0  8 10 7    7..

su orden es 1.05     6. o simplemente con I . 1  1 2   N   2 3  3 1  3 4    N es una matriz simétrica.9. j. n  .VECTOR COLUMNA Es una matriz formada por una sola columna. n23  n32  3 11.MATRIZ IDENTIDAD (O UNIDAD) Es una matriz en que todos los elementos diagonales son iguales a la unidad. 1 0 0   I3  0 1 0 0 0 1   10... Su orden es m.1  5.87    107 . en que n indica el orden matricial. ya que cumple que n12  n 21  2 .67  Y41    2.. Se simbolizan con I n .33      4.MATRIZ SIMETRICA Es una matriz cuadrada A= aij nxn en que aij  a ji para todo i.VECTOR FILA Es una matriz formada por una fila. T13  0 2 1 12. n13  n31  1 ..

MATRIZ NULA Es una matriz en que todos sus elementos son nulos  0 0     0 0  0 0   O 32 15. cada uno con m componentes. EL RANGO DE UNA MATRIZ Sea una matriz A de orden mxn que tiene n vectores columnas. que se denota por A ' o A T . El mayor número de esos vectores columna de A que forman un conjunto de vectores linealmente independientes se llama rango de A y se denota r(A). y viceversa. En el caso de una matriz cuadrada nxn ..VECTOR NULO Es un vector (fila o columna) cuyos componentes son todos ceros. obtendremos la traspuesta de A. esta posee una traspuesta de la misma dimensión.13. 3 8 9 Dado A   1 0 4    3 1   A  8 0 9 4   ' Propiedades de las traspuestas a) A   A .. X  0 0 0 0  0   Y  0 0   14. 16. la traspuesta de la traspuesta es la matriz original. de forma que su primera fila pasa a ser su primera columna. ' ' 108 . MATRICES TRASPUESTAS Cuando se intercambian las filas por las columnas de una matriz A.

Se denomina producto de  por A. la traspuesta de una suma.b)  A  B '  A'  B ' . es igual a la suma de las c) la traspuesta de un producto es igual al producto de las traspuestas en orden inverso. AB '  B ' A ' . MULTIPLICACION DE UN ESCALAR POR UNA MATRIZ Sean la matriz A = (aij ) de orden mxn . 17. y se denota A + B. SUMA DE MATRICES Sean las matrices A = (aij ) y B = (bij ) ambas de orden mxn . cuyo elemento genérico es aij  bij . A + B = (aij  bij ) Ejemplo: Sean las matrices: 2 3  2 0    3 A  4 1 0  7 8 9  1   0 0 1 2    B   3 1 0  4 0 1 1 1    2  0 3  0  2 1 0  2  2 3 1 2      A  B   4  3 1  1 0  0 3  4    7 2 0  1  7  0 8  1 9  1  1  1  7 9 10 0      Propiedades: a) A + B = B + A b) (A + B) + C = A + (B + C) c) A + 0 = A 18. a la matriz de orden mxn . y el escalara  . y se denota mediante  A. traspuestas. a la matriz de orden mxn : 109 . Se denomina suma de A y B.

MULTIPLICACION DE MATRICES 19. n) ... x 2 .1. .1) El producto XY se obtiene multiplicando cada componente del vector X por la componente correspondiente del vector Y. x3 . y el vector columna  y1     y2   ..   .. x n  de orden (1. y sumando los productos parciales así obtenidos. entonces el producto de  por A:   5 10  2    12 9  3x 4 3 x3   3 4 3   3 x1  1       A  3  0  2 1    3x0 3(2) 3x1    0  6 3    5 10  2   3(5) 3 x10 3(2)    15 30  6        Propiedades: d)  (A + B) =  A +  B e)     A =  A +  A 19.  Y   .    y   n de orden (n. Esto es: 110 .Vector fila por vector columna Sean el vector fila X= x1 ..A  (a1 j ) Ejemplo: 4 3   1   Sea el escalar   3 y la matriz A   0  2 1  .

.1).X. el producto AY se obtiene considerando la matriz A (m.  n    x1 y1  x2 y2  . El orden del producto es (1. xn   . y el vector Y de orden (n. por lo que el requisito se satisface. En este caso. Ejemplo: 4     1 Sean los vectores X  1 2 3 4 y Y    2   1   4     1 XY  1 2 3 4   1(4)  2(1)  3(2)  4(1)  4  2  6  4  12 2   1   19.Matriz por vector columna Dadas la matriz A= (aij ) de orden (m. b) El resultado del producto XY es un número real (un escalar) y no un vector. Sea la matriz A de orden (m. se requiere que los dos vectores sean conformables. n) .2. n) ..Y  x1 x2  y1     y2   . n) y del vector columna Y es . y multiplicando cada uno de ellos por el vector columna Y.  xn yn    xi yi .1) . el orden del vector fila X es (1.1) : 111 .  i 1  .. Esto es.. n) y el vector columna Y de orden (n.    y   n Comentarios: a) Para que el producto XY pueda efectuarse.. ambos deben estar formados por el mismo número de elementos. esto es tantas filas como el vector X y tantas columnas como el vector Y. como integrada por un conjunto de m vectores fila (de n elementos cada uno).

.  y   n El producto AY se obtiene así:  a11   a 21 AY   . . se requiere que ambos factores sean conformables. Esto es que el número de columnas de la matriz A sea igual al número de filas del vector Y.. n) y el vector es (n. Ejemplo: Sean:  1 2 1 0   A   2 0 1 1  3 1 2 0   4     1 Y  2   1   Para efectuar el producto AY. .4): 112 ..       n . a1n   . . supondremos que la matriz A está formada por los siguientes vectores filas de orden (1.   . .1) .  n    a1 j y j   a1n   y1   j 1    n  a2n   y2    a2 j y j   ..... a mn    y1     y2  Y .. . por lo que el requisito se satisface. b) El orden del producto AY es (n.     .   a m1 a12 a 22 ..   . esto es un vector columna con tantas filas como la matriz A y tantas columnas como el vector Y.  a mn   y n    a mj y j     j 1  Comentarios: a) Para que el producto AY pueda efectuarse... a  m1 a12 a 22 .  . ..  .  . a11   a 21 A . En este caso el orden de la matriz es (m.   . . . a 2 n  ......1) .    j 1    . am2 .   .. am2 ...

es un vector fila. se requiere que ambos factores sean conformables. b) El orden del producto de un vector fila por una matriz.3.a1  1 2 1 0 a 2  2 0 1 1 a3  3  1 2 0 Multiplicamos cada vector fila de la matriz A por el vector columna Y. que el número de elementos del vector fila sea igual al número de filas de la matriz. y tantas columnas como la de la matriz.. como sigue: 4     1 a1 Y  1 2 1 0   1(4)  2(1)  1(2)  0(1)  4 2   1   4     1 a 2 Y  2 0 1 1   2(4)  0(1)  1(2)  1(1)  11 2   1   4     1 a3 Y  3  1 2 0    3(4)  ( 1)(1)  2(2)  0(1)  17 2   1   4 1 2 1 0   4      1    AY   2 0 1 1      11    2    3  1 2 0   1  17      19. Esto es.Vector fila por Matriz a) Para que el producto pueda efectuarse. con tantas filas como las del vector fila. 113 . es decir que multiplicamos los componentes correspondientes y sumamos los productos parciales.

t ) . cuando n  s .Sea : Q  1 2 3 4  1 2  2 0 A 3 1  1 1  1  1 2  0   1      2 QA   1 2 3 4  3    1      2   0 1 2 3 4    1   1   1   1 1 2 3 4    2   0   QA  1(1)  2(2)  3(3)  4(1) 1(2)  2(0)  3(1)  4(1) 1(1)  2(1)  3(2)  4(0)  QA  18 3 9  19. la multiplicación no esta definida y no puede efectuarse. n) y B es de orden ( s. t ) .4.. para que los factores sean conformables. se requiere que estas sean conformables. El orden de la matriz producto es (m. En general. el producto AB puede efectuarse únicamente si n  s . es decir tantas filas como la matriz A y tantas columnas como la matriz B. es decir que consten de un número adecuado de filas y columnas.Matriz por Matriz Para que la operación de multiplicación de matrices sea posible. O sea que si A es de orden (m. Sean lasa matrices:  1  2  1   B  0 1 2   1 0  1    1 2 3  A    4 5 6 114 . el primero de ellos debe tener el mismo número de columnas que el número de filas de la segunda matriz. En caso contrario.

entonces M’M = M. 1     1 2 3 0   1   AB   1   4 5 6 0     1       2   1 2 3  1   0      2   4 5 6  1   0      1    1 2 3 2     1   4  4 0         1  10  13 0      4 5 6 2     1    NOTA: LA MULTIPLICACION DE MATRICES NO ES CONMUTATIVA AB  BA 20. es decir M2 = MM = M.. 21..TRAZA DE UNA MATRIZ La traza de una matriz cuadrada n x n es la suma de los elementos de la diagonal tr A    aii i 1 n Algunos resultados fáciles de comprobar son: Tr(cA) = c(tr(A)) Tr(A’) = A Tr(A + B) = tr(A) + tr(B) Tr(In) = n Tr(AB) = tr(BA) 22. y su determinante es numéricamente igual al único elemento de dicha matriz. 115 .DETERMINANTE DE UNA MATRIZ Toda matriz A cuadrada de orden n lleva asociado un valor numérico llamado determinante de A y que denotaremos indistintamente por: det A Las matrices cuadradas más sencillas son 1x1. Si M es una matriz idempotente simétrica.MATRIZ INDEMPOTENTE Una matriz idempotente es aquella que es igual a su cuadrado..

su determinante queda multiplicado por dicha constante elevada a la potencia n-ésima 23. para todo número c  0 existe un número b . b) Si una matriz tiene dos filas o columnas iguales entre si. que verifica la propiedad 116 . Si se multiplica una matriz cuadrada por una constante. del determinante queda multiplicado por esa constante.Dada una matriz 2x2 a A   11 a  21 a12   a 22   det A  a11 a 22  a12 a 21 Dada una matriz 3x3  a11  A   a 21 a  31 a12 a 22 a32 a13   a 23  a33   det A  a11 a 22 a33  a 21 a32 a13  a12 a 23 a31  a13 a 22 a31  a 23 a32 a11  a12 a 21 a33 Propiedades: a) Una matriz cuadrada y su traspuesta tienen el mismo determinante. e) Si se multiplica una línea de una matriz n x n por una constante. su determinante es cero. llamado inverso multiplicativo (o recíproco9.. d) El determinante del producto de dos matrices cuadradas de igual orden es igual al producto de sus respectivos determinantes. c) Una matriz con una línea de ceros tiene determinante igual a cero.MTRICES INVERSAS En el conjunto de los números reales. Una matriz con determinante igual a cero se dice singular.

la relación BA = I.ab  ba  1 Se simboliza ese número b por a 1 o por 1 a Análogamente se plantea la posibilidad de que dada una matriz A cualquiera. o ambas simultáneamente. conformable con A para la operación de producto. i  j  impar son negativos. como es el caso en nuestro ejemplo con C12 y C 21 c) Se calcula la traspuesta de C a la que se suele denominar adjunta de A  a12   a  C '  adj A C '   22  a   21 a11  117 . que satisfaga la relación AB = I. diremos que es una inversa multiplicativa de la matriz A. Si esa matriz B existe. y se le simbolizará por A-1. exista otra matriz B. es decir: AB = BA = I En que I es una matriz identidad de orden apropiado. Calculo de la inversa a través del método de los cofactores Para simplificar la explicación supondremos una matriz: a A   11 a  21 a12   a 22   a) Se calcula la determinante de A  C  b) Se calcula la matriz de cofactores C1 j   11   C 21 a C11   11 a  21 a C12   11 a  21  C12   a 22   C 22    a12   a 21   a11   a12    a22 a22   a C21   11 a  21 a12    a12 a22   a12  a  a   a21 C22   11 12   a11 a   a22   21 a22  Es importante destacar que aquellos cofactores en que.

A  0 .  3   0  1 C    0  1   3  2 0 2 0 3    7 3 7 3 0   21 6  9   4 1 4 1  1     7 31 3   7 3 7 3 0  5  8 12   1 4 1 4 1     2 0 2 0 3   118 . Ejemplo: 3 2 Hallar la inversa de A    1 0   Puesto que A  2  0 . es decir. A debe ser no singular. B 1 existe. El cofactor de cada elemento es en este caso una determinante 1x1.d) Se calcula la inversa. existe la inversa A 1 . Ejemplo  4 1  1   Hallar la inversa de B   0 3 2  3 0 7    Como B  99  0 .  C 11 C  C 21   C 12 C 22   0  1     2 3      0  2 adj A    1 3    A 1  1  1  0  2  0 1 adj A         1 3   1 / 2  3 / 2  2 a    Como se puede observar el orden de la inversa es el mismo que el de la matriz original. como se puede observar para que A A 1 exista. A 1  1 adjA .

La inversa de la matriz inversa es la matriz original (A 1 ) 1  A . Si una matriz cuadrada tiene inversa. 119 . (AB) 1  B 1 A 1 . 21  7 5    adj B   6 31  8    9 3 12     21  7 5   21 / 99  7 / 99 5 / 99     1 1   adj B   6 31  8    6 / 99 31 / 99  8 / 99  B 99       9 3 12    9 / 99 3 / 99 12 / 99  B 1 Propiedades de las matrices inversas a) b) c) d) El producto de dos matrices inversas es conmutativo A 1 A  AA 1  I . esta es única. La inversa de un producto de matrices. es igual al producto de las inversas en orden contrario.

el producto AB puede efectuarse únicamente si n  s . 120 . t ) . cuando n  s . En caso contrario. Dado las siguientes matrices en Excel. O sea que si A es de orden (m. la multiplicación no esta definida y no puede efectuarse. t ) . para que los factores sean conformables. En general. es decir que consten de un número adecuado de filas y columnas. Multiplicación de matrices. n) y B es de orden ( s. se requiere que estas sean conformables. Para que la operación de multiplicación de matrices sea posible. El orden de la matriz producto es (m. el primero de ellos debe tener el mismo número de columnas que el número de filas de la segunda matriz.APENDICE 3 CALCULO DE MATRICES CON EXCEL 1. es decir tantas filas como la matriz A y tantas columnas como la matriz B.

en la cual se buscara la función “MMULT”. la cual está ubicada en la categoría de funciones “Matemáticas y trigonométricas”: Seguidamente se abrirá una segunda ventana de diálogo.Para dar inicio al proceso de multiplicar dos matrices ubicamos el cursor en la celda a partir de la cual queremos que aparezca el resultado de la multiplicación (area de la matriz producto) y luego activamos el comando de “Pegar Función” Con lo que aparecerá una primera ventana de diálogo. donde veremos 2 areas donde se definirán el rango de las dos matrices: Matriz 1 y matriz 2 121 .

volvemos a hacer click en el botón de la derecha del area 122 .Para definir el rango de la matriz 1 hacemos click en el botón que se encuentra a la derecha del area y deslizamos el cursor abarcando toda el area de la matriz en la hoja de cálculo. Para finalizar.

Repetimos el mismo procedimiento. pero ahora. para la matriz 2 123 .

Definidos los rangos de las dos matrices. 124 . procedemos a hacer click en el botón “Aceptar”. con lo cual nos aparecerá el resultado en la celda selecionada.

procedemos a asombrear el area que abarca la misma. Debemos recordar que esta matriz tendrá el mismo número de filas que la matriz 1 y el mismo número de columnas de la matriz 2.Para completar los valores de la matriz producto. Una vez sombredao el area. procedemos a ubicar el cursor en la barra de formulas y hacemos click la misma. En este ejemplo sombreamos un área conformado por 7 filas y 7 columnas. 125 .

los botones de CONTROL. 126 . SHIFT y ENTER con lo cual aparecerá el resto de los valores de la matriz producto. en el teclado.y se oprime en forma simultanea..

2 Inversa de una matiz. El procedimiento para calcular la inversa de una matriz (A-1). Primeramente selecionamos la celda a partir de la cual queremos la salida de la matriz inversa y activamos el botón de “Pegar Función” para que seguidamente selecionemos la función “MINVERSA” 127 . que este procedimiento sólo se puede realizar a matrices cuadradas. es similar al de la multiplicación de matrices. Es importante recordar.

Con lo que aparece la ventana de díalogo donde definimos el area de la matriz a la cual le vamos a calcular la inversa Hacemos click en el botón a la derecha del área de la matriz y con el cursor señalamos los valores de la matriz en la hoja de cálculo 128 .

Definido el área de la matriz. sombreamos un el área equivalente al orden de la matriz inversa. la cual es es mismo de la matriz original. hacemos click en el boton “Aceptar” y obtenemos el valor bucado en la acelda selecionada Para obtener el resto de los valores. 129 .

Otras operaciones Otra función importante que trae el Excel es el cálculo de la determinante de una matriz. los botones de CONTROL. SHIFT y ENTER con lo cual aparecerá el resto de los valores de la matriz inversa. cuyo procedimiento es similar a los casos anteriores. en el teclado.Una vez sombredao el area. 3. 130 . procedemos a ubicar el cursor en la barra de formulas y se oprime en forma simultanea.

131 .

Por lo tanto podemos indicar que un modelo sufre de multicolinealidad cuando hay presencia de una relación lineal entre dos o más variables explicativas del modelo. como por ejemplo: X 1  2 X 2  3 X 3 Es importante resaltar que multicolinealidad solo se refiere al concepto de relación lineal. de forma individual sobre la variable dependiente. nos 132 . Se conoce como multicolinealidad a una situación en la que. donde v es una variable aleatoria o estocástica. DEFINICION Uno de los supuestos del modelo clásico es: cov( X i . la perfecta y la imperfecta. lo más común que suceda en la práctica.CAPITULO VI MULTICOLINEALIDAD 1. por ejemplo: X 1  X 2   . es decir el comportamiento de una de las variables explicativas es explicado en un 100% de los casos por otra variable explicativa. se presenta un hecho que se denomina multicolinealidad. Existe multicolinealidad perfecta cuando existe una relación lineal entre dos a más variables explicativas del modelo. Si se viola este supuesto. es cuadrática) no violan el supuesto de no multicolinealidad. Hay multicolinealidad imperfecta. 2. es explicada en un porcentaje menor al 100% por otra(s) variable(s) explicativa(s). ya que ecuaciones no lineales como por ejemplo: Y   0  1 X   2 X 2  u en las cuales la relación entre las variables explicativas no es lineal (en el ejemplo anterior. es que al recopilar los datos para las variables explicativas del modelo. X j )  0 . como consecuencia de una fuerte interrelación entre las variables explicativas. entre dos o más variables explicativas del modelo no debe existir ninguna relación. cuando una variable explicativa. como por ejemplo: X 1  X 2 . es difícil desligar los efectos que cada variable tiene. NATURALEZA DE LA MULTICOLINEALIDAD A pesar que la definición plantea que la multicolinealidad surge cuando existe una relación lineal entre las variables explicativas. Existen dos clases de multicolinealidades. es decir.

si se pueden estimar los coeficientes.encontremos que los datos asociados a dos o más variables diferentes. Por ejemplo. por lo cual. En el caso de la multicolinealidad imperfecta. es una matriz singular. CONSECUENCIAS DE LA MULTICOLINEALIDAD En el caso de la multicolinealidad perfecta. 133 . dado el siguiente modelo: Yt   0   1 X 1t   2 X 2t  u t y partiendo del supuesto: x1  x 2 tenemos que: ˆ 1   x y x   x y x x  x  x   x x  1 2 2 2 2 1 2 2 2 1 2 1 2  x y  x   x y  x x   x   x   x x  2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 ˆ 1  2 2   x2 y  x2    x2 y x2  2 x x 2 2 2 2  2  x   0  in det erminado 0 Desde el puntos de vista matricial al haber una relación lineal entre dos o más columnas de la matriz X. 3. la consecuencia directa es que no se pueden estimar los coeficientes. estas nos darán cero sobre cero o lo que es lo mismo. tenemos las siguientes consecuencias: 1 A diferencia del caso de multicolinealidad perfecta. Los estimadores mínimos cuadráticos seguirán siendo. por lo tanto. lo cual imposibilita el cálculo ˆ de los coeficientes de la ecuación (   ( X ' X ) 1 X 'Y ). los mejores estimadores linealmente insesgados. la determinante de la matriz X’X es igual a cero. y no se puede calcular su inversa. es decir seguirán siendo MELI. mas no en la población. es decir que sucede en la muestra. Al aplicar las ecuaciones mínimo cuadráticas. indeterminado. Al ser un problema muestral. se dice que la multicolinealidad es netamente un problema muestral. estén relacionados entre sí.

Pequeños cambios en los datos pueden producir grandes variaciones en los estimadores de los coeficientes. COMO DETECTAR LA MULTICOLINEALIDAD 1. Los errores estándar de los coeficientes estimados pueden ser muy grandes.   n  0 a través de la prueba F y algunos coeficientes ( o todos) son individualmente no significativos. 4.2. 5. Es prácticamente imposible separar los efectos o influencias relativas de las diferentes variables explicativas sujetas a un fuerte grado de correlación lineal.. Esto da indicios de un posible problema de multicolinealidad. Una primera aproximación para sospechar que un modelo sufre de multicolinealidad no los da la teoría económica. Por ejemplo dado el siguiente modelo: 134 .. puede esta bien planteado desde el punto de vista teórico (cuando una persona piensa comprar un vehículo siempre toma en consideración sus niveles de ingreso. Los coeficientes pueden tener signo opuesto al esperado o una magnitud poco creíble. mediante la prueba T. Un segundo método es a través de las pruebas de significancia individual y global. por lo que las estimaciones concretas pueden cometer errores muy fuertes al absorber unos parámetros la influencia de las otras con las que están correlacionadas. el modelo conservara su capacidad de estimar valores de la variable dependiente. Pero a nivel econométrico sabemos que el ingreso y el ahorro no pueden esta conjuntamente como variables explicativas dado que la teoría económica nos indica que el ahorro esta en función directa de los niveles de ingreso. Es importante hacer resaltar que pese a la presencia de multicolinealidad en el modelo. si este presenta un coeficiente de determinación elevado. llevando a aceptar hipótesis nulas indebidamente y despreciar ciertas variables como explicativas cuando sí lo son. Si en un modelo estimado se rechaza la hipótesis H 0 :  1   2  . los test de significancia individual y global de los coeficientes del modelo pueden establecer conclusiones contradictorias. Es decir. Por ejemplo el siguiente modelo: C   0   1Y   2 S  u el cual nos indica que el consumo(C) de un bien esta en función lineal de los niveles de ingreso (Y) y de los niveles de ahorro (S). 2. 4. 3. para el pago de las mensualidades y de sus ahorros para la inicial).

(1.5% 2.1442  2. 135 . Este resultado nos indica que el modelo se ajusta bastante bien a los datos recolectados.365) y.7525) (0.365 H0 H0 : i  0 / H1 : i  0 i  1. en ambos casos aceptamos la hipótesis nula de que los coeficientes son iguales a cero. por lo tanto podemos concluir que ambos coeficientes no son significativamente diferentes a cero. Comparando la T calculadas con las T de la gráfica.8229) (0.442) (-0.9415 X 1i  0.35% de las variaciones en el consumo son explicadas por el ingreso y la riqueza.365 En primer lugar tenemos un coeficiente de determinación bastante alto.7747  0.2 H1 2. el 96.6690) (1.0424 X 2i (6. X 1 = ingreso.9635 g de l = 7 Y = consumo.ˆ Yi  24.0807) T= (3.5% H1 -2. X 2 = riqueza Análisis estadístico:   5% 95% 2.5261) R 2  0.

el ingreso X 1 (US$) y la riqueza X 2 (US$.40 2 1  R /  N  K  1  0. Un último método de detección de la multicolinealidad es a través de los coeficientes de correlación de orden cero y parcial entre las variables explicativas. ¿ Cómo se explica que los coeficientes individualmente no sean significativos pero globalmente si lo sean?. EJERCICIO Nº 18 En el siguiente cuadro se tiene una Información hipotética sobre el gasto de consumo Y (US$). 3.40  2.9635 / 10  3 0.365 rechazamos la hipótesis nula y aceptamos la alternativa de que los coeficientes betas son diferentes a cero. por lo tanto concluimos que los coeficientes globalmente son significativamente diferentes de cero. La única explicación posible es la existencia de una correlación lineal entre las variables explicativas. 136 .9635 / 3  1 0.005  dado que 96.74 H1 H 0 : 1   2  0 H1 : 1   2  0 F  0.  5% 95% 5% H0 4.482 R 2 /( K  1)    96.

Y 70 65 90 95 110 115 120 140 155 150 X1 80 100 120 140 160 180 200 220 240 260 X2 810 1009 1273 1425 1633 1876 2052 2201 2435 2686 Se necesita estimar un modelo lineal. y determinar si el mismo presenta multicolinealidad o no b) Yi   0   1 X 1i   2 X 2i  u i 1  0  2  0 ˆ ˆ ˆ ˆ Yi   0   1 X 1i   2 X 2i  u i Y 70 65 90 95 110 115 120 140 155 150 1110 X1 80 100 120 140 160 180 200 220 240 260 1700 X2 810 1009 1273 1425 1633 1876 2052 2201 2435 2686 17400 X1Y X 2Y X1 X 2 64800 100900 152760 199500 261280 337680 410400 484220 584400 698360 3294300 X1 2 2 X2 Y 2 5600 56700 6500 65585 10800 114570 13300 135375 17600 179630 20700 215740 24000 246240 30800 308140 37200 377425 39000 402900 205500 2102305 6400 656100 10000 1018081 14400 1620529 19600 2030625 25600 2666689 32400 3519376 40000 4210704 48400 4844401 57600 5929225 67600 7214596 322000 33710326 4900 4225 8100 9025 12100 13225 14400 19600 24025 22500 132100 X1  X N 2 1  1700  170 10 X2  X N  17400  1740 10 137 .

9415 235068000 330003434326  3363002 ˆ 2   x y x   x y x x  x  x   x x  2 2 1 1 2 1 2 2 2 1 2 1 2 ˆ 2  17090533000  16800336300   9975000  0.0424 235068000 330003434326  3363002 ˆ ˆ ˆ  0  Y  1 X 1   2 X 2 ˆ  0  111  0.Y  Y N 1  1110  111 10  x y   X Y  NX Y 1 1 2 2 2  205500  10170111  16800  x y   X Y  NX Y  2102305  101740111  170905 x x  X X 1 2 1 2  NX 1 X 2  3294300  10170 1740   336300 2 x x 2 2 2 1   X 12  NX 12  322000  10170  33000 2 2 2   X 2  NX 2  33710326  101740  3434326 2 y   Y 2  NY 2  132100  10111  8890 2 ˆ 1  x y x   x y x x   x  x   x x  1 2 2 2 2 1 2 2 2 1 2 1 2 ˆ 1  168003434326  170905336300  221325300  0.9415170   0.04241740  24.7747 138 .

35% de las variaciones en la inflación observada son explicadas por el modelo b.0424170905  8570.3494 10  3 139 .ˆ Yi  24.0424 X 2i b) Análisis.9415 X 1i  0.0424 dólares.941516800   0.4459  46. Este coeficiente tal como está nos indica que por cada dólar adicional de riqueza el consumo disminuirá en 0.4459 ˆ   2 N K ˆ u 2  324.1) Análisis económico: El signo del coeficiente que acompaña a la variable ingreso es el esperado y nos indica que por cada dólar adicional de ingreso el consumo aumentará en 0. El signo del coeficiente que acompaña a la variable riqueza no es el esperado lo cual puede indicar que hay cierto problema en los datos.9635 8890 8890 El 96. b.1) Coeficiente de determinación R 2  ˆ ˆ  1  x1 y   2  x 2 y R2  y 2 R2  0.96358890  324.2.828  0. ˆ  u  1  R  y 2 2 t  1  0.9415 dólares. b.2.) Prueba de significancia individual de los coeficientes pendientes.2) Análisis estadístico: b.2.7747  0.

8229 0.5% H1 -2.9415    1.365 H0 H0 : i  0 / H1 : i  0 i  1.8229 ee1  140 .ˆ ee1    2 ˆ  x  x   x x  2 1 2 2 1 2 x 2 2 2 ˆ ee1   46.365 T1  ˆ 1  1 0.1441 ˆ 0.5% 2.9415  0 0.2 H1 2.3494 3434326  0.8229 235068000 ˆ ee 2    2 ˆ  x  x   x x  2 1 2 2 1 2 x 2 1 2 ˆ ee 2   46.0807 235068000   5% 95% 2.3494 33000  0.

141 . entonces T2 calculado cae en la zona de aceptación. por lo tanto aceptamos la hipótesis nula por lo que se concluye que el coeficiente no es significativamente diferente de cero. Prueba de significancia global 0.6538  4.4818 R 2 / K  1    92.6538 2 1  R /  N  K  1  0.0424    0.74 H1 H 0 : 1   2  0 H1 : 1   2  0 : Como 92. por lo que se concluye que los coeficientes globalmente si son significativamente diferentes a cero. por lo tanto aceptamos la hipótesis nula por lo que se concluye que el coeficiente no es significativamente diferente de cero.9635 / 10  3 0.0052 F     5% 95% 5% H0 4.Como.74 entonces rechazamos la hipótesis nula y aceptamos la alternativa de que los coeficientes son diferentes a cero.0424  0  0.0807 0. entonces T1 calculado cae en la zona de aceptación.9635 / 3  1 0.5254 ˆ 0. ˆ  2   2  0.0807 ee 2  T2  Como.

expresar las variables en diferencias o incrementos. si existe un elevado grado de multicolinealidad entre las variables que forman parte de la regresión. una forma de atenuar (no eliminar) el problema es aumentando el tamaño de la muestra. lo cual se ve reflejado a través de una reducción en el valor del coeficiente de determinación y el posible surgimiento de autocorrelación. se puede sospechar la existencia de multicolinealidad en el modelo. Entre las transformaciones más frecuentes se pueden señalar las siguientes: trabajar con tasas de crecimiento en vez de con valores absolutos. 2. COMO SOLUCIONAR EL PROBLEMA DE MULTICOLINEALIDAD 1. utilizar una transformación logarítmica de las variables. motivo por el cual el nuevo modelo regresado (sin la variable) pierda capacidad predictiva. El problema de multicolinealidad se reduce.9989 330003434326 El coeficiente de correlación nos da un valor bastante alto lo que indica una fuerte relación entre las variables explicativas. 3. expresar las variables en proporciones. de forma esencial. podemos tratar de excluir una de ellas y estimar los parámetros correspondientes al resto. Se debe tener presente la teoría económica a la hora de efectuar transformaciones que tengan sentido y que no 142 . Al aplicar esta metodología hay que tener mucho cuidado ya que al excluir o eliminar una de las variables explicativas se puede correr el riego de que el modelo se vea afectado en mayor medida que con la presencia de multicolinealidad. es la transformación de los datos. rX 1 X 2  cov( X 1 X 2 )  var X 1  var X 2  x x x x 1 2 2 1 2 2  336300  0. y es el de tener unas varianzas muy grandes. Lo que reafirma la sospecha de la existencia de multicolinealidad en el modelo 5. etc. Por lo cual estimaremos el coeficiente de correlación entre las dos variables explicativas para reafirmar o no la sospecha.Dado los resultados obtenidos en donde tenemos que los dos coeficientes individualmente no son significativos y globalmente si lo son. Se puede dar el caso de que la variable eliminada sea importante para explicar el comportamiento de la variable dependiente. Cuando se presenta esta condición se dice que el modelo está mal especificado. Otra metodología que se utiliza. a una falta de información suficiente que permita estimar de forma más o menos exacta los parámetros individuales. Algunos autores afirman que el problema de multicolinealidad es el mismo que se presenta cuando se tienen pocos datos. Por lo tanto. En algunas ocasiones podemos estar interesados en unos parámetros más que en otros y.

Estos resultados nos dan un primer indicio sobre la existencia de multicolinealidad en el modelo. Para profundizar en el análisis de la posibilidad de existencia o no de multicolinealidad. obteniéndose los siguientes resultados. Como se puede observar se tienen por lo menos tres (3) coeficientes individualmente no son significativos.921833) y finalmente la prueba de significancia global nos indica que los coeficientes son globalmente significativos. pero el Coeficiente de Determinación o Bondad de ajuste arroja un resultado bastante alto (0. procedemos a chequear la matriz de correlaciones: 143 .supongan meramente un juego matemático con las ecuaciones del modelo econométrico. EJERCICIO Nº 19 En la pagina 82 se estimó una regresión lineal para las ventas para la compañía petrolífera Campsol.

Indicando una fuerte correlación entre todas las variables explicativas del modelo.En la matriz anterior se puede observar como en todos los casos el coeficiente de correlación simple entre cada par de variables (r) no es menor de 0. En tercer término se puede realizar la regresión de cada regresor frente al resto de las variables explicativas para así determinar si realmente todas las variables son multicolineales o alguna de ellas es irrelevante: 144 .9.

145 .

resumiendo los resultados obtenidos para los coeficientes de determinación: Xt RENTA PRECIOS VEHICULOS INDICE 2 R X 1 / X 2 . el proceso de eliminación debe hacerse por tanteo hasta lograr un modelo que cumpla con los requerimientos. podemos decir que hay indicios de la presencia de multicolinealidad en el modelo.. VEHICULOS e INDICE. una estimación tentativa. aunque hay que hacer la acotación de que como se verá mas adelante puede presentar problemas de autocorrelación.. Por ejemplo. cuyo coeficiente de correlación simple es uno de los mas elevado. La solución al problema conlleva a la eliminación de aquellas variables causantes del problema.993621 0.935342 Cono se puede observar todos los R 2 dan valores cercanos a 1. todas las variables explicativas guardan relación entre ellas. Por todo lo anterior. lo que nos indica una fuerte relación entre las variables explicativas.. sería eliminando las variables. ya que observa que la relación lineal entre ellas es muy fuerte.992940 0.917979 0. 146 . X K 0. Dado que en este caso.

EJERCICIO Nº 20 Se dispone de 20 observaciones 34 relativas al consumo interno (CONS).60 3.78 78.29 18.00 33.21 42.31 40.8 65.12 El objetivo de este ejercicio es el análisis de la presencia de colinealidad en el modelo econométrico señalado.20 22.3 103. Observaciones 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 CONS 55.2 58.06 44.67 2.08 3..2 62. Leceta R.73 20.2 62.219. 147 34 . c) Corrija la multicolinealidad en caso de ser necesario.79 57.3 100.0 63.61 1. Y María del Mar Zamora S.30 6.55 19.39 5.1 51.48 4.95 7.92 74.3 76. “Cien Ejercicios de Econometría”. Madrid.93 5.0 57.18 19.9 67.27 45.16 47.97 73. Galindo F.37 8.37 39.92 17.87 9.68 50.39 4. para el período 1928 –1941 y 1945 –1950 de la economía estaudinense.5 71. Ediciones Pirámide.88 39.54 71.37 4. María E.25 2.15 WA 39. b) Detecte por distintas víaas la presencia de multicolinealidad en el modelo.44 14.6 56.39 13.51 80.1 54. rentas salariales agrarias (WA).2 108.90 6. Julio A Estavillo D.51 46.27 8. 1999. rentas no salariales no agrarias (RNA) y rentas agrarias (RA). Con esta información se va a estimar el modelo de Klein y Goldberger (1955) en el que se explica el consumo en función de las mencionadas rentas.49 18.42 9.83 17.6 51.6 86.49 19.01 75.76 13.15 34.97 RNA 17. Ejercicio tomado de Pena Trapero.12 19.59 36.9 RA 4. J.67 17.57 18. P.51 4.17 20.93 14.76 17.3 95. María J.7 98. Bernardo.44 2. según la siguiente especificación: Cons i   0  1 RAi   2WAi   3 RNAi  ui Se pide: a) Estime el modelo anterior por MCO.20 15.

podemos encontrar que la varianza en el consumo se eleva con el nivel de ingresos. o la estructura de empleo. cedasticidad = dispersión  Homocedasticidad = igual dispersión hetero = diferente. Otro ejemplo sería si queremos cuantificar una relación en la que nos preocupe explicar los gastos en innovación que una empresa realiza. mediante diferentes variables explicativas como el capital. puede darse el caso de que no todos los términos de perturbación tengan la misma varianza. Tal es el caso por el cual familias con mayores ingresos pueden tener mayor flexibilidad respecto al consumo. DEFINICION El supuesto de Homocedasticidad 35 nos indica que: var(U i )  constante   2 AHORRO GASTO Y var(U i )   2 HOMOCEDASTICIDAD INGRESO X Lo cual significa nos indica que todos los términos de perturbación tienen la misma varianza. cedasticidad = dispersión  Heterocedasticidad = diferente dispersión 148 .CAPITULO VII HETEROCEDASTICIDAD 1. Esta condición de varianza inconstante se conoce con el nombre de Heterocedasticidad 36. al estudiar los niveles de gasto de consumo de las familias a diferentes ingresos disponibles. Sin embargo. es muy probable que 35 36 homo = igual. Como por ejemplo.

medianas o grandes o de ingresos bajos. el gasto público. estos miembros pueden ser de diferentes tamaños como por ejemplo empresas pequeñas. industrias. Son ejemplos el PIB. por lo que posiblemente las varianzas sean proporcionales a la población de cada región que se ha utilizado para promediar dichos datos. En las series de tiempo. AHORRO GASTO Y var(U i )   i2 HETEROCEDASTICIDAD INGRESO X Por otra parte. por lo que también es muy probable que los errores generados tras realizar la regresión presenten un problema de Heterocedasticidad. durante el período 1960 – 2000. Además.se produzca una mayor variación en el monto de dichos gastos en empresas de mayor tamaño. ciudades. 149 . El problema de Heterocedasticidad es probablemente más común en la información de corte transversal que en la información de series de tiempo. años. meses. En la información de corte transversal. empresas. etc. etc. si pretendemos ajustar una regresión con datos regionales per cápita en la que estamos interesados en contratar la relación entre los gastos de inversión en estructura y la renta de las regiones. o subdivisiones geográficas tales como estados. medios o altos. tal como los consumidores individuales o sus familias. países. generalmente se trata con miembros de una población en un momento dado del tiempo. las variables tienden a ser datos de magnitud similares por que generalmente se recopila información sobre el mismo fenómeno o hecho durante un período de tiempo (días. por el contrario. es muy posible que los errores presenten Heterocedasticidad por el hecho de que para obtener los valores de la variable dependiente y explicativa hemos dividido los datos agregados por la población de cada región. el empleo en Venezuela.

ya no son MELI. pero no eficientes. hay Heterocedasticidad. La ponderación ocurre debido a que es probable que la suma de residuales cuadrados asociada con términos de error de varianza grande sea considerablemente mayor que la suma de residuales cuadrados asociada con errores de varianza baja. Pero sucede que en la realidad normalmente verificamos la presencia o no de Heterocedasticidad posteriormente a la regresión del modelo. Hay que recordar que según el teorema de Gauss – Markov. es decir homocedástica. P. estamos utilizando una metodología equivocada.2. CONSECUENCIAS DE LA HETEROCEDASTICIDAD Para un modelo con perturbaciones heterocedásticas aceptaremos que cada término del error u i está distribuido en forma normal con varianza. el error estándar de: 37 Ver Gujarati. es decir los estimadores mínimos cuadráticos en presencia de Heterocedasticidad no son los mejores estimadores linealmente insesgados. la estimación de mínimos cuadrados ordinarios da más ponderación a las observaciones con varianzas de perturbaciones grandes que aquella con varianza de errores menores. Cuando está presente la Heterocedasticidad. los estimadores de los coeficientes de mínimos cuadrados ordinarios son insesgados y consistentes. lo que significa que ya se realizó la estimación de los coeficientes.355 150 . como sería el caso del método de los mínimos cuadrados generalizados 37. al momento de estimar los coeficientes debemos utilizar una metodología que contemple este supuesto. Debido a esta ponderación implícita. son validos o no?. los errores estándar de los coeficientes y las pruebas F y T. y esto puede lograrse mejor garantizando un ajuste muy bueno en la porción de los datos de varianza grande. Lo anterior nos indica que cuando utilizamos el método de los mínimos cuadrados ordinarios en presencia de Heterocedasticidad.   u 2 i   i2  N  K  La línea de regresión se ajustará para minimizar la suma total de residuales cuadrados. ¿ qué sucede con estos valores. Ob. donde la varianza varu i   E u i2   i2 no es constante entre observaciones. El método de los mínimos cuadrados supone que las varianzas de los términos de perturbación es constantes. Por lo tanto si estas varianzas ya no son constantes. por ejemplo. cit. Si recordamos la ecuación para estimar.

con el siguiente conjunto de hipótesis H 0 : 1  0 H 1 : 1  0 que sería equivalente a plantear el siguiente conjunto de hipótesis: ˆ H 0 : varu i    2  hom ocedasticidad ˆ H 1 : varu i    i2  heterocedasticidad 151 . 3.~ ee 1    ˆ 1  X  NX 2 2 El problema radica en que la fórmula anterior conducirá a valores sesgados (mayor o menor al valor verdadero) del error estándar. Se realiza la prueba T (significancia individual) para el coeficiente pendiente. A continuación se regresa alguno de los siguientes modelos: ˆ ln u i2   0   1 ln X i   i = Prueba de Park ˆ u1   0   1 X i   i ˆ ui   0  1 X i   i 1  i Xi 1 ˆ ui   0  1  i Xi ˆ ui   0  1 Prueba de Glejser  valor absoluto 3. Recordando que u  Y  Y i i i 2. COMO DETECTAR LA HETEROCEDASTICIDAD Para detectar el problema de Heterocedasticidad realizaremos la siguiente metodología: ˆ ˆ ˆ 1. con N-K grados de libertad. En primer lugar se realiza la regresión normal Yi   0   1 X i  u i con la finalidad de ˆ ˆ estimar los residuales. por lo tanto. si se utiliza este valor. las pruebas estadísticas (T y F) y los intervalos de confianza serán incorrectas.

7 Se quiere estimar la relación existente entre el empleo y el PIB en las comunidades autónomas españolas.371 1.6 1.298 135. Y y otros autores.1 412.2 252.4 162. Se pide verificar la existencia de Heterocedasticidad.025 384. 152 38 .5 90.6 528.265 660.9 446.251.747.511.752.3 29. 38 En primer lugar establecemos el modelo: PIBi   0   1 EMPi  u i 1  0 ˆ ˆ ˆ PIBi   0   1 EMPi  u i regresando mediante el método de los mínimos cuadrados.372 3.8 1.338.3 841.357 963.7 302.088 4. Estavillo D.0 183.305 2.038 2. Bernardo.636.935.830. Ediciones Pirámide S.518 7.222.276. Cien ejercicios de Econometría.221 1.846.895. julio A.949. Para ello se utilizan los datos del valor añadido bruto al costo de factores (precios corrientes.0 317.540 1.591 1. tenemos que el modelo resultante es: Tomado de: Pena Trampero J.876 EMPLEO 1.A.3 351.012.665 1.9 1.9 708.983 9.834.3 2.EJERCICIO Nº 21 OBSERVACIONES Andalucia Aragón Asturias Baleares Canarias Cantabria Castilla y León Castilla-La Mancha Cataluña Comunidad Valenciana Extramadura Galicia Madrid Murcia Navarra País Vasco La Rioja Ceuta y Melilla PIB 6.980. en millones de pesetas) y el número de ocupados (medias anuales en miles de personas) para el año 1991.645 840. Madrid 1999.240.586 1.150. que aparecen en la siguiente tabla: Existe la posibilidad de que haya Heterocedasticidad en la varianza de las perturbaciones dependiendo directamente de la variable empleo o alguna transformación de ésta.

4  4.5353) (20.167. la dispersión aumenta a medida que lo hace el PIB: En segundo lugar.413. para tal fin generamos la siguiente instrucción: GENR RESIDUOS = RESID En primer lugar se realiza la representación gráfica del PIB frente a la variable empleo Este gráfico permite observar que a niveles bajos de PIB existe pequeña volatilidad en la ocupación y.1 EMPi (199. se puede analizar también de forma gráfica la relación existente entre los residuos y la variable explicativa: 153 .ˆ PIBi  118.964613 Para el análisis de la posible heterocedasticidad en el modelo en primer lugar se realizara el análisis gráfico. sin embargo.884) R 2  0. De la regresión original se ha obtenido la serie de residuos que es necesario renombrar.

todo. si el valor muestral del estadístico es suficientemente alto como 39 Artículo tomado de: Carrascal Arranz. Ursicino. Contraste de WHITE 39 El contraste de White es uno de los más utilizados para la detección de Heterocedasticidad dado que no requiere una especificación concreta bajo la alternativa: H 0 :  i2   2 para.H 0 La forma de realizar el contraste se basa en la regresión de errores mínimo cuadráticos al cuadrado. partiendo del siguiente modelo: Yi   0   1 X 1i   2 X 2i  u i La regresión auxiliar para realizar este contrates sería: 2 ˆ u i2   0   1 X 1i   2 X 2i   11 X 12i   22 X 2i   12 X 1i X 2i   i La interpretación del contrates reside en que si las perturbaciones fueran homecedásticas. a través del análisis gráfico se puede sospechar la existencia de heterocedasticidad en el modelo.verifique.i. Ob. sus cuadrados y sus productos cruzados dos a dos (o de segundo orden). frente a un término independiente. Por ello. el R 2 debería ser pequeño. p.230 154 . los regresores. que son el indicativo de la varianza de las perturbaciones.Como se puede observar a valores elevados de la variable EMPLEO le corresponde valores elevados de los residuos.cit. Por ejemplo. 4. las variables incluidas en la regresión no deberían tener ningún poder explicativo sobre los residuos al cuadrado y por lo tanto. Como conclusión de esta parte.se. H 1 : no.

y otra en lo que estos no se incluyen. Una en la que se incluyen en la regresión los productos cruzados dos a dos ( 12 X 1i X 2i ) según la versión original del test de White. seleccionamos VIEWS/RESIDUAL TEST/WHITE HETEROSKEDASTICITY (NO CROSS TERMS) 155 . En la práctica se realiza el contraste para regresiones mínimo cuadráticas sin productos cruzados Ejemplo: En el ejercicio anterior Heterocedasticidad para el modelo: queríamos detectar la presencia de Utilizando el test de White sin productos cruzados.para que la probabilidad de rechazar la hipótesis nula siendo cierta sea menor al 5% rechazaremos la hipótesis nula de Homocedasticidad. El paquete Eviews incorpora dos versiones de este contraste.

9 %. por lo que se rechaza la hipótesis nula de la precensia de Homocedasticidad en el modelo. lo que aclara los resultados obtenidos con la metodología aplicada anteriormente. la cual daba resultados un poco ambiguos. 156 .Y obtenemos: Como se puede observar el valos de R 2 es bajo y es estadístico F es siginificativo a un 4.

si se trata de restablecer la igualdad de varianza en. que en la práctica es bastante difícil de conseguir. lo que se hace es plantear un supuesto sobre el comportamiento de las mismas y seguidamente se transforma el modelo de manera que se cumpla el supuesto de Homocedasticidad. 2.4. Entre los diferentes supuestos que se pueden establecer. par el cual se necesita conocer la varianza de cada una de las perturbaciones. hecho esto. con lo que la especificación a estimar sería  Yi u  0  1  i Xi Xi Xi comprobación: u var i X  i  u   E i  X   i 2  E U i   i2    2  2 2  Xi EX i   2 b) Suponer que la varianza es proporcional al valor de la variable explicativa:  i2   2 X i con lo que el modelo con el mismo propósito que anteriormente resultaría: Yi Xi  0 Xi  1 X i  ui Xi 157 . COMO REMEDIAR EL PROBLEMA DE LA HETEROCEDASTICIDAD 1. bajo esta hipótesis de Heterocedasticidad. El método principal que se utiliza para eliminar la Heterocedasticidad es aplicar el método de los mínimos cuadrados generalizados. se tendría que transformar el modelo dividiendo el modelo original por. en la práctica. A falta de conocimiento del verdadero valor de las varianzas de las perturbaciones. señalaremos los dos principales: a) El primer supuesto que se puede hacer es establecer que la varianza de las perturbaciones es proporcional al cuadrado de la variable explicativa:  i2   2 X i2 donde  2 es la varianza Homocedástica.

6 35.0 129.7 RENTA DISPONIBLE 38.5 53.7 42.8 66.7 51.EJERCICIO Nº 22 En el cuadro que se presenta a continuación 40 se muestran los datos referidos a una encuesta realizada a 16 familias.6 121. Ob. p.2 17.255 158 .4 71. en función de la renta salarial Y.5 40.2 14.1 31.0 127.2 86.7 Considerando el modelo de regresión lineal simple como modelo teórico: S i   0   1Yi  u i 40 Tomado de: Díaz Fernández.5 60. En los mismos se recoge el comportamiento con relación al ahorro realizado.9 134.4 23. Monserrat y María del Mar Llorente Marrón. S.2 77.0 47.4 109.6 102. expresadas ambas variables en miles de pesetas: UNIDAD FAMILIAR 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 AHORRO 12.0 53.5 45.9 27.9 21.Cit.1 94.4 37.7 24.9 115.3 43.

La regresión es estdísticamente significativa de acuerdo con la prueba F (F= 3162. Se trata de una muestra de corte transversal en las que las variables seleccionadas podrían presentar una diferente variabilidad. respectivamente. a partir del comportamiento de la variable xeplicativa seleccionada. Los resultados obteniods nos permite valorar positivamente los resultados. aproximadamente.9516 ) y. Como primera aproximación al análisis del modelo señalaremos la existencia de ciertas sospechas acerca de un posible problema de heterocedasticidad. Con objeto de disipar nuestras dudas.Trataremos de detectar y en su caso corregir. un posible problema de heterocedasticidad. estimaremos en primer lugar el modelo. y trataremos de detectar dicho problema a través de diferentes criterios. 159 . Las variaciones experimentadas por la variable dependiente del modelo se explican en 99%.959) e individualmente los parámetros  0 y 1 son estadísticamente significativos con la prueba t-Student ( t0  5.

existe una tendencia que implica una relación inversa entre los residuales y el ingreso lo cual es indicativo de la precencia de heterocedasticidad en el modelo. realizaremos el gráfico de los residuos y la variable explicativa INGRESO: Para tal fin seleccionamos en Eviews: QUICK/GRAPH/RESID INGRESO/SCATTER DIAGRAM Como se puede observar en el gráfico. b) Prueba de Park ˆ Lnui2   0  1 ln X i   i 160 .Como primera aproximación al estudio de la posible existencia de heterocedasticidad en el modelo.

dado que de acuerdo con la prueba t-Student la pendiente del modelo es estadísticamente significativo a un 5%. la regresión confirma la sospecha de la existencia de heterocedasticidad.De acuerdo con la prueba de Park. c) Prueba de Glejser ˆ ui   0  1Yi   i ˆ u i   0   1 ln Yi   i 161 .

ˆ u i   0   1Yi 2   i ˆ ui   0  1 1  i Yi 162 .

diremos que estamos ante un problema de heterocedasticidad. ˆ u i   0   1Yi 2   i . el coeficiente pendiente de la regresión: En consecuencia.9051 . d) Contraste de White t  4. 163 .En todas las regresiones la pendiente es estadísticamente significativa. de acuerdo con el criterio de Glejser. Dado que este método constituye ademáaas una solución empírica al problema. siendo el mas significativo. retomaremos este resultado al final del ejercicio con el objeto de transformar el modelo original.

dado que u  1  E  i2   Y E Yi 2  i  2    2 E ui2    1 E ui2   2 4 Yi   el nuevo término aleatorio sí es Homocedástico.1% por lo que se rechaza la hipótesis nula de la precensia de homocedasticidad en el modelo y aceptando la alternativa. el modelo cuya pendiente era mas ˆ significativa era: u i   0   1Yi 2   i . lo que nos llleva a concluir que ha precensia de heterocedasticidad en el modelo. 1 1 u Si   0 2  1  I2 2 YI YI YI YI la transformación a realizar. y de los contrastes realizados alguno de ellos cumple la doble función de detección y propuesta de una solución empírica al problema. Según vimos en la prueba de glejser. lo que sugiere que el esquema según el cual se genere la varianza del término aleatorio: E ui2   2Yi 4   siendo. En todas las pruebas realizadas hemos llegado a la misma conclusión: el modelo presenta un problema de heterocedasticidad.Como se puede observar el estadístico F es significativo a 0. Dado que la resolución del mismo requiere la adopción de algún supuesto inicial acerca del esquema de comportamiento de la varianza del término aleatorio. 164 .

podemmos ver que en el modelo resultante no hay evidencia de la precensia de multicolinealidad. 165 .donde: AHORROT  SI YI2 1 YI2 INVINGRESO 2  INVINGRESO  1 YI utilizando el contraste de White.

Para permitir la presencia tanto de heterocedasticidad como de correlación serial. ¿Qué sucede cuando uno de estos supuestos se abandona?. 166 . que contemple en no cumplimientos del supuesto de perturbaciones esféricas. Los estimadores mínimos cuadráticos generalizados (MCG) o estimadores Aitken. se plantea que: Cov (u )  E uu ´   2 Ω (1) . ESTIMACION POR MINIMOS CUADRADOS GENERALIZADOS (MCG) y MINIMOS CUADRADOS PONDERADOS (MCP) Uno de los supuestos del modelo clásico es el de “perturbaciones esféricas”. (MELI).5. Como nos indica el teorema de Gauss-Markov. Por lo tanto se hace necesario buscar una metodología de estimación de los coeficientes. dado el cumplimiento de los supuestos la estimación mínimo cuadrática me garantiza Los Mejores Estimadores Linealmente Insesgados. son los mejores los mejores estimadores linealmente insesgados del modelo de regresión cuando se considera la existencia de heterocedasticidad o correlación serial 41.   41 El tema de correlación serial se desarrolla en el siguiente capítulo.. Como se mencionó anteriormente los estimadores mínimos cuadráticos dejan de ser eficientes. término con el cual se engloba los supuestos de homocedasticidad y la de ausencia de correlación serial (autocorrelación).

de orden n y  2 es un parámetro conocido. su inversa Ω -1 P también lo es y. por lo tanto. hay que tener en cuenta que como Ω es definida positiva. toda la inferencia sobre en dicho modelo se puede llevar a cabo aplicando MCO a la ecuación (2). P Cuando los elementos de Ω en (1) son números conocidos. como el vector de parámetros definido en (2) es el mismo que en el modelo β original. O bien:    Y  Xβ  U (2) Donde    Y  PY. de la siguiente manera: PY   PX β  PU  . X  PX. Cuando Ω es conocida existe un estimador de  con las mismas propiedades que el estimador mínimo cuadrático bajo los supuestos clásicos. se puede calcular a partir de Ω una matriz tal que 1 Ω  P P . la matriz puede 1 calcularse de acuerdo con que Ω  P P y utilizarse para transformar el modelo clásico: Y  Xβ  u . U  PU  Con: EU   0 y 1    Var U  E UU  PE UUP  σ 2 PΩP  σ 2 PPP  P  σ 2 I     Lo que implica que las perturbaciones en el modelo transformado son esféricas. Este caso se reduce a perturbaciones esféricas si Ω es la matriz identidad E uu    2 I pero.donde Ω es un matriz simétrica positiva definida. Para encontrar dicho estimador. de modo más general considera perturbaciones no esféricas. En concreto el estimador MCO de β    en Y  Xβ  U es: 1    1   β Y  XX  XY  XPPX  XPPY  XΩ 1X   1 XΩ 1Y y cuya matriz de varianzas es: Var  Y  σ 2 XΩ 1X β     1 167 . además.

Esta es la matriz inversa que en teoría. debe ser empleada en el estimador MCG para el caso de heterocedasticidad. en la práctica. la matriz cuyos elementos diagonales son los recíprocos de las varianzas correspondientes de los términos de perturbación estocástica.…. la estimación MCG puede interpretarse como 168 . para emplear el estimador MCO es necesario construir una matriz de covarianzas adecuada. la inversa usada en el estimador MCG es:  1  2  σ1  -1 Ω     0    0      . Desde otro punto de vista: 1   σ1  Ω -1  PP donde P      0    0       1  σn   1 σ2 La matriz P es una matriz diagonal cuyos elementos en la diagonal principal son los recíprocos de las desviaciones estándar correspondientes de los términos de perturbación. este estimador puede ser calculado. Así. por lo tanto se puede deducir que tanto la variable dependiente como las variables explicativas son ponderadas en cada observación por el recíproco de la desviación estándar de la variable dependiente (o término de perturbación estocástica) en esa observación.n. Entonces. i=1. En el caso de Heterocedasticidad. la matriz de covarianzas es de la forma: 2  σ1   cov(u)  σ 2 Ω    0  σ 2 2 . en este caso. 0     σ2  n  Donde  2 es la varianza de i-ésimo término de perturbación estocástica..  1  σ2  n  1 σ2 2 Es decir. Si las n varianzas están dadas. la matriz de covarianzas Ω en general es desconocida y no observable.Debido a que.2.

 . el Ministerio de Agricultura. PY    .277 169 . p. Si la desviación estándar en cada observación  i puede suponerse proporcional a una de las variables explicativas. Pesca y alimentación ha decidido establecer una función lineal que explique la producción en función de la superficie cultivada. por ejemplo X 1 . referidas a las variables: Y: Producción de verduras y hortalizas medidas en Qm X: Superficie cultivada medida en hectáreas. Bernardo.    xn σ  n                y Respectivamente. 42 Tomado de: Pena Trampero. entonces la transformación que requiere MCG puede ser ejecutada empleando cocientes de variables adecuadas. J. de lo que se trata es de ponderar a cada una de las variables mediante un valor proxis de la desviación estándar.una estimación MCO para la cual los datos son reemplazados por los datos transformados:  y1   σ1 y  2  σ2  . Como se puede deducir.Cit.  . Ob. Por estos motivos.    yn σ  n                 x1   σ1 x  2  σ2  . PX    . Para ello dispone de la información del año 1993. el estimador MCG aplicado a un modelo con perturbaciones heterocedásticas suele denominarse estimador de mínimo cuadrados ponderados (MCP) EJERCICIO Nº 23 Ante la próxima reunión de la Comisión de la Unión Europea 42 sobre la concesión de subvenciones para la explotación agraria dedicadas a verduras y hortalizas.

747 535 567 890 2.357 6.473 9.903 2.283 30.548 23.430 270 2. 170 .243 3.083 23.208 6.046 X 25.535 8.217 Analice la posible presencia de heterocedasticidad en el modelo.367 2.779 4.341 329 1.393 25.514 7.OBSERVACIONES Pimiento Acelga Ajo Alcahofa Batata Berenjenas Calabaza y calabacín Cardo Coliflor Escarola Guisantes verdes Habas verdes Judías verdes Lechuga Melón Pepino Sandía Y 7. c) El Contraste de White. utilizando: a) Análisis gráfico b) La Prueba de Glejser.556 1.526 33.063 3.528 3.338 702 2.797 50.739 1.050 13.398 12.504 10.

que pueden ser de 2 tipos: forma funcional incorrecta y omisión de variables.U j  0 X Uno de los supuestos del modelo clásico nos indica que: covu i . más concretamente el supuesto indica que no debe existir ninguna relación entre dos o más observaciones diferentes de la variable estocástica. De manera simplificada se puede decir que un modelo presenta problemas de autocorrelación cuando el término de perturbación (la variable aleatoria) está absorbiendo algún elemento que es importante para explicar el comportamiento de la variable dependiente. la teoría de costos nos indica que la curva de costo medio está representada por una función cuadrática. u j   0 que nos indica que la covarianza entre las perturbaciones de un modelo debe ser igual a cero. Si este supuesto no se cumple. DEFINICION Y Y  U X Y Y XU cov  U i . Por lo tanto el término autocorrelación se puede definir como la correlación existente en el término de perturbación ( u ).CAPITULO VIII AUTOCORRELACIÓN 1. C   0  1 X   2 X 2  u 171 . que no está planteado en forma explícita en el modelo. En el primer caso se dice que un modelo está mal especificado cuando no tiene la forma funcional correcta. se dice que el modelo presenta problemas de autocorrelación o correlación serial.U j  0 X cov  U i . Son causas de autocorrelación: a) Problemas en la especificación del modelo. por ejemplo.

un modelo está mal especificado cuando se omite una variable explicativa en el modelo que es importante para explicar las variaciones de la variable dependiente. Por ejemplo. posiblemente el segundo modelo experimente problemas de autocorrelación. si tenemos una función en que la demanda de un bien está explicada por el precio del bien y por el ingreso familiar: C     1 P   2Y  u pero se ajusta un modelo en el cual el consumo está en función únicamente del ingreso: C   0  1Y   si el primer modelo es el correcto. ya que el término de perturbación absorberá a la variable precio.pero se ajusta de la siguiente forma: C   0  1 X   Si la primera ecuación es la correcta. la segunda debe presentar problemas de autocorrelación ya que como se puede observar esta no contempla el efecto cuadrático que debe tener la curva y por lo tanto.   2 X 2  u Y C   0  1 X   X En segundo lugar.   1 P  u 172 . el mismo es absorbido por la variable estocástica  .

el valor de una serie en un punto del tiempo es mayor que su valor anterior. precios. empleo. la mayoría de estas series empieza a moverse hacia arriba. Por consiguiente. en las regresiones que consideran datos de series de tiempo.U 0 tiempo tiempo ˆ U . es probable que las observaciones sucesivas sean interdependientes. cuando se inicia la recuperación económica. 2.U tiempo tiempo Patrones de autocorrelación b) Una característica relevante de todas las series de tiempo de variable económicas. Empezando en el fondo de la recesión.ˆ U . COMO DETECTAR LA AUTOCORRELACION En este punto nos centraremos a tratar de detectar la autocorrelación de primer orden.U ˆ U . es la inercia. En este movimiento hacia arriba. esta está generada de la siguiente forma: u t  u t 1   t 173 .U ˆ U .) presenta un comportamiento cíclico (ciclos económicos). Como se sabe toda variable económica (PIB. etc. un aumento de la tasa de interés o en los impuestos o ambos) para reducirlo. Así hay un “momentum” construido en ellas y éste continuará hasta que algo suceda (por ejemplo. si suponemos que hay presencia de autocorrelación en el modelo. Es decir.

y el mismo indica al grado de correlación existente entre la perturbación de un período y la perturbación del período anterior.Este modelo es conocido como esquema autorregresivo de primer orden. son no estocástica. la prueba es inaplicable a modelos del siguiente tipo: Yt   0   1 X t   3Yt 1  u t donde Yt 1 es el valor de Y rezagado un período. Autorregresivo por que la variable dependiente aparece como variable explicativa. por que el rezago es de solo un periodo. hay perfecta autocorrelación negativa. Tales modelos son conocidos como modelos autorregresivos. X. cerrado  1. Por tanto. no hay autocorrelación. e) No hay observaciones faltantes en los datos. d) El modelo no incluye valor(es) rezagado(s) de la variable dependiente como una de las variables explicativas. y de primer orden. hay perfecta autocorrelación positiva  es el coeficiente de autocorrelación. 174 . es decir. pero rezagada en el tiempo. el cual se basa en los siguientes supuestos: a) El modelo de regresión incluye el término de intercepto. Si  = 0.1 . b) Las variables explicativas. Si  = 1. c) Las perturbaciones u t se generan mediante un esquema autorregresivo de primer orden. son fijas en muestreo repetido. el cual está comprendido en el intervalo ˆ Ut ˆ Ut ˆ U t 1 ˆ U t 1  1   1 Para detectar autocorrelaciones de primer orden utilizaremos el estadístico de Durbin – Watson. Si  = -1.

La prueba del Durbin – Watson es similar en su tratamiento a las pruebas T y F. ya que una observación se pierde al realizar las diferencias consecutivas. Manipulando un poco la ecuación podemos encontrar una ecuación que nos relacione el estadístico Durbin – Watson con el coeficiente de autocorrelación: ˆ  u d 2 t ˆ ˆ ˆ  2u t u t 1  u t21 ˆ u 2 t  ˆ u d 2 t ˆ ˆ ˆ  2 u t u t 1   u t2 ˆ u 2 t donde se utilizó el supuesto de que ˆ u 2 t ˆ   u t21 . el cual posteriormente compararemos con unos valores dados por una tabla a fin de aceptar una hipótesis. Es decir calcularemos un estadístico. se puede considerar que en muestras grandes son aproximadamente iguales. ˆ ˆ ˆ 2 u t2  2 u t u t 1 ˆ u 2 t d   u t u t 1  ˆ ˆ   21   ˆ  u t2    ˆ ˆ u u ˆ u t si definimos que   t 1 2 t 175 . dado que ambos difieren solamente en una observación. y es igual a: ˆ  u t 2 n d t n ˆ  u t 1  2 t 2 ˆ u t 1 obsérvese que el numerador la sumatoria se realiza a partir de la segunda observación. La primera observación no tiene ninguna observación anterior con que realizar la diferencia. El estadístico calculado se define como la razón de la suma de diferencias al cuadrado de residuales sucesivos entre la suma de los cuadrados de los residuales.

WATSON Dependiendo de la ubicación del estadístico calculado en el gráfico. y el caso de que no haya autocorrelación. podremos decidir sobre la existencia o no de autocorrelación en base a la siguiente regla: 176 . como podría ser por ejemplo: d = 1. Para poder decidir sobre la existencia o no de autocorrelación dado un valor del Durbin – Watson. Si   1 Si   0 Si   1 d 4 d 2 d 0 El cuadro nos indica que el estadístico de Durbin .tenemos que d  21    La anterior identidad nos da una aproximación de los valores que puede tomar el estadístico Durbin – Watson. utilizaremos como herramienta complementaria.Watson siempre será un valor positivo y menor o igual que cuatro.34. pero en el mismo solo se presentan las casos extremos de perfecta autocorrelación positiva y negativa. pero generalmente el estadístico tendrá un valor comprendido entre estos valores extremos. el gráfico del Durbin – Watson: ZONA DE INDECISION ZONA DE INDECISION AUTOCORRELACION NO HAY AUTOCORRELACION POSITIVA AUTOCORRELACION NEGATIVA 0 dl du 2 4-du 4-dl 4 LIMITES DEL ESTADISTICO DURBIN .

664 1.848 0.WATSON 0  d  dl dl  d  du du  d  4  du 4  du  d  4  dl 4  dl  d  4 RESULTADO Se acepta la presencia de autocorrelación positiva.391 1.381 1.829 1.710 1.779 1.257 1.859 1. Se acepta la presencia de autocorrelación negativa.535 1. .168 1.104 2.710 0.543 0.437 1. Los valores de los límites dl y du son determinados a través de la tabla del estadístico Durbin – Watson: Por ejemplo para un modelo con 3 variables explicativas y 20 observaciones.752 1. 17 1.991 Con lo cual el gráfico quedaría de la siguiente forma: 177 .078 1.669 0.685 0. Resultado indeterminado.023 1.828 0.660 0.986 1.015 1.940 1.538 1.894 1.100 1.VALOR DEL DURBIN .536 1. .420 1.797 0.239 1.897 0.920 0. No hay autocorrelación.958 1.060 2.967 1.664 0.895 2.147 1. los valores de dl y du son: Estadístico d de Durbin-Watson:puntos de significancia de dl y du al nivel de significancia del 5% K=1 K=2 K=3 K=4 K=5 dl du dl du dl du dl du dl du . 1.964 1.812 0.401 1.696 0.133 18 1.053 1. .536 1.158 19 1.900 0.125 1.863 1.537 1.201 1.180 20 21 22 23 .411 1.785 0.221 1.541 1.820 1.872 0.792 1.046 1. Resultado indeterminado.026 1.998 1. .676 0.933 0.429 1.927 1.074 1.

383 1.768 1.585 1.442 45 1.490 1.721 2 2.789 1. Ob cit.721 1. 1.544 1.328 1.503 1. Tomado de Gujarati.514 1.324 3.50? (d)¿d = 3.696 1. 178 . que puede usted decir sobre autocorrelación si (a) ¿d = 1.998 1.615 1.378 1.378 hay presencia de autocorrelación positiva.658 1.287 1.622 4 LIMITES DEL ESTADISTICO DURBIN .540 1.218 1.767 1.629 1.659 1.471 1.279 2.421 1.786 1.676 2 2.681 1.338 1.597 1.536 1.767 1.600 1.462 1.05<1. .662 1.452 1.641 1. .616 1.566 1.WATSON EJERCICIO Nº 24 Dada una muestra de 50 observaciones y de 4 variables explicativas. 43 Estadístico d de Durbin-Watson:puntos de significancia de dl y du al nivel de significancia del 5% K=1 K=2 K=3 K=4 K=5 dl du dl du dl du dl du dl du .721 1. 39 1.40? (c) ¿d = 2.720 1.336 1.002 4 LIMITES DEL ESTADISTICO DURBIN .382 1.689 1.724 1.335 1.549 1.528 1.374 1.WATSON a) d = 1.652 1.731 1.230 1.05 43 0<1.414 1.776 1.378 1.722 1.430 1.444 1.391 1.628 1.ZONA DE INDECISION ZONA DE INDECISION AUTOCORRELACION NO HAY AUTOCORRELACION POSITIVA AUTOCORRELACION NEGATIVA 0 0.503 1.435 40 1.285 1.674 1.408 1.475 50 55 60 65 .97?.727 1.567 1.666 1.273 1.438 1.601 1. .05? (b) ¿d = 1.771 ZONA DE INDECISION ZONA DE INDECISION AUTOCORRELACION NO HAY AUTOCORRELACION POSITIVA AUTOCORRELACION NEGATIVA 0 1. .480 1.

279<2. AÑO 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 Y 699 730 763 749 766 858 438 1021 1084 1161 1257 1314 1385 1490 1580 1652 1778 X 776 811 791 825 986 1206 1321 1495 1846 2140 2356 2694 3227 4006 4960 5940 6941 Respuesta: Primeramente regresamos el modelo.622.40<1. no se puede decidir sobre la presencia o no de autocorrelación.262<3.40 1.50 2.97<4. no se puede decidir sobre la presencia o no de autocorrelación.50<2. EJERCICIO Nº 25 Sea el modelo: Yt   0   1 X t  u t donde Y denota el número de transacciones comerciales que se realizan en una determinada unidad económica. c) d = 2.378<1.97 2.b) d = 1.721. hay presencia de autocorrelación negativa. para poder obtener los valores de los residuales recordando que un residual es igual a la diferencia existente entre el valor ˆ ˆ de Y observado y el valor de Y estimado: U t  Yt  Yt Yt   0   1 X t  u t 1  0 ˆ ˆ ˆ Yt   0   1 X T  uT 179 . utilizando el estadístico Durbin – Watson. d) d = 3. y X el Producto Nacional Bruto (PNB). se requiere detectar la presencia o no de autocorrelación en el modelo.

529.006.00 986.14   0.00 48.539.925.753.00 7.550.00 5.1882489.47  ˆ ˆ  0  Y  1 X  1.025.00 42.694.835  172.341.292.084.812.736.00 3.968.00 2.00 1.00 617.600.00 972.00 2.196.00 1.00 5.227.00 1.940.45  0.00 625.407.030.177.00 10.00 1.00 776.936.778.036.454.667.681.484.00 542.292.00 603.941.00 4.176.00 7.00 6.00 1.846.725.526.47   633.489.00 24.598.356.257.495.00 755.321.469.00 180 .188 2 58.140.00 825.579.00 2.00 1.667.00 2.00 749.00 1.636.540.47  11.424.916.054  172.00 164.436.721.034.880.00 766.00 9.321.101.533.745.490.000 164.00 763.00 1.314.716.00 578.835.161.00 1.206.00 18.652.961.048.625.600.00 3.188 X T 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 AÑO 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 Y X XY 699.47 1.00 2.257.00 4.00 592.395.098.00 3.283.600.00 680.00 12.00 1.00 X 2 602.00 438.235.395.00 858.00 1.041.00 16.00 1.00 1.00 657.748.051.601.00 35.00 1.960.ˆ 1   XY  NXY  X  NX 2 2  57.489.580.00 2.00 5.00 4.064.800.492.00 1.385.001.054.00 1.940.00 811.276.00 1.021.00 57.00 4.00 2.47  0.481.00 1.00 791.413.45 ˆ YT  633.00 730.101.836.

41 4.36 -160.750 0.38 180. .257.42 36.340.00 749.34 -80. .20 176.035.69 533.967 1.00 1.977 0.34 785.816.07 1.220 16 1.45 -89.535 1. 14 1.750.682.35 3.34 3.80 -443.157 17 1.00 1.490.00 766.385.66 472.371 0.046 1.900 0.045 1.93 14.78 197.AÑO 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 Y 699.50 103.48 1.27 32.381 1.543 0.814 1.76 -20.779 0.778.00 763.867.296 15 1.55 -39.11 15.361 0.82 9.20 -41.314.24  1.561.710 1.933 0.19 6.92 782.160. .50 1.00 1.80 914.872 0.17 -98.652.580.615 2.104 2.11 7.00 858.779 0.55 3.00 438.82 860.31 42.49 980. d ˆ  u t 2 n t n ˆ  u t 1  2 t 2 ˆ u t 1  533.564.24 379.718.39 -6.15 852.935 0.350 0.16 -19.401 1.13 144.084.696.597. .51 106.64 -441.240.18 -2.35 25.22 196.92 174.133 18 1.712.27 10.00 1.39 -13.789.92 -55.00 730.077 1.04 2.161.93 10.714.00 18.18 881.030 0.983.99 21.42 1.54 -29.561.00 1.24 -62.664 1.78 Estadístico d de Durbin-Watson:puntos de significancia de dl y du al nivel de significancia del 5% K=1 K=2 K=3 K=4 K=5 dl du dl du dl du dl du dl du .19 596.88 11.78 Después de haber obtenido los residuales procedemos a calcular el estadístico Durbin – Watson.55 818.87 1.03 415.068.848 0.00 1.74 195.454.23 1.35 -112.58 103.00 1.82 30.956.87 20.96 12.00 ˆ Y ˆ Ut ˆ ˆ U t  U t 1 ˆ ˆ (Ut  Ut 1 )2 ˆ2 Ut 779.897 0.752 2.29 -2.407 379.536 1. 1.16 788.685 1.028.946 1.160. para posteriormente ubicarlo en el gráfico.505 2.180 .391 1.62 1.076.637.564.536 0.905 1.767 1.00 1.303.158 19 1.023 181 .36 0.106 1.710 1.82 1.725.139.685 0.66 302.17 1.632 2.00 1.00 1.386.62 550.539 0.08 1.938.73 55.021.857 1.060 2.74 2.30 367.015 1.988.351.565.12 8.728 0.734 1.982 1.82 -52.126.074 1.00 24.859 1.624.27 50.83 1.551 0.820 0.77 125.696 1.562 2.

015 <1. se obtiene: Yt 1   0   1 X 1  u t 1 restando (3) de (1): (3) Yt  Yt 1   0   0   1 X t   1 X t 1  u t  u t 1 182 .536 2 2. por lo tanto no se puede concluir nada sobre la existencia o no de autocorrelación en el modelo.ZONA DE INDECISION ZONA DE INDECISION AUTOCORRELACION NO HAY AUTOCORRELACION POSITIVA AUTOCORRELACION NEGATIVA 0 1. Transformación: Sí la igualdad presentada en (1) es cierta. el estadístico cae en una zona de indecisión.407<1.015 1.985 4 1. Para solucionar este problema lo que se hace es transformar el modelo de tal manera que el término de perturbación quede libre del problema. por tanto podemos rezagar todo el modelo en un período: Yt 1   0   1 X t 1  u t 1 (2) Multiplicando (2) por  a ambos lados de la igualdad. también es cierta en el período t-1. 3. Lo anterior nos indica que en el modelo hay presencia de autocorrelación de primer orden generado bajo un esquema autorregresivo de primer orden.464 2. COMO SOLUCIONAR EL PROBLEMA DE AUTOCORRELACION Dado el siguiente modelo: Yt   0   1 X t  u t u t  u t 1   t (1) donde  = coeficiente de autocorrelación y  t es un término de perturbación estocástica que cumple con todos los supuestos.536.

para muestras grandes. para muestras pequeñas:  d n 2 1    k 2 2 ˆ    2 2 n k donde n = número total de observaciones. Conocer este coeficiente en la práctica se hace muy difícil. por lo cual normalmente la que se hace es buscar un valor estimado del mismo. c.2) Obtenidos los residuales se precede a estimar  mediante la siguiente igualdad: ˆ ˆ si u t  u t 1   t 183 .1) Primero se estima el modelo original para obtener los residuales. k = Número de coeficientes betas y d = estadístico Durbin-Watson. d  21      1 ˆ d 2 b) Estimación del  de Theil–Nagar basado en el estadístico d. en el cual se hace necesario conocer el verdadero valor del coeficiente de autocorrelación. c. entre las cuales podemos mencionar: a)  basado en el estadístico de Durbin – Watson.Yt  Yt 1   0 (1   )   1 ( X t  X t 1 )  u t  u t 1 Yt  Yt 1   0 (1   )  1 ( X t  X t 1 )   t donde en el último paso se utilizó el supuesto del esquema autorregresivo de primer orden. El modelo resultante se conoce como modelo de diferencias generalizadas. con lo cual el modelo quedaría de la siguiente forma: Yt  Yt 1   0 (1   )  1 ( X t  X t 1 )   t ˆ ˆ ˆ Para estimar el valor de  se pueden utilizar varias metodologías. c) Procedimiento en dos etapas de Cochrane – Orcutt.

8207 31.9479 10.6282 12.6620 X 23.0230 39.6888 9.2759 27.2862 26.2368 29. AÑO 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 Y 8.2380 11.3831 11.5747 28.2506 24.0954 27.0920 184 .4775 12.7070 9.5885 37.5324 8.1000 9.3655 30.8930 9.ˆ  ˆ ˆ u u ˆ u t t 1 2 t En todos los casos mencionados anteriormente se utiliza el valor estimado de  para realizar la regresión del modelo de diferencias generalizadas EJERCICIO Nº 26 En la siguiente tabla tenemos los datos sobre importaciones (Y) y el Producto Interno Bruto (X) para un determinado país.4803 8.3324 11.6920 36.5138 24.2184 38.6901 13.1803 11.2874 40.1241 25.8690 9.2535 13.4099 12.9014 8.9578 14.9207 32.7559 35.3333 33.1368 28.

3924 690.0292 0.0173 0.6823 9.3617 8.4289 ˆ ˆ (U t  U t 1 ) 2 ˆ U t2 0.0081 0.463 2.7514 9.3758 -0.4967 1.0009 0.1707 0.9578 39.0023 0.0024 0.139.5324 23.0920 587.4803 24.2535 38.0572 0.0584 -0.2184 472.4342 0.4140 11.6784 797.1026 ZONA DE INDECISION ZONA DE INDECISION AUTOCORRELACION NO HAY AUTOCORRELACION POSITIVA AUTOCORRELACION NEGATIVA 0 1.0747 -0.8823 11.385.2386 -0.2387 11.0392 0.6920 442.4208 734.0020 0.9322 12.0475 -0.3930 1.2759 239.0954 262.962 1.8642 8.0602  0.1014 -0.746.5189 12.1607 760.0830 0.5705 8.6289 8.7597 14.0009 0.6282 33.4581 1. Para eliminar el problema de autocorrelación.8963 10.0304 0.3631 14.952.5795 8.0901 581.0489 0.0444 -0.1286 0.8622 11.9207 356.3643 10.8983 588.5885 456.3333 366.1839 1.5874 9.0109 -0.0000 ˆ ˆ Ut  Ut 1 0.5293 12.0735 0.0020 0.3799 11.0753 -0.3147  0.1026 0.1803 31.0029 0.0446 0.1316 0.3066 13.8667 12.9305 1.9682 9.0142 0.1103 9.9160 1.3615 -0.607.2380 30.1458 -0.1274 0.2862 224.6620 40.6689 9.8692 9.6901 37.9014 24.7191 1.9741 639.3587 -0.045.0365 0.1191 -0.0212 0.3831 29.3779 0.4775 36.1169 -0.8299 ˆ Y 8.9780 10.962 <1.3646 791.8930 25.0301 0.3270 13.3655 304.1428 0.1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 AÑO 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 Y X XY 8.0827 0.018.3569 -0.0137 0.5138 200.3338 949.9385 13.5317 12.5747 267.543.9149 1.5915 6.4449 1.3157 862.3324 32.2715 0.3645 19.0054 0.537 2 2.2069 0.1412 0.9438 9.0000 0.1194 -0.7478 1.6888 27.100 con lo cual se concluye que hay evidencia de autocorrelación positiva en el modelo.0902 -0.8690 28.7559 392.1368 277.0001 0.3069 9.8361 13.7070 27.445.0150 -0.6269 0.0103 0.100 1.1307 0.0230 503.0056 0.0057 0.1000 26.338.0351 ˆ Ut 0.1910 0.0188 0.4099 35.3422 X t El estadístico Durbin-Watson es igual a: d 1.273.2392 -0.2506 215.3083 -0.0602 La regresión mínimo cuadrática dio como resultado: ˆ Yt  0.0428 0.0517 13.5212 9.1241 204.8270 218.1885 0.0737 0.2880 0.900 4 0 <0.9051 11.0143 0.0002 0.3638 11.8041 X2 552.3324 619.2368 280.0004 0.8207 346.0034 0.2876 -0.0569 0. estimaremos el modelo de diferencias generalizadas: ˆ Yt  Yt 1   0 (1   )  1 ( X t  X t 1 )   t ˆ ˆ ˆ 185 .0951 0.2874 548.2086 1.1980 0.6138 8.9479 28.

2876 -0.1286 0.0146 0.1014 -0. Teniendo el valor estimado de  .0081 0.3930 1.0475 -0.0034 0.0071 -0.0004 0. se procede a estimar el modelo de diferencias generalizadas.0057 0.2386 -0.0028 0.0392 0.337Yt 1   0 (1  0.0056 0.337)  1 ( X t  0.0023 0.0220 0.0260 0.6269 0.1307 0.0753 -0. la cual se realizará a través de la identidad: ˆ ˆ u u ˆ u t ˆ  t 1 2 t  ˆ 0.3758 -0.0009 0.para lo cual tendremos que estimar el valor del coeficiente de autocorrelación.3587 -0.3614 Es importante hacer notar como al estimar el valor de  se pierde una observación.1297 0.0301 0.0143 0.3615 -0.337 X t 1 )   t el cual regresado es igual a: 186 .0188 0.0210 -0.0735 ˆ Ut ˆ ˆ U tUt 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 AÑO 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 ˆ U t2 0.0902 -0.0033 0.0068 0.0113 0.0428 0.0045 0.0584 -0.337 1.0827 0.2069 0.0428 0.0020 0.0156 -0. Yt  0.0491 -0.1412 0.0569 0.0103 0.1980 0.1194 -0.0747 -0.1241 0.0266 -0.0735 0.0054 0.0006 0.0735 0.3614  0.0444 -0.0285 0.0022 -0.

4436 9.8207 7.7864 X*Y* 98.6620 40.5267 522.5138 8.2184 8.9578 39.1031 17.4736 14.8497 11.5646 21.7361 211.2535 38.2093 619.337 X t 1 8.5915 141.7070 27.3324 619.3655 7.0920 9.8120 124.2380 30.5579 591.1649 355.4805 15.9245 11.9207 7.7182 465.353( X t  0.2368 6.2506 6.1803 31.8092 22.4419 18.2953 24.2031 163.9479 28.2404 9.1368 6.9582 26.6920 8.4912 24.3831 29.337Yt 1  0.Yt  0.1941 139.6901 37.1002 351.8521 218.0438 X *2 266.337 X t 1 ) modelo este que no presenta problemas de autocorrelación.0230 8.4803 24.8522 721.2504 700.3324 32.5567 161.4234 103.8930 25.7389 20.9517 8.3829 87.2874 9.0260 16.1000 26.0116 437.4913 26.3564 120.6220 18.4852 24.2793 603.7360 251.8351 463.1631 400.8595 12.7547 10.7559 7.4099 35.4156 649.6888 27.2190 332.3285 124.5136 206.5324 23.3264 8. 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 AÑO 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 Y X Yt  0.1811 228.337Yt 1 X t  0.9769 25.0358 8678.2862 6.8690 28.5761 11.6282 33.3162 12.7382 394.3989 3057.7135 340.5341 11.2151 178.0954 6.3333 7.6221 18.7544 9.2759 6.4775 36.0307 19.4804 13.3931 21.5603 12.1564 9.0164  0.9014 24.0351 17.2694 267.9332 159.8881 13.3412 315.8441 9.1241 5.5977 18.9778 187 .5885 8.5747 6.4732 203.7895 118.5405 108.4567 294.5521 254.

Ob.EJERCICIO Nº 27 En el cuadro que se presenta a continuación 44 se muestran los datos referidos al número de transacciones comerciales que se realizan en una determinada unidad económica (Y). es necesario estimar el modelo original 44 Tomado de: Díaz Fernández. un posible problema de Autocorrelación.Cit. p. Para realizar el análisis de la posible existencia de autocorrelación en los residuos. y el Producto Nacional Bruto (PNB) para el período 1960 -1976: Nº DE TRANSACCIONES 699 730 763 749 766 858 438 1021 1084 1161 1257 1314 1385 1490 1580 1652 1778 AÑO 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 PNB 776 811 791 825 986 1206 1321 1495 1846 2140 2356 2694 3227 4006 4960 5940 6941 Considerando el modelo de regresión lineal simple como modelo teórico: Yt   0  1 PNBt  ut Trataremos de detectar y en su caso corregir.218 188 . Monserrat y María del Mar Llorente Marrón.

A partir de esta estimación.1) Diagrama de disperción entre u t y u t 1 Instrucciones: QUICK/GRAPH/ SCATTER DIAGRAM/ RESIDUOS RESIDUOS(-1) 189 . se genera la serie de mínimo cuadráticos correspondientes Instricciones: GENR RESIDUOS = RESID a) Contrastes Gráficos a.

por lo que puede ser indicativo de ausencia de autocorrelación a. con un tamaño de muestra igual a 17 y con k igual a 1: 190 . Instrucciones: QUICK/GRAPH/LINE GRAPH/RESIDUOS La representación gráfica de los residuos no presenta un comportamiento sistemático lo cual indica la posible ausencia de autocorrelación en el modelo. b) Contrate de Durbin – Watson En la salida de regresión que ofrece el Eviews se puede encontrar el valor del estadístico de Durbin-Watson el cual es : d= 1.2) Gráfico de los residuos en el tiempo.se puede observar que los puntos se colocan en el diagrama en su gran mayoría en el primer cuadrante. du  .40667 En las tablas podemos obtener los límites inferioe y superior dl. al 95% de confianza.

734 1.015 1. .696 0.977 16 1.664 0.867 4 1.767 1.023 ZONA DE INDECISION ZONA DE INDECISION AUTOCORRELACION NO HAY AUTOCORRELACION POSITIVA AUTOCORRELACION NEGATIVA 0 1.157 2.158 1.752 du 2.562 0.350 0.750 0.900 18 1.361 0.946 1. .220 2. K=5 dl 0. podemos contrastar la presencia de autocorrelación.Estadístico d de Durbin-Watson:puntos de significancia de dl y du al nivel de significancia del 5% K=1 K=2 K=3 K=4 dl du dl du dl du dl du .401 1.371 0.551 0.106 1.710 0.104 2.381 diremos que nos hemos situado en una zona de indecisión.710 0.133  d  1.077 1.045 1.820 1.180 1.779 1.539 0. u t  u t 1   t 191 .046 1.859 1.030 15 1.296 2.505 0.133 1.814 1.615 0.074 1. c) Por último dado que suponemos que el esquema de autocorrelación mediante el cual se genera la variable aleatoria es de primer orden.40667 dado que dl  1.982 1.632 2. en la que nada podemos decir acerca de la presencia o no de autocorrelación en el modelo.685 1.535 0.619 2.935 17 1.133 1.391 1.381 2 2.543 0.857 1.848 . .933 1.728 0.381 1.967 1.536 0. analizando la significatividad estadística del parámetro  en la regresión. .779 0.536 0. 14 1.685 0.40667  du  1.872 19 1.060 2.897 1.905 1.

104. En caso de detectar dicho problema.289 192 . en millones de pesetas.813. p. contraste el posible incumplimiento de la hipótesis clásica de no autocorrelación.101 7. Ob.368. con el objeto de estimar un modelo de regresión lineal y comprobar la posible presencia de autocorrelación en las perturbaciones.159.743.543.811.145.740.143.044.511 6.239.141.808.948. las series toman los siguientes valores: AÑO PIBPM CP 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 28.014 7.992 36.Cit. trate de corregirlo.584 64.158. Bernardo.896.097 A partir de dicha información.320 59.498.137 5.972 40.261 77. EJERCICIO Nº 28 Se ha recogido información 45 de la economía española para el período 1985-1997 de las macromagnitudes consumo público (CP) y producto interior bruto a precios de mercado (PIBPM). 45 Tomado de Pena Trampero.535 69. Solución: Considerando el modelo de regresión lineal simple como modelo teórico: CPt   0  1 PIBPM t  ut Trataremos de detectar y en su caso corregir.462 6.776 6. J.221 5.ˆ El estadístico  no es estadísticamente significativo a un 5%.197.952.074.095 6.885 32.195 54.200.905 5.058 73.696 6.986 60. un posible problema de Autocorrelación.323.971.140 7.927.034 4. evidenciando la ausencia de autocorrelación en el modelo.128 50.586 4.739 45.780.

se genera la serie de mínimo cuadráticos correspondientes Instricciones: GENR RESIDUOS = RESID a) Contrastes Gráficos a.1) Diagrama de disperción entre u t y u t 1 193 . es necesario estimar el modelo original A partir de esta estimación.Para realizar el análisis de la posible existencia de autocorrelación en los residuos.

por lo que puede ser indicativo de presencia de autocorrelación positiva a. al 95% de confianza.2) Gráfico de los residuos en el tiempo. posiblemente cíclico que sigue indicando la posible presencia de problemas de autocorrelación. b) Contrate de Durbin – Watson En la salida de regresión que ofrece el Eviews se puede encontrar el valor del estadístico de Durbin-Watson el cual es : d= 0. du  . Instrucciones: QUICK/GRAPH/LINE GRAPH/RESIDUOS La presentación gráfica de los residuos presenta un comportamiento sistemático.343122 En las tablas podemos obtener los límites inferioe y superior dl. con un tamaño de muestra igual a 13 y con k igual a 1: 194 .Se puede observar que los puntos se colocan en el diagrama en el primer y tercer cuadrante.

447 du 3.767 1.350 0.010 1.40667  dl  1.816 0.927 1.814 1.361 0.551 0.512 2.Estadístico d de Durbin-Watson:puntos de significancia de dl y du al nivel de significancia del 5% K=1 K=2 K=3 K=4 K=5 dl du dl du dl du dl du dl du .283 0. 11 0.946 1.562 2.579 0.005 2.472 ZONA DE INDECISION ZONA DE INDECISION AUTOCORRELACION NO HAY AUTOCORRELACION POSITIVA AUTOCORRELACION NEGATIVA 0 1.030 0.324 0. podemos contrastar la presencia de autocorrelación.343122 1.779 0.505 2.331 0.444 2. .645 12 0. .390 14 1.268 0.692 2.445 2.977 0. u t  u t 1   t 195 .572 2.715 1. analizando la significatividad estadística del parámetro  en la regresión.340 2 2.750 0.094 0. K=6 dl 0.832 2.990 4 dado que 0  d  1.340 0.316 2.864 0.077 1.660 2.203 0.971 1.010 0.296 15 1.506 13 1.045 1.658 1.928 0.220 .905 1.562 0.543 0.658 1.177 0.685 1.812 1.379 2. .328 0.861 1.574 2.595 1.389 0.010 diremos que existe autocorrelación positiva de primer orden c) Por último dado que suponemos que el esquema de autocorrelación mediante el cual se genera la variable aleatoria es de primer orden. .632 2.604 0.

pero suponiendo un esquema de autocorrelación para las perturbaciones mediante in proceso AR(1).Como se puede observar el coeficiente pendiente (   0. En el cuadro de diálogo correspondiente a la especificación incorporamos al lado de las variables ya escritos el término AR(1). 196 . Las opciones a ejecutar en Eviews para estimar un modelo con autocorrelación. Pulsamos el botón ESTIMATE de su barra de herramientas para reestimar el modelo inicial. son las mismas que se requieren para estimar el modelo por mínimos cuadradaos ordinarios. pero añadiendo una serie de diferencias. tal como puede verse en la figura a continuación 46 Este esquema se desarrollara con mas detalle en el capítulo X.876997 ) es estadisticamente significativo a un 5% de significancia. Nos situamos en el objeto ecuación en el que hemos estimado por mínimo cuadrados ordinarios el modelo de consumo. han mostrado la existencia de autocorrelación de primer orden que puede aproximarse por un esquema AR(1) 46. confirmando la existencia de autocorrelación positiva en el modelo. SOLUCION Los instrumentos gráficos analizados y el contrates de Durbin-Watson.

Cabe destar que la variable PIBPM 197 . bajo la especificación del modelo MCO.Esta metodología se basa en el método de Cochrane-Orcutt. el cual es un criterio de estimación iterativo para obtener estimadores lineales. Los resultados que se obtienen son: Esta estimación muestra los resultados de la repetición 23 veces del proceso Cochrane-Orcutt para conseguir la convergencia. insesgados y óptimos.

McGraw-Hill.2 1899.2) Contraste de Durbin – Watson.4 1063.1 796..9 155.1 1306.8 1702.7 52.4 28.7 40.9 126.5 935.3 563.2 26. mientras que el proceso autorregresivo es significativo a un 5%.pasa a ser no significativa.2 23.1 523.8 594.5 982.5 Se pide: a) Estimar una función que relacione las importaciones con el PNB. EJERCICIO Nº 29 La tabla a continuación 47 indica el nivel de importaciones de USA y el PNB (ambos en miles de millones de dólares) desde 1960 hasta 1979 AÑO 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 IMPORTACIONES 23.8 217.6 47.1) Contrastes Gráficos. P161 198 .9 58.3 868.2 75.9 94. b. c) En caso de ser necesario corregir el problema 47 Tomado de: Salvatore. Serie Schaum.6 2368.4 131. 1983.5 2127. Dominick.4 32.7 688.9 PNB 506.4 1171.1 37.5 260. b) Determinar la posible existencia de autocorrelación en el modelo mediante: b.1 753.7 635. Mexico.9 1528.5 64.1 25.6 1412. “Econometría”.4 185.

variables que toman de forma continua valores reales. En términos econométricos. En ocasiones se utiliza también la denominación inglesa. El análisis de la influencia de la localización geográfica. la consideración de factores como la localización.CAPITULO IX VARIABLES FICTICIAS. Cuando queremos construir un modelo econométrico que. de las unidades familiares o la situación de la cabeza de familia con relación al empleo. Estas variables reciben también la denominación de variables binarias o dicotómicas. que hasta ahora no hemos considerado en el modelo de regresión. rural o urbana. con relación a los dos valores que toman. que las variables seleccionadas son de carácter cuantitativo. 199 . En otras palabras valores 1 y 0 para denotar la presencia o ausencia. rural o urbana. VARIABLES FICTICIAS O CUALITATIVAS (VARIABLES DUMMY) En la especificación del modelo de regresión lineal hemos considerado. en el comportamiento electoral de una determinada población constituyen un claro ejemplo con relación a esta cuestión. 48 Un ejemplo de un modelo que utilice variables ficticias sería: 48 Díaz Fernández. Tomarán el valor de 1 cuando en el elemento muestral correspondiente se constate la presencia del atributo considerado. Ob cit. estado civil o la localización geográfica constituyen variables de carácter cualitativo que desempeñan un papel protagonista en el estudio de los fenómenos económicos. además de las variables cuantitativas habituales. Factores como el sexo. por ejemplo. variables dummy. constituyen variables a tener en cuenta para explicar el comportamiento de la variable dependiente. el componente estacional. 1. Montserrat. respectivamente. del atributo considerado. y el valor 0. Los factores de naturaleza cualitativa no sólo se incluyen dentro de la categoría de variables explicativas. describa las pautas de consumo con relación a un determinado bien. estas variables se denominan variables ficticias y únicamente toman los valores de 1 y 0. para su consideración. cuando aquel no esté presente en la correspondiente unidad muestral. es decir. 1 y 0. hasta ahora. El tratamiento de estas situaciones requiere la construcción de unas variables artificiales que permitan cuantificar las variaciones cualitativas de los distintos factores considerados. MODELOS DE REZAGOS DISTRIBUIDOS Y MODELOS AUTORREGRESIVOS. sino que también pueden aparecer en el modelo como variable a explicar o dependiente.

una variable cualitativa de una cuantitativa Para considerar la interpretación que en un modelo econométrico se debe dar a los coeficientes de las variables ficticias plantearemos un ejemplo muy sencillo. están definidas: 200 . En este ejemplo tan simple.Yt   o   1 X 1t   2 X 2t   3 Dt  u t Donde D es la variable ficticia. Se pretende explicar el nivel de salarios de los individuos y para ello se plantea la siguiente regresión simple: Yi   0   1 Di  u i Donde Yi es el salario individual y Di es una variable ficticia que tomará el valor de 1 si el trabajador es profesional universitario y 0 si el trabajador no es profesional universitario. Es de uso práctico utilizar la letra D (dummy) para las variables ficticias y así poder diferenciar a simple vista. Supongamos que en lugar de tener un atributo de calificación con dos posibilidades o valores distintos. tenemos que dicho atributo recoge la posibilidad de licenciados universitarios. técnicos superiores. Supongamos que tenemos una muestra con los salarios de N individuos y una característica ocupacional que representa si el individuo es un trabajador es un profesional universitario o no. concluimos que 1 no es significativo. y trabajadores sin educación universitaria. estaremos aceptando que no existen diferencias en los salarios entre trabajadores profesionales y no profesionales. Consideremos que el salario de los tres tipos de trabajadores puede ser diferente. Si en el momento de realizar la prueba de significación individual según la metodología acostumbrada. mientras que 1 mide la diferencia entre los salarios esperados para el trabajador profesional y el no profesional. Para contrastarlo plantearemos la siguiente especificación: Yi   0   1 D1i   2 D2i  u i en la que de nuevo Yi es el salario del trabajador i y las variables D1i y.  0 mide el salario esperado de un trabajador no profesional universitario.

si no lo es La combinación de valores de las variables es la siguiente TRABAJADOR Licenciado Técnico Superior No universitario D1i 1 0 0 D2i 0 1 0 Y con ello los valores esperados para el salario son: 0 si D1i = 0 si D2i = 0 D2i = 0 D2i = 1  0  1 D1i = 1 D1i = 0 0  2 si 201 . si no lo es 0. si trabajador es licenciado universitario técnico superior D2i D1i   0.1. si el el trabajador es 1.

503 1.230 1.156 Se requiere estimar un modelo que permita determinar si el factor “trimestre” es relevante para la venta de acciones de fondos mutuales.108 1. si pretendemos considerar m situaciones o el atributo está compuesto de m alternativas.654 1.129 1.219 1. excluyamos de la especificación la constante. Tomado de Gujarati.398 1. Damodar.994 1. Cit.381 1.176 888 1. Cuando se introducen variables ficticias en un modelo de regresión. EJERCICIO Nº 30 En la siguiente tabla se presenta información 50 trimestral (sin ajustar trimestralmente) sobre venta de acciones de fondos mutuales por parte de la industria de fondos mutuales durante el periodo 1968-1973.564 2.304 1. se produciría un problema de multicolinealidad perfecta en el modelo.607 1. Solución: 49 50 Para un estudio completo del tema. p 525 202 .099 933 AÑO 1968 1969 1970 1971 1972 1973 I 1.donde ahora  0 mide el salario esperado de un trabajador sin estudios universitarios.382 IV 1. ver: Gujarati. Valor de acciones de Fondos Mutuales (Millones de US$) TRIMESTRES II III 1.446 1.658 1.428 975 1.288 1.039 1. mientras que 1 mide la diferencia entre los salarios esperados para un licenciado y el no universitario y  2 la diferencia entre los salarios esperados para técnicos superiores y no universitarios 49. se debe tener cuidado de introducir m-1 variables ficticias.Cit. Ob. Ob. De lo contrario. a menos que a la vez que introducimos las m variables cualitativas.

0 de lo contrario.Par determinar si el factor estacional es importante. estimaremos un modelo de la siguiente forma: VENTAS t  1 D1   2 D2   3 D3   4 D4  u t Donde: D1 = 1 para el primer trimestre. 0 de lo contrario. 0 de lo contrario. Como se puede observar en el modelo ya regresado. lo que indica que el factor estacional es importante para la estimación de la venta de fondos mutuales 2. esto 203 . D4 = 1 para el cuarto trimestre. 0 de lo contrario. D3 = 1 para el tercer trimestre. normalmente nos encontraremos que la relación causa efecto no sucede en el mismo período. generalmente. MODELO DE REZAGOS DISTRIBUIDOS Cuando se analiza un fenómeno económico. todos los coeficientes son significativos al 5%. D2 = 1 para el segundo trimestre. por ejemplo. la emisión de dinero inorgánico por parte del gobierno y su posterior incidencia en la elevación del nivel general de precios (inflación) no sucede inmediatamente.

. 51 51 Ver: Gujarati. por la tanto es importante especificar en un modelo este hecho. Estas sumas parciales se denominan multiplicadores intermedios.   k   que se conoce como el multiplicador de rezagos distribuidos de largo plazo o total.cit. el cual es un caso particular de las series de tiempo. porque da el cambio en el valor medio de Y que sigue a un cambio unitario en X en el mismo período de tiempo.sucede con cierto número de períodos de diferencia. 204 . y esto da como resultado estimaciones imprecisas de las. Ob. como son los modelos de ajuste parcial. Usualmente para solventar los problemas antes mencionados. Cap. Los problemas que surgen al aplicar la estimación mínimo cuadrática a los modelos de rezagos distribuidos son: a) Se pierden k grados de libertad porque estos modelos solo se pueden estimar a partir de (n-k) observaciones... Finalmente. Si el cambio en X se mantiene al mismo nivel desde el principio.  1   2 en el que sigue y así sucesivamente. se estiman modelos alternos. 17. si k es grande esto conduce a una reducción considerable en el número de observaciones efectivas utilizadas.   k X t  k  u t donde  0 se conoce como el multiplicador de corto plazo o de impacto. Modelo de expectativas adaptables y la aproximación polinomial de Almon.. Tal especificación lo podemos realizar a través de un modelo de rezago distribuido. b) Frecuentemente existe multicolinealidad elevada entre las variables explicativas. entonces  0  1  nos da el cambio en (el valor medio de) Y en el período siguiente. Siempre y cuando la suma  exista. después de K períodos se obtiene 0    i 0 k i   0  1   2  . Un modelo de rezagos distribuidos se caracteriza por incluir no solamente los valores actuales sino además los valores rezagados (pasados) de las variables explicativas: Yt     0 X t   1 X t 1   2 X t  2  .

La ecuación anterior muestra que el efecto de un incremento de US$ 2. . . . . o se distribuye.800. 10 Ejemplo de modelo de rezagos distribuidos 52 Supóngase que una persona recibe un incremento salarial de US$ 2. Se puede escribir la función de consumo como: Yt  constante  0.cit.4 X t  0. ¿Cuál será el efecto de este incremento en el ingreso sobre el gasto de consumo anual de la persona?. Inmediatamente después del aumento en el ingreso. la gente usualmente no se apura a gastarse todo el incremento inmediatamente. 90 X t 2 ------10 20 30 . Por consiguiente modelos como este se denominan modelos de rezagos distribuidos porque el efecto de una causa dada ( el ingreso) se propaga durante un número de períodos de tiempo. en US$ 600 en el siguiente año y en otros US$ 400 un año después y ahorra el resto. el gasto de consumo anual de la persona habrá aumentado en US$ 1. . el beneficiario del ejemplo puede decidir aumentar su gasto de consumo en US$ 800 durante el primer año siguiendo el incremento salarial en el ingreso.000 en su pago anual y supóngase que se trata de un incremento “permanente” en el sentido de que se mantiene el incremento en el salario. durante un período de tres años. 80 X t 3 ---------10 20 .2 X t  2  u t donde Y es el gasto de consumo y X es el ingreso. . 100 X t 1 ---10 20 30 40 . Así.000 se propaga. . A fines del tercer año. 70 … X t n ---------------. 205 . Ob. .3 X t 1  0. 52 Gujarati. .GENERACION DE UN BANCO DE DATOS A PARTIR DE LOS REZAGOS DE X Xt 10 20 30 40 50 . .

se recogen para cada uno de los modelos estimados. . .EJERCICIO Nº 31 Se desea estimar un modelo 53. La determinación. Ob. que permita explicar el número de vehículos de fabricación nacional (FABNAC) a partir de la variable Importaciones de Vehículos (IMPORT) retardada en número diferente de períodos. mientras que si es excesivo cometeremos un error de especificación por inclusión. el valor del coeficiente de determinación ajustado (CDA). el número total de observaciones (N* = N – M). desde un punto de vista econométrico. ponderándolo por los grados de libertad   2 n 1   R 2  1  R2   n  k  1 La ventaja que presenta este coeficiente frente al R2 es que permite comparar la capacidad explicativa de modelos referidos a una misma muestra de la misma variable endógena con distinto número de variables explicativas. el criterio de información de Akaike (AIC) y el criterio de Schwarz (SBC).309. el número de retardos utilizados (M). son dos estadísticos que sirven para analizar la capacidad explicativa de un modelo y permite realizar comparaciones a este respecto entre modelos anidados.El criterio de información de Akaike (Akaike info criterion) y el Criterio de Schwarz (Schwarz criterion). se convierte en un problema de selección de modelos en el que hay que tener presente que si el número de retardos es escaso incurrimos en un error de especificación por omisión.Coeficiente de Determinación ajustado R (Adjusted R-squared):Este coeficiente se obtiene a partir del R2. En la tabla que se presenta a continuación. 206 . Ursicino. La selección entre modelos puede llevarse a cabo comparando el coeficiente de determinación ajustado a cada uno de ellos y/o utilizando algún criterio de información como el de Akaike o el de Schwarz54 (ambos calculados por Eviews) Para tal fin vamos agregando un retardo por vez al modelo y vamos observando los estadísticos antes señalados.Cit. 53 54 Tomado de: Carrascal A. p.

207 .55620 19.27476 Los resultados de la tabla llevan a seleccionar el modelo que incluye siete retardos de la variable IMPORTACIONES.59055 17.75353 19.972380 AIC 19.793596 0.49262 18.979235 0. ya que es el que presenta el mayor coeficiente de determinación ajustado y el menor valor en los criterios de Akaike y de Schwarz.55606 19.95491 19.81132 18.45869 19.48690 19.00576 17.79105 19.770240 0.919698 0.M 0 1 2 3 4 5 6 7 8 T* 25 24 23 22 21 20 19 18 17 CDA 0.790627 0.782131 0.70695 19.03573 18.966824 0.40342 18.63416 19.827643 0.15982 18.78463 SBC 19.

En la literatura a este tipo de modelos también se les conoce como modelos dinámicos puesto que señalan la trayectoria en el tiempo de la variable dependiente en relación con su(s) valor(es) pasado(s). es estocástico (aleatorio). el consumo de una persona para un período determinado está influenciado en cierta medida por su patrón de consumo. RA-MA. Yt 1 al igual que.296. lo cual significa que se tiene una variable explicativa estocástica en el modelo. Un modelo que refleje esta situación sería: C t   0   1C t 1  u t Si el modelo incluye uno o más valores rezagados de la variable dependiente entre sus variables explicativas.3. 2001. Normalmente el comportamiento de una variables es explicado por el comportamiento que ha tenido la misma en períodos pasados. un modelo autorregresivo se puede esquematizar de la siguiente forma: Yt   0   1 X t   2Yt 1  u t Es importante resaltar que en este tipo de modelos. Yolanda Gonzalez G. se hace necesario utilizar un método diferente para comprobar la existencia o no de autocorrelación en un modelo autorregresivo (por ejemplo. Y Beatriz Rodríguez. Madrid. por ejemplo. Se debe recordar que la teoría clásica de mínimos cuadrados se basa en el supuesto de que las variables explicativas o bien sean no estocásticas o. están distribuidas independientemente del término de perturbación estocástico. Por consiguiente. en caso de serlo. 208 . Igualmente la presencia de Y rezagado viola uno de los supuestos en los cuales se basa la prueba de Durbin-Watson. es decir de la forma en que viene consumiendo a través del tiempo. Ursicino. p. la prueba h de Durbin. se denomina modelo autorregresivo. “Análisis Econométrico con Eviews”. MODELOS AUTORREGRESIVOS En los diferentes estudios económicos es interesante estudiar el comportamiento de una variable a través del tiempo. En forma genérica. EJERCICIO Nº 32 Un investigador utilizando datos anuales 55 para el período 1964-1998 para la formación bruta de capital fijo (I80) y del producto interior bruto a coste de los factores 55 Tomado de: Carrascal A. la aparición de Yt 1 como variable explicativa puede crear algunos problemas estadísticos.

Para realizar este análisis podemos utilizar el estadístico de la h de Durbin o el Contraste de Breusch-Godfrey. Como es un modelo autorregresivo. El Contraste de Breusch-Godfrey lo realizamos desde la ventana de la ecuación MCO seleccionando en el menú: VIEW/RESIDUAL TEST/SERIAL CORRELATION LM. 209 .(PIBCF80) en pesetas constantes de 1980. Para tal fin estimó el siguiente modelo: PIBCF 80 t   0   1 I 80 t   2 PIBCF 80 t 1  u t obteniéndose los siguientes resultados: Los resultados muestran la significancia individual de los coeficientes de I80 y PIBCF80(-1). no podemos utilizar el estadístico de Durbin-Watson para chequear la existencia o no de autocorrelación de primer orden en el modelo. intentó explicar la producción en función de la inversión.

En los resultados podemos observar la no significación individual de RESID(-2). lo que lleva a plantear la existencia de un esquema AR(1) 210 .

8314)) 4. Dado Yt   0   1 X t  u t con N . Dada una muestra de tamaño N. Así mismo.54 unidades (3. de modo que a largo plazo el efecto de la inversión sobre el PIB se cifra en 3.l. sea diferente. se mantienen constantes para las dos submuestras.El modelo finalmente estimado permite concluir que el efecto a corto plazo de la inversión sobre el producto interior bruto es igual a 0.54= 0. respectivamente. Una de las pruebas más populares para identificar un cambio estructural en el modelo. Sin embargo.5972/(1-0. esa unidad adicional de inversión genera efectos sobre el producto interior bruto de los periodos siguientes. o por el contrario. ANALISIS DE LA ESTABILIDAD ESTRUCTURAL DE LOS COEFICIENTES En las series de tiempo.k g. una de las hipótesis que suponemos cumple el modelo de regresión es que los coeficientes se mantienen constantes para todo el período muestral. es posible que existan submuestras para las que el comportamiento del modelo.l. se dividirá en la unidad temporal en la que se produce el cambio estructural de los coeficientes. es la Prueba de CHOW. (1) Yt   0   1 X t   t con n1 – k g.597. siendo necesario contrastar esta posibilidad. su estructura. (2) 211 . El contraste de estabilidad en el comportamiento estructural del modelo se planteará comprobar si los coeficientes se mantienen constantes para las dos submuestras. obteniéndose dos submuestras de tamaño n1 y n2 .

Si no presenta un comportamiento estable.Yt   0   1 X t   t con n2 – k g. respectivamente. a la suma de residuos mínimo-cuadráticos de la muestra de tamaño N.noviembre de 1998. observaciones.l. 212 . se estimaría el modelo (1) con una muestra de N = n1 + n2. (3) H 0 : 1  1 H1 : 1  1 Si el modelo presenta un comportamiento estable. Para el período: enero de 1980 . la suma de residuos al cuadrado de cada submuestra individualmente. y SRCn1 y SRCn2. Denominando SRC. se calcula el estadístico F siguiente: SRC N  SRC n1  SRC n2  k F SRC n1  SRC n2 n1  n 2  2k A continuación se presenta un modelo en el cual el crédito interno neto (CRED) está en función de la oferta monetaria (M1). necesariamente hay que estimar un modelo para cada submuestra. es decir los modelos (2) y (3).

seleccionamos en la barra de herramientas VIEW / STABILITY TESTS / CHOW BREAK POINT TEST Lo que da a lugar a un cuadro de dialogo como el que se muestra a continuación: 213 . lo cual puede sugerir que para esos períodos hubo un cambio estructural en el modelo.Observando el gráfico de las variables podemos observar cambios en la pendiente de la curva del crédito interno neto en los años 1991 y 1993. Para analizar en Eviews la estabilidad estructural de los coeficientes a través el test de Chow.

siempre con la precaución de que el número de observaciones de cada submuestra sea superior a k+1. El valor del estadístico F y su probabilidad indican el rechazo de la hipótesis nula de estabilidad estructural. se concluye que en el modelo estimado se produce un cambio estructural en junio de 1991.05). 214 . Por tanto. También se pueden considerar más de un punto de ruptura. puesto que la probabilidad de rechazar dicha hipótesis siendo cierta no supera el 5% (0. . En la tabla aparecen los valores estadísticos que calcula Eviews para contrastar un cambio estructural en junio de 1996. el número de coeficientes o parámetros a estima.En el mismo deben escribirse los puntos. fechas o números de observaciones en los que se cree que ha existido el cambio estructural.

Holden Day.. y la partes de promedios móviles.2. Banco Central de Venezuela. a su vez.Editorial AC. es que los datos aparecen ordenados cronológicamente. Mimeo. generalmente regulares. 215 . a fin de recoger la parte determinista del modelo. la parte autorregresiva. 1976. los modelos ARIMA (Autoregressive Integrated Moving Average) a través de la 58 metodología desarrollada por Box y Jenkins (1976) para tratar modelos lineales univariantes..CAPITULO X ESTACIONARIEDAD Según José Otero 56.. contiene dos elementos: uno sistemático que recoge patrones de comportamiento del fenómeno de interés (como la estacionalidad) y otro determinista que recoge características predeterminados de la serie. En otras palabras se asume que cada valor X 1 . X t en la serie es extraído al azar de una distribución de probabilidad. George y Gwilym Jenkis. “Time Series Analysis. ordenadas de acuerdo con el parámetro discreto . 58 Box. se define como una colección de variables aleatorias.. Los cuales están conformados por dos componentes.6. que pretende reflejar el componente estocástico.3. p1.. 57 Blanco Odio.. Forecasting and Control”. San Francisco. para t = 1.1997 p. es una sucesión de valores observados de una variable referidos a momentos o a periodos de tiempo diferentes..PROCESOS ESTOCASTICOS Un proceso estocástico X t . una serie de tiempo o serie cronológica. que en nuestro contexto es el tiempo. “Aspectos Conceptuales Sobre Series de Tiempo”. Una serie de tiempo está conformada por las siguientes partes 57: Y = sistemática + determinista + aleatoria La variable Y se dice ser estocástica por que su valor en cada momento del tiempo está en función de una parte conocida bastante predecible y de una parte desconocida o impredecible.. en contraposición a las observaciones de corte transversal. España. Carlos M. Calif. La parte conocida. 56 Otero. 1989. X t . 1. “Modelos Econométricos y Predicción de Series Temporales”. La característica distintiva entre una serie de tiempo . X 2 . La parte puramente aleatoria está formada de eventos no explícitamente considerados en el modelo o factores estocásticos (tendencia estocástica) En este capítulo describiremos la metodología para la estimación de un tipo de modelos estocásticos especialmente útiles para la predicción de series de tiempo. José M.

.. si el proceso estocástico está fijo en el tiempo. se alejarán cada vez más del bar. se dice que un proceso estocástico es estacionario (o débilmente estacionario) si su media y su varianza son constantes en el tiempo y si el valor de la covarianza entre dos períodos depende solamente de la distancia o rezago entre dos períodos de tiempo y no del tiempo en el cual se ha calculado la covarianza. Ob. Damodar. y1   y t  E  t 1   y t 3.. ESTACIONARIEDAD Cuando se comienza a desarrollar modelos para series de tiempo. Lo mismo se dice acerca del precio de las acciones. entonces podemos modelar el proceso a través de una ecuación con coeficientes fijos que pueden estimarse a partir de datos pasados. El precio de las acción hoy es igual al precio de la acción ayer más un “shock” o innovación aleatoria 60 Consideremos el caso en el que se requiere un pronóstico para un proceso de caminata aleatoria. En sentido amplio. el ebrio se mueve a una distancia aleatoria u t en el tiempo t si el o ella continúa caminando indefinidamente. E  t    2 y E  t  s   0 para t  s. Al dejar el bar. En el proceso más simple de caminata aleatoria cada cambio sucesivo en y t es extraído en forma independiente de una distribución de probabilidad con media 0. es decir. p. p. si es estacionario. Por tanto. y t está determinado por: y t  y t 1   t con E  t   0 . Robert. Si las características del proceso estocástico cambian con el tiempo. Ob. donde una cara recibe un valor de +1 y una cruz recibe un valor de –1. Gujarati. El pronóstico está dado por: ˆ y t 1  E  y t 1 / y t . En otras 59 60 Pindyck. si el proceso no es estacionario.Cit.. la caminata aleatoria es comparada con la caminata de una persona ebria.2. Por el contrario. 2 A menudo. se desea saber si es posible suponer que el proceso estocástico subyacente que generó la series es invariable con respecto al tiempo.702 216 .Cit.515. en general será difícil representar la serie de tiempo durante intervalos de tiempo pasados y futuros con un modelo algebraico simple. Dicho proceso puede ser representado por los lanzamientos sucesivos de una moneda. CAMINATA ALEATORIA El ejemplo mas simple de una serie de tiempo estocástica es el proceso de caminata aleatoria o Random Walk 59. es decir.

lo que es indicativo de que la media no es constante para toda la serie. una serie es estacionaria cuando su distribución de probabilidad no depende del tiempo. Ob. y su varianza es constante. Es de resaltar que la mayoría de las series económicas encontradas en la práctica son no estacionarias. 217 . y el mismo consiste en una serie de tiempo que abarca el periodo 1980-1998. tiene que ver con la innovaciones. su efecto es permanente sobre fenómenos no estacionarios. Un aspecto importante a considerar con respecto a las series estacionarias.palabras. Las series no estacionarias son aquellas cuya media o varianza cambian con el tiempo. con periodicidad mensual de un indicador de renta salarial real para la economía española. se habla de tendencia estocástica.Cit. En el gráfico Nº 2 se muestra una serie de tiempo estacionaria La definición de estacionariedad en sentido estricto implica que las características del proceso estocástico no sufren alteración al considerar tiempos históricos diferentes A continuación se presenta un cuadro resumiendo las características principales de una serie estacionaria y de una no estacionaria: 61 El ejemplo es tomado de Pulido. Cuando sólo la media depende del tiempo se dice que existe tendencia determinística y cuando es la varianza la que depende del tiempo. en el mismo se puede observar claramente una tendencia. Gráfico Nº 1 Gráfico Nº 2 En el gráfico Nº 1 61 se puede observar una serie no estacionaria. lo que significa que mientras un shock tiene carácter transitorio en series estacionarias. Esto implica que a pesar de sus oscilaciones la serie tiende a converger a un valor medio fijo. Antonio y Ana María López.

es posible transformar muchas series económicas de tiempo en otras estacionarias. un shock aleatorio tendrá efectos transitorios y van decreciendo (perdiendo permanentes en el proceso.ESTACIONARIA Tiene una media constante y hay una NO ESTACIONARIA tendencia de la serie a volver hacia esta Tiene un comportamiento divagante. fuerza) en el tiempo. tiempo Tiene memoria limitada de su comportamiento pasado. RAICES UNITARIAS. 4. por efectos de un Shock aleatorio son sólo tanto. Muy pocas series económicas de tiempo son estacionarias. tanto tiende a fluctuar alrededor de la media Tiene autocorrelaciones que decrecen Las autocorrelaciones tienden a uno para rapidamente al alejernos en el tiempo cualquier retardo Tiene varianza finita e independiente del La varianza depende del tiempo. Los motivos de la falta de estacionariedad suelen ser: a) Se presenta una tendencia. para ello consideramos la siguiente representación autorregresiva de la serie Xt: X t  X t 1  at donde at es un ruido blanco utilizando el operador de retardo B j X t  X t  j  obtenemos la siguiente representación: X t  X t 1  at  BX t 218 . en el sentido de que no se manatiene sobre un media cuando se ha desviado de ella. c) Hay variaciones estacionales. Por valor medio a lo largo de su historia. lo que es contrario a la hipótesis de estacionariedad. Afortunadamente. b) La varianza no es una constante. sometiéndolas a operaciones algebraicas. Por tanto los El proceso tiene memoria ilimitada y. OPERADOR DIFERENCIA Y ORDEN DE INTEGRACION DE UNA SERIE DE TIEMPO es importante destacar la asociación existente entre la noción de serie no estacionaria y raíz unitaria. La presencia de variaciones estacionales se traduce en una variabilidad de la media del proceso.

en otras palabras. un resultado teórico establece que un modelo como el anterior es débilmente estacionario si toda raíz  de  B  cumple con las siguiente condición:  1 (la raíz está fuera del circulo unitario) -1 0 1  1  1  1 -1 0 1 El caso de mayor interés es cuando . y se puede probar que cuando esto ocurre. la serie es no estacionaria. cuya raíz viene dada por   1  : 1  B   0  1  B    Ahora bien. cuando existe raíz unitaria. De allí que la relación fundamental que siempre se ha de tener en cuenta es: EXISTENCIA DE RAICES UNITARIAS EQUIVALE A NO ESTACIONARIEDAD 219 . esto es. la varianza de Xt no es finita. X t  BX t  at  1  B X t  at   B X t  at donde  B   1  B   B X t  at es la representación general de un modelo autorregresivo de orden 1 Obsérvese que  B  es un polinomio de grado 1.

diremos que una serie Xt es integrable de orden d. si existe raíz unitaria se tiene que: X t  X t 1  at :  X t  X t 1  at denotando X t  X t  X t 1 y sustituyendo en la ecuación anterior.NO ESTACIONARIEDAD  SI  EXISTENCIA DE RAICES UNITARIAS CRECIMIENTO EXPLOSIVO  1 X t  X t 1  at X t  X t 1  at = caminata aleatoria  proceso integrado  no estacionario Saber que existen raíces unitarias provee de la transformación necesaria para superar el problema de la no estacionariedad. resulta:  X t  at La primera diferencia de Xt es estacionaria. si debe ser diferenciada d veces para alcanzar estacionariedad y se denota: Xt ~ I(d) 220 . de forma que la no estacionariedad se supera diferenciando la serie tantas veces como raíces unitarias posea. En general. Considerando nuevamente una representación autorregresiva para Xt.

Gráfico Nº 3 221 . la gráfica obtenida se conoce como correlograma. se define como: k   k cov arianza. denotada por  k . Si se grafica  k frente a k. igual que cualquier coeficiente de correlación.  k es un número sin unidad de medida.k  0 var ianza Puesto que la covarianza y la varianza están medidas en las mismas unidades.5. PRUEBA DE ESTACIONARIEDAD BASADA EN EL CORRELOGRAMA Una prueba sencilla de estacionariedad está basada en la denominada función de autocorrelación (ACF). seleccionamos VIEWS/CORRELOGRAM. Se encuentra entre –1 y +1. Esto no suele ocurrir con las series estacionarias (gráfico Nº 4). La ACF de las series estacionarias disminuye sensiblemente a medida que aumenta el desfase temporal K (gráfico Nº 3).rezago. Para obtener el correlograma en Eviews. La ACF al rezago k.al. o puro.

esta función es cercana a cero.941). varianza constante y no esta autocorrelacionado. Ob. Dado el siguiente modelo autorregresivo de primer orden 62: Yt  Yt 1  u t donde u t es el término de error estocástico que sigue los supuestos del modelo clásico.Cit. su autocorrelación en cualquier rezago mayor que cero es cero. tiene media cero. p. PRUEBA DE RAIZ UNITARIA SOBRE ESTACIONARIEDAD – PRUEBA DICKEY – FULLER (ADF). mientras que la función de autocorrelación parcial presenta un valor significativo en el retardo uno.En el gráfico Nº 3 se aprecia como la función de autocorrelación decrece rápidamente. con un coeficiente de autocorrelación cercano a la unidad (0. lo cual es indicativo de una serie estacionaria. Este gráfico puede considerarse como indicativo de la no estacionariedad. 6. Un término de error con tales propiedades es conocido también como término de error de ruido blanco (White noise). surge lo que 62 Gujarati. ya para la observación 2. Ahora bien si el coeficiente de Yt 1 es igual a 1.702 222 . En el caso de un proceso estocástico puramente aleatorio. Gráfico Nº 4 En el gráfico Nº 4 se aprecia que la ACF decrece exponencialmente y de forma lenta. Damodar.

se dice que la serie original es integrada de orden dos. Si a la ecuación anterior se le resta Yt 1 podemos hallar una forma alternativa de expresarla de muy frecuente utilización: Yt  Yt 1  Yt 1  Yt 1  u t Yt     1Yt 1  u t Yt  Yt 1  u t donde      1 y  se el operador de primera diferencia   Yt  Tt 1 .A. una situación de no estacionariedad. por lo que a esta prueba se conoce como la prueba de Dickey-Fuller (DF). lo cual nos indica que la primera diferencia de una serie de tiempo de caminata aleatoria es una serie de tiempo estacionaria porque por supuestos. los estadísticos t que se obtengan no siguen una  0  distribución t de Student aun en muestras grandes. ˆ Para saber si una serie es estacionaria o no. En su gran mayoría las series de tiempo económicas son integrada de orden uno. Ahora bien. se dice que la serie original (caminata aleatoria) es integrada de orden 1. o I(1). el estadístico t calculado se conoce como el estadístico  (tau). 63 A. Vol. se puede convertir en estacionaria diferenciándola. debe tomarse la primera diferencia de la primera diferencia) para hacerla estacionaria. Por consiguiente al realizar la regresión Yt  Yt 1  u t y se encuentra que   1 . Posteriormente. En general. Bajo la hipótesis nula de   1 . o si ˆ es estadísticamente igual a cero H : ˆ  0 . o I(d). se debe determinar si  es ˆ estadísticamente igual a uno H 0 :   1 . En forma similar. Lo anterior supone que una serie de tiempo no estacionaria. si la serie original debe ser diferenciada dos veces (es decir. si una serie de tiempo ha sido diferenciada una vez y la serie diferenciada resulta estacionaria. o I(2). 223 . si una serie de tiempo debe ser diferenciada d veces.se conoce como el problema de raíz unitaria es decir. Si se cumple la hipótesis nula de   0 el modelo se puede escribir de la siguiente forma: Yt  u t . cuyos valores críticos han sido tabulados por Dickey-Fuller 63. fueron ampliadas por Mackinnon. Fuller. Distribution of the Estimators for Autoregressive Time Series with a Unit Root”. Lamentablemente. las tablas con los valores críticos. 4 1979. entonces se dice que la variable estocástica Yt tiene una raíz unitaria. esta se dice que esta es integrada de orden d. Dickey y W. u t es puramente aleatoria. Journal of the American Statistical Association. y se denota por I(1).

Por razones teóricas y prácticas, la prueba de Dickey-Fuller se aplica a regresiones efectuadas en las siguientes formas:
Yt  Yt 1  u t Yt   1  Yt 1  u t Yt   1   2 t  Yt 1  u t

Donde t es la variable tiempo o tendencia. En cada caso, la hipótesis nula es que   0 , es decir que hay una raíz unitaria, o lo que es lo mismo, la variable estocástica no es estacionaria. Si el término de error u t está correlacionado, Yt   1   2 t  Yt 1  u t de la siguiente forma:
m

se

modifica

la

ecuación

Yt   1   2 t  Yt 1   1  Yt i  u t
i 1

donde, por ejemplo, Yt 1  Yt 1  Yt  2  , Yt  2  Yt  2  Yt 3  , etc., es decir se utilizan términos en diferencia rezagados. El número de términos en diferencia rezagados que deben incluirse con frecuencia se determina empíricamente, siendo la idea incluir suficientes términos, de tal manera que el termino de error u t sea serialmente. Independiente (ruido blanco). La hipótesis nula es la misma, es decir que existe una raíz unitaria en Yt (o lo que es igual, Yt es no estacionaria). Esta prueba se llama Dickey-Fuller aumentada (ADF) En el paquete Eviews, se puede obtener fácilmente la prueba de Dickey-Fuller, para tal fin seleccionamos VIEWS/UNIT ROOT TEST, con lo cual obtenemos el siguiente cuadro:

224

Como se puede observar, en el cuadro se pueden identificar cuatro áreas: en la superior izquierda, identificamos que prueba se utilizará, la de Dickey-Fuller aumentada o la de Phillips-Perron (que se tratará mas adelante). En la inferior izquierda, indicamos si la prueba se va a realizar sobre la serie en niveles, primeras diferencias o segundas diferencias de la serie original. En el área superior derecha, especificamos la forma funcional del modelo a regresar: con intercepto solamente, con tendencia e intercepto, o finalmente, sin tendencia ni intercepto. Para esta parte resulta bastante importante ver el gráfico de la serie. Finalmente, en el área inferior derecho, indicamos el número de rezagos de la variable en diferencias que se va a utilizar. Por ejemplo, seleccionando:

Se obtiene el siguiente cuadro

225

El estadístico del test ADF (-2,749934) coincide con el estadístico t de la variable dependiente retardada IRENTA(-1), incluida como regresor en la ecuación estimada. La hipótesis nula ( H 0 : existe una raíz unitaria) se acepta si el estadístico t es menor que los valores críticos de Mackinnon. En este ejemplo, comprobamos que la hipótesis nula se acepta a cualquiera de las de los tres niveles de significación presentados (1%, 5% y 10%), es decir, la serie IRENTA, presenta una raíz unitaria, es decir, no es estacionaria. Adicionalmente, podemos ver que tanto la tendencia como el intercepto son significativos a un 5%. Es importante destacar que un requisito para que esta prueba sea válida, es que el término de perturbación sea un ruido blanco, por lo cual, se hace necesario ver el correlograma de los residuales

226

Para que sea ruido blanco, los residuales no deben estar autocorrelecionados. En el correlograma se puede observar que los primeros 6 coeficientes de correlación no son significativos, con lo cual podríamos interpretar que el término de perturbación u t es un ruido blanco, por lo tanto la prueba del Dickey-Fuller es válida En el caso de que no fuera un ruido blanco, se realiza una nueva prueba de Dickey-Fuller aumentada, incluyendo rezagos de la variable en diferencias.
EJERCICIO Nº 33

A continuación se presenta un cuadro con el tipo de cambio promedio para Venezuela para el período 1996-2002. Se pide determinar si la serie es estacionaria o no.
CUADRO Nº 1 VENEZUELA - TIPO DE CAMBIO PROMEDIO (millones de US$)
1996 ENERO FEBRERO MARZO ABRIL MAYO JUNIO JULIO AGOSTO SEPTIEMBRE OCTUBRE NOVIEMBRE DICIEMBRE FUENTE: B.C.V. 290,00 290,00 290,00 360,47 468,89 471,25 470,75 474,20 476,12 470,01 471,57 474,73 1997 476,84 474,40 478,40 479,25 483,27 485,63 491,25 495,90 496,79 498,62 499,93 502,80 1998 507,29 514,64 520,90 530,08 537,05 542,00 557,39 570,19 584,42 571,25 569,25 566,19 1999 568,84 577,10 579,40 587,29 595,63 602,13 610,56 615,22 624,48 630,19 634,15 643,35 2000 652,15 658,51 666,12 672,01 679,53 680,55 685,21 688,89 690,08 692,46 695,31 698,34 2001 699,70 702,58 705,52 709,64 714,39 716,69 722,00 730,82 742,94 743,07 744,73 751,91 2002 761,55 884,21 947,22 876,54 965,48 1196,74 1328,98 1373,93 1457,20 1452,32 1366,60 1320,67

227

En primer lugar debemos observar el gráfico de la serie: Gráfico Nº 5

En el gráfico Nº 5, se observa que la serie de tiempo muestra una clara tendencia ascendente, por lo que la media no puede ser constante, lo que evidencia que la serie no es estacionaria en niveles. En segundo lugar vemos el correlograma: Gráfico Nº 6 Correlograma TCP

Observando el correlograma, vemos como la función de autocorrelación decrece exponencialmente y de forma lenta, mientras que la función de autocorrelación parcial presenta un valor significativo en el retardo uno, con un coeficiente de
228

autocorrelación cercano a uno (0,93). Este gráfico puede considerarse como indicativo de la no estacionariedad de la serie, es decir, presenta raíz unitaria.

Para comprobar de forma más exhaustiva esta característica de la serie, procedemos a aplicar la prueba de raíces unitarias. Seleccionando en el cuadro de diálogo de aplicación de la prueba ADF (datos en niveles, tendencia, intercepto y tres rezagos). Eviews nos presenta los siguientes resultados:

229

GRAFICO Nº 7 CORRELOGRAMA DE LOS RESIDUOS

El estadístico ADF (-3,4181) es menor que el valor crítico de Mackinnon a un 5% de significación, por lo que se acepta la hipótesis nula, es decir, la serie TCP presenta raíz unitaria, no es estacionaria. A continuación se presenta la prueba de Dickey-Fuller para la primera diferencia del tipo de cambio promedio y el correlograma de los residuales:

230

7. PRUEBA DE PHILLIPS-PERRON (test PP)
Phillips y Perron 64 propusieron en 1988 un método no paramétrico para controlar la correlación serial de orden elevado en una serie. La prueba de regresión contenida en el test PP es el proceso autorregresivo de primer orden AR(1):
Yt    Yt 1   t

Mientras que la prueba ADF corrige la correlación serial de orden elevado añadiendo más retardos del término diferenciado de la serie original en el lado derecho de la ecuación, el test PP realiza una corrección del estadístico t sobre el coeficiente en la regresión AR(1) para considerar la correlación serial en el término  . La distribución asintótica del estadístico t del test PP es la misma que la del estadístico t de la prueba ADF y se contrastan los resultados del test con los valores críticos de Mackinnon. Igual que en la prueba ADF tenemos que especificar si incluimos una constante, constante mas término de tendencia o nada en la regresión, para el test PP además hay que especificar el numero de períodos de correlación serial a incluir.

64

Pulido, Antonio y Ana María López. Ob.Cit. p.271
231

232 .

Supongamos que la ecuación ”verdadera” y “correcta” para la demanda de un bien es la siguiente: Yi   0   1 X 1i   2 X 2i  u i (2. en gran parte. en realidad. Sin embargo. El sesgo dependerá de la 233 .CAPITULO XI OTROS TEMAS DE ECONOMETRIA 1. Una vez que se asume la especificación correcta del modelo. Los principales errores que se pueden cometer en el momento de especificar un modelo son: a) Omisión de una variable relevante. la estimación y prueba del mismo se hacen relativamente sencillas. nunca podemos estar seguros de que un modelo determinado está especificado en forma correcta.1) Donde se especifica que la cantidad demandada del bien Yi  está en función del precio de dicho bien  X 1i  y la publicidad del mismo  X 2i  . Generalmente se examinan más de una probable especificación. Al no especificar la función de demanda tal como se indica en la ecuación (2. DEFINICION Hasta el momento los modelos econométricos estudiados.2) estaremos incurriendo en un error de especificación al omitir una variable relevante para explicar el comportamiento de la variable dependiente. se han basado. ERROR DE ESPECIFICACION. por equivocación o ignorancia de la relación verdadera. OMISION DE UNA VARIABLE RELEVANTE. 2. b) Inclusión de una variable innecesaria. intentando encontrar la especificación que describa en mejor forma el proceso bajo estudio. Ahora bien. estimamos el siguiente modelo: Yi   0   1 X 1i  u i (2. en el supuesto de que el modelo que se va a estimar esté especificado en forma correcta. el estimador 1 obtenido en la ecuación (2.1).2) será sesgado.

Este sesgo de especificación cuantitativamente será igual a: E 1   1  1 2 (2. 234 . por lo tanto la utilización del estadístico Durbin-Watson. Es decir E  0    0 y. las consecuencias de omitir una variable explicativa relevante en el modelo son las siguientes: a) Si la variable excluida X 2 está correlacionada con la variable incluida. Si la publicidad está correlacionada positivamente con la demanda.3) donde 1 es igual a la pendiente de la regresión entre las dos variables explicativas X 1i   0   1 X 2i  u i alternativamente la ecuación (2. el estimador mínimo cuadrático 1 tomará valores mayores que lo realmente debiera. d) La varianza del coeficiente 1 es un estimador sesgado de la varianza verdadera de. Esquemáticamente.3) se puede escribir de la siguiente forma: E 1   1   2 x x x 1 2 2 2  1   2 X X X 1 2 2 2  NX 1 X 2 2  NX 2 Es importante recordar que el especificar mal un modelo puede traer como consecuencia la presencia de autocorrelación en el modelo. y el estudio de los residuales pueden ser una metodología adecuada para sospechar la presencia de un sesgo de especificación por la omisión de una variable relevante. independientemente del tamaño de la muestra.  0 es aun segado. se sobrestimará. y el precio aparece correlacionada positivamente con la publicidad.relación existente entre las dos variables explicativas. es probable que el intervalo de confianza usual y los procedimientos de prueba de hipótesis conduzcan conclusiones equivocadas sobre la significancia estadística de los coeficientes estimados. c) La varianza de la perturbación  2 está incorrectamente estimada. b) Aun cuando X 1 y X 2 no estén correlacionadas. e) En consecuencia. es decir el coeficiente. es decir. Precio y publicidad. y del poder explicativo de la publicidad en función de demanda. aun cuando 1 sea ahora insesgado.  0 y 1 son sesgados como también inconsistentes.

Este aumento puede incluso llevarnos a aceptar la hipótesis nula al aplicar el estadístico t para verificar la significación individual de los coeficientes de variables que realmente son relevantes. España. La consecuencia directa es que si X 1 y X 2 están correlacionados. b) La varianza del error  2 está correctamente estimada. INCLUSION DE VARIABLES IRRELEVANATES. donde. d) Sin embargo. y nosotros estimamos la (2. José María Labeaga y Francisco Mochón. 4. sus varianzas generalmente serán más grandes que las del verdadero modelo. Ahora supongamos que la función verdadera es la (2.2). OMISION VERSUS INCLUSION DE VARIABLES 65 A continuación se presenta un cuadro resumen en donde se presentan las posibles situaciones de sesgo de especificación. no es significativamente diferente de cero.3. Introducción a la Econometría. es la observar el comportamiento de los errores estándar de las demás variables explicativas antes y después de incluir la variable en cuestión. c) Los procedimientos usuales de intervalos de confianza y de prueba de hipótesis continúan siendo válidos.1997. los estimadores MCO generalmente serán ineficientes. Prentice Hall. DECISION REALIDAD Yi  0 1X1i  Ui Yi  0 1X1i  Ui Yi  0  1X1i  2 X 2i  Ui OMISIO VARIABL (2) DE Estimado mínim RELEVANTE:Estima (1) Mco con cuadrático insesgado y restriccione sesgado con meno varianza que en (3) INCLUSIO DE VARIABL IRRELEVANT Estimado (4) Estimado MCO insesgad con varianz insesgado y mayor que en Yi  0  1X1i  2 X 2i  Ui mínim cuadrátic 65 Martín Guillermina. Una forma de comprobar si una variable es irrelevante o no. 235 .1). es decir. Esquemáticamente las consecuencias de incluir una variable irrelevante son: a) Los estimadores MCO de los coeficientes del modelo incorrecto son todos insesgados y consistentes. la varianza de 1 será mayor a la varianza de 1 provocando una perdida en la eficiencia de los estimadores de las variables relevantes. es decir E  0    0 y.

tendremos que especular acerca de extensión de cualquier sesgo de especificación que esté presente.054) R 2  0. uno puede afirmar que la ecuación estimada es de hecho una mala especificación de la ecuación correcta para la demanda de dinero a largo plazo. Yp = logaritmo natural del ingreso permanente. y Daniel L. R = logaritmo natural de la tasa de interés.069Ypt  0. En vista de que Chow ve la ecuación estimada como una ecuación a largo plazo para la demanda de dinero.2001. Mexico. Y = logaritmo natural del ingreso actual. la extensión de la importancia del ingreso permanente es exagerada debido al error de 66 Pindyck. Sin embargo. Econometría modelos y pronósticos. Si la variable M t 1 no está disponible.Ejercicio 66Nº 34 En un estudio de la demanda de dinero a largo y a corto plazos. Robert S. Rubinfeld. En otras palabras. 236 .148) (0. (La variable Y es insignificante. esperaríamos que los coeficientes de la ecuación estimada de Chow fueran sesgados. predeciríamos que el sesgo es positivo y considerable. mientras que Yp es altamente significativa. Gregory Chow estimó la siguiente ecuación de demanda (los errores estándar están entre paréntesis y todos los datos son trimestrales): ˆ M t  0.1321Yt  0.9965 donde M = logaritmo natural de la reserva total de dinero. concluye que el ingreso permanente es más importante que el dinero actual como la restricción a largo plazo sobre bienes individuales.1365  1.139) (0.) Sin embargo. en vista de que implica un rezago de un período de una variable presente en la ecuación mal especificada. en este ejemplo particular M t 1 está disponible. Dado que se sabe que M t 1 y Ypt están altamente correlacionados y esperamos que el signo de M t 1 sea positivo cuando se ejecute la ecuación especificada en forma correcta.7476 Rt (0. Taylor y Newhouse afirman que la especificación correcta es: M t  1   2Ypt   3Yt   4 Rt   5 M t 1   t Si la ecuación anterior es correcta. Mc Graw Hill.

a parte del ˆ  ui2 se pueden ˆ estimador insesgado de la varianza de las perturbaciones  2  nk analizar los errores absolutos y relativos (porcentajes de error). Esta suposición se corrobora cuando se estima el modelo especificado en forma correcta. A continuación se completará el proceso de evaluación mediante ciertas medidas que es posible establecer. Los resultados son los siguientes: ˆ M t  0. En referencia a las medidas establecidas sobre los errores o residuos.3325 Rt  0. 5. Error medio absoluto y porcentaje de error. EVALUACION DE MODELOS En capítulos anteriores. que u  0 con lo que el error cuadrático medio S uˆ2  coincidirá con la varianza residual ˆ S uˆ2   2 2 ˆ u Dado los supuestos del modelo clásico.3274Yt  0. bien en la fase de construcción del mismo. se debe cumplir que ˆ u i  0 y por lo tanto S ˆ  u  i ˆ u n    uˆ 2 2 i n Dada la nulidad del error medio.. así como las correspondientes medias y desviaciones típicas. a) Medidas sobre los errores: error cuadrático medio.especificación. Por tanto.143) (0.5878M t 1 (0.094) (0.06158Ypt  0. mientras que el coeficiente Ypt es positivo pero es no significativo en el nivel de 5%.059) (0. o bien. la conclusión original debería revisarse para establecer que el ingreso actual es más importante que el ingreso permanente para explicar la demanda de dinero a largo plazo. se planteó que para realizar la evaluación de un modelo econométrico es necesario utilizar el coeficiente de determinación R 2  y las pruebas T y F .067) R 2  0. puede interesar conocer el error medio absoluto: 237 .9988 El coeficiente M t 1 es positivo y significativo.3067  0. durante la aplicación del modelo.

Con respecto a la representación gráfica de los errores podemos realizar el dibujo de la líneas correspondientes a los valores reales y estimados de la variable endógena. seleccionamos en el menú secundario.u  ˆ u n i o el porcentaje medio del error  ˆ ui yi n b) Representación gráfica de los errores. 238 .. Teniendo activo la salida del modelo. También se puede representar los errores sobre el eje cero de abscisas correspondiente a su valor medio nulo. El paquete Eviews nos permite obtener los dos gráficos indicados. Resids. por diferencia entre los cuales quedan representados los residuos o errores de predicción para el período muestral.

el coeficiente de determinación así obtenido no aporta ninguna información adicional.. puede definirse el modelo. c) Coeficiente de desigualdad de Theil.Para analizar la fiabilidad del modelo se toma en cuenta la mayor o menor distancia de los valores estimados y reales. Definimos ˆ U . 239 . Basándose en estos supuestos. implicaría una predicción totalmente errónea. ya que entonces el coeficiente será indeterminado. a partir de la siguiente expresión aplicada a los porcentajes de cambio respectivos. analizar la bondad de predicción. ii) Predicciones no nulas sobre valores iguales a cero. y observando el error sistemático (puntos situados principalmente en la zona de sub o sobreestimación). U 1 ˆ  yi  yi 2 n 1 1 ˆ  yi2  n yi2 n El valor del coeficiente esta comprendido entre 0 y 1. ˆ y i    y i   0 para el caso de una predicción perfecta no sólo supondrá que R 2  1 .. como el coeficiente de desigualdad entre y i e y i . A partir de los valores estimados y reales de la variable endógena. En caso de que U  0 . sino que deberá cumplirse que   0 y   1 . En caso de que U  1 . es el caso de predicción perfecta. excepto en el caso de que tanto las predicciones como los valores reales sean todos cero. Theil establece el “coeficiente de desigualdad” que nos va a permitir. Este valor puede obedecer: i) Predicciones nulas para valores reales distintas a cero. Concretamente. a fin de que coincidan punto a punto ambas series de valores. Mediante su aplicación. iii) que las predicciones equivoquen sistemáticamente el signo del cambio. implicaría que los valores de predicción coinciden con los reales.

TABLAS 240 .

718 3.782 2.385 3.423 2.533 2.333 1.845 20 0.319 1.729 2.001 0.683 1.703 1.25 0.925 2 0.717 2.310 1.753 2.169 10 2.042 2.617 120 Nota: La primera columna corresponde a los grados de libertad (n-k) La probabilidad más baja que aparece en el encabezamiento de cada columna es el área en una cola.086 2.841 3 0.638 2.296 1.821 3.833 0.930 3.120 2.688 1.467 3.303 6.779 26 0.764 3.132 2.771 27 0.421 3.05 0.679 1.787 3.214 7.893 5.397 1.297 4.886 2.819 22 0.032 5 0.684 0.646 3.Puntos porcentuales de la distribución t Pr 0.692 1.289 1.861 19 0.681 1.552 3.707 6 0.998 3.528 2.721 2.943 0.093 2.025 3.650 3.687 1.314 4.450 3.681 3.005 g de l 0.683 1.10 0.671 2. 0.689 1.688 1.727 1.440 1.579 3.686 1.479 2.173 5.697 1.776 3.069 2.110 2.306 2.314 1.457 2.310 22.20 0.706 31.345 1.708 2.05 0.785 4.683 1.852 3.691 1.501 4.695 1.002 318.700 1.383 1.711 2.012 13 0.055 12 0.313 1.796 2.02 0.658 1.316 1.315 1.232 3.812 2.396 3.01 0.355 8 0.690 1.624 2.056 2.358 2.552 2.435 3.467 2.408 3.372 1.015 2.356 1.330 1.921 16 0.567 2.341 1.706 1.318 1.311 1.965 9.01 12.740 0.307 3.323 1.021 2.746 2.074 2.179 2.747 4.363 1.920 3.327 10.328 1.485 2.701 0.078 6.143 3.353 2.500 2. la probabilidad mas alta es el área en ambas colas.025 0.686 1.337 1.250 9 0.797 24 0.539 2.365 2.604 4 0.505 3.390 2.571 3.499 7 2.518 2.860 2.160 2.160 241 .602 2.144 4.787 25 0.350 1.763 28 0.303 1.898 17 0.228 2.684 1.697 2.182 4.201 2.10 0.711 1.718 1.816 1.415 1.677 1.527 3.048 2.583 2.262 2.321 1.052 2.699 2.761 2.106 11 0.131 2.686 1.208 4.145 2.473 2.896 3.657 1 1.660 60 0.462 2.733 3.714 2.895 2.694 1.771 2.703 2.947 15 0.325 1.50 0.686 3.704 40 0.706 2.750 30 0.725 0.000 2.365 4.476 2.685 1.485 3.977 14 0.000 3.831 21 2.064 2.756 29 2.878 18 2.492 2.821 63.684 1.447 3.045 2.060 2.734 2.765 1.807 23 0.980 2.508 2.080 2.684 1.610 3.541 5.741 1.101 2.

84 7.20 2.15 9.06 6.63 2.10 1.10 0.10 34.94 18.66 2.19 11.95 10.70 1.05 0.05 0.41 5.57 8.40 2.30 99.16 15.01 0.25 0.58 6.00 1.79 6.01 1.45 5.20 2.01 0.05 0.26 4. de l.99 13.69 6.66 2.36 5.51 3.46 8.50 49.01 0.53 18.05 11.00 3.50 6.20 1.31 9.61 2.89 3.59 16.01 0.71 21.90 1.96 4.39 8.87 7.00 1.81 3.37 4.71 2.78 3.01 4.15 1. para el numerador (K-1) 2 3 4 5 7.12 10.63 2.08 4.35 8.82 57.51 3.10 0. de l para el denominador (N-K) Pr 1 0.30 1.52 5.10 0.18 1.10 0.70 3.80 2.07 4.99 8.80 225.55 3.54 7.00 1.00 2.55 1.76 9.01 0.88 3.23 9.01 1 5.02 5.34 9.30 1.24 19.14 10.25 0.63 1.31 9.50 1.37 1.29 19.20 99.28 8.20 2.27 8.39 5.81 4.60 2.28 9.10 0.50 1.07 7.69 3.25 0.00 99.20 1.70 2.85 3.25 0.42 5.50 2.29 4.61 3.78 5.42 8.90 237.70 2.30 99.00 4.12 7.72 3.62 5.59 5.05 0.39 9.19 1.64 2.05 0.40 4.89 3.05 4.58 55.20 230.36 5.25 0.89 3.65 1.01 0.10 0.62 3.26 15.83 39.32 6.12 28.90 2.54 3.16 19.70 1.11 4.85 1.10 1.92 4.43 5.06 6 8.10 58.98 6.46 5.50 200.05 0.79 3.40 1.46 1.62 3.83 3.46 5.28 8.05 6.99 1.78 3.11 4.94 27.98 58.40 99.53 9.59 12.20 53.29 5.21 8.79 13.73 3.01 0.20 99.60 216.66 3.57 3.50 98.32 11.46 9.28 29.72 2.41 12.26 1.54 10.05 0.26 8.61 16.28 5.00 9.39 16.07 4.00 3.90 161.10 0.05 0.10 0.78 5.79 3.67 3.75 1.76 3.69 4.25 0.50 2.25 0.61 2 3 4 5 6 7 8 9 242 .81 3.20 234.01 4.70 2.10 0.09 15.97 7.06 4.67 2.62 2.01 28.80 7 9.30 2.78 3.08 3.30 1.00 19.00 3.37 5.34 9.70 1.65 2.25 0.05 4.33 2.33 19.00 3.11 6.35 19.86 6.89 3.01 6.45 1.89 27.20 1.00 3.63 6.02 8.74 9.55 30.60 g.25 0.62 3.88 10.00 3.19 6.59 1.88 3.78 1.Puntos porcentuales de la distribución F g.48 6.05 0.00 1.00 2.71 2.78 3.47 1.18 4.

98 7.05 0.25 0.70 1.31 2.10 0.96 4.58 2.56 1.05 0.49 2.26 5.99 1.04 1.48 2.75 9.58 1.20 5.54 8.58 2.01 0.24 2.63 6.09 5.57 2.85 4.49 2.21 1.01 0.20 1.25 0.93 4.10 0.33 1.71 4.48 2.48 2.29 5.05 0.18 5.52 3.05 0.53 2.61 3.07 1.46 3.68 6.36 5.68 1.81 3.22 1.31 2.86 1.46 3.39 1.54 3.44 1.34 1.18 2.01 4.67 3.47 2.08 2.49 3.45 3.56 1.20 1.56 3.00 4.46 2.60 8.58 2.42 3.27 2.01 4.96 10.01 0.52 3.51 2.10 0.05 0.89 1.47 3.50 2.34 3.48 5.52 2.58 3.01 7 1.16 5.25 0.86 1.84 9.54 2.10 7.10 0.55 1.06 4.91 4.21 2.51 1.51 2.11 5.85 4.45 3.45 2.55 2.44 2.19 2.74 1.10 4.05 0.59 2.42 1.60 2.32 1.33 3.55 2.15 2.49 3.00 1.64 3.90 4.96 4.20 2.50 2.41 3.81 4.56 1.70 4.62 1.05 4.70 3.52 2.44 1.23 1.89 1.25 0.73 3.24 5.92 4.42 3.50 2.77 4.01 1.57 2.28 2.45 2.67 1.10 1.73 3.01 0.10 0.49 2.56 2.54 2.39 3.52 2.01 1 1.46 1.93 1.56 2.82 1.40 1.28 2.18 4.49 2.55 6.29 2.20 5. para el numerador (K-1) 2 3 4 5 1.74 4.55 2.51 2.05 0.09 1.14 4.43 3.49 8.62 3.32 1.60 2.25 0.45 8.46 2.13 2.61 3.36 3. de l para el denominador (N-K) Pr 10 0.51 2. de l.51 2.05 0.69 1.46 2.34 5.01 0.41 1.61 3.11 5.Puntos porcentuales de la distribución F (continuación…) g.33 5.01 0.14 1.33 3.22 2.77 1.22 5.06 1.41 5.84 11 12 13 14 15 16 17 18 243 .59 6.03 4.25 0.01 0.24 2.21 1.64 1.43 3.25 0.50 2.35 3.74 6.52 2.01 0.10 0.65 1.81 6.64 1.36 1.10 0.76 4.92 4.41 3.39 3.16 2.55 2.05 0.48 3.53 2.83 4.28 1.03 1.52 2.42 3.53 1.66 4.41 8.10 4.29 1.29 4.23 2.89 6.44 3.56 2.07 1.53 2.79 4.07 4.14 5.25 0.53 2.25 0.46 3.29 g.51 2.03 4.59 2.93 1.11 1.86 3.23 4.67 9.39 3.66 4.47 2.10 0.10 2.13 2.59 6.49 5.76 3.71 6.95 1.10 0.50 2.47 2.25 6 1.44 3.18 1.67 1.66 3.

391 1.543 0.828 0.146 1.829 1.222 1.035 2.430 1.567 1.258 1.554 0.550 1.188 1.015 1.446 1.814 1.390 14 1.650 1.363 1. n = número de observaciones 244 .697 1.502 0.161 1.837 0.759 0.767 0.720 1.886 26 1.992 1.229 1.030 0.998 1.872 0.870 1.900 0.832 2.594 1.198 1.328 0.808 35 1.283 1.615 2.090 1.735 1.676 0.462 1.577 1.584 1.419 1.812 0.420 1.268 0.445 2.239 1.658 1.287 9 0.905 1.343 1.931 1.368 2.927 1.061 1.061 2.775 0.143 1.389 0.427 1.792 1.920 24 1.177 0.879 1.295 1.546 1.658 1.020 1.699 0.650 1.933 1.144 1.585 1.046 1.816 0.958 1.283 0.559 1.352 1.333 1.654 1.819 33 1.168 1.538 1.496 1.077 1.822 Nota: K = númerode variables explicatorias (Nº de X).190 1.928 0.656 1.010 1.629 1.053 1.700 1.287 1.506 13 1.615 1.650 1.664 0.514 1.421 1.071 1.543 1.402 1.658 1.128 0.106 1.964 22 1.884 1.525 1.722 1.877 1.868 0.848 0.429 1.651 1.354 1.944 1.822 11 0.361 0.320 0.551 0.206 2.998 1.833 31 1.273 1.909 1.201 1.935 0.084 1.012 1.050 1.650 1.341 1.795 38 1.804 0.927 1.739 1.897 1.296 15 1.074 1.175 1.574 1.813 34 1.291 3.414 0.975 0.743 1.230 1.041 1.566 1.109 1.193 1.812 1.779 1.475 1.825 32 1.664 2.580 1.692 0.660 0.724 1.732 1.350 0.321 1.971 1.645 12 0.597 1.570 1.004 1.897 0.224 1.562 0.674 1.101 1.383 1.655 1.147 1.104 1.777 0.789 40 1.028 1.726 1.974 1.208 1.785 0.467 1.685 1.203 0.285 1.896 8 0.181 1.206 1.316 2.728 0.721 1.595 1.023 20 1.307 1.378 1.563 1.632 2.902 25 1.734 1.435 1.143 1.094 0.401 1.859 1.373 1.508 1.857 1.769 0.710 0.Estadístico d de Durbin-Watson:puntos de significancia de dl y du al nivel de significancia del 5% K=1 K=2 K=3 K=4 K=5 n dl du dl du dl du dl du dl du 6 0.864 0.114 1.579 0.218 1.792 39 1.692 2.728 1.560 1.244 1.803 36 1.572 2.376 2.297 1.489 1.131 1.776 50 1.649 0.469 1.328 1.124 1.288 1.750 0.331 0.005 2.338 1.382 1.455 2.133 1.653 1.779 0.437 1.364 1.861 1.652 1.925 0.162 2.238 1.525 2.654 1.747 1.240 1.951 0.175 1.393 1.302 1.786 45 1.715 1.472 2.273 1.656 1.316 1.160 1.125 1.214 1.861 28 1.016 0.104 18 1.204 1.270 1.986 1.603 0.651 1.411 1.371 0.920 1.158 1.652 1.512 2.400 7 0.610 1.160 1.332 0.284 1.271 1.503 1.335 1.318 2.388 2.940 23 1.535 1.318 1.505 2.127 1.835 1.381 1.820 1.669 0.590 1.060 19 1.600 1.340 0.356 0.097 1.753 1.062 1.696 0.723 1.958 1.411 1.257 2.953 1.383 1.255 1.544 1.539 0.162 1.328 1.841 30 1.442 1.535 0.261 1.732 0.873 27 1.556 1.900 1.100 1.562 2.946 1.243 2.157 17 1.045 1.220 16 1.447 0.530 1.536 0.454 1.850 29 1.373 1.536 0.540 1.730 1.379 2.666 1.721 1.257 1.771 dl K=6 du 0.854 1.553 1.824 1.177 1.650 1.309 1.587 1.722 1.391 1.476 1.767 1.124 2.296 2.925 1.864 1.752 2.891 1.799 37 1.588 10 0.537 0.324 0.574 2.604 0.979 1.483 1.090 2.336 1.444 2.026 1.863 1.628 1.894 1.659 1.895 1.977 0.710 2.180 1.797 0.982 1.123 1.221 1.249 1.080 1.461 1.502 1.519 1.991 21 1.541 1.013 1.320 0.078 1.763 1.685 0.859 1.967 1.641 0.038 1.236 1.

487 1.801 1.801 1.662 1.600 1.471 1.612 1.801 1.772 85 1.679 1.774 1.778 100 1.721 1.560 1.652 1.651 1.Estadístico d de Durbin-Watson:puntos de significancia de dl y du continuación K=1 K=2 K=3 K=4 K=5 n dl du dl du dl du dl du dl du 55 1.550 1.535 1.571 1.696 1.817 1. n = número de observaciones 245 .727 1.671 1.739 1.525 1.802 1.751 1.583 1.503 1.592 1.525 1.770 80 1.688 1.554 1.694 1.567 1.629 1.758 1.334 1.720 1.747 1.748 1.810 1.433 1.735 1.774 90 1.575 1.444 1.802 1.696 1.715 1.654 1.703 1.586 1.736 1.408 1.799 1.458 1.550 1.726 1.514 1.693 1.808 1.778 1.464 1.480 1.549 1.602 1.709 1.372 1.528 1.820 K=6 dl du 1.767 65 1.652 1.665 1.494 1.662 1.557 1.776 95 1.414 1.542 1.681 1.724 1.672 1.536 1.601 1.404 1.758 1.635 1.689 1.515 1.543 1.743 1.534 1.589 1.641 1.680 1.768 60 1.634 1.715 1.746 1.571 1.706 1.760 1.613 1.579 1.518 1.452 1.687 1.767 70 1.566 1.598 1.718 1.500 1.788 1.831 Nota: K = númerode variables explicatorias (Nº de X).755 1.616 1.679 1.709 1.480 1.490 1.803 1.780 150 1.624 1.789 1.731 1.438 1.801 1.374 1.641 1.703 1.611 1.507 1.707 1.645 1.805 1.623 1.814 1.768 75 1.738 1.802 200 1.728 1.732 1.

Cheltenham. JOSE DE LA CRUZ GALLEGOS Y LUIS ALEJANDRO LAGUNES TOLEDO. Publishers ltd.U. UK. 2000. Springer Verlag New York Inc. 2002 CARRASCAL A. CHARENZA. Y BEATRIZ RODRÍGUEZ P. ALPHA C. 1993 BALTAGI.1993. Tercera Edición.A. Harvard University press. Ejercicios de Econometría. Barcelona. ARTHUR S.BIBLIOGRAFIA ARMENTA FRAIRE. Cambridge. DAVIDSON. Estimation and Inference in Econometrics. Ediciones Pirámide. Vol. McGraw-Hill. Edward Elgar Publishing Limited. New Directions in Econometric Practice. Oxford University Press. CHIANG. OXFORD University Press. JAMES. 2005. Editorial Trillas. RUSSELL Y JAMES G. MONTSERRAT Y MARÍA DEL MAR LLORENTE MARRÓN. 2000 DÍAZ FERNÁNDEZ. Análisis Econométrico con Eviews.A. BROOKS. PHOEBUS J. Modelo de análisis y Prospectiva Económica Aplicada MAPEA. MACKINNON. CARLOS A. GOLDBERGER. 2001 AZNAR. Second Edition. Serie Shaum. MARTA REGULEZ. FAVERO. Cambridge University Press. Madrid 1998. USA. Métodos de Predicción en Economía. CHRIS. 1993 DAVISON. RA – MA Editorial. Métodos Fundamentales de Economía Matemática. Third Edition. Introductory Econometric for Finance. Springer-Verlag. URSICINO. Germany. Madrid. 1. Applied Macroeconometrics. Mathematics for Econometrics. Masachusettts. S. España. Editorial Ariel S. 1998. Un Instrumento de Simulación y Pronostico Econométrico para los Tomadores de Decisiones. 1997. McGraw Hill/Inter5americana de España. United Kingdom. PAZ MORAL Y VICTORIA ESTEBAN. WOJCIECH AND DEREK F. 2001 FERNANDEZ ANA. Econometría. DAVID H. YOLANDA GONZÁLEZ G. Great Britain. 2001. LETICIA. 1991 - - - - - - - - - - - 246 . Econometrics. Mexico. Econometric Theory. DHRYMES. ANTONIO Y FRANCISCO JAVIER TRIVEZ. DEADMAN. A Course in Econometrics. PILAR GONZALEZ. New York. México.

Estadística para Administradores. KLEIMAN.1985. DAMODAR N.S.A. Graw Hill. ARIEL Y ELENA K. Modelos Econométricos. MADDALA G. España. Ejercicios de Econometría. Introductory Econometrics. Prentice Hall. Graw Hill. Prentice Hall. McGraw Hill Internacional Editions. Econometrics. 2000. GUJARATI. Masachusettts. Cambridge. México. OATES. DAVID F. España. Sexta edición. Y DAVID S. Matrices. - 247 . JACK Y JOHN DINARDO. Econometric Methods. México. New Cork. México. Madrid. 1995. Y WALLACE E. de Econometría. DE KLEIMAN. 1998 GREENE. Pricenton University Press. Tercera edición. VICENS - - - - - - - - - - - LEVIN. 1980.A. 2004. JAN. JOHNTON. Fondo de Cultura Económica. FUMIO. GUJARATI. Singapore. Mexico. 2000 INTRILIGATOR MICHAEL D. Análisis Econométrico. Introducción a la Econometría. KMENTA.1989. Segunda edici HYASHI.- GOLDBERGER. WILLIAM H. HERNÁNDEZ ALONSO.1990. 1997. 2006. JOSÉ MARÍA LABEAGA Y FRANCISCO MOCHÓN. Elementos universidad. KENNEDY. España. Introducción a la Econometría.1999. JOSE. Técnicas y Aplicaciones. Harvard University press. Editorial LIMUSA S. Aplicaciones Matemáticas en Economía y Administración. PETER. Tercera edición. USA. México. Segunda Edición. cuarta edición. Prentice Hall.1996. HARRY H. MARTÍN. RUBIN. Econometría. Harla S. Dynamic Econometrics. ARTHUR S. Introducción a la econometría. GUILLERMINA. HENDRY. Economics Series. RICHARD I.1997. Fondo de Cultura Económica. DAMODAR N. Mc. 1997 KELEJIAN. Principios de Econometría. tercera edición. Econometría. Mc. Oxford University Press. España. Fourth Edition. Mc Graw Hill. México.

MARÍA ESTHER GALINDO F. ANTONIO Y ANA MARÍA LÓPEZ. Métodos Econométricos. Modelos Econométricos de Elección Discreta. Caracas. 248 - - - - - - - - - - - . modelos y pronóstico.1999. Econometrics. 1993 PINDIYCK.A. Graw Hill. TEODOSIO..México.A.C. Cien Ejercicios de Econometría. Editorial Debate S. Mc Graw Hill. - - ORTUZAR S. LUIS Y JOSÉ NIÑO DÍAZ. ARMANDO: Iniciación a la Estadística. FRANCISCO JAVIER. Y DANIEL L. SOTO NEGRIN.1982. JUAN DE DIOS. JULIO A. Madrid. Serie Schaum. Ediciones Pirámide S. Ediciones Universidad Católica de Chile. Fondo Editorial Tropykos y Comisión de Estudios de Postgrados. ESTAVILLO DORADO. Graw Hill.. México. Predicción y Simulación Aplicada a la Economía de Empresas. U. Facultad de Ciencias Económicas y Sociales. Chile. México.. RUBENFELD. MARÍA JOSÉ LECETA REY Y MARÍA DEL MAR ZAMORA SANZ. Segunda edición.A Madrid. editor. 1985. el caso mexicano. Fondo de Cultura Económica S. Madrid. Caracas. MICAHAEL. SZENERG. Ediciones Pirámide. SANCHEZ GONZÁLEZ. España. CARLOS.1993. 1976. 1996. Introducción a la Econometría. Revisión de los Métodos Cuantitativos en la Economía. SCHMIDT. Santiago. PULIDO. Ejercicios de Econometría Empresarial. Madrid. Mc. Mc.V. Ariel Economía. Marcel Dekker.1990 SALVATORE. SALAS. 1992. Graw Hill. 2000 PENA TRAPERO. Ediciones Pirámide S. ROBERT S. PETER. UCV. Econometría aplicada a los países en Desarrollo. JAVIER. Aspectos Teóricos del Algebra Matricial con Aplicaciones Estadísticas.- MATA MOLLEJAS. Grandes Economistas de Hoy. Editorial José Martí. ALFONSO. DOMINICK. MAURA Y GUILLERMO RAMÍREZ.A. Econometría. Madrid. INC. VÁSQUEZ. USA. PÉREZ AMARAL. Econometría. PABLO AMORÓS GONZÁLEZ Y SILVIA RELLOSO PEREDA. Mc. J. Caracas. España 1999. Econometría. BERNARDO. 2000 NOVALES. 1999. 2001. TRIVEZ BIELSA..

The MIT Press. Massachusetts. Corporación de Investigaciones Económicas para América Latina (CIEPLAN). Introducción a la Econometría. 1991. WOOLDIGDE.Thomson Learning. Cambridge. “Especificación y Evaluación de Modelos Econométricos”. México. - - 249 . Santiago de Chile.- VIAL. Econometric Análisis of Cross Section and Panel Data. 2001. WOOLDIGDE. Serie Docente Nº 3. JEFFREY M. JEFFREY M. JOAQUIN. 2001.