You are on page 1of 91

ANALISIS ECONOMETRICO CON

E-VIEWS 7.0

JOS LUIS NOLAZCO1

Bachiller en Economa de la UNALM, cualquier consulta: jlnc09@gmail.com.

Curso: Econometra I

Jos Luis Nolazco

CAPITULO 1
INTRODUCCION AL MANEJO DE E-VIEWS 7.0
1.1 Nociones de Econometra y el Programa E-Views
El programa E-Views es la versin en entorno MS-Windows del antiguo Micro - TSP
(Time Series Analysis) desarrollado por primera vez en 1981. Es uno de los ms utilizados
dentro del campo de la econometra y su manejo permite la estimacin, resolucin y uso de
modelos economtricos de distinta naturaleza mediante la utilizacin de una amplia gama
de procedimientos.
Su puesta al da" en relacin con los ltimos avances de la econometra aplicada es notable
y, para los que conocen cada una de las tcnicas, su utilizacin es extremadamente intuitiva.
Esta adecuacin a la prctica profesional de la econometra se debe sin duda a sus autores
que, desde las primeras versiones del TSP disearon el programa de cara a su utilizacin
real adaptndolo a sus propias necesidades del da a da.
Aunque el programa fue desarrollado por economistas y la mayor parte de sus usos se
realizan en el campo de la economa no hay nada en su diseo que limite su utilidad a las
series temporales econmicas.

1.2 Inicio y Creacin de un Espacio de Trabajo

Para comenzar a trabajar con el programa E-views, bastara con acceder a icono
correspondiente de nuestro escritorio, y activar la aplicacin seleccionada, presentndonos
una pantalla como la que presentamos en la figura 1, que esta divida en cuatro grandes
partes, marcadas respectivamente del 1 al 4, con los siguientes contenidos.

Curso: Econometra I

Jos Luis Nolazco

Parte 1

Parte 2

Parte
3

Parte 4

Figura 1

Parte 1. Men bsico de herramientas generales

En esta primera parte podemos acceder a los diferentes mens desplegables, habituales en
las aplicaciones de tipo Windows, donde se puede ejecutar los comandos genricos de
fichero (File), edicin (Edit), manejo de objetos (Object), Vista (View), desarrollo de
procedimientos (Procs), accesos rpidos a operaciones bsicas (Quick), opciones generales
del programa (Options), gestin de ventanas (Window) y ayuda en lnea (Help), y cuyas
funciones son las siguientes:

File Menu: controla operaciones relacionadas con los ficheros, datos y programas
Edit Menu: contiene los tems bsicos de cualquier programa en entorno Windows
Objects Menu: manipula los distintos objetos que se almacenan en un workfile.
Proc and View Menu: estos dos mens se utilizan de forma diferente que el resto
ya que se refieren siempre a la ventana activa en cada caso y por tanto diferirn
segn el tipo de ventana en uso.
Quick Menu: da acceso directo a comandos que se utilizan con cierta frecuente
Options Menu: altera los parmetros de funcionamiento general del E-Views. Los
cambios que se realicen con este men permanecen an saliendo del programa.
Windows Menu: da acceso directo a las distintas ventanas que tengamos abiertas
en el rea de trabajo.
Help Menu: men de ayuda clsico.

Vamos ahora a entrar con ms detalle en las opciones bsicas de aquellas entradas
principales de mayor inters excepto en los casos de procs y views ya que estas cambian

Curso: Econometra I

Jos Luis Nolazco

segn la ventana activa. No se trata de describir con detalle cada una de las opciones sino
tan slo de anticipar alguno de los tems de cada uno de ellos.
MENU FILE
ENTRADA
New
Open
Save
Save as
Close

Import

Export

Print
Print Setup
Exit

ACCION
Crea nuevos workfiles, ficheros de programa y ficheros de texto.
Abre un men por el que se accede a los workfiles, programas o ficheros
de texto previamente creados.
Salva el workfile, programa o fichero de texto activo, si no se ha grabado
nunca preguntara el nombre a utilizar.
Salva el workfile, programa o fichero de texto preguntando el nombre
Cierra la ventana activa. Si la ventana activa es un workfile, un programa o
un fichero de texto este se cerrara, es decir, ser borrado de la memoria
RAM. Previamente se nos preguntara si deseamos guardar los ltimos
cambios.
Lee datos de un fichero externo. Los ficheros legibles son de los
siguientes tipos: Banco de datos de E-Views, DRI Basic Economic
database, texto, Lotus y Excel. Cuando se importan datos de estos
formatos se abrir un men adicional en el que se nos preguntara el
formato de los mismos.
Escribe datos desde un fichero de trabajo al formato de Banco de datos
E-Views, texto, Lotus y Excel. En el formato de Banco de datos puede
almacenarse cualquier tipo de objeto (en ficheros separados) pero en
ficheros de texto o de hoja de clculo solo pueden almacenarse series de
datos. Se abrirn en todos los casos mens adicionales para especificar el
formato.
Imprime el contenido de la ventana activa. Si no hay ventana activada
imprime el rea de comandos.
Controla las opciones de impresin. El men que se abre permite, entre
otras cosas, especificar si la impresin ser enviada a la impresora o a un
fichero de disco.
Cierra todas las ventanas y sale del programa preguntando si deben
grabarse los cambios realizados.
MEN EDIT

ENTRADA
Undo
Cut
Copy
Paste
Delete
Find
Replace
Next
Insert text file

ACCION
Deshace el efecto de la operacin de edicin ms reciente.
Borra la seleccin y la coloca en el Clipboard de Windows.
Copia la seleccin en el Clipboard de Windows.
Coloca el material residente en el Clipboard de Windows en la zona
seleccionada.
Borra la seleccin.
Encuentra una cadena de caracteres en un texto.
Reemplaza determinadas cadenas de caracteres en un texto.
Ejecuta la siguiente operacin de bsqueda segn la condicin de
bsqueda previa.
Sirve para insertar un documento de texto de tu computadora.

Curso: Econometra I

Jos Luis Nolazco

MENU OBJECTS
ENTRADA
New Object
Fetch
Store
Store As
Name
Copy
Freeze

Print
View Options

ACCION
Crea un nuevo objeto del que se nos preguntara el tipo y el nombre.
Es la operacin contraria a Store y de efecto similar a Import del men
File. Su utilidad es grabar un objeto en formato Base de Datos E-Views
(*.db*) en un disco.
Es la operacin contraria a Fetcht y de efecto similar a Export del men
File. Su utilidad es grabar un objeto en formato Base de Datos E-Views
(*.db*) en un disco.
De efecto idntico a Store permite guardar objetos en formato .db
pero permitiendo especificar el nombre y el lugar de almacenamiento.
Permite dar nombre a un objeto nuevo o ya creado cuando este se
encuentra activo.
Realiza una copia de un determinado objeto cuando este se encuentra
activado o simplemente resaltado. Nos preguntara el nombre del nuevo
objeto.
Congela la vista activa del objeto seleccionado creando un nuevo
objeto. Si el objeto congelado es un grafico de una serie, el grafico se
almacenara como un objeto nuevo que podr ser modificado poniendo
textos, sombras. Para cualquier otro objeto el resultado ser una tabla
que tambin puede ser editada.
Imprime la vista activa del objeto que estemos visualizando.
Activa o desactiva ciertas propiedades de la vista del objeto activo. No
cambia el tipo de vista sino algunas de sus caractersticas. Este men
cambia segn el men de vista activo. Sus opciones son ms accesibles
desde la barra de iconos que aparece en la parte superior de la ventana
de una vista.

MENU QUICK
ENTRADA
Sample
Generate Series
Show
Graph

Empty Group
Series Statistics

ACCION
Altera la muestra de datos que se consideraran para los tratamientos
posteriores a esta orden.
Permite especificar una ecuacin para generar una serie nueva a
partir de otras almacenadas en el fichero de trabajo adems del
periodo (muestra) para el que se generaran datos de esa nueva serie.
Activa la ventana del objeto seleccionado. La principal utilidad de
esta orden no es abrir la ventana de un objeto sino abrir, en una
ventana nica, varios grficos o series.
Permite crear un grafico de la serie seleccionada o de un grupo de
series. Una vez seleccionadas las series puede especificarse el tipo de
grafico que se desea y mltiples opciones que modifican su aspecto
final.
Crea un grupo de series vaco. Una vez creado pueden teclearse en
la barra de edicin de ese grupo las series que se desean en ese
grupo o los valores concretos para cada una de ellas.
Calcula diversos estadsticos que se ofrecen en un men para una o
varias series seleccionadas.

Curso: Econometra I

Group Statistics

Estimate Equation
Estimate VAR

Jos Luis Nolazco

Calcula estadsticos para un grupo de variables previamente creado.


Al aplicarse a un grupo aparecern ciertos estadsticos como las
correlaciones, correlogramas, etc., que solo tienen sentido cuando
quieren analizarse de forma cruzada las variables de un grupo.
Estima una nueva ecuacin que el usuario deber especificar y la
almacena como un objeto nuevo.
Estima un modelo VAR que debemos especificar.

Parte 2. Zona de recepcin o lnea de comandos

En esta segunda rea, que habitualmente ocupara muy poco espacio, se podrn introducir y
ejecutar de forma manual todos los comandos habilitados en E-views, de forma tal que un
usuario avanzado podr ejecutar las opciones que desee sin necesidad de ir seleccionando
secuencialmente las opciones ofrecidas en las diferentes ventanas de acceso.

Parte 3. Zona de presentacin de contenidos y resultados.

En esta zona, que ocupara habitualmente la mayor parte de la pantalla, es donde se


presentaran los contenidos de los distintos ficheros de trabajos activos, as como los
resultados de las diferentes acciones realizadas sobre los mismos. En este sentido, podrn
aparecer varias ventanas desarrolladas, con todos sus contenidos, con pequeos contenidos
que debern ser maximizados para consultar su contenido.

Parte 4. Barra de presentacin del estado de la aplicacin

Finalmente, este ltimo rea nos informa sobre el estado actual de la aplicacin activa,
detallando la accin que se est ejecutando en ese momento (mensaje de bienvenida en la
imagen adjunta), el directorio activo en ese momento (Path), la base de datos activa, si la
hubiera (DB), y el archivo de trabajo (Workfile).

Ahora para crear un archivo de Trabajo se tiene que cargar en primer lugar el E-views que
aparece en la ventana principal, posteriormente para generar un archivo de trabajo se
realizan los siguientes pasos:
Seleccionar la opcin File situada en la parte posterior de la pantalla, luego New y se sita
sobre la opcin Workfile

Curso: Econometra I

Jos Luis Nolazco

Luego de seleccionar estos pasos, aparecer una nueva ventana en el que se debe especificar
sobre la periodicidad o frecuencia de los datos con los que se va a trabajar.
Luego en Start date y End date debe especificar el rango entre la fecha de inicio y la fecha
de trmino de trabajo respectivamente.

Curso: Econometra I

Jos Luis Nolazco

Ahora tenemos que orientarle a E-views el tipo de serie que se ingresara al sistema. En
Frecuency se muestran los posibles formatos a ingresar:
Por ejemplo:
Tipo o frecuencia

Start date

End date

Multi anual
(Multi-year)

1898

1996

Series anuales
(annual)

1952

2010

Semi anual
(Semi-anual)

1952

2010

Series trimestrales
(quarterly)

1952:3

2010:4

Series mensuales
(monthly)

1952:01

2009:12

Series bimensuales
(bimonthly)

1952:01

2009:12

Serie quincenal
(Fortnight)

1898:01

1899:01

Series trimensuales
(Ten-day Trimonthly)

1898:01

1899:01

1/01/1952

12/12/2009

Series semanales
(weekly)
Series diarias

Curso: Econometra I
(Daily 5 day week)
(Daily 7 day week)

Jos Luis Nolazco


1/01/1999

1/20/1999

(Intraday)

1/01/1999

1/01/1999

Das enteros

10

(Daily custom week)

(Integer date)

Donde:
Multianual: 1898-1906, en este caso se selecciono para dos aos, por lo tanto el
programa solo encontrar en ese periodo 5 observaciones (1898, 1900, 1902,1904
,1906).
Anual: 1952-2010, en este caso el programa encontrara 59 observaciones.
Semi anual: 1952-2010, en este caso el programa encuentra 2 observaciones (2
semestres por cada ao), por lo que encontrara 118 observaciones.
Trimestral: 1952:3 - 2010:4, comienza desde el tercer trimestre de 1952 y acaba el
cuarto y ltimo trimestre del 2010, encontrando 234 observaciones.
Mensual: 1952:01 2009:12, significa de enero de 1952 hasta diciembre del 2009,
encuentra 696 observaciones.
Bimensual: 1952:01 2009:12, igual que el tem anterior solo que cada mes se divide
en dos partes iguales, encontrando 1380 observaciones.
Quincenal: 1898:01 1899:01, cada mes equivale a dos quincenas, por tanto
encuentra 27 observaciones.
Trimensuales: 1898:01 1899:01, significa que cada mes se divide en tres partes
iguales, encontrando 37 observaciones.
Semanales: 1/01/1952 - 12/11/2009, hace un conteo de todas las semanas desde el
mes de enero de 1952 hasta el mes de diciembre del 2009.
Diaria: 1/01/1999 - 1/20/1999, para el primer caso (5 day week) considera solo los 5
primeros das como hbiles (Lunes a Viernes), para el segundo caso ( 7 day week)
considera los 7 das como hbiles (Lunes a Domingo), y por ultimo (custom week)
considera los das que usted asigne como das hbiles.
Intraday: 1/01/1999 - 1/01/1999, para este caso se identifica en cada cuanto tiempo
en horas, minutos o segundos se haga el conteo para una fecha determinada dado
los das hbiles segn usted lo determine. Para nuestro ejemplo se especificara 30
minutos para todo el da de 1/01/1999, encontrado as 48 observaciones.
Das enteros: 5-10, hace un conteo simple de los das que usted determine, en
nuestro ejemplo encuentra 6 observaciones.

Curso: Econometra I

Jos Luis Nolazco

Como hemos visto el tipo y la frecuencia de los datos pueden ser multi anual, anuales, semi
anuales, trimestrales, mensuales, bimensuales, quincenales, trimensuales, semanales, diarios
o sin fecha (corte transversal)2.
Si los datos son de frecuencia anual y de rango entre 1978 y 2010 se crea el archivo
workfile:

El E-views crea por default dos objetos c (antecedido de un cono-alfa) y resid (antecedido
del cono relacionado a las series de datos). En el objeto c (alfa) almacenar los valores
estimados para los parmetros de los modelos corridos y el objeto resid almacenar los
valores residuales de la ltima regresin corrida.
Range: 1978 2010 significa que toda la informacin empieza el ao 1978 y termina el ao
2010.
Sample: 1978 2010 significa que la muestra activa va de 1978 a 2010. El sample puede ser
modificado por ejemplo de 1978 a 1990 u otra combinacin dentro del Range, para ello
tiene tres alternativas:
1. Elija la opcin Sample de la barra de herramientas de la ventana workfile. Sobre la
ventana Sample escriba el nuevo rango muestral, por ejemplo: 78 90.

Para este tipo de datos nos situamos en Workfile structure type, desplazamos y escogemos
Unstructured/Undated. En este caso en Observations solo ingresamos el nmero de datos disponibles. La otra
estructura del workfile es para paneles de datos balanceados (Balanced panel).

10

Curso: Econometra I

Jos Luis Nolazco

2. De doble click en el workfile sobre Sample: 1978 1999. Aparecer la ventana Sample
y cambie el rango muestral, por ejemplo 78 90.
3. Escriba sobre la lnea de comando en la ventana principal del E-views: smpl 78 90.

1.3 Creacin de una base de datos en el archivo de trabajo (Workfile)


Supongamos que se crea un workfile con 6 observaciones, del 1 al 6. Este se genera
mediante:
File/New/Workfile
/Workfile structure type/Unstructured-Undated
/Data range/ 6 / OK
Seguidamente en la lnea de comandos de la ventana principal del E-views escriba:
Data y x1 x2 (Enter)
Este ultimo procedimiento crea un grupo de tres variables (y, x1, x2) en la cual cada una
tiene 6 observaciones.
Aparece una nueva ventana tipo hoja de clculo (spreadsheet) para completar datos. Para
guardar los datos digitados utilice la opcin Edit +/- de la barra de herramientas de esta
ventana. Adems puedes poner un nombre al grupo de datos utilizando la opcin Name.

11

Curso: Econometra I

Jos Luis Nolazco

Alternativamente, se puede crear una nueva serie eligiendo la opcin en el men de


herramientas generales:
Object / New object / Series.
Al igual que antes, llene los datos y cierre la serie con la opcin Edit+/-.

1.4 Importacin de datos desde un archivo de texto o Excel


Vamos a usar el archivo data1_anual.xls el cual muestra las variables PBIREAL,
CONSUMO e INVERSION para el periodo 1980-2008. Ahora para importar un archivo
de Excel a E-views procedemos a realizar los siguientes pasos:
Primero creamos el workfile con frecuencia anual:
Workfile structure type: Date regular frequency y Frequency: Annual
Start date: 1980 y End date: 2008 / OK
Desde el men bsico de herramientas generales marque las opciones:
File / Import / Read, luego ubiquen el archivo de Excel y seleccionen.
Aparecer una ventana llamada Excel Spreadsheet Import como se muestra a
continuacin.

12

Curso: Econometra I

En este lugar se digita los


nombres de cada serie a utilizar
en el E-views. Tener cuidado en
el orden a al digitar.

Jos Luis Nolazco

Significa que el E-views


comenzar a contar los valores
a partir de la celda B2 en
adelante.

En este lugar se digita el


nombre de la pestaa del
archivo de Excel a
importar

Otra es escribir en la lnea de comandos Open donde debe elegir el archivo donde estn
los datos y el tipo de archivo a elegir. Luego de escoger el archivo marque la opcin abrir.
Se ingresa a una nueva ventana donde debe completarse informacin adicional mostrado
en el cuadro de arriba, tambin debemos tener en cuenta si los datos estn en filas o
columnas (Data order) y del sample donde se va a insertar los datos. Esta debe ser
coherente con el sample del workfile creado inicialmente.

13

Curso: Econometra I

Jos Luis Nolazco

Como ejercicio, utilice el archivo data1_trimestral donde se tiene datos del primer
trimestre de 1980 al primer trimestre del 2009, el cual se usarn tres variables: PBIREAL,
CONSUMO y INVERSION. Tener en cuenta que los datos empiezan en el casillero B2 y
los nombres de las variables estn en la primera fila.
Utilizando el workfile creado anteriormente,
mediante la siguiente opcin:

procedemos a guardar dicho archivo

Save (enter) en la lnea de comandos o File / Save (o Save as) del men bsico de
herramientas generales, luego agregue un nombre, por ejemplo prime_workfile. En el
directorio de trabajo o en lugar donde usted decida guardar el archivo, este aparecer con
extensin wf1, es decir primer_workfile.wf1.
Para ver los datos que contiene el workfile creado, se tiene varias alternativas:

Escribir show PBIREAL CONSUMO INVERSION en la lnea de comandos o


seleccionar las series que se requiere ver en el workfile con ctrl/doble click/Open
Group, tambin se puede usar en el men bsico de herramientas generales Quick/
Show/ PBIREAL CONSUMO INVERSION/OK.
Aparecer una nueva ventana del tipo Group incluyendo la lista de variables marcadas.

14

Curso: Econometra I

Jos Luis Nolazco

Luego de mostrar en grupo las tres variables a estudiar, E-views muestra otras alternativas
para ver los datos, el cual la mayora de ellas estn asociadas a las siguientes opciones en el
workfile:
View / Graph / Options Pages, Graph Type, Details
View / Descriptive Stats / Individual Sample o Common Sample
View / Covariance Analysis/ Correlation
Ahora utilizando el grupo de series como ventana activa, puede copiar dichas series
eligiendo siguiendo los siguientes pasos:
Utilizar la opcin Freeze. Aparecer una nueva ventana con los datos de las variables
mostradas, esta ventana puede ser grabada en el workfile al dar click en Name y guardarlo
con el nombre que usted crea conveniente.
Elegir la opcin Edit +/- en la barra de herramientas del E-Views para cambiar los valores
de las series si es necesario.
Seleccionar todo los valores del grupo de series y dar click derecho/copy e ir al
documento MS Word y pegar el objeto copiado utilizando la pegar.

1.5 Creacin de series

Para crear series en base a las variables existentes (PBIREAL, CONSUMO, INVERSION)
se puede elegir la opcin Genr en la barra de herramientas del workfile creado. Aqu
aparecer una nueva ventana por la ecuacin que transforma las series existentes en la
nueva serie que usted desea crear.
Aqu se crea el logaritmo
de la variable consumo.

Tener en consideracin
el periodo muestral
que es esta eligiendo.

15

Curso: Econometra I

Jos Luis Nolazco

En este caso se cre: lgconsumo=log(consumo)


Otra opcin es escribir en la lnea de comandos del E-views el comando Genr seguido por
la ecuacin que usted desee crear, as por ejemplo:
Genr lgconsumo=log(consumo),como se mostro anteriormente, se genera una variable
que es el logaritmo del consumo.
Genr pbireal2=pbireal^2 , en E-views esto equivale al cuadro de la dicha variable
seleccionada.
Genr lgconinv=log(consumo)+log(inversion)
Genr trend=@trend(1980), este crea una variable de tendencia con 0 en 1980, 1 en 1981 y
as sucesivamente hasta el ao 2008.
Genr invrezagada=inversion(-1), aqu se crea una variable en base al rezago de un ao
(por eso el valor de 1) de la variable inversin.
Otra alternativa, es elegir la opcin Object / Generate Series de la barra de herramientas
del Workfile.

1.6 Estadsticos para la interpretacin y tabulacin de datos de una


serie
Antes de realizar cualquier anlisis economtrico que pretenda vincular un conjunto de
variables observadas, es conveniente analizar por separado cada una de las series
involucradas. En esta parte se revisarn las principales herramientas que permiten realizar
un anlisis estadstico elemental de las series de datos en E-Views.
Al abrir un objeto tipo serie (con doble clic sobre la serie correspondiente o utilizando el
botn derecho del mouse y seleccionando Open), la presentacin por defecto ser la de
hoja de datos (SpreadSheet). Es conveniente comenzar un anlisis univariado examinando
la forma que adopta el grfico lineal de una serie de datos. En caso de tratarse de una serie
de tiempo (como en nuestro ejemplo, que va desde el ao 1980 hasta el ao 2008 en
intervalos anuales), el grafico mostrara la evolucin temporal de los datos.
En cambio, si lo que se tiene son datos de corte transversal (como los que se obtendran al
analizar la respuesta a una misma pregunta aplicada a un grupo de 100 personas), el grfico
mostrado no necesariamente tendr valor analtico inmediato (salvo para apreciar el nivel
medio y dispersin aproximada de las respuestas dadas por distintas personas). Al tratarse
de un anlisis de corte transversal, tendr sentido ordenar primero las observaciones de
acuerdo con un criterio til (por ejemplo, colocar a la izquierda a los hombres y a la
derecha a las mujeres), de modo que se evidencien comportamientos diferenciados.
Regresaremos a esto ms adelante.

16

Curso: Econometra I

Jos Luis Nolazco

PBIREAL

INVERSION

200
180

CONSUMO

50,000

140,000

40,000

120,000

30,000

100,000

20,000

80,000

10,000

60,000

160
140
120
100
80
1980

1985

1990

1995

2000

2005

0
1980

1985

1990

1995

2000

2005

40,000
1980

1985

1990

1995

2000

2005

Luego de un primer acercamiento visual a las caractersticas de una serie de datos, el


siguiente paso formal consiste en la revisin de los indicadores estadsticos elementales.
Como veremos posteriormente, el valor de algunos de estos ndices determina el
cumplimiento de los requisitos para un anlisis de regresin.
La tercera opcin que ofrece el botn View permite acceder a un conjunto de estadsticas
descriptivas que a continuacin se detallan.

17

Curso: Econometra I

Jos Luis Nolazco

La primera pantalla de resultados se denomina Histogram and Stats. Seguidamente se


muestra el resultado de esta pantalla para una serie de datos que hemos estado trabajando
llamada CONSUMO. Tambin se puede escribir en la lnea de comandos show
consumo.his, en ambos casos dar el siguiente resultado.

10

Series: CONSUMO
Sample 1980 2008
Observations 29

Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis

79896.72
78223.23
129097.1
59999.71
18539.24
0.958550
3.249980

Jarque-Bera
Probability

4.516462
0.104535

0
60000

70000

80000

90000

100000

110000

120000

130000

Otras opciones para aplicar en la lnea de comandos para la serie CONSUMO, se


mencionan a continuacin:
Show consumo.bar, aqu se muestra el grfico de barras para la serie CONSUMO.
Show consumo.hist, aqu se muestra el Histograma para la serie CONSUMO.
Show consumo.line, aqu se muestra el grfico de Lneas para la serie CONSUMO.
Show consumo.qqplot, aqu se muestra
CONSUMO.

el grafico

Quantil-Quantil para la serie

Show consumo.stats, aqu se muestra las estadsticas bsicas e histograma para la serie
CONSUMO.
Show consumo.label, aqu se la etiqueta de la serie CONSUMO.
Show consumo.sheet, aqu se muestra la hoja de datos de la serie CONSUMO.
Show consumo.statby, aqu se muestra las estadsticas por clasificacin de la serie
CONSUMO.
Show consumo.testby, aqu se muestra las pruebas de igualdad por clasificacin de la serie
CONSUMO.

18

Curso: Econometra I

Jos Luis Nolazco

Show consumo.teststat, aqu se muestra las pruebas de hiptesis simples de la serie


CONSUMO.
Show consumo.uroot, aqu se muestran las pruebas de raz unitaria de la serie
CONSUMO.

Dado el grafico anterior (as como la vista Stats), el cual muestra un grfico de barras que
representa la distribucin de frecuencias de la serie analizada. De esta manera, es posible
determinar qu valores tienen la mayor probabilidad de ocurrencia y alrededor de que
valor(es) se centran las observaciones. La forma de la distribucin para los datos de la serie
seleccionada puede analizarse con ms detalle y formalidad a partir de los siguientes
estadsticos:

Media (mean)
Corresponde al valor promedio de la serie. Si el valor de la media fuese muy cercano a
cero, se podra concluir la caracterstica de normalidad estandarizada del proceso
generador de la serie.

Mediana (median)
Corresponde al valor central de la serie (luego de ser ordenada segn su magnitud).
Como se sabe, en una distribucin normal la media, la mediana y la moda arrojan el
mismo resultado debido, precisamente, a que la distribucin es simtrica (el estadstico
relevante para medir la simetra ser explicado ms adelante).

Desviacin estndar (Std.Dev.)


Es una medida de dispersin de las observaciones alrededor de la media. Formalmente,
la desviacin estndar se calcula a partir de la raz cuadrada de la sumatoria del
cuadrado de las desviaciones de las observaciones respecto a la media de la serie, es
decir:

1 N
( yi y )2

N 1 i 1

Donde N representa el nmero total de observaciones en la muestra, mientras que yi


e y representan el valor de la variable para la i-sima observacin y la media de la serie,

19

Curso: Econometra I

Jos Luis Nolazco

respectivamente. Si dicho estadstico arrojara un valor muy cercano a la unidad, se


debera al proceso de estandarizacin de los datos generados de la serie.

Coeficiente de asimetra (skewness)


Este ndice ofrece una medida de simetra de la distribucin de las observaciones. El
valor referencial que se toma para comparar el estadstico que muestra E-Views es cero
(asociado a una distribucin normal y, por ende, simtrica). Entonces, un valor positivo
para el coeficiente de asimetra implica una mayor cola a la derecha de la media;
mientras que un valor negativo significa una mayor cola a la izquierda del valor
promedio. Formalmente, el coeficiente de asimetra se construye a partir del tercer
momento de la distribucin y la desviacin estndar de la misma:

Sk

1
N

( yi y )3

i 1

Coeficiente de curtosis (kurtosis)


Se trata de una medida que indica el grado de apuntamiento de la distribucin o
anchura de sus colas. Al igual que en el caso del coeficiente de asimetra, se toma el
coeficiente de curtosis de la distribucin normal (3) como valor referencial.
Formalmente, el coeficiente de curtosis se construye a partir del cuarto momento de la
distribucin y el cuadrado de su varianza (o la cuarta potencia de su desviacin
estndar):

1
Ku
N

( yi y )4

i 1

En este sentido, para una distribucin normal, el cuarto momento es igual a tres veces
el cuadrado de su varianza. A partir de lo anterior, si el coeficiente de curtosis es menor
a tres se dice que la distribucin es platicrtica; en cambio, si el cuarto momento es mas
de tres veces el cuadrado de la varianza (coeficiente de curtosis de mayor a tres) se dice
que la distribucin es leptocrtica. Asimismo, una distribucin cuyo coeficiente de
curtosis se aproxima al valor de tres se denomina mesocrtica. Si consideramos la
denominacin anterior, el termino lepto significa delgado (en griego) y se refiere al
hecho de que este tipo de distribuciones presenta una parte central relativamente
delgada; lo cual no se debe confundir con la anchura de colas, ya que distribuciones
leptocrticas presentan colas ms anchas que las platicrticas. Por otro lado, el trmino
plati significa ancho y se refiere a la mayor anchura de la parte central, a pesar de que
las colas sean relativamente ms delgadas. En conclusin, distribuciones con un
coeficiente de curtosis mayor a tres (leptocrticas) poseen un mayor apuntamiento

20

Curso: Econometra I

Jos Luis Nolazco

(centro ms delgado) y colas ms anchas; mientras que lo contrario ocurre en


distribuciones con un coeficiente de curtosis menor de tres (platicrticas).

Platicrticas

Mesocrtica

Leptocrtica
s

Test Jarque-Bera

La prueba de normalidad de Jarque-Bera se basa en el estadstico JB bajo la distribucin


Chi-cuadrado con 2 grados de libertad.

JB

N k
1

Sk 2 ( Ku 3) 2

6
4

Donde k indica el nmero de coeficientes utilizados para generar la serie analizada. Tal
como se aprecia, la prueba de normalidad se basa en los dos estadsticos explicados
anteriormente: el coeficiente de asimetra y el coeficiente de curtosis. As, cuanto mayor
sea la diferencia entre los valores referenciales a estos estadsticos para una distribucin
normal y los obtenidos para la serie analizada, mayor ser el estadstico JB y, por tanto,
mayor ser la probabilidad de que este resulte mayor al valor crtico y nos encontremos
en zona de rechazo para la hiptesis nula de normalidad.
Tal como se indic la hiptesis nula del test Jarque-Bera es que la distribucin de donde
han sido extrados los datos de la serie analizada es normal. Sin embargo, antes de
contrastar la evidencia que nos brinda el valor del estadstico JB, es necesario fijar un
nivel de confianza (lo usual es trabajar con una certidumbre del 95%) que delimite las
zonas de aceptacin y rechazo para la hiptesis nula.

21

Curso: Econometra I

Jos Luis Nolazco

Si la probabilidad asociada al estadstico JB es mayor a 0.05, no se puede rechazar la


hiptesis nula de normalidad para la serie de datos analizada con un nivel de confianza
del 95%.

22

Curso: Econometra I

Jos Luis Nolazco

CAPITULO 2
M0DELO DE REGRESION LINEAL CLASICO

2.1 RESUMEN TEORICO

Con los modelos de regresin lineal perseguimos explicar el comportamiento de una


variable a partir de otras. Para ello suponemos que existe una relacin lineal entre la
variable cuyo comportamiento queremos explicar (variable endgena o dependiente) y las
variables que utilizamos como explicativas (variables exgenas o independientes).

yi 0 1 x1n 2 x2i ....... k xki i

, i 1,..., n

(1)
La variable yi es la variable endgena o dependiente, las variables xij , i 1,......k son las
variables explicativas o regresores y i es la perturbacin aleatoria o comnmente llamado
termino de error, por ltimo los son los parmetros asociados a cada una de las
variables explicativas, tambin llamados coeficientes de regresin y miden el impacto de
cada variable independiente al comportamiento de la variable endgena.
Los parmetros de la poblacin que son 1 , 2 ,...k no son conocidos. Sin embargo
utilizando informacin muestral se pueden obtener estimadores de los parmetros (o
coeficientes).
As utilizando la informacin muestral se debe obtener:

Buenos estimadores de los coeficientes.


Determinar cmo los estimados cambian si se tiene otra muestra de la misma
poblacin.
Analizar si hay suficiente evidencia al no tomar algunos valores de los coeficientes.
Utilizar los estimadores para interpretar el modelo.

Ahora si utilizamos la notacin matricial, el modelo se escribe como Y X , donde:

23

Curso: Econometra I

x11
y1


x12
y2

Y
,X


x1n
yn nx1

Jos Luis Nolazco

x21
x22
x2 n

xk1

xk 2

xkn

nxk
(2)

1
1

2 , 2




k kx1
n nx1

Si se quiere que en el modelo exista trmino independiente, la variable x1i tiene que ser
igual a uno, o lo que es lo mismo, la primera columna de la matriz X tiene que ser un
vector de unos. A este regresor se le llama regresor ficticio. Normalmente, se trabajar con
modelos en los que existe trmino independiente.
Adems, se considera que se cumplen las siguientes hiptesis clsicas bsicas:

Como se ha mostrado anteriormente en la ecuacin del modelo, esta cumple la


hiptesis de linealidad entre la relacin y la constancia de los parmetros a lo largo
de la muestra.
No existen relaciones lineales entre las variables explicativas o regresores y estos no
son variables aleatorias (no multicolinealidad).
La esperanza del vector de la variable aleatoria es cero: E ( ) 0 .
La matriz de varianzas y covarianzas del vector de variables aleatorias es:
E ( ) 2 I . Es decir todos los componentes del vector tienen varianza
idntica (homoscedasticidad), y adems las covarianzas son 0, es decir, los
elementos del vector no estn correlacionados (no autocorrelacin).
El rango de la matriz X es k, el nmero de regresores, y debe ser menor o igual a n, el
nmero de observaciones. Esta condicin es necesaria para que la matriz XX sea
invertible. Adems la matriz X es una matriz no aleatoria no aleatoria o no
estocstica.
La distribucin de probabilidad del vector de perturbaciones aleatorias es:
N (0, 2 I ) , es decir es un vector normal esfrico.

Por tanto, las perturbaciones son variables aleatorias independientes e igualmente


distribuidas, normales con media cero y varianza 2 . Dado que X no es aleatoria, la
distribucin de probabilidad del vector Y se deriva a partir del vector de
perturbaciones:
Y N ( X , 2 I ) .

Como lo hemos mencionado anteriormente, los modelos de regresin tienen como


finalidad la explicacin del comportamiento de una determinada variable (variable

24

Curso: Econometra I

Jos Luis Nolazco

dependiente) como funcin de un conjunto de otras variables (variables independientes).


Para ello se selecciona una variable objeto de estudio y un conjunto de variables que van a
contribuir a su explicacin, dado que la inclusin de estas nuevas variables en el modelo
siempre contribuye a mejorar el grado de explicacin alcanzado por este, se hace necesario
utilizar criterios que valoren la inclusin de estas nuevas variables tanto en la mejora que se
produce en su coeficiente de determinacin como en la reduccin que sufren los grados de
libertado del modelo estimado.
Por lo tanto, se plantean distintos estadsticos que permiten seleccionar las variables que
deben ser explicativas en un modelo economtrico. Entres los principales criterios de fcil
aplicacin se incluyen los siguientes:

R2 ajustado:
Se define de tal modo que penaliza la inclusin de nuevas variables explicativas en el
modelo, ya que, si bien al aumentar el nmero de regresores aumenta tambin la Suma de
Cuadrados Explicados, la inclusin de nuevas variables explicativas reduce los grados de
libertad del modelo, por lo que no siempre resultara adecuado incorporar nuevas variables
al mismo.
SCR
n 1
R 1 n k 1
(1 R 2 )
SCT
nk
n 1

Criterio de Informacin de Akaike (AIC)


Este criterio es un estadstico que permite seleccionar variables en un modelo de regresin,
su clculo se realiza a partir de la suma de cuadrados de residuos del modelo de regresin,
tambin penaliza la inclusin de nuevos regresores en el modelo, seleccionando como
modelo ms adecuado aquel que presenta un menor valor de dicho coeficiente. Su frmula
de clculo responde a la siguiente expresin:

SCR 2k
AIC ln

n n

Y su valor tambin aparece calculado automticamente en la estimacin facilitada por Eviews; el nombre que lo identifica es Akaike info criterion.

25

Curso: Econometra I

Jos Luis Nolazco

Criterio de Schwarz
Este criterio es una alternativa mas restrictiva al criterio AIC, ya que permite la seleccin de
variables que deben ser incluidas en el modelo. Este criterio penaliza en un grado mayor la
inclusin de nuevos regresores en el modelo. Al igual que en el caso anterior, se considera
mejor modelo aquel que presente un menor valor del coeficiente. Su valor aparece tambin
calculado en la estimacin facilitada por E-views con el nombre Schwarz criterion y se
obtiene a partir de la siguiente expresin.

SBC

k
SCR
ln(n) ln

n
n

Criterio de razn de Verosimilitud

Este criterio se basa en el principio de mxima verosimilitud y consiste en la realizacin de


un contraste de unidad para un subconjunto de coeficientes del modelo de regresin. El
diseo de este contraste necesita de la comparacin de dos modelos, uno de ellos que
verifique la hiptesis nula (modelo restringido) y otro que no la verifique (modelo no
restringido). En cada uno de estos modelos se calcula el valor de logaritmo de la funcin de
verosimilitud y se aplica el siguiente contraste:
2
X exp
2 ln
2
X tco
X p2

Donde es el cociente de los valores de la funcin de verosimilitud en el modelo


restringido y el modelo no restringido, y p es el nmero de restricciones o coeficientes
sometidos a contraste.
El resultado de la estimacin mnimo cuadrtica de E-views presenta el valor del logaritmo
de la funcin de verosimilitud (Log Likelihood), por lo que este estadstico se puede
calcular a partir de la siguiente expresin:
2
X exp
2(ln LR ln LNR )

Otra posibilidad en la aplicacin de un contraste mas general que analiza error de


especificacin del modelo; errores en la forma funcional del modelo, en la exclusin o
inclusin de variables, o violaciones de las hiptesis clsicas (presencia de
heteroscedasticidad, autocorrelacin o dependencia entre la matriz de regresores y la
perturbacin aleatoria). Este contraste fue presentado por Ramsey (1969) y se encuentra
implementado en E-views.

26

Curso: Econometra I

Jos Luis Nolazco

Para su realizacin, desde el resultado de la estimacin cuya validez se quiere analizar, se


selecciona: View/Stability Tests/ Ramsey RESET/ y en el cuadro de dialogo se
especifica el numero de variables que se desea aadir en la ecuacin.
La aplicacin de este contraste se basa en una estimacin aleatoria alternativa donde se
incluye un conjunto de variables representadas por sucesivas potencias de la variable
dependiente estimada en la regresin original:
Y X Z u

Donde Z introduce las potencias de la variable dependiente estimada. Si existe algn


error de especificacin, los parmetros serian estadsticamente distintos de cero. El
resultado del contraste muestra los valores del estadstico F y del contraste de razn de
verosimilitud para el contraste de hiptesis en el que los coeficientes son todos nulos.

2.2 APLICACIONES

2.2.1 Un alumno de la UNALM desea estimar la funcin de produccin del sector textil
utilizando como variables explicativas el trabajo y el capital.
Observaciones
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996

Q
3267636
3664620
4106758
4592483
5250695
6074133
6887865
7848365
8168404
8392581
8972103
9420052

L
1493.8
1549.1
1637.6
1727.6
1848.6
1963.5
2036.2
2070.8
2065.4
2055.9
2093.78
2107.615

K
2923423.74
3138053.94
3364006.38
4672090.06
6413698.56
8526638.63
10744839.7
12597038.7
14444431.8
16260040.2
17962362.2
19226538.1

Se le pide:
1. Estimar una funcin de produccin lineal y verificar la igualdad entre las
productividades marginales del trabajo y el capital.
2. Estimar una funcin tipo Cobb-Douglas y verificar la existencia de rendimientos
constantes de escala.

27

Curso: Econometra I

Jos Luis Nolazco

3. Analizar los efectos que se producen sobre las estimaciones ante cambios de escala
( se multiplica por diez), en la variable dependiente y en los regresores.
4. Analizar los efectos que se producen sobre las estimaciones ante cambios de origen
(se restan quinientas unidades), en la variable dependiente y en los regresores.
5. Considerando el periodo 1985-1993 en la variable dependiente, realizar una
prediccin para dicha variable en los tres aos siguientes.
Solucin:
Primero procedemos a importar la base de datos del excel llamado Ejercicio2.1.xlsx, para
esto abrimos el E-views, luego:
File / New/ Workfile. Luego utilizando Dated-regular frecuency y Frecuency/
Annual, seleccionamos en Start date: 1985 y en End date: 1996, por ltimo pulsamos
OK.

Ahora como hemos visto antes, realizamos File/ Import/Import from


file/Ejercicio2.1/finish, luego grabamos el workfile con el nombre que usted desee
seleccionando el comando save.
1. La funcin de produccin de tipo lineal a estimar en este caso es:
qt Lt Kt ut

Instrucciones: En herramientas generales seleccionamos Quick/Estimate equation/ q c


l k o en la lnea de comandos escribimos EQUATION EQ01.LS q c l k.

28

Curso: Econometra I

Jos Luis Nolazco

Dependent Variable: Q
Method: Least Squares
Sample: 1985 1996
Included observations: 12
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
L
K

-1832783.
2999.482
0.255262

725849.9
467.3818
0.017681

-2.525017
6.417627
14.43725

0.0325
0.0001
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.996321
0.995503
146379.0
1.93E+11
-158.0286
1218.617
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

6387141.
2182889.
26.83810
26.95933
26.79322
1.577307

Es conveniente asignar un nombre a la ecuacin puesto que va a ser utilizada de nuevo.


Desde la salida correspondiente a la estimacin se elige la opcin name/eq01. Puede
observarse como en la pantalla principal se ha creado un nuevo objeto que identifica a esta
ecuacin. En segundo lugar, se realiza el contraste para verificar la igualdad entre las
productividades marginales, es decir:
H0 :

o H0 : 0

Desde la salida correspondiente a la estimacin del modelo de produccin lineal, se


selecciona la opcin correspondiente al test de Wald. En esta opcin aparecer una ventana
de dialogo en la que deber especificarse la restriccin propuesta, sabiendo que el programa
asigna el nombre c(1) al primer parmetro del modelo, c(2) al segundo, y as sucesivamente.
Instrucciones: En la eq01 vamos a la opcin View/Coefficient diagnostics/ Wald testcoefficient Restrictions / c(2)-c(3)=0
Wald Test:
Equation: EQ01
Test Statistic
t-statistic
F-statistic
Chi-square

Value

df

Probability

6.416860
41.17609
41.17609

9
(1, 9)
1

0.0001
0.0001
0.0000

Value

Std. Err.

2999.227

467.3979

Null Hypothesis: C(2)-C(3)=0


Null Hypothesis Summary:
Normalized Restriction (= 0)
C(2) - C(3)
Restrictions are linear in coefficients.

29

Curso: Econometra I

Jos Luis Nolazco

La salida del ordenador muestral los estadsticos experimentales y las probabilidades que
dejan a su derecha. Puesto que en ambos casos la probabilidad es menor que el nivel de
significacin elegido (se utiliza normalmente 0,05), se rechaza la hiptesis nula, por lo que
se rechaza la igualdad entre las productividades marginales.
2. La funcin de produccin de tipo Cobb-Douglas a estimar en este caso es:
qt ALt Kt eut

Para realizar la estimacin de este modelo es necesario linealizarlo tomando logaritmos:


ln qt ln A ln Lt ln Kt ut
Siendo:
ln qt Lqt , ln A , ln Lt LLt , ln Kt LKt

Hay que estimar el modelo:


Lqt LLt LKt ut
Antes de estimar el modelo, se necesita transformar las variables originales en logaritmos.
Instrucciones: Genr/Lnq=log (q)
Genr/LnL=log (L)
Genr/LnK=log (K)
Se estima la nueva funcin de produccin:
Instrucciones: En herramientas generales seleccionamos Quick/Estimate equation/
Lnq c Lnl Lnk o en la lnea de comandos escribimos EQUATION EQ02.LS Lnq c
Lnl Lnk

Dependent Variable: LNQ


Method: Least Squares
Date: 08/09/10 Time: 12:04
Sample: 1985 1996
Included observations: 12
Variable
C
LNL
LNK
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

Coefficient

Std. Error

t-Statistic

Prob.

4.392927
0.617822
0.412304

1.714918
0.354840
0.063183

2.561597
1.741128
6.525580

0.0306
0.1156
0.0001

0.992414
0.990729
0.035672
0.011452
24.69955
588.7303
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

15.61025
0.370473
-3.616591
-3.495365
-3.661474
1.348233

30

Curso: Econometra I

Jos Luis Nolazco

Se realiza el contraste para verificar la existencia rendimientos constantes de escala, es decir:


H0 : 1

Por ltimo, desde la salida correspondiente a la estimacin del nuevo modelo de


produccin tipo Cobb-Douglas, se selecciona la opcin correspondiente al test de Wald.
Instrucciones: En la eq02 vamos a la opcin View/Coefficient diagnostics/ Wald testcoefficient Restrictions / c(2)+c(3)=1

Wald Test:
Equation: EQ02
Test Statistic
t-statistic
F-statistic
Chi-square

Value

df

Probability

0.102506
0.010508
0.010508

9
(1, 9)
1

0.9206
0.9206
0.9184

Value

Std. Err.

0.030126

0.293890

Null Hypothesis: C(2)+C(3)=1


Null Hypothesis Summary:
Normalized Restriction (= 0)
-1 + C(2) + C(3)

Restrictions are linear in coefficients.

Puesto que la probabilidad que deja a la derecha el estadstico es mayor que el nivel de
significacin de 0.05, no se puede rechazar la hiptesis nula, por lo que se considera la
presencia de rendimientos constantes de escala.
3. Anlisis de las estimaciones antes cambios de escala.
Se selecciona en la pantalla principal la ecuacin la ecuacin uno, puesto que es el modelo
de produccin lineal sobre el que se va a trabajar. En primer lugar es necesario definir de
nuevo las variables, incrementndolas por die, incluido el termino independiente.
Instrucciones: Genr/MQ=10*Q

Genr/MC=10*1
Genr/ML=10* L
Genr/MK=10*K

31

Curso: Econometra I

Jos Luis Nolazco

Se realizan un conjunto de regresiones utilizando las variables incrementadas y se observa


cmo afectan estos incrementos a las estimaciones del modelo. Si se incrementan los
regresores, excluido el trmino independiente, los coeficientes de dichos regresores quedan
divididos por diez.
qt MLt MKt ut

Instrucciones: En herramientas generales seleccionamos Quick/Estimate equation/ q c


ML MK o en la lnea de comandos escribimos EQUATION EQ03.LS q c ML MK

Dependent Variable: Q
Method: Least Squares
Date: 08/09/10 Time: 12:26
Sample: 1985 1996
Included observations: 12
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
ML
MK

-1832783.
299.9482
0.025526

725849.9
46.73818
0.001768

-2.525017
6.417627
14.43725

0.0325
0.0001
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.996321
0.995503
146379.0
1.93E+11
-158.0286
1218.617
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

6387141.
2182889.
26.83810
26.95933
26.79322
1.577307

Si se incrementa un nico regresor, su coeficiente queda divido por diez:


qt MLt Kt ut
Dependent Variable: Q
Method: Least Squares
Date: 08/09/10 Time: 12:27
Sample: 1985 1996
Included observations: 12
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
ML
K

-1832783.
299.9482
0.255262

725849.9
46.73818
0.017681

-2.525017
6.417627
14.43725

0.0325
0.0001
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

0.996321
0.995503
146379.0
1.93E+11
-158.0286

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.

6387141.
2182889.
26.83810
26.95933
26.79322

32

Curso: Econometra I

Jos Luis Nolazco

F-statistic
Prob(F-statistic)

1218.617
0.000000

Durbin-Watson stat

1.577307

Si se incrementa solo la variable dependiente, los coeficientes de todos los regresores se ven
multiplicados por diez:
Mqt Lt Kt ut
Dependent Variable: MQ
Method: Least Squares
Date: 08/13/10 Time: 22:30
Sample: 1985 1996
Included observations: 12
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
L
K

-18327831
29994.82
2.552618

7258499.
4673.818
0.176808

-2.525017
6.417627
14.43725

0.0325
0.0001
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.996321
0.995503
1463790.
1.93E+13
-185.6596
1218.617
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

63871413
21828885
31.44327
31.56450
31.39839
1.577307

Si se incrementan la variable dependiente y los regresores, excluido el trmino


independiente, el coeficiente del regresor ficticio queda multiplicado por diez:
Mqt MLt MKt ut
Dependent Variable: MQ
Method: Least Squares
Date: 08/13/10 Time: 22:35
Sample: 1985 1996
Included observations: 12
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
ML
MK

-18327831
2999.482
0.255262

7258499.
467.3818
0.017681

-2.525017
6.417627
14.43725

0.0325
0.0001
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.996321
0.995503
1463790.
1.93E+13
-185.6596
1218.617
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

63871413
21828885
31.44327
31.56450
31.39839
1.577307

33

Curso: Econometra I

Jos Luis Nolazco

Si se incrementan todas las variables, incluido el regresor ficticio, los coeficientes de las
variables, incluido el del regresor ficticio, no se alteran:
Mqt MCt MLt MKt ut
Dependent Variable: MQ
Method: Least Squares
Date: 08/09/10 Time: 12:33
Sample: 1985 1996
Included observations: 12
Variable

Coefficient

Std. Error

t-Statistic

Prob.

MC
ML
MK

-1832783.
2999.482
0.255262

725849.9
467.3818
0.017681

-2.525017
6.417627
14.43725

0.0325
0.0001
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.996321
0.995503
1463790.
1.93E+13
-185.6596
1.577307

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.

63871413
21828885
31.44327
31.56450
31.39839

De los anteriores cuadros, se concluye:

Si se cambian las escalas de los regresores sus coeficientes quedan modificados,


incrementndose por el inverso del factor de escala.
Si se cambia solo la escala de la variable dependiente, los coeficientes de los
regresores quedan modificados, incrementndose por el factor de escala.
Si se cambian las escalas de todas las variables, incluido el regresor ficticio, los
coeficientes de los regresores no varan.

4. Anlisis de las estimaciones ante cambios de origen


Se necesita definir otra vez las variables, restando quienentas unidades, incluido de nuevo,
el termino independiente.
Instrucciones: Genr/RQ=Q-500

Genr/RC=1-500
Genr/RL= L-500
Genr/RK=K-500

34

Curso: Econometra I

Jos Luis Nolazco

Se realiza un conjunto de regresiones utilizando las nuevas variables y se observa cmo


afectan estas alteraciones a las estimaciones del modelo. Si se modifican los regresores,
excluido el regresor ficticio:
qt RLt RKt ut

Instrucciones: En herramientas generales seleccionamos Quick/Estimate equation/ q c


RL RK o en la lnea de comandos escribimos EQUATION EQ04.LS q c RL RK

Dependent Variable: Q
Method: Least Squares
Date: 08/09/10 Time: 12:43
Sample: 1985 1996
Included observations: 12
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
RL
RK

-332914.4
2999.482
0.255262

494515.7
467.3818
0.017681

-0.673213
6.417627
14.43725

0.5177
0.0001
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.996321
0.995503
146379.0
1.93E+11
-158.0286
1218.617
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

6387141.
2182889.
26.83810
26.95933
26.79322
1.577307

Se modifica el coeficiente del regresor ficticio de la siguiente forma:


-1832783 + 500*(2999.482+0.255262)=-332914.4
Es decir, es el antiguo coeficiente del regresor ficticio menos el cambio de origen (-500)
multiplicado por los coeficientes de las variables incrementadas.
Si se modifica un nico regresor:
qt RLt Kt ut

35

Curso: Econometra I

Jos Luis Nolazco

Dependent Variable: Q
Method: Least Squares
Date: 08/09/10 Time: 12:48
Sample: 1985 1996
Included observations: 12
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
RL
K

-333042.1
2999.482
0.255262

494508.3
467.3818
0.017681

-0.673481
6.417627
14.43725

0.5176
0.0001
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.996321
0.995503
146379.0
1.93E+11
-158.0286
1218.617
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

6387141.
2182889.
26.83810
26.95933
26.79322
1.577307

Se modifica el coeficiente del regresor ficticio de la siguiente forma:


-1832783 + 500*(2999.482)=-333042.1
Si se modifica solo la variable dependiente:

Rqt Lt Kt ut
Dependent Variable: RQ
Method: Least Squares
Date: 08/09/10 Time: 12:50
Sample: 1985 1996
Included observations: 12
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
L
K

-1833283.
2999.482
0.255262

725849.9
467.3818
0.017681

-2.525705
6.417627
14.43725

0.0325
0.0001
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.996321
0.995503
146379.0
1.93E+11
-158.0286
1218.617
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

6386641.
2182889.
26.83810
26.95933
26.79322
1.577307

Se modifica el coeficiente del regresor ficticio de la siguiente forma:


-1832783 + 500=-1832283
Si se modifican la variable dependiente y los regresores, excluido el ficticio:

36

Curso: Econometra I

Jos Luis Nolazco

Rqt RLt RKt ut


Dependent Variable: RQ
Method: Least Squares
Date: 08/09/10 Time: 12:50
Sample: 1985 1996
Included observations: 12
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
RL
RK

-333414.4
2999.482
0.255262

494515.7
467.3818
0.017681

-0.674224
6.417627
14.43725

0.5171
0.0001
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.996321
0.995503
146379.0
1.93E+11
-158.0286
1218.617
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

6386641.
2182889.
26.83810
26.95933
26.79322
1.577307

Se modifica el coeficiente del regresor ficticio de la siguiente forma:


-1832783 -500+ 500*(2999.482+0.255262)=-333414.4
Si se modifican todas las variables:
Rqt RCt RLt RKt ut
Dependent Variable: RQ
Method: Least Squares
Date: 08/09/10 Time: 12:52
Sample: 1985 1996
Included observations: 12
Variable
RC
RL
RK
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

Coefficient

Std. Error

t-Statistic

Prob.

668.1652
2999.482
0.255262

991.0134
467.3818
0.017681

0.674224
6.417627
14.43725

0.5171
0.0001
0.0000

0.996321
0.995503
146379.0
1.93E+11
-158.0286
1.577307

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.

6386641.
2182889.
26.83810
26.95933
26.79322

Se modifica el coeficiente del regresor ficticio de la siguiente forma:

37

Curso: Econometra I

Jos Luis Nolazco

1832783 500 500(2999.482 0.255262)


668.1652
500

Por lo tanto en todas las regresiones el nico estimador que varia es el correspondiente al
regresor ficticio, permaneciendo inalterados los coeficientes de los dems regresores.
5. Prediccin de la variable dependiente para el periodo 1994-1996.
Para poder realizar esta prediccin hay que generar una nueva serie que sea igual a nuestra
serie de produccin pero sin datos para el periodo 1994-1996.
Instrucciones: Genr/qmod=q
Una vez conseguida la nueva serie hay que mostrarla: escriba en la lnea de comandos show
q qmod, y editarla (edit +/-) para poder modificar las tres ltimas observaciones de la
serie, escribiendo sobre ellas NA.

Puesto que la variable dependiente se ha modificado, tiene tres observaciones menos, para
realizar la prediccin es necesario estimar de nuevo el modelo.
Instrucciones: En herramientas generales seleccionamos Quick/Estimate equation/
qmod c L K o en la lnea de comandos escribimos EQUATION EQ05.LS qmod c L K
Dependent Variable: QMOD
Method: Least Squares
Date: 08/09/10 Time: 12:58
Sample (adjusted): 1985 1993
Included observations: 9 after adjustments

38

Curso: Econometra I

Jos Luis Nolazco

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
L
K

-991000.6
2391.562
0.292948

1118930.
765.0700
0.039874

-0.885668
3.125938
7.346843

0.4099
0.0204
0.0003

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.994121
0.992162
159777.9
1.53E+11
-118.7797
507.3115
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

5540107.
1804697.
27.06216
27.12790
26.92029
1.705018

Desde la salida correspondiente, mostrada en el cuadro anterior, se selecciona la opcin


correspondiente a la prediccin: Forecast. El programa asigna un nuevo nombre a la
prediccin de la variable dependiente (qmodf). De esta manera:
11,000,000

Forecast: QMODF
Actual: QMOD
Forecast sample: 1985 1996
Included observations: 9
Root Mean Squared Error 130458.1
Mean Absolute Error
112710.8
Mean Abs. Percent Error
2.281807
Theil Inequality Coef f icient 0.011257
Bias Proportion
0.000000
Variance Proportion
0.001474
Cov ariance Proportion 0.998526

10,000,000
9,000,000
8,000,000
7,000,000
6,000,000
5,000,000
4,000,000
3,000,000
2,000,000
85

86

87

88

89

90
QMODF

91

92

93

94

95

96

2 S.E.

Es interesante compara la variable produccin original y la prediccin que se ha obtenido


de esta, en la lnea de comandos se escribe: show q qmod qmodf.
obs

QMOD

QMODF

1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996

3267636
3664620
4106758
4592483
5250695
6074133
6887865
7848365
8168404
8392581
8972103
9420052

3267636.
3664620.
4106758.
4592483.
5250695.
6074133.
6887865.
7848365.
8168404.
NA
NA
NA

3437927.
3633056.
3910901.
4509343.
5308923.
6202696.
7026381.
7651728.
8180004.
8689164.
9278449.
9681875.

39

Curso: Econometra I

Jos Luis Nolazco

Como podemos ver en este caso, por regla general las predicciones de la variable son
mayores que los verdaderos valores.

2.2.2

Supongamos que un economista de la agraria quiere estudiar el sector turstico


de Espaa, para ello se dispone de cinco variables relativas al sector hotelero
con las que pretende construir un modelo economtrico que le permita conocer
el grado de ocupacin hotelera (Y). Los datos disponibles son de corte
transversal y pertenecen a cada una de las 17 comunidades autnomas para el
ltimo trimestre de 1995.

observaciones

x1

x2

x3

x4

Andaluca

40.16

421844

2.96

116.7

Aragn

22.67

72323

1.76

115.4

Asturias

23.43

25581

2.16

117.9

Baleares

43.51

75614

10.96

117.2

Canarias

71.41

249763

8.16

118.7

Cantabria

18.08

18022

1.68

116.1

Castilla y Len

23.65

126887

1.52

116.7

Castilla la Mancha

26.89

77751

1.5

117.2

Catalua

35.81

285090

2.32

116.8

48.2

143514

5.11

115.3

Extremadura

27.69

45072

1.57

117.6

Galicia

22.94

86473

1.9

117.6

Comunidad de Madrid

41.58

317845

1.97

115.9

Murcia

29.35

26471

2.93

116.5

Navarra

22.07

16470

1.69

120.5

Pas Vasco

28.85

57700

1.81

117.1

La Rioja

30.85

12963

1.92

118.6

Comunidad Valenciana

Fuente: Contabilidad Trimestral, INE.

Las variables que inicialmente se desean incluir en el modelo como regresores son: nmero
medio de viajeros (x1), estancia media (x2), renta(x3), variable de localizacin geogrfica
(x4), que toma el valor de 1 si la comunidad autnoma tiene zona costera y el valor 0 en
caso contrario.
El modelo terico con el que se pretende trabajar es una especificacin lineal como la
siguiente:
yt 0 1 x1t 2 x2t 3 x3t 4 x4t t

40

Curso: Econometra I

Jos Luis Nolazco

A partir de la informacin facilitada para el ltimo trimestre de 1995, realice una seleccin
de variables y un contraste de error de especificacin sobre el modelo que considere
adecuado.

Solucin:
La idea de este ejercicio es realizar una seleccin entre los posibles regresores del modelo.
Para ello se estiman modelos alternativos con distintas variables explicativas. A partir de
estas estimaciones se selecciona el modelo ms adecuado en base a los criterios habituales
de seleccin de variables. Es importante recordar que no todos los autores comparten estos
criterios de seleccin que fueron explicados anteriormente, puesto que introducen un
desgaste de datos al utilizar los mismos datos para probar diferentes modelos. Los
contrastes clsicos pierden su significatividad ya que las probabilidades serian
condicionadas a los modelos anteriormente rechazados.
Para comenzar con la seleccin de variables se estima el modelo inicialmente propuesto,
modelo no restringido (modelo inicial) y a continuacin distintos modelos alternativos en
los que se han omitido alguno o algunos de los regresores.
Los modelos considerados son los siguientes:

Y C x1 x2 x3 x4
Y C x1 x2 x4
Y C x1 x3 x4
Y C x2 x3 x4
Y C x1 x2 x3
Y C x1 x2
Y C x1 x3
Y C x1 x4
Y C x2 x3
Y C x2 x4
Y C x3 x4
Y C x1
Y C x2
Y C x3
Y C x4

Para cada uno de ellos se realiza una estimacin mnimo cuadrtica (MCO), comparando
los valores obtenidos en el coeficiente de determinacin corregidos, criterio de informacin
de Akaike y el criterio de Schwarz. Se observan tambin en estas regresiones el valor de la
suma de cuadrados de residuos que se utilizara para el clculo del criterio de Amemiya y el
valor del logaritmo de la funcin de verosimilitud para el clculo del contraste de razn de
verosimilitud.

41

Curso: Econometra I

Jos Luis Nolazco

Los datos se encuentran disponibles en el fichero jose2.wfl, para obtener la estimacin


mnimo cuadrtica del modelo inicial son las siguientes instrucciones: Quick/Estimate
equation/ y c x1 x2 x3 x4 y posteriormente se le graba con el nombre modelo1.

Dependent Variable: Y
Method: Least Squares
Date: 08/10/10 Time: 11:08
Sample: 1 17
Included observations: 17
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
X1
X2
X3
X4

-181.5765
5.82E-05
3.283160
1.697576
-2.771114

198.5911
1.69E-05
0.710733
1.698589
4.396278

-0.914323
3.442665
4.619403
0.999403
-0.630332

0.3786
0.0049
0.0006
0.3373
0.5403

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.771123
0.694831
7.279629
635.9160
-54.90771
10.10747
0.000809

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

32.77294
13.17767
7.047965
7.293028
7.072325
2.347176

Del resultado de la estimacin se utilizaran los valores marcados en negrita para realizar la
seleccin de variables. De igual forma y como lo descrito usted puede estimar los
diferentes modelos que se menciono en la pregunta.
Luego de estimar todos los modelos, y segn los criterios explicados anteriormente, se
deduce que el modelo mas adecuado para la estimacin del grado de ocupacin hotelera es
el modelo 6, Quick/Estimate equation/ y c x1 x2, el cual se puede observar a
continuacin:
Dependent Variable: Y
Method: Least Squares
Date: 08/10/10 Time: 12:51
Sample: 1 17
Included observations: 17
Variable
C
X1
X2
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid

Coefficient

Std. Error

t-Statistic

Prob.

16.67247
5.08E-05
3.257840

3.004335
1.45E-05
0.672418

5.549471
3.510076
4.844963

0.0001
0.0035
0.0003

0.751692
0.716220
7.019883
689.9026

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion

32.77294
13.17767
6.894155
7.041193

42

Curso: Econometra I

Jos Luis Nolazco

Log likelihood
F-statistic
Prob(F-statistic)

-55.60032
21.19082
0.000058

Hannan-Quinn criter.
Durbin-Watson stat

6.908771
2.440799

Una vez seleccionado el modelo se puede probar la inclusin y exclusin de otros


regresores adicionales, para ello y desde la pantalla que presenta la estimacin del modelo 6,
se selecciona View/coefficient diagnostics/ Omitted variables test-likelihood ratio, y
se escriben a continuacin las variables que se considera podan haberse incluido en la
estimacin y, sin embargo han sido omitidas.

Omitted Variables Test


Equation: MODELO6
Specification: Y C X1 X2
Omitted Variables: X3 X4

F-statistic
Likelihood ratio

Value
0.509375
1.385228

df
(2, 12)
2

Probability
0.6133
0.5003

Como puede observarse, si es que las variables x3 y x4 se incluyesen en el modelo 6, estas


serian incluidas de forma irrelevante en el modelo que estima el grado de ocupacin
hotelera.
Ahora se procede a la aplicacin del contraste de Ramsey, el modelo aceptado como valido
(modelo 6) se realiza este contraste considerando una nica variable adicional. Desde la
estimacin numero 6, se selecciona View/ stability diagnostics test/ Ramsey reset
test/1. El resultado obtenido indica que no existe evidencia para rechaza la hiptesis nula
y, por tanto, no se considera error de especificacin en el modelo seleccionado.
Ramsey RESET Test
Equation: MODELO6
Specification: Y C X1 X2
Omitted Variables: Squares of fitted values

t-statistic
F-statistic
Likelihood ratio

Value
0.117411
0.013785
0.018017

df
13
(1, 13)
1

Probability
0.9083
0.9083
0.8932

Unrestricted Test Equation:


Dependent Variable: Y
Method: Least Squares
Date: 08/10/10 Time: 13:28
Sample: 1 17
Included observations: 17
Variable
C

Coefficient

Std. Error

t-Statistic

Prob.

16.80535

3.315255

5.069097

0.0002

43

Curso: Econometra I

Jos Luis Nolazco

X1
X2
FITTED^2

4.00E-05
2.414243
0.003134

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.751955
0.694714
7.281018
689.1718
-55.59131
13.13663
0.000312

9.32E-05
7.218797
0.026697

0.428962
0.334438
0.117411

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

0.6750
0.7434
0.9083
32.77294
13.17767
7.010743
7.206793
7.030230
2.420164

Se puede observar como la nueva variable incluida presenta la una probabilidad superior al nivel de significacin
considerado (5%), por lo que se considera que no es relevante en el modelo estimado. Por lo tanto, el modelo parece
presentar un buen comportamiento en cuanto a su especificacin. Utilizando cualquiera de los criterios anteriormente
comentados se puede observar como el modelo 6 es el mas aceptable. En este modelo se considerad el grado de
ocupacin hotelera (y)en funcin del numero medio de viajeros (x1) y del a estancia media (x2) a travs de la siguiente
estimacin mnimo cuadrtica:
Y

16.6724718112

5.07729318039e-05*X1

3.25784026566*X2

En la que un 75.16 % de la variabilidad del grado de ocupacin hotelera est siendo


explicado por el modelo de regresin ajustado, los regresores seleccionados son, adems
individual y globalmente significativos.

2.2.3

Un problema que interesa a las autoridades sanitarias (entre otros) es el de


determinar los efectos que tiene el consumidor de fumar durante el embarazo
sobre la salud del recin nacido. Una medida de la salud del recin nacido es su
peso: si un recin nacido pesa poco al nacer aumenta el riesgo de que contraiga
diversas enfermedades. Como existen otros factores, adems del tabaco,
deberamos tenerlos en cuenta. Por ejemplo, una renta ms alta se traduce
generalmente en un mejor acceso a los cuidados prenatales, as como en una
mejor alimentacin de la madre. Una ecuacin que reconoce esto es

bwght 0 1cigs 2 fa min c u

Donde bwght es el peso al nacer del bebe, faminc es la renta familiar y cigs mide el consumo
de tabaco de la madre.

Cul podemos esperar que sea el signo ms probable de 2 ?

44

Curso: Econometra I

Jos Luis Nolazco

Es probable que cigs y faminc estn correlacionadas? Explicar por que la correlacion
puede ser positiva o negativa
Estimar ahora una ecuacin con y sin faminc, utilizando los datos de jose3.wf.
Presentar los resultados en forma de ecuacin, incluyendo el tamao de la muestra
y el R-cuadrado ajustado. Comentar los resultados, centrndose en si el aadir
faminc cambia de manera sustancial el efecto estimado de cigs sobre bwght.

Solucin:
En la pregunta mencionan que una renta ms alta se traduce generalmente en un mejor
acceso a los cuidados prenatales, as como en una mejor alimentacin de la madre,
ocasionando que el peso del nacer del bebe aumente, por lo tanto a simple vista al parecer
dicho coeficiente tiene signo positivo.
Por otro lado es probable que cigs y faminc estn correlacionadas, debido a que cuando
aumenta la renta familiar, existe un aumento en la capacidad adquisitiva de la madre,
pudiendo gastar dicho dinero en compras de cigarrillo o tabaco u otras cosas, as que puede
haber una correlacin entre estas variables. Esto se puede escribiendo en la lnea de
comandos corr cigs faminc, se obtiene los siguientes resultados:

CIGS
FAMINC

CIGS

FAMINC

1.000000
-0.173045

-0.173045
1.000000

Al parecer hay una correlacin negativa baja entre el ingreso familiar y el consumo de
tabaco de la madre. Ahora estimamos una ecuacin con y sin faminc, los resultados son:
Dependent Variable: BWGHT
Method: Least Squares
Date: 08/12/10 Time: 21:26
Sample: 1 1388
Included observations: 1388
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
CIGS
FAMINC

116.9741
-0.463408
0.092765

1.048984
0.091577
0.029188

111.5118
-5.060315
3.178195

0.0000
0.0000
0.0015

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.029805
0.028404
20.06282
557485.5
-6130.414
21.27392
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

118.6996
20.35396
8.837772
8.849089
8.842005
1.921690

Dependent Variable: BWGHT


Method: Least Squares
Date: 08/12/10 Time: 21:26

45

Curso: Econometra I

Jos Luis Nolazco

Sample: 1 1388
Included observations: 1388
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
CIGS

119.7719
-0.513772

0.572341
0.090491

209.2668
-5.677609

0.0000
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.022729
0.022024
20.12858
561551.3
-6135.457
32.23524
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

118.6996
20.35396
8.843598
8.851142
8.846420
1.924390

Si
bien
en
ambos
modelos
estimados,
uno
con
la
variable
faminc y otro sin faminc son ambos significativos, al comparar y escoger un modelo, el
primero tienen un mayor R2 ajustado (aunque bajo) y adems tiene un menor schwarz. Por
lo tanto el mejor modelo es el primero incluyendo la variable renta familiar.

2.2.4

En este ejercicio se va a proceder a la estimacin de una funcin de demanda y,


a partir de este resultado, al clculo de tres tipos de elasticidades. Por ello es
necesario que el lector recuerde ciertos conocimientos de Teora Econmica.
La informacin disponible para la realizacin de este problema se refiere al
conjunto de la economa peruana para el periodo de 1980-2008, segn se recoge
en el cuadro que figura ms adelante. Las series de datos corresponde al
consumo de naranjas expresado en decenas de miles de toneladas (Y), precio de
las naranjas en soles por kilogramo (x1), el precio de las manzanas en soles por
kilogramo (x2) y renta nacional en billones de soles (x3).
Ao

x1

x2

x3

1980

40.96

110.11

112.7

2.15

1981

35.58

109.36

110.24

2.45

1982

36.46

109.35

109.65

2.89

1983

35.82

110.83

111.96

3.49

1984

36.93

108.49

109.65

4.33

1985

40.01

112.18

115.47

5.08

1986

35.81

107.89

106.78

6.1

1987

46.88

123

133.48

7.73

1988

50.07

115.63

131.88

9.57

1989

45.81

110.94

122.83

11.12

1990

44.72

119.07

126.61

12.76

1991

42.53

117.23

120.63

13.91

1992

51.56

121.75

135.35

15.99

1993

40.04

125.76

124.05

17.91

1994

48.07

124.37

133.34

20.11

1995

39.47

128.76

125.32

23.3

46

Curso: Econometra I

Jos Luis Nolazco

1996

51.45

142.61

154.19

25.3

1997

50.9

135.18

146.51

28.53

1998

64.21

136.49

158.81

31.92

1999

56.94

136.2

147.36

35.83

2000

58.06

154.39

169.23

37.45

El modelo que se propone para la estimacin de la funcin de demanda de naranjas es el


que recoge una relacin lineal entre las variables disponibles segn la siguiente
especificacin:
yt 0 1 x1t 2 x2t 3 x3t t

Una vez estimado este modelo, calcule las elasticidades de la demanda de naranjas, esto es,
la elasticidad-precio, la elasticidad-ingreso y la elasticidad-cruzada con respecto al precio de
las manzanas.
Solucin:
Usando jose4.wf, se estima el modelo de demanda de naranjas siguiendo las instrucciones:
En herramientas generales seleccionamos Quick/Estimate equation/ y c x1 x2 x3 o en
la lnea de comandos escribimos EQUATION EQ01.LS y c x1 x2 x3
La funcin de demanda que resulta de la estimacin anterior puede escribirse como sigue:
Y = 34.1762879794 - 0.775928596947*X1 + 0.784462656639*X2 + 0.307780896207*X3

Antes de proceder al clculo de las elasticidades pedidas, conviene recordar que estas se
expresan, en cada punto de la funcin de demanda, la variacin porcentual de la cantidad
demandada de un producto frente a variaciones porcentuales unitarias del precio del propio
producto, de la renta o del precio de otro producto. Analticamente puede calcularse como:

xy
i

x
y xi
i i
xi y
y

As cuando xi represente el precio de las naranjas, se obtendr la elasticidad-precio de las


naranjas, si xi resulta ser la renta se puede obtener la elasticidad-renta de la demanda de
naranjas y, por ltimo, si se considera xi el precio de la manzana, puede calcularse la
elasticidad-cruzada de la demanda de naranjas con respecto al precio de las manzanas.
Asimismo, para su clculo emprico, es necesario sustituir el parmetro de la expresin
anterior por su estimacin en la regresin realizada y particularizar para el punto de medias
muestrales que corresponda en cada caso, tal como se pide en el enunciado.

47

Curso: Econometra I

Jos Luis Nolazco

Elasticidad-precio de la demanda de naranjas


Es una medida de la sensibilidad de la demanda de naranjas (y) frente a las variaciones de
su precio (x1); por tanto, es posible obtenerla a partir de la siguiente expresin:

xy1

y x1
x1
1
x1 y
y

Estos valores se calculan escribiendo en la lnea de comandos las siguientes instrucciones:


@mean(x1)
=121.885
@mean(y)
=45.346
xy1 2.08597
Por lo tanto si el precio de las naranjas se eleva en 1%, la cantidad demandada de las
mismas disminuir en un 2.08%, por lo que puede decirse que las naranjas son un bien
ordinario.
Elasticidad-precio de la demanda de naranjas
Procediendo de forma anloga a como se ha hecho en el apartado anterior:

xy3

y x3
x3
3
x3 y
y

Sustituyendo los valores correspondientes a la media de x3 y de Y, asi como la estimacin


del parmetro, el valor que se obtiene para esta elasticidad es:
@mean(x3)
=15.139

@mean(y)
=45.346

xy3 0.1028
Luego un aumento de la renta en 1% provocara un incremento del 0.1% de la cantidad
demandada de naranjas. El signo obtenido para esta elasticidad indica que se trata de un
bien normal.
Elasticidad-cruzada de la demanda de naranjas con respecto al precio de las
manzanas
Siguiendo la misma metodologa, en este caso:

xy2

y x2
x2
2
x2 y
y

48

Curso: Econometra I

Jos Luis Nolazco

@mean(x2)
=128.859
@mean(y)
=45.346

xy2 2.2288
Por tanto, a partir de la informacin disponible puede afirmarse que un incremento del
precio de manzanas en 1% provocara un incremento del 2.22% de la cantidad demanda de
naranjas. Se trata, por tanto, de bienes sustitutos.
Una forma alternativa de obtener las elasticidades de una funcin de demanda consiste en
estimar una transformacin doblemente logartmica de dicha funcin. En el caso que nos
ocupa este modelo es:
Lyt o 1Lx1 2 Lx2 3 Lx3 ut

El valor que se obtenga en la estimacin MCO ofrece directamente el valor de la elasticidad


que se asocia con el coeficiente del regresor correspondiente.

2.2.5

Considere la siguiente funcin de costos totales, donde CTi representa el costo


total para la empresa i e Yi se refiere al nivel de produccin correspondiente:

CTi 1 2Yi 3Yi 2 4Yi 3 ui

Para la estimacin de esta funcin de costos totales se dispone de un total de 30


observaciones del costo total (CT) y del nivel de produccin (Y) de otras tantas empresas.
A partir de la informacin anterior, se pide:

Estime por MCO la funcin de costos especificada anteriormente.


Realice un grafico de la funcin de costo total, as como de las correspondientes al
costo marginal, los costos medios y los costos variables medios.
A qu nivel de produccin el punto de cierre de las empresas?

Solucin:
Utilizando jose5.wf, estimamos por MCO la funcin de costos que se necesita, en primer
lugar, generamos las potencias cuadradas y cubicas de Y que se incluyen como regresores

49

Curso: Econometra I

Jos Luis Nolazco

en la funcin de costos especificada. A estas variables se las nombrara, respectivamente Y2


y Y3.
Instrucciones: Genr/ Y2=Y^2
Genr /Y3=Y^3
Luego estimamos la funcin de costos:
En herramientas generales seleccionamos Quick/Estimate equation/ cti c yi y2 y3 o
en la lnea de comandos escribimos EQUATION EQ01.LS cti c yi y2 y3

Dependent Variable: CTI


Method: Least Squares
Date: 08/13/10 Time: 00:36
Sample: 1 30
Included observations: 30
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
YI
Y2
Y3

174.7825
30.49810
-5.084017
0.748526

18.98125
11.56052
2.089334
0.115654

9.208165
2.638124
-2.433319
6.472105

0.0000
0.0139
0.0221
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.997657
0.997386
7.594006
1499.392
-101.2424
3689.580
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

357.0312
148.5356
7.016161
7.202988
7.075929
1.453636

Por tanto, el modelo estimado para esta funcin de costos resultara ser el siguiente:
CTI = 174.782515206 + 30.4980985818*YI - 5.08401653356*Y2 + 0.748525860467*Y3
Con estos resultados pueden generarse las variables costos marginales (cmg), costos
medios (cme) y costos variables medios (cvme) relativas a esta funcin de produccin.
Instrucciones: Genr/

o
/

Las representaciones graficas pedidas se van a realizar en sendos grficos de dispersin,


recogiendo en el eje de ordenadas los datos relativos a las distintas funciones de costos y en
el eje de las abcisas los correspondientes al nivel de produccin de las empresas.
Instrucciones: Quick/ Graph/ cti yi/ scatter

50

Curso: Econometra I

Jos Luis Nolazco

800

700

CTI

600

500

400

300

200
0

10

12

YI

Instrucciones: Quick/ Graph/cmg yi/ scatter


160
140
120

CMG

100
80
60
40
20
0
0

10

12

YI

Instrucciones: Quick/ Graph/cme yi/ scatter

51

Curso: Econometra I

Jos Luis Nolazco


130
120
110

CME

100
90
80
70
60
50
0

10

12

YI

Instrucciones: Quick/ Graph/cvme yi/ scatter


55
50

CVME

45
40
35
30
25
20
0

10

12

YI

La curva de oferta de una empresa competitiva viene dada por el tramo de su curva de
costos marginales que se encuentra por encima de los costos variables medios. El cierre de
las empresas se producir, por tanto, cuando sus ingresos no cubran los costos variables
medios, aunque los beneficios de las empresas no son positivos hasta que no alcanzan un
nivel de produccin tal que su costo medio supera a su costo marginal. Para ver cul es el
punto de cierre se analizan las variables cvme, cmg y que nivel de produccin se alcanza
cuando se da la igualdad (aproximada) entre estas.
Para ello, en primer lugar, es necesario ordenar los datos de forma creciente en funcin de
la produccin; el comando que nos permite realizar dicha operacin es sort. La utilizacin
de este comando ordenara los datos de todas las variables segn sentido creciente de la

52

Curso: Econometra I

Jos Luis Nolazco

variable especificada, por lo que para poder reordenar posteriormente los datos en el orden
original se debe crear previamente una variable tendencia (t=0,1,2,3,).
Instrucciones: Genr/ t=@trend(1)
En la lnea de comando escribir primero: sort yi, luego show cti yi cmg cvme cme

obs

CTI

YI

CMG

CVME

CME

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

231.6288
214.9501
231.0902
224.9952
232.5102
239.0219
237.9734
242.6670
247.7566
243.7987
249.1614
259.5556
272.6811
279.5434
291.0340
297.9801
307.8361
316.2933
345.7123
404.1607
392.8819
428.8959
441.4836
465.0450
494.8002
519.9197
527.7194
616.7535
716.3884
736.6997

1.82
2.02
2.55
2.63
2.72
2.80
2.93
3.00
3.41
3.43
3.45
3.72
4.12
4.53
4.91
5.17
5.53
5.75
5.91
6.91
7.02
7.47
7.52
7.82
8.20
8.53
8.60
9.32
10.01
10.01

19.43053
19.12153
19.17148
19.28861
19.45473
19.63293
19.98382
20.20420
21.93691
22.04074
22.14637
23.74822
26.72313
30.51818
34.70967
37.95119
42.94066
46.27632
48.83878
67.45905
69.78147
79.84814
81.02280
88.30654
98.11286
107.1550
109.1359
130.7883
153.7232
153.7232

23.72461
23.28267
22.40115
22.30461
22.20747
22.13130
22.02795
21.98278
21.86554
21.86625
21.86757
21.94396
22.25773
22.82793
23.58111
24.22101
25.27408
26.01314
26.59615
31.10823
31.69596
34.28891
34.59573
36.51524
39.14004
41.59485
42.13653
48.13382
54.60946
54.60946

119.7590
109.8087
90.94331
88.76184
86.46574
84.55362
81.68069
80.24362
73.12141
72.82326
72.52917
68.92850
64.68067
61.41126
59.17837
58.02807
56.88032
56.41010
56.17018
56.40237
56.59375
57.68684
57.83809
58.86595
60.45498
62.08518
62.46008
66.88731
72.07025
72.07025

Se puede apreciar que el mnimo de la funcin de costo variable medio se alcanza en


21.86554, para un nivel de produccin 3.41. Asimismo, puede comprobarse que en este
punto se verifica la igualdad (aprox.) entre el costo marginal y el mnimo del costo variable
medio.

53

Curso: Econometra I

Jos Luis Nolazco

CAPITULO 3
MODELOS DE REGRESION CON VARIABLES
DUMMY
3.1 RESUMEN TEORICO

Las variables dummy (variables ficticias) se incluyen en el modelo bsicamente por tres
razones:

Para aislar el efecto de un evento aleatorio, por ejemplo un terremoto o un


fenmeno del nio, un golpe de estado, que puede provocar un comportamiento
extrao de la variable dependiente en alguna o algunas observaciones de la muestra.
A estas observaciones se les denomina outliers.
Las variables dummy aparecen como representacin de una variable categrica, o
atributo especial de las observaciones, que se repiten regularmente en la muestra
(por ejemplo sexo, raza, religin, estacin, tipo de colegio, etc.) que hace que las
observaciones donde se observa dicho atributo tengan un comportamiento
diferente con respecto a aquellas observaciones donde no se observa dicho
atributo.
Finalmente, las variables dummy permiten capturar los eventos aleatorios que
pueden haber ocurrido en un momento pero con consecuencias por un periodo
mayor. En este caso dicho evento produce produce cambios estructurales en la
muestra que se reflejan inestabilidad en los parmetros del modelo.

Cambios solo en el intercepto:


Supongamos que se observa nicamente un residuo fuera de rango (un outlier) que es
ocasionado por ejemplo por el terremoto del 2007. Para capturar el efecto del terremoto
bastara con crear una variable dummy que identifique dicho evento, as:
Yi 1 2 x2i 3 x3i 4 Di ui

Si no ocurre el terremoto, D=0, el modelo es: Yi 1 2 x2i 3 x3i ui , pero si ocurre el


terremoto, D=1,el modelo es: Yi 2 x2i 3 x3i ui . Donde el intercepto es:

1 4 .
Donde, 4 refleja la magnitud del impacto del terremoto en el modelo. El signo de 4
indicara el sentido el impacto, positivo o negativo.

54

Curso: Econometra I

Jos Luis Nolazco

Cambios solo en la pendiente:


Si el propsito es identificar la eventualidad de que un shock aleatorio haya producido
cambios en alguna o en todas las pendientes, ser necesario crear tantas variables
adicionales como pendientes hayan sido afectadas. Supongamos que solo cambio la
pendiente de la variable x2 .
Yi 1 2 x2i 3 x3i 4 Di x2i ui

Si no ocurre el terremoto, D=0, el modelo es: Yi 1 2 x2i 3 x3i ui , pero si ocurre el


terremoto, D=1, el modelo es: Yi 1 2 x2i 3 x3i ui . Donde la pendiente de x2 es:

2 4 .
Donde 4 refleja la magnitud del impacto adicional del terremoto del 2007 en la pendiente
de la variable x2 . El signo de 4 indicara el sentido del impacto, positivo o negativo.
Cambios en el intercepto y en las pendientes:
Utilizando el ejemplo anterior, supongamos que el terremoto ha provocado cambios
nicamente en el intercepto y en la pendiente de la variable x2 . De modo que si no ocurre
el terremoto, D=0, el modelo es Yi 1 2 x2i 3 x3i ui , pero, si ocurre el fenmeno
del nio, D=1, el modelo es: Yi 1 2 x2i 3 x3i 4 Di 5 Di x2i ui .
Donde 4 refleja la magnitud del impacto adicional del terremoto en el intercepto del
modelo y 5 mide el cambio en la pendiente de la variable x2 . El signo de 4 y 5
indicar el sentido del impacto, positivo o negativo, en el intercepto y en la pendiente.
Precauciones en el uso de variables dummy:
1. Si una variable cualitativa tiene m categoras, solo hay que agregar (m-1)
variables dicotmicas. Si por ejemplo la variable cualitativa regin tiene tres
categoras, se introducen solo dos variables dicotmicas. Si no se respeta esta
regla, se provocara lo que se conoce como trampa de la variable dictoma.
2. La categora a la cual no se le asigna la variable dicotmica se conoce como
categora base, de comparacin, de control.
3. El valor de la interseccin representa el valor medio de la categora de
comparacin.
4. Los coeficientes anexos a las variables dictomas se conocen como coeficientes
de la interseccin diferencial, debido a que indican en que medida el valor de la
interseccin que se le asigna 1 vara del coeficiente de interseccin de la
categora de comparacin.

55

Curso: Econometra I

Jos Luis Nolazco

5. Se puede evitar la trampa de la variable dictoma siempre y cuando no se


introduzca la interseccin en dicho modelo.

3.2 APLICACIONES

1. En un estudio sobre el comportamiento de los salarios (wage)se supuso que estos


dependan de dos variables: la experiencia laboral (EL), medida en aos de trabajo y
de los aos de estudio (AE). Se recogieron datos correspondientes a 30 individuos, 15
primeros son varones y los 15 restantes a las mujeres. El objetivo de este ejercicio es
averiguar, a partir de esta informacin, si existe o no diferencia en los salarios
percibidos por el hecho de ser varn o de ser mujer. En caso de que as ocurra,
analizar que regresor est afectado y qu tipo de influencia ejerce este hecho sobre el s
salario de los individuos.
Solucin:
El objetivo de este ejercicio es averiguar, a partir de esta informacin, si existe o no
diferencia en los salarios percibidos por el hecho de ser varn o de ser mujer. En caso de
que si ocurra, analizar que regresor est afectado y qu tipo de influencia ejerce este hecho
sobre el salario de los individuos.
Primero abrimos el workfile jose6.wf1 y se genera dos variables ficticias: DV, que tomara
valor 1 en las observaciones correspondientes a los varones y 0 en resto, y DM que toma el
valor 1 en las observaciones que corresponden a mujeres y 0 en el caso de varones. A
partir de estas se construyen unas variables ficticias compuestas ELV, ELM, AEV y AEM
que recogen, respectivamente, la experiencia laboral y los aos de estudio de los varones y
mujeres.
Instrucciones: SAMPLE/ 1 15
Genr/ DV=1
Genr/ DM=0
SAMPLE/ 16 30
Genr/ DV=0
Genr/ DM=1
SAMPLE/ 1 30
Genr/ ELV=DV*EL
Genr/ ELM=DM*EL

56

Curso: Econometra I

Jos Luis Nolazco

Genr/ AEV=DV*AE
Genr/AEM=DM*AE

A continuacin se proceder a estimar, mediante MCO, los modelos especificados


anteriormente. Las instrucciones a utilizar son Quick/Estimate equation/ y la
especificacin del modelo considerando la variable dependiente y los regresores.
Los resultados y las instrucciones particulares correspondientes a la estimacin de cada uno
de los modelos sealados se presentan a continuacin:
Modelo I: Los salarios no se ven afectados por el gnero de los individuos.
Instrucciones: Quick/ Estimate equation/ wage c el ae
Dependent Variable: WAGE
Method: Least Squares
Date: 08/15/10 Time: 15:46
Sample: 1 30
Included observations: 30
Variable

Coefficient

Std. Error

t-Statistic

Prob.

75.41237
4.597165
0.208721

5.616567
0.656256
0.375814

13.42677
7.005138
0.555384

0.0000
0.0000
0.5832

C
EL
AE
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.694271
0.671625
7.361606
1463.218
-100.8761
30.65680
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

108.0000
12.84657
6.925073
7.065192
6.969898
1.591648

De esta regresin se necesita la suma de cuadrados de los residuos (SCR), que toma el valor
de 1463.218 y que aparece resaltado en la estimacin anterior.
Modelo II: El gnero de los individuos afecta nicamente a los niveles autnomos del
salario.
Instrucciones: Quick/ Estimate equation/ wage dv dm el ae

Dependent Variable: WAGE


Method: Least Squares
Date: 08/15/10 Time: 15:50
Sample: 1 30
Included observations: 30
Variable

Coefficient

Std. Error

t-Statistic

Prob.

57

Curso: Econometra I

Jos Luis Nolazco

DV
DM
EL
AE

82.49125
75.93863
4.689260
-0.095786

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.753742
0.725328
6.732787
1178.591
-97.63132
1.897346

5.862383
5.141099
0.601324
0.364562

14.07128
14.77090
7.798228
-0.262742

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.

0.0000
0.0000
0.0000
0.7948
108.0000
12.84657
6.775421
6.962248
6.835189

Modelo III: El salario de los individuos est influenciado, tanto en sus niveles como en los
coeficientes asociados al gnero.
La estimacin de este modelo puede hacerse por dos vas alternativas. Por una parte,
podran estimarse dos regresiones por separado, una correspondiente a los varones
(observaciones 1 al 15) y otra correspondiente a las mujeres (observaciones 16 al 30). Por
otra parte, podra estimarse el modelo de forma conjunta, de acuerdo con la especificacin
del modelo III.
En el primer caso hay que estimar dos regresiones. Las instrucciones a seguir en la primera
de ellas son:
Instrucciones: Quick/ Estimate equation/ wage c el ae/sample 1 15

Dependent Variable: WAGE


Method: Least Squares
Date: 08/15/10 Time: 15:54
Sample: 1 15
Included observations: 15
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
EL
AE

102.6836
5.555483
-1.742571

3.866359
0.346729
0.252336

26.55821
16.02257
-6.905747

0.0000
0.0000
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.955502
0.948086
3.365734
135.9380
-37.81519
128.8379
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

111.9333
14.77192
5.442026
5.583636
5.440517
2.204288

Las instrucciones a seguir para la estimacin de la segunda regresin son:


Instrucciones: Quick/ Estimate equation/ wage c el ae/sample 16 30

58

Curso: Econometra I

Jos Luis Nolazco

Dependent Variable: WAGE


Method: Least Squares
Date: 08/15/10 Time: 15:56
Sample: 16 30
Included observations: 15
Variable

Coefficient

Std. Error

t-Statistic

Prob.

63.02514
2.843575
1.768156

1.215491
0.183090
0.080357

51.85160
15.53100
22.00366

0.0000
0.0000
0.0000

C
EL
AE
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.990356
0.988749
1.009037
12.21788
-19.74545
616.1703
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

104.0667
9.512899
3.032727
3.174337
3.031219
2.256287

La SCR del modelo III se obtiene como suma de las SCR de las dos estimaciones
anteriores. Para ello debe ejecutarse, en la lnea de comandos, la siguiente operacin:
= 135.9380+ 12.21788=148.1559
En el segundo caso, si se estima de forma conjunta el modelo, las instrucciones a seguir
son:
Instrucciones: Quick/ Estimate equation/ wage dv elv aev dm elm aem

Dependent Variable: WAGE


Method: Least Squares
Date: 08/15/10 Time: 16:04
Sample: 1 30
Included observations: 30
Variable

Coefficient

Std. Error

t-Statistic

Prob.

DV
ELV
AEV
DM
ELM
AEM

102.6836
5.555483
-1.742571
63.02514
2.843575
1.768156

2.854146
0.255955
0.186275
2.992942
0.450829
0.197867

35.97699
21.70492
-9.354846
21.05792
6.307436
8.936107

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.969044
0.962595
2.484585
148.1559
-66.52417
2.232038

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.

108.0000
12.84657
4.834945
5.115184
4.924596

59

Curso: Econometra I

Jos Luis Nolazco

Puede comprobarse que la SRCIII obtenida en esta estimacin coincide con la suma de las
SCR de las regresiones anteriores. Asimismo, el valor de las estimaciones de los
parmetros coincide en un caso y en el otro.
Modelo IV: El gnero de los individuos afecta a los salarios a travs de las variables aos de
estudio y experiencia laboral.
Instrucciones: Quick/ Estimate equation/ wage c elv elm aev aem
Dependent Variable: WAGE
Method: Least Squares
Date: 08/15/10 Time: 16:08
Sample: 1 30
Included observations: 30
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
ELV
ELM
AEV
AEM

83.79523
5.906663
1.035201
-0.750007
1.122215

4.448393
0.545567
0.881904
0.333535
0.400682

18.83719
10.82666
1.173826
-2.248662
2.800762

0.0000
0.0000
0.2515
0.0336
0.0097

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.850436
0.826506
5.350932
715.8119
-90.15146
35.53821
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

108.0000
12.84657
6.343430
6.576963
6.418140
1.762148

Una vez estimadas las regresiones se cuenta con la informacin necesaria para analizar la
estabilidad de los parmetros. En este sentido se plantean los contrastes de hiptesis que
permiten verificar dicha estabilidad.
a) Contraste para verificar la estabilidad total del modelo:
Ho : v m

H1 : v m

H o : v m

H1 : v m

Ho : v m

H1 : v m

Fexp

SCRI SCRIII
3

SCRIII
30 6

F243

El estadstico experimental se calcula, ejecutando en la lnea de comandos, la siguiente


operacin:
=((1463.218-148.1559)/3)/( 148.1559/24) = 71.009637

60

Curso: Econometra I

Jos Luis Nolazco

A continuacin y para poder tomar una decisin acerca del contraste planteado, se calcula
la probabilidad a la derecha del estadstico experimental. Para ello, en la lnea de comandos
se ejecuta.
=@FDIST(71.009637,3,24)=4.45512441626E-12
Como esta probabilidad es menor de 0.05, que es el nivel de significacin elegido, el
estadstico experimental est situado en la regin de rechazo de la hiptesis nula, es decir,
existe diferencia entre los salarios de los varones y las mujeres.
b) Contraste para verificar la igualdad de ordenadas suponiendo igualdad en los
coeficientes.

Ho : v m

H1 : v m

H o : v m

Ho : v m

H1 : v m

H1 : v m

Fexp

SCRI SCRII
1

SCRII
30 4

F261

Se calcula, siguiendo el mismo procedimiento que en el caso anterior, el estadstico


experimental y su probabilidad, para este contraste:
=((1463.218-1178.591)/1)/( 1178.591/26) = 6.27893985276
=@FDIST(6.27893985276,1,26)= 0.01880964
Este resultado implica que, a un 5% de significacin, se rechaza la hiptesis nula, es decir,
las ordenadas en el origen deben considerarse distintas a un 95% de confianza.
c) Contraste para verificar la igualdad de los coeficientes suponiendo distintas
ordenadas en el origen

H o : v m

H1 : v m

Ho : v m

H1 : v m

Ho : v m

Fexp

SCRII SCRIII
2

SCRIII
30 6

H1 : v m

F242

61

Curso: Econometra I

Jos Luis Nolazco

En la lnea de comandos se calculan los valores numricos cuyos resultados pueden


observarse en la lnea de estado:
=((1178.591-148.1559)/2)/( 148.1559/24) = 83.4608760097
=@FDIST(83.4608760097,2,24)= 1.55693315704E-11
El estadstico experimental vuelve a incluirse dentro de la regin de rechazo de la hiptesis
nula. Los resultados obtenidos en los contraste realizados en el modelo III, de ruptura
total, como el ms adecuado para explicar el modelo de salarios propuesto.
d) Contraste con variables ficticias
En este apartado se va desarrollar el mismo estudio anterior siguiendo un procedimiento
alternativo. En primer lugar se especifica, a partir de las variables ficticias generadas para
los varones, un modelo como el siguiente:
wage i 0 1 * DVi 1 * AEi 2 * AEVi 1 * ELi 2 * ELVi ui

Obsrvese que al incluir el termino independiente solo se considera una ficticia por
modalidad, DV1, AEV y ELV a fin de evitar la trampa de las ficticias o dictomas.
En este modelo se contempla la posibilidad de existencia de diferencias salariales entre
varones y mujeres, tanto en la ordenada en el origen como en los aos de estudio y
experiencia laboral tomando como individuo de referencia a las mujeres. Para estimar este
modelo las instrucciones a ejecutar son:
Instrucciones: Quick/ Estimate equation/ wage c dv ae aev el elv
Dependent Variable: WAGE
Method: Least Squares
Date: 08/15/10 Time: 16:59
Sample: 1 30
Included observations: 30
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
DV
AE
AEV
EL
ELV

63.02514
39.65845
1.768156
-3.510727
2.843575
2.711908

2.992942
4.135680
0.197867
0.271752
0.450829
0.518420

21.05792
9.589341
8.936107
-12.91884
6.307436
5.231097

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.969044
0.962595
2.484585
148.1559
-66.52417
150.2583
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

108.0000
12.84657
4.834945
5.115184
4.924596
2.232038

62

Curso: Econometra I

Jos Luis Nolazco

A partir de este resultado obtenido en este modelo se contrasta la significatividad conjunta


de las variables referidas exclusivamente a los varones (DV, AEV y ELV). Para ello, las
instrucciones a ejecutar en E-views, desde la estimacin MCO del modelo de regresin,
son:
View/Coefficient diagnostics/ Wald test coefficient restrictions
C(2)=0,C(4)=0,C(6)=0
El resultado obtenido es:
Wald Test:
Equation: CONTRASTEVARIABLSFICTICI
Test Statistic
F-statistic
Chi-square

Value

df

Probability

71.00961
213.0288

(3, 24)
3

0.0000
0.0000

Value

Std. Err.

39.65845
-3.510727
2.711908

4.135680
0.271752
0.518420

Null Hypothesis: C(2)=0,C(4)=0,C(6)=0


Null Hypothesis Summary:
Normalized Restriction (= 0)
C(2)
C(4)
C(6)
Restrictions are linear in coefficients.

Este resultado permite comprobar, una vez ms, que si existen diferencias significativas en
los salaries por el hecho de ser varn o mujer, es decir, una vez contrastados los posibles
efectos diferenciales de las variables se comprueba que se rechaza la hiptesis nula, es decir,
que estos regresores si son significativos o relevantes en la explicacin del salario.

63

Curso: Econometra I

Jos Luis Nolazco

CAPITULO 4
PERTURBACIONES NO ESFERICAS:
HETEROSCEDASTICIDAD Y AUTOCORRELACION

4.1 CONDICIONES DE GAUSS-MARKOV


Antes de empezar con los problemas de las perturbaciones no esfricas, primero es
primordial ver las cuatro condiciones de Gauss-Markov para el planteamiento del modelo
lineal general. Suponiendo una ecuacin de regresin de la forma:
y xu

Estas condiciones (que son parte de los supuestos del modelo lineal general) asumen que el
trmino de error o perturbacin puede resumirse en:

E (ui ) 0 para todo i

Var (ui ) 2 (constante) para todo i.

cov(ui u j ) 0 para todo i j .

cov( xiui ) 0 (lo cual implica que las variables explicativas son no estocsticas).

El segundo y tercer supuesto se pueden resumir en trminos matriciales (para el modelo


lineal general) a travs de la siguiente expresin:

E ( ') 2 I n
Cuando se cumplen estas dos condiciones se dice que los errores son esfricos. La
violacin del segundo supuesto da origen al problema de heteroscedasticidad e implica
que la varianza del trmino de error no es constante para cada observacin. Por otro lado,
si los elementos fuera de la diagonal de la matriz de varianzas y covarianzas de los errores
son distintos de cero, se viola el tercer supuesto y como resultado tendremos el problema
de autocorrelacin. Este problema significa que los trminos de error no son
independientes, es decir, el tamao del error para un periodo determinado afecta el valor
del periodo u observacin siguiente.
En general, a partir de la discusin anterior nos queda la impresin de que estos problemas
no deberan existir porque van a afectar las propiedades del estimador de mnimos
cuadrados ordinarios. De hecho, sabemos que si no se cumplen las condiciones de Gauss-

64

Curso: Econometra I

Jos Luis Nolazco

Markov tendremos un estimador que ya no ser el mejor estimador linealmente insesgado


(MELI).

4.2 HETEROSCEDASTICIDAD

La segunda condicin de Gauss - Markov implica que la varianza de la perturbacin debe


ser constante para cada observacin. Si este supuesto se verifica para toda la muestra se
puede concluir que los errores son homocedsticos. En este sentido, el supuesto de
homocedasticidad implica que la distribucin relevante para cada observacin es la misma.
En algunos casos, sin embargo, puede ser ms razonable pensar que la distribucin del
trmino de error es diferente para cada observacin en cuyo caso su varianza tambin
diferira.
Por ejemplo, el hecho de que la varianza de la perturbacin muestre un comportamiento
creciente para cada observacin no significa que el error deba necesariamente registrar un
valor muy alto en las ltimas observaciones pero s implica que la probabilidad de tener un
valor errtico sea mayor. Este es un ejemplo de heterocedasticidad la cual, en trminos
generales, significa que el error muestra diferentes dispersiones para cada observacin o, lo
que es lo mismo, que la probabilidad de que el trmino de error tome un determinado valor
es diferente para cada observacin.
A manera de resumen, sea el modelo lineal general: Y X
La matriz de varianzas y covarianzas en presencia de heteroscedasticidad est dado por:
E ( ') 2 donde I n .

4.2.1 Por qu se presenta la heteroscedasticidad?

Relacin entre las variables explicativas y la varianza del error.


Datos agregados
Errores de especificacin

4.2.2 DETECCION Y CORRECCION - APLICACIONES

Ejercicio. Supongamos que a un alumno de la Agraria se le pide estimar la relacin


existente entre el empleo y el PIB en algunos de departamentos del Per. Para ello se
utilizan los datos agregados del Producto Bruto Interno en millones de soles y el nmero
de ocupados (medias anuales en miles de personas) para el ao 2008, que aparecen en la
siguiente tabla.

65

Curso: Econometra I

Jos Luis Nolazco


Observaciones

PIB

Arequipa
Piura
Chiclayo
Trujillo
Iquitos
Huancavelica
Hunuco
La Libertad
Lima
Ayacucho
Junn
Lambayeque
Cusco
Ica
Amazonas
Cajamarca
Puno
Ancash

6895665
1747221
1338540
1150586
1830265
660038
2980371
1846983
9511088
4949357
963305
2752518
7935591
1240645
840372
3251025
384298
135876

EMPLEO
1834.1
412.3
351.2
252.9
446.4
162.3
841.6
528.3
2222.9
1276.7
302.6
1012.8
1636
317
183.9
708.5
90.3
29.7

Existe la posibilidad de que haya heteroscedasticidad en la varianza de los errores


dependiendo directamente de la variable empleo o alguna transformacin de ella. Se pide
verificar la existencia de heteroscedasticidad utilizando los siguientes mtodos:
a)
b)
c)
d)

Mtodo grafico
Test de Golfeld-Quandt
Test de Breusch-Pagan
Test de White

Encontrar la forma de la heteroscedasticidad, si es que existe, y en caso afirmativo


corregirla:
e) Utilizando la estimacin por mnimo cuadrados generalizados

Solucin
Primero abrimos el workfile llamado ht1.wf1, ahora para el anlisis de la
heteroscedasticidad es necesario estimar el modelo por MCO y obtener una serie de
residuos mnimo cuadrticos que se utilizaran para la realizacin de algunos test de
heteroscedasticidad.
Instrucciones: Quick/Estimate equation/ pib c empleo
Dependent Variable: PIB
Method: Least Squares
Date: 08/29/10 Time: 15:27

66

Curso: Econometra I

Jos Luis Nolazco

Sample: 1 18
Included observations: 18
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
EMPLEO

-118413.4
4167.111

187797.8
199.5353

-0.630536
20.88407

0.5372
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.964613
0.962401
532101.5
4.53E+12
-261.8035
436.1445
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

2800764.
2744155.
29.31150
29.41043
29.32514
2.513420

Anlisis de la heteroscedasticidad: El anlisis puede llevarse a cabo por distintos


mtodos que se presentan a continuacin.
a) Mtodos grficos: De la regresin original se ha obtenido la serie de residuos que es
necesarios renombrar. Se utiliza adems de esta, la variable empleo, as como distintas
variantes de ambas: sus cuadrados y el valor absoluto de los residuos.

Instrucciones: Genr
empleo2=empleo^2

r=resid;

Genr

r2=r^2;

Genr

absr=abs(r);

Genr

En primer lugar, se realiza la representacin grafica del producto interno bruto frente a la
variable empleo. Esta representacin permite observar que a niveles bajos de PIB existe
pequea variabilidad en la ocupacin y, sin embargo, la dispersin aumenta a medida que lo
hace el PIB.
Instrucciones: Quick/graph/ empleo pib /scatter
10,000,000

8,000,000

PIB

6,000,000

4,000,000

2,000,000

0
0

400

800

1,200

1,600

2,000

2,400

EMPLEO

67

Curso: Econometra I

Jos Luis Nolazco

En segundo lugar, se puede analizar tambin de forma grafica la relacin existente entre los
residuos y la variable explicativa: a valores elevados de la variable empleo le corresponden
valores tambin elevados de los residuos.
Instrucciones: Quick/graph/ empleo r /scatter

1,500,000

1,000,000

500,000

-500,000

-1,000,000

-1,500,000
0

400

800

1,200

1,600

2,000

2,400

EMPLEO

Instrucciones: Quick/graph/ empleo r2 /scatter


2.0E+12

1.6E+12

R2

1.2E+12

8.0E+11

4.0E+11

0.0E+00
0

400

800

1,200

1,600

2,000

2,400

EMPLEO

b) Test de Goldfeld-Quandt

Ho: Homocedasticidad. La varianza es constante en toda la muestra.


Ha: Heterocedasticidad. La varianza no es constante en toda la muestra.

68

Curso: Econometra I

Fexp

Jos Luis Nolazco

SCR2
)/2 k
F((nncc)/2
k
SCR1

Este test requiere ordenar de forma ascendente todas las variables segn el orden
creciente de la variable que se supone causante de la heteroscedasticidad, variable
empleo. Para ello se dispone de un comando que las ordena automticamente, pero
como este es el nico test que lo requiere es necesario generar una serie de tendencia
que permita recolocar las series en su posicin original.
Instrucciones: Genr/ t=@trend(1)
La nueva serie toma valores correlativos empezando por el cero. Servir para reordenar
todas las variables una vez realizado el contraste. A continuacin, se procede a la
recolocacin de todas las variables segn el orden creciente de la variable que se supone
causa la heteroscedasticidad.
Instrucciones: Procs/Sort current page /empleo/ascending o sort empleo
Se obtienen dos submuestras con las primeras (n-c)/2 observaciones y las (n-c)/2
ltimas observaciones (normalmente c=n/3) y se ajustan dos regresiones por separado
para cada submuestra.
Instrucciones: Quick/ estimate equation / pib c empleo/ smpl 1 6

Dependent Variable: PIB


Method: Least Squares
Date: 08/29/10 Time: 17:57
Sample: 1 6
Included observations: 6
Variable
C
EMPLEO
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

Coefficient

Std. Error

t-Statistic

Prob.

88887.67
3524.664

121839.2
629.5643

0.729549
5.598576

0.5061
0.0050

0.886827
0.858533
141817.5
8.04E+10
-78.47101
31.34406
0.004997

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

689079.2
377053.5
26.82367
26.75426
26.54580
1.844886

Instrucciones: Quick/ estimate equation / pib c empleo/ smpl 13 18


Dependent Variable: PIB
Method: Least Squares

69

Curso: Econometra I

Jos Luis Nolazco

Date: 08/29/10 Time: 18:01


Sample: 13 18
Included observations: 6
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
EMPLEO

-1554291.
5026.047

1129850.
730.6937

-1.375661
6.878459

0.2409
0.0023

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.922047
0.902559
854712.9
2.92E+12
-89.24836
47.31320
0.002341

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

5837432.
2738103.
30.41612
30.34671
30.13825
2.709093

Finalmente, para obtener el estadstico de prueba del test de Goldfeld-Quandt es


necesario dividir los valores de las sumas de cuadrados de residuos de las dos
regresiones anteriores. Se puede efectuar esta operacin en la lnea de comandos.
=2.92E+12/8.04E+10= 36.3184079602
A continuacin se calcula la probabilidad a la derecha de este punto bajo la hiptesis
nula. En la lnea de comandos se ejecuta:
=@fdist(36.3184079602,4,4)= 0.00211566325386
Es decir, puesto que la probabilidad a la derecha es menor que un nivel de significacin
de 0.05, se rechaza la hiptesis de varianza constante para toda la muestra. Antes de
continuar con el resto del ejercicio, es necesario volver a colocar las series en su
posicin original.
Instrucciones: Procs/Sort current page /t/ascending o sort t
c) Test de Breusch-Pagan

Ho: Homocedasticidad. La varianza es constante en toda la muestra.


Ha: Heterocedasticidad. La varianza no es constante en toda la muestra.
2
X exp
SCE / 2 X p21

Donde SCE es la suma de cuadrados explicados de una regresin auxiliar en la que la


variable dependiente (G) es el cociente entre el cuadrado de los residuos de la estimacin
del modelo original (R2) y la estimacin maximoversimil de la varianza de las
perturbaciones, esto es:

70

Curso: Econometra I

Jos Luis Nolazco


2
2
G j e i2 / MV
y MV
e i2 / n

Para calcular el estimador maximoverosimil se efecta la siguiente operacin en la lnea de


comandos.
=4.53E+12/18 =251666666667
A continuacin se procede a calcular la variable G y seguidamente, se estima la regresin
auxiliar.
GENR/G= R2/251666666667
QUICK/ESTIMATE EQUATION/ G C EMPLEO
Dependent Variable: G
Method: Least Squares
Date: 08/29/10 Time: 18:39
Sample: 1 18
Included observations: 18
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
EMPLEO

-0.023796
0.001461

0.683299
0.000726

-0.034825
2.013069

0.9727
0.0612

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.202092
0.152223
1.936041
59.97209
-36.37246
4.052445
0.061249

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

1.000025
2.102683
4.263607
4.362537
4.277248
1.119032

De esta regresin se necesita el valor de la suma de cuadrados explicados. Para obtenerla se


utiliza la suma de cuadrados residuales y el coeficiente de determinacin:
SCT SCR / 1 R 2

SCE SCT SCR

Efectuando estas operaciones en la lnea de comandos, se obtiene los siguientes resultados:


SCT=59.97209/1-0.202092=75.1616602415
SCE=75.1616602415-59.97209=15.1895702415
El estadstico experimental obtenido es el siguiente:
X2(CHISQ)= SCE/2=7.59478512075

71

Curso: Econometra I

Jos Luis Nolazco

Y la probabilidad a la derecha de este punto bajo hiptesis nula es:


= @CHISQ(7.59478512075,1)= 0.00585373719225
Como conclusin se puede decir que a un nivel de confianza del 95% se rechaza la
hiptesis nula de varianza constante para toda la muestra.

d) Test de White

H0 =Homoscedasticidad. La varianza es constante en toda la muestra.


H1 =Heteroscedasticidad. La varianza no es constante en toda la muestra.
2
X exp
n.R 2 X p21

Donde el coeficiente de determinacin se obtiene a partir de una regresin auxiliar de


los residuos al cuadrado sobre las variables explicativas, sus cuadrados y sus productos
cruzados. Este procedimiento esta automatizado en el paquete E-views, por lo que no
ser necesario estimar esta regresin auxiliar. El procedimiento a seguir una vez
recuperadas la regresin inicial (eq1) es el siguiente:
VIEWS/RESIDUAL DIAGNOSTICS/ HETEROSKEDASTICITY TEST
El resultado obtenido es el siguiente:
Heteroskedasticity Test: White
F-statistic
Obs*R-squared
Scaled explained SS

3.698591
5.944912
9.806474

Prob. F(2,15)
Prob. Chi-Square(2)
Prob. Chi-Square(2)

0.0495
0.0512
0.0074

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 08/29/10 Time: 18:59
Sample: 1 18
Included observations: 18
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
EMPLEO
EMPLEO^2

-3.03E+11
1.44E+09
-512657.3

2.39E+11
6.56E+08
302565.4

-1.266662
2.195207
-1.694368

0.2246
0.0443
0.1109

R-squared
Adjusted R-squared

0.330273
0.240976

Mean dependent var


S.D. dependent var

2.52E+11
5.29E+11

72

Curso: Econometra I
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

Jos Luis Nolazco


4.61E+11
3.19E+24
-507.3210
3.698591
0.049458

Akaike info criterion


Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

56.70234
56.85073
56.72280
1.230263

Es decir, se obtiene el estadstico experimental que es 5.944912 y la probabilidad que


deja es 0.0512, el cual es menor que 0.05, por lo que se rechaza la hiptesis nula de
varianza constante en toda la muestra (es decir existe heteroscedasticidad).

Correccin de la Heteroscedasticidad
De las regresiones anteriores se tiene aquella que, teniendo el coeficiente de regresin
significativamente distinto de cero, presente un coeficiente de determinacin mayor. Su
correspondiente variable explicativa da una idea de la forma de la Heteroscedasticidad.
Para solucionar el problema de la heteroscedasticidad, vemos que la varianza de la variable aleatoria
es proporcional a la raz cuadrada de la variable empleo, es decir la variable rempleo. De ello se
deduce:

rempleo * I
1 rempleo 1 * I
P ' P 1
P rempleo 1 * I rempleo 1/2 * I
Donde P es la matriz de transformacin, el cual servir para que la varianza sea homoscedastica, e I
es la matriz identidad.
Una vez conocida la matriz de transformacin, se puede premultiplicar el modelo y aplicar MCO al
modelo transformado. La variable aleatoria de perturbacin del modelo transformado, ya cumple
las especificaciones del modelo de regresin lineal clsico, y adems, los estimadores obtenidos son
los estimadores por MCG factibles. Se necesita en primer lugar generar esa matriz de
transformacin:
GENR / Rempleo =SQR (empleo)
GENR /R4empleo =SQR (Rempleo)
GENR/ IR4empleo=1/R4empleo
e) Estimacin por mnimos cuadrados ponderados

73

Curso: Econometra I

Jos Luis Nolazco

Instrucciones: Quick/Estimate equation/ pib c empleo/options / Type: inverse


standar deviation/ weight: ir4empleo
Dependent Variable: PIB
Method: Least Squares
Date: 08/29/10 Time: 19:52
Sample: 1 18
Included observations: 18
Weighting series: IR4EMPLEO
Weight type: Inverse standard deviation (EViews default scaling)
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
EMPLEO

-36343.78
4070.215

120156.1
184.8007

-0.302471
22.02489

0.7662
0.0000

Weighted Statistics
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.968070
0.966074
403036.6
2.60E+12
-256.8029
485.0958
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
Weighted mean dep.

2218625.
1693343.
28.75588
28.85481
28.76952
2.473158
1690105.

Ahora para comprobar si ya no existe heteroscedasticidad, realizamos el test de White,


obteniendo:
Heteroskedasticity Test: White
F-statistic
Obs*R-squared
Scaled explained SS

2.048964
5.491868
8.897817

Prob. F(3,14)
Prob. Chi-Square(3)
Prob. Chi-Square(3)

0.1532
0.1391
0.0307

Test Equation:
Dependent Variable: WGT_RESID^2
Method: Least Squares
Date: 08/29/10 Time: 19:54
Sample: 1 18
Included observations: 18
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
WGT^2
EMPLEO^2*WGT^2
EMPLEO*WGT^2

-1.24E+12
2.81E+11
-720392.7
3.05E+09

8.15E+11
2.29E+11
501102.1
1.73E+09

-1.519519
1.227975
-1.437616
1.763590

0.1509
0.2397
0.1725
0.0996

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic

0.305104
0.156197
2.76E+11
1.07E+24
-497.4903
2.048964

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

1.44E+11
3.01E+11
55.72114
55.91900
55.74843
1.323239

74

Curso: Econometra I
Prob(F-statistic)

Jos Luis Nolazco


0.153247

La probabilidad que deja ala derecha del estadstico indica que no se puede rechazar la
hiptesis nula de varianza constante en toda la muestra, es decir, el modelo transformado
ya es homoscedastico.

4.3 AUTOCORRELACION
La tercera condicin de Gauss-Markov implica que el trmino de error para cada
observacin se determina independientemente de los valores que pueda arrojar en el resto
de observaciones de la muestra. Especficamente, la independencia de las perturbaciones
implica que su covarianza es cero (Cov (uiuj) = 0 para todo i j ). Cuando esta condicin
no se cumple se dice que el error presenta autocorrelacin. Los problemas asociados a la
presencia de autocorrelacin son similares a los que enfrentamos cuando los errores son
heteroscedsticos.
Los estimadores MCO se mantienen insesgados pero dejan de ser eficientes. Esto implica
que la varianza aumenta por lo que la volatilidad de los estimadores aumenta. Sin embargo,
en trminos de la estimacin en la prctica ocurre lo contrario. Dado que los programas
economtricos utilizan el estimador MCO, lo que ocurre es que calculan la varianza
siguiendo la frmula tradicional de MCO la cual nos da desviaciones estndar menores. Por
tanto, stas son usualmente subestimadas lo que conduce a una sobreestimacin de los
estadsticos-t y a problemas de inferencia dado que nuestras conclusiones seran errneas.
Con referencia al problema asociado a la eficiencia de los estimadores MCO, y al igual que
para el caso de heterocedasticidad, basta encontrar otro procedimiento para la estimacin
de los parmetros que arroje estimadores de menor varianza para descartar la eficiencia de
los estimadores MCO. En este sentido, y como alternativa a la estimacin MCO, la
estimacin por mnimos cuadrados generalizados arroja estimadores ms eficientes en el
sentido de presentar una menor varianza.

4.3.1 Por qu se presenta la autocorrelacin?

Presencia de ciclos econmicos


Presencia de relaciones no lineales
Mala especificacin

4.3.2 DETECCION Y CORRECCION - APLICACIONES

Ejercicio. Se ha recogido informacin hipottica macroeconmica del Per, el cual se


usan el consumo pblico (cp) y el producto bruto interno a precios de mercado (pibpm),
ambos en millones de soles, con el objetivo de estimar un modelo de regresin lineal y
comprobar la posible presencia de autocorrelacin en las perturbaciones. Las series toman
los siguientes valores:

75

Curso: Econometra I

Jos Luis Nolazco


obs

PIBPM

CP

1985

28200885

4498034

1986

32323992

4740221

1987

36143972

5159905

1988

40158739

5368137

1989

45044128

5813462

1990

50145195

6197776

1991

54927320

6543696

1992

59104986

6808095

1993

60952584

6971511

1994

64811535

6948140

1995

69780058

7074014

1996

73743261

7141101

1997

77896586

7239097

A partir de dicha informacin, contraste el posible incumplimiento de la hiptesis de no


autocorrelacin por medio de:
a)
b)
c)
d)
e)

f)

Analisis graficos
Test de Durbin-Watson
Correlograma
Tets de Breusch-Godfrey
Sobre esta misma informacin, se propone especificar una nueva forma estableciendo una
relacin lineal del consumo pblico a partir del PIBPM y de un retardo del CP como
factores explicativos. Bajo esta formulacin, pruebe la presencia de autocorrelacin en las
perturbaciones.
En caso de detectar problemas de autocorrelacin, obtenga una estimacin MELI para los
parmetros del modelo.

Solucion: Abrimos primero el workfile llamado ac1.wf1 y estimamos el siguiente modelo


por MCO:
CPt 1 2 * PIBPM t ut

Instrucciones: Quick/Estimate equation/ cp c pibpm


Dependent Variable: CP
Method: Least Squares
Date: 08/29/10 Time: 21:07
Sample: 1985 1997
Included observations: 13
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
PIBPM

3079706.
0.058374

237829.5
0.004282

12.94922
13.63260

0.0000
0.0000

76

Curso: Econometra I

Jos Luis Nolazco

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.944119
0.939039
239828.9
6.33E+11
-178.4002
185.8479
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

6192553.
971351.1
27.75388
27.84079
27.73601
0.343122

A partir de esta estimacin, se genera la serie de los residuos minimo cuadrticos


correspondientes a este ejercicio.
Instrucciones: Genr/ e=resid
a) Contrastes graficos:

Instrucciones: Quick/graph/ e e(-1)/ scatter

400,000
300,000

E(-1)

200,000
100,000
0
-100,000
-200,000
-300,000
-400,000

-200,000

0 100,000

300,000

Se puede observar que los puntos se colocan en el diagrama en el primer y tercer


cuadrante, por lo que puede ser indicativo de presencia de autocorrelacin positiva.
Grafico de los residuos en el tiempo:
Instrucciones: Quick/ graph/ e/ line graph

77

Curso: Econometra I

Jos Luis Nolazco

E
400,000
300,000
200,000
100,000
0
-100,000
-200,000
-300,000
-400,000
85

86

87

88

89

90

91

92

93

94

95

96

97

La representacin grafica de los residuos presenta un comportamiento sistematico,


posiblemente cclico que sigue indicando la posible presencia de problemas de
autocorrelacin.

b) Test de Durbin-Watson

En la salida de regresin original que estimo al comienzo se puede encontrar el estadstico


de Durbin- Watson, que ha sido remarcado en negrita en la salida original: d=0.343122. En
las tablas de Savin-White se pueden obtener los lmites inferior y superior, al 95% de
confianza, con un tamao de muestra igual a 13 y con k variables explicativas=1, D L=1.010
y dU=1.340, por tanto, como d<dL, entonces se rechaza la hiptesis nula, es decir existe
autocorrelacin positiva de orden 1, veamos aqu:
Criterio de decisin:

0.343122

c) Correlograma: Al modelo original se utiliza el correlograma Q (Ljung-Box)


Instrucciones: View/ Residual diagnostics/Correlogram Q-statistic/11 lags

78

Curso: Econometra I

Jos Luis Nolazco

El correlograma de estos residuos muestra un decrecimiento, mientras que la PAC se


observa una banda distinta de 0. Este comportamiento se asocia a un proceso
autorregresivo de orden 1, es decir, un AR(1).
d) Test de Breusch-Godfrey

Para este caso se ira seleccionando progresivamente 1,2, rezagos, hasta que el contraste
de significacin individual del ultimo retardo se situe en la regin de no rechazo de la
hiptesis nula.
Instrucciones: View/residual diagnostics/ serial correlation LM test/1 lags
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
Obs*R-squared

18.71771
8.473176

Prob. F(1,10)
Prob. Chi-Square(1)

0.0015
0.0036

Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 08/29/10 Time: 21:12
Sample: 1985 1997
Included observations: 13
Presample missing value lagged residuals set to zero.
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
PIBPM
RESID(-1)

149133.7
-0.003342
0.974886

151175.4
0.002760
0.225334

0.986495
-1.210686
4.326396

0.3472
0.2539
0.0015

79

Curso: Econometra I
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

Jos Luis Nolazco


0.651783
0.582139
148430.4
2.20E+11
-171.5432
9.358853
0.005120

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

1.79E-11
229618.7
26.85279
26.98317
26.82600
1.278439

E-views ofrece tanto una salida del resultado final como la salida al completo de la
regresin auxiliar de los residuos de MCO en funcin de los regresores del modelo y de los
retardos elegidos de los mismos.
En esta primera opcin, se observa que el estadstico experimental para este test es:
n.R2=8.473176, con una probabilidad asociada de 0.0036 <0.05, que hace situarse a dicho
estadstico en regin critica y, por tanto, se rechaza la hiptesis de no autocorrelacin a un
95% de confianza. El test es dado por lo siguiente:
H0: no existe autocorrelacion
H1: existe autocorrelacion de orden p
2
X exp
n.R 2 X p2

Donde p es el nmero de retardos de los residuos que se introducen en la regresin


auxiliar. Por otra parte, la probabilidad asociada al estadstico t en la regresin auxiliar ,
correspondiente al retardo de los residuos es 0.0015 que por ser menor a 0.05, situa al
estadstico en la regin de rechazo de la hiptesis nula. A continuacin se muestra la salida
correspondiente a la introduccin de dos rezagos de los residuos en la regresin auxiliar.
Instrucciones: View/residual diagnostics/ serial correlation LM test/2 lags

Breusch-Godfrey Serial Correlation LM Test:


F-statistic
Obs*R-squared

10.11549
8.997396

Prob. F(2,9)
Prob. Chi-Square(2)

0.0050
0.0111

Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 08/29/10 Time: 21:14
Sample: 1985 1997
Included observations: 13
Presample missing value lagged residuals set to zero.
Variable

Coefficient

Std. Error

t-Statistic

Prob.

80

Curso: Econometra I
C
PIBPM
RESID(-1)
RESID(-2)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

Jos Luis Nolazco


68270.62
-0.001571
1.216267
-0.428241
0.692107
0.589477
147121.5
1.95E+11
-170.7432
6.743657
0.011152

167332.3
0.003186
0.315142
0.394440

0.407994
-0.493088
3.859431
-1.085692

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

0.6928
0.6338
0.0039
0.3058
1.79E-11
229618.7
26.88357
27.05740
26.84784
1.956964

Al igual que ocurria en el caso anterior, el estadsticos del test de Breusch-Godfrey tiene
una probabilidad asociada de 0.0111<0.05, por tanto se rechaza la hiptesis nula, es decir
existe autocorrelacin. Por otro lado la probabilidad asociada al t experimental es de 0.3058
> 0.05, nose puede rechazar la hiptesis nula, por tanto este segundo rezago ya no es
significativo en el comportamiento de los residuos minimo cuadrticos. La conclusin de
este test es que existe autocorrelacin en las perturbaciones y que es de orden 1.
e) La especificacin alternativa propuesta en este apartado se formaliza mediante la siguiente
ecuacin:

CPt 1 2 * PIBPM t 3 * CPt 1 ut

Al presentar este modelo una especificacin dinmica con la matriz de regresores


estocstica, el contraste de Durbin Watson no se puede utilizar, por lo que se debe recurrir
al contraste h-durbin y al contraste de Breusch-Godfrey. El primero paso para la
realizacin del contraste es la obtencin de la regresin por MCO del modelo especificado:
Instrucciones: Quick/estimate equation/ cp c pibpm cp(-1)
Dependent Variable: CP
Method: Least Squares
Date: 08/29/10 Time: 21:15
Sample (adjusted): 1986 1997
Included observations: 12 after adjustments
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
PIBPM
CP(-1)

780684.3
-0.002714
0.934178

466190.2
0.010880
0.169258

1.674605
-0.249441
5.519250

0.1283
0.8086
0.0004

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.984426
0.980965
119205.9
1.28E+11
-155.5645
284.4366
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

6333763.
864007.5
26.42741
26.54864
26.38253
1.618970

81

Curso: Econometra I

Jos Luis Nolazco

Test de h de Durbin

H0 : 0

No existe autocorrelacion

H1 : 0 1

Existe atucorrelacion: AR (1)

Bajo la hiptesis nula, el estadstico:


h r*

n
AN (0,1)
1 n * var(b1)

La obtencin de los valores necesarios para construir el estadstico se realiza desde la salida de
regresin del modelo estimador por MCO:
r= 1-d/2 =1-1.618970/2=0.190515
var(b3)=(0.169258)2=0.028648271

h 0.190515*

12
0.808436
1 12*0.028648271

El estadstico teorico sigue una distribucin asinttica normal (0,1) que al 95% de confianza, en
contrastes de una sola cola es: ht=1,645, por tanto no se rechaza la hipotests nula.
Analisis con el test de Breusch-Godfrey

Instrucciones: View/residual diagnostics/ serial correlation LM test/1 lags


Breusch-Godfrey Serial Correlation LM Test:
F-statistic
Obs*R-squared

0.107581
0.159231

Prob. F(1,8)
Prob. Chi-Square(1)

0.7513
0.6899

Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 08/29/10 Time: 21:15
Sample: 1986 1997
Included observations: 12
Presample missing value lagged residuals set to zero.
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
PIBPM
CP(-1)
RESID(-1)

98455.69
0.002360
-0.037549
0.136888

575638.5
0.013534
0.211913
0.417347

0.171037
0.174365
-0.177189
0.327996

0.8684
0.8659
0.8638
0.7513

82

Curso: Econometra I
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

Jos Luis Nolazco


0.013269
-0.356755
125595.2
1.26E+11
-155.4843
0.035860
0.990206

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

6.98E-10
107825.8
26.58072
26.74235
26.52087
1.891146

Como se puede observar, tanto el estadstico nR2 como el t experimental tienen


probabilidades asociadas mayores a 0.05 por lo que se situan en regin de aceptacin, no
pudiendo rechazar la hiptesis nula. Es decir ambos test (h durbin y Breusch-Godfrey)
confirman la ausencia de autocorrelacin en las perturbaciones en esta formulacin del
modelo original.
f)

Obtencion de estimadores MELI: Metodo de Cochrane Orcutt

Se debe recordar que el modelo que presentaba problemas de autocorrelacin respondia a la


formulacin inicial del consumo publico en fncion del producto bruto interno a precios de
mercado. Sobre ese modelo ser sobre el que se trate de obtener los estimadores de forma eficiente.
Como ya se ha explicado, en la parte teorica , este test es un criterio de estimacin iterativa para
obtener los mejores estimadores lineales, insesgados y optimos, bajo la especificacin del modelo de
MCG.
Instrucciones: Quick/ Estimate equation/ cp c pibpm ar(1)
Dependent Variable: CP
Method: Least Squares
Date: 08/29/10 Time: 23:42
Sample (adjusted): 1986 1997
Included observations: 12 after adjustments
Convergence achieved after 12 iterations
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
PIBPM
AR(1)

5643278.
0.024402
0.839764

2788228.
0.029292
0.118191

2.023966
0.833054
7.105174

0.0736
0.4264
0.0001

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.984800
0.981422
117764.8
1.25E+11
-155.4185
291.5510
0.000000

Inverted AR Roots

.84

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

6333763.
864007.5
26.40308
26.52431
26.35820
1.484904

Esta estimacin muestra los resultados de la repeticin 12 veces del proceso de C-O para

83

Curso: Econometra I

Jos Luis Nolazco

conseguir la convergencia. Cabe destacar que la variable pibpm pasa a ser no significativa,
mientras que el proceso autorregresivo es significativo, con una probabilidad asociada de
0.0001.
El correlograma de los residuos de esta estimacin corrobora el diagnostico de bueno
comportamiento de la perturbacin:
Instrucciones: view/residual diagnostics/correlogram Q-statistic/10 lags

El estadstico Q de Ljung-Box permite verificar la hiptesis nula de:


H o 1 2 .... 0

Cuando se acepta esta hiptesis se esta indicando que los residuos no estn
autocorrelacionados. En el presente acso, dado que la probabilidad es superior a 0.05 nos
indica que se ha corregido la autocorrelacin, ya que los residuos del nuevo modelo no la
presentan.

84

Curso: Econometra I

Jos Luis Nolazco

CAPITULO 5
MULTICOLINEALIDAD
5.1 RESUMEN TEORICO
La colinealidad est referida a la existencia de una sola relacin lineal entre las variables
explicativas y, por lo tanto, la multicolinealidad se refiere a la existencia de ms de una
relacin lineal. Es importante anotar que la multicolinealidad se refiere slo a relaciones
lineales entre las variables independientes y no a cualquier otro tipo de relacin, as pues, si
xi = xj2, entonces no existir multicolinealidad en el modelo. El problema de la
multicolinealidad est definido por el alto grado de intercorrelacin entre variables
explicativas. Dentro de las violaciones de los supuestos del modelo lineal general, la
multicolinealidad es un problema de grado y noterico como la heterocedasticidad o la
autocorrelacin, ms an, los estimadores obtenidos bajo multicolinealidad, conservan las
propiedades que los define como MELI.
Una cuestin importante que debe analizarse al estudiar los resultados de un modelo de
regresin es el grado de relacin lineal existente entre las observaciones de las variables
explicativas. A este respecto, las posibles situaciones son tres:

Multicolinealidad perfecta: se da cuando existe una relacin lineal exacta entre algunos o
todos los regresiores incluidos en el modelo.
Ortogonalidad: Supone la ausencia de relacin lineal entre algunos o todos los regresores
incluidos en el modelo (raramente ocurre esto).
Multicolinealidad imperfecta: consiste en la existencia de una relacin lineal fuerte entre los
regresores del modelo.

Las posibles fuentes de multicolinealidad son cuatro principalmente:

El mtodo de recoleccin de informacin empleado.


Restricciones sobre el modelo o en la poblacin que es objeto de muestreo.
Especificacin del modelo.
Un modelo sobredeterminado (es cuando un modelo tiene mas variables explicativas que
observaciones).

5.2 CONSECUENCIAS

Varianzas y covarianzas grandes.

Intervalos de confianza ms amplios.

Estadsticos t poco significativos y un R2alto.

Sensibilidad de los estimadores y sus errores estndar ante pequeos cambios en la muestra.

85

Curso: Econometra I

Jos Luis Nolazco

5.3 CORRECCION

Suprimir variables
Utilizacion de informacin adicional
Utilizacion de primeras diferencias
Empleo de cocientes o ratios entre las variables
Aumentar el tamao de muestra
No hacer nada

5.4 APLICACIONES
Ejercicio. Se dispone alguna informacin sobre ingresos de exportacin (inex), el
consumo (cons), los gastos de personal (gper) y los gastos de explotacin (gex) relativos al
sector de metalurgia y fabricacin de productos metalicos para algunos departamentos del
Per.
obs

Departamentos

INEX

CONS

GPER

GEX

Arequipa

302565

180236

51189

274346

Piura

107689

51850

27642

100310

Chiclayo

348540

165985

75735

330602

Trujillo

14619

7991

3813

13253

Iquitos

17812

8693

5356

16000

Huancavelica

117007

59046

30838

115951

Huanuco

134899

75042

30844

126969

La Libertad

74856

43100

17484

70744

Lima

761142

389019

193713

708598

10

Ayacucho

241131

118762

60946

225651

11

Junin

14817

7806

4242

13773

12

Lambayeque

186509

92236

43276

176606

13

Cusco

337445

194993

82411

323954

14

Ica

64181

36941

12675

59007

15

Amazonas

170364

102965

38456

168279

16

Cajamarca

1051196

568539

254043

1037175

17

Puno

50517

28624

10255

46462

El objetivo de este ejercicio es el anlisis de la presencia de colinealidad en un modelo


economtrico cuya especificacin es la siguiente:
inexi 1 2consi 3 gperi 4 gexi ui
La utilizacin de estos regresores puede indicar, a priori, la presencia de colinealidad en el
modelo. Este problema se detectara por distintas vas alternativas y finalmente se
propondr una solucin para su correccin.

Solucion. Primero abrimos el workfile llamado mc1.wf1 , ahora procedemos a estimar el


modelo especificado anteriormente:
Instrucciones: Quick/ estimate equation/ inex c cons gper gex

86

Curso: Econometra I

Jos Luis Nolazco

Dependent Variable: INEX


Method: Least Squares
Date: 08/30/10 Time: 01:11
Sample: 1 17
Included observations: 17
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
CONS
GPER
GEX

3729.609
0.392848
0.663397
0.648393

3240.869
0.276641
0.415687
0.218018

1.150805
1.420067
1.595907
2.974033

0.2705
0.1791
0.1345
0.0108

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.998971
0.998734
9949.564
1.29E+09
-178.3315
1.589402

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

235017.0
279592.1
21.45077
21.64682
4207.203
0.000000

Deteccion de la colinealidad
a) Significacion global y significacin individual de los regresores

En primer lugar, puede observarse que se trata de un modelo globalmente bien estimado.
El estadstico F nos indica que las variables conjuntamente son significativas. Por otra
parte, el valor del coeficiente de determinacin R2 es elevado (0.998971) y al analizar la
significacin individual de las variables explicativas se puede comprobar que las variables
cons y gper no son significativas en la explicacin de los ingresos de explotacin. Cuando
estas dos caractersticas se presentan de forma simultanea (R2 y variables no significativas
individualmente), como ocurre en este caso, puede sospecharse acerca de la presencia de
colinealidad en el modelo.
b) Analisis de la matriz de correlaciones de los regresores

A partir de la matriz de corrrelaciones de los regresores (Rxx) puede profundizarse en el


proceso de deteccin de multicolinealidad en el modelo. Si los regresores fueran
ortogonales, esto es, en ausencia de colinealidad, el determinante de esta matriz tomaria el
valor de 1. A continuacin se realizar la matriz de correlaciones entre las variables
explicativas que se han usado en la estimacin:
Instrucciones: En la lnea de comandos escribir - cor cons gper gex

CONS
GPER
GEX

CONS

GPER

GEX

1.000000
0.990380
0.997769

0.990380
1.000000
0.995341

0.997769
0.995341
1.000000

De la matriz anterior se puede calcular su determinate: Rxx 0.000033924 . El valor que

87

Curso: Econometra I

Jos Luis Nolazco

toma el determinante es muy prximo a cero, lo que tambin es indicativo de la posible


existencia de colinealidad en el modelo. Ademas, en la matriz de correlaciones se refleja una
fuera correlacion entre las variables que han considerado en el modelo.
c) Factor de inflacin de la varianza

Para desarrollar esta metodologa se requiere, previamente, realizar ciertas regresiones


auxiliares, en concreto, se considera cada uno de los regresores como funcin de los dems.
De cada una de estas regresiones se necesita el valor de R2 y, a partir de ellos, pueden
calcularse los aumentos de las varianzas causadas por la multicolinealidad midiendo el
factor de inflacin de la varianza, segn la siguiente expresin:
2
bi2 / bORT
1/ 1 R 2j

Estimacion de la primera regresin auxiliar:


Instrucciones: Quick/estimate equation/ cons c gper gpex
Dependent Variable: CONS
Method: Least Squares
Date: 08/30/10 Time: 03:00
Sample: 1 17
Included observations: 17
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
GPER
GEX

2079.209
-0.639877
0.709049

3081.281
0.363360
0.091938

0.674787
-1.760998
7.712272

0.5108
0.1001
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.996352
0.995831
9612.225
1.29E+09
-178.3751
1.937222

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

125401.6
148861.9
21.33824
21.48528
1911.709
0.000000

Puede calcular el factor de inflacin de la varianza (FIV) ejecutando en la lnea de


comandos la siguiente operacin:
=1/(1-0.996352)= 274.122807018
Estimacion de la segunda regresin auxiliar:
Instrucciones: Quick/estimate equation/ gper c cons gex
Dependent Variable: GPER

88

Curso: Econometra I

Jos Luis Nolazco

Method: Least Squares


Date: 08/30/10 Time: 03:02
Sample: 1 17
Included observations: 17
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
CONS
GEX

-182.0407
-0.283398
0.407116

2083.114
0.160930
0.088371

-0.087389
-1.760998
4.606894

0.9316
0.1001
0.0004

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.992389
0.991302
6396.967
5.73E+08
-171.4525
1.812016

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

55465.76
68591.10
20.52382
20.67086
912.7659
0.000000

Calculo del factor de inflacin:


=1/(1-0.992389)=131.388779398
Estimacion de la tercera regresin auxiliar:
Instrucciones: Quick/estimate equation/ gex c cons gper

Dependent Variable: GEX


Method: Least Squares
Date: 08/30/10 Time: 03:06
Sample: 1 17
Included observations: 17
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
CONS
GPER

-1270.813
1.141627
1.480014

3958.333
0.148027
0.321261

-0.321048
7.712272
4.606894

0.7529
0.0000
0.0004

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.998229
0.997976
12196.85
2.08E+09
-182.4235
2.131833

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

223981.2
271088.6
21.81453
21.96157
3945.000
0.000000

Calculo del factor de inflacin:


=1/(1-0.998229)=564.652738566
Los factores multiplicativos alcanzan valores elevados en los tres casos, por lo que puede
considerarse que la varianza de los coeficientes del modelo original se encuentra muy inflada, por
lo que se toman como no significativos regresores que si podran serlo. Como los valores que

89

Curso: Econometra I

Jos Luis Nolazco

toman estos coeficientes de determinacin son inferiores, pero muy prximos al de la regresin
inicial (0.998971), puede considerarse que, aunque no a un nivel preocupante, si existe colinealidad
entre los regresores del modelo.

d) Correccion de la colinealidad

Aceptada la presencia de colinealidad en el modelo se plantea ahora su correccin. Para ello


se procede a estimar nuevamente el modelo especificado inicialmente corrigiendo el
problema que se ha detectado mediante la divisin de todas las variables entre la variable
peroc. Esta variable, que se encuentra en el workfile de datos, incluye informacin relativa
de las personas ocupadas en el sector de actividad econmica considerado para los 17
departamentos mostrados. Se ha elegido esta variable por que constituye un factor de escala
de todas las incluidas en el modelo y su divisin por dicho factro de escala puede
representar la solucin de multicolinealidad que presenta el modelo.
Para obtener las variables corregidas basta dividirla entre peroc utilizando la sentencia
correspondiente a la generacin de variables. En este caso estas variables transformadas se
nombraran aadiendo una c a su nombre original. Instrucciones:
Genr/ inexc=inex/peroc
Genr/ consc=cons/peroc
Genr/gperc=gper/peroc
Genr/gexc=gex/peroc
El modelo transformado puede ser estimador siguiendo las siguientes instrucciones:
Instrucciones: Quick/estimate equation/ inex c consc gperc gexc
Dependent Variable: INEXC
Method: Least Squares
Date: 08/30/10 Time: 03:31
Sample: 1 17
Included observations: 17
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
CONSC
GPERC
GEXC

1.466301
-0.257027
-1.220936
1.379961

0.280286
0.142161
0.321050
0.132546

5.231453
-1.808005
-3.802943
10.41122

0.0002
0.0938
0.0022
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.997072
0.996397
0.241909
0.760758
2.284594
2.149958

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

12.37447
4.029936
0.201812
0.397863
1475.769
0.000000

90

Curso: Econometra I

Jos Luis Nolazco

La estimacion obtenida muestra un modelo globalmente significativo, con un coeficiente de


determinacion elevado, pero el regresor consc no resulta ser significativo individualmente.
Por ello es aconsejable suprimir esta variable del modelo y realizar una nueva estimacin:
Instrucciones: Quick/estimate equation/ inex c gperc gexc
Dependent Variable: INEXC
Method: Least Squares
Date: 08/30/10 Time: 03:32
Sample: 1 17
Included observations: 17
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
GPERC
GEXC

1.154356
-0.795770
1.155360

0.238115
0.235620
0.049824

4.847894
-3.377348
23.18861

0.0003
0.0045
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.996336
0.995813
0.260775
0.952053
0.378003
1.713325

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

12.37447
4.029936
0.308470
0.455508
1903.527
0.000000

En esta estimacin puede apreciarse que el coeficiente R2 sigue alcanzando un nivel


elevado, prcticamente el mismo que en el modelo inicial, los regresores son
conjuntamente significativos e individualmente tambin. Puede considerarse entonces que
este modelo transformado es adecuado para explicar los ingresos de explotacin, que en
este caso se realiza corrigiendo por las personas ocupadas.

91