You are on page 1of 35

INV- Modelos no lineales en GRETL/2011-II

APLICACIN DE MODELOS NO LINEALES CON VARIABLE


DEPENDIENTE LIMITADA (LOGIT, PROBIT) EN GRETL
Diego Esteban Eslava Avendao 1
diciembre de 2011
Resumen:
El modelo de regresin lineal clsico no siempre es una buena aproximacin en la
explicacin y anlisis de fenmenos econmicos debido a que los problemas que se
buscan modelar pueden presentar caractersticas que hacen que las estimaciones bajo
este modelo no sean adecuadas. Por tal motivo, esta investigacin tiene como objetivo
presentar al lector la aplicacin de dos modelos (Logit y Probit) que buscan solucionar dos
problemas: considerar la variable dependiente limitada o binaria, y, asumir que la
probabilidad de que un evento pase no est relacionada linealmente con las variables
explicativas. Para la aplicacin de dichos modelos se van a describir los procesos
necesarios para su estimacin en GRETL (The Gnu Regression, econometrics and Timeseries Library) como un software alternativo a los usualmente utilizados, por lo que se
har una descripcin bsica del software, se aplicarn los modelos Logit y Probit en ste y
se evaluarn los resultados respecto a uno de los programas ms reconocidos: Stata.

Palabras Clave: Modelo de Probabilidad Lineal, Logit, Probit, GRETL, Stata.

APPLICATION OF NON-LINEAR MODELS WITH LIMITED


ENDOGENOUS VARIABLE (LOGIT, PROBIT) USING GRETL
Abstract:
The classic linear regression model is not always a useful approximation for explaining
and analyzing the economic phenomena, that is because some problems researchers try
to model may have characteristics that make estimations not appropriate under this
model. Therefore, this research aims to present the application of two models (Logit and
Probit) useful for solving two specific problems: to assume the endogenous variable
limited or binary, and, to assume the probability that an event happens is not linearly
associated with the exogenous variables. The processes needed for the application of
those models will be described in GRETL (The Gnu Regression, econometrics and Timeseries Library) as alternative software to the ones usually used. A basic description of the
software and the application of Logit and Probit using GRETL will be provided in this
document; in addition the results will be evaluated in contrast to one of the most known
software: Stata.

Keywords: Linear Probability Model, Logit, Probit, GRETL, Stata.

Estudiante de Economa de la Facultad de Ciencias Econmicas de la Universidad Nacional de


Colombia, y monitor de la Unidad de Informtica y Comunicaciones de la Facultad de Ciencias
Econmicas. Correo Electrnico: deeslavaa@unal.edu.co

INV- Modelos no lineales en GRETL/2011-II

Estudiantes Auxiliares:
Camilo Alexandry Pea Talero
Cristian Andrs Hernndez Caro
Claudia Patricia Ospina Aldana
Daniel Francisco Rojas Martn
David Camilo Snchez Zambrano
David Mauricio Mahecha Salas
Diego Esteban Eslava Avendao
Edward F. Yanquen Briez
Gloria Stella Barrera Ardila
Ivn Albeiro Cabezas Martnez
Javier Alejandro Ortiz Varela
Jeimmy Paola Muoz
Juan Carlos Tarapuez Roa
Juan David Vega Baquero
Juan Fernando Lpez Prieto
Leonardo Alexander Crdenas
Lina Marcela Igua Torres
Mara Paula Contreras Navarrete
Paola Alejandra Alvarado Castillo
Viviana Contreras Moreno
Viviana Mara Oquendo

Director Unidad Informtica:


Henry Martnez Sarmiento
Tutor Investigacin:
Juan Carlos Tarapuez roa.
Coordinadores:
Jasmin Guerra Crdenas
Juan Felipe Reyes Rodrguez
Coordinador Servicios Web:
John Jairo Vargas
Analista de Infraestructura y
Comunicaciones:
Diego Alejandro Jimnez Arvalo
Analista de Sistemas de
Informacin:
Vctor Hugo Ramos Ramos

Este documento es resultado de un


trabajo conjunto y coordinado de los
integrantes de la Unidad de Informtica y
Comunicaciones de la Facultad de
Ciencias Econmicas de la Universidad
Nacional de Colombia.

Esta obra est bajo una licencia reconocimiento no comercial 2.5


Colombia de Creative Commons. Para ver una copia de esta
licencia, visite http://creativecommons.org/licenses/by/2.5/co/ o
enve una carta a Creative Commons, 171second street, suite 30
San Francisco, California 94105, USA.

INV- Modelos no lineales en GRETL/2011-II

APLICACIN DE MODELOS NO LINEALES DE VARIABLE


DEPENDIENTE LIMITADA (LOGIT, PROBIT) EN GRETL
Contenido
1.

INTRODUCCIN. ..................................................................................................................5
1.1. PERTINENCIA DE LA APLICACIN DE MODELOS NO LINEALES Y
GRETL EN LA FCE...................................................................................................................5

2.

DESCRIPCIN BSICA DE GRETL. ...............................................................................7


2.1.

2.1.1.

Linux. .......................................................................................................................7

2.1.2.

MS Windows...........................................................................................................8

2.2.

Ventana Principal .................................................................................................8

2.2.2.

Importacin de archivos .....................................................................................9

2.2.3.

Herramientas de trabajo ...................................................................................11

ANLISIS ESTADSTICO DESCRIPTIVO Y EDICIN DE VARIABLES. ......11

2.3.1.

Estadsticos y grficos descriptivos. .............................................................12

2.3.2.

Transformacin y generacin de nuevas variables. .................................15

APLICACIN DE MODELOS ECONOMTRICOS. ....................................................17


3.1.

4.

EXPLORACIN BSICA DEL PROGRAMA. ..........................................................8

2.2.1.

2.3.

3.

INSTALACIN. ...............................................................................................................7

MNIMOS CUADRADOS ORDINARIOS. ...............................................................17

3.1.1.

Contraste de supuestos. ...................................................................................18

3.1.2.

Intervalos de confianza. ....................................................................................18

MODELOS CON VARIABLE DEPENDIENTE BINARIA ............................................19


4.1.

MODELO DE PROBABILIDAD LINEAL (MPL). ...................................................19

4.1.1.
4.2.

Desventajas del MPL ..........................................................................................21

MODELOS NO LINEALES PARA RESPUESTA BINARIA. ................................21

4.2.1.

Interpretacin de las estimaciones de los modelos Logit y Probit ........24

4.2.2.

Pruebas de hiptesis mltiples. .....................................................................26

4.3.

CONCLUSIONES.........................................................................................................27

INV- Modelos no lineales en GRETL/2011-II


5.

APLICACIN DE MODELOS LOGIT Y PROBIT EN GRETL. ..................................27

6.

APLICACIN DE LOGIT Y PROBIT EN STATA. .........................................................31

7.

CONCLUSIN. .....................................................................................................................34

8.

REFERENCIAS. ...................................................................................................................35

INV- Modelos no lineales en GRETL/2011-II

1. INTRODUCCIN.
En la prctica cada vez toma mayor importancia el anlisis de la efectividad de
polticas y medidas aplicadas en diversas esferas de la sociedad mediante el uso
de modelos economtricos. Sin embargo, debido a la complejidad de la realidad
econmica encontrar modelos que se ajusten al problema analizado sugiere un
gran problema para el investigador, que se agrava al sumrsele el problema de
encontrar software que le permita la exploracin de nuevas herramientas y
modelos, fciles de utilizar y que no sean restrictivos en su uso.
Bajo este contexto, la presente investigacin tiene como objetivo darle a los
estudiantes una introduccin a la aplicacin de dos modelos que buscan mayor
precisin en el anlisis: Logit y Probit; estos modelos responden especficamente
a dos problemas bsicos que presenta el modelo de regresin lineal clsico. Junto
con esto, se ofrece una gua de aplicacin de dichos modelos en un software
alternativo a los utilizados generalmente en el anlisis estadstico: GRETL,
haciendo nfasis en el fcil acceso y utilizacin de dicho programa que favorece la
interaccin del usuario. Para contrastar los resultados de la aplicacin de los
modelos en GRETL, se va a realizar el mismo proceso en Stata, uno de los
software ms reconocidos y utilizados en el rea.

1.1. PERTINENCIA DE LA APLICACIN DE MODELOS NO


LINEALES Y GRETL EN LA FCE.
La enseanza de los distintos mtodos economtricos debe considerar como
componente de gran importancia los procesos necesarios para la estimacin de
modelos y el contraste de supuestos utilizando la diversidad de paquetes
economtricos que existen en el mercado. Estos programas regularmente han
sido desarrollados utilizando cdigos y procedimientos propios, por lo que para
los nuevos usuarios resulta un reto el hecho de tener que, adems de aprender la
teora estadstica detrs de cada modelo, entender el lenguaje del software que se
est utilizando y los resultados que le son mostrados al ejecutar un
procedimiento.
Dentro de la Facultad de Ciencias Econmicas se ha evidenciado la falta de
diversidad en los programas utilizados para la aplicacin de la teora tomada en
clase, esta problemtica se puede deber principalmente a dos factores: el primero,
es la falta de medios explicativos para que los estudiantes aprendan a utilizar los
diferentes paquetes (clases auxiliares con monitores que conozcan diversos
programas, documentos de apoyo, ejemplos, etc.); el segundo, los problemas de
acceso a los software por fuera del aula, pues debido a que ciertos de ellos,
generalmente los ms utilizados, requieren licencias y permisos, su uso est
restringido.

INV- Modelos no lineales en GRETL/2011-II


Como forma de colaborar a disminuir el problema que se evidencia en la facultad,
la presente investigacin busca, en primera instancia, ofrecerles a los estudiantes
una gua para el uso bsico de GRETL, un software que se ajusta a las
necesidades de la academia y que cuenta con gran cantidad de funcionalidades. A
continuacin se hace un anlisis de los contenidos de las materias bsicas de la
lnea de econometra relacionndolos con GRETL:
Materia2

Funcionalidad en GRETL

Econometra I
Contenidos:
Modelo de regresin simple y MCO.
Modelo de regresin mltiple:
estimacin y supuestos Inferencia.
Problemas asociados:
heteroscedasticidad,
multicolinealidad, variables
omitidas, error de medicin y
simultaneidad.

Estimacin de modelos por MCO, contraste


de supuestos, intervalos de confianza,
grficos
de
variables
estimadas
y
observadas, grfico de residuos, intervalos
de confianza.

Econometra II
Contenidos:
Anlisis de Componentes
Principales.
Datos panel.
Procesos estocsticos: lineales,
estacionarios y no estacionarios.
Modelos ARMA y ARIMA:
especificacin y propiedades,
identificacin, estimacin,
verificacin y uso del modelo
(prediccin).
Pruebas de raz unitaria.
Modelo ARIMA estacional.

Anlisis de componentes principales (arroja


los resultados bsicos de valores propios
con su varianza y varianza acumulada y
los vectores propios asociados a cada
valor), estimacin de datos panel (por
efectos fijos, efectos aleatorios, MCO
ponderados), anlisis de series de tiempo
con modelos ARMA y ARIMA.

TABLA 1. PERTINENCIA DE GRETL EN LA FCE

Como se observa en la relacin descrita, el programa se ajusta a las necesidades


de las clases del ncleo bsico que ofrece la carrera. A travs del presente
documento se mostrarn las caractersticas bsicas para el uso del programa en
las que se hace nfasis en la facilidad y versatilidad que este ofrece, lo cual
fortalece la pertinencia de su uso en la facultad, pues puede servir como medio
2

Contenidos tomados del Sistema de Informacin Acadmica de la Universidad Nacional de


Colombia

INV- Modelos no lineales en GRETL/2011-II


para incentivar el trabajo autnomo de los estudiantes que no se van a ver
limitados por problemas de entendimiento usuario-software, como tampoco por el
acceso restringido al uso del programa; sin dejar de asegurar la calidad en las
estimaciones y en los procesos realizados.
Respecto a la calidad en los procesos que GRETL realiza, el documento busca
abarcar un tema complementario a los normalmente enseados en los cursos de
la facultad (presentados en la Tabla 1) se trata de la aplicacin de modelos no
lineales con variable dependiente binaria, modelos muy utilizados para el anlisis
de la realidad pero que por la dificultad en su interpretacin no tienen cabida en
los cursos iniciales de econometra. De esta manera, se busca hacer una
aproximacin bsica a temas complementarios que incentivan el aprendizaje de
los estudiantes por fuera del aula de clases. Los resultados que se obtengan de la
estimacin de dichos modelos sern confrontados con los resultados obtenidos de
uno de los programas ms utilizados, como lo es Stata, buscando validar la
pertinencia del uso alternativo de GRETL.

2. DESCRIPCIN BSICA DE GRETL.


GRETL (The Gnu Regression, Econometrics and Time-series Library) es un
paquete economtrico desarrollado bajo los principios del software libre y la
General Public License (GPL) de GNU. De este modo est dirigido
principalmente al sistema operativo Linux, aunque cuenta con versiones
desarrolladas para Windows y Mac. La principal fortaleza pedaggica del
programa reside en que adems de ofrecer una interfaz agradable para el usuario,
incluye gran cantidad de datos de ejercicios de libros de econometra
ampliamente usados en la enseanza de esta herramienta.
GRETL, adems de permitir desarrollar gran cantidad de mtodos y pruebas
estadsticas, permite asociarse con otros programas ya sea en importacin de
datos (lee bases de datos de SPSS, Excel, Stata, Eviews, etc.) o de exportacin de
documentos donde trabaja conjuntamente con LaTeX. Sumado a esto, el
programa tiene un enlace con R-Project, que se puede usar para un anlisis de
datos ms avanzado.

2.1. INSTALACIN.
2.1.1. Linux.

En Linux existe la posibilidad de elegir entre dos tipos de instalaciones. Por un


lado, se puede instalar GRETL desde la compilacin y construccin de su cdigo,
esto es til para las personas que pretenden hacer desarrollos sobre la
plataforma o quieren adecuar el programa a sus necesidades; Por el otro, existe
un paquete pre-construido el cual es instalado por los usuarios corrientes, pues

INV- Modelos no lineales en GRETL/2011-II


el primer tipo requiere de un conocimiento del cdigo de programacin. Algunas
distribuciones de Linux como Debian y Ubuntu incluyen dentro de sus paquetes
a GRETL y sus libreras, adems se pueden encontrar ciertos paquetes listos para
ejecutar en la pgina principal del programa, seccin descargas
(http://gretl.sourceforge.net/gretl_espanol.html).
2.1.2. MS Windows.

En Windows el proceso de instalacin se reduce a un archivo ejecutable que se


encuentra en la direccin http://gretl.sourceforge.net/win32/index_es.html. Al
ejecutar el archivo y elegir el directorio donde va a ser instalado el programa se
instala automticamente. Aparte de encontrar el instalador de GRETL para
Windows, en esta pgina estn diversos paquetes que se han venido
desarrollando, tales como TRAMO/SEATS, datos de libros de enseanza de
Econometra, etc. Adems se encuentran de opciones para actualizacin y
construccin del programa.
Tanto para Windows como para Linux el programa busca actualizaciones
recurrentemente, sin embargo para el caso de Windows, el usuario puede decidir
si desea que el programa actualice automticamente. Para esto el usuario debe
cerrar GRETL, ejecutar el programa gretl updater y cuando este termine volver a
abrir GRETL.

2.2. EXPLORACIN BSICA DEL PROGRAMA.


2.2.1. Ventana Principal

A. VENTANA PRINCIPAL

INV- Modelos no lineales en GRETL/2011-II


La ventana principal de GRETL es supremamente sencilla e intuitiva para el
usuario, el cual no tiene que tener un conocimiento en programacin para poder
usarlo. GRETL le ofrece opciones que tan slo tiene que elegir con unos cuantos
clics y que simplifican el trabajo del investigador. Sin embargo, para usuarios
avanzados que quieren aumentar la experiencia en GRETL, el cdigo del
programa es abierto y pueden colaborar en el desarrollo de este. A continuacin
se har revisin de las principales herramientas que ofrece la ventana principal:

Barra de herramientas: Contiene las principales herramientas del


programa en lo que se refiere a gestin de archivos y anlisis estadstico y
economtrico. Adems, contiene una ventana de ayuda que enriquece el
aprendizaje del investigador.

Variables disponibles: Esta ventana, que ocupa el espacio ms amplio de


la ventana principal, muestra al usuario las variables que son cargadas
dndole a cada variable un orden, un nombre y una descripcin bsica.

Barra de acceso rpido: Ubicada en la parte inferior izquierda de la


ventana principal, le ofrece al usuario un acceso rpido a ciertas
herramientas bsicas como es calculadora, gua de instrucciones, gua de
usuario, consola y la vista de conos de sesin donde se encuentra la
informacin principal del conjunto de datos que est siendo trabajado.

Caractersticas del conjunto de datos: Es un pequeo espacio ubicado


en la parte inferior central de la ventana principal. Muestra la periodicidad
de los datos y los aos que comprende.

2.2.2. Importacin de archivos

Para importar datos a GRETL hay que utilizar la herramienta Abrir Datos ubicada
en el men archivo de la barra de herramientas, al dar clic en esta opcin el
programa mostrar tres opciones:

Archivo de usuario: en la que el usuario busca en su equipo el conjunto


de datos que desea importar.

Archivo de muestra: Aqu el usuario tiene a disposicin, por defecto, tres


libreras de datos las cuales muestran una cantidad de conjuntos de datos
precargadas y que se pueden aplicar a gran cantidad de modelos segn
sus caractersticas (revisar Ilustracin B). En la pgina de GRETL es
posible ms bases de datos procedentes de libros de econometra. Para
ms
informacin
revise
el
siguiente
vnculo
http://gretl.sourceforge.net/gretl_data_es.html

INV- Modelos no lineales en GRETL/2011-II

Importar: GRETL permite importar datos de diversos programas y


extensiones, como son: Octave, texto/csv, Eviews, Gnumeric, Stata, SPSS,
entre muchos ms.

B. ARCHIVOS DE MUESTR A

Adems de esta opcin, existe la posibilidad de cargar guiones para ejecutar por
medio de la consola, esto se hace desde la opcin Archivos de guion del men
Archivo. Aqu se encontrarn las opciones comunes de cargar un guion ya sea
por el mismo archivo del usuario o precargadas con el programa o crear una
nueva de tipo R, GRETL, Octave, entre otros.
Otra funcin til que GRETL contiene es la carga de archivos de funciones, que
tambin se encuentra ubicada en el men Archivo, en sta opcin se puede
cargar paquetes de funciones que hayan sido desarrolladas por algn usuario o
por usted mismo, evitando el proceso de tener que desarrollarla por medio de
programacin.
Por ltimo existe la opcin de configurar el directorio predeterminado de GRETL,
la opcin Archivo Directorio de trabajo, permite configurar el directorio y las
opciones de uso como se observa en la Ilustracin C.

C. SELECCIN DE DIREC TORIO

10

INV- Modelos no lineales en GRETL/2011-II


De este modo al trabajar con nuestro directorio predeterminado el programa
automticamente buscar all todos los archivos que se llamen usando los
comandos open, run o include, por medio de la consola. Adems cualquier trabajo
que sea guardado o editado quedara grabado en este directorio.
GRETL ofrece la opcin de guardar y abrir sesiones de trabajo en el programa, as
se tendrn a salvo los datos usados, algunos modelos aplicados y algunas
grficas que el usuario al cerrar la sesin haya decido guardar.
Ciertas veces puede ser necesario dar informacin acerca de la naturaleza de la
informacin, esto se lleva a cabo a travs de la opcin Estructura del conjunto de
datos ubicada en la pestaa Datos de la barra de herramientas, aqu se podr
especificar si los datos son de tipo seccin cruzada, serie temporal o panel.
2.2.3. Herramientas de trabajo

La opcin Herramientas, ubicada en la barra de herramientas de la ventana


principal, cuenta con ciertas opciones tiles tanto para mejorar la eficiencia o la
capacidad de uso del programa, como para el anlisis estadstico bsico. Por el
momento se har referencia a las herramientas de trabajo del programa, en la
prxima seccin se revisarn las herramientas de anlisis.
La principal funcin que podemos encontrar es la consola de GRETL, desde aqu
podemos trabajar todas las funciones usando la lnea de comandos del programa.
Las funciones que el programa contiene se encuentran, o escribiendo help en la
consola de comandos o en el men de ayuda, ubicado en la barra de
herramientas, donde aparece la opcin gua de instrucciones. Aqu tendremos a
nuestra disposicin una descripcin de todos los comandos disponibles en el
programa.
Adicional a esta herramienta est disponible una opcin llamada historial de
instrucciones la cual muestra los comandos que han sido utilizados durante la
sesin de trabajo, junto con una opcin de enlace a GNU R, la cual nos va a llevar
a la interfaz de R-Project, que puede llegar a ser til en el desarrollo de funciones
ms avanzadas que GRETL puede no contener.

2.3. ANLISIS ESTADSTICO DESCRIPTIVO Y EDICIN DE


VARIABLES.
GRETL ofrece al usuario ciertas herramientas tiles para la creacin de
estadsticos descriptivos de las variables que se estn trabajando. Una ventaja del
software es que no slo tiene un proceso muy intuitivo para generar los
estadsticos principales sino que adems contiene una serie de calculadoras o

11

INV- Modelos no lineales en GRETL/2011-II


programaciones que nos muestran, por ejemplo, tablas estadsticas, valores-p,
grficas de distribuciones, estadsticos de contraste, entre otros.
2.3.1. Estadsticos y grficos descriptivos.

En la barra de herramientas se encuentra la opcin Variable que desplegar


opciones de edicin y anlisis estadstico, hay que tener en cuenta que cualquier
opcin que se elija va a arrojar el resultado para la variable que se haya
seleccionado previamente en la ventana principal del programa. En relacin con
las opciones de edicin se encontrarn opciones para cambiar datos, atributos de
la serie (cambiar el nombre y nmero) y para establecer el cdigo que reconocer
valores ausentes.
Una de las opciones a tener en cuenta es el tipo de estructura de los datos,
opcin que se ejecutar automticamente al importar una base de datos, o que se
encuentra ubicada en la opcin Datos de la barra de herramientas de la ventana
principal. Aqu se podr especificar la naturaleza de los datos y el orden que
tiene, algo bsico para la estimacin correcta del modelo. Las opciones se
muestran en la Ilustracin D.

D. ESTRUCTURA DE LOS DATOS

12

INV- Modelos no lineales en GRETL/2011-II


En cuanto al anlisis descriptivo las opciones que es posible encontrar son
bsicamente:
Estadsticos principales: La salida de esta opcin nos mostrar: media,
mediana, mximo, mnimo, desviacin estndar o tpica, coeficiente de
variacin, de asimetra y el excedente de curtosis.

E. ESTADSTICOS PRINCIPALES

Adems de esta opcin, desde la barra de acceso rpido se puede encontrar


una herramienta an ms interesante: dando clic en el botn vista de
iconos de sesin se encontrar
la opcin Resumen la cual
automticamente nos mostrar la media, mediana, mnimo y mximo de
todos los datos que contiene la base que ha sido cargada.

F. ESTADSTICOS DEL CONJUNTO DE DATOS GENERAL

13

INV- Modelos no lineales en GRETL/2011-II


Contraste de normalidad: El programa automticamente hace cuatro
pruebas de normalidad para la serie escogida: Doornik-Hansen, W de
Shapiro-Wilk, Lilliefors y Jarque-Bera.
Para cada una el programa
muestra el estadstico y su valor-p asociado.

G. CONTRASTE DE NORMALIDAD

Grfico Q-Q normal: Esta herramienta nos permite comparar los cuantiles
empricos de la serie en cuestin contra los cuantiles de una distribucin
normal. Para llevar a cabo este proceso mnimo hay que contar con 20
datos y el programa por defecto calcula la distribucin normal con la media
y varianza de los datos que se estn utilizando. Adems hay dos opciones
ms para trabajar con datos estandarizados o enfrentar a los cuantiles
brutos contra una normal de media 0 y varianza 1.

H. Q-Q NORMAL.

14

INV- Modelos no lineales en GRETL/2011-II


Grfico de Cajas (Boxplot): Dando clic derecho sobre la variable es posible
encontrar la opcin de grfico de cajas que nos permite ver la distribucin
de la variable, usando su mnimo, mximo, sus cuartiles, su media y su
mediana.

I. BOXPLOT

2.3.2. Transformacin y generacin de nuevas variables.

Otra funcin muy til de GRETL es la variedad de opciones que ofrece para
convertir en diferentes formas funcionales las variables que se han cargado. As
mismo, es muy til para agregar con tan slo un clic variables dummy
estacionales, variables aleatorias, entre otras herramientas que su construccin
podra llevar mucho ms tiempo. Todas estas herramientas las encontramos en el
botn Aadir de la barra de herramientas de la ventana principal. Las opciones
disponibles son: logaritmos, cuadrados, retardos, primeras diferencias,
diferencias de logaritmos y diferencias estacionales de las variables
seleccionadas.
Adems de esto existe la opcin para definir una nueva variable que se quiera
introducir, una gran ventaja pues dinamiza el trabajo de tener que ir hasta la
base de datos original para poder incluirla, o para crear una matriz ya sea
utilizando las series que estn cargadas o introduciendo su tamao y
posteriormente los datos, o mediante una funcin que incluya una relacin
matemtica entre ciertas variables.
Apenas se haga clic sobre la opcin que se desea, la nueva variable que ha sido
creada aparecer en la ventana principal, de esta forma ya puede ser llamada en
cualquier proceso que se vaya a realizar.

15

INV- Modelos no lineales en GRETL/2011-II


2.3.3. Anlisis de componentes principales.

Uno de los procesos estadsticos no inferenciales ms tiles que se pueden


realizar es el Anlisis de componentes principales (ACP). Aunque GRETL tiene
una funcin desarrollada para este proceso es muy bsica respecto a los procesos
que se pueden desarrollar en otros programas como R y SPSS.
La aplicacin de ACP en GRETL se limita a una opcin que se encuentra en el
botn Ver de la barra de herramientas o al comando acp de la consola. Al dar clic
sobre la opcin de ACP el programa abrir automticamente una ventana que
pedir seleccionar las variables a analizar y decidir si se trabaja con la matriz de
covarianzas o con la de correlaciones (paso bsico para la determinacin de los
componentes). Si se realiza el proceso por medio del comando en la consola hay
que especificar las variables a analizar, o en su defecto si se desea analizar toda
la base simplemente hay que escribir el comando y dar enter.

J. ANLISIS DE COMPONENTES PRINCIPALES

La ventana de salida que se obtiene nos muestra, en primera instancia, la


varianza de cada componente (vector propio) y la varianza acumulada que sirven
como criterio de seleccin las componentes a retener. Debajo de estos datos se
encontrar la ponderacin que cada componente le otorga a cada variable, lo cual
es til para hacer el proceso de descripcin de los componentes retenidos.

16

INV- Modelos no lineales en GRETL/2011-II

3. APLICACIN DE MODELOS ECONOMTRICOS.


GRETL contiene programacin para realizar procesos en aproximadamente 28
mtodos economtricos, dentro de estos encontramos mnimos cuadrados
ordinarios, estimacin de la matriz de covarianzas robusta, datos panel esttico y
dinmico, mnimo cuadrados no lineales, Estimacin de mxima verosimilitud y
modelos de series de tiempo univariados y multivariados, entre muchos otros.
Este documento se centrar al estudio de modelos que se enfrentan a problemas
de variables discretas, como ya se ver ms adelante al hacer referencia a los
modelos Logit y Probit. Sin embargo, para explorar un poco ms en detalle el
programa se pretende hacer a continuacin una exposicin de la estimacin de
un modelo de regresin lineal por mnimos cuadrados ordinarios.

3.1. MNIMOS CUADRADOS ORDINARIOS.


El proceso de estimar un modelo de regresin lineal por mnimos cuadrados
ordinarios (MCO) en GRETL se puede desarrollar, al igual que la mayora de los
procesos, por medio de la interfaz de usuario o por medio de la consola.
En la barra de herramientas se encontrar la pestaa Modelo en donde
aparecern los diferentes conjuntos de modelos que se pueden aplicar a los datos
con los que se cuenta. Por consiguiente, en este men aparecer la opcin de
MCO que al seleccionarla mostrar una ventana en donde se debe seleccionar la
variable dependiente y las variables independientes del modelo. Si se desea
proceder usando la consola, se puede realizar con el comando ols seguido de la
variable independiente y despus de las independientes.

K. MNIMOS CUADRADOS ORDINARIOS

17

INV- Modelos no lineales en GRETL/2011-II


3.1.1. Contraste de supuestos.

Al haber estimado el modelo, aparecer una ventana de salida en la cual se


muestran los principales resultados de la estimacin. As mismo, se encuentra
una barra de herramientas con todas las opciones disponibles para analizar y
contrastar el modelo. Especficamente, la opcin contrastes muestra una gran
cantidad de contrastes a los supuestos del modelo, tal como muestra la
Ilustracin L. Al seleccionar cualquiera de los contrastes aparecer
automticamente en otra ventana el proceso realizado por el programa y se crear
debajo de los resultados principales de la estimacin del modelo (obtenidos
anteriormente) un resumen de la prueba realizada, mostrando la hiptesis nula,
el estadstico y su valor-p principalmente.

L. CONTRASTES DE LOS SUPUESTOS, TEST RESET DE RAMSEY.

La diferencia entre las dos formas de aplicar el modelo (interfaz o consola) est en
que para hacer los contrastes de los supuestos del modelo la primera opcin
ofrece en el documento de salida el men explicado anteriormente. Al proceder
mediante la consola se deben seguir utilizando los comandos correspondientes a
los contrastes que se desean hacer, por ejemplo, para hacer el test de Ramsey se
procede con el comando reset.
3.1.2. Intervalos de confianza.

Una de las fortalezas con las que GRETL cuenta es la fcil estimacin de los
intervalos de confianza para cada una de las variables del modelos que se haya
ejecutado, simplemente hay que dirigirse a la seccin anlisis en la ventana de

18

INV- Modelos no lineales en GRETL/2011-II


salida de resultados del modelo, donde aparece la opcin de intervalos de
confianza, estos automticamente sern generados.

M. INTERVALOS DE CONFIANZA

4. MODELOS CON VARIABLE DEPENDIENTE BINARIA3


La aplicacin del modelo de regresin mltiple lineal puede ser no adecuada para
la explicacin de problemas en los cuales la respuesta que se espera toma
nicamente dos valores, por ejemplo, cuando se quiere hacer un anlisis de
polticas las nicas respuestas que se pueden esperar es si estas fueron exitosas
o no en el medio en el cual fueron aplicadas. Para estos casos es necesario
utilizar nuevas herramientas que difieren del modelo de regresin mltiple y que
plantean nuevos mecanismos de medicin. A continuacin se consideraran
ciertos modelos que son tiles para solucionar problemas con variable
dependiente binaria, estos son: Modelo de probabilidad lineal, modelo Logit y
modelo Probit.

4.1. MODELO DE PROBABILIDAD LINEAL (MPL).


El modelo de probabilidad lineal (MPL) es bsicamente una variacin del modelo
de regresin lineal mltiple enfocada a la explicacin de eventos cualitativos. En
este documento slo se considerarn el caso en que el evento a explicar tiene
resultados binarios, de este modo la variable dependiente del modelo de regresin
lineal slo podr tomar valores de cero o uno.
Al tener un modelo,

Con y como una variable bivariada, la interpretacin comn de los


no puede
seguir siendo utilizada, pues los cambios en y ya no son continuos ante cambios
en las X. De este modo hay que recurrir a una nueva forma de entender el modelo
con el fin de hallar su utilidad.
3

Explicacin de modelos basada en Wooldridge (2009)

19

INV- Modelos no lineales en GRETL/2011-II


Al admitir el supuesto de media condicional cero,
puede ser expresado como,

, el modelo

El punto clave de la explicacin del modelo de regresin lineal con variable


dependiente binaria est en que siempre se tiene que el valor esperado de y es
igual a su probabilidad de xito, que es la probabilidad de que y sea igual a 1,
expresado de otra forma:
. De este modo el modelo dice que la
probabilidad de xito es funcin lineal de las variables x, lo que se puede expresar
como,

As mismo, dado que las probabilidades tienen que sumar uno podemos decir que
, que tambin es funcin lineal de las variables x. Este
modelo es llamado Modelo de Probabilidad Lineal (MPL) debido a la linealidad de
los parmetros del ste. El modelo se estima por Mnimos Cuadrados Ordinarios
(MCO) como un modelo comn de regresin lineal mltiple.
La interpretacin de los
se puede entender como la variacin de la
probabilidad de xito al variar , permaneciendo los dems factores constantes
(Wooldridge, 2009):

Cuando se tiene variables independientes binarias el coeficiente que se obtiene


mide la diferencia que se predice para la probabilidad en relacin con el grupo
base (Wooldridge, 2009)

N. MPL BASE DE DATOS WOOLDRIDGE (2009)

20

INV- Modelos no lineales en GRETL/2011-II


Al ser el modelo estimado por MCO, en GRETL se debe seguir el proceso
explicado en la seccin 3.1 con la variable independiente bivariada que exprese
una relacin cualitativa.
Con el nimo de evaluar los resultados de GRETL, se va a utilizar la base de
datos MROZ del libro de Wooldridge (2009) la cual se puede encontrar dentro de
la biblioteca de datos lista para instalar en el programa utilizando el enlace
especificado en la seccin 2.2.2 de este documento.
4.1.1. Desventajas del MPL

El modelo MPL tiene dos desventajas principalmente que lo hacen dbil frente a
los modelos que posteriormente se explicarn. La primera debilidad reside en
que es posible que se den, con ciertas combinaciones de las variables
independientes, resultados en donde la probabilidad es negativa o mayor a uno;
probabilidades que generan un problema de interpretacin y que por lo tanto
requieren de un cambio en la forma de entender y estimar el modelo.
La segunda debilidad del modelo es que no se puede considerar que la
probabilidad est relacionada linealmente con las variables independientes para
todos los valores, ciertos efectos sobre la variable dependiente varan en su
magnitud segn aumenta la variable independiente, el MPL no es capaz de
recoger dichos cambios. Sin embargo, si los valores de las variables
independientes estn cerca del promedio el modelo es til para predecir.

4.2. MODELOS NO LINEALES PARA RESPUESTA BINARIA.


Los modelos Logit y Probit pueden superar las limitaciones que tienen los
modelos de probabilidad lineal vistos en la seccin anterior, pero la principal
desventaja de estos modelos es el grado de dificultad que adquiere la
interpretacin de estos.
Para especificar los modelos Logit y Probit se puede partir de la ecuacin (3) y
hacer una variacin para considerar una clase de modelos como el siguiente:

Donde G se considera una funcin con valores ente cero y uno estrictamente,
para todos los nmeros reales z. Esta primera condicin elimina el problema del
MPL de poder tener valores negativos o mayores a 1.
Por otro lado, la funcin G es una funcin no lineal que cumple con la
caracterstica anterior de valores estrictamente entre cero y uno. Las funciones
que se han utilizado ms ampliamente en las aplicaciones de modelos de variable
dependiente limitada son:

21

INV- Modelos no lineales en GRETL/2011-II

Funcin logstica (modelo Logit): funcin de distribucin acumulada


para una variable logstica estndar.

Se encuentra entre cero y uno para todos los nmeros reales.

Donde

Funcin de distribucin acumulada normal estndar (Modelo Probit):

es la densidad normal estndar

Una forma de derivar los modelos Logit y Probit es a travs de un modelo de


variable latente subyacente.

Se parte de considerar a
como una variable inobservable determinada por la
ecuacin (9) que introduce la notacin de una funcin indicador,
lo que
significa que esta funcin asume el valor de uno si se cumple la condicin dentro
de los corchetes y de cero si no se cumple.
Los errores,
se suponen independientes de
y que tienen la distribucin
logstica estndar o la distribucin normal estndar. Esto significa que en
cualquier caso los errores se distribuyen simtricamente en torno a cero y as
para todos los nmeros reales z se tiene que
.
Con las consideraciones anteriores es posible calcular la probabilidad de
respuesta para y en los modelos Logit y Probit como,
(

Recordando que en los modelos de respuesta binaria toma importancia explicar


los efectos de las variables independientes sobre la probabilidad de xito, es
importante tener en cuenta que aunque a primera vista parezca que lo
importante est en mirar los efectos de las
sobre la variable latente , en los
modelos Logit y Probit la direccin del efecto sobre
y sobre
es la misma. De este modo, dado que la variable
latente regularmente no tiene una unidad de medida definida, toma mayor

22

INV- Modelos no lineales en GRETL/2011-II


importancia la estimacin de los efectos de las
sobre la probabilidad de xito.
Ahora el problema est en que la no linealidad de las funciones G complica la
estimacin e interpretacin de dichos modelos.
Para solucionar el problema hay que recurrir a la derivacin, pues si
es una
variable aproximadamente continua el efecto parcial sobre la probabilidad de
xito,
, se obtiene de la derivada parcial (Wooldridge, 2009), que
se define como:

Con G definida una funcin de distribucin de probabilidad de una variable


aleatoria continua y g como una funcin de densidad de probabilidad. Al ser G
una funcin estrictamente creciente (como en los casos de Logit y Probit), g(z)
siempre va a ser mayor a cero y as de (11) se puede decir que el efecto de
sobre
la probabilidad de xito p(x) va a depender nicamente del signo de
,
reafirmando as su importancia en la explicacin de los efectos.
Cuando hay variables explicativas binarias, el efecto parcial de que sea cero o
uno, ceteris paribus, es:

Que indica el cambio en la probabilidad de tener o no cierta caracterstica


representada por la variable binaria, teniendo en cuenta las dems
caractersticas que permanecen constantes. En resumen el
que representa la
variable binaria determinar el cambio en la probabilidad de xito de acuerdo a
su signo y la cantidad en que vara se estima mediante (12).
Tambin es til utilizar (12) para mirar los cambios en la probabilidad para
variables discretas, de este modo se puede medir el efecto de que
cambie de
a
siguiendo la misma lgica:

Para estimar los modelos de variables dependientes limitadas es necesario utilizar


la Estimacin de Mxima Verosimilitud (EMV) debido a la naturaleza no lineal de
los modelos utilizados.
Estos modelos se pueden poner bajo la forma: Sea
la funcin de
densidad para una extraccin aleatoria
de la poblacin, condicional en

(Wooldridge, 2009), al suponerse que se tiene una muestra aleatoria de tamao n,


la densidad de
, para los modelos Logit y Probit, se determina por dos

23

INV- Modelos no lineales en GRETL/2011-II


valores
Concretamente, la densidad va a estar dada por:

Para
= 0, 1. El estimador de mxima verosimilitud de
log-verosimilitud:

maximiza la funcin de

El vector b es el argumento binario en el problema de maximizacin. En general


(Estimacin de mxima verosimilitud) es consistente y tiene una distribucin
normal aproximada en muestras grandes (Wooldridge, 2009).
Para los modelos Logit y Probit la funcin de log-verosimilitud se obtiene al
aplicar el logaritmo a la ecuacin (14), lo cual, para la observacin i quedara
expresado como una funcin de los parmetros y los datos (
:

As el problema de maximizacin que expresa (15) se puede escribir como:

Ms adelante se revisar como GRETL realiza muestra los resultados del proceso
de estimacin por mxima verosimilitud.

4.2.1. Interpretacin de las estimaciones de los modelos Logit y Probit

Con los paquetes economtricos los problemas de estimacin de los modelos


debido a su complejidad deja de ser un problema, ahora toma importancia la
forma en cmo se interpretan las estimaciones que resultan. Anteriormente, se
dijo que los coeficientes resultantes de la estimacin del modelo reflejan los
efectos parciales de cada
sobre la probabilidad de respuesta, con una
significancia estadstica determinada por la prueba de hiptesis
, a un
nivel de significancia suficiente.
Inicialmente existe una medida de la bondad de ajuste del modelo conocido como
porcentaje predicho correctamente que consiste en definir un predictor binario

24

INV- Modelos no lineales en GRETL/2011-II


de
como uno si la probabilidad que el modelo predice es mayor o igual a 0.5 y
cero si sta es menor de 0.5.

(18)
Con esta herramienta es posible observar que tan bien predice el
a
en cada
observacin del modelo. En GRETL la salida que se obtiene al aplicar el modelo
contiene un anlisis del porcentaje predicho correctamente y que observaremos
posteriormente. Una deficiencia de este mtodo es que en casos particulares
puede no predecir correctamente el resultado menos probable.
Entre las variantes a este mtodo est el de cambiar el umbral de acuerdo a la
fraccin de xitos en la muestra y partir de ah para considerar si
es 1 o 0. De
este modo si el porcentaje de xitos en nuestra muestra es 7% en la ecuacin (18)
hablaramos de
.
Al calcularse un modelo sin utilizar MCO, el
que serva como medida para la
capacidad de ajuste del modelo ya no aplica, pues el procedimiento utilizado para
calcular no ha sido minimizando la varianza sino por mxima verosimilitud. El
equivalente para estos modelos ha sido conocido como pseudo
. Uno de los
ms utilizados y que GRETL calcula automticamente al correr el modelo es el
Pseudo
de McFadden que sugiere la siguiente medida:

Con
como la funcin de log-verosimilitud para el modelo estimado y
como
la funcin de log-verosimilitud con slo el intercepto. La log-verosimilitud del
modelo del intercepto es tratada como la suma total de cuadrados, y la logverosimilitud del modelo completo como la suma de los errores al cuadrado
(UCLA, What are Pseudo R-squareds?) en comparacin con el
de MCO.
El ratio entre
y
nos muestra la capacidad de mejoramiento sobre el
modelo del intercepto que ofrece el modelo completo. Sabemos por la ecuacin
(16) que las log-verosimilitudes de los modelos Logit y Probit siempre van a ser
negativas por lo cual
, por lo tanto, si el modelo tiene baja
probabilidad la log-verosimilitud ser mayor en valor absoluto que la de un
modelo con mayor probabilidad. As, entre el ratio de log-verosimilitudes sea ms
cercano a cero el
ser ms cercano a uno, que indica que el modelo se ajusta
bien. Si el modelo completo no tiene poder explicativo el ratio va a ser cercano o
igual a 1, con lo que el
del modelo ser igual o cercano a 0.

25

INV- Modelos no lineales en GRETL/2011-II


Para estimar los efectos de las
sobre las probabilidades de xito, se parte de la
derivada parcial y los efectos en el cambio de la probabilidad estimada de xito
para cambios pequeos de , que se puede escribir como:

La dificultad de estimar el efecto est en que el factor de escala


depende de todas las variables explicativas, as que se tiene que recurrir a
diferentes medidas de como las medias, los mximos, los cuartiles, entre otras,
y as ver cmo cambia el factor.
Para GRETL el factor escalar es medido utilizando las variables explicativas en el
promedio muestral, de este modo se obtiene el efecto parcial de
para la
persona promedio en la muestra (Wooldridge, 2009).

El procedimiento es realizado tanto para variables explicativas continuas como


discretas. Crticas y alternativas a este procedimiento en Wooldridge (2009).
4.2.2. Pruebas de hiptesis mltiples.

Para probar restricciones de exclusin en los modelos Logit y Probit existen tres
mtodos: El multiplicador de Lagrange, el test de Wald y la Razn de
verosimilitudes. GRETL en el resultado que muestra al usuario aplica la Razn de
verosimilitudes.
La prueba de la razn de verosimilitudes parte de considerar que, dado que la
EMV maximiza la funcin de log-verosimilitud, la omisin de variables ocasiona
generalmente una log-verosimilitud no mayor a la del modelo completo. As, la
prueba est basada en la diferencia de las funciones de log-verosimilitud entre un
modelo restringido y uno no restringido y de este modo se puede concluir si la
disminucin en la log-verosimilitud es lo suficientemente grande para considerar
a las variables omitidas significativas.
Este estadstico es dos veces la diferencia de las log-verosimilitudes del modelo no
restringido (
) y el restringido ( ).
)

(21)

Con q como el nmero de restricciones de exclusin. La hiptesis nula del


contraste considera que los parmetros de las variables excluidas en el modelo
restringido son iguales a cero.

26

INV- Modelos no lineales en GRETL/2011-II

4.3. CONCLUSIONES.
Como se observ anteriormente, los modelos Logit y Probit han surgido como
nuevos mtodos para superar las deficiencias del modelo de regresin lineal
aplicado a variables endgenas restringidas (Modelo de Probabilidad Lineal) y as
generar predicciones ms precisas sobre los fenmenos observados y modelados.
Sin embargo, se reconoce que la dificultad en el proceso de estimacin e
interpretacin del modelo es mayor para los modelos Logit y Probit, planteando
un nuevo reto a los investigadores en cuanto a cmo entender los resultados que
obtienen. Evaluar las salidas de los programas utilizados para estimar los
modelos toma cierta importancia en cuanto a las facilidades que le ofrece al
usuario.
Este apartado del documento busca nicamente ser una gua terica de los
modelos MPL, Logit y Probit; con el fin de evaluar posteriormente los resultados
que GRETL arroja al usuario y su utilidad en la interpretacin de dichos modelos.

5. APLICACIN
GRETL.

DE

MODELOS

LOGIT

Y PROBIT

EN

Utilizando los mismos datos que se tomaron para ilustrar el proceso del MPL
(seccin 4.1) se ejecutar GRETL utilizando en este caso los modelos Logit y
Probit.
Dentro de la pestaa modelo, de la barra de herramientas de la interfaz, aparece
la opcin llamada Modelos no lineales, aqu se encontrarn los dos modelos en
cuestin, tal como lo muestra la figura M. En este caso, solo se estn
considerando los modelos binarios o con variable endgena restringida, as que la
opcin Binario es la nica que ser trabajada en este documento.

O. MODELOS NO LINEALES

27

INV- Modelos no lineales en GRETL/2011-II


Al seleccionar la opcin de aplicar el modelo Binario, tanto para Logit o Probit,
aparecer la ventana de seleccin de variables que ya haba sido explicada en el
apartado 3.1, las diferencias respecto a la explicada anteriormente son
nombradas en la Ilustracin P, a saber, opciones para mirar pendientes o pvalores, y detalles sobre iteraciones.
De acuerdo a la teora explicada anteriormente, las pendientes en la media son
tiles para mirar los efectos parciales de las
en la probabilidad de xito. Debido
a que este efecto parcial depende de las , GRETL por defecto calcula sta
pendiente en la media, lo cual indica que los resultados obtenidos se interpretan
respecto al individuo promedio de la muestra. Los detalles sobre las iteraciones
mostrarn los valores de la funcin de log-verosimilitud de cada iteracin
realizada hasta maximizar la funcin.

P. ESPECIFICACIN DE LOGIT

Dentro de la salida de GRETL para la estimacin de un modelo no lineal con


variable restringida, aparecen ciertos recursos estadsticos de gran ayuda para la
interpretacin de los resultados por parte del usuario. De acuerdo a la teora
enunciada anteriormente los ms importantes son: El pseudo
de McFadden, El
contraste de razn de verosimilitudes, el nmero de casos correctamente
predichos y un cuadro que muestra en detalle el acierto del modelo en su
prediccin mediante la comparacin entre los predichos y los observados.

28

INV- Modelos no lineales en GRETL/2011-II

Q. SALIDA LOGIT (CON DETALLES DE ITERACIONES)

Por supuesto, en la parte central de la salida aparecern los coeficientes


estimados, la desviacin tpica, las pendientes o los p-valores segn la eleccin
tomada al momento de especificar el modelo.
Una de las opciones que puede ser interesante para contrastar el modelo es el
Test de Wald, aunque no se revis teora sobre este permite probar restricciones
mltiples sobre el modelo y cumple una funcin similar a la del estadstico de
razn de verosimilitudes.

R. OMISIN DE VARIABLES, TEST DE WALD

29

INV- Modelos no lineales en GRETL/2011-II


Los pasos para llevar a cabo este test es mediante la opcin contrastes que
aparece en la barra de herramientas de la ventana de salida del programa.
Mediante la opcin omitir variables el programa permitir estimar otro modelo
con variables omitidas o restringidas.
La Ilustracin P muestra la ventana para la omisin de variables. Los pasos a
seguir son: seleccionar las variables a omitir y seleccionar la opcin de Contraste
de Wald. La hiptesis nula de la prueba es que los parmetros de las variables
omitidas son cero.
La salida generada por esta prueba mostrar detalles sobre la hiptesis nula y el
estadstico de contraste utilizado. Si se comparan los resultados del contraste de
Razn de Verosimilitudes y el de Wald los resultados generalmente tendrn
conclusiones similares.

S. CONTRASTE DE OMISIN DE WALD

Otro forma por medio de la cual se puede estimar un modelo Logit o Probit es el
mediante la consola de GRETL se hace mediante el comando Logit o probit, segn
sea el caso. El comando solo pide la especificacin de las variables separadas por
un espacio. Para activar opciones adicionales como ver los p-valores en vez de las
pendientes (p-values), errores estndar robustos (robust), mostrar la matriz de
covarianzas (VCV) o mostrar detalles de las iteraciones (verbose); slo hay que
dejar un espacio despus de las variables escribir dos guiones seguido de la
opcin u opciones que deseamos, tal como se muestra a continuacin:
logit inlf const nwifeinc exper expersq kidslt6 --verbose --vcv
Para llevar a cabo pruebas de restriccin mltiples y en este caso el test de Wald,
el comando es omit, seguido de las variables a restringir y la opcin de Wald:
omit nwifeinc exper expersq kidslt6 --wald
As se llegar al mismo resultado descrito anteriormente.

30

INV- Modelos no lineales en GRETL/2011-II


Debido a que la nica diferencia entre la aplicacin de un modelo Logit y Probit
est en la funcin utilizada, para efectos del proceso necesario en el software para
su estimacin no vara en absoluto.

6. APLICACIN DE LOGIT Y PROBIT EN STATA.


Como una forma de comparar los resultados obtenidos en GRETL, se pretende a
continuacin hacer una exposicin rpida de la estimacin de un modelo Logit o
Probit mediante STATA. Al ser reconocido STATA como uno de los programas de
estadstica ms completos en el mercado, ste ser un buen referente para
comparar los resultados obtenidos con GRETL. A continuacin se explicarn los
comandos y paquetes necesarios para la estimacin del modelo y todos los pasos
para su consecucin. Se seguir trabajando con la misma base de datos que ha
venido utilizndose en el documento.
Para la estimacin de un modelo Logit o Probit es STATA hay que utilizar los
mismos comandos Logit o Probit, segn sea el caso. Cuando no se adhieren
opciones adicionales para la estimacin del modelo la estructura del cdigo
utilizado en GRETL y STATA es el mismo.

T. LOGIT EN STATA

Sin embargo, la salida por defecto de Stata, en comparacin a la de GRETL, no


contiene informacin sobre las pendientes del modelo respecto a cada variable
exgena, que como se revis en la teora es la nica herramienta que permite la
explicacin de los efectos de las variables independientes sobre la probabilidad de
xito. Para conseguir esta informacin en Stata se recurre al comando mfx, el
cual arroja informacin tal como muestra la Ilustracin U.

31

INV- Modelos no lineales en GRETL/2011-II

U. MODELO LOGIT CON PENDIENTES EN STATA

El test de Wald y la razn de verosimilitudes son ejecutados por Stata mediante


dos comandos: test y lrtest, respectivamente. Para el primero, simplemente se
necesita haber corrido el modelo deseado, despus se ejecuta el comando test
seguido de las variables que se van a omitir y el software calcula la prueba y
arroja el p-valor correspondiente. El resultado de este proceso se observa en la
Ilustracin V.

V. TEST DE WALD EN STATA

Para calcular el estadstico de razn de verosimilitudes el proceso que se debe


realizar no es tan intuitivo como el test de Wald, en este caso se deben hacer
unos cuntos pasos antes de ejecutar el comando lrtest que calcula el estadstico,
pues este comando pide especificar los dos modelos (restringido y no restringido)
que va a ser comparados.
Por tal motivo es necesario (mediante el comando estimates store el cual nos
permite guardar los modelos estimados dndoles un nombre) guardar las
estimaciones del modelo restringido y no restringido, para el modelo restringido
tan slo hay que ejecutar el modelo con la variable independiente. Los comandos
necesarios para la estimacin del test en el ejemplo que ha sido trabajado en todo
el documento se especifican en la Ilustracin W.

32

INV- Modelos no lineales en GRETL/2011-II

W. ESTIMACIN RAZN DE VEROSIMILITUDES EN STATA

Por ltimo, el comando que permite ver los casos correctamente predichos es
estat classification el cual muestra principalmente el cuadro de predichos y
observados con los casos en que el modelo predijo correctamente respecto al dato
observado (al igual que en GRETL se considera predicho correctamente cuando el
valor observado es uno y el valor de la estimacin es mayor a 0,5; o cuando el
observado es 0 y la estimacin menor a 0,5). En la salida de Stata True D
representa un dato observado de 1 y Classified + una estimacin mayor a 0,5.

X. CASOS CORRECTAMENTE PREDICHOS EN STATA

En el ltimo campo de la salida del comando estat classification aparece el


porcentaje de casos correctamente predichos el cual sirve para mirar que tan
bueno fue el modelo especificado.

33

INV- Modelos no lineales en GRETL/2011-II

7. CONCLUSIN.
Aunque no se han explorado ms funcionalidades de GRETL y Stata para la
estimacin de modelos no lineales con variable dependiente limitada, se ha hecho
una revisin de los principales comandos que le permitiran al estudiante o
investigador estimar e interpretar en un nivel bsico un modelo no lineal de este
tipo.
Respecto a los dos software utilizados, es posible observar que las estimaciones y
pruebas realizadas no varan entre los dos programas, por lo cual arrojan los
mismos datos y conclusiones. Adems, las salidas que se obtiene de los dos
programas tienen un aspecto similar que permite una fcil comprensin por parte
del usuario; en este punto es importante decir que GRETL genera la mayora de
clculos con el mismo comando mientras que en Stata se deben buscar diversos
comandos para analizar el modelo estimado, esto sin duda presenta una
diferencia entre GRETL y Stata, pues para los nuevos usuarios puede llegar a ser
ms complicada la bsqueda de los comandos necesarios para llegar a buenas
conclusiones.
Esto demuestra que GRETL al ser software libre de cdigo abierto, se presenta
como un programa til para el anlisis economtrico con buenas estimaciones,
una interfaz agradable e intuitiva en varios idiomas, de fcil instalacin y
disponible para cualquier usuario. Aunque todava necesite desarrollos que
fortalezcan su potencia en la ejecucin de varios modelos, se presenta como una
oportunidad para los usuarios que no pueden acceder a otros programas por los
altos costos de las licencias o por la dificultad de entender cmo funcionan.
Adems, al ofrecer una librera gratuita con gran cantidad de bases de datos de
los libros ms reconocidos en la enseanza de la econometra, GRETL se
convierte en una herramienta muy interesante para el aprendizaje.
Modelos como Logit y Probit son utilizados recurrentemente para la estimacin de
fenmenos en el mundo real, sin embargo debido a lo complejo que es su
estimacin no son tomados en cuenta en los cursos bsicos. La pertinencia de
aplicar modelos que no son vistos en la lnea de econometra del programa de
pregrado de la Facultad utilizando interfaces tan intuitivas como GRETL, est en
que los estudiantes y las personas interesadas en profundizar en temas
diferentes, como los modelos no lineales estudiados aqu, no necesitan de un
tutor o profesor que los gue sino de una gua terica y prctica que los
introduzca en el tema y les ofrezca las bases, incentivando as el autoaprendizaje como complemento a la formacin que se recibe en las aulas.

34

INV- Modelos no lineales en GRETL/2011-II

8. REFERENCIAS.

Cottrell, A., & Lucchetti, R. (Julio de 2011). GRETL users guide. Recuperado el 9
de
Septiembre
de
2011,
de
GRETL
Web
page:
http://gretl.ecn.wfu.edu/pub/gretl/manual/PDF/gretl-guide-a4.pdf
UCLA. (s.f.). Stata Data Analysis Examples: Logistic regression. Recuperado el 25
de Noviembre de 2011, de http://www.ats.ucla.edu/stat/stata/dae/logit.htm
UCLA. (s.f.). What are Pseudo R-squareds? Recuperado el 16 de Noviembre de
2011,
de
http://www.ats.ucla.edu/stat/mult_pkg/faq/general/psuedo_rsquareds.htm
Wooldridge, J. (2009). Introductory Econometrics: A modern approach. Cengage
Learning.

You might also like