Professional Documents
Culture Documents
Estudiantes Auxiliares:
Camilo Alexandry Pea Talero
Cristian Andrs Hernndez Caro
Claudia Patricia Ospina Aldana
Daniel Francisco Rojas Martn
David Camilo Snchez Zambrano
David Mauricio Mahecha Salas
Diego Esteban Eslava Avendao
Edward F. Yanquen Briez
Gloria Stella Barrera Ardila
Ivn Albeiro Cabezas Martnez
Javier Alejandro Ortiz Varela
Jeimmy Paola Muoz
Juan Carlos Tarapuez Roa
Juan David Vega Baquero
Juan Fernando Lpez Prieto
Leonardo Alexander Crdenas
Lina Marcela Igua Torres
Mara Paula Contreras Navarrete
Paola Alejandra Alvarado Castillo
Viviana Contreras Moreno
Viviana Mara Oquendo
INTRODUCCIN. ..................................................................................................................5
1.1. PERTINENCIA DE LA APLICACIN DE MODELOS NO LINEALES Y
GRETL EN LA FCE...................................................................................................................5
2.
2.1.1.
Linux. .......................................................................................................................7
2.1.2.
MS Windows...........................................................................................................8
2.2.
2.2.2.
2.2.3.
2.3.1.
2.3.2.
4.
2.2.1.
2.3.
3.
INSTALACIN. ...............................................................................................................7
3.1.1.
3.1.2.
4.1.1.
4.2.
4.2.1.
4.2.2.
4.3.
CONCLUSIONES.........................................................................................................27
6.
7.
CONCLUSIN. .....................................................................................................................34
8.
REFERENCIAS. ...................................................................................................................35
1. INTRODUCCIN.
En la prctica cada vez toma mayor importancia el anlisis de la efectividad de
polticas y medidas aplicadas en diversas esferas de la sociedad mediante el uso
de modelos economtricos. Sin embargo, debido a la complejidad de la realidad
econmica encontrar modelos que se ajusten al problema analizado sugiere un
gran problema para el investigador, que se agrava al sumrsele el problema de
encontrar software que le permita la exploracin de nuevas herramientas y
modelos, fciles de utilizar y que no sean restrictivos en su uso.
Bajo este contexto, la presente investigacin tiene como objetivo darle a los
estudiantes una introduccin a la aplicacin de dos modelos que buscan mayor
precisin en el anlisis: Logit y Probit; estos modelos responden especficamente
a dos problemas bsicos que presenta el modelo de regresin lineal clsico. Junto
con esto, se ofrece una gua de aplicacin de dichos modelos en un software
alternativo a los utilizados generalmente en el anlisis estadstico: GRETL,
haciendo nfasis en el fcil acceso y utilizacin de dicho programa que favorece la
interaccin del usuario. Para contrastar los resultados de la aplicacin de los
modelos en GRETL, se va a realizar el mismo proceso en Stata, uno de los
software ms reconocidos y utilizados en el rea.
Funcionalidad en GRETL
Econometra I
Contenidos:
Modelo de regresin simple y MCO.
Modelo de regresin mltiple:
estimacin y supuestos Inferencia.
Problemas asociados:
heteroscedasticidad,
multicolinealidad, variables
omitidas, error de medicin y
simultaneidad.
Econometra II
Contenidos:
Anlisis de Componentes
Principales.
Datos panel.
Procesos estocsticos: lineales,
estacionarios y no estacionarios.
Modelos ARMA y ARIMA:
especificacin y propiedades,
identificacin, estimacin,
verificacin y uso del modelo
(prediccin).
Pruebas de raz unitaria.
Modelo ARIMA estacional.
2.1. INSTALACIN.
2.1.1. Linux.
A. VENTANA PRINCIPAL
Para importar datos a GRETL hay que utilizar la herramienta Abrir Datos ubicada
en el men archivo de la barra de herramientas, al dar clic en esta opcin el
programa mostrar tres opciones:
B. ARCHIVOS DE MUESTR A
Adems de esta opcin, existe la posibilidad de cargar guiones para ejecutar por
medio de la consola, esto se hace desde la opcin Archivos de guion del men
Archivo. Aqu se encontrarn las opciones comunes de cargar un guion ya sea
por el mismo archivo del usuario o precargadas con el programa o crear una
nueva de tipo R, GRETL, Octave, entre otros.
Otra funcin til que GRETL contiene es la carga de archivos de funciones, que
tambin se encuentra ubicada en el men Archivo, en sta opcin se puede
cargar paquetes de funciones que hayan sido desarrolladas por algn usuario o
por usted mismo, evitando el proceso de tener que desarrollarla por medio de
programacin.
Por ltimo existe la opcin de configurar el directorio predeterminado de GRETL,
la opcin Archivo Directorio de trabajo, permite configurar el directorio y las
opciones de uso como se observa en la Ilustracin C.
10
11
12
E. ESTADSTICOS PRINCIPALES
13
G. CONTRASTE DE NORMALIDAD
Grfico Q-Q normal: Esta herramienta nos permite comparar los cuantiles
empricos de la serie en cuestin contra los cuantiles de una distribucin
normal. Para llevar a cabo este proceso mnimo hay que contar con 20
datos y el programa por defecto calcula la distribucin normal con la media
y varianza de los datos que se estn utilizando. Adems hay dos opciones
ms para trabajar con datos estandarizados o enfrentar a los cuantiles
brutos contra una normal de media 0 y varianza 1.
H. Q-Q NORMAL.
14
I. BOXPLOT
Otra funcin muy til de GRETL es la variedad de opciones que ofrece para
convertir en diferentes formas funcionales las variables que se han cargado. As
mismo, es muy til para agregar con tan slo un clic variables dummy
estacionales, variables aleatorias, entre otras herramientas que su construccin
podra llevar mucho ms tiempo. Todas estas herramientas las encontramos en el
botn Aadir de la barra de herramientas de la ventana principal. Las opciones
disponibles son: logaritmos, cuadrados, retardos, primeras diferencias,
diferencias de logaritmos y diferencias estacionales de las variables
seleccionadas.
Adems de esto existe la opcin para definir una nueva variable que se quiera
introducir, una gran ventaja pues dinamiza el trabajo de tener que ir hasta la
base de datos original para poder incluirla, o para crear una matriz ya sea
utilizando las series que estn cargadas o introduciendo su tamao y
posteriormente los datos, o mediante una funcin que incluya una relacin
matemtica entre ciertas variables.
Apenas se haga clic sobre la opcin que se desea, la nueva variable que ha sido
creada aparecer en la ventana principal, de esta forma ya puede ser llamada en
cualquier proceso que se vaya a realizar.
15
16
17
La diferencia entre las dos formas de aplicar el modelo (interfaz o consola) est en
que para hacer los contrastes de los supuestos del modelo la primera opcin
ofrece en el documento de salida el men explicado anteriormente. Al proceder
mediante la consola se deben seguir utilizando los comandos correspondientes a
los contrastes que se desean hacer, por ejemplo, para hacer el test de Ramsey se
procede con el comando reset.
3.1.2. Intervalos de confianza.
Una de las fortalezas con las que GRETL cuenta es la fcil estimacin de los
intervalos de confianza para cada una de las variables del modelos que se haya
ejecutado, simplemente hay que dirigirse a la seccin anlisis en la ventana de
18
M. INTERVALOS DE CONFIANZA
19
, el modelo
As mismo, dado que las probabilidades tienen que sumar uno podemos decir que
, que tambin es funcin lineal de las variables x. Este
modelo es llamado Modelo de Probabilidad Lineal (MPL) debido a la linealidad de
los parmetros del ste. El modelo se estima por Mnimos Cuadrados Ordinarios
(MCO) como un modelo comn de regresin lineal mltiple.
La interpretacin de los
se puede entender como la variacin de la
probabilidad de xito al variar , permaneciendo los dems factores constantes
(Wooldridge, 2009):
20
El modelo MPL tiene dos desventajas principalmente que lo hacen dbil frente a
los modelos que posteriormente se explicarn. La primera debilidad reside en
que es posible que se den, con ciertas combinaciones de las variables
independientes, resultados en donde la probabilidad es negativa o mayor a uno;
probabilidades que generan un problema de interpretacin y que por lo tanto
requieren de un cambio en la forma de entender y estimar el modelo.
La segunda debilidad del modelo es que no se puede considerar que la
probabilidad est relacionada linealmente con las variables independientes para
todos los valores, ciertos efectos sobre la variable dependiente varan en su
magnitud segn aumenta la variable independiente, el MPL no es capaz de
recoger dichos cambios. Sin embargo, si los valores de las variables
independientes estn cerca del promedio el modelo es til para predecir.
Donde G se considera una funcin con valores ente cero y uno estrictamente,
para todos los nmeros reales z. Esta primera condicin elimina el problema del
MPL de poder tener valores negativos o mayores a 1.
Por otro lado, la funcin G es una funcin no lineal que cumple con la
caracterstica anterior de valores estrictamente entre cero y uno. Las funciones
que se han utilizado ms ampliamente en las aplicaciones de modelos de variable
dependiente limitada son:
21
Donde
Se parte de considerar a
como una variable inobservable determinada por la
ecuacin (9) que introduce la notacin de una funcin indicador,
lo que
significa que esta funcin asume el valor de uno si se cumple la condicin dentro
de los corchetes y de cero si no se cumple.
Los errores,
se suponen independientes de
y que tienen la distribucin
logstica estndar o la distribucin normal estndar. Esto significa que en
cualquier caso los errores se distribuyen simtricamente en torno a cero y as
para todos los nmeros reales z se tiene que
.
Con las consideraciones anteriores es posible calcular la probabilidad de
respuesta para y en los modelos Logit y Probit como,
(
22
23
Para
= 0, 1. El estimador de mxima verosimilitud de
log-verosimilitud:
maximiza la funcin de
Ms adelante se revisar como GRETL realiza muestra los resultados del proceso
de estimacin por mxima verosimilitud.
24
(18)
Con esta herramienta es posible observar que tan bien predice el
a
en cada
observacin del modelo. En GRETL la salida que se obtiene al aplicar el modelo
contiene un anlisis del porcentaje predicho correctamente y que observaremos
posteriormente. Una deficiencia de este mtodo es que en casos particulares
puede no predecir correctamente el resultado menos probable.
Entre las variantes a este mtodo est el de cambiar el umbral de acuerdo a la
fraccin de xitos en la muestra y partir de ah para considerar si
es 1 o 0. De
este modo si el porcentaje de xitos en nuestra muestra es 7% en la ecuacin (18)
hablaramos de
.
Al calcularse un modelo sin utilizar MCO, el
que serva como medida para la
capacidad de ajuste del modelo ya no aplica, pues el procedimiento utilizado para
calcular no ha sido minimizando la varianza sino por mxima verosimilitud. El
equivalente para estos modelos ha sido conocido como pseudo
. Uno de los
ms utilizados y que GRETL calcula automticamente al correr el modelo es el
Pseudo
de McFadden que sugiere la siguiente medida:
Con
como la funcin de log-verosimilitud para el modelo estimado y
como
la funcin de log-verosimilitud con slo el intercepto. La log-verosimilitud del
modelo del intercepto es tratada como la suma total de cuadrados, y la logverosimilitud del modelo completo como la suma de los errores al cuadrado
(UCLA, What are Pseudo R-squareds?) en comparacin con el
de MCO.
El ratio entre
y
nos muestra la capacidad de mejoramiento sobre el
modelo del intercepto que ofrece el modelo completo. Sabemos por la ecuacin
(16) que las log-verosimilitudes de los modelos Logit y Probit siempre van a ser
negativas por lo cual
, por lo tanto, si el modelo tiene baja
probabilidad la log-verosimilitud ser mayor en valor absoluto que la de un
modelo con mayor probabilidad. As, entre el ratio de log-verosimilitudes sea ms
cercano a cero el
ser ms cercano a uno, que indica que el modelo se ajusta
bien. Si el modelo completo no tiene poder explicativo el ratio va a ser cercano o
igual a 1, con lo que el
del modelo ser igual o cercano a 0.
25
Para probar restricciones de exclusin en los modelos Logit y Probit existen tres
mtodos: El multiplicador de Lagrange, el test de Wald y la Razn de
verosimilitudes. GRETL en el resultado que muestra al usuario aplica la Razn de
verosimilitudes.
La prueba de la razn de verosimilitudes parte de considerar que, dado que la
EMV maximiza la funcin de log-verosimilitud, la omisin de variables ocasiona
generalmente una log-verosimilitud no mayor a la del modelo completo. As, la
prueba est basada en la diferencia de las funciones de log-verosimilitud entre un
modelo restringido y uno no restringido y de este modo se puede concluir si la
disminucin en la log-verosimilitud es lo suficientemente grande para considerar
a las variables omitidas significativas.
Este estadstico es dos veces la diferencia de las log-verosimilitudes del modelo no
restringido (
) y el restringido ( ).
)
(21)
26
4.3. CONCLUSIONES.
Como se observ anteriormente, los modelos Logit y Probit han surgido como
nuevos mtodos para superar las deficiencias del modelo de regresin lineal
aplicado a variables endgenas restringidas (Modelo de Probabilidad Lineal) y as
generar predicciones ms precisas sobre los fenmenos observados y modelados.
Sin embargo, se reconoce que la dificultad en el proceso de estimacin e
interpretacin del modelo es mayor para los modelos Logit y Probit, planteando
un nuevo reto a los investigadores en cuanto a cmo entender los resultados que
obtienen. Evaluar las salidas de los programas utilizados para estimar los
modelos toma cierta importancia en cuanto a las facilidades que le ofrece al
usuario.
Este apartado del documento busca nicamente ser una gua terica de los
modelos MPL, Logit y Probit; con el fin de evaluar posteriormente los resultados
que GRETL arroja al usuario y su utilidad en la interpretacin de dichos modelos.
5. APLICACIN
GRETL.
DE
MODELOS
LOGIT
Y PROBIT
EN
Utilizando los mismos datos que se tomaron para ilustrar el proceso del MPL
(seccin 4.1) se ejecutar GRETL utilizando en este caso los modelos Logit y
Probit.
Dentro de la pestaa modelo, de la barra de herramientas de la interfaz, aparece
la opcin llamada Modelos no lineales, aqu se encontrarn los dos modelos en
cuestin, tal como lo muestra la figura M. En este caso, solo se estn
considerando los modelos binarios o con variable endgena restringida, as que la
opcin Binario es la nica que ser trabajada en este documento.
O. MODELOS NO LINEALES
27
P. ESPECIFICACIN DE LOGIT
28
29
Otro forma por medio de la cual se puede estimar un modelo Logit o Probit es el
mediante la consola de GRETL se hace mediante el comando Logit o probit, segn
sea el caso. El comando solo pide la especificacin de las variables separadas por
un espacio. Para activar opciones adicionales como ver los p-valores en vez de las
pendientes (p-values), errores estndar robustos (robust), mostrar la matriz de
covarianzas (VCV) o mostrar detalles de las iteraciones (verbose); slo hay que
dejar un espacio despus de las variables escribir dos guiones seguido de la
opcin u opciones que deseamos, tal como se muestra a continuacin:
logit inlf const nwifeinc exper expersq kidslt6 --verbose --vcv
Para llevar a cabo pruebas de restriccin mltiples y en este caso el test de Wald,
el comando es omit, seguido de las variables a restringir y la opcin de Wald:
omit nwifeinc exper expersq kidslt6 --wald
As se llegar al mismo resultado descrito anteriormente.
30
T. LOGIT EN STATA
31
32
Por ltimo, el comando que permite ver los casos correctamente predichos es
estat classification el cual muestra principalmente el cuadro de predichos y
observados con los casos en que el modelo predijo correctamente respecto al dato
observado (al igual que en GRETL se considera predicho correctamente cuando el
valor observado es uno y el valor de la estimacin es mayor a 0,5; o cuando el
observado es 0 y la estimacin menor a 0,5). En la salida de Stata True D
representa un dato observado de 1 y Classified + una estimacin mayor a 0,5.
33
7. CONCLUSIN.
Aunque no se han explorado ms funcionalidades de GRETL y Stata para la
estimacin de modelos no lineales con variable dependiente limitada, se ha hecho
una revisin de los principales comandos que le permitiran al estudiante o
investigador estimar e interpretar en un nivel bsico un modelo no lineal de este
tipo.
Respecto a los dos software utilizados, es posible observar que las estimaciones y
pruebas realizadas no varan entre los dos programas, por lo cual arrojan los
mismos datos y conclusiones. Adems, las salidas que se obtiene de los dos
programas tienen un aspecto similar que permite una fcil comprensin por parte
del usuario; en este punto es importante decir que GRETL genera la mayora de
clculos con el mismo comando mientras que en Stata se deben buscar diversos
comandos para analizar el modelo estimado, esto sin duda presenta una
diferencia entre GRETL y Stata, pues para los nuevos usuarios puede llegar a ser
ms complicada la bsqueda de los comandos necesarios para llegar a buenas
conclusiones.
Esto demuestra que GRETL al ser software libre de cdigo abierto, se presenta
como un programa til para el anlisis economtrico con buenas estimaciones,
una interfaz agradable e intuitiva en varios idiomas, de fcil instalacin y
disponible para cualquier usuario. Aunque todava necesite desarrollos que
fortalezcan su potencia en la ejecucin de varios modelos, se presenta como una
oportunidad para los usuarios que no pueden acceder a otros programas por los
altos costos de las licencias o por la dificultad de entender cmo funcionan.
Adems, al ofrecer una librera gratuita con gran cantidad de bases de datos de
los libros ms reconocidos en la enseanza de la econometra, GRETL se
convierte en una herramienta muy interesante para el aprendizaje.
Modelos como Logit y Probit son utilizados recurrentemente para la estimacin de
fenmenos en el mundo real, sin embargo debido a lo complejo que es su
estimacin no son tomados en cuenta en los cursos bsicos. La pertinencia de
aplicar modelos que no son vistos en la lnea de econometra del programa de
pregrado de la Facultad utilizando interfaces tan intuitivas como GRETL, est en
que los estudiantes y las personas interesadas en profundizar en temas
diferentes, como los modelos no lineales estudiados aqu, no necesitan de un
tutor o profesor que los gue sino de una gua terica y prctica que los
introduzca en el tema y les ofrezca las bases, incentivando as el autoaprendizaje como complemento a la formacin que se recibe en las aulas.
34
8. REFERENCIAS.
Cottrell, A., & Lucchetti, R. (Julio de 2011). GRETL users guide. Recuperado el 9
de
Septiembre
de
2011,
de
GRETL
Web
page:
http://gretl.ecn.wfu.edu/pub/gretl/manual/PDF/gretl-guide-a4.pdf
UCLA. (s.f.). Stata Data Analysis Examples: Logistic regression. Recuperado el 25
de Noviembre de 2011, de http://www.ats.ucla.edu/stat/stata/dae/logit.htm
UCLA. (s.f.). What are Pseudo R-squareds? Recuperado el 16 de Noviembre de
2011,
de
http://www.ats.ucla.edu/stat/mult_pkg/faq/general/psuedo_rsquareds.htm
Wooldridge, J. (2009). Introductory Econometrics: A modern approach. Cengage
Learning.