You are on page 1of 43

Aplicaciones de la

Econometra en Stata 1

Adriana Camacho

Universidad de los Andes


Especializacin en Evaluacin Social de Proyectos

La econometra es la aplicacin de
mtodos estadsticos para :


cuantificar problemas econmicos





proyectar variables macro




elasticidad precio-cigarrillo
Evasin- tasas impositivas
IPC, PIB, tasa desempleo

probar o validar la teora econmica




salario mnimodesempleo

La econometra es la aplicacin de
mtodos estadsticos para :


Evaluar polticas privadas o pblicas






Programa de capacitacin en salario


Subsidios de educacin
Efecto en las notas al reducir el nmero
de estudiantes en una clase
Efecto en los salarios de un ao de
educacin adicional
Efecto del gasto de las campaas
polticas en las votaciones

Pasos a seguir para hacer un


anlisis emprico
Pregunta de inters = Evaluacin de poltica social
1.
Modelo econmico

ecuaciones matemticas describen relaciones y/o


comportamientos econmicos (mx. utilidad, funcin
produccin)
2.
Modelo economtrico

Puede diferir del econmico, pero se basa en el para


elegir las variables usadas y sus relaciones.

Existen variables que no podemos observar o


medir.(uso de variables Proxy)
3.
Datos

Muestra aleatoria
4.
Mtodos economtricos para encontrar estimadores



5.

Inferencia Estadstica

6.

Insesgados (parmetro poblacional igual al parmetro


muestral)
Eficientes (estimador con menor varianza)
Pruebas t y F

Interpretacin

Distribucin muestral cuanto n


n3

n1 < n2 < n3

n2
n1
1

Tipos de datos


Datos de corte transversal


Encuesta nacional de Hogares
 Censo
 Encuesta de calidad de vida
El comn el uso de dos+ cortes transversales


Series de tiempo




IPC
PIB
Tasa de cambio, tasa de interes

Datos panel



Hogar (no existen en Colombia)


Empresa (banco, sector industria,ciudades)

Terminologa: Modelo de Regresin


Mltiple


En el modelo de regresin lineal mltiple,


donde, y = 0 + 1 x1 + 2 x2 + u , nos referimos

ycomo :
*Dependiente
*de la izquierda
*explicada
*de respuesta
*Predicha

como:
*Independiente
*de la derecha
*explicativa
*de control
*Predictora

Terminologa: Modelo de Regresin


Multiple
0 es el intercepto
 a k se llaman parmetros de
1


pendiente,
1 es el efecto de x1 en y
manteniendo todos los dems
factores constantes
u es el error (muy importante

en el modelo )


u u

parametros
poblacionales y muestrales

Estimacin de MCO


Minimiza el cuadrado de los residuos:




Encuentra valor que minimiza la distancia entre la


muestra y este valor.
Minimiza la diferencia al cuadrado entre el valor
estimado y el valor actual de Y
Cruza una lnea por la muestra de puntos de tal
forma que la suma cuadrada de los residuos sea
tan pequea como sea posible, por esto se llama
MINIMO CUADRADO

( y y ) 2 = u 2

min

Lnea de regresin de una muestra aleatoria


E(y|x) = 0 + 1x
.{
u4

y
y4

y3
y2

y1

u2 {.

.} u3

} u1

x1

x2

x3

x4

Algunos resultados de MCO









Dados 0 , 1 y x obtenemos y (ajustado)


y debe pasar por la lnea de regresin de
MCO
u i (residuo) mide la diferencia entre y y y
Si ui > 0 entonces sub-pronosticamos
Si ui < 0 entonces sobre-pronosticamos
Idealmente quisiramos que ui = 0 (en
este caso todos los datos deberan pasar por
la lnea de regresin... No sucede!)

Supuestos del modelo de


regresin lineal
1.

El modelo Poblacional lineal en los parmetros:

y = 0 + 1 x1 + 2 x 2 + ... + k x k + u

2.

Con una muestra aleatoria de tamao n, {(xi1,


xi2,, xik, yi): i=1, 2, , n}, escribimos el modelo
poblacional en trminos de la muestra:

yi = 0 + 1 xi1 + 2 xi 2 + ... + k xik + u i


3.

Asumimos media condicional igual a cero. (Saber


algo acerca de x no nos da ninguna informacin
sobre u)

E(ui | xi ) = 0

Supuestos del modelo de


regresin lineal
4.

Ninguna de las xs es constante, y no


existe una relacin lineal exacta entre
ellas. (Matriz X de rango completo)


5.

para que

exista

Homoscedasticidad: varianza condicional


cte


encontramos eficiencia.

Stata tiene 4 ventanas:




Variables: nombres de las variables de la


base de datos.

Comandos: donde se escriben


instrucciones para operar stata.

Resultados: mostrar los resultados


derivados de dichos comandos

Comandos anteriores (review) encontrar


listado
de
comandos
usados
anteriormente en la sesin de Stata.

las

Tipos de formatos de archivos de


Stata:


x.do: archivo programacin. Imprime en la


ventana de resultados las operaciones y los
comandos usados.

x.log: archivos guardan las impresiones


que aparecen en la ventana de resultados.


Log using x.log, replace

x.dta: archivo de datos stata.

Barra de herramientas













Abrir: abrir datos en stata


Guardar: guardar datos en stata
Imprimir: imprimir contenidos de la ventana activa.
Log: empezar o terminar, pausar o resumir un archivo
log.
Resultados: abrir la ventana de resultados.
Grfica: abrir la ventana de grfica.
Editor do-file: abrir el editor de do-file.
Data editor: editar los datos.
Data browser: abrir la hoja de los datos.
Ms: comando para continuar cuando esta en pausa.
Stop: parar la tarea que esta realizando.

Comandos de memoria



clear: limpiar memoria


set memory:




set matsize:




Stata asigna 10M automticamente


si cree que necesita ms memoria,
Utilice set memory XXm
Stata asigna 400 variables
Si tiene ms variables
Utilice set matsize hasta 11,000 variables.

compress:


Sirve para comprimir el formato de los datos

Comandos para determinar


directorio


cd: Se encarga de identificar y/o


cambiar el directorio.
dir:
muestra
archivos
en
el
directorio
mkdir: Crea un nuevo directorio

Comandos para introducir base de


datos en diferentes formatos


insheet : archivos separados por comas o


tabs


infile: separados por espacios, comas o


tabs


x.txt, x.prn, x.raw, x.csv

infix: datos fijos




x.csv y x.raw

x.dat, x.dbf

edit: para introducir a mano los datos


use: abrir datos en formato .dta

Formatos de variables


describe:


Tipos de formatos:



resume el contenido de los datos en la


memoria y los formatos de las variables.

Str (string- no numerico)


Byte, float, int, double, long (numericos)

destring: cuando una variable esta en


formato string (no nmerico) cambiar el
formato a uno nmero.


usa la opcin ,replace

Comandos para modificar la base de


datos


rename:



cambia el nombre a una variable,


sin cambiar el contenido.

recode:


cambia los valores numricos de las


variables de acuerdo a la regla
especificada.

Comandos para explorar datos




list:



muestra las observaciones en pantalla


desplegando toda la hoja de calculo.
list in 1/10: lista en una tabla los datos
de todas las variables del primer al
dcimo dato.
list if x1==2: muestra solo los datos en
donde la variable x1 es igual a 2.

count:


numero de observaciones

Comandos para explorar datos




tabulate: genera tablas de frecuencia.





tab x1 (x2): genera todas las posibles


tabulaciones de las dos variable.
Tab1 x1 x2 x3: genera tablas de frecuencia
separadas para cada variable

sum: realiza una descripcin estadstica


de la variable



Media, des.est, mx. min. y numero de


observaciones
sum x1, detail: informacin adicional sobre
coeficientes de asimetra, curtosis y varios
percentiles.

Comandos para explorar datos




correlate:





Este comando seguido de una lista de


variables
Saca una matriz de covarianzas .
corr ventas promsal empleado

Comandos para graficar los datos




histogram: seguido de una variable


crea un histograma de esta.


histogram ventas

Comandos para graficar los datos




twoway scatter: Seguido por dos


variables muestra la relacin entre
estas.


twoway scatter empleado ventas

Comandos para graficar los datos




twoway lfit: Genera la lnea de la


regresin que predice la relacin
entre dos variables.


twoway lfit empleado ventas:

Comandos para graficar los datos




graph matrix: Muestra la relacin


entre 3 variables.


graph matrix empleados ventas


tothoras

Comandos para graficar los datos




kdensity: genera histogramas


planos.


kdensity ventas

Comandos para ordenar las base de


datos


label: Este comando sirve para aadir


etiquetas tanto a las variables como a
bases de datos



label var: aplica una etiqueta a una variable.


label define: define el grupo de etiquetas para
los niveles de una variable categorica.
label value: aplica etiquetas de valor a una
variable.
Ejemplo:

label variable sindicato pertenecia a un sindicato."


label define sld 1 sindicalizado 0 nosindicalizado
label values sindicato sld

Comandos para ordenar las base de


datos


order: Este comando


lista de var cambia el
sea especificado por
variables.
aorder: Acomoda las
orden alfabtico.

seguido por
orden segn
la lista de
variables en

Comandos para ordenar las


observaciones


sort: Ordena de forma ascendente las


observaciones basado en una o ms
variables.
gsort: Tiene las misma propiedades de sort
pero permite ordenar en orden ascendente o
descendente dependiendo del signo que se
introduzca antes de la variable.
bys x1:tab x2: Repite la orden de Stata
sobre los subconjuntos de datos.


Une el comando by y sort

Expresiones utilizadas con generate

Comandos para crear nuevas variables




generate: genera nueva variable


definida en base a una expresin
lgica, aritmtica y matemtica.
replace: cambia el contenido de una
variable ya existente sustituyndola
por una expresin.

Comandos para crear nuevas variables




egen: extencin de generate




gran cantidad de funciones preestablecidas con las que se pueden


generar nuevas variables.

bys fcordigo egen promventas=mean(ventas)




nos genera una variable que


promedio de las ventas por firma

es

el

Comandos para modificar la base de


datos


keep:


drop:


mantiene la lista de variables especificadas y


elimina las que no estn incluidas en la lista.
elimina la lista de variables especificadas y
conserva las que no estn incluidas en la lista

reshape wide, long:




transforma la base de datos de una formato


ancho (wide) a uno largo (long) y viceversa.

Comandos para modificar la base de


datos


reshape wide: Sirve para convertir una


base de datos tienen orden (de nacimiento)
en una columna a una fila.

reshape wide age, i(famid) j(birth)

Comandos para modificar la base de


datos


reshape long: Sirve para convertir


una base de datos que tienen los
aos en una fila a una columna.

reshape long faminc, i(famid) j(year)

Comandos para combinar bases de


datos


merge:





Une dos bases de datos utilizando una


variable en comn (llave).
Las dos bases de datos deben estar en
formato .dta
Deben estar ordenadas (sort) de
acuerdo a la variable(s) de la llave
Anexa variables
mmerge es mas rapido y eficiente

Comandos para combinar bases de


datos


append:



seguido por using base de datos


anexar observaciones por lo general a una
misma variable.

collapse:


construye una base de datos que contenga


informacin condesada de la base original.
 Empresa a industria
 De municipios a departamentos
 De hogares a municipios

Comandos para guardar/borrar datos




save: Para guardar los datos se


utiliza este comando seguido de la
ruta donde se desea guardar.



Alternativa saveold
Utilizar la opcin ,replace

erase: para borrar una base de


datos se utiliza este comando
seguido de la ruta.

Sintaxis general de los comandos


[by vars:] comando vars [if expresin],[opciones]


by permite aplicar el mismo comando


separando la base de datos en subgrupos
definidos por lista de var.
Posteriormente
viene
el
comando
seguido por una segunda lista de var a las
cuales se les aplicar el comando.
in y if ayudan a limitar los datos a los
que va a ser utilizado el comando.

You might also like