You are on page 1of 7

TALLER TEÓRICO PRÁCTICO INDIVIDUAL 4

SEBASTIAN CALLE AGUIRRE.

JOSE ANDERSON GIRALDO VARGAS.

Marzo, 2021

UNIVERSIDAD DE MANIZALES, ECONOMETRÍA

JUAN FELIPE CASTELLANOS MARTINEZ


Taller práctico individual 4

1. Para este punto, se debe elegir una relación económica de interés que se quiera
estudiar y con variables que tengan información disponible. Si no se les ocurre
ninguna, o no encuentran información, pueden buscar entre las bases de datos del
paquete AER o del paquete Wooldridge y elegir la relación de interés a partir de la
información disponible en ellas.
a. Plantear cuál es la relación de interés, cuál es la variable dependiente y cuál es la
variable independiente. Establezca una hipótesis que se pueda trabajar con un
modelo de regresión (Por ejemplo: “la educación permite que las personas puedan
acceder a un mejor salario”, o “El nivel socioeconómico de los hogares afecta el
desempeño académico de los estudiantes”, etc).
b. Dentro de la relación planteada, discutir si existen razones para creer que puedan
presentarse problemas de variable omitida o de endogeneidad.
c. Plantear el modelo de regresión que se ajustará y discutir desde el punto de vista
teórico qué signos se esperarían para cada uno de los coeficientes del modelo.
d. Ajustar el modelo de regresión incluyendo todas las variables que puedan permitir
controlar posibles fuentes de endogeneidad. Explicar por qué se incluyeron cada una
de ellas y explicar si existen variables que pueden haber quedado por fuera del
modelo y que en algún punto puedan causar problemas de sesgo de variable
omitida.
e. Interpretar cada uno de los beta estimados para el mejor modelo obtenido y explicar
si se ajustan a lo esperado en el punto c.
f. Interpretar los p valores asociados con cada uno de estos beta, el valor del R
cuadrado y el resultado de la prueba F de significancia conjunta.
g. Evaluar la distribución de los residuales, y verificar si siguen una distribución cercana
a la normal. Explicar por qué este paso es importante desde el punto de vista de la
inferencia.
h. Realice las pruebas necesarias para verificar los supuestos del modelo en términos
de especificación de forma funcional y heterocedasticidad. Si es necesario, tome
medidas correctivas.
i. Plantear las conclusiones obtenidas de este ejercicio teniendo en cuenta la hipótesis
planteada en el punto a.

2. Consulte:
a. De qué se tratan las variables instrumentales y cuál es su utilidad.
b. Cómo se implementan en un modelo de regresión (cuál es el paso a paso de una
regresión en dos etapas).
c. Proponga un ejemplo en R.

3. Consulte un paper en inglés que se encuentre en una revista académica reconocida


en el cual se realice una aplicación de un modelo econométrico. Explique con sus
propias palabras (copiar y pegar anula la respuesta):
a. ¿Cómo se implementan los modelos econométricos en el archivo? ¿Se usan series
de tiempo, corte transversal o datos panel? ¿Qué bases de datos se utilizan?
b. ¿Cuál es el modelo planteado y qué variables se incluyeron y por qué?
c. Explique los resultados obtenidos en el paper y las conclusiones que se desprenden
de la implementación del modelo.

SOLUCIÓN

1. Rental
a. Existe una relación en el comportamiento del número de integrantes de una
población de una ciudad respecto al número de viviendas ocupadas por inquilinos,
donde por diferentes causas, muchas personas foráneas se ven obligadas a
instalarse en las grandes ciudades, alquilando viviendas para su confort y
aumentando la población de la ciudad. De igual forma las personas que parten de
la ciudad, provocan una disminución en la población y por ende una disminución
en el número de viviendas alquiladas.
Variable dependiente: población de la ciudad Y
Variable independiente: viviendas ocupadas por inquilinos X
Hipótesis
La cantidad de viviendas ocupadas por inquilinos influye en la población de una
ciudad
b. Una de las variables que se omitió para esta regresión fue el ingreso per cápita, la
cual puede llegar a ocasionar problemas de sesgo de variable omitida.
c. Se plantea un modelo de regresión lineal:
𝑦 = 𝛽0 + 𝛽1 𝑋
Para el coeficiente 𝛽1se espera tenga un signo positivo, ya que según lo evidenciado
en diferentes lugares, como referencia Colombia, a medida que aumenta el número
de viviendas ocupadas, la población de la ciudad aumenta. En cuanto a 𝛽0 se espera
que tenga un signo positivo, ya que la población y el número de viviendas ocupadas
no puede ser negativo.
d. Las variables incluidas en el modelo son la población de la ciudad y el número de
viviendas ocupadas por inquilinos, estas se incluyeron ya que se evidencia en la
literatura una relación entre ellas. Una de las variables que se omitió para esta
regresión fue el ingreso per cápita, la cual puede llegar a ocasionar problemas de
sesgo de variable omitida.
e. Los valores obtenidos de los coeficientes para el modelo lineal, el cual se ajustó de
buena manera para los datos analizados, fueron:
𝛽0: 5893, este valor nos indica la población que había al inicio del estudio.
𝛽1 : 4,716. Este valor nos indica cuanto crece la población de la ciudad por cada
vivienda que es ocupada por inquilinos. Efectivamente los valores obtenidos se
ajustan a lo mencionado en el punto c.
f. El valor p para 𝛽0 y 𝛽1fueron de 0,00206 y 2e-16 respectivamente, dado lo anterior
se acepta la hipótesis de investigación, ya que su valor fue menor a 0,05. Respecto
al 𝑅 2 se obtuvo un valor de 0,9653 el cual es un valor aceptable, con una
confiabilidad mayor al 95%.
g.
h.

i. Teniendo en cuenta la hipótesis planteada en el punto a, se concluye que la


población de la ciudad se ve influenciada por la cantidad de viviendas ocupadas y se
relacionan de una manera directamente proporcional.

2. A. Las variables instrumentales se utilizan como método de estimación, cuando un


experimento controlado para probar la existencia de una relación causal no es
factible y se sospecha alguna correlación entre las variables explicativas originales y
el término de error. Cuando las variables explicativas se correlacionan, las variables
instrumentales pueden proporcionar una estimación consistente.

B. La variable instrumental debe cumplir con dos supuestos para poder ser utilizada,
estos son: relevancia y exogeneidad. La relevancia se refiere que la correlación entre
la variable instrumental y la variable endógena debe ser diferente de cero; la
exogeneidad se refiere a que la variable instrumento no debe estar relacionada con
el error [1].

El paso a paso se describe mediante un ejemplo de variables omitidas en un modelo


de regresión simple:
Supongamos que queremos regresar salario en educación y habilidad:
log(𝑠𝑎𝑙𝑎𝑟𝑖𝑜) = 𝛽0 + 𝛽1 𝑒𝑑𝑢𝑐 + 𝛽2 ℎ𝑎𝑏𝑖𝑙 + 𝑒
El término de error que queremos es e pero, como no podemos observar hábil,
entonces solo podemos estimar:
log(𝑠𝑎𝑙𝑎𝑟𝑖𝑜) = 𝛽0 + 𝛽1 𝑒𝑑𝑢𝑐 + 𝜇
Donde hábil forma parte de μ. Sabemos que en este último caso obtendremos
estimaciones por MCO sesgadas e inconsistentes de 𝛽1 sí hábil está correlacionada
con educ. Podemos resolver este problema si encontramos una variable
instrumental (VI) para educ.
En el caso de regresión simple general:
𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝜇 (1)
• Y pensamos que 𝑐𝑜𝑣(𝑥, 𝜇) ≠ 0
• Suponga que tenemos una variable observable Z que cumple con las
siguientes condiciones:
- 𝑐𝑜𝑣(𝑧, 𝜇) = 0 (2)
- cov(z, x) ≠ 0 (3)
• Entonces se dice que z es una variable instrumental de X o un instrumento
para X.
La condición (2) se llama exogeneidad del instrumento o condición de exclusión e
implica que:
• Z es exógena en la regresión (1).
• Z no tiene efecto parcial en Y.
• Z no está relacionada con las variables omitidas.
La condición (3) se llama relevancia del instrumento e implica que:
• Z está correlacionada con X (positiva o negativamente).
• Z explica variabilidad de X.
Las condiciones (2) y (3) son diametralmente diferentes.
No observamos μ por lo que probar la exogeneidad del instrumento es imposible.
• Se justifica por medio de explicaciones económicas o introspección.
La relevancia del instrumento si es mucho más fácil de probar.
En la regresión poblacional tenemos:
𝑋 = 𝛱0 + 𝛱1 𝑍 + 𝑣
Y debemos probar:
𝐻0 : 𝛱1 = 0
𝐻1 : 𝛱1 ≠ 0
Entonces si podemos rechazar 𝐻0 a un nivel de significancia suficientemente bajo
podemos estar seguros de que la condición de relevancia se cumple.
Supongamos que tenemos una variable Z que cumple exogeneidad y relevancia.
Veremos que entonces podemos identificar 𝛽1.
• Identificar 𝛽1 : podemos escribir 𝛽1 en términos de los momentos
poblacionales que pueden estimarse usando una muestra de datos.
Partamos de:
𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝜇
Entonces podemos escribir:
𝑐𝑜𝑣(𝑍, 𝑌) = 𝑐𝑜𝑣(𝑍, 𝛽0 + 𝛽1 𝑋 + 𝜇)
𝑐𝑜𝑣(𝑍, 𝑌) = 𝑐𝑜𝑣(𝑍, 𝛽0 ) + 𝑐𝑜𝑣(𝑍, 𝛽1 𝑋) + 𝑐𝑜𝑣(𝑍, 𝜇)
𝑐𝑜𝑣(𝑍, 𝑌) = 0 + 𝛽1 𝑐𝑜𝑣(𝑍, 𝑋) + 𝑐𝑜𝑣(𝑍, 𝜇)
Y si Z cumple con exogeneidad, 𝑐𝑜𝑣(𝑍, 𝜇) = 0, y la relevancia, con 𝑐𝑜𝑣(𝑍, 𝑋) ≠ 0,
entonces podemos escribir:
𝑐𝑜𝑣(𝑍, 𝑌)
𝛽1 =
𝑐𝑜𝑣(𝑍, 𝑋)
Que muestra que podemos identificar 𝛽1.
Lo que necesitamos ahora es un estimador de 𝛽1 , 𝛽̂1.
Para ello reemplazamos 𝑐𝑜𝑣(𝑍, 𝑌) y 𝑐𝑜𝑣(𝑍, 𝑋) por sus contrapartes muestrales
∑𝑛𝑖=1(𝑍𝑖 − 𝑍̅)(𝑌𝑖 − 𝑌̅)
𝑛 ∑𝑛𝑖=1(𝑍𝑖 − 𝑍̅)(𝑌𝑖 − 𝑌̅)
̂
𝛽1 = 𝑛 =
∑𝑖=1(𝑍𝑖 − 𝑍̅)(𝑋𝑖 − 𝑋̅) ∑𝑛𝑖=1(𝑍𝑖 − 𝑍̅)(𝑋𝑖 − 𝑋̅)
𝑛
Este es el estimador VI de 𝛽1.
El estimador VI de 𝛽̂1 es 𝛽̂0 = 𝑌̅ − 𝛽̂1 𝑋̅
Al igual que MCO, VI es un método de estimación, no un modelo. El modelo
poblacional es el mismo en MCO y VI, lo que cambia es cómo se estima 𝛽1.

3. A. En el paper se propone implementar una tasa por congestión para gestionar la


demanda vehicular mediante la aplicación de encuestas de preferencia declaradas
y modelos econométricos. Se utilizan series de datos de panel.

B. Los modelos econométricos utilizados son de tipo Logit multinomial y mixto. Las
variables incluidas en los modelos son: tiempo de viaje (Tv), costo de usar el modo
(Cm), tiempo de espera (Te) y la tasa por congestión (Tc). Las variables explicativas
se realizaron con base en la lectura de casos y referencias de bibliografía donde la
medida ya fue implementada. Siguiendo el diseño del experimento planteado por
Kocur.

C. De las 2053 observaciones realizadas mediante las encuestas de preferencia


declaradas, se observó que para desestimular el uso del auto particular se debería
cobrar una tasa de $7000 COP por vehículo que ingrese a la zona o área de
congestión.
Si se considera el costo marginal debido a la congestión, se tiene que la demanda
actual es excesiva; los usuarios disfrutan del beneficio a un costo de $3100 COP,
pero imponen a los demás un costo de $22152 COP [2].

Bibliografía

[1] R Studio- Aplicaciones econométricas - FCE. (n.d.). Retrieved March 25, 2021, from
http://www.fce.unal.edu.co/r-studio-aplicaciones-econometricas.html

[2] Jiménez Serpa, J. C., & Salas Rondón, M. H. (2017). Aplicación de modelos
econométricos para estimar la aceptabilidad de una tasa por congestión vehicular.
Inge Cuc, 13(2), 60–78. https://doi.org/10.17981/ingecuc.13.2.2017.08

You might also like