You are on page 1of 6

Bahiron Jesus Astudillo Correa

Paralelo 1
Certamen 1
08/11/2021
1. (20 puntos) Ejercicios teóricos.
a. Explique que es el modelo de regresión lineal múltiple y el método usado para
estimar sus parámetros.
El modelo de regresión lineal múltiple es una técnica estadística para comprobar hipótesis y
relaciones explicativas en donde se busca obtener una relación lineal entre un conjunto de
variables independientes X1,..,Xn con una variable dependiente Y. Esta regresión lineal
múltiple permite identificar que variables independientes (causas) explican una variable
dependiente (resultado), además, permite comparar y comprobar modelos explicativos y
logra predecir valores de una variable. Dentro de este modelo hay que tener en cuenta y
mucho cuidado con la cantidad de variables que se utilizarán, debido a que se pueden obtener
resultados sesgados si el R2 es muy elevado. Por último, el método para trabajar sus
estimadores es elegir k+1 estimadores que minimicen la suma de cuadrados residuales.

b. Explique el trade-off (costos y beneficios) que existe en modelo de regresión lineal


múltiple al incluir muchas o pocas variables explicativas.
Cuando en un modelo de regresión lineal múltiple se incluyen muchas variables explicativas
se genera un trade-off que se traduce en un R2 mayor, lo que implica una mayor significancia
en los datos, siempre y cuando se trabaje bajo el supuesto de que no se está produciendo
colinealidad. Por otra parte, uno de los trade-off mas significativos que se da a la hora de
incluir variables explicativas es el que ocurre entre el sesgo y la varianza, esto se debe a que
cuando omitimos una variable que tiene relación con la variable dependiente estamos
incurriendo en un sesgo por omisión de variables lo que nos da estimadores de MCO
inconsistentes. Además, si la correlación entre las variables omitidas y la variable
dependiente es positiva se obtendrá un sesgo positivo, de lo contrario, si es negativa el sesgo
también será negativo.
c. Explique el concepto de inferencia causal en el contexto de regresión lineal simple.
En concepto de inferencia causal en el contexto de regresión lineal simple es la relación que
tiene la variable independiente con la dependiente en el contexto de como afecta el cambio
en el valor de la variable independiente al resultado en la variable dependiente. En resumen,
este concepto se traduce a como afecta beta 1 a Y, ya que en este caso beta 1 impacta
directamente al resultado que se obtiene en Y.
d. ¿Qué es un modelo restringido y no restringido en el contexto de pruebas de
hipótesis?
El modelo restringido es aquel donde se elimina una gran cantidad de variables
insignificantes, es decir, que no son lo suficientemente necesarios para ser utilizados, por
ende, conducen hacia la hipótesis nula. A raíz de esto, nos damos cuenta de que el modelo
no restringido es aquel que no ha eliminado nada. Por otra parte, en un modelo no restringido,
las variables independientes si tienen relevancia y no considerarlas en la hipótesis, causa
cambios de ajuste en el modelo.

2. (50 puntos). Ejercicio de computación


a. Calcule el R2 y estime la varianza y el error estándar muestral de los residuos
R2 = 1 – SSR/SST
R2 = 1 – (31682,527/47386,683)
R2 = 1 – 0,668
R2 = 0,331
Varianza = SSR/(N-K-1)
N: Observaciones
K: Número variables
Varianza = 31682,527/(60822-4-1)
Varianza = 31682,527/60817
Varianza = 0,520
Error estándar = Var1/2
Error estándar = 0,5201/2
Error estándar = 0,721

#Creación variable mujer


gen mujer = (sexo==1)
#Creación variable exper
gen exper = edad-educ-6
#Creación variable exper2
gen exper2 = exper2
#Creación variable salario/hora
gen salario_hora=yoprcor/160
#Creación variable logarítmica de salario por hora
gen log_salario = ln(salario_hora)

#Análisis regresión múltiple


reg log_salario educ mujer exper exper2

R2 = 0,331
Varianza = 0,520
Error estándar = 0,721

b. Interprete el parámetro estimado de mujer y pruebe si es estadísticamente


significativo al 5% (consejo: use una prueba de t de dos colas)
Prueba de hipótesis de 2 colas Mujer Coeficiente Error típico
H0:beta2=0 -0,353 0,006
Ha:beta2#0
Nivel signfic 0,05
gl (error) 60,817
tcalculado -58,833333
ttabulado 2,00029782 Rechazo H0

La interpretación que se obtiene del parámetro estimado de mujer es que influye


negativamente en el salario/hora debido al valor negativo, ya que por cada unidad que
aumente se vería una disminución del 35,3%
c. Interprete el parámetro asociado a educación y pruebe si estadísticamente la tasa de
retorno de la educación es igual al 10%, versus si es mayor (consejo: use una prueba
de t de una cola).
Prueba de hipótesis de 1 cola izquierda
H0: retornoeduc=0,1
Ha: retornoeduc>0,1
Nivel signific 0,1
gl (error) 60817
tcalculado 171
ttabulado -1,2815655
Valor p 0,17549406
d. Replique el modelo anterior y agregue efectos fijos de región y zona urbano y rural
(consejo: tiene que crear una variable dummy para cada región o zona, y excluir una
dummy del modelo). Compare los resultados obtenidos en términos de la tasa de
retorno a la educación y brecha salarial entre hombres y mujeres.
e. Usando el modelo en d, pruebe si la tasa de retorno a la educación varía entre sexo
(consejo= use la interacción entre educ y mujer). Interprete los resultados.

3. (30 puntos). Problema de investigación


a. ¿Está de acuerdo usted con esta hipótesis?
Estoy medianamente de acuerdo con esta hipótesis ya que a mi parecer los bonos y los retiros
de la AFP podrían ser una causal en la escasez laboral, sin embargo, no se puede decir con
certeza que dichas variables son las responsables de esta paradoja. Lo anterior se debe a que
actualmente las personas ya no cuentan con la posibilidad de seguir retirando dinero de sus
AFP, además, existe una parte considerable de la población que ya no les queda dinero debido
a todos los gastos ocasionados por el virus, lo que los obliga a ir en busca de un empleo para
poder cubrir sus necesidades.
En resumidas cuentas, la hipótesis es cierta cuando el virus recién se dio a conocer, esto
debido a que aumentó la informalidad de trabajo para poder acceder a los bonos generando
así que las vacantes de trabajo no se llenen, junto con una reducción en la tasa de empleo.
Por otra parte, hoy en día un porcentaje significativo de la población encuentra insuficiente
los bonos y retiros de AFP para poder sobrevivir ante tal crisis, lo que se traduce a un aumento
en la tasa de empleo lo que permite aumentar las vacantes de trabajo debido a que las personas
prefieren optar a un empleo para poder costear los gastos en vez de recurrir a los bonos y
beneficios del gobierno que no les son suficientes para poder cubrir necesidades básicas.
b. Utilizando un modelo de regresión lineal múltiple, explique como podría probar esta
hipótesis y que fuente de datos utilizaría. Defina la variable (o variables dependientes,
variable explicativa y variables de control
Definición variable dependiente del modelo (Y)
Desempleo (población desempleada)
Definición variable independiente de interés a evaluar (X)
Ingreso total trabajador, Bonos del gobierno, Búsqueda de trabajo, Fuerza total de trabajo,
Retiro 10%
Otras variables independientes para incluir en el modelo
Edad, sexo, educación, nacionalidad
Definición forma funcional del modelo a estimar y el método de estimación
𝑦𝑖 = 𝛽0 + 𝛽1𝐵𝑖 + 𝛾𝑋𝑖 + 𝜀i
Yi: Variables dependientes
Bi: Variables independientes
X: Variables de control
𝜀i: Término de error

Y desempleo = b0 + b1 ingreso total del trabajador + b2 Búsqueda de trabajo – b3 Bonos


del gobierno + b4 Fuerza total de trabajo – b5 Retiro 10%

Definición fuente de datos a utilizar para estimar el modelo


Datos a utilizar del INE, ya que tiene construida una variable derivada que recoge la actividad
económica de los encuestados cuando la persona tiene 16 años o más, es decir, la situación
en que se encuentra cada persona en cuanto al empleo. Esta variable recoge tanto la población
económicamente activa como la inactiva. La información del INE servirá para cruzar los
datos con información obtenida de los registros administrativos de entrega de bonos.

You might also like