You are on page 1of 2

 

 
 
Facultad de Estadı́stica
Taller
 Maestrı́a en Estadı́stica Aplicada


Estadı́stica Exploratoria Prof: Edna Carolina Moreno

Instrucciones Generales

• Puede hacer el taller solo o puede asociarse máximo 3 personas, entendiendo que la calificación del mismo serı́a la
misma para todas las personas.
• El reporte final se debe enviar a más tardar el Lunes 17 de febrero de 2020 a las 11:59 p.m. a la cuenta de correo:
ednamoreno@usantotomas.edu.co.
• Reportar las cifras utilizando la cantidad adecuada de decimales, dependiendo de lo que se quiera mostrar y las
necesidades del problema.
• El objetivo principal de este trabajo es la claridad lógica y la interpretación de los resultados. El informe no necesita
ser extenso. Recuerde ser minimalista escribiendo el reporte. Se deben incluir solo aquellos gráficos y tablas (y valores
en la tabla) que son relevantes para la discusión. Por favor interprete las salidas y mencione lo más relevante.

Ingresos y nivel educativo

Considere la Encuesta de Transición de la Escuela al Trabajo que realizó el DANE en 2013 y 2015. La descripción completa
de la operación estadı́stica y la descripción de las variables se encuentra en los siguientes enlaces:
http : //microdatos.dane.gov.co/index.php/catalog/517/getm icrodatayhttp : //microdatos.dane.gov.co
/index.php/catalog/518/getm icrodata. Esta encuesta contiene ocho módulos, a saber:

• Caracterı́sticas generales.
• Educación.
• Jóvenes ocupados.
• Jóvenes desocupados.
• Inicio del historial de actividades.
• Perspectivas laborales y fuerza de trabajo.
• Jóvenes inactivos.
• Historial de actividades.

Considere el módulo de JOVENES OCUPADOS (107 variables). Los datos correspondientes a los años 2013 y 2015 se
encuentran disponibles en los archivos JO13.csv y JO15.csv, respectivamente. Este caso de estudio es de alguna manera
longitudinal porque se quiere investigar si hubo cambios considerables de 2013 a 2015 respecto a las caracterı́sticas más
relevantes de los jóvenes ocupados.

En este ejercicio académico solo vamos a considerar las siguientes variables:

EP6450 ¿El contrato es verbal o escrito?


1 Verbal
2 Escrito
3 No tiene

EP6460 ¿El contrato de trabajo es a termino indefinido o a termino fijo?


1 A término indefinido
2 A término fijo
9 No sabe, no informa

EP6422 ¿Está conforme con el tipo de contrato que tiene?


1 Si
2 No
EP6500: Antes de descuentos? Cuánto ganó el mes pasado en este empleo? (Incluya propinas y comisiones, y excluya
viáticos y pagos en especie). Valor mensual en pesos ($).

1. De acuerdo con el diseño estadı́stico de la encuesta (ver metodologı́a ETET 2015.pdf, por ejemplo), cuál es el universo,
la población objetivo, la fuente de datos, y la cobertura y desagregación geográfica?
http : //microdatos.dane.gov.co/index.php/catalog/517/relatedm aterials
2. Clasificar las variables según su naturaleza y su escala de medición.
3. Para el año 2015 cree un data frame que contenga únicamente las preguntas de interés. Cuántos datos faltantes hay
en el 2015? Elimine estas filas con registros faltantes
4. Haga lo mismo con el año 2013.
5. Una las bases de datos en un solo data frame. Para esto es muy importante crear una nueva columna que permite
identificar el año donde se realizó la encuesta a cada individuo. Luego de crear esta columna una las dos bases.
6. Ordene la base de datos de menor a mayor con respecto a la variable EP6500 e identifique si hay observaciones extrañas
o quizá mal digitadas. Utilice la función arrange del paquete dplyr
7. Elabore un filtro donde tenga en cuenta solamente los casos que tengan valores lógicos y razonables para la variable
EP6500 de aquı́ en adelante trabaje con esta base de datos filtrada
8. Elabore e interprete un Boxplot de la variable EP6500, donde compare el 2013 y el 2015. Acompañe la interpretación
de este boxplot con un resumen de medidas descriptivas pertinente.
9. Elabore un filtro donde identifique los valores atı́picos o extremos en la variable EP6500 en el año 2013. Por encima
de qué valor se considera un salario extremo en el 2013?
10. Elabore un filtro donde identifique los valores atı́picos o extremos en la variable EP6500 en el año 2015. Por encima
de qué valor se considera un salario extremo en el 2013?
11. Haga un pequeño resumen descriptivo de estos individuos con salarios extremos
12. Elabore un análisis descriptivo de cada una de las variables cualitativas. En cada caso escriba una pequeña in-
terpretación, utilice en cada pregunta por lo menos dos de las siguientes herramientas. Tablas, Gráficos, Medidas
descriptivas. (Puede ser interesante hacer cruces de variables )
13. Elabore un resumen de la variable EP6500. Donde se comparen todas sus estadı́sticas descriptivas en termninos de una
variable categórica que usted elija. Una forma de presentar las medidas estadı́sticas organizadamente es por medio de
la siguiente tabla:

Table 1:
Medida Categorı́a 1 ··· ··· Categorı́a k
Mı́nimo
Máximo
Cuartı́l 1
Mediana
Cuartı́l 3
Media
Rango
Rango Intercuartı́lico
Desv. Estándar
Coef. Variación
Asimetria
Curtosis

You might also like