CORPORACIÓN ADVENTISTA DE COLOMBIA

PRIMER TRABAJO

Análisis descriptivo de datos (10%)

Base de Datos

Duración:

Nombre Completo
Nombre Completo

SEM. 02 – 2016
Grupo:

60 minutos

Luis Alberto Ávila Fuentes
Miguel José Lesmes Duarte

D. I.
D. I.

4A

1028015642
1017246526

La siguiente base de datos corresponde a una muestra aleatoria de tamaño 200, que contiene las
siguientes variables: GENERO (HOMBRE o MUJER), ESTATURA (en cm. del estudiante), MASA
(en kg del estudiante), HORAS (número de horas dedicadas semanalmente a estudiar, fuera del
horario de clases), EDAD (en años), TIEMPO (en min. Requerido para ir de su casa a la
universidad), NOTAS (obtenido en el semestre anterior), VMATRI (en miles de pesos, valor de
matrícula pagada en el semestre actual), ESTRATO y TRAB (trabaja SI o NO).
Usted debe presentar un informe escrito de MÁXIMO 5 PAGINAS, con la solución a las
preguntas formuladas y resultados en R (resúmenes y/o gráficos).
NOTA: Todas las interpretaciones y/o conclusiones debe hacerlas en el contexto de los datos.
Todos los puntos tienen igual valor.

1. Seleccione dos variables continuas y una categórica. Para las variables continuas calcule:
Media, Mediana y desviación estándar e interprete sus resultados. Para la variable categórica

60
0

20

40

Frequency

80

100

120

elabore una tabla de frecuencias. Comente.

HOMBRE

MUJER
GENERO

GENERO

Frecuencia

Porcentaje

y el otro 50% mayor a esta. y los que no trabajan tienen un promedio de 3. Media: El promedio de la edad es de 22.068 con relación al promedio de 22. Desviación Estándar: Calculamos que las horas tienen una desviación estándar de 7.1. 2. Mediana: El 50% de los estudiantes tiene una edad igual o menor a 21.4 Mediana: El 50% del tiempo esta igual o menor a 33. porque los que trabajan el promedio oscila en 3. Media: El promedio de horas es de 33. Desviación estándar: Calculamos que las edades tienen una desviación estándar de 3.1 años. .85.311 con relación al promedio.5 horas y el otro 50% mayor a este.Hombre 126 63% Mujer 74 37% Los hombres tienen un total de 126 datos que en porcentaje equivale a 63% de un 100%. por lo tanto creemos que es mucha la desviación. ¿La variable VMATRI se comporta igual para los que trabajan y los que no trabajan? T RAB = NO 0 20 40 fr e q u e n c y Justifique su respuesta. 0 1000 2000 3000 4000 3000 4000 T RAB = SI 0 20 40 fr e q u e n c y VMATRI 0 1000 2000 VMATRI No se comporta igual.71.75. Sí. 3. ¿Los que trabajan tienen en promedio un Papa inferior a los que no trabajan? Justifique su respuesta. Porque en los que no trabajan la mayoría de las frecuencias es mayor. Y las mujeres un total de 74 que corresponde a un 37% del 100%.

6 .7 8 m ean of PAP A Plot of Means NO SI TRAB 4. y el de la mujer de 30.6 6 3 . Sí.7 2 3 .7 0 3 . ¿Se puede afirmar que la proporción de hombres es mayor que la proporción de mujeres en el estrato 4? Justifique su respuesta.3 .7 6 3 . porque en el estrato 4 el hombre es de 64.4.6 8 3 .7 4 3 .

80 GENERO 40 20 0 Frequency 60 MUJER HOMBRE cinco cuatro dos seis Reestrato tres uno .