You are on page 1of 9

TRABAJO COLABORATIVO

Utilizando la variable edad (P6040), realice lo siguiente:

 Realice un histograma y describa la información según la forma y la curtosis


de los datos.

El histograma lo realizamos en Excel, vea el archivo adjunto

Intervalo de Frecuencia Marca de


clase clase
Desde Hasta
0 5 5819 2,50
6 11 6520 8,50
12 17 6906 14,50
18 23 6712 20,50
24 29 6041 26,50
30 35 5135 32,50
36 41 4607 38,50
42 47 4713 44,50
48 53 4240 50,50
54 59 3191 56,50
60 65 2313 62,50
66 71 1675 68,50
72 77 1279 74,50
78 83 717 80,50
84 89 357 86,50
90 95 109 92,50
96 101 22 98,50

En el histograma podemos ver una distribución con una cola hacia la derecha, lo
cual quiere decir que la distribución tiene un sesgo positivo. Concluimos que la
mayoría de las personas son jóvenes como se puede notar en la parte izquierda
de la gráfica, y de igual modo en la gráfica vemos que la cantidad de personas con
mayor edad son menos a las de menor edad. También podemos identificar un pico
en la marca de clase 14,20, que es la marca de clase de las edades entre 12 y 17
años.

Sabiendo que el coeficiente de asimetría es de 0,53875778 y además en la grafica


vemos un sesgo a la derecha, podemos concluir que los datos no son simétricos,
nuestra distribución tiene una asimetría positiva y se alarga a valores mayores que
la medida. Recordando que la curtosis nos indica que tan achatada esta la curva,
y sabiendo que la curtosis es de -0,4981865 concluimos que la curtosis es
pequeña

 Realice una descripción numérica y descripción como es la población.

Calculando las medidas de tendencia centrales de los datos, obtenemos que :

MEDIDAS DE
TENDENCIA
CENTRAL
Media 30,9722314
Error típico 0,08448235
Mediana 28
Moda 11
Desviación estándar 20,7551671
Varianza de la
muestra 430,776961
Curtosis -0,4981865
Coeficiente de
asimetría 0,53875778
Rango 101
Mínimo 0
Máximo 101
Suma 1869360
Cuenta 60356

 La media: En este caso la media es de 30,97 cuyo valor corresponde al


promedio de las edades de la población.
 La mediana: En este caso es de 28, y es el valor que se ubica en el centro
de la distribución. La edad de 28 es el valor central de ordenar los datos
ascendentemente.

 La moda: En este caso, la moda corresponde a 11, es decir es la edad más


repetida entre las personas de la población.

 Desviación estándar: En este caso la desviación estándar es de


20,7551671, esto quiere decir que en promedio se alejan 20,7551671 años
de la media de las edades de la población.

 Rango: En este caso el rango de edades es de 110, por lo que


encontramos que la edad mínima es de 0 años y la edad máxima es de
110, el rango se contruye como la resta de la edad máxima menos la edad
miníma.

 Calcule una nueva variable que sea el


Le aplicamos la transformación a cada uno de los datos de la variable edad
(P6040), y la insertamos en el excel adjunto al trabajo en la columna L

 Teniendo en cuenta la variable anterior realice el cálculo del tamaño de


muestra, utilizando la siguiente fórmula:

Donde, se tiene lo siguiente:


Z: Es el cuantil de la distribución normal estándar al nivel de significancia que se
establezca.
S: Es la desviación estándar de la variable.
:Es el margen de error absoluto.
Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un
margen de error de absoluto que no supere 0.5.

Solución:

Estas son las medidas de tendencia central de la nueva variable.

MEDIDAS DE
TENDENCIA
CENTRAL
Media 463,349648
Error típico 2,15743747
Mediana 261,333333
Moda 40,3333333
Desviación estándar 530,027548
Varianza de la muestra 280929,202
Curtosis 2,43929315
Coeficiente de
asimetría 1,59589548
Rango 3400,33333
Mínimo 0
Máximo 3400,33333
Suma 27965931,3
Cuenta 60356

Basandonos en la nueva variable, tenemos que .


Para hallar , tenemos encuenta el total de la media y le sacamos el 0,05%

23,1674824

= = 1945,69699

Los cálculos se pueden apreciar en el excel adjunto, en la hoja “TAMAÑO DE


MUESTRA”.

 Teniendo en cuenta los resultados anteriores, realice una selección de


elementos para una muestra, utilizando el algoritmo del coordinado
negativo.

Se le aplicó el algortimo coordinado negativo a los datos: a cada dato se le asignó


un valor aleatorio, el cúal se organizo de manera ascendente y finalmente se
seleccionó una muestra de tamaño 1946, resaltada en el excel adjunto en color
amarillo.

 Compara la media poblacional, con la media muestral y determine la


variación relativa.

La media poblacional es 463,349648, la media muestral es 0,01575872.

La variación relativa esta dada por

Intervalo de confianza para dos variables numéricas


Un investigador, cree determinar que existen diferencias entre los niveles de
estudio de los hombres y las mujeres en Colombia. Para determinar lo anterior, se
sugiere utilizar la base de la hoja “muestra” y realizar lo siguiente:

 Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un


histograma para los hombres y mujeres. Según los resultados, ¿Existen
diferencias?

(HISTOGRAMA EN EL EXCEL ADJUNTO

Marca
Intervalo
Frecuencia de
de clase
clase
Desde Hasta
0 2 38 1,00
3 5 40 4,00
Intervalo
6 8 Frecuencia
22 Marca
7,00
de 9clase 11 58 10,00 de
12 14 26 13,00clase
Desde
15 Hasta
17 18 16,00
180 20 2 3 28
19,001,00
213 23 5 0 22,004,00
35
246 26 8 1 20
25,007,00
9 11 44 10,00
12 14 20 13,00
15 17 6 16,00
18 20 4 19,00

Comparando los histogramas


tenemos que si existe
diferencia entre las variables
escolaridad para hombres y
para mujeres, en la primera
clase tenemos que hay más
mujeres que alcanzan un nivel
de escolaridad de 0-2, en la
segunda clase hay más
mujeres que alcanzan un nivel
de escolaridad de 3-5, en la tercera clase la diferencias es menor pero siguen
habiendo más mujeres que hombres con un nivel de escolaridad de 6-8, en la
cuarta clase tenemos que hay más mujeres que hombres con un nivel escolaridad
de 9-11, en la quinta clase tenemos que hay más hombres que mujeres que tienen
un nivel de escolaridad de 12-14, en las siguientes clases siempre predominan la
cantidad de mujeres que la cantidad de hombres. Por lo tanto se podría inferir que
las mujeres tienen mayor nivel de escolaridad que los hombres.

 Teniendo en cuenta lo anterior, realice un estudio descriptivo de ambas


variables. Realice lectura de resultados, en esta ecuación hay un cierto
grado de libertad

 HOMBRES

MEDIAS CENTRALES HOMBRES


Media 7,719745223
Error típico 0,390754911
Mediana 8
Moda 11
Desviación
estándar 4,896144997
Varianza de la
muestra 23,97223583
Curtosis -0,841265202
Coeficiente de
asimetría 0,087053218
Rango 20
Mínimo 0
Máximo 20
Suma 1212
Cuenta 157

El histograma muestra una distribución con una cola larga a la derecha, es decir,
muestra un sesgo positivo. Analizando el histograma, vemos que existe un pico en
la clase [9-11], donde hay más hombres con nivel de escolaridad entre 9 y 11, en
los primeros niveles de escolaridad hay más hombres mientrás que en los últimos
niveles de escolaridad hay pocos hombres. La distribución del histograma también
se puede examinar por medio del coeficiente de asimetía que en este caso es de
0,087053218, es decir, la distribución tiene una asimetría positiva y se alarga a
valores mayores que la media. Por otra parte la curtosis me indica que tan
achatada está la curva, en este caso tenemos una curtosis pequeña
-0,841265202.

La media: La media es de 7,719745223, cuyo valor corresponde al promedio de


los niveles de escolaridad de los hombres.
La mediana: La mediana es 8, y es el valor que se ubica en el centro de la
distribución. El nivel de escolaridad de 8 es el valor central de ordenar los niveles
de escolaridad de los hombres ascendentemente.

La moda: En este caso, la moda corresponde a 11, es decir el nivel de


escolaridad más repetido, es decir con mayor número de hombres es 11.

Desviación estándar: En este caso la desviación estándar es de 4,896144997,


esto quiere decir que en promedio se alejan 4,896144997 de la media de los
niveles de escolaridad de los hombres.

Rango: En este caso el rango de 20, por lo que encontramos que la nivel mínimo
de escolaridad es 0 y el nivel máximo de escolaridad es 20, el rango se contruye
como la resta de el nivel de escolaridad máximo menos el nivel de escolaridad
mínimo.

 MUJERES

MEDIDAS CENTRALES MUJERES


Media 8,067961165
Error típico 0,358485268
Mediana 9
Moda 11
Desviación estándar 5,145231533
Varianza de la
muestra 26,47340753
Curtosis -0,796918169
Coeficiente de
asimetría 0,043810057
Rango 24
Mínimo 0
Máximo 24
Suma 1662
Cuenta 206

El histograma muestra una distribución con una cola larga a la derecha, es decir,
muestra un sesgo positivo. Analizando el histograma, vemos que existe un pico en
la clase [9-11], donde hay más mujeres con nivel de escolaridad entre 9 y 11, en
los primeros niveles de escolaridad hay más mujeres mientrás que en los últimos
niveles de escolaridad hay pocas mujeres. La distribución del histograma también
se puede examinar por medio del coeficiente de asimetía que en este caso es de
0,043810057, es decir, la distribución tiene una asimetría positiva y se alarga a
valores mayores que la media. Por otra parte la curtosis me indica que tan
achatada está la curva, en este caso tenemos una curtosis pequeña
-0,796918169.
Si comparamos los dos histogramas tenemos que el coeficiente de asimetría en el
histograma de los niveles de escolaridad de los hombres es mayor al coeficiente
de asimetría de los niveles de escolaridad de las mujeres, esto quiere decir que el
histograma de los hombres tiene una cola más pesada.
Por otro lado la curtosis del histograma de la variable en estudio de las mujeres es
mayor que la curtosis del histograma de la variable en estudio de los hombres,
esto me indica que el histograma de los hombres es más achatado que el
histograma de las mujeres, además en el histograma de las mujeres hay una
mayor concentración de los datos alrededor de la media.

 La media: La media es de 8,067961165, cuyo valor corresponde al


promedio de los niveles de escolaridad de las mujeres.
 La mediana: La mediana es 9, y es el valor que se ubica en el centro de la
distribución. El nivel de escolaridad de 9 es el valor central de ordenar los
niveles de escolaridad de las mujeres ascendentemente.
 La moda: En este caso, la moda corresponde a 11, es decir el nivel de
escolaridad más repetido, es decir con mayor número de mujeres es 11.

 Desviación estándar: En este caso la desviación estándar es de


5,145231533, esto quiere decir que en promedio se alejan 5,145231533 de
la media de los niveles de escolaridad de las mujeres.

 Rango: En este caso el rango de 24, por lo que encontramos que la nivel
mínimo de escolaridad es 0 y el nivel máximo de escolaridad es 24, el
rango se contruye como la resta de el nivel de escolaridad máximo menos
el nivel de escolaridad mínimo.

En el primer histograma podemos relacionar el nivel de escolaridad con las


mujeres y su frecuencia,

 Asumiendo que los datos son normales, calcule un intervalo de confianza


del 95% y determine, la escolaridad de los hombres y de las mujeres de
forma individual.

INTERVALO DE CONFIANZA PARA LA MEDIA DE LAS MUJERES

IC ( =( , )= , ) = (7,4800 , 8,655877)
Los cálculos están en el excel adjunto la hoja “INTERVALOS DE CONFIANZA

INTERVALO DE CONFIANZA PARA LA MEDIA DE LOS HOMBRES

IC ( =( , )= , )= (7,07890717 , 8,3606 )

Los cálculos están en el excel adjunto la hoja “INTERVALOS DE CONFIANZA”

 Asumiendo que los datos son normales, calcule un Intervalo de confianza al


95% para la diferencia de los niveles de escolaridad para los hombres y
mujeres.

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE


HOMBRES Y MUJERES

INC(

= (-0,5214498 , 1,21788165)

Los cálculos están en el excel adjunto la hoja “INTERVALOS DE CONFIANZA”

Podemos concluir con un 95% de confianza que la diferencia de los niveles de


escolaridad para los hombres y mujeres esta entre -0,5214498 y 1,21788165.

You might also like