You are on page 1of 19

ESTADISTICA II

DESARROLLO Y CONSOLIDACIÓN DEL TRABAJO COLABORATIVO

PARTE 1

POLITECNICO GRANCOLOMBIANO

PROFESOR:
GRACIELA SANCHEZ

RAUL ANTONIO BELTRAN VALBUENA
JESSICA GREYCHEN GOMEZ CARVAJAL
JENIFFER ALEXANDRA PRIETO RODRIGUEZ
DAMILES DEL CARMEN POLO NISPERUZA

Sea el archivo de Excel ( https://goo.gl/zB3Ntf ) se tiene información sobre las
características generales de las personas que respondieron en un mes en particular.

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1

Parte 1 Tamaño de muestra Utilizando la variable edad (P6040). Ahora veamos la medida de forma la curtosis (o apuntamiento) la cual mide cuan escarpada o achatada esta una curva o distribución. realice lo siguiente: ● Realice un histograma y describa la información según la forma y la curtosis de los datos. DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO .PARTE 1 .

Es decir el valor de curtosis no se encuentra dentro del rango esperado para datos provenientes de una distribución normal.6759 (24−30. secuencias orden. muy poca concentración de datos en la media presentando una forma muy hachada. clase . hogar. Del resumen de los datos se tienen que Media = 30. ➢ Leptocurtica: la curtosis>o. es decir según el signo de la distribución. mes Dpto. Registro p6016.67594 ) − 3 = . p6020 edad p6040.525 Desviación Estándar = 19. La población consta de 31 variables las cuales están clasificadas como numéricas y categóricas dichas variables están clasificados como directorios.525)4 (1−30.PARTE 1 .67594 + ⋯ + (320)(19.El coeficiente de curtosis viene dado por la siguiente ecuación: ∑𝑁 𝑖=1 (𝑋𝑖 −𝑋)4 Curtosis= −3 𝑁𝑆 4 Siendo 𝑥=la media S=desviación típica La curva se puede clasificar en 3 grupos según el signo de la curtosis.749137 Luego respecto a la información de los datos (edad “p6040”) Según la forma la curtosis es platicurtica muy poca concentración de datos en la media presentando una forma muy hachada.525)4 Luego Curtosis=((320)(19. algunas variables tienen un tamaño de 320 datos ● Calcule una nueva variable que sea el A partir de la variable 𝑃6040𝑛𝑒𝑤 vamos a generar una nueva variable la cual seria 𝑃60402/3 DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO . los datos están muy concentrados en la media siendo una curva muy apuntada ➢ Mesocurtica: : la curtosis=0 la distribución es normal ➢ platicurtica: la curtosis<o. Entre otras.0. ● Realice una descripción numérica y descripción como es la población.

PARTE 1 . utilizando la siguiente fórmula: DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO . ● Teniendo en cuenta la variable anterior realice el cálculo del tamaño de muestra.

S: Es la desviación estándar de la variable. utilizando el algoritmo del coordinado negativo. utilice un nivel de confianza del 95% y un margen de error de absoluto que no supere 0. DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO .4333)2 𝑛0 = = =302.PARTE 1 . Generar N realizaciones de una variable aleatoria 𝜀𝑘 (k ∈ U) con distribución uniforme (0. Para calcular el tamaño de la muestra.1). Veamos la implementación del algoritmo del coordinado negativo.5. realice una selección de elementos para una muestra. Del resumen de los datos anteriores se tiene: µ=9.5 N=320 Con un nivel de confianza del 95% es decir α=0. Para extraer la muestra de tamaño n de un universo de N objetos.Donde. Es el margen de error absoluto.96)2 (4.4333 =0.5)2 𝑛0 = 302 ● Teniendo en cuenta los resultados anteriores.01≅ 302 es decir 𝛿2 (0. se tiene lo siguiente: Z: Es el cuantil de la distribución normal estándar al nivel de significancia que se establezca.96 Así reemplazando en la ecuación anterior se tiene: 𝑍 2 𝑆2 (1. Asignar 𝜀𝑘 al elemento k-´esimo de la población.2162 S=4. Para realizar una selección de elemento para una muestra.05/2= 1.05 entonces el cuantil de la distribución normal estándar seria 𝑍𝛼/2 =𝑍0.

PARTE 1 .Ordenar la lista de elementos descendente (o ascendentemente) con respecto a este número aleatorio 𝜀𝑘 . DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO .

PARTE 1 .A continuación. DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO . Esta selección corresponde a la muestra realizada. seleccionar los n primeros (o los n últimos) elementos.

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO .PARTE 1 .

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO .PARTE 1 . con la media muestral y determine la variación relativa. ● Compara la media poblacional.

21623 Calculemos la media muestral 𝑥=9.23267 De aquí podemos observar que la media de la población es menor que la media de la muestra esto es µ=9. se sugiere utilizar la base de la hoja “muestra” y realizar lo siguiente: ● Utilizando la variable escolaridad (ESC) y sexo (P6020).Calculemos la media poblacional µ=9. Para determinar lo anterior.4586 esto es del 45.86% 𝐶𝑉𝑚𝑢𝑒𝑠𝑡𝑟𝑎 =0.32% De los resultados de los coeficientes de variación anteriores se tiene que 𝐶𝑉𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 =0.PARTE 1 .4632 esto es del 46. Según los resultados.23267 Ahora calculemos el CV es decir coeficiente de variación y de ese modo verificamos en cuál de los dos casos varia mas 𝐶𝑉𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 =0. realice un histograma para los hombres y mujeres. cree determinar que existen diferencias entre los niveles de estudio de los hombres y las mujeres en Colombia.4586 < 𝐶𝑉𝑚𝑢𝑒𝑠𝑡𝑟𝑎 =0. ¿Existen diferencias? DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO .21623 < 𝑥=9.4632 Intervalo de confianza para dos variables numéricas Un investigador.

y 17 mujeres tienen nivel de escolaridad 0 del total que son 157. realice un estudio descriptivo de ambas variables. 30 0 25 1 2 20 3 4 15 5 10 6 7 5 8 0 9 Hombre Mujer (Grafico # 1) Del gráfico de frecuencia anterior se tiene existen mucha diferencia en cuanto a la comparación entre las variables escolaridad (ESC) y sexo (P6020) hombres y mujeres. del total que son 207 mujeres. es decir el nivel de escolaridad en mujeres se encuentra entre 0 a 19 mientras que en los hombres de 0 a 20.PARTE 1 . Veamos un estudio descriptivo de las variables anteriores escolaridad (ESC) y sexo (P6020) En cuanto a la escolaridad (ESC) para el sexo masculino estas variables consta de 157 hombres la consta un niveles de escolaridad de (0 a 20) puede observarse que en esa columna hay unas casillas en NA Veamos la lectura de datos: DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO . ● Teniendo en cuenta lo anterior. Realice lectura de resultados. también se puede ver que 30 mujeres se encuentran en un nivel de escolaridad 10. Por otro lado se puede ver que hay 27 hombres con un nivel de escolaridad 5 y 24 hombres con nivel de escolaridad 1.

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO .PARTE 1 .

PARTE 1 .En cuanto a la escolaridad (ESC) para el sexo femenino estas variables constan de 207 mujeres con niveles de escolaridad de (0 a 19) puede observarse que en esa columna hay unas casillas en NA Veamos la lectura de datos: DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO .

PARTE 1 .DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO .

● Asumiendo que los datos son normales. Varianza Desconocida Un intervalo de confianza del (1 .α) 100% para µ está dado por DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO .PARTE 1 . Calculemos un intervalo de confianza del 95% para la escolaridad de los hombres y de las mujeres de forma individual  Hombres Intervalo de confianza para la media. la escolaridad de los hombres y de las mujeres de forma individual. calcule un intervalo de confianza del 95% y determine.

05. 𝑆 𝑆 𝑥̅ .42568 S= 4. que 2 deja a su derecha un área de α/2. con (n -1) grados de libertad.976233) ≤ µ ≤ 7.976233) √148 √148 6.64556 y 8.80234 4.𝑡(𝛼.2058].(1.42568.42568 + (1.α) 100% para µ está dado por DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO .64556≤ µ ≤ 8.2058 Por lo que el intervalo pedido para la escolaridad de los hombres es [6.80234 Para α=0.PARTE 1 .64556. es decir la media verdadera se encuentra en algún lugar entre 6.𝑛−1) = 𝑡(0. Del resumen de los datos se tienen: n =148 𝑋̅= 7. 8.976233 2 2 Reemplazando en la ecuación anterior se tiene: 4.05 entonces 𝑡(𝛼.𝑛−1) 2 √𝑛 2 √𝑛 Donde 𝑡(𝛼.148−1) = 1.80234 7.𝑛−1) ≤ µ ≤ 𝑥̅ + 𝑡(𝛼. Varianza Desconocida Un intervalo de confianza del (1 .2058  mujeres Intervalo de confianza para la media.𝑛−1) es el punto de la distribución t.

(1.52588.𝑛−1) es el punto de la distribución t.975189 2 2 Reemplazando en la ecuación anterior se tiene: 5. ● Asumiendo que los datos son normales.72785.72785 + (1.𝑛−1) = 𝑡(0. que 2 deja a su derecha un área de α/2.92981≤ µ ≤ 8. con (n -1) grados de libertad.𝑡(𝛼. 8.𝑛−1) ≤ µ ≤ 𝑥̅ + 𝑡(𝛼.52588 Por lo que el intervalo pedido para la escolaridad de las mujeres es [6. DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO .975189) √158 √158 6.078553 7.05.52588].078553 5.92981 y 8.PARTE 1 . 𝑆 𝑆 𝑥̅ . calcule un Intervalo de confianza al 95% para la diferencia de los niveles de escolaridad para los hombres y mujeres.158−1) = 1. Del resumen de los datos se tienen: n =158 𝑋̅= 7. es decir la media verdadera se encuentra en algún lugar entre 6.975189) ≤ µ ≤ 7.07855 Para α=0. En este caso calculemos un intervalo de confianza para µ1 − µ2 Dos distribuciones normales varianzas desconocida.𝑛−1) 2 √𝑛 2 √𝑛 Donde 𝑡(𝛼.72785 S= 5.05 entonces 𝑡(𝛼.92981.

PARTE 1 .7916) + (1.96 Luego reemplazando los datos en la ecuación anterior se tiene: (20.37389≤ µ1 − µ2 ≤ 0.42568-7.05 entonces 𝑍α/2.7916) (7. Luego del resumen de los datos anteriores se tiene 𝑥̅1 =7.72785) – (1.42568 𝑥̅2 =7. =1.0913) (25. es el punto crítico de la distribución z que deja a su derecha un área de α/2.42568-7.96) √ + ≤ µ1 − µ2 ≤ (7.0913 𝜎2 2 =25.72785) 148 158 (20.Un intervalo de confianza del (1 .72785 𝜎1 2 =20.96) √ + 148 158 -1.0913) (25. = 𝑍0.α) 100% para µ1 − µ2 está dado por: 𝜎1 2 𝜎2 2 𝜎1 2 𝜎2 2 (𝑥̅1 − 𝑥̅2 ) -𝑍𝛼/2 √ + ≤ µ1 − µ2 ≤ (𝑥̅1 − 𝑥̅2 ) +𝑍𝛼/2 √ + 𝑛1 𝑛2 𝑛1 𝑛2 Donde 𝑍α/2.05/2.769557 DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO .7916 𝑛1 =148 𝑛2 =158 Con un nivel de confianza del 95% se tiene α=0.

769557) DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO . 0. (-1.PARTE 1 .Por lo que el intervalo al 95% para la diferencia de los niveles de escolaridad para los hombres y mujeres es.37389.