You are on page 1of 15

ESTADISTICA II

NOMBRE:

José Darío Segura Chávez

TUTOR:

Andy Domínguez

Institución Universitaria Politécnico Grancolombiano


INTRODUCCIÓN

El presente consigue desplegar las circunstancias de las dificultades estadísticos, refuerzo


a la alineación de los alumnos. Cuando se realiza una investigación de estadística los datos
que se obtienen como resultado formando qué se llama muestra aleatoria de estos datos al
presentarse en forma gráfica podrían ser de más interés que si se hiciera en forma tabulada
el proverbio de que una imagen vale más que mil palabras resume la importancia de la
representación gráfica es mucho más fácil comprender una imagen clara correspondiente
a grandes cantidades de datos obtenidos que todo un párrafo al respecto.
El trabajo colaborativo es el resultado del desarrollo de cada una de las actividades
propuestas por el docente, el cual llevó un proceso de análisis y practica de los métodos de
calcular muestras, identificación de intervalos de confiabilidad, así como los pasos para
probar una hipótesis, entre otros.

Contexto- Situación Problema

A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares (GEIH),


realizada por el DANE1. Esta encuesta se hace en las 13 ciudades principales del Colombia
(Bogotá, Medellín, Cali, barranquilla, Bucaramanga, Manizales, Pasto, Pereira, Ibagué,
Cúcuta, Villavicencio, Montería, Cartagena) y 11 ciudades intermedias (Tunja, Florencia,
Popayán, Valledupar, Quibdó, Neiva, Riohacha, Santa Marta, Armenia, Sincelejo, San
Andrés). Esta encuesta, se solicita información sobre las condiciones de empleo de las
personas (si trabajan, en qué trabajan, cuánto ganan, si tienen seguridad social en salud o
si están buscando empleo), además de las características generales de la población como
sexo, edad, estado civil y nivel educativo, se pregunta sobre sus fuentes de ingresos. La
GEIH proporciona al país información a nivel nacional, cabecera - resto, regional,
departamental, y para cada una de las capitales de los departamentos.

1. Tamaño de Muestra

Utilizando la variable edad (P6040), realice lo siguiente:


1.Realice un histograma y describa la información según la forma y la curtosis de los
datos.
Distribución Frecuencia – Cuantitativa
Punto
Inferi Sup Medio Amplitu Frecue Porce Frecuenc Porcentaje
or erio d ncia ntaje ia
r
0 < 5 3 5 4775 7,9 4775 7,9
5 < 10 8 5 5237 8,7 10012 16,6
10 < 15 13 5 5751 9,5 15763 26,1
15 < 20 18 5 5722 9,5 21485 35,6
20 < 25 23 5 5490 9,1 26975 44,7
25 < 30 28 5 5023 8,3 31998 53,0
30 < 35 33 5 4333 7,2 36331 60,2
35 < 40 38 5 3825 6,3 40156 66,5
40 < 45 43 5 4007 6,6 44163 73,2
45 < 50 48 5 3846 6,4 48009 79,5
50 < 55 53 5 3277 5,4 51286 85,0
55 < 60 58 5 2598 4,3 53884 89,3
60 < 65 63 5 1975 3,3 55859 92,5
65 < 70 68 5 1501 2,5 57360 95,0
70 < 75 73 5 1213 2,0 58573 97,0
75 < 80 78 5 857 1,4 59430 98,5
80 < 85 83 5 513 0,8 59943 99,3
85 < 90 88 5 282 0,5 60225 99,8
90 < 95 93 5 99 0,2 60324 99,9
95 < 100 98 5 29 0,0 60353 100,0
100 < 105 102 5 3 0,0 60356 100,0
TOTAL 60356 100,0

Histograma
12

10

Series1

P6040
Curtosis: -0,4982

Es expresar que es Platicúrtica, ya que es <0. Es decir, que hay muy poca concentración
de datos en la media, presentando una forma muy achatada.

2. Realice una descripción numérica y descripción como es la población.


Teniendo en cuenta la gráfica, la tabla con los datos recolectados, se determina:
Que la población entre los 10 y los 20 años es la más representativa ocupando un 19%
del total de la población encuestada, mientras que las personas que oscilan entre los 80 y
100 años representan el 1.5% de la población encuestada.
3. Calcule una nueva variable que sea el

Formula en Excel para hallar nueva variable


=+ENTERO (POTENCIA(B2;2/3))

P6040n P6040
ew
12 44
10 33
0 0
13 52
13 49
9 29
9 27
6 17
4 8
11 37
10 33
4 9
4 8
12 46
9 27
4 9
7 21
10 36
4 8
0 0
12 45
12 45
6 18
4 8
8 25

Distribución de Frecuencia

Punt
Infe Superi o Amplitud Frecue Porcent Frecuen Porcentaje
rior or Medi ncia aje cia
o
0 < 1 1 1 964 1,6 964 1,6
1 < 2 2 1 1827 3,0 2791 4,6
2 < 3 3 1 3028 5,0 5819 9,6
3 < 4 4 1 2021 3,3 7840 13,0
4 < 5 5 1 4499 7,5 12339 20,4
5 < 6 6 1 3424 5,7 15763 26,1
6 < 7 7 1 4644 7,7 20407 33,8
7 < 8 8 1 4519 7,5 24926 41,3
8 < 9 9 1 4142 6,9 29068 48,2
9 < 10 10 1 4725 7,8 33793 56,0
10 < 11 11 1 4098 6,8 37891 62,8
11 < 12 12 1 3849 6,4 41740 69,2
12 < 13 13 1 3993 6,6 45733 75,8
13 < 14 14 1 4348 7,2 50081 83,0
14 < 15 15 1 3304 5,5 53385 88,5
15 < 16 16 1 2120 3,5 55505 92,0
16 < 17 17 1 2110 3,5 57615 95,5
17 < 18 18 1 1370 2,3 58985 97,7
18 < 19 19 1 786 1,3 59771 99,0
19 < 20 20 1 454 0,8 60225 99,8
20 < 21 21 1 113 0,2 60338 100,0
21 < 22 21 1 18 0,0 60356 100,0
TOTAL 60356 100,0

4. Teniendo en cuenta la variable anterior realice el cálculo del tamaño de muestra,


utilizando la siguiente fórmula:
Donde, se tiene lo siguiente:
Z: Es el cuantil de la distribución normal estándar al nivel de significancia que se
establezca.
S: Es la desviación estándar de la variable.
Es el margen de error absoluto.
Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un margen
de error de absoluto que no supere 0.5.

CÁLCULO DEL TAMAÑO DE UNA Precisi


MUESTRA ón

1% 2, 2, 3,0 3, 4,0
0 5 % 5 %
% % %
ERROR 0,5 100 4.8 1.9 1.3 96 7 56
% 00 99 36 32 4 2 6
7
TAMAÑO POBLACIÓN 60.3 110 5.1 1.9 1.3 97 7 56
56 00 28 71 48 3 3 9
2
NIVEL DE CONFIANZA 95 120 5.3 2.0 1.3 98 7 57
% 00 35 01 62 0 3 2
6
130 5.5 2.0 1.3 98 7 57
00 24 27 74 6 3 4
9
N
TAMAÑO DE LA 234 140 5.6 2.0 1.3 99 7 57
MUESTRA = 74 00 96 50 85 2 4 6
2

150 5.8 2.0 1.3 99 7 57


00 55 70 94 6 4 7
5
200 6.4 2.1 1.4 1.0 7 58
00 88 44 27 13 5 3
4
250 6.9 2.1 1.4 1.0 7 58
00 39 91 48 23 6 6
0
300 7.2 2.2 1.4 1.0 7 58
00 75 23 62 30 6 8
4
350 7.5 2.2 1.4 1.0 7 59
00 36 47 72 36 6 0
7
400 7.7 2.2 1.4 1.0 7 59
00 44 65 80 39 6 1
9
450 7.9 2.2 1.4 1.0 7 59
00 15 79 86 42 7 2
1
500 8.0 2.2 1.4 1.0 7 59
00 56 91 91 45 7 3
2
1000 8.7 2.3 1.5 1.0 7 59
00 62 45 13 56 7 7
8
1500 9.0 2.3 1.5 1.0 7 59
00 26 63 21 60 8 8
0
2000 9.1 2.3 1.5 1.0 7 59
00 64 72 25 61 8 8
1
2500 9.2 2.3 1.5 1.0 7 59
00 48 78 27 63 8 9
2
3000 9.3 2.3 1.5 1.0 7 59
00 06 82 29 63 8 9
2
3500 9.3 2.3 1.5 1.0 7 59
00 47 85 30 64 8 9
2
4000 9.3 2.3 1.5 1.0 7 59
00 79 87 31 64 8 9
2
4500 9.4 2.3 1.5 1.0 7 59
00 03 88 31 65 8 9
3

Poblaci 60356 Poblaci 603


ón ón 56
n0 240,26 n 380
N 240 Lím inf. 0
alfa 0,05 Lím 20
sup.
Z 1,65 media 9
delta 0,50 DSTD 4,
71
Media
Poblaci
9 Moda 4
ón
P6040n
ew
DSTD
Població
n 4,54 Mediana 9
P6040ne
w

Curtosis -99,4%

La muestra es platicúrtica debido a el índice de curtosis es negativo, mirando gráfica, de


igual manera se nota la semejanza con la curva platicúrtica.
La muestra es asimétrica hacia la izquierda.
6. Compara la media poblacional, con la media muestral y determine la variación relativa.

3. Intervalo De Confianza Para Dos Variables Numéricas


Un investigador, cree determinar que existen diferencias entre los niveles de estudio de
los hombres y las mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la
base de la hoja “muestra” y realizar lo siguiente:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma


para los hombres y mujeres. Según los resultados, ¿Existen diferencias?

ESC Hombr Mujer


e
0 16 23
1 4 3
2 8 12
3 10 13
4 5 5
5 20 22
6 5 8
7 7 11
8 8 3
9 8 5
10 4 7
11 32 46
12 3 11
13 10 9
14 7 6
15 0 5
16 5 11
17 1 2
18 3 3
19 0 0
20 1 0
21 0 0
22 0 0
23 0 0
24 0 1

Histograma 2
50
46
45

40

35 32
30

25 23 22

20 20
16
15 12 13 11 11 10 11
10 8 8 9
10 8 7 76
8
43 55 5 7 54 55
5 3 3 33
0 12 001000000001
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Hombre Mujer

2. Teniendo en cuenta lo anterior, realice un estudio descriptivo de ambas variables.


Realice lectura de resultados.

Se observa que las mujeres presentan mayor grado de escolaridad. Es importante aclarar
que esto se refiere al nivel académico, en este caso son las mujeres quienes representan
un mayor porcentaje 13% en cuanto a la culminación de estudios nivel bachillerato o
técnico. Y un 3% en nivel postgrado.

En el caso de los hombres, el 9% de la población masculina se encuentra finalizando o ha


finalizado el bachillerato. Y un 1% en el nivel de postgrado.

Esto quiere decir que las mujeres se están preparando más en sus niveles educativos en
comparación con los hombres en algunas regiones del país.
3. Asumiendo que los datos son normales, calcule un intervalo de confianza del 95%
y determine, la escolaridad de los hombres y de las mujeres de forma individual.

4. Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95%
para la diferencia de los niveles de escolaridad para los hombres y mujeres.
Escolaridad Hombres

lo upper midpoint Width frequency percent


w
er
0 < 2 1 2 20 12,74
2 < 4 3 2 18 11,46
4 < 6 5 2 25 15,92
6 < 8 7 2 12 7,64
8 < 10 9 2 16 10,19
10 < 12 11 2 36 22,93
12 < 14 13 2 13 8,28
14 < 16 15 2 7 4,46
16 < 18 17 2 6 3,82
18 < 20 19 2 3 1,91
20 < 22 21 2 1 0,64
22 < 24 23 2 0 0,00
24 < 26 25 2 0 0,00

157 1,00

Histogram
25,73

12,62 12,14 13,11

9,22
7,28
6,31
5,34
3,88
2,91
1,46
0,00 0,00 0,00%
Escolaridad Mujeres
ESC

lower upper midpoint width frequency percent


0 < 2 1 2 26 12,62
2 < 4 3 2 25 12,14
4 < 6 5 2 27 13,11
6 < 8 7 2 19 9,22
8 < 10 9 2 8 3,88
10 < 12 11 2 53 25,73
12 < 14 13 2 15 7,28
14 < 16 15 2 11 5,34
16 < 18 17 2 13 6,31
18 < 20 19 2 3 1,46
20 < 22 21 2 0 0,00
22 < 24 23 2 0 0,00
24 < 26 25 2 6 2,91
206 100,00%

25,73

12,62 13,11
12,14

9,22
7,28
6,31
5,34
3,88
2,91
1,46
0,00 0,00 0,00%

Series1
Según los estadísticos de la muestra, se puede concluir que, si hay diferencia de un
año de escolaridad entre mujeres y hombres, las primeras tienen un promedio de 8 años
de escolaridad versus 7 para los hombres.

La muestra está compuesta por 166 hombres y 214 mujeres (43,7% y 56,3%
respectivamente). La escolaridad media para los hombres es de 7 años con una desviación
estándar de 5 años y en el caso de las mujeres de 8 años y 5 años respectivamente. El
nivel de escolaridad se encuentra entre 0 y 24 años, el cual corresponde a niveles de
posgrado.

La muestra nos indica un nivel de escolaridad de 7 ± 0,78 años para los hombres y
de 8 ± 0,68 años para las mujeres, con un nivel de confianza del 95%.

4. Prueba de hipótesis para dos variables nominales


Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las
mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base de la hoja de
“muestra” y realizar lo siguiente:

1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y


sexo (P6020), realice un diagrama de barras comparativo para los hombres y mujeres en
un solo gráfico. Según los resultados, ¿Existen diferencias?
2. Con un nivel de confianza del 95%, realice una estimación de los hombres que
asisten a un establecimiento oficial.
3. Con un nivel de confianza del 95%, realice una estimación de las mujeres que
asisten a un establecimiento oficial.
4. Realice una prueba de hipótesis para determinar la afirmación del investigador.
Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?
puede tomar solo de la gráfica porque la muestra contiene
Según la gráfica, de quienes asisten a un colegio oficial, el 56,3% son mujeres y el
43,8% restantes son hombres. Sin embargo, esta afirmación no se puede tomar solo de
la gráfica porque la muestra contiene más mujeres que hombres, se requiere
demostración basado en los cálculos estadísticos
CONCLUSIONES

• La ejecución de este tiene como propósito, consolidar los conocimientos


logrados a lo largo de este módulo

• Aspectos básicos de la Estadística como son: Muestreo y distribuciones


muéstrales, estimación de parámetros, intervalos de confianza en dos muestras,
planteamiento de una hipótesis etc.

• La Estadística es una ciencia matemática que se utiliza para describir, analizar


e interpretar ciertas características de un conjunto de individuos llamado
población. Cuando nos referimos a muestra y población hablamos de conceptos
relativos, pero estrechamente ligados. Una población es un todo y una muestra
es una fracción o segmento de ese todo.

• La estadística trata en primer lugar, de acumular la masa de datos numéricos


provenientes de la observación de multitud de fenómenos, procesándolos de
forma razonable. Mediante la teoría de la probabilidad analiza y explora la
estructura matemática subyacente al fenómeno del que estos datos provienen
y, trata de sacar conclusiones y predicciones que ayuden al mejor
aprovechamiento del fenómeno.