You are on page 1of 23

1

ANALISIS DE DATOS

Viviana Andrea Rojas Hurtado (20162015157)


Mónica Lorena Becerra Chaves (20162015158)
Fabian Andrés Rodríguez Meléndez (20162015155)
Mayo 2018.

Universidad Distrital Francisco José de Caldas.


Ingeniería Industrial.
Estadística y Probabilidad
2

Tabla de Contenidos

1. Objetivos. .................................................................................................................... 5
1.1 General. ............................................................................................................... 5
1.2 Específicos. ......................................................................................................... 5
2. Introducción. ............................................................................................................... 6
3. Justificación. ............................................................................................................... 7
4. Gráficos y Tablas. ....................................................................................................... 8
5. Análisis ..................................................................................................................... 20
6. Conclusiones ............................................................................................................. 23
3

Lista de tablas

Tabla 1. Datos estadísticos del Peso. .................................................................................. 8

Tabla 2. Datos estadísticos del tiempo que gasta en realizar una actividad. ...................... 9

Tabla 3. Frecuencias en el RH. ........................................................................................... 9

Tabla 4. Porcentajes de Genero. ....................................................................................... 10

Tabla 5. Porcentajes por localidad. ................................................................................... 10

Tabla 6. Índice de satisfacción agrupado. ......................................................................... 11

Tabla 7. Porcentajes de RH. .............................................................................................. 11

Tabla 8. Datos estadísticos de los índices de satisfaccion. ............................................... 12

Tabla 9. Datos especificos de Edad. ................................................................................. 12


4

Lista de figuras

Ilustración 1. Relación entre localidad, ingresos y género.6 ............................................ 13

Ilustración 2. Histograma del Peso Agrupado. ................................................................. 13

Ilustración 3. Histograma del tiempo que gasta una persona en realizar una actividad

agrupada. ................................................................................................................... 14

Ilustración 4. Relación entre el tiempo que realiza una persona para una actividad con el

género. ....................................................................................................................... 14

Ilustración 5. Diagrama de barras de la localidad vs. Genero. ......................................... 15

Ilustración 6. Relación entre Rh y género. ........................................................................ 15

Ilustración 7. Índice de satisfacción por localidad. ........................................................... 16

Ilustración 8. Frecuencias de índice de satisfacción. ........................................................ 16

Ilustración 9. Porcentajes de localidad.............................................................................. 17

Ilustración 10. Histograma de edad. ................................................................................. 17

Ilustración 11. Índice de satisfacción por localidad y género……………………………19

Ilustración 12. Porcentaje de RH……………………………………………………….. 19

Ilustración 13. Relación entre RH y género…………………………………………….. 20


5

1. Objetivos.

1.1 General.

Realizar un estudio estadístico donde se tome un muestreo por toda la ciudad


contemplando la cantidad de variables necesarias para la realización de
comparaciones y relaciones entre las variables.

1.2 Específicos.

 Realizar una encuesta en la ciudad

 Organizar la información obtenida para su posterior análisis

 Analizar la relación entre las variables incluidas en la toma de datos.

 Verificar si el índice de satisfacción tiene alguna relación con la edad,

genero o localidad donde reside.

 Comparar los datos obtenidos para hallar una posible interrelación.

 Realizar el debido análisis a cada una de las variables que se relacionan en

el estudio.

 Identificar
6

2. Introducción.

En el siguiente trabajo se realizará un estudio de la base de datos obtenida a través

de una encuesta que se realizara haciendo un recorrido por la ciudad de Bogotá tomando

una muestra de datos con el fin de realizar un análisis de la población teniendo en cuenta

variables como la edad, genero, peso, RH, ingresos semanales, tiempo en realizar una

actividad y el índice de satisfacción que tienen las personas en cada localidad. Este con el

fin de verificar existe relación entre las variables estudiadas. Dicho análisis se hará

haciendo uso del software SPSS Stadistics 23, el cual facilita la realización de cálculos

estadísticos importantes como medidas de tendencia central y la posible variación de los

datos junto con la creación de gráficos que nos permitan analizar con mas facilidad las

variables y la comparación entre las mismas además de hallar la posible relación entre las

variables e identificar si alguna es causante de la variación de las demás si es que hay

relación directa y dependencia de las mismas. Así mismo llegar a unas conclusiones

sobre los datos de cada variable y sacar conclusiones que ayuden a una posible toma de

decisiones.
7

3. Justificación.

Se llega a pensar que mediante el análisis detallado de los datos obtenidos se puede

llegar a realizar un análisis detallado en cada una de las áreas dadas. Gracias a programas

como Excel y SPSS podemos desarrollar graficas que relacionen varias variables. El

análisis sirve para poder detallas a fondo cada una de las problemáticas de alguna

circunstancia dada, creando conclusiones sobre la información. Varias empresas de la

industria han usado esto ya, les permite que las compañías u organizaciones tomen y

generen mejores decisiones respecto a ciertos sectores de ella.

Muchas veces las empresas sufren de ineficacia en sus procesos internos y todos

los proyectos que se están llevando a cabo, esto se evidencia no en las respuestas obtenidas

en los informes sino en las preguntas que se realizan en el. La información interna y externa

de la empresa es uno de los principales activos con los que cuenta, así que la forma en la

que esta sea recogida sea utilizada y se interprete será la que generara una mejora en su

sistema.
8

4. Gráficos y Tablas.

A continuación, se presentarán las tablas y gráficos obtenidas mediante IBM SPSS

Statistics 23.

Tabla 1. Datos estadísticos del Peso.


Estadísticos
N Válido 3000
Perdidos 0
Media 57,5583
Error estándar de la 0,27870
media
Mediana 57,4323
Moda 95,99
Desviación estándar 15,26513
Varianza 233,024
Asimetría -0,001
Error estándar de 0,045
asimetría
Curtosis -0,034
Error estándar de 0,089
curtosis
Rango 99,60
Mínimo 4,33
Máximo 103,93
Percentiles 25 47,4051
50 57,4323
75 67,7753
9

Tabla 2. Datos estadísticos del tiempo que gasta en realizar una actividad.
Estadísticos
N Válido 3000
Perdidos 1
Media 5,70512
Error estándar de la 0,042462
media
Mediana 5,47516
Moda 0,125a
Desviación estándar 2,325728
Varianza 5,409
Asimetría 0,465
Error estándar de 0,045
asimetría
Curtosis 0,148
Error estándar de 0,089
curtosis
Rango 15,639
Mínimo 0,125
Máximo 15,764
Suma 17115,36
1
Percentiles 25 4,02557
50 5,47516
75 7,21752

Tabla 3. Frecuencias en el RH.


RH ..
Frecuencia Porcentaje Porcentaje Porcentaje
válido acumulado
Válido No sabe 161 5,4 5,4 5,4
O+ 585 19,5 19,5 24,9
O- 878 29,3 29,3 54,1
A+ 775 25,8 25,8 80,0
A- 411 13,7 13,7 93,7
B+ 155 5,2 5,2 98,8
B- 27 ,9 ,9 99,7
AB+ 7 ,2 ,2 100,0
AB- 1 ,0 ,0 100,0
Total 3000 100,0 100,0
10

Tabla 4. Porcentajes de Genero.


Frecuencia Porcentaje Porcentaje Porcentaje
válido acumulado
Válido Hombre 1525 50,8 50,8 50,8
Mujer 1475 49,2 49,2 100,0
Total 3000 100,0 100,0
Perdidos Sistema 1 ,0
Total 3001 100,0

Tabla 5. Porcentajes por localidad.


Frecuencia Porcentaje Porcentaje Porcentaje
válido acumulado
Válido Usaquen 153 5,1 5,1 5,1
Chapinero 141 4,7 4,7 9,8
Santa Fe 151 5,0 5,0 14,8
San Cristobal 144 4,8 4,8 19,6
Usme 163 5,4 5,4 25,1
Tunjuelito 161 5,4 5,4 30,4
Bosa 163 5,4 5,4 35,9
Kennedy 131 4,4 4,4 40,2
Fontibon 156 5,2 5,2 45,4
Engativa 165 5,5 5,5 50,9
Suba 130 4,3 4,3 55,3
Barrios 147 4,9 4,9 60,2
Unidos
Teusaquillo 147 4,9 4,9 65,1
Los Martires 140 4,7 4,7 69,7
Antonio 145 4,8 4,8 74,6
Nariño
Puente 159 5,3 5,3 79,9
Aranda
La 145 4,8 4,8 84,7
Candelaria
Rafael Uribe 140 4,7 4,7 89,4
Uribe
Ciudad 157 5,2 5,2 94,6
Bolivar
Sumapaz 162 5,4 5,4 100,0
Total 3000 100,0 100,0
11

Tabla 6. Índice de satisfacción agrupado.


Frecuencia Porcentaje Porcentaje Porcentaje
válido acumulado
Válido <= ,10 289 9,6 9,6 9,6
,11 - ,20 313 10,4 10,4 20,1
,21 - ,30 324 10,8 10,8 30,9
,31 - ,40 294 9,8 9,8 40,7
,41 - ,50 292 9,7 9,7 50,4
,51 - ,60 307 10,2 10,2 60,6
,61 - ,70 318 10,6 10,6 71,2
,71 - ,80 298 9,9 9,9 81,1
,81 - ,90 273 9,1 9,1 90,2
,91 - 1,0 293 9,8 9,8 100,0
Total 3001 100,0 100,0

Tabla 7. Porcentajes de RH.


RH
Frecuencia Porcentaje Porcentaje Porcentaje
válido acumulado
Válido No sabe 161 5,4 5,4 5,4
O+ 585 19,5 19,5 24,9
O- 878 29,3 29,3 54,1
A+ 775 25,8 25,8 80,0
A- 411 13,7 13,7 93,7
B+ 155 5,2 5,2 98,8
B- 27 ,9 ,9 99,7
AB+ 7 ,2 ,2 100,0
AB- 1 ,0 ,0 100,0
Total 3000 100,0 100,0
12

Tabla 8. Datos estadísticos de los índices de satisfacción.


Estadísticos
N Válido 3001
Perdidos 0
Media ,5009
Error estándar de la media 0,00523
Mediana 0,5000
Moda 0,26a
Desviación estándar 0,28677
Varianza 0,082
Asimetría 0,018
Error estándar de asimetría 0,045
Curtosis -1,189
Error estándar de curtosis 0,089
Rango 1,00
Mínimo 0,00
Máximo 1,00
Suma 1503,32

Tabla 9. Datos específicos de Edad.

Estadísticos
N Válido 3000
Perdidos 0
Media 49,324
Error estándar de la media ,3205
Mediana 50,000
Moda 50,0
Desviación estándar 17,5541
Varianza 308,147
Asimetría ,008
Error estándar de asimetría ,045
Curtosis -1,215
Error estándar de curtosis ,089
Rango 59,0
Mínimo 20,0
Máximo 79,0
Suma 147972,0
Percentiles 25 34,000
50 50,000
75 65,000
13

Ilustración 1. Relación entre localidad, ingresos y género.6

Ilustración 2. Histograma del Peso Agrupado.


14

Ilustración 3. Histograma del tiempo que gasta una persona en realizar una actividad
agrupada.

Ilustración 4. Relación entre el tiempo que realiza una persona para una actividad con el
género.
15

Ilustración 5. Diagrama de barras de la localidad vs. Genero.

Ilustración 6. Relación entre Rh y el peso.


16

Ilustración 7. Índice de satisfacción por localidad.

Ilustración 8. Frecuencias de índice de satisfacción.


17

Ilustración 9. Porcentajes de localidad.

Ilustración 10. Histograma de edad.


18

Ilustración 11. Índice de satisfacción por localidad y género.


19

Ilustración 12. Porcentaje de RH

Ilustración 13. Relación entre RH y género.


20

5. Análisis

Los datos fueron obtenidos de encuestas realizadas en la ciudad y se tomo una

muestra de 3000 personas. Se les solicito la edad, tipo de RH, peso, localidad, ingresos

semanales, el tiempo que dura realizando su actividad y el índice de satisfacción respecto

al salario que recibe.

Como podemos observar en la Tabla 1 e Ilustración 2, los datos de peso tienden a

ser mayores, la distribución es platicúrtica. La varianza de los datos es demasiado alta por

lo que los datos están muy alejados de la media, de igual manera la desviación no es tan

alta, por lo que los datos están concentrados cerca al promedio. De la Tabla 2 e Ilustración

3, se obtiene una gráfica casi simétrica, por lo tanto, los datos de tiempo que gasta una

persona en realizar una actividad tienen una gran precisión. De la Tabla 4 podemos concluir

que las encuestas fueron casi equitativas tanto para mujeres como para hombres, ya que su

desviación es muy baja. En la Ilustración 1, podemos concluir que los hombres de las

localidades de Chapinero y Ciudad Bolívar tienden a tener ingresos más bajos que lo

común, mientras que en las mujeres es en las localidades de Barrios Unidos y Rafael Uribe

Uribe. En localidades como Usaquén, Bosa, Kennedy, Fontibón, Los Mártires, Antonio

Nariño y Suma Paz suelen tener los mismos ingresos tanto hombres como Mujeres. Las

localidades que más ingresos tienen a recibir son las mujeres en Ciudad Bolívar y los

hombres en la Calendaría. Se puede decir que en Ciudad bolívar hay una clara diferencia

entre los ingresos para mujeres como para hombres haciendo esto que no exista relación

entre el barrio donde viven con el género de la persona. En la Ilustración 4, podemos

observar la relación que existe entre el tiempo que gasta la persona al realizar una actividad
21

con su sexo, se obtuvo que tanto hombres como mujeres tienden a gastar la misma cantidad

de tiempo. Y que para los dos existen varios datos atípicos por lo que el tiempo no afecta

si es hombre o mujer. En la Ilustración 5, se ve el recuento respecto al número de personas

que viven en cada localidad respecto a su género. En localidades como Suba, Los Mártires,

Santa Fe y la Calendaría, viven casi equitativamente, mientas que en lugares como Puente

Aranda, Barrios Unidos, Ciudad Bolívar y Usme hay una gran diferencia entre los géneros.

Como se puede observar en la tabla 5, los datos tomados tienen cantidades similares de

personas por localidad, así se podrá tener un mejor conocimiento sobre los datos obtenidos

en cada localidad. Así mismo es evidente que el índice de satisfacción de las personas con

su salario es bastante disperso, aun así, las medidas de tendencia central nos indica que

aproximadamente el 50% de la muestra están inconformes con sus ingresos. Mediante la

ilustración 1, donde se relaciona el género, ingresos y localidad; se observa que existen

varias localidades donde la cantidad de ingresos para ambos géneros es similar. Además,

en la localidad de barrios unidos los ingresos para las mujeres son menores y en la localidad

de santa fe los ingresos son altos tanto para mujeres como para los hombres. En la

ilustración 7 y 10, se muestra el índice de satisfacción respecto a cada localidad y género,

en las localidades de Usaquén, chapinero, santa fe, san Cristóbal y Usme los hombres

muestran un índice de satisfacción mayor que en las demás localidades mientras que en las

localidades de bosa, Fontibón, Engativá, Teusaquillo, los mártires y Antonio Nariño los

índices más altos de satisfacción son de las mujeres. Según los datos presentados podríamos

decir que el índice de satisfacción puede variar por diferentes variables ajenas al estudio

puesto que se evidencia que el genero y la localidad afectan de forma mínima dicho índice.
22

Al tener un numero de datos por localidad similares el estudio toma una mayor validez al

hablar de toda la ciudad puesto que hay total inclusión. De igual forma, cómo se puede

observar en la tabla 9 e ilustración 10 existe una distribución de tipo platicúrtica puesto que

se posee muy poca concentración de datos en la media, se obtiene que la varianza de los

datos es demasiado alta, lo que quiere decir que los datos alrededor de la media se

encuentran muy dispersos, así mismo la desviación no es tan alta, por lo tanto la magnitud

de la dispersión de edades son cercanas a la media. De la tabla 7 y la ilustración 12 se puede

concluir que el tipo de RH que se encuentra con mayor frecuencia en la población es el O-

y el de menor frecuencia es el AB-. En la ilustración 6, se puede observar que todos los RH

se encuentran relacionados en un mismo intervalo de valores de peso, a excepción del RH:

AB-, que sobre pasa el promedio de valores de dichos intervalos de peso. En la ilustración

13 se puede observar que los grupos sanguíneos O- y A+ son los más comunes en las

mujeres y se obtienen bastantes datos atípicos en los grupos sanguíneos: B+, B-, AB+ y en

el grupo donde no saben su respectivo RH, mientras que para los hombres, se observa que

existe una equidad entre los grupos sanguíneos O+ y O-, también se evidencian datos

atípicos en los grupos sanguíneos AB+ y AB-.


23

6. Conclusiones

 El 75% de la muestra de 3000 personas tienen máximo 65 años de edad.

 La edad más común que se evidencia en la muestra son 50 años.

 Del 100%, el 29,3% pertenece al grupo sanguíneo O- siendo este el RH más común

en la muestra.

 Los RH menos comunes en las mujeres son: B+ y AB+.

 El RH menos común en los hombres es: AB+.

 Desde una perspectiva general los hombres y las mujeres tienen los mismos

ingresos semanales.

 Los índices de satisfacción más comunes en la muestra de 3000 personas son de

0,21 a 0,30.

 Los hombres que habitan en la localidad de Santa fe son los que poseen un mayor

número de ingresos.

 Las mujeres que habitan en la localidad de Santa fe son las que poseen un mayor

número de ingresos.

 La localidad donde se concentra el mayor número de mujeres es Santa fe.

 La localidad donde se concentra el mayor número de hombres es Puente Aranda.

Los hombres y las mujeres emplean prácticamente el mismo tiempo para realizar. una

actividad.