You are on page 1of 22

Paso 3 fase intermedia - trabajo colaborativo 2

Estadística Descriptiva

Trabajo realizado por:

Franky Steven anturi 1114730066


Huber Alexis Gómez 1114732397

Grupo
255

Tutor
Jesús Antonio Peña rueda

Universidad Nacional Abierta y a Distancia

Octubre de 2016

Cali, valle
INTRODUCCION

En el siguiente trabajo de estadística descriptiva se realizara un estudio descriptivo que llevara una
organización y representación de los datos estadísticos en la que se tomó como muestra datos de
accidente clasificados en edad, cantidad de heridos y muertos.

Luego se generara algunos procedimientos tales como las medidas matemáticas y no matemáticas
de tendencia central cuyo fin es organizar y analizar detalladamente la problemática y sintetizar una
gran información por medio de gráficos ya que esto nos ayuda apreciar los datos como un todo e
identificar sus características de dicha problemática en este caso la accidentalidad.
JUSTIFICACIÓN

La estadística descriptiva resulta fundamentalmente para conocer el comportamiento de ciertos


eventos, por lo que ha adquirido un papel clave para la investigación como se puede ver en el
siguiente trabajo.

Una de las múltiples importancias de la estadística descriptiva es que ayuda en la búsqueda,


organización y análisis de información cuantitativa para realizar dichos diagnósticos, generar
hipótesis y hasta plantear soluciones.

Se puede clasificar es descriptiva e inferencial una información sobre un fenómeno en específico a


partir de toda población ya se anteriormente o actualmente como se podemos ver en el tema de
accidentalidad cuyo fin es recopilar información para generar una idea que pueda llevar acabo al fin
de todo estos hechos planteados.

En el mundo de hoy, es considerado la estadística de una gran importancia porque nos suministras
los mejores instrumentos de investigación, no solo para observa y copilar todo una información
dentro de un mismo entorno o fuera de ello sino también en el control de ciertas actividades a
desarrollar.
OBTETIVOS

 Describir estadísticamente la información recopilada para la investigación.

 Conocer de qué forma se puede las tendencias matemáticas y no matemáticas

 Diferenciar correctamente los conceptos de la población y muestra

 Usar apropiadamente las diferencias técnicas para elaborar tablas de distribución de


frecuencia.

 Elaborar graficas de representación de distribución de frecuencia de datos estadísticos

 Aplicar adecuadamente las medidas de tendencia central


1. MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL

-Identificar las variables discretas dentro del problema de estudio y calcular las medidas univariantes
de tendencia central más adecuadas, a aquellas que consideren sean relevantes para el problema
de estudio.

VARIABLES DISCRETAS

Número de accidentes

Edad

Número de heridos

Número de muertos

TABAL DE FRECUENCIA PARA VARIABLE NUMERO DE MUERTOS

n 110
v.max 12
v.men 1
rango 11
clase 8
amplitud w 1,38

Frecuencia f. ab f. rela
absoluta acumulada f. relativa acumulada Xi
mi x
clase L.inf L.sup mi ni Ni fi Fi ni
1 1 2 1,69 31,0 31 0,28 0,28 52
2 2 4 3,06 22,0 53 0,20 0,48 67
3 4 5 4,44 19,0 72 0,17 0,65 84
4 5 7 5,81 4,0 76 0,04 0,69 23
5 7 8 7,19 10,0 86 0,09 0,78 72
6 8 9 8,56 14,0 100 0,13 0,91 120
7 9 11 9,94 2,0 102 0,02 0,93 20
8 11 12 11,31 8,0 110 0,07 1,00 91
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL

 MEDIA

52 + 67 + 84 + 23 + 72 + 120 + 20 + 91
𝑥=
110
529
𝑥=
110
𝑥=5

 MEDIANA

𝑁 110
= = 55
2 2
55 − 53
𝑀𝑒 = 4.44 + ∗ 1.38
19
𝑀𝑒 = 4.44 + 0.14
𝑀𝑒 = 4.5

 MODA

31 − 0
Mo = 1 + ∗ 1.38
(31 − 0) + (31 − 22)
31
Mo = 1 + ∗ 1.38
39
Mo = 1 + 1.09
Mo = 2.09
Mo = 2
- Elegir una variable discreta que sea representativa y elaborar una tabla de frecuencias para datos
NO agrupados, representarla gráficamente, calcular las medidas de tendencia central: media,
mediana, moda, los cuartiles, deciles 5 y 7 ; percentiles 30 , 50 e interpretar sus resultados.

Datos organizados variable cuantitativa edad

29 38 52 46 21 18 54 33 52 38
46 29 17 22 55 60 33 32 46 55
19 21 42 46 36 35 43 32 24 44
31 50 30 48 53 35 46 45 32 45
31 33 23 56 18 54 33 52 38 46
29 17 22 54 17 21 46 55 19 21
42 46 36 35 56 22 23 45 43 34
38 18 54 33 52 38 46 29 17 22
34 46 55 19 21 42 46 36 35 55
22 18 54 33 52 38 46 29 17 22
38 52 46 21 18 54 60 33 32 46

Tabla de frecuencia para datos no agrupados variable edad

EDAD
CATEGORIA fi Fi hi Hi Xi X2i
1 17 5 5 0,05 5% 5 5
2 18 5 10 0,05 9% 10 20
3 19 3 13 0,03 12% 9 27
4 21 6 19 0,05 17% 24 96
5 22 6 25 0,05 23% 30 150
6 23 2 27 0,02 25% 12 72
7 24 1 28 0,01 25% 7 49
8 29 5 33 0,05 30% 40 320
9 30 1 34 0,01 31% 9 81
10 31 2 36 0,02 33% 20 200
11 32 4 40 0,04 36% 44 484
12 33 7 47 0,06 43% 84 1008
13 34 2 49 0,02 45% 26 338
14 35 4 53 0,04 48% 56 784
15 36 3 56 0,03 51% 45 675
16 38 7 63 0,06 57% 112 1792
17 42 3 66 0,03 60% 51 867
18 43 2 68 0,02 62% 36 648
19 44 1 69 0,01 63% 19 361
20 45 3 72 0,03 65% 60 1200
21 46 14 86 0,13 78% 294 6174
22 48 1 87 0,01 79% 22 484
23 50 1 88 0,01 80% 23 529
24 52 6 94 0,05 85% 144 3456
25 53 1 95 0,01 86% 25 625
26 54 6 101 0,05 92% 156 4056
27 55 5 106 0,05 96% 135 3645
28 56 2 108 0,02 98% 56 1568
29 60 2 110 0,02 100% 58 1682
TOTAL 110 1 1612 31396

15 EDAD 14

10 7
5 5 6 6 5 6 6 5
3 4 4
5 2 1 1 2 2 3 3 2 3
1 1 1 1 2 2

0
17 19 22 24 30 32 34 36 42 44 46 50 53 55 60

 MEDIA
𝑋𝑖
𝑋=
𝑁
1612
𝑋=
110
𝑋 = 15
La media se ubica en la posición 15, el cual equivale a 55 años de edad.

 MEDIANA
𝑁
𝑀𝑒 =
2
110
𝑀𝑒 =
2
𝑀𝑒 = 55
𝑁
𝑀𝑒 = +1
2
𝑀𝑒 = 56
𝑁 𝑁
+ +1
𝑀𝑒 = 2 2
2
111
𝑀𝑒 = = 55.
2
La mediana se ubica en la posición 55, el cual equivale a 18 años de edad
 MODA
EDAD Frecuencia Frecuencia
Frecuencia abs. Frecuencia rel.
absoluta acumulada relativa acumulada

21 46 14 86 0,13 78% 294

La moda es 46 años con una frecuencia de 14.

 CUARTIL.

Fórmulas para datos no agrupados

Cuando n es impar cuando n es par

 Cuartil 1

1(110 + 1)
𝑄1 =
4

𝑄1 = 28

El cuartil 1 se ubica en la posición 28, el cual equivale a 32 años de edad, determinando que el
25% es ≤ a 32 años de edad y el otro 75% es mayor que 32 años.

 Cuartil 2

2(110 + 1)
𝑄2 =
4

𝑄2 = 55

El cuartil 2 se ubica en la posición 55 el cual equivale a 18 años de edad, determinando que el 50%
es ≤ a 18 años de edad y el otro 50% es mayor que 18 años.
 Cuartil3

3(110 + 1)
𝑄3 =
4

𝑄3 = 83

El cuarti 3 se ubica en la posición 83, el cual equivale a 55 años de edad, determinando que el 75%
es ≤ a 55 años de edad y el otro 25% es mayor que 55 anos

 DECILES

Fórmulas para datos no agrupados

Siendo A, el número del decil.

Cuando n es par Cuando n es impar

 DECIL 5

5(110 + 1)
𝐷5 =
10

𝐷5 = 55

El Decil 5 se ubica en la posición 55, el cual equivale a 18 años de edad, determinando que el 50%
es ≤ a 18 años de edad y el otro 50% es mayor que 18 años.

 DECIL 7

7(110 + 1)
𝐷7 =
10

𝑫𝟕 = 𝟕𝟖

El Decil 7 se ubica en la posición 78, el cual equivale a 45 años de edad, determinando que el 70%
es ≤ a 45 años de edad y el otro 30% es mayor que 45 anos
 PERCENTILES
Fórmulas para datos no agrupados

Cuando n es par Cuando n es impar

 PERCENTIL 30
30(110 + 1)
𝑃30 =
100
𝑃30 = 33

El percentil 30 se ubica en la posición 33, el cual equivale a 42 años de edad, determinando que el
70% es ≤ a 42 años de edad y el otro 70% es mayor que 42 anos

 PERCENTIL 50
50(110 + 1)
𝑃50 =
100
𝑃50 = 55

El percentil 50 se ubica en la posición 55, el cual equivale a 18 años de edad, determinando que el
50% es ≤ a 18 años de edad y el otro 50% es mayor que 18 años.

- Elegir una variable Continua que sea representativa y siguiendo los lineamientos, diseñar una
tabla de frecuencia para datos agrupados, representarla gráficamente por medio de un histograma
de frecuencias, un polígono de frecuencias, calcular las medidas de tendencia central, determinar
el tipo de asimetría, los cuartiles , deciles 5 y 7 ; percentiles 25, 50 ( Interpretar sus resultados)

Tabla organizada variable cuantitativa velocidad


33 38 40 40 45 45 48 50 50 50
50 51 55 55 55 55 55 55 60 60
60 62 63 65 65 66 66 66 66 66
67 67 67 68 68 68 68 68 69 69
69 69 69 69 69 70 70 70 70 70
70 70 70 71 71 72 72 73 73 73
74 74 74 75 75 75 75 76 77 77
77 77 78 78 78 79 79 79 80 80
80 80 80 80 80 81 81 81 83 83
83 83 83 83 85 86 88 88 88 88
88 95 95 100 105 108 111 138 138 150
Tabla de frecuencia para variable velocidad
N 110
VALOR MAX 150 154
VALOR MIN 33 30
INTERVALOS
NC 7,573284446 8
AMPLITUD 15
RANGO 117 123,5923471 124 7

NUMERO DE MARCA
INTERVALOS F F. F. F.R. DE Xi (fi
LIM. LIM ABSOLUTA ACUMULADA RELATIVA ACUMULADA CLACE x
INFERIOR SUPERIOR fi Fi hi Fi Mc mc)
1 33 48 7 7 0,06 0,06 41 285
2 48 64 16 23 0,15 0,21 56 899
3 64 79 55 78 0,50 0,71 72 3939
4 79 95 23 101 0,21 0,92 87 2003
5 95 110 5 106 0,05 0,96 103 513
6 110 126 1 107 0,01 0,97 118 118
7 126 141 2 109 0,02 0,99 133 267
8 141 156 1 110 0,01 1,00 149 149
TOTAL 110 1 8173

Histograma y polígono de frecuencia para variable velocidad

VELOCIDAD
60
50
40
30
20
10
0
41 56 72 87 103 118 133 149
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL

 MEDIA

285 + 899 + 3939 + 2003 + 513 + 118 + 267 + 149


𝑥=
110
8173
𝑥=
110
x = 74
La media se ubica en la posición 74 la cual equivale a 75 k/h

 MEDIANA

𝑁 110
= = 55
2 2
55 − 23
𝑀𝑒 = 72 + ∗ 15
55
Me = 80
La mediana se ubica en la posición 80 la cual equivale a 80 k/h.

 MODA

55 − 16
Mo = 72 + ∗ 15
(55 − 16) + (55 − 23)
39
Mo = 64 + ∗ 15
71
Mo = 80
La moda se ubica en la posición 80 la cual equivale a 80 k/h.
 CUARTILES

1 ∗ 110
= 27.5
4
27.5 − 23
𝑄1 = 72 + ∗ 15
55
𝑄1 = 73
El cuartil 1 se ubica en la posición 73, el cual equivale a 74 k/h, determinando que el 25% es ≤ a
74 k/h y el otro 75% es mayor que 74.

2 ∗ 110
= 55
4
55 − 23
𝑄2 = 72 + ∗ 15
55
𝑄2 = 80
El cuartil 2 se ubica en la posición 80, el cual equivale a 80 k/h, determinando que el 50% es ≤ a 80
k/h y el otro 50% es mayor que 80.

3 ∗ 110
= 82.5
4
82.5 − 78
𝑄3 = 87 + ∗ 15
23
𝑄3 = 90
El cuartil 3 se ubica en la posición 90, el cual equivale a 83 k/h, determinando que el 75% es ≤ a 83
k/h y el otro 25% es mayor que 83.

 PERCENTILES

25 ∗ 110
= 27.5
100
27.5 − 23
𝑃25 = 72 + ∗ 15
55
𝑃25 = 73
El percentil 25, se ubica en la posición 73, el cual equivale a 78 k/h, determinando que el 25% es ≤
a 78 k/h y el otro 75% es mayor que 78.
50 ∗ 110
= 55
100
55 − 23
𝑃50 = 72 + ∗ 15
55
𝑃50 = 80
El percentil 50, se ubica en la posición 80, el cual equivale a 80 k/h, determinando que el 50% es ≤
a 80 k/h y el otro 50% es mayor que 80.

 DEECILES

5 ∗ 110
= 55
10
55 − 23
D5 = 72 + ∗ 15
55
D5 = 80
El decil 5, se ubica en la posición 80, el cual equivale a 80 k/h, determinando que el 50% es ≤ a 80
k/h y el otro 50% es mayor que 80.
7 ∗ 110
= 77
10
77 − 23
D7 = 72 + ∗ 15
55
D7 = 86
El decil 7, se ubica en la posición 86, el cual equivale a 81 k/h, determinando que el 70% es ≤ a
10 k/h y el otro 0% es mayor que 81

 ASIMETRIA
Medida de Yule Bowley o Medida Cuartílica

73 + 90 − 2(80)
As =
90 − 73
3
AS =
17
AS = 0.17
Como As > 0 se dice que la asimetría es positiva en la distribución de los datos.
2. MEDIDAS UNIVARIANTES DE DISPERSION

-Identificar las variables discretas dentro del problema de estudio y calcular las medidas univariantes
de dispersión más adecuadas, a aquellas que consideren sean relevantes para el problema de
estudio.

_ Con la variable Discreta elegida calcular: rango, varianza, desviación típica y coeficiente de
variación. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio

Tabla de datos organizada variable edad

29 38 52 46 21 18 54 33 52 38
46 29 17 22 55 60 33 32 46 55
19 21 42 46 36 35 43 32 24 44
31 50 30 48 53 35 46 45 32 45
31 33 23 56 18 54 33 52 38 46
29 17 22 54 17 21 46 55 19 21
42 46 36 35 56 22 23 45 43 34
38 18 54 33 52 38 46 29 17 22
34 46 55 19 21 42 46 36 35 55
22 18 54 33 52 38 46 29 17 22
38 52 46 21 18 54 60 33 32 46

Tabla de frecuencia para datos no agrupados variable edad

EDAD FRECUENCIA F. ABS. FRECUENCIA


ABSOLUTA ACUMULADA RELATIVA F.REL.ACUMULADA
CATEGORIA fi Fi hi Hi Xi X2i
1 17 5 5 0,05 5% 5 5
2 18 5 10 0,05 9% 10 20
3 19 3 13 0,03 12% 9 27
4 21 6 19 0,05 17% 24 96
5 22 6 25 0,05 23% 30 150
6 23 2 27 0,02 25% 12 72
7 24 1 28 0,01 25% 7 49
8 29 5 33 0,05 30% 40 320
9 30 1 34 0,01 31% 9 81
10 31 2 36 0,02 33% 20 200
11 32 4 40 0,04 36% 44 484
12 33 7 47 0,06 43% 84 1008
13 34 2 49 0,02 45% 26 338
14 35 4 53 0,04 48% 56 784
15 36 3 56 0,03 51% 45 675
16 38 7 63 0,06 57% 112 1792
17 42 3 66 0,03 60% 51 867
18 43 2 68 0,02 62% 36 648
19 44 1 69 0,01 63% 19 361
20 45 3 72 0,03 65% 60 1200
21 46 14 86 0,13 78% 294 6174
22 48 1 87 0,01 79% 22 484
23 50 1 88 0,01 80% 23 529
24 52 6 94 0,05 85% 144 3456
25 53 1 95 0,01 86% 25 625
26 54 6 101 0,05 92% 156 4056
27 55 5 106 0,05 96% 135 3645
28 56 2 108 0,02 98% 56 1568
29 60 2 110 0,02 100% 58 1682
TOTAL 110 1 1612 31396

 RANGO

𝑹𝑨𝑵𝑮𝑶 = 𝑽. 𝑴𝑨𝑿𝑰𝑴𝑶 − 𝑽. 𝑴𝑰𝑵𝑰𝑴𝑶


RANGO = 60 − 70
RANGO = 10

 VARIANZA

1612
𝑿= = 14.65
110
31396
δ2 = − 14.652
110
δ = 70.79
 DESVIACION TIPICA

1612
X= = 14.65
110

31396
σ=√ − 14.652
110

σ = 8.41

 COEFICIENTE DE VARIACION

8.41
C. V = ∗ 100
14.65
C. V = 57.40 %

Interpretación de datos obtenidos

Las medidas de dispersión representan una alta variabilidad de los datos con respecto a la Media
obtenida representado en un representado en un 8.14 la desviación de los datos de la variable edad
con respecto a la media de 14.65 años, con un coeficiente de variación de 57.40% lo cual es una
variación alta de los datos reales con respecto al promedio identificado
_ Con la variable Continua elegida calcular: rango, varianza, desviación típica y coeficiente de
variación. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio.

Tabla organizada variable cuantitativa velocidad


33 38 40 40 45 45 48 50 50 50
50 51 55 55 55 55 55 55 60 60
60 62 63 65 65 66 66 66 66 66
67 67 67 68 68 68 68 68 69 69
69 69 69 69 69 70 70 70 70 70
70 70 70 71 71 72 72 73 73 73
74 74 74 75 75 75 75 76 77 77
77 77 78 78 78 79 79 79 80 80
80 80 80 80 80 81 81 81 83 83
83 83 83 83 85 86 88 88 88 88
88 95 95 100 105 108 111 138 138 150

N 110
VALOR MAX 150 154
VALOR MIN 33 30
INTERVALOS
NC 7,573284446 8
AMPLITUD 15
RANGO 117 123,5923471 124 7

NUMERO DE
INTERVALOS
MARCA
F. F. DE Xi (fi X2i
LIM. LIM FRECUENCIA ACUMULADA RELATIVA F.R.ACUMULADA CLACE x (Mc x
INFERIOR SUPERIOR fi Fi hi Hi Mc mc) X1)
1 33 48 7 7 0,06 0,06 41 285 11606
2 48 64 16 23 0,15 0,21 56 899 50500
3 64 79 55 78 0,50 0,71 72 3939 282121
4 79 95 23 101 0,21 0,92 87 2003 174405
5 95 110 5 106 0,05 0,96 103 513 52593
6 110 126 1 107 0,01 0,97 118 118 13920
7 126 141 2 109 0,02 0,99 133 267 35623
8 141 156 1 110 0,01 1,00 149 149 22174
TOTAL 110 1 8173 642943

 RANGO

𝑹𝑨𝑵𝑮𝑶 = 𝑽. 𝑴𝑨𝑿𝑰𝑴𝑶 − 𝑽. 𝑴𝑰𝑵𝑰𝑴𝑶


RANGO = 150 − 33
RANGO = 117
 VARIANZA

8173
𝑿= = 74.3
110
642943
δ2 = − 74.32
110
δ2 = 324.4
 DESVIACION TIPICA

8173
𝑿= = 74.3
110

642943
σ=√ − 74.32
110

σ = 18.01
 COEFICIENTE DE VARIACION

18.01
C. V = ∗ 100
74.3
C. V = 24.23 %

Interpretación de datos

Al igual que el anterior grupo Las medidas de dispersión representan una alta variabilidad de los
datos con respecto a la Media obtenida representado 18.01 la desviación de los datos de la variable
velocidad con respecto a la media de 74.3 k/h años, con un coeficiente de variación de 24.23% lo
cual es una variación alta de los datos reales con respecto al promedio identificado
CONCLUSION

Un objetivo común para un proyecto de investigación estadística es investigar la causalidad, y en


particular extraer una conclusión en el efecto que algunos cambios en los valores de predictores o
variables independientes tienen sobre una respuesta o variables dependientes.

Con todo lo aprendido, podemos concluir que la estadística es una rama de la matemática que está
no se encuentra muy visible en lo cotidiano pero que en realidad es de mucha utilidad para interpretar
y ver desde un punto de vista muy general datos que se obtienen. A través de sus gráficas, medidas
de tendencia central y de dispersión podemos ver más claro y concreto un conjunto de datos que se
nos hacen muy complicados, en resumen son un verdadero método de ayuda para informar.
Bibliografía

http://www.vitutor.net/2/11/moda_media.html

http://es.slideshare.net/pipofmr/mediana-y-moda-en-datos-agrupados-estadsticas

http://www.monografias.com/trabajos27/datos-agrupados/datos-agrupados.shtml#ixzz4Nf2i186g

http://www.portaleducativo.net/octavo-basico/792/Media-moda-y-mediana-para-datos-agrupados

You might also like