You are on page 1of 11

ESTADISTICA DESCRIPTIVA

PASO 3 - FASE INTERMEDIA


(Trabajo colaborativo 2)

INTRODUCCION

Las muertes por accidentes de trnsito en Colombia son materia de estudio y anlisis de las
autoridades de trnsito, esto con el fin de proponer alternativas de solucin para que el
nmero de muertes en la va se reduzca ao tras ao. En ese contexto, la Secretaria de
Trnsito y Transporte de Medelln realizo un estudio con los datos de 120 accidentes
registrados a lo largo del ao 2015. En este estudio abordaremos dichos datos recopilados
por la autoridad de trnsito.

En este estudio analizaremos las variables discretas y continuas recopiladas por las
autoridades con el fin de determinar cules son las que ms influyen en esta problemtica de
los accidentes en la va. Tambin calcularemos e interpretaremos las medidas univariantes
de tendencia central y de dispersin de la variable discreta ms relevante, as como tambin
de la variable continua ms relevante.
JUSTIFICACION

Las muertes por accidentes de trnsito en Colombia son un problema maysculo de salud
pblica, tanto que el mismo gobierno nacional ha reconocido que en Colombia mueren ms
personas por accidentes de trnsito que por el conflicto armado. Las muertes en accidentes
de trnsito en el ao 2015 fueron alrededor de 4500. Por esto, el gobierno nacional ha
emprendido campaas muy importantes en favor de mejorar las condiciones tcnico
mecnicas de los vehculos que circulan por las vas nacionales, as como tambin en
campaas de concientizacin social sobre los buenos hbitos de manejo. En el ao 2013 se
aprob la ley que sanciona a conductores que manejan en estado de alicoramiento, esto
muestra la gran preocupacin que esta problemtica est generando en toda la poblacin
colombiana. Por estas razones, y muchas otras, consideramos que un estudio de este tipo es
muy importante, pertinente y necesario para Colombia.
CALCULO E INTERPRETACION DE LAS MEDIDAS UNIVARIANTES DE
TENDENCIA CENTRAL Y DE DISPERSION PARA LA VARIABLE DISCRETA

En total, el problema propuesto consta de 10 variables discretas y 4 variables continuas. Las


variables discretas son las siguientes:

Nmero de heridos
Nmero de muertos
Tipo de vehculo
Genero
Involucra peatones
Mes
Edad
Da de la semana
Otros factores
Tipo de va

Todas estas variable son relevantes a la hora de abordar el problema, sin embargo se ha
elegido como las ms relevantes, en su orden:
1. Edad
2. Da de la semana

Por esta razn, la variable discreta elegida para este estudio es Edad.

Medidas de Tendencia Central.

Para los datos No agrupados, la medida de tendencia central que podemos calcular es la
media, calculndola de manera directa en Excel.

29 46 19 31 31 29 42 38 34 22 38
38 29 21 50 33 17 46 18 46 18 52
52 17 42 30 23 22 36 54 55 54 46
46 22 46 48 56 54 35 33 19 33 21
21 55 36 53 18 17 56 52 21 52 18
18 60 35 35 54 21 22 38 42 38 54
54 33 43 46 33 46 23 46 46 46 60
33 32 32 45 52 55 45 29 36 29 33
52 46 24 32 38 19 43 17 35 17 32
38 55 44 45 46 21 34 22 55 22 46
Fig. 1 Datos NO agrupados. Edad.
Representacin grfica.
DATOS NO AGRUPADOS
80

60

40

20

0
0 20 40 60 80 100 120

4067
Media = = = 37
110

Para las otras medidas de tendencia central se agrupan los datos como sigue:

Xi fi Hi Yi*fi (Xi)2*fi
17 5 5 85 1445
18 5 10 90 1620
19 3 13 57 1083
21 6 19 126 2646
22 6 25 132 2904
23 2 27 46 1058
24 1 28 24 576
29 5 33 145 4205
30 1 34 30 900
31 2 36 62 1922
32 4 40 128 4096
33 7 47 231 7623
34 2 49 68 2312
35 4 53 140 4900
36 3 56 108 3888
38 7 63 266 10108
42 3 66 126 5292
43 2 68 86 3698
44 1 69 44 1936
45 3 72 135 6075
46 14 86 644 29624
48 1 87 48 2304
50 1 88 50 2500
52 6 94 312 16224
54 6 100 324 17496
55 5 105 275 15125
56 2 107 112 6272
60 3 110 180 10800
TOTAL 110 4074 168632
Tabla 2. Datos de la Edad. Tabla de frecuencias.

1 + 35+36
Mediana. = 55. Como 1 < = = = 35.5
2 2 2

Moda = 46 porque es el dato que ms se repite, 14 veces.

Cuartil 1 = Percentil 25
25
= 100 = 100 110 = 27.5 28 1 = 24 La edad correspondiente al cuartil 1
es de 24 aos.

Cuartil 2 = Percentil 50
50
= 100 = 100 110 = 55 2 = 36 La edad correspondiente al cuartil 2 es de 36
aos.

Cuartil 3 = Percentil 75
75
= 100 = 100 110 = 82.5 82 3 = 46 La edad correspondiente al cuartil 3
es de 46 aos.

Percentil 30
30
= 100 = 100 110 = 33 30 = 29 La edad correspondiente al percentil 30 es de
29 aos.

Percentil 50
50
= 100 = 100 110 = 55 50 = 36 La edad correspondiente al percentil 50 es de
36 aos.

Decil 5 = Percentil 50
50
= 100 = 100 110 = 55 5 = 36 La edad correspondiente al decil 5 es de 36
aos.
Decil 7 = Percentil 70
70
= 100 = 100 110 = 77 7 = 46 La edad correspondiente al decil 7 es de 46
aos.

Clculos de las medidas de dispersin.

Apoyndonos en la tabla 1 obtenemos:

Rango = Dato mayor dato menor = 60 17 = 43 aos

( 2 ) 168632
Varianza 2 = = 110 372 = 137

Desviacin tpica = 2 = 11.7 aos

11.7
Coeficiente de variacin = = = 0.31
37

CALCULO E INTERPRETACION DE LAS MEDIDAS UNIVARIANTES DE


TENDENCIA CENTRAL Y DE DISPERSION PARA LA VARIABLE
CONTINUA
En total, el problema propuesto consta de 10 variables discretas y 4 variables continuas. Las
variables continuas son las siguientes:

Grado de alcohol del conductor


Hora
Costo estimado del siniestro
Velocidad

Todas estas variables son relevantes a la hora de abordar el problema, sin embargo se ha elegido
como las ms relevantes, en su orden:
1. Velocidad
2. Grado de alcohol del conductor

Por esta razn, la variable discreta elegida para este estudio es la Velocidad del vehculo.

Tabla de Frecuencias.

Xi fi Fi Xi*fi (Xi)2*fi
33 1 1 33 1089
38 1 2 38 1444
40 2 4 80 3200
45 2 6 90 4050
48 1 7 48 2304
50 4 11 200 10000
51 1 12 51 2601
55 6 18 330 18150
60 3 21 180 10800
62 1 22 62 3844
63 1 23 63 3969
65 2 25 130 8450
66 5 30 330 21780
67 3 33 201 13467
68 5 38 340 23120
69 7 45 483 33327
70 8 53 560 39200
71 2 55 142 10082
72 2 57 144 10368
73 3 60 219 15987
74 3 63 222 16428
75 4 67 300 22500
76 1 68 76 5776
77 4 72 308 23716
78 3 75 234 18252
79 3 78 237 18723
80 7 85 560 44800
81 3 88 243 19683
83 6 94 498 41334
85 1 95 85 7225
86 1 96 86 7396
88 5 101 440 38720
95 2 103 190 18050
100 1 104 100 10000
105 1 105 105 11025
108 1 106 108 11664
111 1 107 111 12321
135 2 109 270 36450
150 1 110 150 22500
TOTAL 110 8047 623795
Tabla 2. Datos de la velocidad. Tabla de frecuencias
Grafica del Histograma y del polgono.

10 Histograma de Frecuencias y Poligono


8

0
33

71

105
38
40
45
48
50
51
55
60
62
63
65
66
67
68
69
70

72
73
74
75
76
77
78
79
80
81
83
85
86
88
95
100

108
111
135
150
Medidas de tendencia central.
8047
Media =
= 110
= 73.15 La velocidad promedio es de 73.15 Km/h


Mediana. 2
= 55. Como = 55 = 71 La mediana es de 71 Km/h

Moda = 70 Km/h, porque es el dato que ms se repite, 8 veces.

Cuartil 1 = Percentil 25
25
= 100 = 100 110 = 27.5 28 1 = 66 La velocidad correspondiente al cuartil 1 es
de 66 Km/h.

Cuartil 2 = Percentil 50
50
= 100 = 100 110 = 55 2 = 71 La velocidad correspondiente al cuartil 2 es de 71
Km/h.

Cuartil 3 = Percentil 75
75
= = 110 = 82.5 82 3 = 80 La velocidad correspondiente al cuartil 3 es
100 100
de 80 Km/h.

Decil 5 = Percentil 50
50
= 100 = 100 110 = 55 5 = 71 La velocidad correspondiente al decil 5 es de 71 Km/h.

Decil 7 = Percentil 70
70
= 100 = 100 110 = 77 7 = 79 La velocidad correspondiente al decil 7 es de 79 Km/h.

Percentil 25
25
= 100 = 100 110 = 27.5 28 25 = 66 La velocidad correspondiente al percentil 25
es de 66 Km/h

Percentil 50
50
= = 110 = 55 50 = 71 La velocidad correspondiente al percentil 50 es de 71
100 100
Km/h

Clculos de las medidas de dispersin.


Apoyndonos en la tabla 2 obtenemos:

Rango = Dato mayor dato menor = 150 33 = 117 Km/h

( 2 ) 623795
Varianza 2 =
= 110 73.152 = 319.86

Desviacin tpica = 2 = 17.88 Km/h

17.88
Coeficiente de variacin = = 73.15 = 0.24
ANALISIS E INTERPRETACION DE LA INFORMACION OBTENIDA

Para el caso de la variable discreta elegida que fue la Edad del conductor tenemos una media, moda y mediana
con valores de 37, 46 y 35.5 respectivamente, notamos que la moda esta distanciada 9 aos del valor de la
media, de todas maneras este valor de la moda y de la mediana se encuentran dentro del rango de 1
desviacin tpica ya que la desviacin tpica fue de 11.7 aos.
El cuartil 1 = 24 aos significa que el 25% de los datos estn por debajo de esa edad.
El cuartil 2 = 36 aos significa que el 50% de los datos estn por debajo de esa edad.
El cuartil 3 = 46 aos significa que el 75% de los datos estn por debajo de esa edad.

El percentil 30 = 29 aos significa que el 30% de los datos estn por debajo de esa edad.
El percentil 50 = 36 aos significa que el 50% de los datos estn por debajo de esa edad y es igual al
Cuartil 2.

El decil 7 = 46 aos significa que el 70% de los datos estn por debajo de esa edad.

El decil 5 = percentil 50 = Cuartil 2 = 36 aos significa que el 50% de los datos estn por debajo de esa
edad. Este valor tpicamente es muy aproximado a la media, y vemos que as es en nuestro estudio (36
aos y 37 aos).

El rango es de 43 aos y el coeficiente de variacin es de 31%, este es un valor elevado, lo cual


denota una alta variabilidad de los datos respecto a la media.

Para el caso de la variable continua elegida que fue la Velocidad del conductor tenemos una media, moda y
mediana con valores de 73.15, 71 y 70 respectivamente, notamos que la 3 medidas estn muy cercanas entre
s, la distancia mayor entre ellas es de 3.15 Km/h, lo cual est muy por debajo del valor de 1 desviacin tpica
que es de 17,88 Km/h.
El cuartil 1 = 66 Km/h significa que el 25% de los datos estn por debajo de esa velocidad.
El cuartil 2 = 71 Km/h significa que el 50% de los datos estn por debajo de esa velocidad.
El cuartil 3 = 80 Km/h significa que el 75% de los datos estn por debajo de esa velocidad.
El percentil 25 = 66 Km/h significa que el 30% de los datos estn por debajo de esa velocidad y es igual
al Cuartil 1.

El percentil 50 = 71 Km/h significa que el 50% de los datos estn por debajo de esa velocidad y es igual
al Cuartil 2.

El decil 7 = 79 Km/h significa que el 70% de los datos estn por debajo de esa velocidad.

El decil 5 = percentil 50 = Cuartil 2 = 71 Km/h significa que el 50% de los datos estn por debajo de esa
velocidad. Este valor tpicamente es muy aproximado a la media, y vemos que as es en nuestro estudio
(73.15 Km/h y 71 Km/h).

El rango es de 43 Km/h y el coeficiente de variacin es de 25%, este es un valor moderado, lo cual


denota una variabilidad promedio en los datos con respecto a la media.

You might also like