You are on page 1of 22

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

Escuela de Ciencias Bsicas, Tecnologa e Ingeniera - ECBTI

Estadstica descriptiva
Trabajo Colaborativo 2

Presentado por:
DAYANA POLET URIBE TOVAR
CODIGO: 1103099984
Tutor:
Wilson Arturo Herrera

Grupo:
204040_12

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA ECBTI
Sincelejo-Sucre, 26 de mayo del 2016

INTRODUCCION

La estadstica es una ciencia formal y una herramienta que estudia usos y anlisis provenientes de una
muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenmeno fsico o
natural, de ocurrencia en forma aleatoria o condicional.
En este caso la estadstica descriptiva est constituida por un conjunto de tcnicas cuyo objetivo es clasificar,
presentar, describir, resumir y analizar los datos relativos a una o ms caractersticas de los individuos de una
poblacin, a partir de la informacin sobre todos y cada uno de ellos. Para cubrir estos objetivos se vale de
tablas, grficos y resmenes estadsticos.
La estadstica descriptiva univariante se centra en el anlisis de una nica caracterstica o cualidad del
individuo. Las caractersticas a analizar presentan modalidades, exhaustivas y mutuamente excluyentes.
Dependiendo del tipo de modalidades, las caractersticas, que de forma general denominaremos variables.
Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir la informacin con
un solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos se
denomina medida o parmetro de tendencia central o de centralizacin. Cuando se hace referencia
nicamente a la posicin de estos parmetros dentro de la distribucin, independientemente de que sta est
ms o menos centrada, se habla de estas medidas como medidas de posicin
Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una
distribucin, indicando por medio de un nmero si las diferentes puntuaciones de una variable estn muy
alejadas de la media. Cuanto mayor sea ese valor, mayor ser la variabilidad, y cuanto menor sea, ms
homognea ser a la media. As se sabe si todos los casos son parecidos o varan mucho entre ellos.

JUSTIFICACION

La estadstica permite a las personas no especializadas, interpretar mejor determinada informacin,


hacindola ms entendible e interesante. Aun cuando presentan una cantidad limitada de datos y cifras
aproximadas, permite reforzar los argumentos o conclusiones que una investigacin presente. Proporciona
una idea generalizada de los resultados.
Dentro de ella las medidas de tendencia central son empleadas para resumir a los conjuntos de datos que
sern sometidos a un estudio estadstico, se les llama medidas de tendencia central porque generalmente la
acumulacin ms alta de datos se encuentra en los valores intermedios. Estas medidas son utilizadas con
grandes frecuencias como medidas descriptivas de poblaciones o muestras.
Las medidas de dispersin hacen referencia a la variabilidad, o la evaluacin de cun separados o extendidos
estn los datos o bien cuanto difieren unos de otros. Entendindose la variacin, como el grado en que los
datos numricos tienden a distribuirse alrededor de un valor central y su objetivo es identificar si una medida
central, es adecuado para representar la poblacin de datos Indicar la relacin de un dato con los otros y
comprender el riesgo para poder tomar decisiones, es de gran utilidad al comparar distribuciones.

OBJETIVOS

Identificar las variables discretas y dentro de ellas seleccionar la ms representativa segn el problema
plasmado y elaborar una tabla de frecuencias para datos no agrupados y calcular las medidas de tendencia
central: media, mediana, moda, los cuartiles, deciles 5, 7 y percentiles 30, 50 con su respectiva
interpretacin.
Calcular las medidas univariantes absolutas y relativas de dispersin para variables cuantitativas discreta y
calcular: rango, varianza, desviacin tpica y coeficiente de variacin. Interpretar los resultados obtenidos y
asociarlos con el problema objeto de estudio.
Elegir una variable Continua que sea representativa, disear una tabla de frecuencia para datos agrupados,
calcular las medidas de tendencia central, los cuartiles, deciles 5, 7 y percentiles 50 y 75 e Interpretar sus
resultados.
Determinar las medidas univariantes absolutas y relativas de dispersin para variables cuantitativas Continua
y calcular: rango, varianza, desviacin tpica y coeficiente de variacin. Interpretar los resultados obtenidos y
asociarlos con el problema

DISCRETA

NUMERO DE
HERIDOS
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2

2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3

3
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
5
5
5
6
6
6
6
6
8
8
9
9
11

15
18

No
DE
fa
HERIDOS

fr %

Xi*fa

0
1
2
3
4
5
6
8
9
11
15
18
Total

15,00
14,17
31,67
11,67
15,00
2,50
4,17
1,67
1,67
0,83
0,83
0,83
100

0
17
76
42
72
15
30
16
18
11
15
18
330

18
17
38
14
18
3
5
2
2
1
1
1
120

MEDIA
Para el clculo de la media se toman todos los datos se suman y el resultado de dicha suma se
divide en el nmero de datos.
330/120= 2.75
MEDIANA
En este ejemplo como son 120 datos seria: 120 / 2 = 60 por lo tanto la mediana seria Me=
(X60+X61)/2.
(2+2)/2=2
MODA
La moda en este caso seria 0heridos pues es el dato que ms se repite, presenta una frecuencia de
18 o representa el 15%

NUMERO DE
MUERTOS
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
4

MEDIA

Para el clculo de la media se toman todos los datos se suman y el resultado de dicha suma se
divide en el nmero de datos.
103/120= 0.85
MEDIANA
En este ejemplo como son 120 datos seria: 120 / 2 = 60 por lo tanto la mediana seria Me=
(X60+X61)/2.
(2+2)/2=2
MODA
La moda en este caso seria 1muerto pues es el dato que ms se repite, presenta una frecuencia de
48 o representa el 40%

Con la variable Discreta elegida calcular: rango, varianza, desviacin tpica y coeficiente de
variacin. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio.

R//:
Medidas de dispersin
a) Rango:
El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica.
18-0=18
Rango es 18

b) Varianza:
La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una
distribucin estadstica.
La varianza se representa por:

=2

c) Desviacin Tpica:
Tanto para datos agrupados, como para datos no agrupados, La desviacin tpica es la raz
cuadrada de la varianza.
= 1.41

d) Coeficiente de Variacin:
Para una muestra se emplea la siguiente frmula:
S
CV = 100
X

Donde:
CV= coeficiente de variacin.
S= desviacin estndar de la muestra.
X = media aritmtica de la muestra.
CV =

1.41
100
2

CV =70.5

CONTINUA

EDAD
17
17
17
17
17
18
18
18
18
18
19
19
19
19
21
21
21
21
21
21
21
22
22
22
22
22
22
22
23
23
24
29
29
29
29
29

30
31
31
32
32
32
32
33
33
33
33
33
33
33
34
34
35
35
35
35
35
36
36
36
36
38
38
38
38
38
38
38
42
42
42
42
42
43
43
44
45

45
45
46
46
46
46
46
46
46
46
46
46
46
46
46
46
46
48
50
52
52
52
52
52
52
53
54
54
54
54
54
54
55
55
55
55
55
55
56
56
56

60
60
MEDIA
Para el clculo de la media se toman todos los datos se suman y el resultado de dicha suma se
divide en el nmero de datos.
4441/120= 37.00
MEDIANA
En este ejemplo como son 120 datos seria: 120 / 2 = 60 por lo tanto la mediana seria Me=
(X60+X61)/2.
(36+36)/2=36
MODA
La moda en este caso seria 45 aos pues es el dato que ms se repite, presenta una frecuencia de
15 o representa el 12.5%

CUARTILES
El primer cuartil es el mismo percentil del 25%
Q1 = (120*25) /100 = 30 es un nmero entero, por lo que se deber de agregar 0.5, entonces el
Q1 se encuentra en la posicin 30.5, entonces est entre 30 y 31avo dato.
Q1 = (1+1)/2 = 2/2 = 1
El segundo cuartil es el mismo percentil del 50% o la misma Mediana
Q2 = (120*50) /100 = 60 es un nmero entero, por lo que se deber de agregar 0.5, entonces el
Q2 se encuentra en la posicin 60.5, entonces est entre 60 y 61avo dato.
Q2 = (2+2)/2 = 4/2 = 2
El Tercer Cuartil es el mismo percentil del 75%
Q3 = (120*75) /100 = 90 es un nmero entero, por lo que se deber de agregar 0.5, entonces el
Q3 se encuentra en la posicin 90.5, entonces est entre 90 y 91avo dato.
Q3 = (4+4)/2 = 8/2 = 4

DECILES
El Tercer Decil es el mismo percentil del 30%

D3 = (120*30) /100 = 36 es un nmero entero, por lo que se deber de agregar 0.5, entonces el
D3 se encuentra en la posicin 36.5, entonces est entre 36 y 37 avo dato.
D3 = (2+2)/2 = 4/2 = 2
El Quinto Decil es el mismo percentil del 50% o la misma mediana
D5 = (120*50) /100 = 60 es un nmero entero, por lo que se deber de agregar 0.5, entonces el
D5 se encuentra en la posicin 60.5, entonces est entre 60 y 61 avo dato.
D5 = (2+2)/2 = 4/2 = 2

PERCENTILES
El Percentil del 30%
P30= (120*30) /100 = 36 es un nmero entero, por lo que se deber de agregar 0.5, entonces el
P30 se encuentra en la posicin 36.5, entonces est entre 36 y 37 avo dato.
P30 = (2+2)/2 = 4/2 = 2
El Percentil del 50% o la misma Mediana
P50 = (120*50) /100 = 60 es un nmero entero, por lo que se deber de agregar 0.5, entonces el
P50 se encuentra en la posicin 60.5, entonces est entre 60 y 61 avo dato.
P50 = (2+2)/2 = 4/2 = 2

Medidas de dispersin
e) Rango:
El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica.
60-17=43
Rango es 43

f) Varianza:

La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una
distribucin estadstica.
La varianza se representa por:

2
| = 24.5

g) Desviacin Tpica:
Tanto para datos agrupados, como para datos no agrupados, La desviacin tpica es la raz
cuadrada de la varianza.
= 4.94

h) Coeficiente de Variacin:
Para una muestra se emplea la siguiente frmula:
S
CV = 100
X

Donde:
CV= coeficiente de variacin.
S= desviacin estndar de la muestra.
X = media aritmtica de la muestra.
CV =

4.94
100
24.5

CV =20.16

ANALISIS E INTERPRETACION

DISCRETA:

Para el valor de la Mediana tenemos que el 50% de los accidentes reportados por la
secretaria de transito ha dejado como resultado de 0 a 2 heridos, y en el otro 50% de los
accidentes informados, da como resultado de 0 a 2 heridos.
Tenemos para el caso de la Moda, de los 120 accidentes reportados por la secretaria de
transito la tendencia es de 18 heridos en 15 accidentes.
Tenemos para el caso de la media o promedio para este problema de heridos en accidentes
en la ciudad de Medelln durante el ao 2015 es de 2.75.

CONTINUA:

Para el valor

de la Mediana tenemos que el 50% de los accidentes

reportados por la secretaria de transito ha dejado como resultado


personas de 36 aos, y en el otro 50% de los accidentes informados, da
como resultado personas de 36 aos.
Tenemos para el caso de la Moda, de los 120 accidentes reportados por la
secretaria de transito la tendencia es de personas de 15 aos en 12.5
accidentes.
Tenemos para el caso de la media o promedio para este problema de
heridos en accidentes en la ciudad de Medelln durante el ao 2015 es de
37.
En el caso de los cuartiles, el rango est representado por 1 accidentes
para el 25% de los accidentes informados por la secretaria de trnsito,
2accidentes para el 50% y de 4 aos para el rango de los 75%, siendo ste
ltimo el tercer cuartil.
En los deciles, se tiene que para el quinto decil arroja como resultado de
2accidentes y para el sptimo decil representado con el 70%, tambin da
como resultado de 2 accidentes.
En los percentiles representados en el 30% y 50%, los rangos estn entre
0 y 2accidentes respectivamente.

CONCLUSIONES

Con este trabajo podemos concluir que estamos en excelentes condiciones para solucionar un
problema y hallar las medidas univariables de tendencia central y medidas de dispersin
correspondientes.
Estamos en pticas condiciones en utilizar simuladores en el programa Excel.
Analizamos que algunos resultados de cuartiles deciles y percentiles son iguales a algunos
valores de media moda y mediana.
Concluimos que sabemos cmo y con qu formulas hallar frecuencia absoluta y frecuencia
relativa.

BIBLIOGRAFIAS

unad.edu.co. (Unidad 2- Medidas EstadsticasUnivariantes).


[http://campus06.unad.edu.co/ecbti05/mod/lesson/view.php?
id=8716&pageid=2352]. 13 de abril del 2016

unad.edu.co. (estadstica descriptiva y distribuciones de probabilidad).


[http://campus06.unad.edu.co/ecbti05/mod/lesson/view.php?
id=8716&pageid=2072]. 13 de abril del 2016

unad.edu.co. (medidas de dispersin).


[http://campus06.unad.edu.co/ecbti05/mod/lesson/view.php?
id=8716&pageid=2071]. 11 de abril del 2016

unad.edu.co. (Medidas de Tendencia Central).


[http://campus06.unad.edu.co/ecbti05/mod/lesson/view.php?
id=8716&pageid=2070]. 11 de abril del 2016

unad.edu.co. (Anlisis de datos Unidimensionales).


[http://campus06.unad.edu.co/ecbti05/mod/lesson/view.php?
id=8716&pageid=2069]. 10 de abril del 2016