You are on page 1of 31

REPBLICA DE COLOMBIA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA U.N.A.D

CURSO: 100105_808: ESTADISTICA DESCRIPTIVA

LEONARDO DAVID BRITO NIEVES


Cdigo: 84.103.756
ROBINSON LOBO HERNANDEZ
Cdigo: 77.179.466
LIDA KARINA MENDEZ MENCO
CODIGO: 37687451

TUTOR: DIEGO ALBERTO GOMEZ

SAN JUAN DEL CESAR - LA GUAJIRA, NOVIEMBRE, 2.014


INTRODUCCIN

Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la


variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes
puntuaciones de una variable estn muy alejadas de la media. Cuanto mayor sea
ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la
media. As se sabe si todos los casos son parecidos o varan mucho entre ellos.
Para calcular la variabilidad que una distribucin tiene respecto de su media, se
calcula la media de las desviaciones de las puntuaciones respecto a la media
aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan
dos clases de estrategias para salvar este problema. Una es tomando las
desviaciones en valor absoluto (Desviacin media) y otra es tomando las
desviaciones al cuadrado (Varianza).

Este trabajo se fundamenta en el reconocimiento y profundizacin en la temtica


propuesta dentro de la unidad 2 y el desarrollo de algunas de las temticas
estudiadas a lo largo del proceso acadmico del curso de estadstica descriptiva.

Para el desarrollo de esta actividad fue necesario poner en prctica conceptos de


gran importancia tales como media aritmtica, mediana rango, varianza, desviacin,
mediana, entre otros conceptos estudiaos a lo largo del periodo acadmico con el
propsito de que el aprendizaje sea ms dinmico y se facilite ms.
OBJETIVOS

GENERALES:

Poner en prctica algunos de los conceptos ms importantes estudiados a lo


largo del proceso acadmico en especial de la unidad nmero dos la cual
lleva por nombre de medidas estadsticas.

ESPECFICOS:

Manejar conceptos que nos permitan realizar una investigacin de forma


confiable.

Interpretar y utilizar las medidas de dispersin.

Descubrir nuestras fortalezas y debilidades asociativas a travs del desarrollo


de esta actividad.
1. Realizar un mentefacto conceptual sobre las medidas de dispersin.
2. Una empresa despulpadora de fruta busca optimizar su produccin de jugo
de mango. Para esto, inici un estudio en el cual midi los pesos en gramos
de una muestra.

76 85 92 70 65 90 98 99 78 97
84 102 77 94 109 102 104 105 100 102
90 83 74 91 87 88 90 96 94 92
68 69 79 82 96 100 102 107 98 93
104 76 83 108 67 100 102 98 99 130

Realizar una tabla de distribucin de frecuencias para datos agrupados dado


que la variable es peso (cuantitativa continua), Calcular varianza, desviacin
estndar y coeficiente de variacin. Interprete los resultados.

Peso (gr) Frecuencia (f) 99 2


100 3
65 1
102 5
67 1
104 2
68 1
105 1
69 1
107 1
70 1
108 1
74 1
109 1
76 2
130 1
77 1
Muestra: 50
78 1
79 1
82 1
83 2
84 1
85 1
87 1
88 1
90 3
91 1
92 2
93 1
94 2
96 2
97 1
98 3
Distribucin de frecuencias de los pesos de los mangos para jugos

Peso (gr) Frecuencia (f) (X.f) X2 f . X2


65 1 65 4.225,00 4.225,00
67 1 67 4.489,00 4.489,00
68 1 68 4.624,00 4.624,00
69 1 69 4.761,00 4.761,00
70 1 70 4.900,00 4.900,00
74 1 74 5.476,00 5.476,00
76 2 152 5.776,00 11.552,00
77 1 77 5.929,00 5.929,00
78 1 78 6.084,00 6.084,00
79 1 79 6.241,00 6.241,00
82 1 82 6.724,00 6.724,00
83 2 166 6.889,00 13.778,00
84 1 84 7.056,00 7.056,00
85 1 85 7.225,00 7.225,00
87 1 87 7.569,00 7.569,00
88 1 88 7.744,00 7.744,00
90 3 270 8.100,00 24.300,00
91 1 91 8.281,00 8.281,00
92 2 184 8.464,00 16.928,00
93 1 93 8.649,00 8.649,00
94 2 188 8.836,00 17.672,00
96 2 192 9.216,00 18.432,00
97 1 97 9.409,00 9.409,00
98 3 294 9.604,00 28.812,00
99 2 198 9.801,00 19.602,00
100 3 300 10.000,00 30.000,00
102 5 510 10.404,00 52.020,00
104 2 208 10.816,00 21.632,00
105 1 105 11.025,00 11.025,00
107 1 107 11.449,00 11.449,00
108 1 108 11.664,00 11.664,00
109 1 109 11.881,00 11.881,00
130 1 130 16.900,00 16.900,00
TOTAL 50 4.575,00 270.211,00 427.033,00
Calculo de varianza (s2):

Desviacin estndar (s):


Coeficiente de variacin:

Estos resultados llevan a las siguientes conclusiones:

El peso promedio de los mangos es de 91,5 gr.


El peso de los mangos varan grandemente respecto a la media: en
168,41 gr2, que en trminos de la desviacin estndar esto es 12,98
gr.
El coeficiente de variacin es 14,19 %.
3. Un empleado de la empresa de Acueducto de la ciudad de Cartagena, realiza
un estudio sobre los reclamos realizados en los 2 ltimos aos, para ello
elige una muestra de 60 personas, con los siguientes resultados:

N Reclamaciones 0 1 2 3 4 5 6 7
N De usuarios 26 10 8 6 4 3 2 1

Calcular:
a. El promedio de reclamos.
b. La varianza y su deviacin tpica.
c. El coeficiente de variacin.

Distribucin de frecuencias del nmero de usuarios por reclamo

N N De
Frecuencia (f) (X.f) X2 f . X2
Reclamaciones usuarios
0 26 26 0 0,00 0,00
1 10 10 10 1,00 10,00
2 8 8 16 4,00 32,00
3 6 6 18 9,00 54,00
4 4 4 16 16,00 64,00
5 3 3 15 25,00 75,00
6 2 2 12 36,00 72,00
7 1 1 7 49,00 49,00
TOTAL 60 60 94,00 140,00 356,00

Calculo del promedio:


Calculo de varianza (s2):

Desviacin estndar (s):


Coeficiente de variacin:

Estos resultados llevan a las siguientes conclusiones:

El promedio de reclamos es 1,57.


Los reclamos varan grandemente respecto a la media: en 3,48
reclamos cuadrados, que en trminos de la desviacin estndar esto
es 1,87 reclamos.
El coeficiente de variacin es 119,05 %.
4. Ingresar al blog de Estadstica Descriptiva que se encuentra en la pgina
principal del curso en el TOPICO DE CONTENIDOS, posteriormente buscar
el LABORATORIO (REGRESIN Y CORRELACIN LINEAL EXCELL) y
realizar los ejercicios 2 y 3 que se encuentra al final del laboratorio.
A) En un nuevo proceso artesanal de fabricacin de cierto artculo que est
implantando, se ha considerado que era importante ir anotando
peridicamente el tiempo medio (medido en minutos) que se utiliza para
realizar una pieza (variable Y) y el nmero de das desde que empez
dicho proceso de fabricacin (variable X). Con ello, se pretende analizar
como los operarios van adaptndose al nuevo proceso mejorando
paulatinamente su proceso de produccin.

Los siguientes datos representan dicha situacin:

X 10 20 30 40 50 60 70
Y 35 28 23 20 18 15 13

a) Realice el diagrama de dispersin y determine el tipo de asociacin


entre las variables.

Existe una correlacin fuerte, Negativa: El valor de Y


disminuye claramente cuando X aumente. El valor de r
coeficiente de correlacin lineal.
Es una relacin inversa.
b) Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre la otra. Es confiable?.

Estadsticas de la regresin
Coeficiente de correlacin
mltiple 0,972336414
Coeficiente de
determinacin R^2 0,945438103
R^2 ajustado 0,934525723
Error tpico 1,969408903
Observaciones 7

ANLISIS DE VARIANZA
Grados de Promedio de los Valor crtico
libertad Suma de cuadrados cuadrados F de F
Regresin 1 336,0357143 336,0357143 86,63904236 0,000240856
Residuos 5 19,39285714 3,878571429
Total 6 355,4285714

Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepcin 35,571 1,664454314 21,37122556 4,15932E-06 31,29281255 39,8500446 31,29281255 39,8500446
Variable X 1 -0,346 0,03721833 -9,308009581 0,000240856 -0,442101334 -0,250755809 -0,442101334 -0,250755809

El modelo es confiable para pronosticar datos teniendo en cuenta el rango de la muestra (10 - 70) das.
c) Determine el porcentaje de explicacin del modelo y el grado de
relacin de las dos variables.

El coeficiente de correlacin lineal r, es tambin conocido como


coeficiente de Pearson. Ya se mencionaba que el coeficiente de
correlacin lineal oscila entre +1 y -1, se puede entonces interpretar el
grado de correlacin partiendo de los siguientes lmites de referencia:

Interpretacin Valores de r (+) Valores de r (-)


Correlacin perfecta =1 = -1
Correlacin excelente 0,90 < r < 1 -1 < r < -0.90
Correlacin aceptable 0,80 < r < 0,90 -0.90 < r < -0.80
Correlacin regular 0,60 < r < 0,80 -0.80 < r < -0.60
Correlacin mnima 0,30 < r < 0,60 -0.60 < r < -0.30
No hay correlacin 0 < r < 0,30 -0.30 < r < 0
Tomado de Estadstica Bsica Aplicada; Ciro Martnez Bencardino

Dnde:

R2: Coeficiente de determinacin, 0 <= R2 <= 1.


Se2: Varianza del error estimado.
Sy2: Varianza de la variable dependiente Y.
3.656,00 (35,571)(152,00) (-0,346)(5.110,00)
= 1,969
7-2

Desviacin para datos no agrupados.

3.656,00
- 21,714 = 7,126
7

R2 = 1 - 3,879 / 50,776 = 0,924

r = 0,961

Segn los resultados obtenidos podemos decir que el grado de


correlacin es EXCELENTE.
d) Que tiempo deber tardarse un empleado cuando se lleven 100 das?.

Ord Das (X) Tiempo (Y) (X * Y) (X * X)


1 10 35 350,00 100,00
2 20 28 560,00 400,00
3 30 23 690,00 900,00
4 40 20 800,00 1600,00
5 50 18 900,00 2500,00
6 60 15 900,00 3600,00
7 70 13 910,00 4900,00
TOTAL: 280,00 152,00 5.110,00 14.000,00

Y = a + bX

Dnde:
Y: Variable dependiente (la que se va a predecir).
A: Intercepto de la variable Y.
X: Variable independiente.
B: Pendiente de la recta.

n: 7
b: - 0,346
Dnde: a: 35,571
b: Pendiente de la recta X: 100
a: Intercepto de la variable Y Y: 0,929
X : Valores de la variable independiente
Y : Valores de la variable dependiente
n: Tamao de la muestra

Por lo que la ecuacin de regresin lineal sera:


Y= a + bX
Y = 35,571 + (-0,346)(X)

Respondiendo a la pregunta con X = 100 das.

Y= 35,571 0,346 * 100


Y= 35,571 34,6
Y= 0,929

Entonces al tiempo de fabricacin de 100 das, el tiempo estimado sera


de aproximadamente de 1 minuto (0,929 min).
B) Una nutricionista de un hogar infantil desea encontrar un modelo
matemtico que permita determinar la relacin entre peso y la estatura de
sus estudiantes.

Para ello selecciona 10 nios y realiza las medicines respectivas.

A continuacin se presentan los resultados:

Estatura (cm) 121 123 108 118 111 109 114 103 110 115
Peso (kg) 25 22 19 24 19 18 20 15 20 21

a) Realice el diagrama de dispersin y determine el tipo de asociacin


entre las variables.

Existe una correlacin fuerte, Positiva: al aumentar o disminuir


los valores de la variable independiente aumentan o disminuyen
los de la variable dependiente. El valor de r coeficiente de
correlacin lineal.
Es una relacin directa.
b) Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre la otra. Es confiable?.

Estadsticas de la regresin
Coeficiente de
correlacin mltiple 0,90013752
Coeficiente de
determinacin R^2 0,810247554
R^2 ajustado 0,786528499
Error tpico 1,343510379
Observaciones 10

ANLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crtico
libertad cuadrados cuadrados F de F
Regresin 1 61,6598389 61,6598389 34,16019445 0,000385097
Residuos 8 14,4401611 1,805020138
Total 9 76,1

Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepcin -27,377 8,168377614 -3,351567626 0,010056862 -46,21318252 -8,54055741 -46,2131825 -8,54055741
Variable X 1 0,421 0,072061142 5,844672313 0,000385097 0,255000471 0,58734705 0,25500047 0,58734705

El modelo es confiable para pronosticar datos teniendo en cuenta el rango de la muestra (103 - 123) cm.
c) Determine el grado de relacin de las dos variables.

El coeficiente de correlacin lineal r, es tambin conocido como


coeficiente de Pearson. Ya se mencionaba que el coeficiente de
correlacin lineal oscila entre +1 y -1, se puede entonces interpretar el
grado de correlacin partiendo de los siguientes lmites de referencia:

Interpretacin Valores de r (+) Valores de r (-)


Correlacin perfecta =1 = -1
Correlacin excelente 0,90 < r < 1 -1 < r < -0.90
Correlacin aceptable 0,80 < r < 0,90 -0.90 < r < -0.80
Correlacin regular 0,60 < r < 0,80 -0.80 < r < -0.60
Correlacin mnima 0,30 < r < 0,60 -0.60 < r < -0.30
No hay correlacin 0 < r < 0,30 -0.30 < r < 0
Tomado de Estadstica Bsica Aplicada; Ciro Martnez Bencardino

Dnde:

R2: Coeficiente de determinacin, 0 <= R2 <= 1.


Se2: Varianza del error estimado.
2
Sy : Varianza de la variable dependiente Y.
4.197,00 (-27,377)(203,00) (0,421)(23.126,00)
= 1,344
10 - 2

Desviacin para datos no agrupados.

4.197,00
- 412,09 = 2,759
10

R2 = 1 - 1,805 / 7,610 = 0,763

r = 0,873

Segn los resultados obtenidos podemos decir que el grado de


correlacin es ACEPTABLE.
d) Cul es el peso que debera tener un estudiante que mide 130 cm?.

Ord Estatura (X) Peso (Y) (X * Y) (X * X)


1 121 25 3.025,00 14.641,00
2 123 22 2.706,00 15.129,00
3 108 19 2.052,00 11.664,00
4 118 24 2.832,00 13.924,00
5 111 19 2.109,00 12.321,00
6 109 18 1.962,00 11.881,00
7 114 20 2.280,00 12.996,00
8 103 15 1.545,00 10.609,00
9 110 20 2.200,00 12.100,00
10 115 21 2.415,00 13.225,00
TOTAL: 1.132,00 203,00 23.126,00 128.490,00

Y = a + bX

Dnde:
Y: Variable dependiente (la que se va a predecir).
A: Intercepto de la variable Y.
X: Variable independiente.
B: Pendiente de la recta.

Dnde: n: 10
b: Pendiente de la recta b: 0,421
a: Intercepto de la variable Y a: -27,377
X : Valores de la variable independiente X: 130
Y : Valores de la variable dependiente Y: 27,376
n: Tamao de la muestra
Por lo que la ecuacin de regresin lineal sera:

Y= a + bX
Y = -27,377 + 0,421(X)

Respondiendo a la pregunta con X = 130 cm.

Y= -27,377 + 0,421*130
Y= -27,377 + 54,76
Y= 27,376

Entonces el peso que debera tener un estudiante que mida 130 cm son
27,376 kg.
5. A continuacin Se presentan las ventas nacionales de mviles nuevos de
1992 a 2004 en la siguiente tabla. Obtenga un ndice simple para las ventas
nacionales utilizando una base variable:

Ao Ventas (millones $)
1992 8.8
1993 9.7
1994 7.3
1995 6.7
1996 8.5
1997 9.2
1998 9.2
1999 8.4
2000 6.4
2001 6.2
2002 5.0
2003 6.7
2004 7.6

Los ndices son de base variable cuando a cada observacin se le divide por el
valor de la observacin inmediatamente anterior.

Donde,

ndice.
Perodo base.
Perodo que se analiza.
Precio, cantidad o valor del perodo que se investiga.
Precio, cantidad o valor del perodo considerado como base.
Con los datos de las ventas se obtiene la siguiente tabla:

AO VENTAS NDICE t / (t1) NDICE t / (t1)%


1992 8,8
1993 9,7 (9,7 / 8,8) = 1,10 (1,10 * 100) = 110,23
1994 7,3 (7,3 / 9,7) = 0,75 (0,75 * 100) = 75,26
1995 6,7 (6,7 / 7,3) = 0,92 (0,92 * 100) = 91,78
1996 8,5 (8,5 / 6,7) = 1,27 (1,27 * 100) = 126,87
1997 9,2 (9,2 / 8,5) = 1,08 (1,08 * 100) = 108,24
1998 9,2 (9,2 / 9,2) = 1,00 (1,00 * 100) = 100,00
1999 8,4 (8,4 / 9,2) = 0,91 (0,91 * 100) = 91,30
2000 6,4 (6,4 / 8,4) = 0,76 (0,76 * 100) = 76,19
2001 6,2 (6,2 / 6,4) = 0,97 (0,97 * 100) = 96,88
2002 5,0 (5,0 / 6,2) = 0,81 (0,81 * 100) = 80,65
2003 6,7 (6,7 / 5,0) = 1,34 (1,34 * 100) = 134,00
2004 7,6 (7,6 / 6,7) = 1,13 (1,13 * 100) = 113,43

1992
I = (9,7/8,8)*100 = 110,23%
1993

Se considera que el aumento en las ventas es del 10,23% en el ao 1993 con


respecto al ao 1992.

1993
I = (7,3/9,7)*100 = 75,26%
1994

Se considera que el aumento en las ventas es del 75,26% en el ao 1994 con


respecto al ao 1993.

1994
I = (6,7/7,3)*100 = 91,78%
1995

Se considera que el aumento en las ventas es del 91,78% en el ao 1995 con


respecto al ao 1994.

1995
I = (8,5/6,7)*100 = 126,87%
1996

Se considera que el aumento en las ventas es del 126,87% en el ao 1996 con


respecto al ao 1995.
1996
I = (9,2/8,5)*100 = 108,24%
1997

Se considera que el aumento en las ventas es del 108,24% en el ao 1997 con


respecto al ao 1996.

1997
I = (9,2/9,2)*100 = 100%
1998

Se considera que el aumento en las ventas es del 100% en el ao 1998 con


respecto al ao 1997.

1998
I = (8,4/9,2)*100 = 91,30%
1999

Se considera que el aumento en las ventas es del 91,30% en el ao 1999 con


respecto al ao 1998.

1999
I = (6,4/8,4)*100 = 76,19%
2000

Se considera que el aumento en las ventas es del 76,19% en el ao 2000 con


respecto al ao 1999.

2000
I = (6,2/6,4)*100 = 96,88%
2001

Se considera que el aumento en las ventas es del 96,88% en el ao 2001 con


respecto al ao 2000.

2001
I = (5,0/6,2)*100 = 80,65%
2002

Se considera que el aumento en las ventas es del 80,65% en el ao 2002 con


respecto al ao 2001.

2002
I = (6,7/5,0)*100 = 134%
2003

Se considera que el aumento en las ventas es del 134% en el ao 2003 con


respecto al ao 2002.
2003
I = (7,6/6,7)*100 = 113,43%
2004

Se considera que el aumento en las ventas es del 113,43% en el ao 2003 con


respecto al ao 2002.

Es posible representar este ndice con base variable en un diagrama de barras o


columnas que toma como valores la diferencia de nivel respecto a la igualdad entre
periodos o nivel 100%. As, los datos se representan en la figura No.1

DIFERENCIA DE
AO VENTAS NDICE t/(t1) NDICE t/(t1)% NIVEL RESPECTO
A LA IGUALDAD
1993 9,7 1,10 110,23 0,10
1994 7,3 0,75 75,26 -0,25
1995 6,7 0,92 91,78 -0,08
1996 8,5 1,27 126,87 0,27
1997 9,2 1,08 108,24 0,08
1998 9,2 1,00 100,00 0,00
1999 8,4 0,91 91,30 -0,09
2000 6,4 0,76 76,19 -0,24
2001 6,2 0,97 96,88 -0,03
2002 5,0 0,81 80,65 -0,19
2003 6,7 1,34 134,00 0,34
2004 7,6 1,13 113,43 0,13
figura No.1
CONCLUSIONES

Las medidas de dispersin miden cuan alejados estn un conjunto de valores


respecto a su media aritmtica. As, cuanto menos disperso sea el conjunto, ms
cerca del valor medio se encontrarn sus valores. Este aspecto es de vital
importancia para el estudio de mltiples sistemas.

Al finalizar el presente trabajo hemos diferenciado claramente los temas que nos
ms importantes de la segunda unidad del curso; como lo son, varianza, rango,
desviacin estndar, desviacin media, coeficiente de variacin, covarianza, etc.

Por otra parte podemos concluir que se hizo un excelente trabajo y se cumplieron
cada uno de los lineamientos expuestos por la universidad nacional abierta y a
distancia UNAD, entendiendo cada uno de los procesos para llevar a cabo el
desarrollo de esta actividad.
BIBLIOGRAFA

Ortegn Pava Milton Fernando, Modulo de Estadstica Descriptiva, Editorial Unad,


Ibagu. Julio 2010, pgs. 178

MEDIDAS DE DISPERSIN. Recuperado el dei 28 de Octubre de 2014, de la


pgina web: http://www.lbanegas.com/lecciones/capitulo02/capitulo0202.html

MARTNEZ, C; Estadstica Comercial, editorial Norma, pagina 119 a 166.