You are on page 1of 12

UNIVERSIDAD DE CARABOBO

FACULTAD DE INGENIERA
MTODOS ESTADSTICOS II

INFORME N1
MEDIDAS ESTADSTICAS

Profesor: Integrante:

Carlos Martnez Johanny Vargas C.I:22292647

Naguanagua, Octubre 2016


INTRODUCCIN
Las medidas de tendencia central, de dispersin y de posicin, son de relevante
importancia en el momento de realizar estudios estadsticos. Las medidas de tendencia
central, dan una idea de un nmero alrededor del cual tienden a concentrarse todo un conjunto
de datos. Las medidas de tendencia central ms comnmente usadas son:
La media Aritmtica, la mediana y la moda; cada una de estas medidas es representativa de
una serie de datos en una forma particular.

Las medidas de tendencia central son medidas estadsticas que pretenden resumir en un solo
valor a un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el
conjunto de los datos. Las medidas de dispersin en cambio miden el grado de dispersin de
los valores de la variable. Dicho en otros trminos las medidas de dispersin pretenden
evaluar en qu medida los datos difieren entre s. De esta forma, ambos tipos de medidas
usadas en conjunto permiten describir un conjunto de datos entregando informacin acerca de
su posicin y su dispersin.

Los procedimientos para obtener las medidas estadsticas difieren levemente dependiendo de
la forma en que se encuentren los datos. Si los datos se encuentran ordenados en una tabla
estadstica diremos que se encuentran agrupados y si los datos no estn en una tabla
hablaremos de datos no agrupados.

Las medidas de posicin dividen un conjunto de datos en grupos con el mismo


nmero de individuos. Para calcular las medidas de posicin es necesario que
los datos estn ordenados de menor a mayor. Las medidas de posicin son:
cuartiles, deciles, percentiles,
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS

Las medidas de tendencia central tienen como propsito hallar con toda precisin el
centro de un conjunto de observaciones.

Media aritmtica:

La media aritmtica es la medida de tendencia central que frecuentemente llamamos


promedio, consiste en la suma de los valores del grupo de datos dividida entre la cantidad de
valores. La media aritmtica de una poblacin se representa con el smbolo (mu), y la media
aritmtica de una muestra se representa con el smbolo (equis barra) y susfrmulas son las
siguientes:

=1 =1
= =

Propiedades de la Media Aritmtica:

Para calcular la media se toman todos los valores.


Un conjunto de datos slo tiene una media. La media es nica.
La media es una medida til para comparar dos o ms poblaciones.
La media aritmtica es la nica medida de posicin en la que las suma de las
desviaciones de los valores de la media es siempre cero:=1( ) = 0

Media geomtrica:

La media geomtrica es til para encontrar el promedio de porcentajes, proporciones,


ndices o tasas de crecimiento. Tiene mucha aplicacin en el comercio y en la economa
debido a que nos interesa encontrar el porcentaje de cambio en ventas, salarios o cualquier
otro dato econmico. La media geomtrica de un conjunto n de nmeros positivos se define
como la n-sima raz del producto de los n valores. La frmula de la media geomtrica se
escribe as:

= (1) (2) ()

La media geomtrica ser siempre menor o igual a la media aritmtica, pero nunca mayor.

Mediana:

La mediana o media posicional queda en la mitad un grupo de elementos ordenados de


forma ascendente o descendente. En este caso la mitad de los nmeros estar por debajo de la
mediana y la otra mitad por encima de ella. La posicin de mediana se obtiene con la
siguiente ecuacin:

+1
=
2
Si el grupo de datos es impar la mediana se calcula as de la siguiente forma. Ejemplo:
Calculemos la mediana de los kilos(ordenados de forma ascendente) de materia prima
utilizada durante esta semana: 33, 36, 40, 45, 57,60 y 68.
+1 7+1 8
= = = =4
2 2 2
La mediana es el valor que est en la posicin 4: 33, 36, 40, 45, 57,60 y 68. Xmed=45
Si el grupo de datos es par, aplicamos la misma ecuacin promediando los dos valores
centrales, observemos el ejemplo: Datos: 10, 15, 18, 25, 31, 36, 45, 60, 77, 80
+ 1 10 + 1 11
= = = = 5,5
2 2 2
El punto 5,5 estara entre los valores de las posiciones 5 y 6, por lo que buscamos
ambos valores y los promediamos 10, 15, 18, 25, 32, 36, 45, 60, 77, 80
32 + 36
= = 34
2
Moda:
Es la medida de tendencia central ms fcil de recordar ya que es el dato que ms se
repite dentro de nuestro conjunto de elementos. Veamos este ejemplo:
Las edades de los nios de nuestra familia: 12, 1, 10, 1, 10, 2, 5, 7, 8, 9, 10, 11. El
nmero que ms se repite es el 10, a pesar del que el 1 tambin se repite, el 10 se repite mayor
nmero de veces.

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS


Para el uso de datos agrupados as definiciones de nuestras medidas de tendencia
central se mantienen, lo que va a variar es la forma de calcularlos.

Media aritmtica:
Para aproximar la media aritmtica de datos agrupados en una distribucin de
frecuencias, comenzamos por asumir que las observaciones de cada clase estn representadas
por el punto medio de la clase. La media de una distribucin de frecuencias se calcula as:
=1
=

Donde:
f = frecuencia de cada clase
Xm = punto medio de la clase
n = nmero total de frecuencias

Media geomtrica:
La media geomtrica para datos agrupados se determina con la siguiente ecuacin:

= (1) 1 (2) 2 ()
Donde:
Xm = punto medio de la clase o intervalos
f = frecuencia de la clase
Recordar que la media geomtrica se calcula para promedios de porcentajes.

Mediana:
La mediana es el valor por debajo del cual se encuentran una mitad de los valores y
por encima del cual se encuentra la otra mitad. Como los datos estn organizados en una
distribucin de frecuencias, se ha perdido algo de informacin. As no podemos calcular la
mediana exacta, sin embargo, se puede estimar de la siguiente manera:


2
= + ()

Donde:
L = lmite inferior de la clase que contiene la media
CF = nmero de frecuencia acumuladas que en las clases que preceden a la clase que
contiene a la mediana
f = frecuencia de la clase que contiene la mediana
i = amplitud de la clase que contiene la mediana

Moda:
Siendo la moda el valor con ms frecuencia, slo debemos buscar dentro de nuestra
distribucin de frecuencias los intervalos con mayor cantidad de frecuencia.

MEDIDAS DE DIPSERSION O VARIABILIDAD


Las medidas de tendencia central por s solas carecen de significado, pues de nada
sirve saber el promedio sin conocer la dispersin, es decir, saber cunto se alejan las
observaciones de su propio promedio.
Existen dos grupos de medidas de dispersin. El primer grupo es el de las medidas de
dispersin absolutas que vienen expresado por las mismas medidas que identifican a la serie
de datos; el segundo grupo es el de las medias de dispersin relativas que son relaciones entre
las medidas de dispersin y las medidas de tendencia central, expresado en valores abstractos
(porcentajes).

MEDIDAS DE DISPERSION ABSOLUTA


El rango:
El rango o recorrido es la medida de dispersin ms sencilla, consiste en calcular la
diferencia entre el valor mayor y el valor menor de la observacin, se podra decir que el
rango es una medida de dispersin cebil pues solo toma en cuenta dos valores de la muestra,
la manera de calcular el rango es la siguiente:

=
Para el caso de datos agrupados se toma el lmite inferior de la primera clase y el
lmite superior de la ltima clase.

Rango intercuartil:
Se define como la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1). A
menudo se utiliza ms que el rango, ya que se usa para construir los diagramas de caja y
bigote, dado que el rango intercuartil excluye valores atpicos.

= 3 1
Donde:
RI = rango intercuartil
Q1 = primer cuartil ( se acumula 0.25 de probabilidad)
Q3 = tercer cuartil ( se acumula 0.75 de probabilidad)

Desviacin media:
La desviacin media mide la cantidad promedio en que los valores de la poblacin, o
de la muestra, varan de la media. Se define as:
=1| |
=

Se hace uso del valor absoluto, Por qu? Porque si no lo hiciramos as las
desviaciones positivas y negativas se anularan, y la desviacin siempre sera cero, y una
medida de dispersin cero sera completamente intil.

Varianza:
La varianza se define como la media aritmtica de las desviaciones de la media
elevadas al cuadrado. Y su frmula es:

=1( )2
2
=
1
Donde:
S2 = Varianza muestral
X = valor i de la muestra
= media aritmtica
n = tamao de la muestra
Para datos agrupados la formula serala siguiente:

2
=1 2 2
=
1
Donde:
f = frecuencia de la clase
Xm = punto medio de la clase
= media aritmtica

Desviacin estndar:
Se define como la raz cuadrada de la varianza, para los casos en que se trabaja con
datos agrupados y no agrupados, la frmula es la siguiente:

= 2
MEDIDAS DE DISPERSION RELATIVAS
Las medidas de dispersin relativa se expresan en porcentaje (valores abstractos) y se
determinan por la relacin existente entre una medida de dispersin absoluta y una medida de
tendencia central, relacin que nos permite comparar la variabilidad de los datos entre varias
series. La medida de dispersin relativa de mayor importancia es el coeficiente de variacin,
que se expresa en porcentajes y se calcula por la relacin que existe entre la desviacin
estndar y la media aritmtica. Su frmula es la siguiente:

= 100%
||
TABLA N 1. Niveles de Oxgeno e Hidrocarburo

i Xi Yi Xi - Xm (Xi-Xm)2 |Xi-Xm| Yi - Ym (Yi-Ym)2 |Yi-Ym|


1 0,99 90,01 -0,206 0,042436 0,206 -2,1505 4,62465025 2,1505
2 1,02 89,05 -0,176 0,030976 0,176 -3,1105 9,67521025 3,1105
3 1,15 91,43 -0,046 0,002116 0,046 -0,7305 0,53363025 0,7305
4 1,29 93,74 0,094 0,008836 0,094 1,5795 2,49482025 1,5795
5 1,46 96,73 0,264 0,069696 0,264 4,5695 20,88033025 4,5695
6 1,36 94,45 0,164 0,026896 0,164 2,2895 5,24181025 2,2895
7 0,87 87,59 -0,326 0,106276 0,326 -4,5705 20,88947025 4,5705
8 1,23 91,77 0,034 0,001156 0,034 -0,3905 0,15249025 0,3905
9 1,55 99,42 0,354 0,125316 0,354 7,2595 52,70034025 7,2595
10 1,4 93,65 0,204 0,041616 0,204 1,4895 2,21861025 1,4895
11 1,19 93,54 -0,006 3,6E-05 0,006 1,3795 1,90302025 1,3795
12 1,15 92,52 -0,046 0,002116 0,046 0,3595 0,12924025 0,3595
13 0,98 90,56 -0,216 0,046656 0,216 -1,6005 2,56160025 1,6005
14 1,01 89,54 -0,186 0,034596 0,186 -2,6205 6,86702025 2,6205
15 1,11 89,85 -0,086 0,007396 0,086 -2,3105 5,33841025 2,3105
16 1,2 90,39 0,004 1,6E-05 0,004 -1,7705 3,13467025 1,7705
17 1,26 93,25 0,064 0,004096 0,064 1,0895 1,18701025 1,0895
18 1,32 93,41 0,124 0,015376 0,124 1,2495 1,56125025 1,2495
19 1,43 94,98 0,234 0,054756 0,234 2,8195 7,94958025 2,8195
20 0,95 87,33 -0,246 0,060516 0,246 -4,8305 23,33373025 -4,8305
SUMA 23,92 1843,21 0 0,68088 3,08 0 173,376895 38,509

Donde:

i = Nmero de observaciones
Xi= Nivel de hidrocarburo x(%)
Yi= Pureza y(%)
RESULTADOS

Datos no agrupados:

TABLA N 2. DATOS NO AGRUPADOS

MEDIDAS ESTADSTICAS Xi Yi
MEDIA ( ) 1,196 92,1605
MEDIA GEOMTRICA (MG) 1,18162581 92,11387558
MEDIANA 1,195 92,145
MODA 1,15 #N/A
RANGO 0,68 12,09
DESVIACIN MEDIA (DM) 0,154 1,92545
VARIANZA MUESTRAL ( S2 ) 0,035835789 9,125099737
DESVIACIN ESTANDAR ( S ) 0,189303432 3,020778002
COEFICIENTE DE VARIANCIN PORCENTUAL (CV) 15,828045 3,277736

DATOS AGRUPADOS

Nivel de Hidrocarburo (Xi)


Rango (R) = 0,68
Nmero de Intervalos ( # Int) : 1 + 3,33log(20) = 5.33 6
0,68
Ancho de Clase (C) : = # Int = = 0,1133
6

TABLA N 3. DATOS AGRUPADOS (NIVEL DE HIDROCARBURO)

# Int Lim. Inferior Lim. Superior Pm fab fr f% fac frac frac%


1 0,87 0,9833 0,92665 3 0,15 15 3 0,15 15
2 0,9833 1,0933 1,0383 3 0,15 15 6 0,3 30
3 1,0933 1,2099 1,1516 5 0,25 25 11 0,55 55
4 1,2099 1,3232 1,26655 4 0,2 20 15 0,75 75
5 1,3232 1,4365 1,37985 3 0,15 15 18 0,9 90
6 1,4365 1,5498 1,49315 2 0,1 10 20 1 100

CLCULOS TPICOS:
. +.
= 2
fa= cantidad de datos contenidos en un intervalo especfico

= , donde n es la cantidad de datos

% = 100%
Fi = Es la sumatoria del fi de ese intervalo ms el fi del intervalo posterior

Fr =
% = 100%

RESULTADOS:

Media = 1,1922
Mediana = 1,1866
Moda = 1,1516
Varianza Muestral = 0,0299
Desviacin Estndar = 0.1732
Pureza (Yi)
Rango (R) = 12,09
Nmero de Intervalos ( # Int) : 1 + 3,33log(20) = 5.33 6
12,09
Ancho de Clase (C) : = # Int = = 2,01f
6

TABLA N 4. DATOS AGRUPADOS (PUREZA)

# Int Lim. Inferior Lim. Superior Pm fab fr f% f ac Frac Frac%


1 87,33 89,345 88,3375 3 0,15 15 3 0,15 15
2 89,345 91,36 90,3525 5 0,25 25 8 0,4 40
3 91,36 93,375 92,3675 4 0,2 20 12 0,6 60
4 93,375 95,39 94,3825 6 0,3 30 18 0,9 90
5 95,39 97,405 96,3975 1 0,05 5 19 0,95 95
6 97,405 99,42 98,4125 1 0,05 5 20 1 100

Media = 92,3675
Mediana = 92,3675
Moda = 94,3825
Varianza Muestral = 7,3185
Desviacin Estndar = 2,7052

Donde:

Pm : Punto Medio del Intervalo


fab : Frecuencia Absoluta
fr : Frecuencia Relativa
f% :Frecuencia Relativa Porcentual
Fac : Frecuencia Acumulada
Frac :Frecuencia Relativa Acumulada
Frac% : Frecuencia Relativa Acumulada Porcentual

DISCUSIN DE RESULTADOS

Primeramente haciendo un anlisis de los datos no agrupados, se logr notar que no existe
la medida de tendencia central denominada moda para los datos de pureza. Esta medida
estadstica, es la encargada de resaltar el dato que ms se repite en el conjunto de datos, y al
no existir un dato repetido, se puede establecer que no existe la Moda para este caso.
Tambin se pudo observar una diferencia considerable, en el Coeficiente de Variacin,
siendo mayor el del nivel de Hidrocarburos, lo cual representa que no existe mucha
similitud entre dichos datos. Y por otra parte se encuentra la varianza muestral, para el caso
del Nivel de Hidrocarburo, haciendo una comparacin entre datos no agrupados y datos
agrupados, se refleja que no existe mayor diferencia, lo que es el caso contrario para la
pureza, la cual si reflej una diferencia en esta medida de dispersin, con lo cual se puede
concluir, basndose en fundamentos tericos, que la ltima calculada representa un valor
ms exacto.

CONCLUSIONES

Las medidas de tendencia central (Media, Mediana, Moda) nos permiten fijar, establecer
y/o proyectar lmites y valores hacia los que tiende a ubicarse la variable que se est
evaluando. Por otra parte las Medidas de Dispersin permiten ver el rango entre el cual
pudiese moverse la variable. Y la Importancia de ambas es que permite fijar los valores de
las variables para lograr una mejor administracin de los procesos: Productivos,
administrativos, de servicios, entre otros, en cualquier rea donde se puedan generar y
tomar datos.

Las medidas de dispersin son importantes debido a que dos muestras de observaciones con
el mismo valor central pueden tener una variabilidad muy distinta. La variabilidad de
cualquier distribucin se contempla generalmente en trminos de la desviacin de cada
valor observado (X) con respecto a la media muestral. La importancia de la dispersin de la
distribucin est basada en que:
*Su informacin permite juzgar la confiabilidad de la medida de tendencia central.
*Nos permite determinar cuan dispersos estn los datos y por lo tanto solucionar o explicar
los problemas que se puedan presentar por este hecho.
*Se pueden comparar las dispersiones de varias muestras, con la cual el riesgo de que exista
un espectro de valores lejos del centro se puede evitar.
BIBLIOGRAFA

Canavos, G. (2003). Probabilidad y Estadstica Aplicaciones y Mtodos. Mxico:


McGraw-hill/interamericana.

Depool, R., Monasterio, D. (2013). Probabilidad y Estadstica Aplicaciones a la


Ingeniera. Consultado el da 29 de Abril del 2016 desde
http://www.bqto.unexpo.edu.ve/avisos/PROBABILIDADYESTADISTICA(2-7-13).pdf.

Montgomery, D., Runger, G (2002). Probabilidad y Estadstica Aplicaciones y Mtodos.


Mxico: LimusaWiley Editores.

Rasse, R. (2012). Unidad II Medidas de Tendencia Central. Universidad de Oriente


Venezuela. Consultado el da 29 de Abril del 2016 desde
http://estadisticaeducativaudo.blogspot.com/p/medidas-de-tendencia-central-nos.html.

You might also like