You are on page 1of 12

Medidas de dispersin

Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una
distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy
alejadas de la media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms
homognea ser a la media. As se sabe si todos los casos son parecidos o varan mucho entre ellos.
Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las
desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre
cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones
en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado (Varianza).
Rango estadstico
El rango o recorrido estadstico es la diferencia entre el valor mnimo y el valor mximo en un grupo de
nmeros aleatorios. Se le suele simbolizar con R.
Requisitos del rango
Ordenamos los nmeros segn su tamao.
Restamos el valor mnimo del valor mximo.
Ejemplo
Para una muestra (0, 45, 50, 55, 100), el dato menor es 0 y el dato mayor es 100 (Valor unitario
inmediatamente posterior al dato mayor menos el dato menor). Sus valores se encuentran en un rango de:
Rango = (100-0) =100
Medio rango
El medio rango de un conjunto de valores numricos es la media del menor y mayor valor, pato y katherine o
la mitad del camino entre el dato de menor valor y el dato de mayor valor. En consecuencia el medio rango
es:

Ejemplo
Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor valor Max= 8. El
medio rango resolviendolo mediante la correspondiente frmula sera:

Representacin del medio rango:
Desviacin media
La desviacin media es la media de las diferencias en valor absoluto de los valores a la media.

Este valor estadstico no es de mucha utilidad en estadstica debido a que no es fcil manipular dicha funcin
al no ser derivable.
Siendo ms formales, la desviacin media debera llamarse desviacin absoluta respecto a la media,
para evitar confusiones con otra medida de dispersin, la desviacin absoluta respecto a la mediana,
DM, cuya frmula es la misma, sustituyendo la media aritmtica por la mediana M. Pero tal
precisin no es relevante, porque la desviacin absoluta respecto a la mediana es de uso todava menos
frecuente.
La desviacin absoluta respecto a la media, D
m
, la desviacin absoluta respecto a la mediana, DM, y la
desviacin tpica, , de un mismo conjunto de valores verifican la desigualdad:

Siempre ocurre que

donde el Rango es igual a
Rango = valor mximo valor mnimo
D
m
= 0 cuando los datos son exactamente iguales (e iguales a la media aritmtica)
justo slo hay dos valores en los datos, :a,b, y hay exactamente la mitad de
datos igual a :a y :b.

Desviacin estndar
La desviacin estndar o desviacin tpica () es una medida de centralizacin o dispersin para variables
de razn (ratio o cociente) y de intervalo, de gran utilidad en la estadstica descriptiva.
Se define como la raz cuadrada de la varianza. Junto con este valor, la desviacin tpica es una medida
(cuadrtica) que informa de la media de distancias que tienen los datos respecto de su media aritmtica,
expresada en las mismas unidades que la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino
que necesitamos conocer tambin la desviacin que representan los datos en su distribucin respecto de la
media aritmtica de dicha distribucin, con objeto de tener una visin de los mismos ms acorde con la
realidad a la hora de describirlos e interpretarlos para la toma de decisiones.
Formulacin
La varianza representa la media aritmtica de las desviaciones con respecto a la media que son elevadas al
cuadrado.
Si atendemos a la coleccin completa de datos (la poblacin en su totalidad) obtenemos la varianza
poblacional; y si por el contrario prestamos atencin slo a una muestra de la poblacin, obtenemos en su
lugar la varianza muestral. Las expresiones de estas medidas son las que aparecen a continuacin.
Expresin de la varianza muestral:

Expresin de la cuasivarianza muestral (estimador insesgado de la varianza poblacional):

Expresin de la varianza poblacional:

donde es el valor medio de {X
i
}

Expresin de la desviacin estndar poblacional:

El trmino desviacin estndar fue incorporado a la estadstica por Karl Pearson en 1894.
Por la formulacin de la varianza podemos pasar a obtener la desviacin estndar, tomando la raz cuadrada
positiva de la varianza. As, si efectuamos la raz de la varianza muestral, obtenemos la desviacin tpica
muestral; y si por el contrario, efectuamos la raz sobre la varianza poblacional, obtendremos la desviacin
tpica poblacional.


Desviaciones estndar en una distribucin normal.
Expresin de la desviacin estndar muestral:

Tambin puede ser tomada como

con a como y s como ademas se puede tener una mejor tendencia de medida al desarrollar
las formulas indicadas pero se tien eque tener en cuenta la media, mediana y moda
Interpretacin y aplicacin
La desviacin estndar es una medida del grado de dispersin de los datos con respecto al valor promedio.
Dicho de otra manera, la desviacin estndar es simplemente el "promedio" o variacin esperada con respecto
a la media aritmtica.
Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus
desviaciones estndar son 8.08, 5.77 y 1.15, respectivamente. La tercera muestra tiene una desviacin mucho
menor que las otras dos porque sus valores estn ms cerca de 7.
La desviacin estndar puede ser interpretada como una medida de incertidumbre. La desviacin estndar de
un grupo repetido de medidas nos da la precisin de stas. Cuando se va a determinar si un grupo de medidas
est de acuerdo con el modelo terico, la desviacin estndar de esas medidas es de vital importancia: si la
media de las medidas est demasiado alejada de la prediccin (con la distancia medida en desviaciones
estndar), entonces consideramos que las medidas contradicen la teora. Esto es coherente, ya que las
mediciones caen fuera del rango de valores en el cual sera razonable esperar que ocurrieran si el modelo
terico fuera correcto. La desviacin estndar es uno de tres parmetros de ubicacin central; muestra la
agrupacin de los datos alrededor de un valor central (la media o promedio).
Desglose
La desviacin estndar (DS/DE), tambin llamada como desviacin tpica, es una medida de dispersin
usada en estadstica que nos dice cunto tienden a alejarse los valores puntuales del promedio en una
distribucin. De hecho, especficamente, la desviacin estndar es "el promedio de la distancia de cada punto
respecto del promedio". Se suele representar por una S o con la letra sigma, .
La desviacin estndar de un conjunto de datos es una medida de cunto se desvan los datos de su media.
Esta medida es ms estable que el recorrido y toma en consideracin el valor de cada dato.
Es posible calcular la desviacin estndar de una variable aleatoria continua como la raz cuadrada de la
integral

donde

La DS es la raz cuadrada de la varianza de la distribucin

As la varianza es la media de los cuadrados de las diferencias entre cada valor de la variable y la media
aritmtica de la distribucin.
Aunque esta frmula es correcta, en la prctica interesa realizar inferencias poblacionales, por lo que en el
denominador en vez de n, se usa n-1 (Correccin de Bessel)

Tambin hay otra funcin ms sencilla de realizar y con menos riesgo de tener equivocaciones :

Ejemplo
Aqu se muestra cmo calcular la desviacin estndar de un conjunto de datos. Los datos representan la edad
de los miembros de un grupo de nios. { 4, 1, 11, 13, 2, 7 }
1. Calcular el promedio o media aritmtica .
.
En este caso, N = 6 porque hay seis datos:






i=nmero de datos para sacar desviacin estndar
Sustituyendo N por 6


Este es el promedio.

2. Calcular la desviacin estndar

Sustituyendo N - 1 por 5 ( 6 - 1 )
Sustituyendo por 6,33






ste es el valor de la desviacin estndar.

Varianza
La varianza, tambin denominada variancia (Aunque esta denominacin es menos elegida) es una medida
estadstica que mide la dispersin de los valores respecto a un valor central (media), es decir, la media de las
diferencias cuadrticas de las puntuaciones respecto a su media aritmtica. Suele ser representada con la letra
griega o una V en mayscula.


Propiedades
La varianza es siempre positiva o 0:
Si a los datos de la distribucin les sumamos una cantidad constante la varianza no se modifica.
Y
i
= X
i
+ k c

Si a los datos de la distribucin les multiplicamos una constante, la varianza queda multiplicada por
el cuadrado de esa constante.


Propiedad distributiva: V(X + Y) = V(X) + V(Y)
Desviacin tpica
La variancia a veces no se interpreta claramente, ya que se mide en unidades cuadrticas. Para evitar ese
problema se define otra medida de dispersin, que es la desviacin tpica, o desviacin estndar, que se
halla como la raz cuadrada positiva de la varianza. La desviacin tpica informa sobre la dispersin de los
datos respecto al valor de la media; cuanto mayor sea su valor, ms dispersos estarn los datos. Esta medida
viene representada en la mayora de los casos por S, dado que es su inicial de su nominacin en ingls.
=== Desviacin tpica muestral ===
Desviacin tpica poblacional

Ejemplo [editar]
Con Scilab este clculo se hace de la siguiente manera:
-->x= [17 14 2 5 8 7 6 8 5 4 3 15 9]
x =

17. 14. 2. 5. 8. 7. 6. 8. 5. 4. 3. 15. 9.

-->stdev(x)
ans =

4.716311

-->
Primero hemos declarado un vector con nombre X, donde introduzco los nmeros de la serie. Luego con el
comando stdev se hallar la desviacin tpica.


Covarianza
La covarianza entre dos variables es un estadstico resumen indicador de si las puntuaciones estn
relacionadas entre s. La formulacin clsica, se simboliza por la letra griega sigma () cuando ha sido
calculada en la poblacin. Si se obtiene sobre una muestra, se designa por la letra "s_{xy}".
La formula suele aparecer expresada como:

Este tipo de estadstico puede utilizarse para medir el grado de relacin de dos variables si ambas utilizan una
escala de medida a nivel de intervalo/razn (variables cuantitativas).
La expresin se resuelve promediando el producto de las puntuaciones diferenciales por su tamao muestral
(n pares de puntuaciones, n-1 en su forma insesgada). Este estadstico, refleja la relacin lineal que existe
entre dos variables. El resultado numrico fluctua entre los rangos de +infinito a -infinito. Al no tener unos
lmites establecidos no puede determinarse el grado de relacin lineal que existe entre las dos variables, solo
es posible ver la tendencia.


Ejemplo [editar]
Tenemos una tabla con dos datos (x y h), elaboramos su tabla de frecuencias (fre)
-->x=[10 20 30 40] Vector de datos X
x =

10. 20. 30. 40.

-->y=[10 20 30 40] Vector de datos H
y =

10. 20. 30. 40.

-->fre=[.20 .04 .01 0; Matriz de frecuencias
--> .10 .36 .09 0;
--> 0 .05 .10 0;
--> 0 0 0 .05]
fre =

0.2 0.04 0.01 0.
0.1 0.36 0.09 0.
0. 0.05 0.1 0.
0. 0. 0. 0.05

-->s=covar(x,y,fre) Aplicacin del Comando covar
s =

49.

Coeficiente de Correlacin de Pearson
El coeficiente de correlacin de Pearson, r, permite saber si el ajuste de la nube de puntos a la recta de
regresin obtenida es satisfactorio. Se define como el cociente entre la covarianza y el producto de las
desviaciones tpicas (raz cuadrada de las varianzas).

Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos
expresiones siguientes:



Propiedades [editar]
El coeficiente de correlacin, r, presenta valores entre 1 y +1.
Cuando r es prximo a 0, no hay correlacin lineal entre las variables. La nube de puntos est muy
dispersa o bien no forma una lnea recta. No se puede trazar una recta de regresin.
Cuando r es cercano a +1, hay una buena correlacin positiva entre las variables segn un modelo
lineal y la recta de regresin que se determine tendr pendiente positiva, ser creciente.
Cuando r es cercano a -1, hay una buena correlacin negativa entre las variables segn un modelo
lineal y la recta de regresin que se determine tendr pendiente negativa: es decreciente.

Ejemplo
Tenemos una tabla con dos datos (x y h), elaboramos su tabla de frecuencias (fre)
-->x=[2.5 7.5 12.5 17.5] Vector de datos X
x =
2.5 7.5 12.5 17.5
-->h=[0 1 2] Vector de datos H
h =
0. 1. 2.
-->fre=[.03 .12 .07;.02 .13 .11;.01 .13 .14;.01 .09 .14] Matriz de frecuencias
fre =
0.03 0.12 0.07
0.02 0.13 0.11
0.01 0.13 0.14
0.01 0.09 0.14