MEDIDAS DE DISPERSIÓN La sección anterior estuvo dedicada al estudio de algunas medidas de tendencia central.

Con mucha frecuencia, resulta de igual importancia describir la forma en que las observaciones están dispersas o diseminadas, a cada lado del centro. A estas medidas se les conoce en general como medidas de dispersión, variación o variabilidad. En esta sección se estudian las medidas comúnmente empleadas para describir la dispersión de las observaciones. La medida de dispersión es importante debido a que dos muestras de observaciones con el mismo valor central pueden tener una variabilidad muy distinta. La variabilidad de cualquier distribución se contempla generalmente en términos de la desviación de cada valor observado (X) con respecto a la media muestral :

X

Si las desviaciones:

(X − ) X

son pequeñas, obviamente los datos son están menos dispersos, que si las desviaciones son grandes. Entonces, la desviación proporciona información acerca del grado de dispersión en una muestra. A fin de que la variabilidad pueda ser medida resulta necesaria una fórmula basada en tales desviaciones.Sería de esperarse que el promedio de éstas serviría para este fin, pero esto es imposible debido a que algunas de las desviaciones son negativas, algunas positivas y la suma de todas las desviaciones es igual a cero. Una solución posible a este problema consiste en calcular el promedio de desviaciones. DEFINICIÓN: El promedio de desviaciones PD (o desviación promedio) es la media aritmética de los valores absolutos de las desviaciones a partir de la media.

OBSERVACIONES NO AGRUPADAS: Si X1, X2, ..., Xn forman una muestra de n observaciones, la expresión para calcular el promedio de desviaciones es:

PD =

∑X
i =1

n

i

−X

n

en donde | | significa que los signos de las desviaciones no se toman en cuenta. OBSERVACIONES AGRUPADAS: Si las X1, X2, ..., Xn observaciones ocurren con frecuencias respectivas: f1, f2, ... , fk, la expresión para calcular el promedio de desviaciones es:
k − ∑ X j −X f j j= 1 PD = k ∑ f j j= 1

EJEMPLO: Calcule el promedio de desviaciones de los siguientes conjuntos de observaciones: a) Observaciones sin agrupar: xi : 0.49, 0.56, 0.53, 0.58, 0.48, 0-46, 0.41, 0.50, 0.40, 0.33

PD =

∑X
i =1

10

i

−X =

10

| 0.49 − 0.474 | + | 0.56 − 0.474 | +...+ | 0.33 − 0.474 | 10

0.592 = = 0.0592 10
b) Observaciones agrupadas: xj : 23 fj : 3 28 42 33 21 38 7 43 3 48 2 53 2 58 2 63 1

PD =

∑X
j =1

9

j

− X fj =
j

∑f
j =1

9

| 23 − 32.6988 | ( 3)+ | 28 − 32.6988 | (42) + ...+ | 63 + 32.6988 | (1) 83

=

452.8916 = 5.4565 83

c) Observaciones agrupadas en una distribución de frecuencias:
Intervalos (3.475, 4.375] (4.375, 5.275] (5.275, 6.175] (6.175, 7.075] (7.075, 7.975] (7.975, 8.875] (8.875, 9.775] (9.775, 10.625] TOTAL xj 3.925 4.825 5.725 6.625 7.525 8.425 9.325 10.225 -----fj 3 2 7 19 22 13 4 3 73 fr 3/73 2/73 7/73 19/73 22/73 13/73 4/73 3/73 -------Fa(Absolutas) 3 5 12 31 53 66 70 73 -------Fa(Relativas) 3/73 5/73 12/73 31/73 53/73 66/73 70/73 73/73 --------

PD =

∑X
j =1

8

j

− X fj =
j

∑f
j =1

8

| 3.925 − 7.2331 | ( 3)+ | 4.825 − 7.2331 | ( 2) + ...+ | 10.225 − 7.2331 | ( 3) 73

76.1109 = = 1.0426 73
Uno de los defectos más importantes de esta medida es el hecho de que se deban ignorar los signos de las desviaciones. No tomar en cuenta los signos hace que el método no sea algebraico y la medida no resulta conveniente para el manejo matemático. Una forma de vencer esta dificultad consiste en trabajar con los cuadrados de las desviaciones.

DEFINICIÓN: El promedio de desviaciones al cuadrado se le conoce como varianza. Si la varianza de un conjunto de observaciones es grande, se dice que los datos tienen mayor variabilidad que un conjunto de datos que tenga una varianza pequeña. DEFINICIÓN: La desviación estándar(o típica) de un conjunto de observaciones, es la raíz cuadrada positiva del promedio de las desviaciones con respecto a la media elevadas al cuadrado. La fórmula empleada para calcular la varianza y subsecuentemente la desviación estándar, depende de silos datos están agrupados. En primer lugar, se presenta una definición matemática básica del concepto para datos no agrupados y después una forma más conveniente de calcular la varianza y la desviación estándar para tales datos.

OBSERVACIONES NO AGRUPADAS: Sea X una variable aleatoria. Si se selecciona una muestra de n observaciones X1, X2, ..., Xn, entonces la expresión para calcular la varianza de X, representada por el símbolo : s2 , se expresa en la siguiente forma:

s2 =

( X i − X )2 ∑
i =1

n

∑X
i =1

n

=

( X i − X )2 ∑
i =1

n

n

i

y la desviación estándar de X, denotada por s, es:

s=

( X i − X )2 ∑
i =1

n

n

OBSERVACIONES AGRUPADAS: Si en una distribución de frecuencias las observaciones X1, X2, ..., Xn ocurren con frecuencias respectivas: f1, f2, ... , fk, la expresión para calcular la varianza es:

s2 =

∑( X j − X ) f j
2 j =1

k

∑f
j =1

k

=

( X j − X )2 f j ∑
j =1

k

n

j

Generalmente la media muestral se emplea para realizar inferencias acerca de la media de la población, ya que proporciona un buen estimador de esta. De manera semejante, es razonable esperar que la varianza muestral, proporcione un buen estimador de la varianza de la población. Por desgracia, la varianza muestral calculada mediante cualesquier de las fórmulas anteriores tiende a subestimar a la varianza de población, es especial, cuando el tamaño de muestra es pequeño.

Existe otra fórmula para la varianza muestral que proporciona una estimación más precisa de la varianza de la población, esta se conoce como varianza muestral insesgada:
∧2

s

=

( X i −X ) 2 ∑
i= 1

n

n −1

La ecuación de la varianza:

s

2

s difiere de la ecuación sólo en el denominador: n está sustituida por (n - 1). Cuando el tamaño de la muestra (n) es grande estas ecuaciones proporcionan resultados aproximadamente iguales.
Resulta suficiente decir que se utiliza invariablemente esta ecuación para estimar a la varianza de población.

∧2

A partir de las ecuaciones anteriores, podemos establecer la siguiente relación entre ellas:

ns 2 s2 = ( n − 1)
Una fórmula adecuada para el cálculo de la varianza insesgada cuando las observaciones no se encuentran agrupadas es la siguiente:

s =

∧2

∑X i −
i =1

n

( ∑X i ) 2
i =1

n

n

n −1

Finalmente, la fórmula correspondiente para el cálculo de la varianza insesgada, cuando las observaciones se encuentran agrupadas es:
k

s =

∧2

X2j fj − ∑
j= 1

( ∑X j f j ) 2
j= 1

k

n

n −1

EJEMPLO: Calcule la varianza y la desviación estándar de los siguientes conjuntos de observaciones: a) Observaciones sin agrupar: xi : 0.49, 0.56, 0.53, 0.58, 0.48, 0-46, 0.41, 0.50, 0.40, 0.33

s =

∧2

∑X i −
i= 1

10

( ∑X i ) 2
i= 1

10

10 10 −1

22.4676 2.3 − 10 = = 0.005915 10 −1

s = 0.005915 = 0.0769
b) Observaciones agrupadas: xj : 23 fj : 3 28 42 33 21
9

38 7

43 3

48 2

53 2

58 2

63 1

s =

∧2

X2j fj − ∑
j =1

9

(∑ X j f j )2
j =1

83

83 − 1

7,365,796 93,962 − 83 = = 63.6277 82

s = 63.6277 = 7.9767
c) Observaciones agrupadas en una distribución de frecuencias:
Intervalos (3.475, 4.375] (4.375, 5.275] (5.275, 6.175] (6.175, 7.075] (7.075, 7.975] (7.975, 8.875] (8.875, 9.775] (9.775, 10.625] TOTAL xj 3.925 4.825 5.725 6.625 7.525 8.425 9.325 10.225 -----fj 3 2 7 19 22 13 4 3 73 fr 3/73 2/73 7/73 19/73 22/73 13/73 4/73 3/73 -------Fa(Absolutas) 3 5 12 31 53 66 70 73 -------Fa(Relativas) 3/73 5/73 12/73 31/73 53/73 66/73 70/73 73/73 --------

∧2

s =

X2j fj − ∑
j =1

8

(∑ X j f j )2
j =1

8

73

73 − 1

=

3,953.2808 −

278,799.8402 73 = 1.8626 72

s = 1.8626 = 1.3648

Sign up to vote on this title
UsefulNot useful