You are on page 1of 16
MEDIDAS DE DISPERSION Las medidas de tendencia central (x;M.3 Mj; My; M,) no son suficientes para describir a un conjunto de datos ; es decir, para completar el analisis, se debe tener una idea del grado de concentracion o disposici6n de las observaciones alrededor de un valor central o de posicioén, por lo que resulta necesario incluir medidas de disposicién como por ejemplo la varianza representa por S? 0 o” yladesviacion estandar ie, | Soo. eg eb VARIANZA MUESTRAL Una vez determinado el promedio de un grupo de datos , nuestra busqueda de informacion se dirige de inmediato a una medida de dispersion. Por ejemplo que los datos son 3;4;3;5;8 y 7. La disposicion o variabilidad que existe entre ellos se puede cuantificar al restar el minimo valor del maximo valor; esto es , 8 - 3= 5. Esta es una medida de variabilidad basada en los valores extremos del conjunto y, por tanto no informa nada con respecto a la variabilidad en la parte central de los datos. Para desarrollar una medida de variabilidad mas exacta, tomaremos las desviaciones de cada dato con respecto a la media de ellos. En el tenemos: " x | 314] 3 15]8]7] Total x|-2|-1/-2/o/3/2/ 0 Se podria suponer que el promedio de las desviaciones (x, — x) puede funcionar como medida de dispersién; sin embargo, puedes observar que la suma de estas desviaciones es exactamente cero. De hecho , siempre tendra valor cero. ~Por qué?, Revisa la definicién de media para justificar esta afirmaci6on. Es obvio que si esta medida va a ser siempre cero, no sera util para describir un conjunto cualquiera de datos. Observaras que hay una cancelaci6n entre las desviaciones negativas y positivas. Este efecto de cancelacion podria evitarse si todas las desviaciones fuesen positivas. Al elevar al cuadrado todas las desviaciones se tendran siempre valores positivos y , por tanto , cuando se sumen tales valores, el resultado sera Positiy Retornaremos a nuestro ejemplo: x 3 | 4) 3 (5/8) 7 | Total x-x |-2]-1/-2/0]3/2] 0 (x,-x) | 4 [1] 4 lol9l4| 22 Las desviaciones al cuadrado suri 22,el promedio de las desviaciones_al cuadrado es 2 = 3,67 Esta medida es conocida como varianza, se denota por S? y se define como la dispersién de los datos alrededor de la media: k = k a a g?= 1 = F1 — (x) n n La misma formula en datos resumidos en una distribucién de frecuencias es: ¥ vi i Pa n EJEMPLO: Dado: 57600) I 102 500 48 000 | 2 430 000 187 200| 3 932 500 444 000) 7 840 000 Luego, la varianza de los ingresos es: gen ME OO tt 100 Usando la formula reducida, tenemos: 2. 7840 000 40 Estoes: S —(439)*=11 100 En los calculos anteriores de varianza, los resultados se expresan en soles al cuadrado. Por ejemplo, la varianza de los ingresos result6 $?=11100 soles”. £Cémo interpretamos este resultado? La respuesta sera «esto no es interpretable» © «no tiene interpretacion». Pues el problema de la varianza como medida de dispersion no tiene interpretacion debido a que esta expresando en unidades cuadraticas. Este problema de interpretacién se resuelve utilizando la desviacién estandar. DESVIACION ESTAND, (S =+Vvarianza) Se define como la raiz positiva de la varianza. Se denota con la letra S“Ef el ejemplo anterior, la varianza de los ingresos fue 11100 soles’, Entonces, la desviacion estandar es: S = V11 100 nuevos soles” = S/. 105,36 Cuya interpretacion podria ser: “en promedio , el ingreso de una familia difiere del ingreso promedio familiar en S/. 105,36”. Las unidades de medida de la desviacion estandar son iguales a las unidades de medida de los datos. Si por ejemplo, los datos estan en kilogramos, entonces la desviacién estandar S también en kilogramos, y mientras mayor sea el valor de S 0 S?, mayor sera la dispersién de los datos. a OBSERVACIONES: * Cuando los valores tienden a concentrarse alrededor de su media la varianza sera pequefia, si los valores tienden a distribuirse lejos de la media, Ja varianza sera grande. ik * No olvides que, por definicion, tanto la varianza como la desviacion estandar son dos valores positivos. * $2 y S son ambas medidas de dispersion, la diferencia radica en que S? esta acompafiada de las unidades originales elevadas al cuadrado, mientras que S esta acompafiada de las unidades originales. Por decir, si se calcula S? de un grupo de datos expresados en metros, y resulta $7=1,45, lo correcto es : $7=1,45m7, mientras que para la desviacion estandar se tiene que decir: $= 1,45 m = 1,2041m Un problema que se plantea, tanto la varianza como la desviacion estandar, especialmente a efectos de comparaciones entre distribuciones, es el de la dependencia respecto a las unidades de medida de la variable. Cuando se quiere comparar el grado de dispersion de dos distribuciones que no vienen dadas en las mismas unidades 0 que las medias no son iguales se utiliza el llamado «Coeficiente de Variacion de Pearson», del que se demuestra que nos da un numero independiente de las unidades de medidas empleadas, por lo que entre dos distribuciones dadas diremos que posee menor dispersion aquella cuyo coeff de variacion sea menor., y que se como la relaci6n por cociente entre’ la desviacion estandar y la media aritmética; o en otras palabras es la desviacioén estandar expresada como porcentaje de la media aritmética. COEFICIENTE DE VARIACION (C.V.) Es una medida de dispersion relativa (libre de unidades de medida), que se define como la desviacién estandar dividida por la media aritmética: : 6 cv.=$100% CV.= x El C.V. es una medida muy util para comparar la variabilidad de dos o mas conjunto de datos que tengan unidades de medida y/o distinta : aritméticas. Su utilidad estriba en que nos péarrflite comparar la dispersién o variabilidad de dos o mas grupos. Asi, por ejemplo, si tenemos el peso de 5 pacientes (70;60; 56; 83 y 79 kg) cuya media es de 69,6kg. y su desviaci6n tipica (s)=10,44 y la TAS de los mismos (150 ; 170 ; 135 ; 180 y 195 mmHg) cuya media es de 166 mmHg y su desviacion tipica de 21,3. La pregunta seria: ¢.qué distribucion es mas dispersa, el peso o la tensi6én arterial? Si comparamos las desviaciones tipicas observamos que la desviacion tipica de la tension arterial es mucho mayor; sin embargo, no podemos comparar dos variables que tienen escalas de medidas diferentes, por lo que calculamos los coeficientes de variacién: 10,44 _ 69.6 CV de la variable peso = 4 21,30 66 Ala vista de los resultados, observamos que la variable peso tiene mayor dispersion. CV de la variable TAS = =12,8% Cuando los datos se distribuyen de foritia simétrica (y ya hemos dicho que esto oourre cuando los valores de su media y mediana estan préximos), se usan para describir esa variable su media y desviacién tipica. En el caso de distribuciones asimétricas, la mediana y la amplitud son medidas mas adecuadas. En este caso, se suelen utilizar ademas los cuartiles y percentiles. Los cuartiles y percentiles no son medidas de tendencia central sino medidas de posici6én. El percentiles el valor de la variable que indica el porcentaje de una distribucién que es igual © menor a esa cifra. Asi, por ejemplo, el percentil 80 es el valor de la variable que es igual o deja por debajo de si al 80% del total de las puntuaciones. Los cuartiles son los valores de la variable que dejan por debajo de si el 25%, 50% y el 75% del total de las puntuaciones y asi tenemos por tanto el primer cuartil (Q,), el segundo (Q,) y el tercer cuartil (Q,). NOTA: El coeficiente de variacién es comun en varios campos de la probabilidad aplicada, como Teoria de renovacién, Teoria de colas y. En estos campos la distribucién exponencial es a menudo mas importante que la distribucién normal. La desviacién tipica de una distribucién exponencial es igual a su media, por lo que su coeficiente de variacion es 4 La distribuciones con un CV menor que uno, como la distribucion de Erlang se consideran de «baja varianza», mientras que aquellas con un CV mayor que uno, como la distribucién hiperexponencial se consideran de «alta varianza. Algunas formylas en estos campos se expresan usando el oti del coeficiente de variacion, abreviado co (por su siglas en inglés). —_ PROBLEMA? : Determine la Varianza de los siguientes datos: x; | fj 2 /10 4 |20 7 |30 9 | 20 A)4 B)S C)2,25 —OD) 2,368 E) 5,609 RESOLUCION: x | fi | Xf | x? et 2 |10 | 20 4 | 20 | 80 7 |30/210 De latabla: [9 | 20 | 180 pao S _ SO 8s e188 i 80 2 4s: =X; f, _ 3450 Ademas: » Xj =e" = 43,125 n 80 Luego la varianza: x? > S?= 43,125 - (6,125)” gt. ES fi 2 n +a & RPTA.“e™ PROBLEMA 18 : Las notas de un examen fueron 10; 12; 15; 16; 17. Determinar la desviacién standard de los numeros. A)24 B)25 C)26 D)27 E28 RESOLUCION: —_104+12+15+16+17 pe al Se forma la tabla: x | (=x) (x -x/? 10 | 10-14 = -4 | (-4)? =16 12 |12-14=-2] (-2)?7=4 15| 15-14=1 P=1 16| 16-14=2 | 27=4 17| 17-14=3 | 3?=9 Varianze x), an 1644144 = desviacion standard : Vo? = 6,8 = 2, RPTA.,4C” tambi tiliza: ee ambien se utiliza sae X(x;) = (x PROBLEMA 19: éQué tanto por ciento de los numeros 1; 2; 3; 4; 5; 6; 8; 10; 11; 12; 18 y 22 estan Comprendidos en el _ intervalo (x-0; X+0)? A)65,6 B)66,3 C)66,6 D)67,3 E)67,6 RESOLUCIO! Calculando x : qa tt2+3 44454648410 411412418422 12 =x =8,5 Luego se determina: Wx}? _ 17427432447 452467487 410741 1412741874227 n 12 2 = 2% = = 1328 -110,6 a, Aplicando : o*= - —(x? => 07=110,6 — (8,5)?=38,42 =o = /38,42=6,2 >< K-G)K+5> =< 8,5 —6,2;8,5+6, Msi = <2,3;14,7> ~ Los datos que se encuentran en <2,3;14,7> son: 3; 40;14;12 8 datos % de datos 4 *100%=66,6% RPTA: “Cc” PROBLEMA 20 : Indicar el valor de verdad de las siguientes proposiciones: 1) La mediana es la medida promedio que depende del numero de datos ordenados y no de los valores de estos datos. Il) La moda es la medida de tendencia central, que sefiala el valor mas comun de una serie de datos. Ill) Si los datos tienden a distribuirse alrededor de su media, la varianza sera pequefia. A)VVV_ B)VFV C)FFV D)VVF E)FVV RESOLUCION: 1) FALSA : La mediana es el valor que divide al conjunto de datos en dos partes con igual cantidad de datos en cada parte, depende de los valores de estos datos. EJEMPLOS: 759;10;14;15;15 om, =10441 6 datos =10,5 7;10;12;12;13;17 > M, =12*12 5 6 datos 2 fl PAA Il) VERDADERA III)VERDADERA: La varianza (o?)es una mediana de dispersi6n que sefiala como se distribuyen los datos alrededor de la media , mientras menor sea su valor los datos se concentran mas alrededor de su medio. RPTA: “E” PROBLEMA 21: Indique verdadero (V) o falso (F). 1) La desviaci6n standard es la raiz cuadrada de la varianza. Il) La varianza es un medida de tendencia central. Ill) La moda y la mediana de los valgres 1; 1; 2; 5; 4; 5; 6; 7; 5; 9; 8; 1 poseen el mismo valor. A)FFF B)FFV C)FVW D)WF_ E) VF RESOLUCION: teen I)VERDADERO : desviacién standard: o=/varianza Il) FALSO : la varianza es una medida de dispersion Il) VERDADERO: = ordenando los datos: 1;1;2;4;5;5 ;5;6;7;8;9;10;10 a es 6 datos i 6 datos M/=5 Dato que mas se repite : M,=5 donde M.=M,=5 RPTA: “E” PROBLEMA 26 : De la tabla: x, | F, 2/10 4 | 30 7 | 60 9 | 80 Calcular la desviacién estandar. A) 2,15 B) 2,36 C) 3,25 D) 4,62 ; E) 5,61 RESOLUCION: = —2 x | | A | x | 0G —x)? [0 -%) fi 1 10|10/ 20 | 17,01 170,16 30 20/ 80 4,52 90,31 60 | 30/210| 0,77 22,97 80 | 20/180) 8,27 165,31 xX =6,125 orn] BP] yD o = 5,61 = 2,36 rpTa: Hg ee 1 a o? = E(x; — x) E) 1,432 50 D) 3,465 2 C)2,4 + 1,952 B21112+1128 135 18 E)15y = ‘Solucion: Rpta: B A)S/15 B)S/12 C)S/16 D)S/10 E) S/20 om=s9 ,n=12, Datos x: 9,7,11,12,9,12 5 Peg anal : beets aE ricBE ag

You might also like