Calculo de los diferentes indicadores de Tendencia Central y Dispersión, cuando se

tiene 30 o menos datos.
Ejemplo.
UE: Curso semestral que se dictó en el periodo académico 1997 – I, en la EAPE de la
FCM de la UNMSM.
Conjunto de unidades de Observación: Todos los cursos semestrales, dictados en el
Periodo Académico 1997 - I
Variable: Porcentaje de avance del curso(X).
Tipo de variable: cuantitativa continua.
Conjunto de datos: Constituyen los datos poblacionales
{ 45 40 50 50 55 45 40 48 48 45 50 48 50 40 45 48 48 45}
Cómo estos datos, son datos poblacionales y N < 30, entonces las fórmulas a utilizar
para hallar los indicadores son los siguientes:

Indicadores Tendencia Central
1. Media Aritmética
18



x

i

i1

18

 46.6%

(Observación: el símbolo porcentaje es la unidad de la

variable)
2. Mediana.
- Ordenamos los datos de menor a mayor
40 40 40 45 45 45 45 45 48  48 48 48 48 50 50 50 50 55
- Cómo el número de datos es par, entonces el valor de la mediana estará dado
por la semisuma de los datos centrales.
Luego. Me = 48%
3. Moda.
Existen varias modas, porque varios de los datos diferentes se repiten, por lo
tanto no tiene sentido considerar este indicador.

Indicadores de dispersión.
1. Longitud de recorrido.
LoR = 55 - 40 = 15%
2. Desviación Media.
18

DeM 

x
i 1

i



=

18

Lic. María A. Zacarías Díaz
Página 43
u = 46.6 %

xi

xi  

40
40
40
45
45
45
45
45
48
48
48
48
48
50
50
50
50
55

6.6
6.6
6.6
1.6
1.6
1.6
1.6
1.6
1.4
1.4
1.4
1.4
1.4
3.4
3.4
3.4
3.4
8.4
56.8

3.15 %

10 datos

6 -1.4 1.56 2. 3.4 1.96 1.56 2.  x  X  N X  2 i i1 2 (a) N Esta fórmula es equivalente a: N X2  x N 2 i i1  N x 2  X  xi i 1 N  2 i X2  N X N N  X 2 (b) Por lo tanto.56 2. Varianza.6 -6.56 2. Cálculos según (a) Cálculos según (b) xi ( xi   ) ( xi   ) 2 xi xi2 40 40 40 45 45 45 45 45 48 48 48 48 48 50 50 -6.4 3.6 -1. Observando la columna de las desviaciones. Zacarías Díaz Página 44 .96 11.56 11.96 1. María A. Para el ejemplo utilizaremos las dos fórmulas.6 -1.4 1.6 -6.96 1.56 1.96 1.4 3.6 -1.4 1.56 43.6 1.15 o lo que es equivalente a que el 55% de los datos se aleja de la media en menos de 3.6 -1.Interpretación. el valor de la varianza puede ser obtenido a partir de las fórmulas (a) o (b).56 43.56 40 40 40 45 45 45 45 45 48 48 48 48 48 50 50 1600 1600 1600 2025 2025 2025 2025 2025 2304 2304 2304 2304 2304 2500 2500 Lic. xi   .15 lo que podríamos interpretar como que los datos no están muy dispersos.56 2.4 43. tenemos que 10 datos se alejan de la media en menos de 3.

6 %  X2  50 50 55 840 270. 5. María A.56 11. 4.08  15.4 8. en el caso de analizar un solo grupo de datos y dado que la dispersión es un factor importante para elegir que promedio usar (y teniendo cuidado que la media no este cercana a 0). Si tuviera que compararse dos o más conjuntos de datos.56 70. desviación media.4 3. Zacarías Díaz Página 45 .217 % 2 18 El valor de la varianza calculada a partir de la fórmula (b) proporciona un valor aproximado de ella.4 11. (No tiene unidades) Uso del coeficiente de variación Aunque fundamentalmente el coeficiente de variación se utiliza en la "comparación" de dos o más conjuntos de datos (para saber cuál es más disperso o menos disperso). podemos tomar en consideración lo siguiente: Sí el 0<CoV<15% los datos presentan poca dispersión 15%<CoV<25% los datos presentan regular dispersión 25%<CoV los datos presentan bastante dispersión Nota.004 % 2 18  X2  39470  (46. Coeficiente de Variación. CoV = 0. puede hacerse en términos de los indicadores de dispersión absoluta (si los conjuntos de datos están expresados en las mismas unidades) Lic. varianza y desviación estándar son llamados indicadores de dispersión absoluta ya que están expresados en términos de las unidades de la variable en estudio.083 Al coeficiente de variación se le considera como un indicador de dispersión relativa.6 % Los indicadores de dispersión: longitud de recorrido.50 50 55 840 3.874 %  X  4. Desviación estándar.08 2500 2500 3025 39470   840 /18  46.56 270.6 %   840 /18  46.6) 2  21.  X  3.

es decir hay un ligero atraso.6 1 0.2 6 0. se elige la media aritmética como indicador de tendencia central. Previo al cálculo de los indicadores de tendencia central y dispersión.6% 48% -  LoR 15% Dispersión  DeM 2 3.15 % 21. Calculo de los diferentes indicadores de Tendencia Central y Dispersión. Conjunto de datos.1 0. 2003 – I. es decir. Tipo de variable cuantitativa continua. se construye la tabla de frecuencias y el polígono de frecuencias. María A. Ejemplo La profesora del curso de estadística I.7 4 0. constituyen la población de individuos. dado qué.7 7 0.6 5 0. como no existe mucha diferencia entre el valor de la media y el valor de la mediana.6 % a mitad del periodo académico. Zacarías Díaz Página 46 . en la mayoría de los cursos el avance del Silabo está en torno al 46.21% 4.3 2 0 0. para posteriormente ver si hubo o no relación con la nota que obtuvieron. Los datos se dan a continuación: 0. CoV 0.61%.6 1 0. la varianza y la desviación estándar y el coeficiente de variación.2 6 0. Variable: Porcentaje de asistencia a clases (X).099 nos dice que la dispersión de los datos es baja.7 1 0.6 1 0. UE: El alumno del curso de Estadística I del grupo 4 del Período Académico 2003-I.5 5 0. Cálculo de la media aritmética. ahora observamos los indicadores de tendencia central.1 3 0. FCM.3 5 0.7 1 0.1 0.0 6 0.4 8 0.4 2 0. Conjunto de individuos: todos los alumnos del grupo 4.099 Interpretación.0 6 0. constituyen los datos poblacionales.8 4 0. el observar el comportamiento de la variable ayuda a visualizar la tendencia central Lic.8 1 0. entonces las fórmulas a utilizar para hallar los indicadores son los siguientes: 1.6 5 0.4 5 0.6 8 0.CUADRO RESUMEN Tendencia Central Me Mo 46. de la EAPE de la FCM.5 5 0.7 1 0. de la EAP de Estadística.1 6 0. al finalizar el semestre obtiene el porcentaje de asistencia de cada uno de sus alumnos. generalmente.7 4 0.7 4 0. son datos poblacionales y N > 30. grupo 4 Sem. cuando se tiene más de 30 datos.3 9 0. luego concluimos que la mayoría de los datos están en torno a la medía.2 3 0.1 9 0.7 4 0.5 5 Cómo estos datos. El CoV = 0.

58 0. '  Xi .58 0.87 7.19 0.71 b.33 0.0.5 c. María A.255 0.32 0.20 0.71 - 0.5% 2 = 0. Cálculo de la mediana.46 0.0.0.125 0.505 X ' i 1 0.775 6 4 4 5 6 10 Las fórmulas a utilizar para el cálculo de la media y la varianza son: 1 X  N m  X i fi  i 1 1  N  Xi    fi 0 Xi Xi fi Xif i 0.00625 10. a.6 0.2601 0.515 0.02 1.0577222 %2   2 X X i 1 2 i i N X i f 2i f  2 0.54 2.0.326125 2.' X i 1  X 'i 0.19 .59 0.71 - Luego:  0.255 0.49615 6.0.19 0.45 0.385 0.0.58 . Se construye la tabla de frecuencias acumuladas ( absolutas o relativas) ' X i 1 0.775275  = 0.7 0.645 0.2403 % CoV = 2.45 0. la menor frecuencia absoluta acumulada que supere a N/2. para el ejemplo es: Lic.32 0.5929 1.385 0.645 0.45 0. Zacarías Díaz Página 47 .09375 0.515 0.71 .32 .125 0.32 0.71 .75 1. Se busca en la tabla de frecuencias construida.0.775 6 4 4 5 6 10 35 0. Procedimiento.19 0.71 .48037 2 m 2 ' = 0.84 Fi 6 10 14 19 25 35 Se halla N/2 = 17.84 0.575 3.0.58 0.6 0.58 0.45 .45 0.32 0.19 0.84 Xi fi 0.75 17.

5N  F3  ` Utilizando la fórmula.25 nos dice que los datos están muy dispersos.d.775 en torno a los cuales se acumulan los datos es decir existen 2 modas. siempre es conveniente complementar el análisis con la representación gráfica de la distribución de los datos o comportamiento de la variable.125% Mo2 0. 0125 y 0. Cálculo de la moda. aparentemente están cerca el uno del otro.24% CoV 0. El comportamiento de la variable nos muestra la presencia de dos valores más frecuentes es decir dos Modas. Zacarías Díaz Página 48 Nombre de la Porcentaje de .5.775% Cuadro de las medidas resumen Tendencia central  Me 0.48 Interpretación. a esta cuarta frecuencia acumulada le corresponde el cuarto intervalo. que no basta contar con los indicadores. por lo que la media aritmética ni la mediana no son los adecuados para representar a los datos.45 + 0. El coeficiente de Variación.541 % 3. como es superior a 0.13( 17. DESVIACIÓN TIPICA O ESTANDAR. por ello es preferible utilizar otra medida de dispersión y esta es la desviación típica o estándar que se define como la raíz cuadrada positiva de la varianza. F 4 = 19 > 17.  0. CoV.45 . Me = 0. en este intervalo se encontrara el valor de la mediana. que no tiene significado real. La varianza se expresa en unidades que son el cuadrado de la unidad de la variable. Mo1 = 0. pero al observar la tabla de frecuencias y el polígono de frecuencias vemos que hay dos valores frecuentes. Me  X 3  A4 .541% Mo1 0.5 – 14)/ (19 – 14) = 0. Las categorías y el porcentaje son las siguientes: Valores de la Lic. obtenemos el valor de  F4  F3  la mediana.125 % Mo2 = 0.0577%2 0.0.   2 Cuando el polígono de frecuencias es simétrico o casi simétrico.775% Dispersión  LoR 2 0. y al ver los valores de tendencia central la media y la mediana estos son diferentes.5 % 0. María A. la desviación estándar permite clasificar a las unidades estadísticas en cinco categorías e indicar el porcentaje de individuos de cada categoría. Del análisis hecho al problema anterior concluimos.78% 0. es decir [ 0.58).

21 55. debido a que el polígono es casi simétrico no es simétrico y porque son pocos los datos.82 60. Estad.43 Nombre de la Categoría Avance muy bajo Avance bajo Avance regular Avance Alto Avance muy alto Porcentaje de cursos Ningún curso 16. por lo tanto. donde μ = 46.43 43 .5 68 13.99 51. y en cuanto al porcentaje de cursos dentro de cada categoría.55 Total Cursos 3 5 5 4 1 18 Que.5 Ejemplo. El siguiente cuadro estadístico y gráfica muestran Distribución de los cursos de acuerdo al porcentaje de avance Porcentaje de avance 40 .38 41.5 2.7 5.5 13.82 - 37.6 % y σ = 4.77 37. En este caso la variable es: Porcentaje de avance de los cursos.5 Ningún curso Podemos observar que no hay ningún curso cuyo avance sea calificado como muy bajo o muy alto.46 46 .52 52 .21 55. difiere en cuanto a lo establecido.49 49 . podemos aplicar las propiedades de la desviación estándar. Lic. 2.99 51.38 41. Zacarías Díaz Página 49 .variable   3   2     2         2   2   3 categoría Muy malo Malo Regular Bueno Muy bueno Unid.6 77. la distribución de los datos es casi simétrica. María A.61 % Porcentaje de avance 32.

5 X 2 Ejemplo.VARIABLES ESTANDARIZADAS O TIPIFICADAS Los datos de una variable pueden tomar varias apariencias numéricas. la media aritmética y la varianza con cada una de las unidades sea diferente. un dato xi se aleja de X su media en términos de su desviación estándar. Nota x = 11 puntos En unidades estándar: z x   X 11  10   0. Zacarías Díaz Página 50 13 13 Varianza 9 4 . en cuánto. los cuales están divididos en dos grupos Grupo Nota media 1 2 Lic. Una variable estandarizada se denota con Z y su definición es: X  X Z X Donde:  X es la media y  X es la desviación estándar de X xi   X Esta definición indica que un dato. de todos los alumnos del curso. las medias y las varianzas serán iguales en una u otra unidad. zi  . Un alumno obtuvo 11 de nota ¿En unidades estándar a cuanto equivale su nota? Rpta. dependiendo de la unidad en la cual es medida. La siguiente tabla muestra información estadística. Por ejemplo si se registra el ingreso de los trabajadores en soles o dólares. pero si se da en su forma estandarizada. La media y varianza de Z son: X  X 0 Media de Z es:  Z  X Varianza de Z es:  Z2   X2 1  X2 Ejemplo La nota media y la varianza del primer examen parcial del curso de cálculo I de un grupo de estudiantes es:  X = 10 puntos  X2 = 4 puntos2 Donde X: Nota de cálculo I. lo que da lugar a que. María A. mide. respecto a las notas del primer examen parcial del curso de Estadística.

0.33 Nota estandarizada de Rosa: zR = (12 . ¿Quién esta en mejor posición? Rpta. Lic.El alumno Juan obtuvo 12 puntos y pertenece al grupo 1. y la alumna Rosa también obtuvo 12 puntos y pertenece al grupo 2. Zacarías Díaz Página 51 . Nota estandarizada de Juan: z J = (12 . entonces Juan esta en mejor posición. María A.0.13) / 3 = .13) / 2 = .5 Comparando estas notas estandarizadas. que la nota de Rosa es menor que la nota de Juan.