You are on page 1of 12

Medidas de tendencia central

Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas 1 como medidas de posición. En este caso se incluyen también los cuantiles entre estas medidas. Entre las medidas de tendencia central tenemos:       Media. Media ponderada. Media geométrica. Media armónica. Mediana. Moda.

Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las medidas de posición o medidas de tendencia se usan de acuerdo al tipo de variable que se está observando, en este caso se observan variables cuantitativas.

La media aritmética
La media aritmética es el valor obtenido por la suma de todos sus valores dividida entre el número de sumandos. Por ejemplo, las notas de 5 alumnos en una prueba: niño 1 2 3 4 5 nota 6,0 5,4 3,1 7,0 6,1 ·Primero, se suman las notas: 6,0+5,4+3,1+7,0+6,1 = 27,6 ·Luego el total se divide entre la cantidad de alumnos: 27,6/5=5,52

· La media aritmética en este ejemplo es 5,52 La media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos. Se le llama también promedio o, simplemente, media.
2

el término se refiere generalmente a la media aritmética.La media En matemáticas y estadística una media o promedio es una medida de tendencia central que según la Real Academia Española (2001) «[…] resulta al efectuar una serie determinada de operaciones con un conjunto de números y que. 8. mientras que la última prueba tiene un peso de 50% y las calificaciones respectivas son de 6. tales como la media geométrica. para obtener una suma ponderada. puede representar por sí solo a todo el conjunto».2. dando como resultado la media ponderada. Se obtiene multiplicando cada uno de los datos por su ponderación o peso y luego sumarlos. A continuación se divide la suma ponderada entre la suma de los pesos. que es apropiada cuando en un conjunto de datos cada uno de ellos tiene una importancia relativa (o peso) respecto de los demás datos. en determinadas condiciones. Por ejemplo.4. si las dos primeras pruebas tienen un peso de 30% y 20% respectivamente. Existen numerosos ejemplos de medias . en donde se asigna distinta importancia (peso) a los distintos exámenes que se realicen. Existen distintos tipos de medias. 9. Se puede usar una media ponderada para calcular la nota final de un curso. la media ponderada y la media armónica aunque en el lenguaje común.1 entonces la nota final corresponde a la siguiente media ponderada: Datos: Pesos: Media Ponderada: . una de las pocas propiedades compartidas por todas las medias es que cualquier media está comprendida entre el valor máximo y el valor mínimo del conjunto de datos: Además debe cumplirse que: La media ponderada La media ponderada es una medida de tendencia central.

la media geométrica de 2 y 18 es Otro ejemplo. .. xn la media armónica será igual a: La media armónica resulta poco influida por la existencia de determinados valores mucho más grandes que el conjunto de los otros. x2. La media armónica no está definida en el caso de que exista algún valor nulo. o inverso. 3 y 9 sería Media armónica La media armónica. dados n números x1. para promediar razones.Media geométrica En matemáticas y estadística. de la media aritmética de los recíprocos de dichos valores y es recomendada para promediar velocidades. es recomendada para datos de progresión geométrica. la media geométrica de una cantidad arbitraria de números (por decir n números) es la raíz n-ésima del producto de todos los números. la mediana representa el valor de la variable de posición central en un conjunto de datos ordenados. interés compuesto y números índices. de una cantidad finita de números es igual al recíproco. Así. la media de 1. siendo en cambio sensible a valores mucho más pequeños que el conjunto. Mediana En el ámbito de la estadística. .. Por ejemplo. denominada H. .

si coincide con el valor de una frecuencia acumulada. . la mediana es el valor que ocupa la posición una vez que los datos han sido ordenados (en orden creciente o decreciente). utilizando la siguiente equivalencia: Donde que y son las frecuencias absolutas acumuladas tales . Datos agrupados Al tratar con datos agrupados. Cuando los dos datos que están en el centro de la muestra ocupan las posiciones decir: . Este valor. que ordenados son: . que ordenados son: . si tenemos 5 datos. Se observa que es la amplitud de los intervalos seleccionados para el diagrama. . la mediana es la media aritmética de los dos valores centrales. se calcula a través de semejanza de triángulos en el histograma o polígono de frecuencias acumuladas. Por tanto. Es decir: . b) Si n es par. deja dos ) y otros dos por encima de él ( . . que es la mediana de ese conjunto de datos. si tenemos 6 datos. . . distinguimos dos casos: a) Si n es impar. Por ejemplo. ). => El valor central es el tercero: datos por debajo ( . la mediana de este grupo de datos es la media aritmética de .Datos sin agrupar Sean la mediana como los datos de una muestra ordenada en orden creciente y designando . . . la mediana. Es Por ejemplo. . el valor de la mediana coincidirá con la abscisa correspondiente. y es par. porque éste es el valor central. del intervalo donde se alcanza la mediana y es la abscisa a calcular. . . => Hay dos valores que están por debajo del dato estos dos datos: y otros dos que quedan por encima del siguiente . y son los extremos. interior y exterior. Si no coincide con el valor de ninguna abcisa.

respectivamente. es decir. puede usarse un tipo de indicador que permite apreciar el grado de dispersión o variabilidad existente en el grupo de variantes en estudio. siendo c la amplitud del intervalo. Cuando tratamos con datos agrupados antes de definir la moda. pero no de de la homogeneidad de cada una de los valores con respecto a la medida de tendencia central aplicada. Para obtener la moda en datos agrupados se usa la siguiente fórmula: Donde: = -inferior de la clase modal. al intervalo modal. Si todas las variables tienen la misma frecuencia diremos que no hay moda. que verifiquen que: Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los intervalos anterior y posterior. . la moda es el valor con una mayor frecuencia en una distribución de datos.Moda En estadística. El intervalo modal es el de mayor frecuencia absoluta. Hablaremos de una distribución bimodal de los datos adquiridos en una columna cuando encontremos dos modas. puede servir para tener una idea bastante clara de la conformación. En el caso de las variables con valores que pueden definirse en términos de alguna escala de medida de igual intervalo. dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que encontramos tres modas. = es el delta de frecuencia absoluta modal y la frecuencia absoluta premodal. = Amplitud del intervalo modal Medidas de Dispersión El conocimiento de la forma de la distribución y del respectivo promedio de una colección de valores de una variable. cuando los datos están agrupados. es un punto que divide al intervalo modal en dos partes de la forma p y c-p. La moda. se ha de definir el intervalo modal. = es el delta de frecuencia absoluta modal y la frecuencia absoluta postmodal.

A estos indicadores les llamamos medidas de dispersión. necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes. las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. La dispersión es importante porque:    Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo. Quizá se desee comparar las dispersiones de diferentes muestras. por cuanto que están referidos a la variabilidad que exhiben los valores de las observaciones. Ya que existen problemas característicos para datos ampliamente dispersos. la media. extensión o variabilidad. la posición central es menos representativa de los datos. entonces no habría necesidad de la gran mayoría de las medidas de laestadística descriptiva.  LA DISPERSIÓN. la dispersión. Si los datos se encuentran ampliamente dispersos. y debemos estar en capacidad de describirla. Al igual que sucede con cualquier conjunto de datos. ¿cómo medimos la variabilidad de una distribución empírica?. la variabilidad de los valores de la distribución respecto al valor central. Vamos a considerar sólo algunas . debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas. Las medidas de dispersión cuantifican la separación. Si no se desea tener una amplia dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables. debemos medir también su dispersión. que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras. Para aumentar nuestro entendimiento del patrón de los datos. la mediana y la moda sólo nos revelan una parte de la información que necesitamos acerca de las características de los datos. ya que si no hubiere variabilidad o dispersión en los datos interés. Pero si hay dispersión en la mayoría de los datos. Distinguimos entre medidas de dispersión absolutas. Ya que la dispersión ocurre frecuentemente y su grado de variabilidad es importante.

250 – 50.00 0. de la clase n – lim.835 14.medidas de dispersión absolutas: el rango.873 3 0. Rango para datos agrupados. De la clase 1) Ejemplo: Si se toman los datos del ejemplo resuelto al construir la tabla de distribución de frecuencia de las cuentas por cobrar de Cabrera’s y Asociados que fueron los siguientes: Clases P.043 4 36.080 – 79.458 5 50. la desviación estándar y el coeficiente de variación.27 1.080 57. R = Xmáx. R= (lim. para calcular la media aritmética (promedio de las edades.495 – 93.835 – 36.00 0. a saber: 18.63 0.00 XXX XXX XXX XXX .665 – 65.-Xmín = Xn-X1 Ejemplo: Se tienen las edades de cinco estudiantes universitarios de Ier año. Sup.1.33 10 0.10 22 0..17 30 65. 27.250 29.495 72.) y el mas bajo (X1 ó Xmin) en un conjunto de datos.EL RANGO O RECORRIDO ( R ): Es la medida de variabilidad más fácil de calcular. el rango se define como la diferencia entre el valor más alto (Xn ó Xmax. Rango para datos no agrupados.10 25 0.665 43.910 86. Xi 7.17 fi fr fa↓ fa↑ fra↓ fra↑ 21.420 – 21.83 0.703 5 Total XXX 30 1.33 1. Inf.46 0.23.628 10 0.288 3 79. se tiene que: R = Xn-X1 ) = 34-18 = 16 años Con datos agrupados no se saben los valores máximos y mínimos.. 1. Se aproxima el rango tomando el limite superior de la última clase menos el limite inferior de la primera clase.73 0. Para datos finitos o sin agrupar. Si no hay intervalos de clases abiertos podemos aproximar el rango mediante el uso de los límites de clases.17 19 30 20 16 11 8 5 0.13 14 0.67 0.37 0.54 0. la varianza.34 y 25.M.

De la clase 1) = (93. puesto que no cuenta con los demás valores de la variable. ignorando a los demás valores de la variable. Cuando más lejos están las Xi de su propia media aritmética.49   Propiedades del Rango o Recorrido: El recorrido es la medida de dispersión más sencilla de calcular e interpretar puesto que simplemente es la distancia entre los valores extremos (máximo y mínimo) en una distribución Puesto que el recorrido se basa en los valores extremos éste tiende s ser errático. siempre existe el peligro de que el recorrido ofrezca una descripción distorsionada de la dispersión. tales como X1. Cuando tal cosa sucede. Sup. … .910 – 7. Por tal razón. la varianza es una medida de que tan cerca.. Inf.2.420) = 86. mayor es la varianza. o que tan lejos están los diferentes valores de su propia media aritmética. X2. Y se define y expresa matemáticamente de la siguiente manera: La varianza para datos no agrupados Dado un conjunto de observaciones. No es extraño que en una distribución de datos económicos o comerciales incluya a unos pocos valores en extremo pequeños o grandes. entonces el recorrido solamente mide la dispersión con respecto a esos valores anormales. Ese punto de referencia es la media aritmética de la distribución. de la clase n – lim.    1. cuando más cerca estén las Xi a su media menos es la varianza.El rango de la distribución de frecuencias se calcula así: R= (lim. La principal desventaja del recorrido es que sólo esta influenciado por los valores extremos. En el control de la calidad se hace un uso extenso del recorrido cuando la distribución a utilizarse no la distorsionan y cuando el ahorro del tiempoal hacer los cálculos es un factor de importancia.. la varianza denotada usualmente por la letra minúscula griega δ (sigma) elevada al cuadrado (δ2)y en otros . Más específicamente.LA VARIANZA (S2 ó δ2 ): La varianza es una medida de dispersión relativa a algún punto de referencia. Xn.

4 (27 – 25.76 (-0. y 34. se obtuvo 25.4 (23 – 25. Al calcular la media aritmética (promedio de las edades.4)2= 0.16 ( 8.4)2=54. se expresa como: Ejemplo: Se tienen las edades de cinco estudiantes universitarios de Ier año.4 (25 – 25.5)= 8. a saber: 18.6 (34 – 25. encontrar la varianza de las edades de estos estudiantes: Para calcular se utiliza una tabla estadística de trabajo de la siguiente manera: ( Xi Xi 18 23 25 27 34 Total ( Xi (18 – 25.20 Respuesta: la varianza de las edades es de 27.5)= 1. 27.4 años .casos S2 según otros analistas.5)=-0.4 años.6)2 =73. se define como: el cuadrado medio de las desviaciones con respecto a su media aritmética" Matemáticamente.16 ( 1.5)=-2.96 137.76 (-2. 25.64)2= 2.6 xxxx (-7.5)=-7.23.4)2= 5.

[(ΣXifi)2/N] δ2 = ---------------------------N donde N=Σfi Ejemplo: Se tienen los datos de una muestra de 30 cuentas por cobrar de la tienda Cabrera’s y Asociados dispuestos en una tabla de distribución de frecuencias.835 – 36.280 116. f2.458 (ver ejemplo del calculo en "media aritmética para datos agrupados) de la siguiente manera Punto medios clases 7.496 146. fn.250 Xi 14. la varianza se calcula así: Σ(Xiδ2 = ---------------Σfi Sin embargo la formula anterior tiene algún inconveniente para su uso en la practica. … . Asimismo cuando se trabaja con máquinas calculadoras.172 2. y las frecuencias de las clases f1. La tarea de computar la varianza se simplifica utilizando la formula de computación que se da a continuación: ΣXi2fi .628 29. si se calculó anteriormente la media aritmética y se fijó en 43. a partir de los cuales se deberá calcular la varianza.139. X2.978 843. para lo cual se construye la siguiente tabla estadística de trabajo.984 fi Xi2 Xifi X2fi .420 – 21.La varianza para datos agrupados Si en una tabla de distribución de frecuencias.043 10 4 213. Los puntos medios de las clases son X1.373. Xn.835 21. … .780 3. sobre todo cuando se trabaja con números decimales o cuando la media aritmética es un número entero.

349. Será 0 solamente La varianza es la medida de dispersión cuadrática optima por ser la menor de todas.284 5.190 9.047.125 78.053.645 Respuesta: la varianza de las cuentas por cobrar es igual B/.495 – 93. Veámoslo: ) Si a xi’ = xi · k tendremos (sabiendo que .990 10.665 37.649.676.721.910 Total 43.36.645     Propiedades de la varianza : s siempre un valor no negativo.225.346.344 / 30 = 721.619 216.304.665 50. Veámoslo: Si a xi le sumamos una constante xi’ = xi + k tendremos (sabiendo que )  Si todos los valores de la variable se multiplican por una constante la varianza queda multiplicada por el cuadrado de dicha constante.288 86.703 XXX 5 3 3 5 30 1.936 217. Si a todos los valores de la variable se le suma una constante la varianza no se modifica.965 1.080 – 79.025 19.458 57.864 433.396 = 21.442.598 3.495 79.080 65.270 173.852 15.533. que puede ser igual o distinta de 0.555 7.665 – 65.665.873 72.888.250 – 50.

la varianza de la distribución inicial se relaciona con la varianza de cada uno de los subconjuntos mediante la expresión Siendo Ni è el nº de elementos del subconjunto (i) S2i è la varianza del subconjunto (i) . Si en una distribución obtenemos una serie de subconjuntos disjuntos.