You are on page 1of 37

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS

Existen dos medidas de interés para cualquier conjunto de datos: la localización de su centro y su variabilidad. La tendencia central de un conjunto de datos es la disposición de éstos para agruparse ya sea alrededor del centro o de ciertos valores numéricos. La variabilidad de un conjunto de datos es la dispersión de las observaciones en el conjunto. Las medidas de posición facilitan información sobre la serie de datos que se esta analizando. Estas medidas permiten conocer diversas características de esta serie de datos. Son aquellas medidas que ayudan a saber donde están los datos pero sin indicar como se distribuyen. Las medidas de posición se clasifican en dos tipos: a) Medidas de posición central: informan sobre los valores medios de la serie de datos. b) Medidas de posición no centrales: informan de como se distribuye el resto de los valores de la serie.

Prof. Lic.María E. de Fernández

1

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS

a ) Medidas de posición central

Las principales medidas de posición central son las siguientes:

1. Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de medias, siendo las más utilizadas: 1.1 Media aritmética: se calcula multiplicando cada valor por el número de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra: x Se denota por , la fórmula está dada por n i

x x i n

Prof. Lic.María E. de Fernández

2

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS

Ventajas e inconvenientes de la Media Aritmética:

 


La media aritmética viene expresada en las mismas unidades que la variable. En su cálculo intervienen todos los valores de la distribución. Es el centro de gravedad de toda la distribución, representando a todos los valores observados. Es única. Su principal inconveniente es que se ve afectada por los valores extremadamente grandes o pequeños de la distribución. Su cálculo es sencillo,resulta fácil de entender y es un buen valor central que se usa para resumir un conjunto de datos, independientemente del número de valores que tengan.

Prof. Lic.María E. de Fernández

3

f2 medias m2.  f k mk f1  f 2  . entonces xj Media Aritmética calculada a partir de datos agrupados x  A i 1 n dj n  A i 1 n f jd j n 4 Prof.María E........ entonces la media de todos los números es x f1 m1  f 2 m2  ... .. Lic.....  f k es decir una media aritmética ponderada de todas las medias  Si A es cualquier supuesta media aritmética (que puede ser cualquier número) d j  x j y Asi son las desviaciones de de A. La suma de los cuadrados de las desviaciones de un conjunto de números xj de cualquier numero a es mínima solamente a si x Si f1 números tienen de media m1 . fk números tienen de media mk ... de Fernández ..CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Propiedades de la Media Aritmética • • • La suma algebraica de las desviaciones de un conjunto de números de su media aritmética es cero.

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Si todos los intervalos de clase tienen igual tamaño c. negativo o cero.María E. las d x A desviaciones pueden expresarse como cu j . de Fernández 5 . Lic. Entonces j j x  A j 1 n f ju j n c  A j 1 n f ju j n c  A  cu A este método se llama método clave. donde puede ser un n ° positivo. Las unidades de x pasan a u donde x  A  cu Prof.

...+ w Σw 1 1 2 2 k k k 1 2 k k k Se llama media aritmética ponderada. Prof.w que dependen de la importancia de cada uno de los números..... En este caso 1 2 k 2 k X = w X + w X +... en las que se introducen unos coeficientes de ponderación..w X = Σ w X w +w +……. que son valores positivos... de Fernández 6 ..X ciertos factores o pesos w. w . que representan el número de veces que un valor de la variable es más importante que otra.... Lic.. Se asocian a los números X .María E.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Media aritmética ponderada Es una media aritmética que se emplea en distribuciones de tipo unitario. X .

Según el tipo de datos que se analice será más apropiado utilizar la media aritmética o la media geométrica. Prof... La media geométrica se suele utilizar en series de datos como tipos de interés anuales..XN es la raiz enésima del producto de los números. X3 .2 Media geométrica: La media geométrica G de una serie de N números X1 . etc. inflación.. Lic..CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS 1. X2 . se eleva cada valor al número de veces que se ha repetido.María E. donde el valor de cada año tiene un efecto multiplicativo sobre el de los años anteriores. Se multiplican todos estos resultados y al producto final se le calcula la raíz "n" (siendo "n" el total de datos de la muestra). de Fernández 7 ..

Su cálculo es más complicado que el de la media aritmética. cuando la variable toma al menos un x = 0 entonces la media geométrica se anula.. Lic.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Media Geométrica Ventajas e inconvenientes:      En su cálculo intervienen todos los valores de la distribución. tasas. y si la variable toma valores negativos se pueden presentar una gama de casos particulares en los que tampoco queda determinada debido al problema de las raíces de índice par de números negativos.María E. etc. Es única. en los casos en los que se supone que la variable presenta variaciones acumulativas Prof. Además. es decir. Los valores extremos tienen menor influencia que en la media aritmética. El empleo más frecuente de la media geométrica es el de promediar variables tales como porcentajes. de Fernández 8 . números índices.

Se suele utilizar para promediar variables tales como productividades. Lic. Prof.María E. Su cálculo no tiene sentido cuando algún valor de la variable toma valor   cero. velocidades. de Fernández 9 . Ventajas e inconvenientes: En su cálculo intervienen todos los valores de la distribución.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Media armónica La media armónica.  Es única. cambios. etc. tiempos. que representaremos por H. se define como sigue: 1 1 X 1 1    H N N X H N X 1 Obsérvese que la inversa de la media armónica es la media aritmética de los inversos de los valores de la variable. rendimientos. No es aconsejable en distribuciones de variables con valores pequeños.

Dada una distribución de frecuencias con los valores ordenados de menor a mayor.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS 2. que deja a su izquierda el mismo número de frecuencias que a su derecha. de Fernández 10 . llamamos mediana y la representamos por Me. pero en cambio no utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido).María E.. Lic.Mediana: es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores). Prof. No presentan el problema de estar influido por los valores extremos. al valor de la variable.

N= número de datos (frecuencia total). Lic.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Mediana La Mediana se define de la siguiente forma: Mediana= Donde: Li= límite inferior de la clase de la mediana. de Fernández 11 .María E. = suma de frecuencia de las clases inferiores a la mediana fmediana= frecuencia de la clase mediana c= anchura del intervalo de la clase mediana Prof.

cuando hay dos modas se dice que la distribución es bimodal y si hay más de dos modas la distribución se llama multimodal. de Fernández 12 .CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Moda Moda es el valor que más se repite en la muestra. que se presenta con la mayor frecuencia. es decir es el valor más común. Aquellas distribuciones que tienen una sola moda se llaman unimodales. Prof. Lic.María E. La moda puede no existir. incluso si existe puede no ser única.

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Moda  Para obtener la moda en datos agrupados se usa la siguiente fórmula: Donde: L1 = Límite inferior de la clase modal.María E. D1 = Exceso de la frecuencia modal sobre la clase contigua inferior. Lic. D2 = Exceso de la frecuencia modal sobre la clase contigua superior. Prof. C = Tamaño del intervalo de la clase modal. de Fernández 13 .

se suelen utilizar una serie de valores que dividen la muestra en tramos iguales: Cuartiles: son 3 valores que distribuyen la serie de datos. en cuatro tramos iguales. ordenada de forma creciente o decreciente. Prof. Segundo cuartil (Q2): Coincide. de Fernández 14 .CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de posición no centrales Medidas de posición no centrales Las medidas de posición no centrales permiten conocer otros puntos característicos de la distribución que no son los valores centrales. es idéntico o similar al valor de la Mediana (Q2 = Md). Es decir. Lic.María E. Entre otros indicadores. en los que cada uno de ellos concentra el 25% de los resultados ellos son: (Q1. Q2. Q3) Primer cuartil (Q1): Aquel valor de una serie que supera al 25% de los datos y es superado por el 75% restante. supera y es superado por el 50% de los valores de una Serie.

Lic. de Fernández 15 . faa. la correspondiente a tal frecuencia acumulada. siendo la clase de Q1. Li. Donde: posición de Q1.María E.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de posición no centrales Fórmula de Q1 para series de Datos Agrupados en Clases. fi. Prof. Ic : idéntico a los conceptos vistos para Mediana pero referidos a la medida de la posición correspondiente. la cual se localiza en la primera frecuencia acumulada que la contenga.

todo idéntico al cálculo de la Mediana. Prof. Es decir. Lic. Fórmula de Q3 para series de Datos Agrupados en Clase. término o dato que supera al 75% y es superado por el 25% de los datos restantes de la Serie.María E.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de posición no centrales Segundo cuartil (Q2): Coincide. es idéntico o similar al valor de la Mediana (Q2 = Md). de Fernández 16 . Donde: : posición de Q3. supera y es superado por el 50% de los valores de una Serie. c) Tercer cuartil (Q3): Aquel valor.

de Fernández 17 . en diez tramos iguales. Deciles (D1. D2. hablando en porcentajes. supera al 10% y es superado por el 90% restante). Lic. … D9) Primer Decil (D1). El primer decil es aquel valor de una serie que supera a 1/10 parte de los datos y es superado por las 9/10 partes restantes (respectivamente. Prof. ordenada de forma creciente o decreciente.María E. en los que cada uno de ellos concentra el 10% de los resultados. Quinto Decil (D5) y Noveno Decil (D9).CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de posición no centrales Deciles: son 9 valores que distribuyen la serie de datos.

de Fernández 18 . P50. P99 para series de Datos Agrupados en Clases. Lic. Prof. ordenada de forma creciente o decreciente. en cien tramos iguales. Fórmulas de P1. El primer percentil supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restante.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de posición no centrales   Percentiles: son 99 valores que distribuyen la serie de datos. Percentiles (P1. en los que cada uno de ellos concentra el 1% de los resultados. P2. … P99) Primer Percentil (P1).María E. Percentil 50 (P50) y Percentil 99 (P99).

el cuarto decil el 40° percentil. Como se observa. el 80 decil será el valor por encima del cual estará el 20 por ciento de los datos. Para determinar estas medidas se aplicara el principio de la mediana. bajo el tercer cuartil se encuentra el 75 por ciento.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de posición no centrales El P99 (noventa y nueve percentil) supera al 99% de los datos y es superado a su vez por el 1% restante. el tercer cuartil el 75° percentil. cambiando obviamente las correspondientes posiciones de cada medida. así. todas estas medidas no son sino casos particulares del percentil ya que el primer cuartil no es sino el 25° percentil. el primer cuartil será el valor por debajo del cual se encuentra el 25 por ciento de los datos. etc. Prof. Lic. Idénticas fórmulas al cálculo de la Mediana.María E. de Fernández 19 .

X2.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de posición no centrales Datos no agrupados: Se hace difícil calcular estas medidas. sin embargo. Lic. siguiendo los mismos principios mencionados para la Mediana. se pueden localizar en la forma siguiente: Si tenemos una serie de valores X1. cuando n es impar. de Fernández 20 . Para el tercer cuartil será (n impar).María E. Prof. y (n par). se localiza el primer cuartil como el valor cuando n es par. X3 … Xn.

de Fernández 21 .CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de posición no centrales En caso de los textiles será representa el número del textil.María E. Lic. o donde A Para los deciles será del decil. y para los percentiles o siendo A el número o Prof.

Así podremos diferenciar dos conjuntos de datos que poseen iguales medias. Los indicadores básicos de dispersión son: Desviación media Varianza Desviación estándar Coeficiente de variación o Coeficiente de variación de Pearson Rango. de Fernández 22 . Las medidas de dispersión nos indican la distancia promedio de los datos respecto a las medidas de tendencia central.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersión No solo basta con determinar las medidas de tendencia central para comprender el comportamiento de una serie de datos. Amplitud o Recorrido Cuasivarianza Cuasidesviación típica        Prof. siendo los datos de uno más dispersos del otro. Lic. es importante además. conocer que tan alejados están esos datos respecto a ese punto de concentración.María E.

Algunos inconvenientes No utiliza todas las observaciones (sólo dos de ellas). Lic. pero indudablemente es muy fácil de calcular.María E. En cualquier caso nunca disminuye.     Prof. o bien se queda igual. Se puede ver muy afectada por alguna observación extrema. la mas utilizada es con respecto a la media. Omitir el valor extremo e indicarlo como una excepción es una forma razonable de ajustar esta limitación del rango.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersión  Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo. El rango aumenta con el número de observaciones. Hemos estudiado varias medidas de centralización. de Fernández 23 . sin embargo. Realmente no es una medida muy significativa en la mayoría de los casos. por lo que podemos hablar de desviación con respecto a cualquiera de ellas.

Pero esta solución es mala pues como veremos siempre va a ser 0. de Fernández 24 . Para resolver este problema. Prof. Lic. La primera solución puede ser calcular la media de todas las desviaciones. si consideramos como muestra la de todas las desviaciones y calculamos su media. tenemos dos caminos: Tomar el valor absoluto de las desviaciones. La denotaremos por di. es decir. son muchas medidas. Varianza. Luego por lo tanto esta primera idea no es valida. por lo que precisaremos una medida que resuma dicha información. Desviación media Elevar al cuadrado las desviaciones. pues las desviaciones positivas se contrarrestan con las negativas.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersión Desviación: Es la diferencia que se observa entre el valor de la variable y la media aritmética.María E. pues cada valor de la variable lleva asociada su correspondiente desviación. No es una medida.

y la denotaremos por d de las Prof. la desviación media respecto de la mediana es mínima.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersión  Desviación media: Ocasionalmente. la desviación media se define como desviaciones absolutas de la mediana u otro promedio en lugar de la media. Es la media de los valores absolutos desviaciones. Lic.María E. Una propiedad interesante de la suma ∑ xj – a es que es mínima cuando a es la mediana. es decir. de Fernández 25 . Resulta más apropiado utilizar el término desviación media absoluta que el de desviación media.

Es la media de los cuadrados de las desviaciones. La sumatoria obtenida se divide por el tamaño de la muestra. Lic.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersión  Varianza: Mide la distancia existente entre los valores de la serie y la media. multiplicadas por el número de veces que se ha repetido cada valor. Se calcula como la sumatoria de las diferencias al cuadrado entre cada valor y la media. y la denotaremos por o .María E. Prof. de Fernández 26 .

La varianza siempre será mayor que cero. por ejemplo. Lic. Mientras más se aproxima a cero. La varianza vendrá en cm2 . si la variable viene dada en cm.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersión  Varianza que sigue  También es posible calcular usando la fórmula  Este estadístico tiene el inconveniente de ser poco significativo. de Fernández 27 . Prof. más concentrados están los valores de la serie alrededor de la media. pues se mide en el cuadrado de la unidad de la variable.María E.

Cuando la dispersión de las observaciones es grande (Datos que se alejan mucho por encima y por debajo del promedio). la media de la suma de los cuadrados).CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersión  Varianza: Por el contrario. y por lo tanto la varianza. es la variación promedio de las puntuaciones en una distribución (es decir. de Fernández 28 . Prof. Entonces aumenta la suma de cuadrados de las puntuaciones de desviación. mientras mayor sea la varianza. (distancia entre cada dato y el promedio) será grande. La varianza es un número que nos permite comparar poblaciones. más dispersos están. Lic. el valor de las puntuaciones de desviación.María E.

Este estadístico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. la desviación típica o estándar es una de las más importantes entre las medidas de dispersión. Prof.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersión  Desviación típica:. Se calcula como la raíz cuadrada de la varianza. de Fernández 29 . La desviación estándar o desviación típica tiene las mismas unidades que la variable en estudio. Si la media aritmética es la más importante. de gran utilidad en la estadística descriptiva. Lic. La desviación estándar (o desviación típica) es una medida de dispersión para variables de razón (ratio o cociente) y de intervalo. Tanto la varianza como la desviación estándar nos permiten comparar el grado de dispersión de distintas observaciones.María E.

Pues no es posible comparar unidades de distinto tipo. Lic. esto implica que si cambiamos de unidad de medida. en un grupo de alumnos si los pesos o las alturas presentan mas dispersión. los valores de estos estadísticos se vean a su vez modificados. de Fernández 30 .María E. se denota por Sx o sx Expresión de la varianza muestral: Prof.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersión   Todas estas medidas de dispersión vienen influidas por la unidad en la que se mide la variable. no permite comparar por ejemplo. Es la raíz cuadrada de la varianza. Además.

y si por el contrario. obtenemos la desviación típica muestral. tomando la raíz cuadrada positiva de la varianza. Expresión de la desviación estándar muestral: Expresión de la desviación estándar poblacional Prof. si efectuamos la raíz de la varianza muestral.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersión Expresión de la varianza poblacional: Una vez entendida la formulación de la varianza podemos pasar a obtener la desviación estándar. Así. Lic.María E. obtendremos la desviación típica poblacional. efectuamos la raíz sobre la varianza poblacional. de Fernández 31 .

1 la representaremos por o y la calcularemos de la siguiente forma: Prof. cuya única diferencia con la varianza es que dividimos por N. Lic. (1857-1936) fue un matemático británico. Otros dos estadísticos importantes son la cuasivarianza y la cuasidesviación típica.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersión    El término desviación estándar fue incorporado a la estadística por Karl Pearson en 1894. de Fernández 32 . Cuasivarianza: Es una medida de dispersión.María E. son los estimadores de la varianza y desviación típica poblacionales respectivamente.

Lic.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersión  Cuasidesviación típica: La raíz cuadrada de la cuasivarianza y la denotaremos por También se puede expresar la varianza muestral o cuasivarianza de esta forma : Prof. de Fernández 33 .María E.

La denotaremos por C. de Fernández 34 .V. etc.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersión    Medidas de dispersión relativas Se precisa de una medida "escalar". Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón. Lic. Coeficiente de Variación de Pearson: Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada ninguna unidad.María E. por lo que nos permitirá decir entre dos muestras. kilos. es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos.) o que corresponden a poblaciones extremadamente desiguales. cual es la que presenta mayor dispersión. es decir. Una manera de construir una medida de variabilidad que cumpla los requisitos anteriores es el llamado coeficiente de variación Prof. que no lleve asociado ninguna unidad de medida es el coeficiente de variación. Para comparar la dispersión de variables que aparecen en unidades diferentes (metros.

CV representa el número de veces que la desviación típica contiene a la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media. de Fernández 35 .CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersión Relativas  Coeficiente de Variación   Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variación de Pearson que se define como el cociente entre la desviación típica y el valor absoluto de la media aritmética. Lic.María E. Prof.

A menor coeficiente de variación consideraremos que la distribución de la variable medida es más homogénea. Lic. Si comparamos la dispersión en varios conjuntos de observaciones tendrá menor dispersión aquella que tenga menor coeficiente de variación. de Fernández 36 . Al dividir la desviación típica por la media se convierte en un valor exento de unidad de medida. ya que viene expresada en las mismas unidades que los datos de la serie El principal inconveniente. Esto no ocurre con la desviación típica.María E. indican que debe prescindirse de la unidad de medida de la media). el coeficiente tenderá a infinito Prof.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersión Relativas     Coeficiente de Variación: (las barras del denominador representan el valor absoluto. es decir. cuando ésta tome valores cercanos a cero. es que al ser un coeficiente inversamente proporcional a la media aritmética.

 Prof. CV . La dispersión o variación real determinada por la desviación típica u otra medida de dispersión se llama dispersión absoluta.CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersión Relativas   Dispersión Absoluta y Relativa. Lic.María E. la dispersión relativa se conoce como coeficiente de variación o coeficiente de dispersión. La dispersión relativa está definida como: Dispersión relativa = Dispersión absoluta/ Promedio Si la dispersión absoluta es la desviación típica s y el promedio es la media x. de Fernández 37 .