Professional Documents
Culture Documents
Las medidas descriptivas son valores numricos calculados a partir de la muestra y que nos
resumen la informacin contenida en ella.
- El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte de los datos
- El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor que la mitad de los
datos
- El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas partes de los datos
DECILES: son los nueve valores que dividen al conjunto de datos ordenados en diez partes
iguales, son tambin un caso particular de los percentiles.
Ejemplo:
Dada la siguiente distribucin en el nmero de hijos (Xi) de cien familias, calcular sus cuartiles.
xi
ni
Ni
14
14
10
24
15
39
26
65
20
85
15
100
n=100
Solucin:
1.
Primer cuartil:
2.
Segundo cuartil:
3.
Tercer cuartil:
Medidas de Centralizacin
Nos dan un centro de la distribucin de frecuencias, es un valor que se puede tomar como
representativo de todos los datos. Hay diferentes modos para definir el "centro" de las
observaciones en un conjunto de datos. Por orden de importancia, son:
MEDIA : (media aritmtica o simplemente media). es el promedio aritmtico de las
observaciones, es decir, el cociente entre la suma de todos los datos y el numero de ellos . Si xi es
el valor de la variable y ni su frecuencia, tenemos que:
Si los datos estn agrupados utilizamos las marcas de clase, es decir c i en vez de xi.
MEDIANA (Me):es el valor que separa por la mitad las observaciones ordenadas de menor a
mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores.
Si el nmero de datos es impar la mediana ser el valor central, si es par tomaremos como
mediana la media aritmtica de los dos valores centrales.
MODA (M0): es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia
absoluta es mayor. No tiene porque ser nica.
Medidas de Dispersin
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de tendencia
central son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican
la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor
central.Distinguimos entre medidas de dispersin absolutas, que no son comparables entre
diferentes muestras y las relativas que nos permitirn comparar varias muestras.
MEDIDAS DE DISPERSIN ABSOLUTAS
VARIANZA ( s2 ): es el promedio del cuadrado de las distancias entre cada observacin y la
media aritmtica del conjunto de observaciones.
Haciendo operaciones en la frmula anterior obtenemos otra frmula para calcular la varianza:
Para estimar la desviacin tpica de una poblacin a partir de los datos de una muestra se utiliza la
frmula (cuasi desviacin tpica):
CV representa el nmero de veces que la desviacin tpica contiene a la media aritmtica y por lo
tanto cuanto mayor es CV mayor es la dispersin y menor la representatividad de la media.
Medidas de Forma
Comparan la forma que tiene la representacin grfica, bien sea el histograma o el diagrama de
barras de la distribucin, con la distribucin normal.
MEDIDA DE ASIMETRA
Diremos que una distribucin es simtrica cuando su mediana, su moda y su media aritmtica
coinciden.
Diremos que una distribucin es asimtrica a la derecha si las frecuencias (absolutas o relativas)
descienden ms lentamente por la derecha que por la izquierda.
Si las frecuencias descienden ms lentamente por la izquierda que por la derecha diremos que la
distribucin es asimtrica a la izquierda.
Existen varias medidas de la asimetra de una distribucin de frecuencias. Una de ellas es
el Coeficiente de Asimetra de Pearson:
Su valor es cero cuando la distribucin es simtrica, positivo cuando existe asimetra a la derecha y
negativo cuando existe asimetra a la izquierda.
Se definen 3
Resumen de Frmulas