You are on page 1of 20

DIRECCIN DE ESTADSTICAS DE LA

PROVINCIA

INTRODUCCIN A LA
ESTADSTICA DESCRIPTIVA
Lazarte Vctor Fabio

Naidicz Paula Lorena

MEDIDAS DE POSICIN Y DISPERSIN


MEDIDAS DE POSICIN:
Resumen la informacin referida de la posicin de la muestra. Las
medidas de posicin ms utilizadas son: Media, Mediana, Moda
y Cuartiles, las tres primeras, media, mediana y moda son
medidas de tendencia central.
Supongamos que los datos observados son: x1, x2, , xn.

Media: es el promedio de los datos

x 1 x 2 ... x n
n

Ejemplo 1: Las notas de un alumno son: 10, 8, 7, 9, 10, 7, 6.


Nota promedio x 10 8 7 9 10 7 6 8.14
7
En este caso la media es un buen representante del rendimiento
acadmico del alumno.

La media tiene la propiedad de equilibrar los desvos.

Ejemplo 2: En el ejemplo de la cantidad de miembros de una


familia de cierta ciudad.
La cantidad promedio de miembros de una familia es x 4.7

Existen casos en donde la media no es un buen representante del


conjunto de datos.
Ejemplo 3: Una empresa tiene 5 empleados, sus sueldos en
pesos son: 1000, 1000, 1000, 1000, 10000.
Entonces la media es : x 2800
El dueo de la empresa dira orgulloso El sueldo promedio de los
empleados mi empresa es de $ 2800 al mes!!
Pero claramente, la media no es un buen representante de este
conjunto de datos, dado que hay 4 empleados que ganan slo
1000 y slo uno que gana 10000.

En general cuando la muestra tenga valores alejados o presente


asimetra, la media no ser un buen representante del conjunto
de datos.
Una medida de posicin alternativa a la media sera la Mediana.

La Mediana: Es el valor central de la muestra ordenada.

Si la cantidad de datos es impar, la mediana es el valor


central de la muestra ordenada.

Si la cantidad de datos es par, la mediana es el promedio de


los dos datos centrales de la muestra ordenada.

Ejemplos

Para n impar.
Notas de un alumno A: 10, 8, 7, 9, 10,
Datos ordenados:

6,

7, 7, 8,

La mediana de las notas es 8. Notacin:

7, 6.

9, 10, 10.

~
x 8

Para n par
Notas de un alumno B:
Datos ordenados:

10, 8, 7, 9, 10, 7, 6,

9.

6, 7, 7, 8, 9, 9, 10, 10.

La mediana de las notas es:

89
~
x
8,5
2
7

En el ejemplo de la empresa con 5 empleados la mediana sera


igual a $ 1000, por lo tanto sera un mejor representante del
conjunto de datos.

La mediana no es afectada por valores alejados ni es afectada


por asimetra.

Cuartiles: En cierta forma, dividen el lote de datos ordenado en


cuatro partes iguales.
Para calcular los cuartiles, se toma la primera mitad de la
muestra ordenada y se calcula la mediana de este conjunto que
ser el primer cuartil, para el tercer cuartil se trabaja igual con
los datos de la segunda mitad.
8

Ejemplos

Para n impar
Datos ordenados:

6,

7, 7, 8,

9, 10, 10.

Primer cuartil: Q1 = 7

Tercer cuartil: Q3 = 9,5

Para n par
Datos ordenados:
Primer cuartil: Q1 = 7

6, 7, 7, 8, 9, 9, 10, 10.
Tercer cuartil: Q3 = 9,5

Moda: Es el dato ms frecuente (si es que este existe)

En los ejemplos de las notas del alumno no existe la moda


por que hay varios datos que se repiten dos veces.
6,

7, 7, 8,

9, 10, 10

En el ejemplo de la empresa con 5 empleados los datos son:


1000, 1000, 1000, 1000, 10000
As la moda es igual a $ 1000, por lo tanto sera un buen
representante del conjunto de datos.

10

En el ejemplo de la cantidad de miembros de una familia


Cul sera la moda?
Cantidad de
miembros

Cantidad de
familias

Porcentajes

%
acumulado

2,5 %

2,5 %

6,3 %

8,8 %

11,3 %

20,0 %

Moda

22

27,5 %

47,5 %

Mediana

20

25,0 %

72,5 %

11

13,8 %

86,3 %

7,5 %

93,8 %

3,8 %

97,5 %

10

2,5 %

100,0 %

Total

80

100,0 %

11

MEDIDAS DE DISPERSIN
Ejemplo :
Notas del alumno Juan: 6, 6, 8, 10, 10.
Notas del alumno Pedro: 8, 8, 8, 8, 8.
La nota promedio de los dos alumnos es 8, sin embargo
claramente su desempeo no es igual.
Cmo los comparo? Cul es la diferencia?
Una medida de dispersin es una medida de cuan alejados estn
los datos del centro de la distribucin, ya sea que se tome como
centro a la media o a la mediana de los datos

12

Varianza muestral:
La varianza es el promedio de los desvos al cuadrado, es decir,
se mide la distancia de cada dato a la media, se la eleva al
cuadrado y se las promedia.

Desviacin Estndar: es la raz cuadrada positiva de la varianza.

13

Ejemplo:
Notas del alumno Juan: 6, 6, 8, 10, 10.
La media es 8 por lo tanto los desvos son: -2, -2, 0, 2, 2, los
desvos al cuadrado son: 4, 4, 0, 4, 4.

La varianza ser:

Desviacin Estndar:

Para el alumno Pedro naturalmente la varianza y la desviacin


estndar sern iguales a cero.
14

Coeficiente de variacin
El coeficiente de variacin es una medida de la magnitud de la
dispersin en relacin a la media.

Estas tres medidas toman como centro a la media, por lo tanto


estn asociadas a ella.

Si el lote de datos es simtrico y no tiene valores alejados,


utilizaremos a la media y la desviacin estndar para describir
el conjunto de datos.

15

Una medida de dispersin asociada a la mediana es el Rango


Intercuartil.
El Rango intercuartil es simplemente la diferencia entre el primer
y el tercer cuartil: RI = Q3 Q1

Si el conjunto de datos es simtrico y no tiene valores alejados


se recomienda utilizar a la media como medida de posicin con
la desviacin estndar como medida de dispersin.

Si el conjunto de datos es asimtrico o tiene valores alejados se


recomienda utilizar a la mediana como medida de posicin con
el rango intercuartil como medida de dispersin.

16

Cmo analizo simetra?

Grficamente

Coeficiente de asimetra:

Figura 5: Ejemplo de una distribucin asimtrica positiva

17

Valores alejados: Estos son valores observados que se apartan


demasiado del resto de la muestra. Para detectarlos se puede
utilizar la siguiente regla:

Si un valor xi de la muestra es menor que Q1 1.5 (Q3 Q1) ,


entonces xi es alejado por defecto.

Si un valor xi de la muestra es mayor que Q3 + 1.5 (Q3 Q1) ,


entonces xi es alejado por exceso.

No significa que haya que descartar ese dato, significa que hay
que estudiar ese caso y usar medidas que no se vean
afectadas por valores alejados.
18

Diagrama de tipo caja:


Se deben calcular mnimo y mximo, mediana, Q1 , Q3 y Detectar
valores alejados
Figura 5: Peso en gramos de los recin nacidos en un cierto periodo de
una cierta ciudad.

19

Diagrama de tipo caja:

Cantidad de miembros
4
6

10

Figura 5: Cantidad de miembros de una familia.

20

You might also like