You are on page 1of 48

UNIVERSIDAD NACIONAL SAN AGUSTIN DE

AREQUIPA
FACULTAD DE PSICOLOGÍA, RELACIONES INDUSTRIALES
Y CIENCIAS DE LA COMUNICACIÓN
DEPARTAMENTO ACADÉMICO DE ESTADISTICA
AREQUIPA -
2012
MEDIDAS ESTADÍSTICAS
s
2
m
s
N
x
M D
i ¿
÷
=
| |
.
µ
2
2
2
2
) (
µ
µ
o ÷ =
÷
=
¿ ¿
N
x
N
x
i i
2
2
2
) (
µ
µ
o ÷ =
÷
=
¿ ¿
N
x
N
x
i i
n
x
x
i
¿
=
1. Medidas de tendencia central
- Media ( aritmética, geométrica y armónica)
- Mediana
- Moda

2. Medidas de dispersion
- Rango
- Varianza
- Desviación Standard

3. Asimetria y apuntamiento

Grafica tus
datos
Interpreta lo
que ves
Resúmenes
Numéricos?
Modelos
Matemático
s?
Comienzas representando gráficamente e
interpretando lo que tú ves
Buscas patrones globales y desviaciones llamativas
de esos patrones, y buscas explicaciones en el
contexto del problema
Basado en el examen de los datos, escoges
apropiadas descripciones numéricas de aspectos
específicos
Si el patrón global es suficientemente regular, buscas
a un modelo matemático compacto para ese patrón”
“CUANDO TÚ EXAMINAS UN CONJUNTO DE DATOS….
(Moore, 1999, Pág. 251).
David Moore sintetiza la esencia de lo que se quiere enseñar en este
curso
MEDIA
ARITMÉTICA
MEDIANA
MODA
MEDIA
PONDERADA
MEDIA
GEOMÉTR
ICA
MEDIA
ARMÓNICA
FRACTILES
DESVIACIÓN
MEDIA
VARIANZA
DESVIACIÓN
ESTÁNDAR
ALCANCE
INTERCU
ARTIL
ALCANCE
INTERDECIL
ALCANCE
INTERPERCENTIL
RANGO o
ALCANCE
-CUARTILES
-DECILES
-PERCENTILES
MEDIDAS DE FORMA
CURTOSIS SIMETRÍA
HACIA QUÉ VALOR SE
AMONTONA LA MAYORÍA
DE LOS DATOS?
CUÁN DISPERSOS
ESTÁN LOS DATOS?

EN CUÁNTO SE PARECE NUESTRA
CURVA DE FRECUENCIA A UNA
DISTRIBUCIÓN NORMAL?
MEDIA
ARITMÉTICA
MEDIANA
MODA
MEDIA
PONDERADA
MEDIA
GEOMÉTRICA
MEDIA
ARMÓ
NICA
DECILES
PERCENTILES
CUARTILES
MEDIDAS DE POSICIÓN

MEDIA
ARITMÉTICA
MEDIA
PONDERADA
Para una
población de “N”
elementos
N
x
¿
= µ
n
x
x
i
¿
=
Para una muestra
de “n” elementos
n
x
X
n
i
i i ¿
=
=
1
f
La media aritmética de los valores x
1
, x
2
, x
3
, . . . x
k
ponderada por
los pesos w
1
, w
2
, w
3
, . . . w
k
es el número:
Ejemplo: Si un alumno en el semestre anterior ha obtenido 11 en el
curso A de 5 créditos, 13 en el curso B de 4 créditos y 16 en el curso C
de 3 créditos. Entonces su promedio (ponderado por los créditos) es:

¿
¿
=
=
=
+ + + +
+ + + +
=
k
i
i
k
i
i i
k
k k
w
x w
w w w w
x w x w x w x w
X
1
1
3 2 1
3 3 2 2 1 1
...
...
Rpta: 13,06
• ELEMENTO REPRESENTATIVO DE UN CONJUNTO DE
VALORES DADOS, CUYA DISTRIBUCIÓN ES
APROXIMADAMENTE SIMÉTRICA.
SIGNIFICADOS DE LA MEDIA ARITMÉTICA
•SIRVE PARA OBTENER UNA CANTIDAD IGUAL A REPARTIR
PARA CONSEGUIR UNA DISTRIBUCIÓN UNIFORME.
•SIRVE PARA ESTIMAR UNA CANTIDAD DESCONOCIDA EN
PRESENCIA DE ERRORES DE MEDIDA.
•SIRVE PARA CONOCER EL VALOR QUE SE OBTENDRÁ CON
MAYOR PROBABILIDAD AL TOMAR UN ELEMENTO AL AZAR,
DE UNA POBLACIÓN
Ventajas:
Concepto familiar para muchas personas
Es única para cada conjunto de datos
Es posible comparar medias de diferentes
muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no
están agrupados, su cálculo es
tedioso
Si los datos están agrupados en clases
con extremos abiertos, no es posible
calcular la media.
VENTAJAS Y DESVENTAJAS DE LA
MEDIA ARITMÉTICA
Ejemplo:
La siguiente tabla muestra el número
de reclamos y quejas presentadas por
clientes en el Servicio de
mantenimiento a lo largo de una
semana. Calcule e interprete la media.
Día/Semana Lun Mar Mier Jue Vier Sab
Reclamos/día 8 10 5 12 10 15
Ejemplo:
La distribución de frecuencias siguiente,
representa los puntajes obtenidos en una
evaluación del desempeño, aplicado al
personal técnico de una empresa. El puntaje
máximo en la prueba es 50. Calcule e
interprete la media.
Desempeño Número de
(puntos) técnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
Ejemplo: Una empresa comercializadora de
Seguros Médicos dispone de 3
representantes para la zona de Miraflores,
cada uno de los cuales cobra diferente
comisión por póliza vendida, y realiza
diferente número de contratos. Calcule e
interprete el valor medio de la comisión





Nº de polizas de Comisión
Vendedor Seguro Médico por venta $
Pedro 30 30
Juan 25 40
Pablo 20 50
i
w i
X
Interpretación:
Si se elige al azar un representante se espera que
cobre una comisión de $38.67 por póliza vendida.
67 . 38 $
75
2900
20 25 30
) 50 ( 20 ) 40 ( 25 ) 30 ( 30
= =
+ +
+ +
=
p
x
SOLUCIÓN:
MEDIANA
Una vez que se han ordenado los datos, la mitad de
ellos
(N / 2) ó ( n / 2 ) es menor o igual que la mediana y la
otra mitad es mayor o igual que la mediana.
MODA
Cálculo de la mediana a partir de datos no
tabulados
Para hallar la mediana de un conjunto de datos,
primero hay que organizarlos en orden
descendente o ascendente.

Si el conjunto de datos contiene un número impar
de elementos, el dato central en el arreglo
ordenado es la mediana. Su ubicación se
encuentra con la fórmula: 2
1 +
=
n
Me
MEDIANA
Si hay un número par de observaciones, la
mediana es el promedio de los dos elementos
ordenados centrales. Su ubicación se encuentra
con la fórmula:
2
n
Me =
MEDIANA
k
k
k
k
c
f
F
n
X Me
2

1
1
|
|
|
|
.
|

\
|
÷
+ =
÷
÷
donde:
X
k-1
: es el límite real inferior de la clase mediana o del
intervalo donde se ubica la Me.
n : número total de datos u observaciones.
F
k-1
: frecuencia absoluta acumulada inferior al
Intervalo de la Me.
f
k
: frecuencia absoluta de la clase mediana o del
Intervalo de la Me.
c
k
: amplitud o ancho del intervalo mediano
Ejemplo: La tabla siguiente muestra la experiencia laboral
(años) del personal de seguridad que labora en una
institución. Calcule e interprete la mediana.
Experiencia Número de
laboral trabajadores
(años) de seguridad
0 - 3 4
4 - 7 12
Clase
Mediana
8 - 11 24
12 - 15 16
16 - 19 10
20 - 23 3
69
Lugar de la mediana:
4
24
) 16 (
2
1 69
5 , 7
(
(
(
¸
(

¸

÷
+
+ = d M
4
24
16 35
5 , 7
(
¸
(

¸

÷
+ =
Mediana = 10,5 años
o
35
2
1 69
2
1
=
+
=
+ n
Interpretación:

La mitad del personal de seguridad que
labora en esta institución tienen una
experiencia laboral igual o menor a 10 años 6
meses. La otra mitad de este personal tiene
una experiencia laboral igual o mayor a 10
años y 6 meses.
e) Ventajas:
Los valores extremos no afectan a la mediana como
en el caso de la media aritmética.
Es fácil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos,
registrados bajo una escala ordinal.

Desventajas:
Como valor central, se debe ordenar primero la
serie de datos.
Para una serie amplia de datos no agrupados, el
proceso de ordenamiento de los datos demanda
tiempo y usualmente provoca equivocaciones.
VENTAJAS Y DESVENTAJAS DE LA MEDIANA




MODA
La moda es aquel valor que más se repite
en el conjunto de datos. En ocasiones, el
azar hace que un solo elemento no
representativo se repita lo suficiente para
ser el valor más frecuente del conjunto de
datos. Es por esta razón que rara vez
utilizamos la moda de un conjunto de
datos no agrupados como medida de
tendencia central.
el dato que más se repite
o la mayor frecuencia de un
conjunto de datos
PARA DATOS
NO AGRUPADOS
PARA DATOS
AGRUPADOS
Se toma el dato que más se repite
Si fuesen dos valores diferentes,
se habla de bimodal, de ser tres,
sería trimodal

es
Se calcula
k k
c X Mo
2 1
1
1
|
|
.
|

\
|
A + A
A
+ =
÷
MODA
Donde:
X
k-1
: límite real inferior de la clase modal, o sea la
de mayor frecuencia.
= diferencia entre las frecuencias de la clase
modal y la clase contigua inferior.
= diferencia entre las frecuencias de la clase
modal y la clase contigua superior.
c
k
: amplitud del intervalo modal

1
A
2
A
Las clases mediana y modal pueden coincidir pero
conceptualmente son diferentes.
Ejemplo: La tabla siguiente muestra los errores de
facturación durante un mes, en una Empresa. Calcule e
interprete la moda.








Interpretación: Durante un mes, el número más frecuente
de errores de facturación en esta empresa es 6.
Errores de
f acturación Días
0 - 3 6
4 - 7 12
Clase
Modal
8 - 11 8
12 - 15 3
16 - 19 1
Total 30
Clase moda : (4 - 7)



Mo = 5,9
6
1
= A
4
2
= A
4
4 6
6
5 . 3 Mo
|
.
|

\
|
+
+ =
VENTAJAS
Se puede utilizar tanto para datos
cualitativos como cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan
una o más clases abiertas.
DESVENTAJAS:
No tiene un uso tan frecuente como la
media.
Muchas veces no existe moda (distribución
amodal).
En otros casos la distribución tiene varias
modas, lo que dificulta su interpretación.
Ventajas y desventajas de la
moda
EJEMPLO
Para los datos de las remuneraciones (en dólares)
de 50 obreros de construcción civil, calcular,
Media aritmética, mediana y Moda
Remuneraciones X
i
f
i

45 - 52
52 - 59
59 - 66
66 - 73
73 - 80
80 - 87
87 - 94
48,5
55,5
62,5
69,5
76,5
83,5
90,5
3
7
7
18
8
4
3
50
CUARTILES
k
k
k
k r
c
n
N
rn
X Q
4
1
1
|
|
|
|
.
|

\
|
÷
+ =
÷
÷
DECILES
k
k
k
k r
c
n
N
n r
X D
10

1
1
|
|
|
|
|
.
|

\
|
÷
+ =
÷
÷
MEDIDAS DE POSICIÓN - FRACTILES
PERCENTILES
k
k
k
k r
c
n
N
n r
X P
100

1
1
|
|
|
|
|
.
|

\
|
÷
+ =
÷
÷
Ejemplo:
La tabla muestra la experiencia (en años) de
Trabajadores de un centro minero.
Experiencia Trabajadores
(años)
0 - 3 18
4 - 7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
Total 334
¿Sobre qué edad se ubica el 25% de los
trabajadores de mayor experiencia?
Para saber en cuál clase se halla este dato, se
calculó la frecuencia acumulativa.
Menor
Experiencia
Mayor
Experiencia
75 % 25 %
P
75

K = 75
) ordenados números los de ( 5 , 250
100
) 334 ( 75
100
Kn
P del Lugar
o
75
= = =
Experiencia Nº Trabajadores Frec. Acumulada
(años)
0 - 3 18 18
4 - 7 42 60
8 - 11 68 128
12 - 15 120 248
16 - 19 40 288
20 - 23 34 322
24 - 27 12 334
334
Interpretación: Para que un trabajador esté
comprendido dentro del 25% de mayor experiencia
laboral debe tener al menos 15 años, 7 meses y 24
días.
( )
4
40
1 248
100
75(334)
5 . 15
75
P
(
(
(
¸
(

¸

+ ÷
+ =
años 65 . 15
75
P =
i
F
i
f
En esta clase
se localizan del
249º - 288º
F=248
SIMETRIA Y APUNTAMIENTO
Para saber si una distribución de frecuencias es
simétrica, hay que precisar con respecto a qué.
Un buen candidato es la mediana, ya que para
variables continuas, divide al histograma de
frecuencias en dos partes de igual área.
Podemos basarnos en ella para, de forma
natural, decir que una distribución de frecuencias
es simétrica si el lado derecho de la gráfica (a
partir de la mediana) es la imagen por un espejo
del lado izquierdo.
Cuando la variable es discreta, decimos que es
simétrica, si lo es con respecto a la media.
Las curvas que representan a un conjunto de
datos, pueden ser analizadas de acuerdo a
su:
a) Simetría o Sesgo
b) Curtosis o apuntamiento

Las curvas simétricas, tienen una forma tal
que con una línea vertical que pase por el
punto más alto de la curva, dividirá el área de
esta en dos partes iguales.
SIMETRIA Y APUNTAMIENTO
Mo Me X = =
DISTRIBUCIÓN SIMÉTRICA
Las curvas sesgadas son aquellas cuyos valores
están concentrados en el extremo inferior o superior
de la escala de medición del eje horizontal. La “cola”
indica el tipo de sesgo.
SIMETRIA Y APUNTAMIENTO
DISTRIBUCIÓN ASIMÉTRICA
POSITIVA NEGATIVA
> Me > Mo

X X
< Me < Mo
SIMETRIA Y APUNTAMIENTO
INDICES DE ASIMETRÍA.
POSITIVA
NEGATIVA
3
3
1
) (
s
n x x
g
i i ¿
÷
=
COEFICIENTE DE FISHER
Si g
1
> 0  distribución
asimétrica positiva
Si g
1
< 0  distribución
asimétrica negativa
Si g
1
= 0  distribución
simétrica.

SIMETRÍA vs SESGO
COEFICIENTE DE ASIMETRÍA
Mide el grado de ASIMETRÍA de la distribución de frecuencia,
respecto a la curva de distribución normal que tiene
coeficiente igual a 0.
g
1
= 0 g
1
> 0 g
1
< 0
COEFICIENTE DE ASIMETRÍA DE PEARSON
Miden el grado de agudeza, la
mayor o menor cantidad de datos
que se agrupan en torno al valor
central. Se definen 3 tipos de
distribuciones según su grado de
curtosis:
Leptocúrtica (concentración al centro)
Mesocúrtica distribuidos simétricamente)
Platicúrtica (aplanada).

El Apuntamiento o Curtosis
SIMETRIA Y APUNTAMIENTO
SIMETRIA Y APUNTAMIENTO
INDICE DE CURTOSIS
Coeficiente de FISHER
3
) (
4
4
2
÷
÷
=
¿
s
n X x
g
i i
Si g
2
> 0 la distribución será leptocúrtica o apuntada
Si g
2
= 0 la distribución será mesocúrtica o normal
Si g
2
< 0 la distribución será platicúrtica o menos
apuntada que lo normal

g
2
= 0
g
2
> 0
g
2
< 0
COEFICIENTE DE CURTOSIS
Mide el grado de apuntamiento o achatamiento
de la distribución de frecuencia, respecto a la
curva de distribución normal que tiene coeficiente
igual a 0.
Califc, Acum.(base:19) Alumnos sec 2 (35 alumnos)
Calif.Acumulado en base a 19
N
°

a
l
u
m
n
o
s
0 4 8 12 16 20
0
3
6
9
12
15
Calif. Acum. (base 19). 24 alumnos seccion 1
Calif. Acum en base a 19
n
°

d
e

a
l
u
m
n
o
s
0 3 6 9 12 15 18
0
2
4
6
8