You are on page 1of 42

1

ESTADSTICA I
Ing. Miguel Angel Sevillanos
Dominguez

MEDIDAS DE TENDENCIA
CENTRAL
Anlisis estadsticos sencillos que se usan
para describir caractersticas, o elementos
tpicos, de las informacin que recogemos
con el fin de resumir los datos e indicar
similitudes entre ellos que nos permita
comparar dos grupos de datos.
Son puntos en una distribucin obtenida,
los valores medios o centrales de sta,
y nos ayudan a ubicarla dentro de la escala
de medicin.

Medidas de Posicin
3

Son aquellos valores numricos que nos


permiten o bien dar alguna medida de
tendencia central, dividiendo el recorrido
de la variable en dos, o bien fragmentar la
cantidad de datos en partes iguales. Las
ms usuales son la media, la mediana, la
moda, los cuartiles, quintiles, deciles y
percentiles. Pueden ser de dos tipos: de
tendencia central o de tipismo

Medidas de Posicin
4

Este
tipo
de
medidas
nos
permiten identificar y ubicar el
punto (valor) alrededor del cual se
tienden ha reunir los datos
(Punto central).
NOTA: en las poblaciones se
denominan parmetros y en las
muestras
se
les
denomina

Parmetros y
estadsticos

Parmetro: Es una cantidad numrica


calculada sobre una poblacin

La altura media de los individuos de un pas


La idea es resumir toda la informacin que hay en
la poblacin en unos pocos nmeros
(parmetros).

Estadstico: Es una cantidad numrica


calculada sobre una muestra

La altura media de los que estamos en este aula.

Somos una muestra (representativa?) de la


poblacin.

Si un estadstico se usa para aproximar un


parmetro tambin se le suele llamar estimador.

Normalmente nos interesa conocer un parmetro, pero


por la dificultad que conlleva estudiar a *TODA* la
poblacin, calculamos un estimador sobre una muestra
y confiamos en que sean prximos. Ms adelante

Medidas de Tendencia
Central
Las principales medidas de
tendencia central son tres:
moda, mediana y media.

El nivel de medicin de la
variable determina cual es la
medida de tendencia central
apropiada para interpretar.

Media
7

La idea de media o promedio


(tambin llamada media aritmtica)
formaliza el concepto intuitivo de
punto de equilibrio de las
observaciones. Es decir, es el punto
medio del recorrido de la variable
segn la cantidad de valores
obtenidos.

El clculo de la Media
8

Dado un conjunto de observaciones


la media se representa mediante
y se obtiene dividiendo
la suma de todos los datos por el nmero de ellos, es decir:

La interpretacin de la media como centro (o punto de


equilibrio) de los datos se apoya en una propiedad que
afirma que la suma de las desviaciones
de un conjunto de observaciones a su media es igual a cero;
es decir, puede probarse que

Propiedades de la Media
9

Su clculo es muy sencillo y en l


intervienen todos los datos.
Su valor es nico para una serie de datos
dada.
Se usa con frecuencia para comparar
poblaciones, aunque es ms apropiado
acompaarla
de
una
medida
de
dispersin.
Se interpreta como "punto de equilibrio" o
"centro de masas" del conjunto de datos,
ya que tiene la propiedad de equilibrar las
desviaciones de los datos respecto de su

Propiedades de la Media
10

Minimiza las desviaciones cuadrticas de


los datos respecto de cualquier valor
prefijado, esto es, el valor de
es mnimo cuando k= . Este resultado se
conoce como Teorema de Knig. Esta
propiedad permite interpretar uno de los
parmetros
de
dispersin
ms
importantes: la varianza.
Se ve afectada por transformaciones
afines (cambios de origen y escala), esto
es, si

Propiedades de la Media
11

Es poco sensible a fluctuaciones


muestrales, por lo que es un parmetro
muy til en inferencia estadstica.

Inconvenientes de su Uso
12

Para datos agrupados


en
intervalos
(variables continuas)
su valor oscila en
funcin de la cantidad
y amplitud de los
intervalos
que
se
consideren.
La
estatura media como
resumen
de
una
poblacin homognea

Inconvenientes de su Uso
13

Es una medida a cuyo significado afecta


sobremanera la dispersin, de modo que cuanto
menos homogneos sean los datos, menos
informacin proporciona. Dicho de otro modo,
poblaciones muy distintas en su composicin
pueden tener la misma media. Por ejemplo, un
equipo de baloncesto con cinco jugadores de igual
estatura, 1,95 m, evidentemente, tendra una
estatura media de 1,95 m, valor que representa
fielmente a esta poblacin homognea. Sin
embargo, un equipo de jugadores de estaturas ms
heterogneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y
1,70 m, por ejemplo, tendra tambin, como puede

Inconvenientes de su Uso
14

En el clculo de la media no todos los


valores contribuyen de la misma manera.
Los valores altos tienen ms peso que los
valores cercanos a cero. Por ejemplo, en el
clculo del salario medio de un empresa,
el salario de un alto directivo que gane
1.000.000 de tiene tanto peso como el
de diez empleados "normales" que ganen
1.000 . En otras palabras, se ve muy
afectada por valores extremos.
No se puede determinar si en una

Ejemplo
15

Ejemplo 1:
8, 7, 6, 4, 3, 2, 6, 9, 8
suma= 53
n= 9
53/9= 5.88
Ejemplo 2:
5, 8, 12, 4, 6, 8
5+8+12+4+6+7= 42/6= 7
Luego el promedio es 7

16

La media aritmtica de un conjunto de datos es el cociente entre la suma


de todos los datos y el nmero de estos.
Ejemplo: las notas de Juan el ao pasado fueron:
5, 6, 4, 7, 8, 4, 6
La nota media de Juan es:

Hay 7 datos
que suman 40

5 6 4 7 8 4 6 40

5,7
Nota media =
7
7

Ejemplo en una serie simple


17

La tabla muestran las edades de 60


personas
55
58
78
52
54
63
52
54
53
50
63
68
54
54
55

52
65
58
54
68
54
50
50
55

64
58
49
54
55
46
65
52
58

56
56
53
56
57
75
64
65
65

58
50
63
63
49
56
65
68
52

78
52
52
48
53
65
65
63
70

18

Datos Organizados en
Tablas
Si est en intervalos usar como xi las
marcas de clase. Si no ignorar la
columna
Variable de intervalos
fr. fr. ac.
L0 L1

x1

n1

N1

L1 L2

x2

n2

N2

...
Lk-1 Lk

xk

nk

Nk

xn

x
i

i i

19

Ejemplo para una serie de


datos y frecuencias
X
(edad
)

X
(edad
)

f(x)

f(x)

46

46

58

290

48

48

63

315

49

98

64

128

50

200

65

455

52

364

68

204

53

159

70

70

54

378

75

75

55

220

78

156

56

57

224
=
57

60

3487

20

Clculo de la media aritmtica cuando los datos se repiten.


1. Se multiplican los datos por sus frecuencias absolutas respectivas, y
se suman.
2. El resultado se divide por el total de datos.
Ejemplo. Las notas de un grupo de alumnos fueron:
Datos por frecuencias

Media

129
5,1
25

Total de datos

21

La media en una serie de


clases y frecuencias
x
45
50
55
60
65
70
75
Totales

f
50
55
60
65
70
75
80

Pm f Pm
4 47,5
190
1102,
21 52,5
5
14 57,5
805
7 62,5 437,5
10 67,5
675
1 72,5 72,5
3 77,5 232,5
60
3515

Mediana
22

La mediana, a diferencia de la media no


busca el valor central del recorrido de la
variable
segn
la
cantidad
de
observaciones, sino que busca determinar
el valor que tiene aquella observacin que
divide la cantidad de observaciones en dos
mitades iguales. Por lo tanto es necesario
atender a la ordenacin de los datos, y
debido a ello, este clculo depende de la
posicin relativa de los valores obtenidos.
Es necesario, antes que nada, ordenar los
datos de menor a mayor (o viceversa).

Mediana
23

En un conjunto de datos numricos


ordenados en forma creciente o
decreciente, es el valor de la serie de
datos que se sita justamente en el
centro de la muestra (un 50% de
valores son inferiores y otro 50% son
superiores).
Si la muestra esta compuesta por un
numero impar de datos la mediana es
el dato central
Si la muestra esta compuesta por un
numero par de datos la mediana es el

24

Mediana para datos no


Agrupados
PAR
1,2,3,4,5,6
La mediana est entre 3 y 4.
IMPAR:
1,2,3,4,5
La mediana es el 3

25

Mediana para datos


Agrupados
La mediana se encuentra en el intervalo
donde la frecuencia acumulada llega hasta
la mitad de la suma de las frecuencias
absolutas.
Es decir tenemos que buscar el intervalo
en el que se encuentre.N / 2

Luego
calculamos segn la siguiente
frmula:

Donde:
26

Li-1:es el lmite inferior de la clase


donde se encuentra la mediana
N
/ 2:es la semisuma de las
frecuencias absolutas.
F :es
la frecuencia acumulada
i-1
anterior a la clase mediana.
fi : es la frecuencia absoluta del
intervalo mediano.
t es la amplitud de los intervalos.
i:

Ejemplo:
27

En la siguiente tabla se muestran las


edades de un grupo de personas:
Edad
[0-10)
[10-20)
[20- 30)
[30-40)
[40- 50)

Marca
clase
Xi
5
15
25
35
45

Frecuencia
Frecuencia
acumulada
f
Fi
3
3
9
6
7
16
12
28
3
31

Se calcula la Media: 26,94

28

Lo primero que debemos hacer para


poder
calcular
la
mediana
es
identificar laclase mediana. Para
esto tenemos que buscar el intervalo
en el que se encuentre.N / 2
en este caso N / 2 = 31 / 2 15,5

29

Ahora debemos buscar el intervalo donde


la frecuencia acumulada (Fi) contenga el
valor obtenido (15,5).
Veamos:
Edad
[0-10)
[10-20)
[20- 30)
[30-40)
[40- 50)

Frecuencia
Marca clase Frecuencia
acumulada
Xi
f
Fi
5
3
3
15
9
6
25
7
16
35
12
28
45
3
31

30

Ahora reemplazamos los datos en la


Formula

31

Propiedades de la
mediana
Es menos sensible que la media a
oscilaciones de los valores de la
variable. Un error de transcripcin en
la serie del ejemplo anterior en,
pongamos por caso, el ltimo nmero,
deja a la mediana inalterada.
Como se ha comentado, puede
calcularse para datos agrupados en
intervalos, incluso cuando alguno de
ellos no est acotado.

32

Propiedades de la
mediana
No se ve afectada por la dispersin. De
hecho, es ms representativa que la
media aritmtica cuando la poblacin es
bastante heterognea. Suele darse esta
circunstancia cuando se resume la
informacin sobre los salarios de un pas o
una empresa. Hay unos pocos salarios
muy altos que elevan la media aritmtica
haciendo que pierda representatividad
respecto al grueso de la poblacin. Sin
embargo, alguien con el salario "mediano"

33

Inconvenientes de la
mediana
Sus principales inconvenientes son que en
el caso de datos agrupados en intervalos,
su valor vara en funcin de la amplitud de
estos. Por otra parte, no se presta a
clculos algebraicos tan bien como la
media aritmtica.

Moda
34

La moda es el dato ms repetido, el valor


de la variable con mayor frecuencia
absoluta. En cierto sentido la definicin
matemtica corresponde con la locucin
"estar de moda", esto es, ser lo que ms
se lleva. Su clculo es extremadamente
sencillo, pues slo necesita un recuento.
En variables continuas, expresadas en
intervalos, existe el denominado intervalo
modal o, en su defecto, si es necesario
obtener un valor concreto de la variable,

35

Por ejemplo, el nmero de personas en


distintos vehculos en una carretera: 5-7-46-9-5-6-1-5-3-7. El nmero que ms se
repite es 5, entonces la moda es 5.
Hablaremos de una distribucin bimodal
de los datos, cuando encontremos dos
modas, es decir, dos datos que tengan la
misma frecuencia absoluta mxima.
Cuando en una distribucin de datos se
encuentran tres o ms modas, entonces
es multimodal. Por ltimo, si todas las

Ejemplo
36

Buscar la moda de:


5 12 9 5 8 7 1
Como la moda es el nmero que ms se repite, la
moda es 5.
Buscar la moda de:
14 16 18 16 15 12 14 14 16 18 20
16 16
El 14 se repite 3 veces.
El 18 se repite 2 veces.
El 16 se repite 5 veces.
Por lo tanto, la moda es 16.
Buscar la moda de :

37

Ejemplo.

Una zapatera ha vendido en una


semana los zapatos que se reflejan en
la tabla:

N de
38 39 40 41 42 43 44 45
calzado
N de
16 21 30 35 29 18 10 7
personas
El nmero de zapato ms
vendido, el dato con
Lo compran 35 personas
mayor frecuencia
absoluta, es el 41.
La moda es
41.

38

Moda para datos


Agrupados
Se identifica el intervalo modal
Edad
[0-10)
[10-20)
[20-30)
[30-40)
[40- 50)

Frecuen
Marca
Frecuen
cia
clase
cia (f) acumula
(Xi)
da (F)
5
3
3
15
6
9
25
7
16
35
12
28
45
3
31

39

Se reemplazan los datos de la formula

Propiedades de la Moda
40

Clculo sencillo.
Interpretacin muy clara.
Al depender slo de las frecuencias,
puede
calcularse
para
variables
cualitativas. Es por ello el parmetro
ms utilizado cuando al resumir una
poblacin no es posible realizar otros
clculos, por ejemplo, cuando se
enumeran en medios periodsticos las
caractersticas
ms
frecuentes
de
determinado sector social. Esto se

Inconvenientes
41

Su valor es independiente de la
mayor parte de los datos, lo que la
hace muy sensible a variaciones
muestrales. Por otra parte, en
variables agrupadas en intervalos, su
valor depende excesivamente del
nmero de intervalos y de su
amplitud.
Usa muy pocas observaciones, de tal
modo que grandes variaciones en los

Inconvenientes
42

No siempre se sita hacia el centro


de la distribucin.
Puede haber ms de una moda en el
caso en que dos o ms valores de la
variable
presenten
la
misma
frecuencia (distribuciones bimodales
o multimodales).

You might also like