You are on page 1of 13

ARITMÉTICA

Tema:
Estadística Descriptiva II

Docente:
Miguel Hernández
OBJETIVOS

Recordar las diferentes medidas de tendencia central para


datos no agrupados y agrupados.

Recordar algunas medidas de dispersión para datos no


agrupados y agrupados.

Resolver problemas utilizando las medidas de tendencia


central y de dispersión.
INTRODUCCIÓN
Control estadístico de la calidad.
MEDIDAS DE TENDENCIA CENTRAL: b) Mediana (𝑴𝑴𝑴𝑴):
Es el valor que divide a la muestra en 2 partes con
Las medidas de tendencia central son medidas estadís-
la misma cantidad de datos. Para su determinación
ticas que pretenden resumir en un solo valor a un
es necesario que los datos se encuentren
conjunto de valores. Representan un centro en torno al
ordenados de forma creciente o decreciente. Se
cual se encuentra ubicado el conjunto de los datos. Las
calcula de la siguiente manera:
medidas de tendencia central más utilizadas son: media,
mediana y moda. Para una cantidad par de datos:

1. Medidas de tendencia central para datos no 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 2 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
𝑀𝑀𝑀𝑀 =
agrupados: 2

a) Media (�
𝒙𝒙): Para una cantidad impar de datos:
Es el promedio aritmético de los datos, 𝑀𝑀𝑀𝑀 = 𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
calculándose de la siguiente manera:
c) Moda (𝑴𝑴𝑴𝑴):
𝑑𝑑𝑑𝑑𝑑𝑑𝑜𝑜1 + 𝑑𝑑𝑑𝑑𝑑𝑑𝑜𝑜2 + 𝑑𝑑𝑑𝑑𝑑𝑑𝑜𝑜3 + ⋯ + 𝑑𝑑𝑑𝑑𝑑𝑑𝑜𝑜𝑛𝑛 Es el valor o los valores que se repiten la mayor
𝑥𝑥̅ =
𝑛𝑛 cantidad de veces. Si hay un solo valor la
distribución se llama unimodal, si hay más de una
moda se llama polimodal.
Ejemplo: Ejercicio 1:
Sean los datos no clasificados: Las edades de 7 personas, tienen media, mediana y moda
17; 18; 18; 19; 20; 22; 23; 23; 23; 25 iguales y son 15; 𝑎𝑎; 11; 18; 14; 𝑏𝑏; 19. Calcule 𝑎𝑎 + 𝑏𝑏, si
una de las edades es menor de 11 años.
Media 𝑥𝑥̅ :
Resolución:
17 + 18 + 18 + 19 + 20 + 22 + 23 + 23 + 23 + 25
𝑥𝑥̅ = Piden: El valor de 𝑎𝑎 + 𝑏𝑏.
10
𝑥𝑥̅ = 20,8 Ordenando los datos: 𝑎𝑎; 11; 14; 𝑏𝑏; 15; 18; 19
Valor menor a 11 La moda y la mediana
Mediana 𝑀𝑀𝑀𝑀 : son iguales
20 + 22 Para que se cumpla que mediana y moda sean iguales es
𝑀𝑀𝑀𝑀 = 𝑀𝑀𝑀𝑀 = 21
2 necesario que 𝑏𝑏 sea 14 o 15. Por condición, la media
también vale 𝑏𝑏.
Moda 𝑀𝑀𝑀𝑀 :
𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑎𝑎 + 𝑏𝑏 + 77
𝑀𝑀𝑀𝑀 = 23 Porque se repite 3 veces 𝑥𝑥̅ = = = 𝑏𝑏 𝑎𝑎 + 77 = 6𝑏𝑏
7 7
Entonces: 𝑎𝑎 = 7 𝑏𝑏 = 14
Observación:
Si en un conjunto de datos no hay moda se denomina Por tanto 𝑎𝑎 + 𝑏𝑏 = 21
Respuesta: 21
AMODAL a dicha distribución.
2. Medidas de tendencia central para datos agrupados: Se usará luego:
a) Media (�
𝒙𝒙): 𝑛𝑛
− 𝐹𝐹𝑖𝑖−1
Se calcula de la siguiente manera: 𝑀𝑀𝑀𝑀 = 𝐿𝐿𝑖𝑖𝑖𝑖𝑖𝑖 + 𝑊𝑊𝑖𝑖 2
𝑓𝑓𝑖𝑖
𝑘𝑘
∑𝑘𝑘𝑖𝑖=1(𝑓𝑓𝑖𝑖 )(𝑥𝑥𝑖𝑖 )
𝑥𝑥̅ = o 𝑥𝑥̅ = � (𝑓𝑓𝑖𝑖 )(ℎ𝑖𝑖 ) 𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷:
𝑛𝑛 𝑖𝑖=1
𝐿𝐿𝑖𝑖𝑖𝑖𝑖𝑖 : 𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷: 𝑊𝑊𝑖𝑖 : 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚
𝑘𝑘: 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑑𝑑𝑑𝑑 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝑛𝑛/2: 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚
𝑓𝑓𝑖𝑖 : 𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝐹𝐹𝑖𝑖−1 : 𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹. 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑎𝑎 𝑙𝑙𝑙𝑙 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚
𝑥𝑥𝑖𝑖 : 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
𝑓𝑓𝑖𝑖 : 𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚
ℎ𝑖𝑖 : 𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟
𝑛𝑛: 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑

b) Mediana (𝑴𝑴𝑴𝑴):
Para su cálculo se debe ubicar primero la clase
mediana que será aquella cuya 𝐹𝐹𝑖𝑖 sea por primera
vez mayor o igual a la mitad de la cantidad de
datos.
c) Moda (𝑴𝑴𝑴𝑴): Ejercicio 2:
Para su cálculo se debe ubicar la clase que tenga la A continuación se muestran 𝑰𝑰𝒊𝒊 𝒙𝒙𝒊𝒊 𝒇𝒇𝒊𝒊 𝑭𝑭𝒊𝒊
mayor cantidad de datos, usándose luego: los datos clasificados de las
edades de un grupo de [5; 15⟩ 10 4 4
𝑑𝑑1 personas atendidas en un día [15; 25⟩ 20 8 12
𝑀𝑀𝑀𝑀 = 𝐿𝐿𝑖𝑖𝑖𝑖𝑖𝑖 + 𝑊𝑊𝑖𝑖 en un hospital de Lima, a
𝑑𝑑1 + 𝑑𝑑2 [25; 35⟩ 30 10 22
partir de dicha información
determinar la media, la [35; 45⟩ 40 12 34
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷:
mediana y la moda. [45; 55] 50 6 40
𝐿𝐿𝑖𝑖𝑖𝑖𝑖𝑖 : 𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚
𝑊𝑊𝑖𝑖 : 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 Resolución:
𝑑𝑑1 = 𝑓𝑓𝑖𝑖 − 𝑓𝑓𝑖𝑖−1 Piden: La media, la mediana y la moda.
𝑑𝑑2 = 𝑓𝑓𝑖𝑖 − 𝑓𝑓𝑖𝑖+1
Para la media (𝑥𝑥):
̅
𝑓𝑓𝑖𝑖 : 𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚
𝑓𝑓𝑖𝑖−1 : 𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹. 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑎𝑎 𝑙𝑙𝑙𝑙 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 ∑𝑘𝑘𝑖𝑖=1(𝑓𝑓𝑖𝑖 )(𝑥𝑥𝑖𝑖 )
𝑥𝑥̅ =
𝑛𝑛
𝑓𝑓𝑖𝑖+1 : 𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹. 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑎𝑎 𝑙𝑙𝑙𝑙 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚
10 4 + 20 8 + 30 10 + 40 12 + 50(6)
50 6
𝑥𝑥̅ =
40

𝑥𝑥̅ = 32
Para la mediana (𝑀𝑀𝑀𝑀): Para la moda (𝑀𝑀𝑀𝑀):
Dado que son 40 datos, se busca la 𝐹𝐹𝑖𝑖 en la que por Se busca la 𝑓𝑓𝑖𝑖 en la que hay más datos:
primera vez aparezca 20 o más datos:
𝑰𝑰𝒊𝒊 𝒙𝒙𝒊𝒊 𝒇𝒇𝒊𝒊 𝑭𝑭𝒊𝒊
𝑰𝑰𝒊𝒊 𝒙𝒙𝒊𝒊 𝒇𝒇𝒊𝒊 𝑭𝑭𝒊𝒊
[5; 15⟩ 10 4 4
[5; 15⟩ 10 4 4
[15; 25⟩ 20 8 12
[15; 25⟩ 20 8 12
[25; 35⟩ 30 10 22
[25; 35⟩ 30 10 22 Clase mediana
[35; 45⟩ 40 12 34 Clase modal
[35; 45⟩ 40 12 34
[45; 55] 50 6 40
[45; 55] 50 6 40

𝑛𝑛 𝑑𝑑1
− 𝐹𝐹𝑖𝑖−1 𝑀𝑀𝑀𝑀 = 𝐿𝐿𝑖𝑖𝑖𝑖𝑖𝑖 + 𝑊𝑊𝑖𝑖
2 𝑑𝑑1 + 𝑑𝑑2
𝑀𝑀𝑀𝑀 = 𝐿𝐿𝑖𝑖𝑖𝑖𝑖𝑖 + 𝑊𝑊𝑖𝑖
𝑓𝑓𝑖𝑖
(12 − 10)
𝑀𝑀𝑀𝑀 = 35 + 10
40/2 − 12 12 − 10
(12 10) + (12 − 6)
𝑀𝑀𝑀𝑀 = 25 + 10
10
𝑀𝑀𝑀𝑀 = 37,5
𝑀𝑀𝑀𝑀 = 33
MEDIDAS DE TENDENCIA CENTRAL PARA Si tenemos una tabla de distribución simétrica, con una
UNA TABLA DE DISTRIBUCIÓN SIMÉTRICA cantidad impar de intervalos y además es bimodal, se
cumplirá:
Si tenemos una tabla de distribución simétrica, con una
cantidad impar de intervalos y además unimodal, 𝑓𝑓𝑖𝑖
gráficamente será de la forma: 𝑀𝑀𝑀𝑀𝑀 𝑀𝑀𝑀𝑀𝑀

𝑓𝑓𝑖𝑖

𝑥𝑥̅ 𝐼𝐼𝑖𝑖
𝑀𝑀𝑀𝑀

𝑥𝑥̅ 𝐼𝐼𝑖𝑖 Es decir se afirmará que:


𝑀𝑀𝑀𝑀
𝑀𝑀𝑀𝑀 𝑀𝑀𝑀𝑀𝑀 < 𝑥𝑥̅ = 𝑀𝑀𝑀𝑀 < 𝑀𝑀𝑀𝑀𝑀

Es decir se afirmará que: 𝑥𝑥̅ = 𝑀𝑀𝑀𝑀 = 𝑀𝑀𝑀𝑀


MEDIDAS DE DISPERSIÓN: Se calcula:
2 2
Miden el grado de variabilidad (expansión o compresión) ∑ 𝑛𝑛
𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ ∑ 𝑛𝑛
𝑥𝑥𝑖𝑖
de los valores de la variable. Dicho en otros términos las 𝜎𝜎 2 = 𝑖𝑖=1 o 𝜎𝜎 2 = 𝑖𝑖=1 − 𝑥𝑥̅ 2
𝑛𝑛 𝑛𝑛
medidas de dispersión pretenden evaluar en qué medida
los datos difieren entre sí. Las más utilizadas son la
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷:
varianza y la desviación estándar.
𝑥𝑥𝑖𝑖 : 𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑑𝑑𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 La variabilidad
𝑑𝑑9 es la diferencia 𝑥𝑥:̅ 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
𝑑𝑑8 del valor con 𝑛𝑛: 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
𝑑𝑑6 𝑑𝑑7
su promedio.
𝑥𝑥̅ b) Desviación estándar 𝝈𝝈 :
𝑑𝑑5
𝑑𝑑4
𝑑𝑑1
𝑑𝑑2 𝑑𝑑3 Representa la variabilidad promedio de una serie
de datos respecto a su media. Se calcula como la
𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 raíz cuadrada de la varianza.
1. Medidas de dispersión para datos no agrupados:
𝜎𝜎 = 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉
a) Varianza 𝝈𝝈𝟐𝟐 :
Representa la variabilidad cuadrática promedio de
una serie de datos respecto a su media.
2. Medidas de dispersión para datos agrupados: b) Desviación estándar 𝝈𝝈 :
Se calcula:
a) Varianza 𝝈𝝈𝟐𝟐 :
Se calcula: 𝜎𝜎 = 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉
2
2
∑𝑘𝑘𝑖𝑖=1 𝑓𝑓𝑖𝑖 × 𝑋𝑋𝑖𝑖 − 𝑥𝑥̅ Observación:
𝜎𝜎 =
𝑛𝑛
𝑓𝑓𝑖𝑖
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝑞𝑞𝑞𝑞𝑞𝑞: ℎ𝑖𝑖 =
También se puede usar: 𝑛𝑛
2
∑ 𝑘𝑘
𝑓𝑓𝑖𝑖 × 𝑋𝑋𝑖𝑖 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸:
𝜎𝜎 2 = 𝑖𝑖=1 − 𝑥𝑥̅ 2
𝑛𝑛 𝑘𝑘
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷: 𝜎𝜎 2 = � ℎ𝑖𝑖 × (𝑋𝑋𝑖𝑖 − 𝑥𝑥)̅ 2
𝑋𝑋𝑖𝑖 : 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑖𝑖=1
𝑥𝑥:̅ 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
𝑛𝑛: 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑘𝑘

𝑓𝑓𝑖𝑖 : 𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝜎𝜎 2 = � ℎ𝑖𝑖 × (𝑋𝑋𝑖𝑖 )2 −𝑥𝑥̅ 2


𝑖𝑖=1
w w w. academ iacesar val lej o.edu .pe

You might also like