Professional Documents
Culture Documents
S2&S3 Estadistica - Descriptiva
S2&S3 Estadistica - Descriptiva
Solución
• Linealidad
Ejemplo
Solución
Ejemplo
Solución
Ejemplo
Xi ni
Calcular la media de la siguiente distribución. 38432 4
38434 8
38436 4
38438 3
Si efectuamos un cambio de variable 38440 8
y i x i 38436
2
tomando como nueva variable el valor más centrado, tendremos::
xi ni yi yi ni
38432 4 (38432 - 38436)/2 = -2 -8
38434 8 (38434 - 38436)/2 = -1 -8
38436 4 (38436 - 38436)/2 = 0 0
38438 3 (38438 - 38436)/2 = 1 3
38440 8 (38440 - 38436)/2 = 2 16
n = 27 3
Medidas de Centralización
Mediana: La mediana es el valor central de la variable, es
decir, supuesta una muestra ordenada en orden creciente o
decreciente, es el valor que divide en dos partes a dicha
muestra. Para calcular la mediana debemos tener en cuenta
si la variable es discreta o continua.
Ventajas
• Representativa para datos en escala ordinal.
• Influenciada por valores centrales y es insensible a
los valores extremos u “outliers ”.
• No tiene en cuenta todas las observaciones.
• Depende de la posición relativa de los datos, no de sus
valores.
• Es función de los intervalos escogidos.
Propiedades
• Si una población está formada por 2 subpoblaciones de
medianas Med1 y Med2, sólo se puede afirmar que la mediana,
Med, de la población está comprendida entre Med1 y Med2.
Ejemplo:
Intervalo mediano
Ventajas y Desventajas
• Pueden existir varias modas (distrib.
bimodales, trimodales,...)
• No tiene en cuenta todas las
observaciones.
• Es menos representativa
que la media.
• Se puede calcular para características
• Es función de los intervalos elegidos a través de su
amplitud, número y límites de los mismos.
• Aunque el primero o el último de los intervalos no
posean extremos inferior o superior respectivamente, la
moda puede ser calculada.
• La moda también es menos afectada por unas pocas
observaciones atípicas.
• Si el conjunto de datos es bimodal, su uso puede ser
confuso.
Figura: Cálculo geométrico de la moda
A.- Cálculo de la moda (caso discreto):
X: nº hijos fi hi %
0 15 15/100 15
Mayor
Moda 1 31 31/100 31 frecuencia
2 50 50/100 50
3 2 2/100 2
>4 2 2/100 2
B.- Cálculo de la moda (caso continuo)
Mo L i1
ni ni1 •a i
(n n )(n n )
i i1 i i1
Intervalo modal
Relación entre media, mediana y moda
• En el caso de distribuciones unimodales, la mediana está con
frecuencia comprendida entre la media y la moda (incluso más
cerca de la media).
• En distribuciones que presentan cierta inclinación, es más
aconsejable el uso de la mediana. Sin embargo en estudios
relacionados con propósitos estadísticos y de inferencia suele
ser más apta la media.
Ejemplo
• Un vendedor minorista popular de equipos para acampar, se beneficiaría muy poco del
hecho de saber que la talla promedio de las botas de excursionismo que vendió fue de
7.3492. De mayor utilidad para las decisiones futuras del negocio será conocer el
tamaño modal reconociendo que vendió más botas de talla 8 que de cualquier otra
talla.
• Sin embargo, si se desea comercializar una nueva tienda de acampar. Las dimensiones
de la tienda dependerán, entre otras cosas, de la estatura promedio de los adultos.
• La experiencia ha demostrado que la media sirve muy bien como medida de tendencia
central cuando se trata de productos que están hechos para acomodarse a la
estatura de las personas. El tamaño de los marcos de las puertas de las entradas de
los hogares y negocios minoristas, y gran parte del mobiliario se fabrica con base en la
estatura promedio.
Observación:
Para distribuciones unimodales moderadamente asimétricas
(sesgadas) tenemos las siguientes tres relaciones empíricas entre
la media, moda y mediana (válidas tanto para datos aislados
como para datos agrupados por clases):
Medidas de Localización
Cuantiles: Son medidas de localización que dividen a la
serie estadística en grupos particulares
percentil
Ejemplo: n = 12
111222334567
kn
N i1 4 N i
k•
kn 10
Ni1 Ni d L i1 n N i1 • ai
10
k
N N
i i1
k•
kn
n 100 N i1 • ai
Ni1 Ni p k Li1 N i N i1
100
Medidas de Localización
Ejemplo:
Cuartiles, Deciles y Percentiles: Caso continuo
Intervalo cuartílico
para Q1
1(50)
6 4 12.5 16 i
2
Ejercicios
1. Supóngase que un estudiante tiene las siguientes notas en cuatro cursos
matriculados un cuatrimestre: 67, 82, 90, 71. El número de créditos que
vale cada curso es, respectivamente: 3, 2, 2, 4. Calcule un promedio
adecuado.
40
15
Frecuencia
Frecuencia
30
10
20
10
0 0
0 ,00 2,0 0 4 ,0 0 6,00 8 ,00 10 ,00 0,00 2 ,00 4,00 6 ,00 8,00 1 0,00
A C
* 25
20
Frecuencia
15
10
0
-2 ,00 0,0 0 2,00 4 ,00 6,0 0 8,00 1 0 ,00
B
4. Según la distribución de las notas (en una escala de 1 a 10), ¿cómo
crees que es la prueba A?
a. Fácil *
b. Normal, ni fácil ni difícil
c. Difícil
A B
1 00 80
80
60
Frecuencia
Frecuencia
60
40
40
20
20
0 0
2,00 3,00 4,00 5,00 6 ,00 7,00 8 ,0 0 9,0 0 1 ,0 0 2 ,00 3,0 0 4,00 5 ,00 6 ,00 7,0 0 8 ,00
A B
5. La tabla presentada a continuación representa el consumo de energía
eléctrica de 80 usuarios en el primer mes del 2005:
Consumo Número de
(Kwh) usuarios
5 – 25 04
25 – 45 06
45 – 65 14
65 – 85 26
85 – 105 14
105 – 125 08
125 – 145 06
145 – 165 02
Total 80
Statistics
Yi
N Valid 80
Missing 0
Mean 79.50
Median 78.00a
Mode 75
Percentiles 25 58.00b
50 78.00
75 100.45
a. Calculated from grouped data.
b. Percentiles are calculated from grouped data.
Solución con Casio fx-9860
Media
Moda
Mediana
Cuartiles, deciles y percentiles
Ejercicio 3: Nº de
Salarios empleados
La distribución de los costes salariales de los 0-15000 2145
10000 empleados de una multinacional se 15000-20000 1520
presenta en la tabla siguiente:
20000-25000 840
Calcular el salario medio por trabajador, el
25000-30000 955
salario típico y el salario central. Calcular
30000-35000 1110
también el primer cuartil salarial y el percentil
75. Interpretar. 35000-40000 2342
40000-50000 610
50000-100000 328
100000-300000 150
Solución :
La tabla siguiente contiene los elementos relativos a la distribución de
frecuencia de la variable salario (X) necesarios para realizar los cálculos
pedidos en el problema.
Nº de
empleado Marcas =
Salarios s (ni) xi xi* ni Ni ci di= ni/ ci
0-15000 2145 7500 16087500 2145 15000 0,143
15000-20000 1520 17500 26600000 3665 5000 0,304
20000-25000 840 22500 18900000 4505 5000 0,168
25000-30000 955 27500 26262500 5460 5000 0,191
30000-35000 1110 32500 36075000 6570 5000 0,222
35000-40000 2342 37500 87825000 8912 5000 0,4684
40000-50000 610 45000 27450000 9522 10000 0,061
50000-100000 328 75000 2460000 9850 50000 0,0056
100000-300000 150 200000 30000000 10000 200000 0,00075
10000 293800000
Para hallar el salario medio por trabajador calculamos la media de la
variable X.
Para calcular el primer cuartil observamos que como N/4 = 2500, el intervalo
relativo al primer cuartel será (15000-20000) ya que Ni- 1<2500<Ni es
equivalente en este problema a 2145<2500<3665.El primer cuartel se
calculará como sigue:
El primer cuartel se interpreta como el valor de la variable para el que la
cuarta parte de los valores son menores que él y las tres cuartas partes
restantes son superiores.
A partir de los datos se observa que en el caso de los ateos hay mas
probabilidad de que los matrimonios acaben en divorcio 28.17%. En la religión
musulmana ocurrirá justo lo contrario con solo un 2% de divorcios.
b) Obtener las frecuencias marginales absolutas y relativas de la
variable divorcio.