Professional Documents
Culture Documents
Carmen Le Foulon
ICP 0502
Jueves 16 de agosto
Posición (percentiles)
Tabla de frecuencia
Gráfico de barras
¿Ud. se siente...?
40%
30%
Porcentaje
20%
10%
0%
IVC = 0, 86
Carmen Le Foulon (ICP 0502) Estadı́stica descriptiva Jueves 16 de agosto 10 / 39
Estadı́stica descriptiva univariada
Repasando percentiles
Repasando percentiles
¿Cómo se construyen?
Primero, los datos se ordenan de menor a mayor.
k
Percentilk = n ∗ 100
Ası́, por ejemplo, si tenemos 15 datos, y queremos definir el percentil 25:
2, 3, 3, 5, 7, 8, 8, 9, 10, 10, 11, 12, 14, 15, 17.
¿Cuál es el dato ordenado que corresponde al Percentil 25?
25
De la fórmula: Percentil25 = 15 ∗ 100 = 3,5, como no es entero, el percentil
25 corresponde a la observación ubicada en la posición 4.
En este caso: 2, 3, 3, 5, 7, 8, 8, 9, 10, 10, 11, 12, 14, 15, 17.
Cómo lo leemos? El 25 % de la muestra tiene 5 o menos.
Repasando percentiles
Percentiles ”famosos”:
Cuartiles: dividimos la muestra en 4 grupos iguales: cada una agrupa al 25 %,
en base al percentil 25, percentil 50 y percentil 75.
Quintiles: dividimos la muestra en 5 grupos iguales: cada una agrupa al 20 %,
en base al percentil 20, percentil 40, percentil 60 y percentil 80.
Deciles: dividimos la muestra en 10 grupos iguales: cada uno agrupo al 10 %
de la muestra. Por ejemplo: decil de ingresos.
Tabla de frecuencia
Gráfico de barras
40%
30%
Porcentaje
20%
10%
0%
Carmen Le Foulon (ICP 0502) Estadı́stica descriptiva Jueves 16 de agosto 18 / 39
Estadı́stica descriptiva univariada
Medidas resumen
Forma de la distribución
Unimodal o bimodal
Simetrı́a o asimetrı́a en distribuciones unimodales:
Asimétrica sesgada a la derecha o asimetrı́a positiva: cola más dispersa está en
los valores más altos.
Asimétrica sesgada a la izquierda o asimetrı́a negativa: cola más dispera está
en los valores más bajos.
Simétrica
Diferentes medidas según cualitativos ordinales o cuantitativos
Curtosis o apuntamiento: en relación a la distribución normal, si acumula más
o menos casos en las colas que una distribución normal con una dispersión
similar.
Medida de dispersión:
Varianza población
PN
i=1 (xi − x̄)2
V (x) =
N
OJO: sólo se divide por N cuando estamos calculando la varianza de la
población - tenemos toda la población. En el caso de estadı́stica descriptiva,
la muestra es la población. Pero, cuando pasamos a la estimación debemos
dividir por (N − 1)
Desviación estándar
p
DV (x) = 2 V (x)
s
PN 2
2
i=1 (xi − x̄)
DV (x) =
N
Otra medida es el rango intercuartiles, el cual, al igual que la mediana, es
más resistente que la varianza y desviación estándar.
Variables cuantitativas
Representaciones gráficas:
Permiten ver la distribución de la variable, su forma.
Histograma
Identificar el rango
Definir extensión de los intervalos
Generar tabla de frecuencia en base a los intervalos creados
Graficar
Histograma Edad
75
Frecuencia
50
25
18 22 26 30 34 38 42 46 50 54 58 62 66 70 74 78 82 86 90 94
Edad
Datos bivariados
El cuarteto de Anscombe
El cuarteto de Anscombe
Ejemplo boxplot:
Distribución ingreso por deciles de ingreso