You are on page 1of 45

ELEMENTOS DE

ESTADÍSTICA DESCRIPTIVA
Introducción
 La Estadística es una ciencia que
facilita la solución de problemas en
los cuales necesitamos conocer
características sobre el
comportamiento de algún suceso o
evento.

 Nos permite inferir el


comportamiento de sucesos iguales o
similares sin necesidad de que estos
ocurran.
Conceptos básicos
 Estadística:
Es la ciencia que se encarga de recolectar,
organizar, resumir y analizar datos para
después obtener conclusiones. Se divide en
Estadística Descriptiva y Estadística Inferencial.

 Estadística descriptiva:
Se encarga de la recolección, organización,
presentación y análisis de los datos de una
población.
 Estadística inferencial:
Se encarga de analizar la información
presentada por la estadística descriptiva
mediante técnicas que nos ayuden a conocer,
con determinado grado de confianza, a la
población. Lo que nos permite tomar
decisiones.
 Población:
Conjunto definido de TODOS los INDIVIDUOS,
COSAS de donde se observa cierta característica
en común.

Ejemplo: El conjunto formado por todos los estudiantes


chilenos que rinden la PSU 2018.
 Muestra:
Subconjunto representativo de una población, que
intenta reflejar las características de la población
lo mejor posible.
Ejemplo: El conjunto formado por 1500 estudiantes
chilenos extraídos de todas las regiones del país, que
rinden la PSU 2018.
El número de individuos que integran la muestra,
llamado tamaño de la muestra se representa con
la letra n.
 Individuo:
Es el elemento de la población o de la muestra que
aporta información sobre lo que se estudia.
 Variable:

Característica o propiedad de los individuos que se


desea estudiar y se puede medir o calificar;
cambia o varía con el tiempo en un individuo dado,
o cambia o varía de elemento a elemento.
Ej. Edad, peso, sexo, estado civil, número de hijos, etc.
Las variables pueden ser cuantitativas o cualitativas.
 Variable Cuantitativa
(números):
son aquellas variables que
poseen relación con cantidades
numéricas.

En la variable CUANTITATIVA se pueden distinguir


dos tipos: continua y discreta.
 Variable Continua:
Si la variable puede tomar cualquier
número real entre dos valores dados
(decimal o entero).
Ej. El peso de un individuo.
 Variable Discreta:
Si la variable sólo puede tomar
números enteros.
Ej. El número de hijos de un individuo.
 Variable Cualitativa
(categorías):
Son aquellas variables que
poseen relación con
características o cualidades del
objeto de estudio.
En la variable CUALITATIVA se pueden distinguir
dos tipos: nominal y ordinal.
 Variable Cualitativa Nominal:
Una nominal presenta modalidades no numéricas
que no admiten un criterio de orden.

Ejemplo: estado civil, sexo, nivel socioeconómico,


deporte favorito, carrera a estudiar, etc.
 Variable cualitativa Ordinal:
Una V.C. ordinal presenta modalidades no númericas, en
las que existe un orden, pero no se pueden hacer
operaciones aritméticas entre ellas.
Por ejemplo: - La nota en un examen: Logrado,
Medianamente Logrado, No logrado.
- Puesto conseguido en una prueba deportiva:

1º, 2º, 3º, ...


- Medallas de una prueba deportiva: oro,

plata, bronce.
Tabla de Frecuencia de Datos

 Una vez que se tenga ordenados los datos, se


acomodan en la “Tabla de distribución de
frecuencias o tabla de frecuencias”.

 La tabla es básicamente una tabla de valores


x-y, dónde “x” representa el dato e “y”
representa la frecuencia.
 La frecuencia es el número de veces que aparece
cada dato.

 Hay dos clases de tablas de frecuencias:


 Para datos NO agrupados (en intervalos).
 Para datos agrupados (en intervalos).
Tabla de frecuencias para
datos NO agrupados

 Está formada por dos columnas: una para la


variable “xi” y la otra para su frecuencia “f”, a
esta frecuencia se le llama frecuencia absoluta o
frecuencia observada.
Ejemplo
 Tabla de frecuencias de los pesos en kg de 25
alumnos.
xi f xi f
Peso de 25 estudiantes (en kg)
40 1 52 2
42 1 55 2
40 42 43 44 44 43 56
1 2
45 48 49 50 50 44 2 57 1
51 51 52 52 55 45 1 58 1
55 56 56 57 58 48 1 59 1
59 62 63 63 66 49 62
1 1
50 2 63 2
51 2 66 1
Total 25
Frecuencia relativa y acumulada
 Por lo regular, se agregan dos columnas: la de la
frecuencia relativa “fr” y la de la frecuencia
acumulada “fa” o “F”
 La frecuencia relativa se obtiene mediante el
cociente de la frecuencia y el número total de
datos, esto es fr = f/n.
 La frecuencia acumulada se obtiene sumando las
frecuencias anteriores a las frecuencias de un dato
dado.
Ejemplo: La siguiente tabla muestra el peso
en kilógramos de un grupo de estudiantes:
1/25
xi f fr fa xi f fr fa
40 1 0.04 1 52 2 0.08 14
42 1 0.04 2 55 2 0.08 16
43 1 3 2/25 56 2 0.08 18
0.04
44 2 0.08 5 57 1 0.04 19
58 1 0.04 20
45 1 0.04 6
59 1 0.04 21
48 1 0.04 7 Siempre
62 1 0.04 22
49 1 0.04 8 es el
63 2 0.08 24 número
50 2 0.08 10
66 1 0.04 25 total
51 2 0.08 12
Total 25 1

Siempre es 1
Medidas de Tendencia Central
para datos no agrupados
 Moda (Mo): es el dato que posee mayor frecuencia
absoluta. Se clasifica en unimodal, bimodal, o
polimodal.
 Mediana (Me): es el valor central de los datos
ordenados en forma ascendente. Si n es impar, la
mediana se ubica en la posición (n + 1)/2. Si n es
par, la mediana es el promedio de los datos
ubicados en la posición n/2 y n/2 + 1
 Media Aritmética o promedio (X): es la sumatoria de
todos los valores de la muestra dividida en el
tamaño de la muestra.
Ejemplos:
a) Dada la distribución de datos 5, 7, 1, 5, 3, 9, 1.
Determine la media, la moda y la mediana.
b) Dada la distribución de datos: 2, 4, 6, 2, 3, 2, 5,
6, 7, 9. Determine la media, la moda y la
mediana.
c) Dada la siguiente tabla, la cual muestra el número
de hijos de un grupo de 50 familias del sector sur
de Santiago, determine las medidas de tendencia
central:
Número de hijos (Xi) Frecuencia (f)
0 4
1 11
2 13
3 16
4 6
a) Mo = 1 y 5 (bimodal)
Me = 5
X = 4,43
b) Mo = 2
Me = 4,5
X = 4,6
c) Mo = 3 hijos
Me = 2 hijos
X = 2,18 hijos
Tabla de frecuencia para datos
agrupados en intervalos
Intervalos de clases
 En ocasiones es conveniente acomodar los
datos en pequeños grupos de igual tamaño,
llamados intervalos de clase.
 El punto medio o marca de clase “xi”, se
obtiene con:
Marca de clase = Límite inferior + límite superior
2
 Para decidir la amplitud del intervalo y el número
de ellos, se pueden utilizar las siguientes fórmulas:

 K = 1 + 3.3 log (n)


 Donde K = número aproximado de intervalos

n = número de datos.
 Amplitud de los intervalos = Rango / K
 Donde Rango = diferencia entre el dato mayor
y el dato menor.
Ejemplo
 Para el ejemplo de los datos de los pesos de 25
alumnos, el valor de K:
K = 1 + 3.3 log (n) = 1 + 3.3 log (25) = 5.6
Por lo tanto se requieren 6 intervalos.

 Y la amplitud de los intervalos sería:


Amplitud = Rango / K = (66 – 40) / 6 = 4.33
Por lo tanto, 5 unidades es la amplitud de los
intervalos.
De esta manera, la tabla de frecuencia agrupada en
intervalos del ejemplo estudiado es:

Límite inferior Límite superior Lím inf + Lim sup


2
Intervalo de Punto medio f
clase “xi”
40 – 45 42,5 5
45 – 50 47,5 3
50 – 55 52,5 6
55 – 60 57,5 7
60 – 65 62,5 3
65 – 70 67,5 1
 Si se agregan las columnas de frecuencia relativa
“fr” y frecuencia acumulada “fa”, tenemos:
Intervalo Punto medio f fr Fa
5/25
de clase “xi”
3/25
40 – 45 42,5 5 0.2 5
6/25
45 – 50 47,5 3 0.12 8
50 – 55 52,5 6 0.24 14
55 – 60 57,5 7 0.28 21
60 – 65 62,5 3 0.12 24
65 - 70 67,5 1 0.04 25
Total 25 1
 Por último se agregan las columnas:
 Frecuencia porcentual, “f%” ó “%f”, se obtiene
multiplicando la frecuencia relativa “fr” x 100.
 Frecuencia relativa acumulada “fra”, se obtiene
sumando las frecuencias relativas anteriores a un
dato dado.
 Frecuencia porcentual acumulada, “f%a”, se
obtiene sumando las frecuencias porcentuales
acumuladas a un dato dado.
Tablas de frecuencias absoluta, 0.2 x
relativa y acumulada 100

0.2 x
100
Intervalo Punto medio f fr f% fa fra f%a
de clase “xi”

40 – 45 42,5 5 0.2 20 5 0.2 20


45 – 50 47,5 3 0.12 12 8 0.32 32
50 – 55 52,5 6 0.24 24 14 0.56 56
55 – 60 57,5 7 0.28 28 21 0.84 84
60 – 65 62,5 3 0.12 12 24 0.96 96
65 – 70 67,5 1 0.04 4 25 1 100
Total 25 1 100
Gráfica de Datos
 Existen dos tipos de gráficas mas usuales:
 Polígono de Frecuencias
 Histograma

 Otros gráficos:
 Gráfica de barras
 Pictograma
 Gráfico Circular o de pastel.
Polígono de Frecuencias
 Es la representación mediante un gráfico de
línea. En él se muestra la distribución de
frecuencias y está formado por segmentos de
línea que unen los puntos correspondientes a la
frecuencia de cada una de las clases.

 El eje “x” representa el dato “xi”


y el eje “y” las frecuencias.
Ejemplo
Intervalo Punto f
de clase medio “xi”
40 – 45 42,5 5

45 – 50 47,5 3

50 – 55 52,5 6

55 – 60 57,5 7

60 – 65 62,5 3

65 – 70 67,5 1

Total 25
Histograma
14

 Es la representación gráfica de 12

10

los datos mediante una sucesión 6

de rectángulos. 0
0.95 2.95 4.95

 Está formado por rectángulos cuya anchura


representa a cada uno de los intervalos y la
altura corresponde a la frecuencia.
 En el eje “x” estarán los límites verdaderos, los
puntos medios y en el eje “y” las frecuencias.
Ejemplo

f Histograma
9
8
7
6
5
4
3
2
1
0
40 45 50 55 60 65 70
Ojiva
 Es la representación gráfica de las frecuencias
acumuladas mediante un gráfico de línea. Se
muestra la distribución de frecuencias
acumuladas de los datos.

 En el eje “x” estarán los límites de los


intervalos y en el eje “y” las frecuencias
acumuladas.
Ejemplo

Intervalo Punto medio f fr Fa


de clase “xi”

40 – 45 42,5 5 0,2 5
45 – 50 47,5 3 0,12 8
50 – 55 52,5 6 0,24 14
55 – 60 57,5 7 0,28 21
60 – 65 62,5 3 0,12 24
65 - 70 67,5 1 0,04 25
Total 25 1
F
Gráfico Circular
 También es llamado gráfico de pastel.

 Sólo se representan datos de frecuencias relativas


o frecuencias porcentuales.

 Se debe dividir el área del círculo de manera


proporcional a las frecuencias. 13% 13%
PERRO
17%
PAJARO
HAMSTER
GATO
57%
 Agregaremos una columna a nuestra tabla de
frecuencias “Frecuencia relativa al círculo”,
multiplicando (fr)(360°), para mostrar la parte
proporcional de círculo medida en grados que
corresponde a cada intervalo.
Ejemplo 1
0.2 x
360°
Intervalo Punto medio f fr (fr ) (360°)
de clase “xi” 0.12 x
40 – 45 42,5 5 0.2 72° 360°

45 – 50 47,5 3 0.12 43.2°


50 – 55 52,5 6 0.24 86.4°
55 – 60 57,5 7 0.28 100.8°
60 – 65 62,5 3 0.12 43.2°
65 - 70 67,5 1 0.04 14.4°
Total 25 1 360°
Ejemplo 2

Color Frecuencia Conteo Color de Playera


IIII Azul Blanco Café Gris
Azul 4 Negro Rosa Verde
IIII II 4%
Blanco 7
Café III 3 16% 16%
8%
Gris IIII 4
28%
Negro II 2 16%
Rosa IIII 4 12%
Verde I 1
Otros Gráficos
 La gráfica de barras se traza similar al
Histograma, sólo que las barras se dibujan
separadas unas de otras.
 La escala en el eje “x” es para mostrar
categorías o intervalos de números NO
consecutivos. Frecuencia absoluta
60

50

40

30

20

10

0
PERRO PAJARO HAMSTER GATO
Carrera Alumnos
Elección de Carrera
Medicina 8
Mecánica 11 11 11
8 8
Civil 8 6
3 3
Agronomía 3
Físico - Matemáticas 3
Leyes 6
Contaduría 11
Pictograma
 Similar al de barras, sólo que se sustituyen por
figuras, generalmente relacionadas con la variable
estudiada.