You are on page 1of 31

FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS

Departamento de Estadística
Universidad de Concepción

Clase 2: Medidas de Dispersión

Prof: Jean Paul Navarrete Campos.

Abril 2021
Repaso: Medidas de Tendencia Central.

Asimetría hacia la izquierda Simétrica Asimetría hacia la derecha


Medidas de dispersión o concentración.
n

Varianza poblacional  i
( x   ) 2

2  i 1

n
n

 i
( x  x ) 2

Varianza muestral s2  i1

n 1

Desviación estándar
sX
CVX  100%
Coeficiente de variación x
Diferencia entre Desviación Estándar y
Error Estándar

s
• La desviación estándar es una medida de la dispersión de los
datos. Cuanto mayor sea la dispersión, mayor es la desviación
estándar, mientras que el error estándar de la media cuantifica las
oscilaciones de la media muestral alrededor de la media
poblacional.

s
• Son, por tanto, índices conceptualmente diferentes, aunque
directamente relacionados.

• La desviación estándar es un índice para usar cuando se pretende

n
describir la variabilidad de una variable continua en una muestra.

• El error estándar de la media se debe usar cuando se pretende


cuantificar el error cometido al estimar la media poblacional
mediante la media muestral.
n
Ejemplo 2.1:  (x i  x) 2

s2  i1

n 1
Datos: 2; 5; 7; 9

Desviación estándar muestral


2.986078811

Desviación estándar poblacional


2.586020108
s
Error estándar 1.493
n
Ejemplo 2.2: Obtenga el promedio y la desviación estándar de
estos tres grupos de datos.

2.5
2
Grupo 1 Grupo 2 Grupo 3
1.5
1
1 1,6757 2,1488
0.5
0
0 1,473 0,3243
-0.5

2 -0,1488 0,527
Grupo 1 Grupo 2 Grupo 3
Varianza para variables AGRUPADAS.

Clase Intervalos de Marca de Frecuencia


clase clase absoluta

1 [63 , 68] 65,5 5


2 ]68 , 73] 70,5 6
3 ]73 , 78] 75,5 10
4 ]78 , 83] 80,5 6
5 ]83 , 88] 85,5 9
6 ]88 , 93] 90,5 3
7 ]93 , 98] 95,5 1
Medidas de Posición o cuantíles.
Cuartiles. Particionan a una distribución de frecuencias en
cuatro partes mediante los puntos Q1, Q2, Q3, llamados
primer, segundo y tercer cuartil. Se denomina recorrido
intercuartílico a RIQ = Q3 - Q1.

Deciles: D1, D2, ..., D9. Particionan la distribución de


frecuencias en 10 partes iguales.

Percentiles: P1, P2, ..., P99. Particionan la distribución de


frecuencias en 100 partes iguales.
Gráficos de Caja o BOX-PLOT
Propiedades:
•Si la posición de la mediana se encuentra en la mitad de la caja y las
antenas tienen la misma longitud, la distribución es simétrica.
Propiedades:
• Si la posición de la mediana se encuentra ubicada más cerca del primer
cuartil y la antena superior es de mayor longitud que la antena inferior, la
distribución presenta sesgo positivo.
Propiedades:

•Si la posición de la mediana se encuentra ubicada más cerca del tercer


cuartil y la antena superior es de menor longitud que la antena inferior,
la distribución presenta sesgo negativo.
Ejemplo 2.3:
0,80 0,80 0,80

fre c u e n c ia re la tiv a
fre c u e n c ia re la tiv a

fre c u e n c ia re la tiv a
0,60 0,60 0,60

0,40 0,40 0,40

0,20 0,20 0,20

0,00 0,00 0,00


-2,60 -1,73 -0,86 0,01 0,88 1,75 2,62 -0,48 0,48 1,43 2,38 3,33 4,28 5,24 -12,28 -7,86 -3,45 0,96 5,38 9,79 14,21
X Y Z
fre c u e n c ia re la tiv a 0,80 0,80 0,80

fre c u e n c ia re la tiv a

fre c u e n c ia re la tiv a
0,60 0,60 0,60

0,40 0,40 0,40

0,20 0,20 0,20

0,00 0,00 0,00


-2,60 -1,74 -0,87 0,00 0,87 1,74 2,60 -0,89 -0,59 -0,30 0,00 0,30 0,59 0,89 -0,63 2,43 5,50 8,57 11,63
W V T
5,0

4,0

3,0

2,0

1,0

0,0

x
-1,0

-2,0

-3,0

-4,0

-5,0
fr e c u e n c ia re la tiv a 0,19 5,0

4,0
0,14
3,0

0,09 2,0

1,0
0,05
0,0

x
0,00 -1,0
-5 -4 -3 -2 -1 0 1 2 3 4 5
x
-2,0

-3,0

-4,0

-5,0

¿Qué podemos hacer aquí?


Gráficos a partir de la tabla de frecuencias.
Histograma de las Histograma de las
frecuencias absolutas con Polígono de frecuencias
frecuencias absolutas con sobre el histograma.
marca de clases. intervalos de clase.
Polígono de las frecuencias Ojiva o polígono de Ojiva o polígono de
frecuencias absolutas frecuencias relativas
absolutas. acumuladas. acumuladas.
Obtención de promedios y varianza a través de una tabla de frecuencias.
Promedio para variables NO agrupadas, el
verdadero promedio de los datos.

Promedio para variables AGRUPADAS, es decir obtenido a partir de una tabla


de frecuencias.
Varianza para variables NO agrupadas, la
verdadera varianza de los datos.

Varianza para variables AGRUPADAS, es decir


obtenido a partir de una tabla de frecuencias.
Estandarizar o “normalizar” una variable significa que la nueva variable
tiene promedio cero y varianza 1.

Observe la variable X, claramente tiene una asimetría positiva, por lo tanto NO tiene distribución NORMAL.
La variable Z se obtuvo estandarizando la variable X.
La variable W se obtuvo aplicando raíz cuadrada a los datos de la variable X.
Gráficos de Tallo y Hoja.
Gráfico tallo y hoja o stem and leaf, es un procedimiento semi-gráfico
que se utiliza para representar datos asociados a variables
cuantitativas.
Los dígitos de un dato se separan en dos partes tallo y hoja, la columna
tallo lleva un dígito menos que los datos y la columna hoja lleva un
dígito.
Correlación:

La correlación o coeficiente de correlación entre dos variables aleatorias X e Y


se define por:

El valor ρ=0 indica la ausencia de cualquier asociación lineal.

Mientras que los valores -1 y 1 indican relaciones lineales perfectas entre X e Y


con pendientes negativas y positivas respectivamente.
Formula:

n n

2
 (x i  x)
i1
2
 (x i  x) 2

s  s2  i1
n 1 n 1
Ejemplos:
Ejemplo:

X -1 2 0 1

Y 1 4 2 3
Muchas gracias por su atención.

You might also like