You are on page 1of 18

3ª SEMANA: 15/02 – 21/2 Estadística I

S2T-2
Tema 1. Parte II
MEDIDAS DE DISPERSIÓN; FORMA Y
CONCENTRACIÓN
Prof.. Salvador Carrasco

Elaborado por: Prof. Vicente Coll, Prof. Olga Blasco


Fuente: Esteban et.al. (2005). Estadística descriptiva y nociones de probabilidad.
Capítulo 2.
Medidas dispersión o variación

 Medidas de dispersión absoluta.

Rango o recorrido  Re  x max  x min


Recorrido Intercuartílico
Varianza
Desviación típica

 Medidas de dispersión relativa.

Coeficiente de variación de Pearson


Otras medidas Recorrido Intercuartílico relativo
Coeficiente variación mediano
Recorrido relativo
Coeficiente de apertura

Análisis unidimensional
Dispersión absoluta

La Varianza, a diferencia del Rango y el Recorrido Intercuartílico,


consideran cómo se distribuyen o agrupan las observaciones.

La Varianza (S2): es la media de los cuadrados de las diferencias entre los


valores de la variable y su media.

I
Evalúa la manera en
  x i -x 
2
 ni que fluctúan los valores
S2X  i=1
de la variable respecto
N
a la media

¿Por qué se utiliza el cuadrado de las diferencias?

Análisis unidimensional
Dispersión absoluta

Al hacer el cuadrado, las observaciones que se encuentran más lejos


de la media adquieren más peso que las más cercanas  a mayor S2
más dispersos están los datos.

Si en la anterior expresión de la S2 desarrollamos el cuadrado:


I
Utiliza sólo los valores de la variable
x 2
i  ni
Más sencillo y rápido de calcular
S 
2
X
i 1
x 2

DESVIACIÓN TÍPICA  Sx   S2x  0

Análisis unidimensional
Dispersión absoluta: varianza

Ejemplo:
xi ni xini xi-x (xi-x)2 (xi-x)2ni xi2ni
1 2 2 -2 4 8 2 I=5

2 5 10 -1 1 5 20 x n i i
72
3 10
x= i=1
= 3
30 0 0 0 90 N 24
4 5 20 1 1 5 80
5 2 10 2 4 8 50
N=24 =72 = 26 = 242

I=5 I=5

  x -x  x
2
 ni 2
 ni
i
26  i
242 2 
S2X  i=1
  1, 083 S2X  i 1
 x2   3  1, 083
N 24 N 24

Análisis unidimensional
Propiedades de la varianza:

1.
Siempre es mayor (o igual) a cero. Error frecuente: Varianzas negativas

. Es una medida de dispersión óptima.


3. Si a todos los valores xi de una distribución de frecuencias se les suma
o resta una constante, la varianza no cambia. (NO afecta el cambio de
origen)
4. Si todos los valores xi de una distribución de frecuencias se multiplican
o dividen por una constante, la varianza de la nueva distribución queda
Multiplicada/dividida por esa misma constante al cuadrado. (SI afectan los
cambios de escala)
5. sobre una variable se aplica un cambio de origen y de escala,
Si
Y= a + bX

la varianza de la nueva variable (Y) será: S2Y =b 2  S2X

Análisis unidimensional
Medida de dispersión relativa

COEFICIENTE DE VARIACIÓN DE
PEARSON SX
g 0 (X) 
x
• Nos permite comparar dos distribuciones

Así:

• Cuál de dos V.E su distribución es relativamente mayor


• Cuál de las dos distribuciones, la variable es más homogénea
• Cuál de las dos distribuciones tiene sus valores más regulares
• En cuál de las dos distribuciones tiene la media más representativa

Análisis unidimensional
Medidas de forma: simetría

MEDIDAS DE LA FORMA DE LA DISTRIBUCION

al “doblar”
por el eje de
simetría

COEFICIENTE DE ASIMETRÍA (DE FISHER) g1


I
 x i  x 
3
 ni
i 1

g1 X   N =
S3X
Análisis unidimensional
Medidas de forma: simetría
Distribución asimétrica negativa
cola más larga a la izquierda de la moda
g1 ( X )  0

Distribución simétrica

g1 ( X )  0

Distribución asimétrica positiva


cola más larga a la derecha de la moda

g1 ( X )  0

Análisis unidimensional
Medidas de forma: apuntamiento

COEFIENTE DE CURTOSIS
I
 ( x i  x)4 .n i
i 1

g 2 X   N 3 =3
S4X

Leptocúrtica
g 2 (X)  0

Mesocúrtica
g 2 (X)  0
Platicúrtica
g 2 (X)  0
Análisis unidimensional
TIPIFICACION / ESTANDARIZACION

TIPIFICAR UNA VARIABLE Z= a + b X

Tipificar la V. E. X es realizar un cambio a una nueva V.E. Z de manera


que para cada valor xi de la V.E X, le corresponde un valor nuevo zi de
la variable Z
De manera que 
𝑥 1
 O lo que es lo mismo 𝑧 𝑖 =− + ∗ 𝑥𝑖
𝑆𝑥 𝑆 𝑥

Si aplicamos los cambios de origen y escala tenemos que:

=0
SIEMPRE
=1
UTILIDAD:
1.- Las variables pasan a ser adimensionales.
2.- Permiten comparar utilizando como distancia el número de
desviaciones típicas respecto a la media
Análisis unidimensional
Tipificación de variables
X1={Precio en euros de la habitación doble estándar de los hoteles de la
ciudad “A” en la primera semana de julio}
9

∑ 𝑥 𝑖 𝑛𝑖
3240
𝑖 =1
𝑥 1= = =64 , 8
𝑁 50
9

∑ ( 𝑥𝑖 − 𝑥 )2 𝑛𝑖 31698
𝑖 =1
𝑆2
𝑥= = =633 , 96
𝑁 50
9

∑ 𝑥2
𝑖 𝑛𝑖
241650
𝑖 =1
𝑆2
𝑥= − 𝑥 2= − 64 , 82 = 633 , 96
𝑁 50

𝑆 𝑥 1= √ 633 ,96=25 , 17
X2={ nº de me gusta que ha dado en facebook 20 estudiantes este
último fin de semana}

Si la variable x2 tiene: 𝑥 2=15 𝑆 𝑥 2=11

comparamos
Dado el valor 90 de la variable X1 y el valor 11 de la variable x2.
Cuál de los dos valores es mayor en términos relativos  TIPIFICAR
De V.E X1, 90  Z2 =+1 De V.E X2, 11  Z1 = - 0,36

zi mínimo zi máximo
Z1 = - 0,36
0 Z2=+1

Análisis unidimensional
Medidas de concentración

MEDIDAS DE CONCENTRACIÓN: CURVA DE


LORENZ E INDICE DE GINI.

Medidas de concentración  Miden el mayor o menor


grado de igualdad o equidistribución en el reparto total de los
valores de la variable objeto de estudio.

Representación gráfica  CURVA DE LORENZ.

Medida analítica  INDICE DE GINI.

Análisis unidimensional
Medidas de concentración

CURVA DE LORENZ

En el eje de abscisas se representa 100


el porcentaje acumulado de
frecuencias pi (NÚMERO DE
TRABAJADORES, EXPLOTACIONES
AGRARIAS, INDUSTRIAS…) a quienes
le corresponde, como mucho, el
valor xi de la variable.
En el eje de ordenadas el porcentaje
acumulado del volumen total de la
variable (INGRESOS, EXTENSION, 0 100
VOLUMEN DE VENTAS,…) qi que
corresponden a pi

Análisis unidimensional
Medidas de concentración

INDICE DE GINI

Es una medida cuantitativa de concentración. Es aproximadamente


el cociente entre el área comprendida entre la bisectriz del primer
cuadrante y la curva de Lorenz y el triángulo OPQ.

Puede utilizarse como aproximación la siguiente expresión:


I 1

 ( pi  qi ) Q

IG  i 1
I 1 0  IG  1
p
i 1
i

O P

Análisis unidimensional
Medidas de concentración

RELACIÓN ENTRE LA CURVA DE LORENZ Y EL


ÍNDICE DE GINI

Mínima concentración Máxima concentración

IG  0 0  IG  1 IG  1

qi qi qi

pi pi pi

Existirá una mejor distribución a medida que el IG se acerque más a 0

Análisis unidimensional
Medidas de concentración

Análisis unidimensional
Problema 9 - 3/45

a p a r ta do a
Solo el

masa a repartir masa ac. masa ac. % pob. Ac en %


i l (i-1) li xi ni Ni mi=xi*ni Mi qi=(Mi/M)*100 pi=(Ni/N)*100 pi -qi
1 0 8000 4000 10 10 40000 40000 5,25 20 14,75
2 8000 15000 11500 15 25 172500 212500 27,87 50 22,13

3 15000 25000 20000 20 45 400000 612500 80,33 90 9,67


4 25000 35000 30000 5 50 150000 762500 100,00 100
50 762500
160 46,56
I 1

(p  q ) i i
46.56
a) IG  i 1
I 1
  0.2909
160
p
i 1
i

Análisis unidimensional

You might also like