You are on page 1of 21

Módulo 2.

Estadística descriptiva
(…continuación)
2.2. Medidas estadísticas descriptivas
2.2.1. Medidas de tendencia central
2.2.2. Medidas de dispersión
2.2.3. Medidas de posición
2.2.4. Medidas de forma

1
Medidas estadísticas descriptivas
Son valores que “resumen” las características de los datos en la muestra:
 Medidas de tendencia central
 Medidas de dispersión
 Medidas de posición
 Medidas de forma

Medidas de tendencia central


Son valores que se encuentran en el centro o a la mitad de un conjunto de
datos. Las principales medidas son:

 Media aritmética o promedio ( X)


 Mediana (Me)
 Moda (Mo)

2
Medidas de tendencia central
Media aritmética: Se obtiene sumando todos los datos y dividiendo el
resultado entre el número de datos, su confiabilidad depende de la forma
de su distribución y de la existencia o no de valores extremos. Se le puede
considerar como el punto de equilibrio (o centro de gravedad) de un
conjunto de datos.
Media muestral  X  x  Suma de los valores muestrales
n número de valores en la muestra

Muestra : Media muestral  X


Población: Media poblacional  
Mediana (Me): Es el valor central que divide en dos partes iguales a un
conjunto de datos.
Para obtenerla, se ordenan los valores de menor a mayor (o viceversa),
incluyendo cualquier valor repetido y se identifica el valor de en medio del
conjunto de datos; si existieran dos valores centrales, la mediana es el
promedio de esos dos valores.

3
Medidas de tendencia central
Moda (Mo): Es el valor que ocurre con mayor frecuencia en un
conjunto de datos. Un conjunto de datos puede ser: bimodal,
multimodal o sin moda.
Las medidas de tendencia central representan tres métodos diferentes
para encontrar el valor del “centro”. Estos tres valores pueden ser un
mismo valor pero a menudo son distintos. Cuando son distintos, pueden
servir para diferentes interpretaciones de los datos que queremos
resumir.
Ejemplo: El ingreso mensual de seis familias en un barrio es el siguiente:
$10,000 $20,000 $30,000 $25,000 $5,000 y
$5,000
¿Cuál es el ingreso mensual promedio de las familias del barrio?
¿Cuál es la mediana del ingreso mensual?
¿Cuál es la moda del ingreso mensual?
Si usted está realizando un estudio con el objetivo de que bajen las
contribuciones en dicho barrio, ¿Qué medida usaría?
4
Medidas de dispersión o variabilidad
Las distintas muestras o poblaciones pueden tener medidas idénticas de
centralidad, pero diferir entre sí en otros aspectos importantes como son
las medidas de dispersión.

Las medidas de dispersión, miden la concentración de los datos con


respecto al punto de equilibrio, que está representado por la media
aritmética.

Las principales medidas son:

Amplitud o rango

Varianza

Desviación estándar

5
Medidas de dispersión o variabilidad

Amplitud o Rango(R): Es la diferencia que existe entre el valor más


grande y el más pequeño.

Rango  max  min

Varianza muestral (S²): Es el promedio de los cuadrados de las


distancias de los datos a su media aritmética. Es un estimador insesgado.
Funciona para cualquier tamaño de muestra.
n

 ix  x 2

i 1
S2 =
n-1

NOTA: La varianza poblacional se representa por la letra griega 2

6
Medidas de dispersión o variabilidad

Desviación Estándar (S):

 Se interpreta como la distancia promedio de los datos a su


media aritmética.
 Se expresa en las mismas unidades que las empleadas en los datos.
 Se calcula tomando la raíz cuadrada positiva de la varianza, por
lo que siempre es positiva.

NOTA: La desviación estándar poblacional se representa por la letra


griega 

7
Medidas de dispersión o variabilidad
Ejemplo: La empresa «The Best Toy», pretende sacar un nuevo juguete a
la venta, por lo cual debe evaluar la campaña de publicidad que hasta el
momento se ha realizado. Como parte del estudio, se pregunta a 10 jefes
de familia de uno de los barrios seleccionados en la muestra, sobre el
número de veces a la semana que han visto el anuncio publicitario acerca
del nuevo juguete. Los resultados obtenidos son:
4, 3, 0, 2, 1, 0, 3, 0, 1, 2.

¿Cuál es la variable que se está analizando? ¿Cuál es su escala


de medición?

Calcula las medidas de tendencia central y de dispersión.

Interpreta las medidas calculadas.

8
Medidas de forma
Las medidas de forma son:

El Coeficiente de Sesgo y el Coeficiente de Curtosis


Sesgo: Mide el grado de asimetría (As) que tiene la distribución de los
datos y se calcula con:
Nota: Se usa la media y mediana como medida de Tendencia central

3( x  Md ) (Coef. de Asimetría de Pearson), ó


As 
S

 x  x
3
(Coef. de Asimetría de Fisher)
As  i
3
ns

 Sí As=0 – Conjunto de datos simétricos.


 Sí As<0 – Conjunto de datos sesgados a la izquierda.
 Sí As>0 – Conjunto de datos sesgados a la derecha.

9
Relación de las medidas de tendencia
central con el sesgo
La relación existente entre las medidas de tendencia central y
el coeficiente de asimetría se muestra en la siguiente tabla:

Tipo de sesgo Relación Gráfica


Simétrica o insesgada Moda = Mediana = Media a)
As=0
Sesgo positivo o a la Moda < Mediana< Media b)
derecha
As0
Sesgo negativo o a la Moda  Mediana Media c)
izquierda
As0

10
Relación de las medidas de tendencia
central con el sesgo
Tipos de sesgo “Gráficas”
a)
Insesgada

Moda=Mediana=Media

b)

Sesgo Positivo (a la derecha)

Media
Moda Mediana

11
Relación de las medidas de tendencia
central con el sesgo
Tipos de sesgo “Gráficas”
c)

Sesgo Negativo (a la izquierda)

Media Mediana Moda

12
Medidas de forma
Curtosis
 Esta medida se aplica a distribuciones en forma de
campana, es decir, unimodales y simétricas (o con ligera
asimetría).
 Se utiliza para medir el apuntamiento, el cual se mide con
respecto a una curva de referencia, la curva normal, que es
simétrica, tiene forma de campana, la mayoría de los
valores están alrededor de la media y los valores alejados
de la media son poco numerosos.
 Las medidas de curtosis tratan de estudiar la distribución
de frecuencias en la zona central. La mayor o menor
concentración de frecuencias alrededor de la media dará
lugar a distribuciones más o menos apuntadas.
13
Medidas de forma
Curtosis
 La distribución Normal se considera mesocúrtica, es el término medio.
 Las distribuciones mas puntiagudas que la Normal se llaman
leptocúrticas.
 Las distribuciones menos puntiagudas que la Normal se conocen como
platocúrticas .
 El coeficiente de Curtosis se define como:


 ix  x 4
o bien K
Q3Q1
K 3
ns 4 2( P90  P10)

Curtosis Distribución
K=0 Mesocúrtica
K>0 Leptocúrtica
K<0 Platocúrtica

14
Medidas de forma
Tipos de curtosis “Gráficas”

Leptocúrtica

Mesocúrtica

Platocúrtica

15
Medidas de posición
Son valores que corresponden a una posición determinada en
un conjunto de datos y los cuales dividen en partes iguales a tal
conjunto.
Las medidas de posición (Cuantiles) son:
1. Cuartiles: Puntos que dividen a una distribución de valores en
cuatro porciones iguales. Son tres y delimitan al 25%, 50% y
75% de los datos acumulados.
Q1 (Primer Cuartil): Separa el 25% inferior de los valores
ordenados, del 75% superior.
Q2 (Segundo Cuartil): Es igual a la mediana; separa el 50%
inferior de los valores ordenados, del 50% superior.
Q3 (Tercer Cuartil): Separa el 75% inferior de los valores
ordenados, del 25% superior.

16
Medidas de posición
2. Deciles: Son los cuantiles que dividen a una distribución en
10 partes iguales, por lo que se tienen nueve puntos de
división. Se representa mediante Dn.
3. Centiles o Percentiles: Son 99 y son los valores debajo de los
cuales queda el porcentaje indicado de los valores del
conjunto. Indica la posición de una puntuación en una
distribución porcentual. Se representa mediante Cn o bien Pn.

Número de valores menores que x


Percentil del valor x = ·100
Número total de valores

Para calcular un Cuartil o un Decil, es posible utilizar el valor


del percentil equivalente en su lugar.
Por ejemplo: Q1=P25 , Q2=P50 y Q3=P75

17
Medidas de posición
Conversión del k-ésimo percentil al valor del dato
correspondiente:

Donde: n=número de valores


k=percentil en cuestión
Nota1: Si la posición calculada del dato no es un número entero, entonces
redondear hacia “arriba” al próximo entero.
Nota 2: Si la posición calculada es un entero, promediar: el valor de la
posición obtenida, con el valor de la siguiente posición.

Usos de medidas de posición relativa en:


- Calificaciones de exámenes
- Puntajes en tests Psicológicos
- Curvas de crecimiento en salud

18
Medidas de posición
Estadísticos que se definen mediante el uso de Cuartiles y
Percentiles:

Rango Intercuartil (o RIC)=Q3-Q1

Rango Semiintercuartil = Q3  Q1
2
Q3  Q1
Cuartil medio=
2
Rango de percentiles 10-90=P90-P10

Q1 Q3

Xmenor Xmayor
Me

19
Relación entre las medidas de posición

10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

P5 P10 P15 P20 P25 P30 P35 P40 P45 P50 P55 P60 P65 P70 P75 P80 P85 P90 P95

D1 D 2 D 3 D4 D5 D6 D7 D8 D9
Q1 Q2 Q3

20
Medidas de posición
Ejemplo: En la siguiente tabla se listan los niveles
ordenados de nicotina encontrados en 40 fumadores.
0 1 1 3 17 32 35 44 48 86
87 103 112 121 123 130 131 149 164 167
173 173 198 208 210 222 227 234 245 250
253 265 266 277 284 289 290 313 477 491

1. Calcula el percentil correspondiente al nivel de nicotina de 123

2. Calcula el valor del percentil 68

3. Calcula el valor correspondiente al primer cuartil (Q1)

4. Calcula el valor del primer decil (D1)

5. Construye el diagrama de caja y Bigotes. ¿Qué información proporciona?


21

You might also like