Professional Documents
Culture Documents
TEXTO UNIVERSITARIO
ESTADSTICA DESCRIPTIVA
Estadstica Descriptiva Anlisis Estadstico
ESTADSTICA DESCRIPTIVA
La estadstica descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una poblacin,
altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer con-
clusiones sobre el comportamiento de estas variables.
Variables cualitativas o atributos: no se pueden medir numricamente (por ejemplo: nacionalidad, color
de la piel, sexo).
Variables cuantitativas: tienen valor numrico (edad, precio de un producto, ingresos anuales).
Variables unidimensionales: slo recogen informacin sobre una caracterstica (por ejemplo: edad de los
alumnos de una clase).
Variables bidimensionales: recogen informacin sobre dos caractersticas de la poblacin (por ejemplo:
edad y altura de los alumnos de una clase).
Variables pluridimensionales: recogen informacin sobre tres o ms caractersticas (por ejemplo: edad, al-
tura y peso de los alumnos de una clase).
Segn la influencia que asignemos a unas variables sobre otras, podrn ser:
Variables independientes: Son las que el investigador escoge para establecer agrupaciones en el estudio,
clasificando intrnsecamente a los casos del mismo. Un tipo especial son las variables de , que modifican al
resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los re-
sultados por medio de un sesgo.
Variables dependientes: Son las variables de respuesta que se observan en el estudio y que podran estar
influenciadas por los valores de las variables independientes.
Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: nmero de hermanos (puede
ser 1, 2, 3....,etc., pero, por ejemplo, nunca podr ser 3.45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un
vehculo puede ser 80,3 km/h, 94,57 km/h...etc.
Nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los
colores o el lugar de residencia.
Ordinal: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no
es necesario que el intervalo entre mediciones sea uniforme, por ejemplo, leve, moderado, grave.
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:
Individuo: cualquier elemento que porte informacin sobre el fenmeno que se estudia. As, si estudiamos
la altura de los nios de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada
vivienda es un individuo.
Poblacin: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten informacin so-
bre el fenmeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la po-
blacin ser el total de las viviendas de dicha ciudad.
Muestra: subconjunto que seleccionamos de la poblacin. As, si se estudia el precio de la vivienda de una
ciudad, lo normal ser no recoger informacin sobre todas las viviendas de la ciudad (sera una labor muy
compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente
representativo.
Parmetro: En Estadstica, funcin definida sobre valores numricos de una poblacin. Se llama parmetro
a un valor representativo de una poblacin, como la media aritmtica, una proporcin o su desviacin tpi-
ca.
Estadgrafo o Estadstico: Es una medida cuantitativa, derivada de un conjunto de datos de una muestra
con el objetivo de estimar un parmetro o contrastar caractersticas de una poblacin o modelo estadstico.
Veamos un ejemplo:
Medimos la altura de los nios de una clase y obtenemos los siguientes resultados (cm):
Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, enton-
ces conviene agruparlos por intervalos, ya que de otra manera obtendramos una tabla de frecuencia muy
extensa que aportara muy poco valor a efectos de sntesis.
Si presentramos esta informacin en una tabla de frecuencia obtendramos una tabla de 30 lneas (una pa-
ra cada valor), cada uno de ellos con una frecuencia absoluta de 1 y con una frecuencia relativa del 3,3%.
Esta tabla nos aportara escasa informacin
En lugar de ello, preferimos agrupar los datos por intervalos, con lo que la informacin queda ms resumida
(se pierde, por tanto, algo de informacin), pero es ms manejable e informativa:
El nmero de tramos en los que se agrupa la informacin es una decisin que debe tomar el analista: la re-
gla es que mientras ms tramos se utilicen menos informacin se pierde, pero puede que menos represen-
tativa e informativa sea la tabla.
Nmero de Intervalos: El nmero de intervalos (k) debe ser como mnimo 5 y como mximo 15.
k 1 3.322log 30 5.91 6
Mtodo raz de n: k n
k 30 5.48 5
Rango (R): se considera como el dato mayor menos el dato menor de todo el conjunto de datos considera-
dos en toda la muestra, si consideramos al dato menor de la muestra y al dato mayor entonces el Rango es-
tar determinada como:
R Dmax Dmin
R
wi
k
0.97
wi 0.194
5
Histograma
En estadstica, un histograma es una representacin grfica de una variable en forma de barras, donde la
superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se
representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente sealando las
marcas de clase, es decir, la mitad del intervalo en el que estn agrupados los datos.
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por
comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos
son cualitativos (no-numricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagra-
ma de sectores.
Los histogramas son ms frecuentes en ciencias sociales, humanas y econmicas que en ciencias naturales
y exactas. Y permite la comparacin de los resultados de un proceso.
Para graficar el Histograma se coloca el intervalo de clase en el eje de las X (abscisa) y la frecuencia absoluta
o frecuencia relativa en el eje de las Y (ordenada)
Histograma
12
11
10
10
8
Frecuencia Absoluta
6 6
6
5
5
3
3
0
1.010 - 1.204 1.204 - 1.398 1.398 - 1.592 1.592 - 1.786 1.786 - 1.980
Estatura (Cm.)
45.00% 43.75%
40.00%
35.00%
31.25%
30.00%
Frecuencia relativa
25.00%
20.00%
15.00%
12.50% 12.50%
10.00%
5.00%
0.00%
perro gato hmster pjaro
Mascota
Polgono de frecuencias
Es un grfico de lneas que se usa para presentar las frecuencias absolutas de los valores de una distribu-
cin en el cual la altura del punto asociado a un valor de las variables es proporcional a la frecuencia de di-
cho valor.
Polgono de frecuencias
12
11
10
10
8
Frecuencia Absoluta
7
6 6
6
5
5
4
3
0
1.107 1.301 1.495 1.689 1.883
Estatura (Cm.)
Ojiva porcentual
Es un grfico acumulativo, el cual es muy til cuando se quiere representar el rango porcentual de cada va-
lor en una distribucin de frecuencias.
Para graficar la ojiva se coloca el lmite superior del intervalo de clase en el eje de las X (abscisa) y la fre-
cuencia absoluta o frecuencia relativa en el eje de las Y (ordenada)
Ojiva 100.00%
100.00%
90.00%
83.33%
80.00%
70.00%
63.33%
Frecuencia Relativa Acumulada
60.00%
50.00%
40.00%
30.00%
30.00%
20.00%
20.00%
10.00%
0.00%
0 1.204 1.398 1.592 1.786 1.980
Estatura (Cm.)
MEDIDAS DE POSICIN
Las medidas de posicin nos facilitan informacin sobre la serie de datos que estamos analizando. Estas
medidas permiten conocer diversas caractersticas de esta serie de datos.
Medidas de posicin central: informan sobre los valores medios de la serie de datos.
Medidas de posicin no centrales: informan de como se distribuye el resto de los valores de la serie.
1. Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de media,
siendo las ms utilizadas:
Media aritmtica: se calcula multiplicando cada valor por el nmero de veces que se repite. La suma
de todos estos productos se divide por el total de datos de la muestra:
X i
X i 1
X1 X 2 X 3 X n1 X n
X
n
entonces:
Linf i Lsup i
Xi
2
n
X f
i i
X i 1
X1 f1 X 2 f 2 X 3 f3 X n1 f n1 X n f n
X
n
Marca de
Estatura
Clase fi Xifi
(Cm.)
(Xi)
[1.010 - 1.204] 1.107 6 6.642
(1.204 - 1.398] 1.301 3 3.903
(1.398 - 1.592] 1.495 10 14.950
(1.592 - 1.786] 1.689 6 10.134
(1.786 - 1.980] 1.883 5 9.415
Total 30 45.044
entonces:
45.044
X 1.502
30
Media geomtrica: se eleva cada valor al nmero de veces que se ha repetido. Se multiplican todo
estos resultados y al producto final se le calcula la raz "n" (siendo "n" el total de datos de la mues-
tra).
n
XG n Xi
i 1
X G n X1 * X 2 * X 3 * * X n1 * X n
entonces:
Linf i Lsup i
Xi
2
n
X G n X i fi
i 1
Marca de
Estatura
Clase fi Xifi
(Cm.)
(Xi)
[1.010 - 1.204] 1.107 6 1.840
(1.204 - 1.398] 1.301 3 2.202
(1.398 - 1.592] 1.495 10 55.771
(1.592 - 1.786] 1.689 6 23.215
(1.786 - 1.980] 1.883 5 23.673
Total 30 124,210.71
entonces:
La media armnica: es igual al recproco, o inverso, de la media aritmtica de los recprocos de dchos
nmeros
n
XH n
1
X
i 1 i
n
XH
1 1 1 1 1
X1 X 2 X 3 X n 1 X n
entonces:
30
XG 1.468
1 1 1 1 1 1 1 1
1.15 1.53 1.21 1.48 1.39 1.49 1.98 1.01
Linf i Lsup i
Xi
2
n
XH n
fi
X
i 1 i
n
XH
f1 f f f n 1 f
2 3 n
X1 X 2 X 3 X n 1 X n
Marca de
Estatura
Clase fi fi/Xi
(Cm.)
(Xi)
[1.010 - 1.204] 1.107 6 5.420
(1.204 - 1.398] 1.301 3 2.306
(1.398 - 1.592] 1.495 10 6.689
(1.592 - 1.786] 1.689 6 3.552
Cla
(1.786 - 1.980] 1.883 5 2.655
Total 30 20.62
entonces:
30
XH 1.455
20.62
2. Mediana: es el valor de la serie de datos que se sita justamente en el centro de la muestra (un 50%
de valores son inferiores y otro 50% son superiores).
No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su
clculo toda la informacin de la serie de datos (no pondera cada valor por el nmero de veces que
se ha repetido).
X1 X 2 X n1 X n
X1 X 2 X n1 X n1 X n
2
X ( n 1) X ( n 1)
1 1
Si n es par la mediana es el valor X Me 2 2 2 2
.
2
Notamos que
n 1 15.5 , entonces X15 1.49 y X16 1.52 , entonces:
2
1.49 1.52
X Me 1.505
2
Linf k Lsup k
Xk
2
Al tratar con datos agrupados, si n coincide con el valor de una frecuencia acumulada( n Fk ,
2 2
para el primera frecuencia absoluta acumulada), el valor de la mediana coincidir con la abscisa co-
rrespondiente. Si no coincide con el valor de ninguna abscisa, se calcula a travs de semejanza de
tringulos en el histograma o polgono de frecuencias acumuladas, utilizando la siguiente equivalen-
cia:
n
Fk 1
X Me Linf k 2 wk
fk
n
Fk 1
X Me Linf k 2
fk
Lsup k Linf k
Ejemplo: si tomamos los 30 datos agrupados de las estaturas de los habitantes:
Marca de
Estatura
Clase fi Fi
(Cm.)
(Xi)
[1.010 - 1.204] 1.107 6 6
(1.204 - 1.398] 1.301 3 9
(1.398 - 1.592] 1.495 10 19 Clase mediana
(1.592 - 1.786] 1.689 6 25
(1.786 - 1.980] 1.883 5 30
Total 30
15 9
X Me 1.398 1.592 1.398 1.514
10
X Mo X i ; Si fi max fi , i 1, 2, 3, , k
Entonces, como los valores 1.16, 1.20, 1.48 y 1.98 se repiten dos veces (el mayor nmero de repeti-
ciones) tenemos cuatro modas (tetra modal):
Linf i Lsup i
Xi
2
d1
X Mo Linf k wk
d1 d 2
X Mo Linf k
d1
d1 d 2
Lsup k Linf k
Donde:
Marca de
Estatura
Clase fi
(Cm.)
(Xi)
[1.010 - 1.204] 1.107 6
(1.204 - 1.398] 1.301 3
(1.398 - 1.592] 1.495 10 Clase modal
(1.592 - 1.786] 1.689 6
(1.786 - 1.980] 1.883 5
Total 30
como f3 max fi , i 1, 2, 3, 4, 5 10 la clase modal cae en la tercera categora, entonces:
10 3
X Mo 1.398 1.592 1.398 1.521
10 6 10 3
Las medidas de posicin no centrales permiten conocer otros puntos caractersticos de la distribucin que
no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la
muestra en tramos iguales llamados cuantiles.
Los cuantiles son medidas de posicin que se determinan mediante un mtodo que determina la ubicacin
de los valores que dividen un conjunto de observaciones en partes iguales.
Los cuantiles son los valores de la distribucin que la dividen en partes iguales, es decir, en intervalos que
comprenden el mismo nmero de valores. Cuando la distribucin contiene un nmero alto de intervalos o
de marcas y se requiere obtener un promedio de una parte de ella, se puede dividir la distribucin en cua-
tro, en diez o en cien partes.
Los ms usados son los cuartiles, cuando dividen la distribucin en cuatro partes; los deciles, cuando divi-
den la distribucin en diez partes y los percentiles o percentiles, cuando dividen la distribucin en cien par-
tes. Los cuartiles, como los deciles y los percentiles, son en cierta forma una extensin de la mediana.
Cuartiles: son los tres valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente,
en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la
mediana.
X1 X 2 X n1 X n
Para un nmero de n observaciones en el que los datos no son representados en clases, una vez ordenados
los datos la posicin de los cuartiles se pueden localizar de la siguiente forma:
k n 1
4
Entonces:
k
Qk Linf Lsup Linf
4
3 n 1
Notamos que 23.25 , entonces X 23 1.71 y X 24 1.73 , entonces:
4
3
Q3 1.71 1.73 1.71 1.725
4
Es decir, el 75% de los habitantes tiene estatura inferior o igual a 1.725 Mts.
n
Buscamos la categora que ocupa cada cuartil mediante la expresin Clculo de los cuartiles k , enton-
4
ces: Clase cuartil k primer k n 4 F (para el primera frecuencia absoluta acumulada), donde
i
k 1, 2, 3 , entonces:
n
k Fk 1
4
Qk Linf k wk
fk
n
k Fk 1
Lsup k Linf k
4
Qk Linf k
fk
Marca de
Estatura
Clase fi Fi
(Cm.)
(Xi)
[1.010 - 1.204] 1.107 6 6
(1.204 - 1.398] 1.301 3 9
(1.398 - 1.592] 1.495 10 19
(1.592 - 1.786] 1.689 6 25 Clase cuartil 3
(1.786 - 1.980] 1.883 5 30
Total 30
22.5 19
Q3 1.592 1.786 1.592 1.71
6
Es decir, el 75% de los habitantes tiene estatura inferior o igual a 1.71 Mts.
Deciles: son nueve valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en
diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados.
D1, D2, D3,, D7, D8, y D9 determinan los valores correspondientes al 10%, al 20%, al 30%,,al 70%, al 80% y
al 90% de los datos. D5 coincide con la mediana.
Para un nmero de n observaciones en el que los datos no son representados en clases, una vez ordenados
los datos la posicin de los deciles se pueden localizar de la siguiente forma:
k n 1
10
Entonces:
k
Dk Linf Lsup Linf
10
7 n 1
Notamos que 21.7 , entonces X 21 1.62 y X 22 1.64 , entonces:
10
7
D7 1.62 1.64 1.62 1.634
10
Es decir, el 70% de los habitantes tiene estatura inferior o igual a 1.634 Mts.
n
Buscamos la categora que ocupa cada decil mediante la expresin Clculo de los deciles k , entonces:
4
Clase decil k primer k n 10 F i (para el primera frecuencia absoluta acumulada), donde
k 1, 2, 3, , 7,8, 9 , entonces:
n
k Fk 1
10
Dk Linf k wk
fk
n
k Fk 1
Lsup k Linf k
10
Dk Linf k
fk
Marca de
Estatura
Clase fi Fi
(Cm.)
(Xi)
[1.010 - 1.204] 1.107 6 6
(1.204 - 1.398] 1.301 3 9
(1.398 - 1.592] 1.495 10 19
(1.592 - 1.786] 1.689 6 25 Clase decil 7
(1.786 - 1.980] 1.883 5 30
Total 30
21 19
D7 1.592 1.786 1.592 1.66
6
Es decir, el 70% de los habitantes tiene estatura inferior o igual a 1.66 Mts.
Percentiles: son noventinueve valores que distribuyen la serie de datos, ordenada de forma creciente o de-
creciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.
P1, P2, P3,, P97, P98, y P99 determinan los valores correspondientes al 1%, al 2%, al 3%,,al 97%, al 98% y al
99% de los datos. P50 coincide con la mediana.
Para un nmero de n observaciones en el que los datos no son representados en clases, una vez ordenados
los datos la posicin de los percentiles se pueden localizar de la siguiente forma:
k n 1
100
Entonces:
k
Pk Linf Lsup Linf
100
73 n 1
Notamos que 22.63 , entonces X 22 1.64 y X 23 1.71 , entonces:
100
73
P73 1.64 1.71 1.64 1.691
100
Es decir, el 73% de los habitantes tiene estatura inferior o igual a 1.691 Mts.
n
Buscamos la categora que ocupa cada percentil mediante la expresin Clculo de los percentil k , en-
4
tonces: Clase percentil k primer k n 100
Fi , para el primera frecuencia absoluta acumulada),
donde k 1, 2, 3, , 49, 50, 51, , 97, 98, 99 , entonces:
n
k Fk 1
Pk Linf k 100
wk
fk
n
k Fk 1
100
Pk Linf k
fk
Lsup k Linf k
Marca de
Estatura
Clase fi Fi
(Cm.)
(Xi)
[1.010 - 1.204] 1.107 6 6
(1.204 - 1.398] 1.301 3 9
(1.398 - 1.592] 1.495 10 19
(1.592 - 1.786] 1.689 6 25 Clase percentil 73
(1.786 - 1.980] 1.883 5 30
Total 30
Es decir, el 73% de los habitantes tiene estatura inferior o igual a 1.69 Mts.
MEDIDAS DE DISPERSIN
Estudia la distribucin de los valores de la serie, analizando si estos se encuentran ms o menos concentra-
dos, o ms o menos dispersos.
Existen diversas medidas de dispersin, entre las ms utilizadas podemos destacar las siguientes:
Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor ms elevado
y el valor ms bajo.
R Dmax Dmin
Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de
las diferencias al cuadrado entre cada valor y la media, multiplicadas por el nmero de veces que se ha re-
petido cada valor. El sumatorio obtenido se divide por el tamao de la muestra menos 1 (por correccin
muestral).
2
n
Xi
X i2 i 1
n n
X X
2
i
n
2 i
i 1
n 1 n 1
45.4
2
70.6978
2 30 0.0687
30 1
2
K
K X k fk
X X X k2 f k k 1
K
2
k f
n
2 k 1 i
k 1
n 1 n 1
La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms concentrados estn los va-
lores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, ms dispersos es-
tn.
Estatura
Xi fi Xifi X2ifi
(Cm.)
[1.010 - 1.204] 1.107 6 6.642 7.3527
(1.204 - 1.398] 1.301 3 3.903 5.0778
(1.398 - 1.592] 1.495 10 14.950 22.3503
(1.592 - 1.786] 1.689 6 10.134 17.1163
(1.786 - 1.980] 1.883 5 9.415 17.7284
Total 30 45.044 69.6255
45.044
2
69.6255
2 30 0.0687
30 1
2
n
Xi
X i2 i 1
n n
X X
2
i
n
i
i 1
n 1 n 1
45.4
2
70.6978
30 0.2621
30 1
2
K
K X k fk
X X X k2 f k k 1
K
2
k f
n
k 1 i
k 1
n 1 n 1
Estatura
Xi fi Xifi X2ifi
(Cm.)
[1.010 - 1.204] 1.107 6 6.642 7.3527
(1.204 - 1.398] 1.301 3 3.903 5.0778
(1.398 - 1.592] 1.495 10 14.950 22.3503
(1.592 - 1.786] 1.689 6 10.134 17.1163
(1.786 - 1.980] 1.883 5 9.415 17.7284
Total 30 45.044 69.6255
45.044
2
69.6255
30 0.2622
30 1
Coeficiente de variabilidad o coeficiente de variacin de Pearson: se calcula como cociente entre la des-
viacin tpica y la media.
CV
X
0 CV 1
0.2621
CV 0.1732
1.513
CV 17.32%
El coeficiente de variabilidad est por debajo del 20%, por lo tanto, los valores de la serie estn concentra-
dos alrededor de la media.
MEDIDAS DE FORMA
Las medidas de forma permiten conocer qu forma tiene la curva que representa la serie de datos de la
muestra. En concreto, podemos estudiar las siguientes caractersticas de la curva:
a) Concentracin: mide si los valores de la variable estn ms o menos uniformemente repartidos a lo lar-
go de la muestra.
b) Asimetra: mide si la curva tiene una forma simtrica, es decir, si respecto al centro de la misma (centro
de simetra) los segmentos de curva que quedan a derecha e izquierda son similares.
c) Curtosis: mide si los valores de la distribucin estn ms o menos concentrados alrededor de los valo-
res medios de la muestra.
Concentracin:
Para medir el nivel de concentracin de una distribucin de frecuencia se pueden utilizar distintos indicado-
res, entre ellos el ndice de Gini.
n 1
p q i i
IG i 1
n 1
p
i 1
i
En donde pi mide el porcentaje de individuos de la muestra que presentan un valor igual o inferior al de
X i . pi se calcula aplicando la siguiente frmula:
f1 f 2 f3 fi
pi
n
X1 f1 X 2 f 2 X 3 f3 X i fi
qi
X1 f1 X 2 f 2 X 3 f3 X n1 f n1 X n f n
Ejemplo: si tomamos los 30 datos agrupados (sin intervalo de clase) de las estaturas de los habitantes:
1.3087
IG 0.1020 10.20%
12.8333
Un ndice Gini de 10.20% indica que la muestra est bastante uniformemente repartida, es decir, su nivel
de concentracin no es excesivamente alto.
K 1
p q i i
IG k 1
K 1
p
k 1
i
f1 f 2 f3 fi
pi
n
X1 f1 X 2 f 2 X 3 f3 X i f i
qi
X1 f1 X 2 f 2 X 3 f3 X k 1 f k 1 X k f k
0.2281
IG 0.1160 11.60%
1.9667
Un ndice Gini de 11.60% indica que la muestra est bastante uniformemente repartida, es decir, su nivel
de concentracin no es excesivamente alto.
Estatura
Xi fi Acum(fi) pi Xifi Acum(Xifi) qi pi-qi
(Cm.)
[1.010 - 1.204] 1.107 6 6 0.2000 6.642 6.642 0.1475 0.0525
(1.204 - 1.398] 1.301 3 9 0.3000 3.903 10.545 0.2341 0.0659
(1.398 - 1.592] 1.495 10 19 0.6333 14.950 25.495 0.5660 0.0673
(1.592 - 1.786] 1.689 6 25 0.8333 10.134 35.629 0.7910 0.0424
(1.786 - 1.980] 1.883 5 30 9.415 45.044
Total 30 1.9667 0.2281
Asimetra:
Hemos comentado que el concepto de asimetra se refiere a si la curva que forman los valores de la serie
presenta la misma forma a izquierda y derecha de un valor central (media aritmtica)
1 0 1 0 1 0
Para medir el nivel de asimetra se utiliza el llamado Coeficiente de Asimetra de Fisher, que viene definido:
3
n n
Xi X
1
n 1 n 2 i 1
Si 1 0 , entonces : X X Me X Mo
Si 1 0 , entonces : X X Me X Mo
30
1 0.9404 0.0347
30 1 30 2
Como 1 0.0347 es casi simtrico, con una ligera acumulacin a la derecha.
3
n K
Xk X
1
n 1 n 2 k 1 k
f
45.044
X 1.5015
30
45.044
2
69.6255
30 0.2622
30 1
30
1 4.1719 0.1541
30 1 30 2
Los datos tienen una distribucin asimtrica negativa o a izquierdas (desplazada hacia la izquierda).
45.044
X 1.502
30
15 9
X Me 1.398 1.592 1.398 1.514
10
10 3
X Mo 1.398 1.592 1.398 1.521
10 6 10 3
Entonces: X X Me X Mo
Curtosis:
El Coeficiente de Curtosis analiza el grado de concentracin que presentan los valores alrededor de la zona
central de la distribucin.
Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de los valores centrales de
la variable (el mismo que presenta una distribucin normal).
Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de los valores centrales
de la variable.
Distribucin leptocrtica: presenta un elevado grado de concentracin alrededor de los valores centrales
de la variable.
2 0
2 0
2 0
n n 1 Xi X 3 n 1
4 2
n
2 n 2 n 3
n 1 n 2 n 3 i 1
Si 2 0 : Distribucin mesocrtica.
Si 2 0 : Distribucin platicrtica.
Si 2 0 : Distribucin leptocrtica.
30 30 1 3 30 1
2
2 62.3581 0.6921
30 1 30 2 30 3
30 2 30 3
Como 2 0.6921 es ligeramente platicrtica (achatada).
n n 1 Xk X 3 n 1
4 2
K
2
n 1 n 2 n 3
k 1
f
k n 2 n 3
45.044
X 1.5015
30
45.044
2
69.6255
30 0.2622
30 1
30 30 1 3 30 1
2
2 55.7635 0.9719
30 1 30 2 30 3
30 2 30 3
Como 2 0.9719 es ligeramente platicrtica (achatada).