You are on page 1of 22

Ao de la Diversificacin Productiva y del Fortalecimiento de la

Educacin

Nombre:
Ojeda Antn Rashell

Curso:
Estadstica General

Profesor:
Hugo Luis (D) Chunga Gutirrez

Tema:
Medidas de Resumen para Datos no agrupados

INTRODUCCION
En ocasiones es conveniente resumir la informacin de una muestra (que se representa
mediante las distribuciones de frecuencias vistas anteriormente) en un solo valor para obtener
indicadores del comportamiento de la variable en diferentes sentidos, como punto alrededor
del que toma valores, variabilidad, etc. Resumir la informacin mediante un solo nmero es
interesante para comprender mejor cmo se comporta la variable y para poder realizar
comparaciones. En este captulo se consideraran las medidas de tendencia central ms
habituales. La idea de centro de una distribucin no es nica, aunque en trminos generales
se puede decir que se trata de encontrar un punto alrededor del cual tome valores la variable.
Las medidas de dispersin estn encaminadas a cuantificar lo prximos o alejados que estn
los datos de la muestra de un punto central. Estas medidas indicaran por un lado el grado de
variabilidad que hay en la muestra y, por otro, la representatividad de dicho punto central, ya
que si se obtiene un valor pequeo, eso significar a que los valores se concentran en torno a
ese centro (por lo que habr poca variabilidad y el centro representar a bien a todos). En
cambio, si se obtiene un valor grande, significara que los valores no estn concentrados, sino
dispersos (por lo que habr mucha variabilidad y el centro no ser muy representativo).
Las medidas de posicin nos facilitan informacin sobre la serie de datos que estamos
analizando. La descripcin de un conjunto de datos, incluye como un elemento de
importancia la ubicacin de stos dentro de un contexto de valores posible. Una vez definidos
los conceptos bsicos en el estudio de una distribucin de frecuencias de una variable,
estudiaremos las distintas formas de resumir dichas distribuciones mediante medidas de
posicin (o de centralizacin), teniendo presente el error cometido en el resumen mediante las
correspondientes medidas de dispersin.
Se trata de encontrar unas medidas que sinteticen las distribuciones de frecuencias. En vez
de manejar todos los datos sobre las variables, tarea que puede ser pesada, podemos
caracterizar su distribucin de frecuencias mediante algunos valores numricos, eligiendo
como resumen de los datos un valor central alrededor del cual se encuentran distribuidos los
valores de la variable Son medidas estadsticas cuyo valor representa el valor del dato que se
encuentra en el centro de la distribucin de frecuencia, por lo que tambin se les llama
"Medidas de Tendencia Central ".

Es la apariencia externa de la distribucin de frecuencias o de una coleccin de datos


cuantitativos y viene dada representada por el aspecto grfico. Dentro de la forma se incluye
simetra o asimetra de la curva y el grado de apuntamiento o achatamiento de la curva. Son
medidas relativas, es decir son cocientes o razones y no vienen expresadas en ninguna
unidad de medida

MEDIDAS DE RESUMEN

Las medidas de resumen sirven para describir en forma resumida un conjunto de datos que
constituyen una muestra tomada de alguna poblacin.
Podemos distinguir cuatro grupos de medidas de resumen: las medidas de centro, las medidas de
posicin, (las de centro son casos especiales de estas ltimas), las medidas de dispersin y las
medidas de forma.
Supngase que se dispone de una muestra de observaciones x1, x2, ... xn . Con estas observaciones se
efectuarn los clculos de todas las medidas de resumen que se presentan a continuacin.
A modo de ejemplo, se dispone de tres muestras de datos con las que se obtendrn las medidas de
resumen. Los tres estn ordenados de menor a mayor, por columnas.
Jorge Galbiati Riesco

50

140

175

270

430

50
80
80
90
90
90
95
130
140

150
150
150
150
150
150
150
160
170

180
185
190
190
195
250
250
250
250

280
285
290
295
350
350
365
370
395

450
460
500
510

Muestra 1. Ingresos de 45 empleados de una firma (miles de pesos).


8

14

17

21

11

12

14

8
9
10
12
12
13
14
14
14

15
15
15
16
16
16
17
17
17

17
18
18
18
19
19
19
20
20

22
23
23
23
24
25
27

4
4
7
7
8
8
8
8
8

9
9
9
9
9
9
9
9
10

11
11
11
12
12
12
12
12
12

12
12
12
12
12
13
13
14
14

14

Muestra 2. Pesos de bultos

Muestra 3. Escolaridad de los habitantes

transportados por un correo (kgs).

adultos de un condominio (aos).

Medidas de Centro
Son medidas que pretenden indicar dnde est lo que se podra considerar como el centro de la mas
a
de datos. Promedio o media. Es la suma de todas las observaciones, dividida por el nmero de ellas.
Las ms conocidas son las siguientes:

Media Aritmtica:
Es la medida de tendencia central ms utilizada, tambin se le conoce con el nombre de
Promedio. Para calcular la media aritmtica, se suman todos los datos de la muestra y el
resultado se divide entre el total de datos.

1.-MEDIA ARITMETICA PARA DATOS NO AGRUPADOS

El smbolo que representa a la media aritmtica es una letra X con una barra
sobre ella.

La letra x significa uno de los datos de la muestra y la i es el conteo de los datos


especficos
La frmula en su esquema de desarrollo se presenta de la siguiente manera:

EJEMPLO:
Los sueldos semanales de 5 trabajadores de una obr a de construccin civil son
los siguientes: 500, 550, 600, 700 y 800 nuevos soles. Por lo tanto el sueldo
promedio de los 5 trabajadores es:
DESARROLLO:
DATOS:
500, 550, 600, 700, 800

2.-MEDIANA:
Para un conjunto de datos ORDENADOS de mayor a menor, la mitad de los
valores sern menores o iguales a la MEDIANA mientras que la mitad
restante ser mayor o igual a la MEDIANA.

Es el valor que ocupa el lugar central de todos los datos cuando stos estn
ordenados de menor a mayor.
La mediana se representa por Me
Datos pares: (X N/2 + X N/2 + 1) / 2 = Me
Datos impares: X N+1/2 = Me

Figura IV.7: Los nios han sido ordenados desde el ms pequeo al ms grande.
La mediana corresponde a la altura de la nia central.

Mi altura es la mediana de nuestras


alturas

Figura: Los nios han sido ordenados desde el ms pequeo al ms grande.


La mediana corresponde a la altura de la nia central.

1) PARA DATOS NO AGRUPADOS

EJEMPLOS:

1.1) PARA UN NMERO DE DATOS IMPAR


La mediana es el dato que se encuentra a la mitad de la lista. Para calcular su
posicin se aplica la siguiente ecuacin:

Ejemplo ilustrativo:
Calcular la mediana de las siguientes calificaciones del curso
de Estadstica evaluadas sobre diez: 10, 8, 6, 4, 9, 7, 10, 9 y 6
Solucin:
1) Se ordena los datos de menor a mayor:

2) Se aplica la ecuacin:

La mediana es el valor de x5 (quinto dato), es decir, Md=8


1.2) PARA UN NMERO DE DATOS PAR
La mediana es la media aritmtica de los dos datos que se encuentran a la mitad
de la lista. Para calcular su posicin se aplica la siguiente ecuacin:

Ejemplo ilustrativo: Calcular la mediana de las siguientes calificaciones del curso


de Matemtica evaluadas sobre diez: 10, 8, 9, 6, 4, 8, 9, 7, 10 y 9
Solucin:
1) Se ordena los datos de menor a mayor:

2) Se aplica la ecuacin

3.-MODA:
Se refiere al valor de la variable que ms se repite en una distribucin de
frecuencia, o el valor que est representado por el mayor nmero de
observaciones
En un grfico de barra o histograma la moda corresponde al valor en que la
distribucin alcanza el mximo
EJEMPLOS:
1.- Determinar la moda del siguiente conjunto de datos:
a).- 1, 2, 3, 3, 4, 5, 6, 7, 7, 3, 1, 9, 3
La moda de este conjunto de datos es igual a 3 y si considera unimodal
b).- 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, -3, 4, 6, 3, 3
Las modas de este conjunto de datos son 3 y 4 ya que ambas tienen la ms alta
frecuencia, por lo que la muestra es bimodal
c).- 1, 2, 3, 4, 5, 6, 7, 8, 9
La muestra no contiene ningn dato repetido por lo que se considera que la
muestra es amodal.
Grficamente eso se puede reflejar mediante el anlisis de un histograma de
frecuencias.

MEDIDAS DE POSICION

1.-CUANTILES
Los cuantiles son medidas de posicin que se determinan mediante
un mtodo que determina la ubicacin de los valores que dividen un conjunto de
observaciones en partes iguales.
Los cuantiles son los valores de la distribucin que la dividen en partes iguales, es
decir, en intervalos que comprenden el mismo nmero de valores. Cuando la
distribucin contiene un nmero alto de intervalos o de marcas y se requiere
obtener un promedio de una parte de ella, se puede dividir la distribucin en
cuatro, en diez o en cien partes.
Los ms usados son los cuartiles, cuando dividen la distribucin en cuatro partes;
los deciles, cuando dividen la distribucin en diez partes y los centiles o
percentiles, cuando dividen la distribucin en cien partes. Los cuartiles, como los
deciles y los percentiles, son en cierta forma una extensin de la mediana.
Para algunos valores u, se dan nombres particulares a los cuantiles, Q (u):

2.-CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del
cual queda un cuarto (25%) de todos los valores de la sucesin (ordenada); el
tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas
partes (75%) de los datos.

Para Datos No Agrupados


Si se tienen una serie de valores X1, X2, X3... Xn, se localiza mediante las
siguientes frmulas:
- El primer cuartil:
Cuando n es par:

Cuando n es impar:

Para el tercer cuartil


Cuando n es par:

Cuando n es impar:

3.-DECILES
Los deciles son ciertos nmeros que dividen la sucesin de datos ordenados en diez partes porcentualmente
iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son
tambin un caso particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil,
segundo decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el aprovechamiento acadmico.

Frmulas Datos No Agrupados


Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas:

Cuando n es par:

Cuando n es impar:
Siendo A el nmero del decil.

4.-CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de ubicacin o clasificacin de las
personas cuando atienden caractersticas tales como peso, estatura, etc.
Los percentiles son ciertos nmeros que dividen la sucesin de datos ordenados en cien partes
porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos
ordenados. Los percentiles (P1, P2,... P99), ledos primer percentil,..., percentil 99.

Frmulas Datos No Agrupados


Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas:
Para los percentiles, cuando n es par:

Cuando n es impar:
Siendo A, el nmero del percentil.
Es fcil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el percentil 50 y el tercer
cuartil con el percentil 75.
EJEMPLO
Determinacin del primer cuartil, el sptimo decil y el 30 percentil, de la siguiente tabla:

(I. De

20

30

40

50

60

70
Como son datos agrupados, se utiliza la frmula

Siendo,

La posicin del primer cuartil.

La posicin del 7 decil.

La posicin del percentil 30.


Entonces,

El primer cuartil:
115.5 85 = 30.75
Li = 300, Ic = 100 , fi = 90

El 7 decil:

Posicin:
324.1 295 = 29.1
Li = 500, fi = 70

El percentil 30
Posicin:

138.9 85 = 53.9
fi = 90

MEDIDAS DE DISPERSIN

DESVIACIN ESTNDAR

Habamos visto que la varianza transforma todas las distancias a valores positivos
elevndolas al cuadrado, con el inconveniente de elevar consigo las unidades de
los datos originales.
La desviacin estndar soluciona el problema obteniendo la raz cuadrada de la
varianza, consiguiendo as, un valor similar a la desviacin media.

Desviacin estndar o tpica (S o ): Es igual a la raz cuadrada de la


varianza.

La S representa la desviacin estndar de una muestra, mientras que la


desviacin para todos los datos de una poblacin. Ampliando las frmulas
tenemos
Aplicamos el mismo procedimiento a las frmulas para las tablas de frecuencias
tipo A.
Y para las tablas de frecuencias tipo B.
Ejemplo: Desviacin estndar para datos no agrupados

Varianza:

Varianza (S2 o 2): Es el resultado de la divisin de la sumatoria de las


distancias existentes entre cada dato y su media aritmtica elevadas al
cuadrado, y el nmero total de datos.
Distinguimos dos smbolos para identificar la varianza: S 2 para datos muestrales,
s2

x x

Y 2 para datos poblacionales.


2

x x

Ejemplo: Varianza para datos no agrupados

Coeficiente de variacin
En estadstica, cuando se desea hacer referencia a la relacin entre el tamao de
la media y la variabilidad de la variable, se utiliza el coeficiente de variacin.
Su frmula expresa la desviacin estndar como porcentaje de la media
aritmtica, mostrando una mejor interpretacin porcentual del grado de variabilidad
que la desviacin tpica o estndar. Por otro lado presenta problemas ya que a
diferencia de la desviacin tpica este coeficiente es variable ante cambios de
origen. Por ello es importante que todos los valores sean positivos y su media d,
por tanto, un valor positivo. A mayor valor del coeficiente de variacin mayor

heterogeneidad de los valores de la variable; y a menor C.V., mayor


homogeneidad en los valores de la variable. Suele representarse por medio de las
siglas C.V.
Exigimos que:
Se calcula:

Donde

es la desviacin tpica. Se puede dar en tanto por ciento calculando:

Una distribucin tiene x = 140 y = 28.28 y otra x = 150 y = 25. Cul de las
dos presenta mayor dispersion?

MEDIDAS DE FORMA
1.- ASIMETRA:
Es una medida de forma de una distribucin que permite identificar y describir la
manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se
hallen dentro de la distribucin. Permite identificar las caractersticas de la
distribucin de datos sin necesidad de generar el grfico.

ASIMETRA POSITIVA O A LA DERECHA.- Se da cuando en una distribucin la


minora de los datos est en la parte derecha de la media aritmtica. Este tipo de
distribucin presenta un alargamiento o sesgo hacia la derecha, es decir, la
distribucin de los datos tiene a la derecha una cola ms larga que a la izquierda.
Tambin se dice que una distribucin es simtrica a la derecha o tiene sesgo
positivo cuando el valor de la media aritmtica es mayor que la mediana y ste a
valor de la mediana a su vez es mayor que la moda, en smbolos

Asimetra o Sesgo

Una distribucin es simtrica si la mitad izquierda de su distribucin es la


imagen especular de su mitad derecha.
En las distribuciones simtricas media y mediana coinciden. Si slo hay una
moda tambin coincide
La asimetra es positiva o negativa en funcin de a qu lado se encuentra la
cola de la distribucin.
La media tiende a desplazarse hacia las valores extremos (colas).
Las discrepancias entre las medidas de centralizacin son indicacin de
asimetra.

Asimetra:
Mide la deformacin horizontal respecto a su promedio o valor central
Si el As>o: tiene asimetra positiva. La distribucin extiende la cola hacia los
valores grandes de la variable.
Si el As<o: tiene asimetra negativa. La distribucin extiende la cola hacia
los valores pequeos de la variable.
Si el As - o: se trata de una distribucin simtrica.
COEFICIENTES DE KARL PEARSON

COEFICIENTE DE ARTHUR BOELEY

Apuntamiento o Kurtosis:
La Kurtosis nos indica el grado de apuntamiento (aplastamiento) de una
distribucin con respecto a la distribucin normal o gaussiana. Es adimensional.
Platicrtica: curtosis < 0
Mesocrtica: curtosis = 0
Leptocrtica: curtosis > 0
Los grficos que veis poseen la misma media y desviacin tpica, pero con
diferente grado de apuntamiento.
En el curso sern de especial inters las mesocrticas y simtricas (parecidas a la
normal).

Kurtosis: mide el grado de elevacin o apuntamiento de una distribucin.


Leptokurtica, Si k>0,263, es decir, es ms apuntada que la normal
Mesocrtica, Si k= 0,263, es decir es tan apuntada Como la normal
Platikurtica, Si k< 0,263, es decir, es menos apuntada que la normal

CONCLUSION:
.

Hemos observado que el estudio de la informacin a travs de los grficos ayuda


la comprensin de los datos con respecto a la poblacin.
Finalmente hemos omitidos los pasos para el clculo de las medidas de resumen,
pues en cualquier parte se pueden encontrar las formulas correspondientes a cada
tipo de dato. Es una gran ayuda las medidas de resumen ya que con estas
podemos comprender y desarrollar los estudios observados.
FUENTES BLIBLIOGRAFICAS:
www.monografias.com
www.youtube.com/watch?v=a9B3wPKjqAU
www.jorgegalbiati.cl/enero_07/MedidasResumen.pdf
www.fca.proed.unc.edu.ar/mod/book/view.php?id=3270&chapterid...
www.epiredperu.net/epired/eventos/eve_scsf.../estadistica-scsf-03.pdf
es.slideshare.net
www.dm.uba.ar/materias/analisis_de_datos/2008/1/.../Teor4.pdf
www.buenastareas.com
www.reeme.arizona.edu/materials/Medidas%20de%20resumen.pdf