Professional Documents
Culture Documents
Media aritmtica
o promedio
Es aquella medida que se obtiene al dividir la suma de todos los valores de una
variable por la frecuencia total. En palabras ms simples, corresponde a la suma de un
conjunto de datos dividida por el nmero total de dichos datos.
Ejemplo 1:
En matemticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3
n = 6 (nmero total de datos)
La media aritmtica de las notas de esa asignatura es 4,8. Este nmero representa el
promedio.
Ejemplo 2:
Cuando se tienen muchos datos es ms conveniente agruparlos en una tabla de
frecuencias y luego calcular la media aritmtica. El siguiente cuadro con las medidas de
63 varas de pino lo ilustra.
Largo (en m)
Frecuencia absoluta
10
10 = 50
15
15 = 90
20
20 = 140
12
12 = 96
6 = 54
Frecuencia total = 63
430
Se debe recordar que la frecuencia absoluta indica cuntas veces se repite cada valor,
por lo tanto, la tabla es una manera ms corta de anotar los datos (si la frecuencia
absoluta es 10, significa que el valor a que corresponde se repite 10 veces).
Moda (Mo)
Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o
sea, cual se repite ms.
Ejemplo 1:
Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de
nias de un Jardn Infantil.
5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3
La edad que ms se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)
Ejemplo 2:
20, 12, 14, 23, 78, 56, 96
En este conjunto de datos no existe ningn valor que se repita, por lo tanto, este
conjunto de valores no tiene moda.
Mediana (Med)
Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a
menor o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante
corresponde al nmero del caso que representa la mediana de la distribucin.
Es el valor central de un conjunto de valores ordenados en forma creciente o
decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual
nmero de valores antes y despus de l en un conjunto de datos agrupados.
Segn el nmero de valores que se tengan se pueden presentar dos casos:
Si el nmero de valores es impar, la Mediana corresponder al valor central de dicho
conjunto de datos.
Ejemplo 3:
lo cual significa que la mediana se ubica en la posicin intermedia entre los alumnos 25
y 26 (cuyo promedio es 25,5), lo cual vemos en el siguiente cuadro:
puntaje
alumnos
62
62
62
62
62
67
67
67
67
67
10
72
11
72
12
72
13
72
14
72
15
72
16
72
17
72
18
77
19
77
20
77
21
77
22
77
23
77
24
77
25
77
26
77
27
77
28
77
29
77
30
82
31
82
32
82
33
82
34
82
35
82
36
82
37
82
38
82
39
82
40
82
41
82
42
82
43
82
44
82
45
82
46
87
47
87
48
87
49
87
50
La mediana es 77, lo cual significa que 25 alumnos obtuvieron puntaje desde 77 hacia
abajo (alumnos 25 hasta el 1 en el cuadro) y 25 alumnos obtuvieron puntaje de 77 hacia
arriba (alumnos 26 hasta el 50 en el cuadro).
Ejemplo ilustrativo
Calcular la media aritmtica de las siguientes calificaciones de Estadstica tomadas de
una muestra de 20, sin agrupar, agrupando en tablas de frecuencias y agrupando en
intervalos.
4, 8, 10, 10, 5, 10, 9, 8, 6, 8, 10, 8, 5, 7, 4, 4, 8, 8, 6 y 6
Solucin:
1) Sin agrupar
10
Total 20
3) Agrupando en intervalos
Intervalos f
xm
4- 5
4,5
6 -7
6,5
8- 9
8,5
10-11
10,5
LA VARIANZA (S2 2 ):
La varianza es una medida de dispersin relativa a algn punto de referencia. Ese punto
de referencia es la media aritmtica de la distribucin. Ms especficamente, la varianza
es una medida de que tan cerca, o que tan lejos estn los diferentes valores de su propia
media aritmtica. Cuando ms lejos estn las Xi de su propia media aritmtica, mayor es
la varianza; cuando ms cerca estn las Xi a su media menos es la varianza. Y se define
y expresa matemticamente de la siguiente manera:
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de Ier ao, a saber: 18,23, 25,
27, y 34. Al calcular la media aritmtica (promedio de las edades, se obtuvo 25.4 aos,
encontrar la varianza de las edades de estos estudiantes:
Para calcular se utiliza una tabla estadstica de trabajo de la siguiente manera:
Xi
18
23
25
27
34
Total
clases
7.420 21.835
21.835 36.250
36.250 50.665
50.665 65.080
65.080 79.495
79.495 93.910
Total
= 21,649.344 / 30 = 721.645
Respuesta: la varianza de las cuentas por cobrar es igual B/.721.645
Propiedades de la varianza :
Siendo
Ni el n de elementos del subconjunto (i)
S2i la varianza del subconjunto (i)
Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raz cuadrada
positiva de esta. A la desviacin se le representa por la letra minscula griega "sigma"
( ) por la letra S mayscula, segn otros analistas.
Clculo de la Desviacin Estndar
= 2 S = S2
Ejemplo:
Del calculo de la varianza de las edades de cinco estudiantes universitarios de primer
ao se obtuvo 2=27.44, como la desviacin estndar es la raz cuadrada positiva,
entonces = 27.44 = 5.29 aos.
Igual procedimiento se aplica para encontrar le desviacin estndar de las cuentas por
cobrar de la Tienda Cabreras y Asociados, recordemos que la varianza obtenida fue de
721.645, luego entonces la desviacin estndar es igual a =721.645 = 26.86 balboas.
A su vez la desviacin estndar, tambin tiene una serie de propiedades que se deducen
fcilmente de las de la varianza (ya que la desviacin tpica es la raz cuadrada positiva
de la varianza):
Donde: C.V. representa el nmero de veces que la desviacin tpica contiene a la media
aritmtica y por lo tanto cuanto mayor es CV mayor es la dispersin y menor la
representatividad de la media.
Ejemplo:
Suponga que Usted trabaja en una compaa de ventas, que ofrece como premio de
incentivo al mejor vendedor del trimestre anterior las entradas al palco empresarial en la
serie final de bisbol de las grandes ligas en los Estados Unidos (E,E,U,A,).
De los registros de ventas se tienen los siguientes datos de ventas, expresados en
porcentajes de cumplimiento de las metas fijadas mensualmente:
Vendedor A 95 105 100
Vendedor B 100 90 110
MEDIA
Es la medida de posicin central ms utilizada, la ms conocida y la ms sencilla de
calcular, debido principalmente a que sus ecuaciones se prestan para el manejo
algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su
sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado
grandes o pequeos. La media se define como la suma de todos los valores observados,
dividido por el nmero total de observaciones.
Ecuacin 5-1
Ecuacin 5- 2
Ecuacin 5-3
Donde (X) representa la Media para la muestra, (n) el tamao de la muestra y (Xi)
representa cada uno de los valores observados. Esta frmula nicamente es aplicable si
los datos se encuentran desagrupados; en caso contrario debemos calcular la media
mediante la multiplicacin de los diferentes valores por la frecuencia con que se
encuentren dentro de la informacin; es decir,
Ecuacin 5-4
Para entender mejor este concepto vamos a suponer que hemos tomado la edad de 5
personas al azar cuyos resultados fueron (22, 33, 35, 38 y 41). Para facilitar su
interpretacin se han generado tres rangos de edad los cuales se han establecido de 21 a
30 aos, de 31 a 40 aos y de 41 a 50 aos. Si nos fijamos en estos rangos notaremos
que los puntos medios son 25, 35 y 45 respectivamente. Los resultados de la
organizacin de estos datos se representan en la tabla [5-1].
Figura 5-1
Lo que nos indicara que el promedio de edad para los datos desagrupados es de 34 aos
aproximadamente. Esta diferencia se debe a que al agrupar los datos se pierde
parcialmente la exactitud de los clculos, principalmente al aumentar el nmero de
datos. Para evitar estos inconvenientes, SPSS nos permite calcular las Medias, como si
se trataran de valores desagrupados, aunque tiene algunos procedimientos para valores
agrupados.
Es importante resaltar que existe una gran variedad de medias como la Media
geomtrica, la Media ponderada, la Media cuadrtica, etc. Por el momento slo
hacemos nfasis en la media aritmtica ya que es la ms utilizada, aunque se
recomienda a los lectores profundizar en estos temas.
2. MEDIANA
Con esta medida podemos identificar el valor que se encuentra en el centro de los datos,
es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del
conjunto de datos despus que las observaciones se han ubicado en serie ordenada. Esta
medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la
otra mitad por encima del mismo. Para determinar la posicin de la mediana se utiliza la
frmula
Ecuacin 5-5
Para comprender este concepto vamos a suponer que tenemos la serie ordenada de
valores (2, 5, 8, 10 y 13), la posicin de la mediana sera:
Es decir, la posicin tres y medio. Dado que es imposible destacar la posicin tres y
medio, es necesario promediar los dos valores de la posiciones tercera y cuarta para
producir una mediana equivalente, que para el caso corresponden a (8 + 10)/2 =9. Lo
que nos indicara que la mitad de los valores se encuentra por debajo del valor 9 y la
otra mitad se encuentra por encima de este valor.
En conclusin la mediana nos indica el valor que separa los datos en dos fracciones
iguales con el cincuenta porciento de los datos cada una. Para las muestras que cuentan
con un nmero impar de observaciones o datos, la mediana dar como resultado una de
las posiciones de la serie ordenada; mientras que para las muestras con un nmero par
de observaciones se debe promediar los valores de las dos posiciones centrales.
3. MODA
La medida modal nos indica el valor que ms veces se repite dentro de los datos; es
decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que ms veces se repite es el
nmero 2 quien seria la moda de los datos. Es posible que en algunas ocasiones se
presente dos valores con la mayor frecuencia, lo cual se denomina Bimodal o en otros
casos ms de dos valores, lo que se conoce como multimodal.
En conclusin las Medidas de tendencia central, nos permiten identificar los valores
ms representativos de los datos, de acuerdo a la manera como se tienden a concentrar.
La Media nos indica el promedio de los datos; es decir, nos informa el valor que
obtendra cada uno de los individuos si se distribuyeran los valores en partes iguales. La
Mediana por el contrario nos informa el valor que separa los datos en dos partes iguales,
cada una de las cuales cuenta con el cincuenta porciento de los datos. Por ltimo la
Moda nos indica el valor que ms se repite dentro de los datos.
QU ES LA DESVIACIN ESTANDAR Y COMO INTERPRETARLA #2
13 noviembre 2009
La otra manera de interpretar este resultado, sera decir que se espera un cambio en el
precio de este activo de $1.78 o menos aproximadamente dos das hbiles de cada
tres, un cambio de $3.56 o menor aproximadamente 19 de cada 20 das, y solo un da
de cada 20 podemos esperar un cambio en el precio de mas de $3.56. Recuerde que
estamos hablando en trminos de probabilidad, y puede que sea poco probable que el
precio cambie ms de tres desviaciones, pero no es imposible.
Aplicabilidad
Para los que estn ms familiarizados con el mercado, sabemos que la volatilidad es til
no slo para ver el movimiento que pueda tener el activo, sino que es importante a la
hora de valorar opciones. En un modelo de valuacin de opciones la volatilidad es el
nico factor que no puede ser directamente observado, y va a depender de muchos
factores tales como el mtodo utilizado para determinarla, numero de datos, situacin
especifica en un momento del tiempo, etc, sin embargo, lo que si es cierto es que el
precio de las opciones depende de las expectativas de volatilidad, a mayor volatilidad,
mas caras son las opciones.
Es entonces cuando podemos hablar de volatilidad histrica (desviacin estndar) y
volatilidad implcita, la histrica ya vimos que se obtiene de datos pasados, mientras
que la implcita es la valoracin de la volatilidad que hace el mercado hasta el
vencimiento de una opcin y que est continuamente cambiando en funcin de las
expectativas y variaciones en las primas de las opciones.
La volatilidad implcita se calcula en un determinado momento seleccionado un modelo
de valoracin de opciones y despejando la incgnita, tenemos como datos: el precio de
la opcin que est cotizando en el mercado, el tiempo al vencimiento, el precio de
ejercicio de la opcin y el precio de cotizacin del activo subyacente.
Esta volatilidad est expresada en trminos anuales en la mayora de los casos, sin
embargo la caracterstica que presenta la volatilidad implcita y la desviacin estndar
es que es proporcional a la raz cuadrada del tiempo. Por lo tanto la volatilidad anual
(sa) de un activo es igual a la volatilidad diaria multiplicada por la raz cuadrada de 252
o de 360 dependiendo los das hbiles o calendarios que cotice:
Para muchos la
palabra desviacin estndar puede sonar desconocida y no la habrn odo nombrar a
menos que hayan asistido a una clase de estadstica.
Sin embargo no se preocupe, es probable que si ha escuchado la palabra volatilidad,
volatilidad del mercado, volatilidad del precio, ya esta familiarizado con el tema, ya que
volatilidad lo podemos connotar como movimiento, y significa lo mismo que desviacin
estndar sino que esta ltima palabra es usada en estricto sentido matemtico
Que es desviacin estndar?
Justamente la desviacin Estndar, en un conjunto de datos (precios en el caso del
mercado de valores) es una medida de dispersin, que nos indica cunto pueden
alejarse los valores respecto al promedio (media), por lo tanto es til para buscar
probabilidades de que un evento ocurra, o en el caso del mercado burstil, determinar
entre que rango de precios puede moverse un determinado activo, y determinar que tipo
de activos pueden ser mas voltiles que otros.
Los operadores del mercado estn interesados en la direccin del precio de un activo y
en la velocidad de los movimientos del subyacente para determinar que tan riesgoso o
vlatil puede llegar a ser un activo. Los mercados cuyos precios se mueven lentamente
son mercados de baja volatilidad, los mercados cuyos precios se mueven a alta
velocidad son mercados de alta volatilidad.
Existen varias maneras de estimar la volatilidad, y el mundo ideal sera aquel donde se
pueda determinar la volatilidad de todo el conjunto de datos existentes, sin embargo
teniendo en cuenta que se cuentan con recursos (informacin, costos, etc) limitados, la
desviacin estndar se pude tomar sobre un determinado conjunto de datos que se
ajusten a nuestros requerimientos, mediante la siguiente frmula:
Donde
xi= dato i que esta entre (o, n)
x= promedio de los datos
n= numero datos
Cmo se interpreta y se analiza?
Ya dijimos que los operadores y los inversores estaran muy interesados en saber cual
puede ser la direccin del precio, y tambin poder determinar un rango de precios en el
cual el activo pueda moverse. Veamos entonces un ejemplo de cmo calcular la
desviacin y su interpretacin:
Si definimos la desviacin como una medida de la variacin de los precios, esta
medida se basar en los cambios porcentuales que sufren los mismos. Sin embargo
existen dos formas de calcular estos cambios porcentuales:
Este simple numerito aunque nos dice una aproximacion del movimiento, nos puede
resultar til para interpretarlo en trminos de probabilidad, es decir cul es la
probabilidad de que el activo cotice a determinado precio, pero este tema lo trataremos
en la segunda parte de este articulo.
La Desviacin Estndar
Bsqueda personalizada
Inicio Cursos Ciencia Estadsticas Estadsticas Coeficiente de
correlacin lineal
Compartir
en Facebook
Compartir
en Twitter
Enviar
amigo
Reportar
Error
Imprimir
artculo
Leccin 12 ndice
< Anterior
10
11
12
13
14
15
16
Siguiente >
No obstante, puede que exista una relacin que no sea lineal, sino exponencial,
parablica, etc. En estos casos, el coeficiente de correlacin lineal medira mal la
intensidad de la relacin las variables, por lo que convendra utilizar otro tipo de
coeficiente ms apropiado.
Para ver, por tanto, si se puede utilizar el coeficiente de correlacin lineal, lo mejor es
representar los pares de valores en un grfico y ver que forma describen.
El coeficiente de correlacin lineal se calcula aplicando la siguiente frmula:
Es decir:
Numerador: se denomina covarianza y se calcula de la siguiente manera: en cada par
de valores (x,y) se multiplica la "x" menos su media, por la "y" menos su media. Se
suma el resultado obtenido de todos los pares de valores y este resultado se divide por el
tamao de la muestra.
Denominador se calcula el producto de las varianzas de "x" y de "y", y a este producto
se le calcula la raz cuadrada.
Los valores que puede tomar el coeficiente de correlacin "r" son: -1 < r < 1
Si "r" > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de la
otra). La correlacin es tanto ms fuerte cuanto ms se aproxime a 1.
Por ejemplo: altura y peso: los alumnos ms altos suelen pesar ms.
Si "r" < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye
el de la otra). La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a -1.
Por ejemplo: peso y velocidad: los alumnos ms gordos suelen correr menos.
Si "r" = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro
tipo de correlacin (parablica, exponencial, etc.)
De todos modos, aunque el valor de "r" fuera prximo a 1 o -1, tampoco esto quiere
decir obligatoriamente que existe una relacin de causa-efecto entre las dos variables,
ya que este resultado podra haberse debido al puro azar.
Ejemplo: vamos a calcular el coeficiente de correlacin de la siguiente serie de datos de
altura y peso de los alumnos de una clase:
Alumno
Estat Pes
Estat Pes
Estat Pes
Alumno
Alumno
ura
o
ura
o
ura
o
Alumno
1
1,25
32
Alumno
11
1,25
33
Alumno
21
1,25
33
Alumno
2
1,28
33
Alumno
12
1,28
35
Alumno
22
1,28
34
Alumno
3
1,27
34
Alumno
13
1,27
34
Alumno
23
1,27
34
Alumno
4
1,21
30
Alumno
14
1,21
30
Alumno
24
1,21
31
Alumno
5
1,22
32
Alumno
15
1,22
33
Alumno
25
1,22
32
Alumno
6
1,29
35
Alumno
16
1,29
34
Alumno
26
1,29
34
Alumno
7
1,30
34
Alumno
17
1,30
35
Alumno
27
1,30
34
Alumno
8
1,24
32
Alumno
18
1,24
32
Alumno
28
1,24
31
Alumno
9
1,27
32
Alumno
19
1,27
33
Alumno
29
1,27
35
Alumno
10
1,29
35
Alumno
20
1,29
33
Alumno
30
1,29
34
Aplicamos la frmula:
(1/30) * (0,826)
r =----------------------------------------------------------(((1/30)*(0,02568)) * ((1/30)*(51,366)))^(1/2)
Interpretacin:
**Si r < 0 Hay correlacin negativa : las dos variables se correlacionan en sentido
inverso.A valores altos de una de ellas le suelen corresponder valor bajos de la otra y
viceversa.Cunto ms prximo a -1 est el coeficiente de correlacin ms patente ser
esta covariacin extrema.Si r= -1 hablaremos de correlacin negativa perfecta lo que
supone una determinacin absoluta entre las dos variables ( en sentido inverso): Existe
una relacin funcional perfecta entre ambas(una relacin lineal de pendiente negativa).
** Si r > 0 Hay correlacin positiva: las dos variables se correlacionan en sentido
directo.A valores altos de una le corresponden valores altos de la otra e igualmente con
los valores bajos.Cunto ms prximo a +1 est el coeficiente de correlacin ms
patente ser esta covariacin.Si r = 1 hablaremos de correlacin positiva perfecta lo
que supone una determinacin absoluta entre las dos variables (en sentido
directo):Existe una relacin lineal perfecta ( con pendiente positiva).
** Si r = 0 se dice que las variables estn incorrelacionadas: no puede establecerse
ningn sentido de covariacin.
Propiedad importante: Si dos variables son independientes estarn incorrelacionadas
aunque el resultado recproco no es necesariamente cierto. Matriz de correlaciones
ir a anlsis multidimensional