You are on page 1of 6

Moda

La moda, Mo, es el valor que tiene mayor frecuencia


absoluta.

1 Todos los intervalos tienen la misma ampli tud.

Li-1 es el lmite inferior de la clase modal.


f i e s la fr e cue ncia abso luta de la clase mo da l.
f i - - 1 e s la fr e cue ncia abso luta inme dia tame nte in fer io r a
la e n clase mo dal .
f i - + 1 es la fre cue ncia abso lu ta in me diatame n te po ste r ior a
la clase mo dal .
a i es la ampl itu d de la clase .
Tambi n se ut iliz a o tra f r m ula de la m o da que da
un va lo r a pr o x im a do de sta:

2 Los intervalos tienen amplitudes distintas.


En pr ime r lu gar te ne mo s que hall ar las al turas.

L a clase mo dal es la que tie ne m ayor altura.

L a fr m ula de la mo da a pro x im a da cuando exis te n


disti ntas ampli tude s es:

Mediana

Es e l va lo r que o cupa el luga r c ent r a l de to do s


lo s dat o s cuan do sto s e stn or dena do s de m eno r a m a yor .
1 Si la se r ie tie ne un nm ero impa r de
m edida s la m edia na e s la punt ua c i n c ent r a l de la misma .
2 Si la se r ie tie ne un nm ero pa r de pun tuacio ne s
la m edia na es la m edia e ntre las do s punt ua c io ne s
c ent ra le s .

Mediana para datos agrupados

es la se misuma de las fr e cue ncias abso lutas .


L i - 1 es el lmite in fer io r de la clase do nde se
e ncue ntra
.
F i - 1 es la fr ec uenc ia a c um ula da ante r ior a la clase
me diana.
a i es la ampl itu d de la clase .

Media aritmtica

L a m edia a r it m t ic a e s e l va lo r o bte ni do
al sum a r to do s lo s dat o s y dividir e l r e sultado entr e
e lnm er o to tal de dat o s .

Cuartiles

Lo s c ua rt il es so n lo s tr es va lor e s de la
var iable divide n a un c o njunt o de da to s
or dena do s e nc ua tr o pa rt e s igua le s .

Clculo de los cuartiles


1 Or dena m o s lo s da to s de m eno r a ma yo r .
2 B uscamo s el lu gar que o cupa cada cuar til me diante la
e xpre si n

.
Clculo de los cuartiles para datos agrupados
En pr ime r lu gar busca mo s la c la se do nde se

e ncue ntra
ac um ula da s .

, e n la t a bla de la s fr ec uenc ia s

Deciles
Lo s dec il es so n lo s nuev e va lo r es que divide n la se r ie
de dat o s e n diez pa r t es igua les .

Clculo de de ciles
Or de na mo s lo s dat o s de m eno r a m a yor .
B uscamo s la p untu aci n, e n la se r ie , o la clase , e n la
tabla de las fr e cue ncias acumula das, do nde se
e ncue ntra

, .

Percentiles

Lo s per c ent il es so n lo s 99 va lo r es que dividen la se r ie


de dat o s e n 100 pa r t es igua les .

Clculo de perc entiles


Or de na mo s lo s dat o s de m eno r a m a yor .
B uscamo s la p untu aci n, e n la se r ie , o la clase , e n la
tabla de las fr e cue ncias acumula das, do nde se
e ncue ntra

Desviacin media

,.

L a desvia c i n m edia es la m edia a r it m t ic a de


lo s va lo r es a bso luto s de la s desvia c io ne s r esp ec to a la
m edia .

Desviacin media para datos agrupados

Varianza

L a var ia nz a e s la m edia ar it m t ic a del c ua dr a do de


la s desv ia c io nes r espec t o a la m edia de una dis tr ibuci n
esta dst ica.

Varianza para datos agrupados

Para simpli ficar e l c lc ulo de la var ia nz a vamo s o


utiliz ar las siguie n te s e xpre sio ne s que so n e quivale nte s a las
ante r ior e s.

Varianza para datos agrupados

Desviacin tpica

L a desvia c i n tpic a e s la r a z c ua dr a da de la
var ia nz a .

Desviacin tpica para datos agrupados

Para simpli ficar e l clcu lo vamo s o uti liz ar las sig uie nte s
e xpre sio ne s que so n e quivale nte s a las ante r io re s.

Desviacin tpica para datos agrupados

Coefi ciente de variacin


El c o efic i ent e de var ia c i n e s la re laci n e ntr e
la desv ia c i n t pic a de una mue stra y su m edia .

Coefi ciente de variacin en tanto por ciento

Puntuaciones diferenciales

L as punt ua c io nes difer enc ia l es re sult an de r est a r les a


las punt ua c io ne s dir ec t a s la m edia ar it m t ic a .
xi = Xi X

Puntuaciones tpicas
L as punt ua c io nes tpic a s so n e l re sul tado
de dividir las punt ua c io ne s difer enc ia le s e ntr e
la desv ia c i n t pic a . Es te pr o ce so se llama t ipif ic a c i n .

Distribuciones bidimensionales
Covarianza

Coefi ciente de correlacin lineal

Recta de regresin de Y sobre X

Recta de regresin de X sobre Y

a. Medidas de tendencia central


Las medidas de centralizacin vienen a responder a la primera pregunta. La medida ms evidente que
podemos calcular para describir un conjunto de observaciones numricas es su valor medio. La media no
es ms que la suma de todos los valores de una variable dividida entre el nmero total de datos de los
que se dispone.
Como ejemplo, consideremos 10 pacientes de edades 21 aos, 32, 15, 59, 60, 61, 64, 60, 71, y 80. La
media de edad de estos sujetos ser de:

Ms formalmente, si denotamos por (X1, X2,...,Xn) los n datos que tenemos recogidos de la variable en
cuestin, el valor medio vendr dado por:

Otra medida de tendencia central que se utiliza habitualmente es la mediana. Es la observacin


equidistante de los extremos.
La mediana del ejemplo anterior sera el valor que deja a la mitad de los datos por encima de dicho valor y
a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el nmero de observaciones es par (10 individuos), los dos valores que
se encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de estos dos valores nos
dar a su vez 60, que es el valor de la mediana.
Si la media y la mediana son iguales, la distribucin de la variable es simtrica. La media es muy sensible
a la variacin de las puntuaciones. Sin embargo, la mediana es menos sensible a dichos cambios.
Por ltimo, otra medida de tendencia central, no tan usual como las anteriores, es la moda, siendo ste el
valor de la variable que presenta una mayor frecuencia.
En el ejemplo anterior el valor que ms se repite es 60, que es la moda
b. Medidas de dispersin
Tal y como se adelantaba antes, otro aspecto a tener en cuenta al describir datos continuos es la
dispersin de los mismos. Existen distintas formas de cuantificar esa variabilidad. De todas ellas,
la varianza (S2) de los datos es la ms utilizada. Es la media de los cuadrados de las diferencias entre
cada valor de la variable y la media aritmtica de la distribucin.

Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene
como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada.
En el ejemplo anterior la varianza sera:

Sx2=
La desviacin tpica (S) es la raz cuadrada de la varianza. Expresa la dispersin de la distribucin y se
expresa en las mismas unidades de medida de la variable. La desviacin tpica es la medida de
dispersin ms utilizada en estadstica.

Aunque esta frmula de la desviacin tpica muestral es correcta, en la prctica, la estadstica nos
interesa para realizar inferencias poblacionales, por lo que en el denominador se utiliza, en lugar de n, el
valor n-1.
Por tanto, la medida que se utiliza es la cuasidesviacin tpica, dada por:

Aunque en muchos contextos se utiliza el trmino de desviacin tpica para referirse a ambas
expresiones.
En los clculos del ejercicio previo, la desviacin tpica muestral, que tiene como denominador n, el valor
sera 20.678. A efectos de clculo lo haremos como n-1 y el resultado seria 21,79.

El haber cambiado el denominador de n por n-1 est en relacin al hecho de que esta segunda frmula es
una estimacin ms precisa de ladesviacin estndar verdadera de la poblacin y posee las
propiedades que necesitamos para realizar inferencias a la poblacin.
Cuando se quieren sealar valores extremos en una distribucin de datos, se suele utilizar la amplitud
como medida de dispersin. La amplitud es la diferencia entre el valor mayor y el menor de la distribucin.
Por ejemplo, utilizando los datos del ejemplo previo tendremos 80-15 =65.
Como medidas de variabilidad ms importantes, conviene destacar algunas caractersticas de la varianza
y desviacin tpica:
Son ndices que describen la variabilidad o dispersin y por tanto cuando los datos estn
muy alejados de la media, el numerador de sus frmulas ser grande y la varianza y la
desviacin tpica lo sern.
Al aumentar el tamao de la muestra, disminuye la varianza y la desviacin tpica. Para
reducir a la mitad la desviacin tpica, la muestra se tiene que multiplicar por 4.
Cuando todos los datos de la distribucin son iguales, la varianza y la desviacin tpica son
iguales a 0.
Para su clculo se utilizan todos los datos de la distribucin; por tanto, cualquier cambio de
valor ser detectado.
Otra medida que se suele utilizar es el coeficiente de variacin (CV). Es una medida de dispersin
relativa de los datos y se calcula dividiendo la desviacin tpica muestral por la media y multiplicando el
cociente por 100. Su utilidad estriba en que nos permite comparar la dispersin o variabilidad de dos o
ms grupos. As, por ejemplo, si tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 Kg) cuya media es
de 69,6 kg. y su desviacin tpica (s) = 10,44 y la TAS de los mismos (150, 170, 135, 180 y 195 mmHg)
cuya media es de 166 mmHg y su desviacin tpica de 21,3. La pregunta sera: qu distribucin es ms
dispersa, el peso o la tensin arterial? Si comparamos las desviaciones tpicas observamos que la
desviacin tpica de la tensin arterial es mucho mayor; sin embargo, no podemos comparar dos variables
que tienen escalas de medidas diferentes, por lo que calculamos los coeficientes de variacin:

CV de la variable peso =

CV de la variable TAS =
A la vista de los resultados, observamos que la variable peso tiene mayor dispersin.
Cuando los datos se distribuyen de forma simtrica (y ya hemos dicho que esto ocurre cuando los valores
de su media y mediana estn prximos), se usan para describir esa variable su media y desviacin tpica.
En el caso de distribuciones asimtricas, la mediana y la amplitud son medidas ms adecuadas. En este
caso, se suelen utilizar adems los cuartiles y percentiles.
Los cuartiles y percentiles no son medidas de tendencia central sino medidas de posicin. El percentil
es el valor de la variable que indica el porcentaje de una distribucin que es igual o menor a esa cifra.
As, por ejemplo, el percentil 80 es el valor de la variable que es igual o deja por debajo de s al 80% del
total de las puntuaciones. Los cuartiles son los valores de la variable que dejan por debajo de s el 25%,
50% y el 75% del total de las puntuaciones y as tenemos por tanto el primer cuartil (Q1), el segundo (Q2)
y el tercer cuartil (Q3).