You are on page 1of 44

MEDIDAS DE

RESUMEN

An con tablas o grficos, la condensacin de la


informacin no es suficiente para expresar en
trminos numricos las caractersticas esenciales
de los conjuntos de datos y es cuando las
medidas de resumen manifiestan su utilidad.
Las medidas de resumen segn tipo de variables
son:

V. cualitativas, son:
Razones
Proporciones
Tasas; y para,

V. cuantitativas, son: Medidas de tendencia


central
Medidas de dispersin

1. Razn o relacin (ratio)


Fraccin que indica la dimensin relativa de dos
nmeros. Si (a) es un nmero y (b) es otro, la razn o
relacin entre los dos ser:

a
R
b

Ejemplos:
N de varones = Razn de masculinidad.
N de mujeres
N de habitantes
= hab/cama hospital.
N de camas hospitalarias
Un distrito tiene 2000 habitantes y el policlnico tiene
20 camas. Calcular la razn hab/cama hospital.

2. Proporcin (proportion)
Una proporcin tiene la forma de una fraccin
donde el numerador es el nmero (a) de
eventos o elementos con la caracterstica de
inters (tener obesidad de un total de
conductores de transporte pblico evaluados)
y el denominador es el total (n) de elementos
evaluados, (total de conductores) (a + b), es
a
a
decir:
p
p

ab

La fraccin generalmente se multiplica por


100% y se obtiene el porcentaje.

As:

n = N total de conductores = 572


a = N de conductores obesos= 372
b = N de conductores no obesos,

Entonces la proporcin de obesos, del total de


conductores, ser:
p = 372/572 =0,65.
Expresado en porcentaje indicara que, del total
de conductores evaluados, el 65% tiene
obesidad.
Cunto seria la proporcin de no obesos?

3. Tasa (rate)
La tasa es una expresin que tiene la siguiente
forma:

a
T (
)k
a b

Donde k es el nmero 1 seguido de ceros,


como 1000, 10000, etc.
Adems para el calculo de una tasa se
considera la variable tiempo y lugar.
As por ejemplo en el Per, de acuerdo a la
ENDES 2007-2008 la tasa de mortalidad
infantil fue de 19 muertes x 1000 n.v.
En resumen:

FRACCIN
Est el numerador incluido en el denominador?

SI

NO

Est el tiempo incluido


en el denominador?

SI

TASA

Tasa de
Incidencia

NO

PROPORCION
Prevalencia

RAZON

Mortalidad materna

1. MEDIDAS DE TENDENCIA CENTRAL

Los valores de la mayora de las variables


cuantitativas en medicina, muestran una tendencia
natural de agruparse alrededor de un punto. Esta
tendencia da origen a un pico (en el polgono de
frecuencias simples se puede observar una subida
gradual hasta alcanzar un mximo y luego un
descenso tambin gradual) que se encuentra en las
distribuciones de frecuencias. La localizacin del pico
o punto de tendencia central, es una caracterstica
que se puede medir a travs de la medida de
tendencia central correspondiente. Luego, una medida
de tendencia central es un indicador del centro de la
distribucin.

No todas las distribuciones de variables


cuantitativas tienden a la simetra, existen
distribuciones asimtricas y tambin
dichas variables se miden en diversas
escalas de medicin, por cuyo motivo
existen diferentes medidas de tendencia
central. Las ms utilizadas son:
Moda (Mo)
Mediana (Me)
Media aritmtica ( x)

1.1 MEDIDAS DE TENDENCIA CENTRAL EN


DATOS NO AGRUPADOS

A .Moda (mode)
La moda en un conjunto de n datos es el valor ms
frecuente.
Ejemplo Duracin de una enfermedad en cinco
pacientes expresada en das: 12, 14, 16, 19 y 14
Moda = 14 das. Este es el valor que ms veces se
repite.
Si los datos fueran: 7, 5, 2, 7, 5, 8 y 4
Moda = .......
Y si fueran: 1, 2, 3, 4, 5 y 6
Moda = .......

B. Mediana (median)
La mediana de un conjunto de n datos dispuestos en
orden ascendente o descendente, es el valor que divide
el conjunto de observaciones en dos partes iguales si n
es impar, y si n es par es la semisuma de los valores
centrales.
Ejemplo Calcular la mediana de: 16, 13, 19, 14 y 12 das.
Ordenando: 12, 13, 14, 16 y 19, luego la mediana es: 14
das. Es decir, por debajo de 14 existe un 50% de
observaciones.
La mediana de la serie: 1, 2, 3, 4, 8 y 8
es: .......

C. Media aritmtica (mean)


La media aritmtica de una muestra de n datos x1, x2, x3,
... xn se define como:

xi

Ejemplo Los siguientes datos son edades (aos) de una


muestra de 10 nios que acudieron al consultorio de
pediatra en una semana. 6, 5, 5, 4, 3, 5, 3, 3, 4 y 2

_
x =40/10 = 4 aos.
Luego, los 10 nios tienen en promedio 4 aos de edad.

1.2 MEDIANA Y PERCENTILES EN DATOS


AGRUPADOS
En datos agrupados en intervalos de clase, las
mediana y dems percentiles se calculan de la
siguiente manera.
Ejemplo Se tiene la distribucin de las edades de una
muestra de 70 gestantes.

Edad
fi
Fi
(aos)

15-19

20-24

19

27

25-29

23

50

30-34

14

64

35-39

70

Total

70

Mediana
La mediana o percentil 50 (P50) se calcula con la
siguiente ecuacin que es tambin para el clculo de
cualquier percentil.

(pn/100 F0 )C
Pp L i
fp

Donde:
p = porcentaje deseado de la distribucin
Li = Lmite real inferior del intervalo que contiene el
percentil
Fo = Fi del intervalo anterior al que contiene el
percentil
fp = fi del intervalo que contiene el percentil
C = amplitud del intervalo que contiene el percentil
n = nmero de datos = fi

Pasos para calcular la mediana en datos agrupados:


Obtener las Fi (ver tabla)
Calcular pn/100 = 35
Determinamos el intervalo que contiene la mediana,
respondiendo a la pregunta, cul es el primer
intervalo cuya Fi excede a 35? En este caso la
respuesta es: (25 29). Reemplazando los dados en la
ecuacin.

(35 27)5
P50 = Me = 24,5 + ---------- = 26,2 aos.
23

El 50% de las gestantes tiene menos de 26,2 aos

Los dems percentiles se denominan medidas de posicin


(no de tendencia central), as:
Siguiendo los mismos pasos calculemos el P25 y el P75:

(17,5 8)5
P25 = Q1 = 19,5 + ----------- = 22,0 aos.
19

P75

(52,5 50)5
= Q3 = 29,5 + ----------- = 30,4 aos.
14

Interpretar P25 y P75

CUARTILES
75%
25%
25%
Mnim
o

25%
75%

25%

Cuartil
1 Q1

25%

Median
aCuarti
l 2 Q2

25%

Cuartil
3 Q3

Mxim
o

ASIMETRIA
Existen medidas de asimetra de las distribuciones como
el coeficiente de asimetra de_ Pearson (A)

3( x Me )
A
s

s = desviacin estndar de la distribucin.


_

Si A = 0, es decir, si x= Me, la distribucin es simtrica


Si A es + la distribucin est sesgada a la derecha
Si A es - la distribucin est sesgada a la izquierda

USO DE LAS MEDIDAS DE TENDENCIA CENTRAL

Moda
Puede usarse en variables cualitativas.
Se usa por su rapidez y sencillez en datos
cuantitativos
Mediana
Para variables medidas en escala ordinal o de

intervalo.
Para variables medidas en escala de razn, pero
con distribuciones asimtricas.
No es afectada por variaciones extremas
Siempre est en el centro de la distribucin
Es muy variable de muestra a muestra

Media aritmtica
.

Para variables medidas en escala de razn,


pero con distribuciones simtricas o con
tendencia a la simetra
Es la ms representativa
Se usa en inferencia estadstica
Es afectada o sensible a variaciones
extremas

2. MEDIDAS DE DISPERSIN
Las variables cuantitativas asumen valores que
naturalmente muestran diferentes grados de
dispersin o variabilidad.
Una medida de dispersin cuantifica el grado
de variabilidad o dispersin de los datos
respecto a la medida de tendencia central
correspondiente. Una medida de tendencia
central siempre debe estar acompaada por la
medida de dispersin correspondiente.

La medidas de dispersin que estudiaremos


son:
1. Rango total: R.
2. Desviacin cuartil: Q.
3. Desviacin estndar: s (muestral)
(poblacional).
4. Coeficiente de variacin: CV.

1.-RANGO (range) O RANGO TOTAL: R


Rango, recorrido o amplitud total es igual a:
R = Xmax - Xmin.
En la practica se recomienda especificar el
valor ms alto y el ms bajo sin obtener la
diferencia.
El rango de -0,2 , 0,4 , 0,8 y 1,6 es,
R = 1,6 (-0,2) = 1,8.

2.-DESVIACIN CUARTIL: Q

La desviacin cuartil o rango


semiintercuatlico es la medida de
dispersin respecto a la mediana o
percentil 50 (P50). La distancia entre el
tercer cuartil o percentil 75 (P75) y el primer
cuartil o percentil 25 (P25) o sea (P75 - P25) se
llama rango intercuartlico, RIC
(interquartile range), luego:
RIC = P75 P25 = Q3 Q1

Luego:
Q

P75 P25
2

Q es una medida de variabilidad til y su


clculo es simple. Para propsitos
descriptivos es definitivamente superior a
R, excepto en cuanto a la simplicidad de
clculos

Entre (Me Q) hay aproximadamente 50% de


observaciones si la distribucin es ms o
menos simtrica; pero; si es muy asimtrica
respecto a la mediana, podra darse que hasta
un 70% de las observaciones se encuentre
dentro del rango (Me Q) a (Me + Q)

3.- DESVIACION ESTANDAR (standard


deviation) : s.
Varianza de la poblacin: 2.
Varianza de la muestra: s2.
Desviacin estndar de la poblacin: .
Desviacin estndar de la poblacin: s.
La varianza como medida de variabilidad casi no
es usada, entre otros porque se expresa en
unidades cuadradas, as si el valor de plomo en
sangre de un sujeto se expresa en g/dl, si
elevamos al cuadrado esta unidad, su significado e

La desviacin estndar o desviacin tpica


es una medida de variabilidad de los datos
respecto a la media aritmtica.
As, si tenemos N datos poblacionales, y
deseamos disponer de una medida de
dispersin respecto a la media aritmtica
poblacional (), tendramos:

xi

(xi - )

(xi - )2

x1

(x1 - )

(x1 - )2

x2

(x2 - )

(x2 - )2

.
.
.

.
.
.

.
.
.

xN

(xN - )

(xN - )2

Total

(xi - ) = 0

(xi - )2

Luego:
2= (xi - )2
N

(Varianza poblacional)
_

s = (xi - x)
2

(x i x )
n 1

(Varianza muestral)

Frmula prctica para calcular la desviacin

estndar de una muestra de datos no


agrupados:

2
( xi )

xi

n
n1

La desviacin estndar mide la


variabilidad promedio de los datos
respecto a la media aritmtica

4.-COEFICIENTE DE VARIACIN: CV
CV relaciona la desviacin estndar con la media
aritmtica. Expresa qu tanto por ciento, es la
desviacin estndar de la media aritmtica.

CV _ 100%

El CV es til para comparar la variabilidad relativa de


datos de dos o ms distribuciones de variables
diferentes. As, si se va comparar la variabilidad de
los pesos (kg), y talla (cm) de recin nacidos; se
calcula, para cada variable, el CV y la que presente
menor CV es la ms homognea.

Ejemplos:

1.Los siguientes son tiempos de hospitalizacin


en das de una muestra de 10 pacientes.
5, 7, 6, 4, 5, 7, 8, 5, 3, 5

a) Rango total (R)

Calcular e interpretar las medidas de dispersin.


Xmin = 3
Xmax = 8

R= 5 das

La diferencia entre los valores extremos es 5

b) Desviacin estndar (S)


2
55

323

2
Siendo x = 55, X = 323,
10 n = 10; se tiene:

S = 1,5 das.
La media aritmtica es: 5,5 das.
La interpretacin de S = 1,5 das, es: en promedio, los
diez datos varan respecto a la media aritmtica en 1,5
das.

d) Coeficiente de variacin (CV)

CV = 1,5 x 100% = 27,3%


Tiempo
fi
5,5(aos)
0-4
5 media aritmtica.
La s es
el 27,3% de la
2.-Distribucin
del tiempo
de residencia en Lima de
5-9
13
una muestra de 60 familias migrantes:
10-14
24

15-19
15

20-24
3

Total

60

a) Rango total (R)


R = 24 0 = 24 aos
El recorrido total de los datos es 24 aos

b) Desviacin cuartil (Q)

Siendo: P25 = 8,35 P50 = 12,00 y P75 = 15,50 aos

Luego:
Q = 15,50 8,35 = 3,6 aos
2
La expresin adecuada es:
(12,0 3,6 ) aos
Aproximadamente, el 50% de los migrantes
reside en Lima entre 8,4 y 15,6 aos

Grfico de caja y bigotes.


Permite estudiar la simetra de los datos y
detectar valores atpicos (outliers). Este grfico
divide los datos en cuatro reas de igual
frecuencia. La caja central (donde se encuentra
el 50% central de los datos) tiene una lnea
vertical (u horizontal) en el interior de la caja
que indica la mediana (si esta lnea est en el
centro de la caja hay simetra). Partiendo del
centro de cada lado vertical (u horizontal) de la
caja se dibujan los bigotes. El bigote de la
izquierda ( o inferior) tiene su extremo en el
valor ms cerca de (Q1 1,5RI), mientras que el
bigote de la derecha ( o superior) tiene su
extremo en el valor ms cerca de

(Q3 + 1,5RIC). Se consideran atpicos (outliers) los


valores mayores a (Q3 + 1,5RIC) y menores a (Q 1
1,5RIC). Estos atpicos se clasifican en atpicos
los que estn entre las bandas (Q 3 + 1,5RIC y Q3
+ 3RIC) o (Q1 1,5RIC y Q1 3RIC) y atpicos
extremos los mayores a (Q3 + 3RIC) o menores a
(Q1 3RIC) ( en SPSS se representan por o y x,
respectivamente)
Recordar que.
Q1= cuartil uno o percentil 25.
Q3 = cuartil tres o percentil 75.
RIC = rango intercuartlico = (Q 3 - Q1).
Veamos los ejemplos que siguen:

Diagrama de Caja y Bigotes

Max

Min

Q1

mediana
Escala

Q3

Diagramas de caja y
bigotes

Tabla I. Distribucin de frecuencias


de la edad en 100 pacientes.
Edad

N de pacientes

18

19

20

21

22

23

24

10

25

26

27

28

29

Edad

N de pacientes

30

31

32

33

34

35

36

37

38

39

41

42

Los valores necesarios para obtener el diagrama:


Min. = 18
Mx. = 42
Mediana = 26
Q1 = 23
Q3 = 31
RI = 8
Calculando los extremos de los bigotes:
Extremo inferior = (Q1 1,5RI) = 23 - 1,5(8) = 11
Extremo superior=(Q3 + 1,5RI)= 31 + 1,5(8) = 43
Como los valores mximo y mnimo se
encuentran entre estos extremos, los bigotes se
graficarn hasta 18 y 42, no existiendo ningn
valor atpico (outlier)

Figura 1. Ejemplo de un diagrama de caja y bigotes


correspondiente a lo datos en la Tabla I.