You are on page 1of 18

UNIVERSIDAD

AUSTRAL
BIOESTADSTICA
FACULTAD DE MEDICINA
MARIN H.
INSTITUTO DE SALUD PUBLICA

DE

CHILE
Prof: FRANCISCO

RESUMEN DE DATOS EN SALUD. LOS ESTADGRAFOS


Recuerda qu es una variable?... pues bien, las variables en la prctica
toman valores respecto a los cuales se puede estudiar una o ms de las
siguientes caractersticas:
1.
2.
3.
4.

Frecuencia
Valores representativos
Variabilidad
Forma de la distribucin de frecuencias.

Respecto a frecuencias... se supone que usted ya manejo las medidas


de intensidad, por lo tanto nos referiremos ahora a :
1. ESTADIGRAFOS DE POSICION
Su objetivo es resumir los valores de una variable por medio de un
valor representativo, es decir, indican cul es el centro de la distribucin
de frecuencias de la variable.
Existen muchos estadgrafos de posicin, pero los ms utilizados en el
rea de la salud son media aritmtica, media geomtrica, media armnica,
mediana, moda y percentiles.
1.1

Modo, moda o valor modal. (Md)


No confunda lo ms
frecuente, es decir, lo que
ms se repite con la
mayora Queda claro?
Pregunte.

Moda es el valor de una


variable dada, que se repite un
mayor nmero de veces

Cmo se calcula la moda?. Depende del tipo de variables (al igual que
en las otras medidas de tendencia central)
1.1.1 Variables cualitativas
En un estudio se encontr que las motivaciones del adolescentes para
beber alcohol eran : curiosidad (40,0%), invitacin (30,4%), agrado (17,5%),
olvidar problemas (3,8%), imitacin (2,8%), obligacin (1,7%), y otras
motivaciones (3,8%). Cul es la motivacin modal? Interprtela.
1.1.2 Variables cuantitativas discretas
En este caso la determinacin de la moda se hace igual que en el
ejemplo anterior.
Determine e interprete la edad modal en su curso.
1.1.3 Variables cuantitativas continuas.
Por definicin, en este caso los valores de las variables estn
agrupadas en intervalos. Por este motivo, lo primero, que se debe hacer es
determinar en qu intervalo se encuentra el valor modal. Sospecha cmo
se hace esto?
Luego debe hacer una interpolacin para determinar qu valor del
intervalos es el modo. Para ello existen diversas tcnicas, siendo la ms
utilizada, la que se puede resumir en la siguiente expresin:

Lmite
inferior
intervalo
Md = del
intervalo
modal
inter-

Amplitud
+

del

x
intervalo

Frecuencia absoluta del


siguiente al modal.
Suma de frecuencias de los
valos anterior y siguiente al

modal

En forma resumida

fi + 1

Md = Linf + Ci

fi + 1 + fi - 1

NOTA:

Conviene que Ci sea constante, porque en caso contrario se puede


llegar a conclusiones errneas.

Ejemplo:

GRUPO DE
EDAD
( aos)

15
25
35
45
55
65

24
34
44
54
64
-+

TOTAL

Los datos siguientes corresponden a la consulta psiquitrica en


un trimestre, clasificada segn edad y diagnstico en un hospital
de Concepcin.

DIAGNOSTICO
Esquizofrenia
s

25
65
28
33
11
6

168

TOTAL
Neurosis Alcoholism
o
13
30
28
16
7
2

0
5
18
13
5
2

96

43

Otros

39
67
49
38
21
23

77
167
123
100
44
33

237

544

Para calcular la edad modal del total de la consulta psiquitrica se


puede seguir los siguientes pasos :
a) Encontrar el intervalo modal. La frecuencia mxima es f
tanto el intervalo modal es el segundo.

b) Determinar el lmite inferior del intervalo modal Linf = 25


3

= 167 por lo

c) Calcular la amplitud del intervalo modal ( Ci ) C2 = 35 25 = 10 (OJO)


d) Buscar la frecuencia del intervalo siguiente de aquel que contiene a la
moda ( f i + 1 )
f3 =123
e) Buscar la frecuencia del intervalos anterior al intervalo modal
(f i - 1 )
f1 = 77
f) Calcular la moda.
Md = 25 + 10

123
123 + 77

25 + 6,2

Md = 31,2 aos.
Esto significa que la edad ms frecuente entre las personas que
consultaron por problemas psiquitricos fue 31,2 aos.
Cun real le parece este resultado?
Practique calculando e interpretando la moda de la edad en los
distintos diagnsticos.

1.1.4 Algo para pensar

Qu ocurrir en el ejemplo s un paciente tuviera 99 aos? Cambiara


la edad modal?
Cuntas modas puede tener una distribucin?
A qu tipo de variable se puede aplicar la moda?
En qu unidades se expresa este estadgrafo?

1.2 MEDIANA (Me)

MEDIANA es aquel valor de la variable que supera a no ms de


la mitad de las observaciones y es superada por no ms de la
mitad de ellas, es decir, es un valor que divide la distribucin
en mitades respecto al nmero de casos

Aunque este estadgrafo se puede determinar en el caso de variables


cualitativas ordenables, slo estudiaremos el caso de variables cuantitativas.

1.2.1 Datos No agrupados


Es este caso se ordenan los datos y el que est al centro corresponde a
la mediana.
Ejemplo:
7

35

40

27

18

15

13

15

18

27

35

40

Ordenando se tiene:
7

13

Cul es la mediana en este caso?


Si hubiera dos valores centrales Cul sera el valor de la mediana?

1.2.2 Datos discretos agrupados.


Suponga que se dispone de la siguiente informacin:

NUMERO DE
HIJOS
Xi

NUMERO DE
FAMILIAS
fi

NUMERO ACUMULADO
DE FAMILIAS
Fi

0
1
2
3
4

8
12
25
24
25

8
20
45
69
94

TOTAL

94

Primero se establece cuntas observaciones hay en cada mitad, o sea,


n/2 =94/2 = 47.
Luego se busca la frecuencia acumulada (Fi),
inmediatamente superior a n/2, que en este caso corresponde a F4 = 69.
El valor de la variable (Xi) que tiene la frecuencia acumulada
determinada anteriormente (F4 = 69), es la mediana, o sea, Me = 3.
Cmo se interpreta este resultado?
1.2.3 Datos agrupados en intervalos o clases
Al igual que cuando se calcula la moda, en este caso lo primero que se
debe hacer, es determinar en que intervalo se encuentra la mediana.
Esto se logra utilizando el procedimiento presentado en el punto
anterior. Luego se aplica la siguiente frmula de interpolacin:
n
2

Me = L inf + Ci

-F

i-1

fi

donde:

Linf

Lmite real inferior de la clase de la mediana


6

n
:
Fi-l
:
mediana.
fi
:
Ci
:

Nmero total de observaciones.


Suma de todas las frecuencias que preceden a la clase de la
Frecuencia de la clase de la mediana
Amplitud de la clase de la mediana.

Para aclarar lo expuesto, utilizaremos los datos del punto 1.1.3, con
que se ejemplific el clculo de la moda.
GRUPO DE
EDAD

CASOS

Fi

(aos)

fi

15 24

77

77

25 34

167

-----

35 44

123

367

45 54

100

-----

55 64

44

511

65 y +

33

544

TOTAL

544

En primer lugar, se debe determinar en qu intervalo se encuentra


mediana, para ello calculamos n/2 = 544/2 = 272. Luego se calcula
frecuencia acumulada ( Fi ). HAGALO A continuacin se busca la
inmediatamente superior a n/2 = 272. En este caso dicha frecuencia toma
valor
, lo cual nos indica que la mediana se encuentra en
intervalo. Finalmente se aplica la frmula de interpolacin.
Me = 35 + 10

272 244

aos
123
Interprete el resultado obtenido!

la
la
Fi
el
el

= 35 + 2,3 = 37,3

1.2.4 Otro momento para pensar.

Qu ocurrira con el valor de la mediana, si una de las edades fuera


99?

Puede tomar valores negativos?

En qu unidades se expresa?

Cuntas medianas puede tener una distribucin?

Cundo conviene utilizarla?

1.3

PERCENTILES ( Pp)

No siempre interesa conocer el Valor central de una distribucin de


frecuencias; a veces es necesario saber cules son los valores de la variable
que dividen la distribucin en cuartos (CUARTILES), dcimos (DECILES) o
quinto (QUINTILAS). Pero en el rea de la salud, es frecuente que se necesite
conocer valores que dividen la distribucin en cien partes iguales en cuanto
a frecuencia. Dichos valores reciben el nombre de PERCENTILES.
Ejemplos:

Percentil 75 ( P75 ): es un valor de la variable que deja el 75% de las


observaciones bajo l y al restante 25% sobre l

Percentil 33 ( P33 ): supera a 1/3 de las observaciones y es superado por


los 2/3 de ellas.

Percentil 50 ( P50 ): A qu corresponde?

Aunque se pueden calcular en las mismas situaciones que la mediana,


slo son tiles para datos agrupados.
Se calculan igual que la mediana, pero reemplazando n/2 por np/100
donde n es el nmero de datos y p corresponde al nmero del percentil.

Ejemplo:
Los datos siguientes corresponden a defunciones ocurridas en la ciudad
de Santiago durante un mes, de hace tres dcadas.
EDAD

DEFUNCIONES
N
%

(aos)
15 24

40

4,1

40

25 34

67

6,9

107

35 44

143

14,7

250

45 54

180

18,5

430

55 64

270

27,7

700

65 74

275

28,2

975

TOTAL

975

100,1

Calcularemos : P
*P

25

25

= 35 + 10

243, 75 107
143

= 35 + 9,6 = 44,6 aos

np/100 = 975 50/100 = 487,5

P50

75

, P50 y P75

25

np/100 = 975 25/100 = 243,75

* P50

Fi

75

55 + 10

487,5 430
270

np/100 = 975
= 65 + 10

= 55 + 2,1 = 57,1 aos

75/100 = 731,25

731,25 700
275

= 65 + 1,1 = 66,1 aos

En resumen:
P25 = 44,6 aos: P50 = 57,1 aos y P75 = 66,1 aos. Lo cual significa
que del total de fallecidos estudiados el :
25% no super los 44,6 aos.
50% no super los 57,1 aos.
75% no super los 66,1 aos.
Por supuesto que esto mismo usted lo puede decir de muchas otras
formas. Usted elige!

1.4 MEDIA ARITMTICA O PROMEDIO (X )

MEDIA ARITMECA es el valor que tendra una variable si no


hubiera variabilidad entre sus distintos valores, es decir, es el
centro de gravedad de la distribucin de frecuencias de variable.

1.4.1 Datos no agrupados


Este procedimiento usted lo ha aplicado muchas veces. Primero se
suman los datos (lo cual se simboliza Xi). Luego se determina el nmero
de datos (n) y finalmente se hace la divisin correspondiente. En smbolos.

Xi
n

10

Ejemplo:
Se desea calcular el promedio de los siguientes valores de
hemoglobina (gr/100 c.c.):
10,8;

15,6;

14,9;

13,0;

13,5;

14,0;

13,6;

13,2;

12,5;

11,2

x = 132,3/10 = 13,2 gr/100 c.c.


Interprete el resultado obtenido.

1.4.1 Variable discretas


Es similar al caso anterior, pero como cada valor de la variable se
repite un cierto nmero de veces ( frecuencia ), en vez de sumar varias veces
el mismo nmero o dato, se multiplica por la frecuencia del valor
correspondiente.

X =

xi fi

Donde:
fi = n = nmero de datos
fi =
nmero de veces que se
repite el dato i.

fi

NOTA:

siempre se debe efectuar primero los productos (Xifi) y luego la


suma de ellos. NUNCA OPERAR AL REVES

11

Ejemplo:

CANTIDAD DE VITAMINA

N DE MUESTRAS CON

TOTAL DE VITAMINA

(mg/100 ml)

UNA DETERMINADA

A EN UN DETERMINADO

CANTIDAD DE VITAMINA

NIVEL

Xi

fi

Xi fi

54

486

55

15

825

56

20

1120

57

15

855

58

10

580

59

59

TOTAL

fi = 70

Xifi = 3.925

X=

Xi fi

3925 = 56 mg/100 ml
70

Qu significa este valor?


1.4.3 Variable continuas
En este caso se puede operar igual que en el caso anterior, si se utiliza
un valor que represente a cada intervalo; dicho valor se llama marca (o
centro) de clase y es el promedio entre los lmites reales del intervalo. El
hecho de utilizar el centro del intervalo como valor de las observaciones del
grupo o clase, se basa en la suposicin que los valores individuales se
distribuye en forma simtrica alrededor del promedio, de modo que las
subestimaciones que se producen se compensan con las sobreestimaciones.
Mientras mayor es el numero de observaciones, mejor ser la compensacin
cuando esta suposicin es correcta.

Ejemplo:
12

HEMOGLOBINA

NUMERODE

gr/100 c.c.

OBSERVACIONES

Xi ( 1 )

fi ( 2 )

11 12,9

MARCA
DE CLASE

TOTAL HEMOGLOBINA A UN NIVEL


DADO

Xci ( 3 )

Xci fi ( 4 )

12

24

13 14,9

14

70

15 16,9

78

16

1248

17 18,9

226

18

4068

19 20,9

80

20

1600

21 22,9

22

154

TOTAL

n = 398

TOTAL

7164

Los datos aparecen en las columnas (1) y (2)


El procedimiento es el siguiente:
a)
b)
c)
d)

Determinar el centro de clase Xci para cada intervalo (columna 3)


Multiplicar cada centro de clase por la frecuencia correspondiente.
(col4)
Sumar los productos obtenidos en columna 4.
Dividir la suma anterior por el total de datos.
X =

X =

7164/398

= 18 gr/100 c.c.

Xci fi
fi

1.4.4 Ms para pensar

Qu ocurrir con el promedio si el primer y ltimo intervalo no estn


bien definidos?
13

Se puede calcular en variables cualitativas?

Qu ocurrira en el ejemplo anterior si hubiera un valor igual a 50?

Para que tenga sentido prctico, debe utilizarse en distribuciones


simtricas. Qu se puede hacer en caso contrario?

Cuando los datos son promedios, su media aritmtica NO es la suma de


los datos dividida por el nmero de datos. Cada promedio debe ser
multiplicado por el nmero de datos que le dio origen ( y se divide por el
nmero de datos originales).

Si los datos se distribuyen exponencialmente se debe utilizar la media


geomtrica.

Si los datos son cuocientes se debe utilizar la media armnica.

La media geomtrica de un conjunto de n valores positivos se calcula


como la raz de ndice n del producto de los valores dados.

La media armnica se calcula como el valor recproco de la media


aritmtica de los valores recprocos de la variable.

1.4.5 Criterios para elegir estadgrafos de posicin.


a) Segn tipo de variable:
- Cualitativa no ordenable:
- Cualitativa ordenable
- Cuantitativa discreta:
- Cuantitativa continua:
b) Segn forma de la distribucin:
- Simtrica:
- Exponencial:
- Cuocientes:
- Otros casos:

2. ESTADIGRAFOS DE DISPERSION
Intensidad, tendencia central, posicin, medias... de distintos tipos,
etc., son trminos que usted ya degluti y est digiriendo (?). Entonces
puede que est en condiciones de responder algunas interrogantes : Es
usted una persona promedio cul es la duracin ms frecuente de un
14

beso? Cul es la mediana de su tiempo de estudio semanal? Su PGP refleja


su esfuerzo? Responda! Tiene toda la razn! Falta precisin ....
depende! ....
No basta resumir informacin de acuerdo a lo ya revisado, para tener
una idea completa acerca de un hecho. Falta considerar otros aspectos entre
los cuales est la variabilidad. Qu es la variabilidad?
Observe los tros siguientes:
9

10 11 12 13 14 15 16 17

En qu se parecen estos tros de nmeros?


De acuerdo! ... entonces difieren en la variabilidad o dispersin, que
puede ser resumida por medio De qu cree usted? Consulte dudas!
NOTA: En este curso respetamos su desviacin respecto al promedio.
A continuacin revisaremos los estadgrafos de dispersin ms
utilizados en el reas de la salud.
2.1

Amplitud. (llamada errneamente rango)

Se calcula mediante la diferencia entre los valores mximo y mnimo de


un conjunto de datos.

15

Ejemplo:
Nmero de hijos por familia:
5, 7, 9, 10, 10, 11, 11, 13, 15
Amplitud : 15 5 = 10

Se usa cuando se trata de pocos datos o si


dispersin total.

interesa conocer la

No se basa en todas las observaciones

Debe utilizarse en combinacin con otros indicadores.

2.2

Desviacin estndar

Es el promedio de las desviaciones respecto a la media aritmtica y se


simboliza por s cuando se trabaja con una muestra y por cuando se
dispone de informacin poblacional.

2.2.1 Datos no agrupados

Xi

s=

Ejemplo:
4, 8, 10,11,17

16

Xi
n1

( Xi)2
n (n-1)

Supongamos que se trata de una poblacin


Xi

Xi2

4
8
10
11
17

16
64
10
121
289

50

590

590
5

50
5

118 - 100 =18

= 4,2

Supongamos ahora que se trata de una muestra

S=
4,7

( 50) 2

590
4

147,5 - 125

22,5 =

5*4

Datos agrupados
Si se trata de variables discretas bastar multiplicar los valores de la
variable por su respectiva frecuencia, o sea reemplazar
Xi2

Xi

por

Xi2 fi

Xi fi

respectivamente

En el caso de variables continuas, se reemplaza Xi por la marca


de clase Xci.

2.2.3

Consideraciones
17

El cuadrado de la desviacin estndar se llama varianza


La desviacin estndar se basa en todas las observaciones
El resultado es siempre positivo
Est relacionada con la curva normal.
No conviene utilizarla en distribuciones en que no corresponde aplicar
la media aritmtica. En ese caso se puede utilizar un conjunto de
percentiles.

2.3 Coeficiente de variacin (C V)


Muestra de variabilidad en forma adimensional

CV=

Desviacin estndar
Media aritmtica

x 100

Permite comparar la variabilidad relativa de dos distribuciones.


En su clculo participan todos los datos.
SUFICIENTE

LO ULTIMO. Las medidas de dispersin presentadas A qu tipo de variables


son aplicables? Correcto! Pero conviene tener presente que tambin existen
estadigrafos de dispersin para los otros tipos de variables, pero no son de
uso frecuente.

18