You are on page 1of 14

22/08/2012

1
Dr Ricardo Lpez Ingunza

Agosto, 2012
1
Resume la magnitud con la cual los diferentes datos
difieren entre s.
Sirven como medida de homogeneidad.
Nos dan elementos para evaluar la adecuacin de la
medida de tendencia central usada.
Veremos:
Rango
Varianza (S
x
2
)
Desviacin estndar (S
x
)
Coeficiente de variacin (CV(%))
Error estndar (ES
x
)
2
22/08/2012
2
Rango= X
max
-X
min
Se utiliza para variables cuantitativas medidas en escala de
intervalo o razn
Inestable (muy afectada por los valores extremos)
No aprovecha los datos, insuficiente
Fcil de calcular
3
Nos informan sobre la magnitud de la variacin en los
datos, la magnitud con la cual las observaciones se agrupan
en torno a la media
Slo se aplica a variables cuantitativas (medidas en escala
de razn o intervalo)
Para una poblacin, la varianza es:
2
2
1
( )
i n
i
i
x
N

o
=
=

4
22/08/2012
3
2
2
1
( )
1
i n
ai i
i
f m x
s
n
=
=

2
2
1
( )
1
i n
i
i
x x
s
n
=
=

2
2
1
( )
i n
i
i
x
N

o
=
=

5
Poblacional Muestral
2
o o =
2
s s =
Desviacin estndar: clculo
Ej: 5 8 8 5 9
Media=(5+8+8+5+9)/5=7
87 . 1 5 , 3
5 , 3
4
4 1 1 4 4
4
) 7 9 ( ) 7 8 ( ) 7 8 ( ) 7 5 ( ) 7 5 (
2 2 2 2 2
2
= =
=
+ + + +
=
+ + + +
=
s
s
2
2
1
( )
1
i n
i
i
x x
s
n
=
=

6
Usando STATA:
22/08/2012
4
Proporciona los elementos para comparar la variabilidad en
distintos conjuntos de datos que pueden tener distintas medias.
Una desviacin estndar de 500 en una distribucin con una
media de 5000, sugiere una variabilidad mayor que una
desviacin de 500 en una distribucin de media 50000.
Clculo
s
CV
x
=
* 100 %
7
Proporciona la variabilidad de las medias muestrales respecto
a la media poblacional. Es til cuando se comparan dos o ms
medias, es la medida de dispersin que acompaa a la media
aritmtica cuando se presentan dos o mas grupos.
Clculo :
Sx
n
8
22/08/2012
5
Se refiere a la simetra respecto a la media.
Si f es la funcin de distribucin, diremos que la distribucin
es:
Distribucin simtrica
0
2
4
6
8
10
12
m
-
a
m
m
+
a
D
e
n
s
i
d
a
d
Asimetra negativa
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7 8 9
D
e
n
s
i
d
a
d
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7 8 9
D
e
n
s
i
d
a
d
Asimetra positiva
( ) ( ) f media a f media a = +
Simtrica si para todo a es
( ) ( ) f media a f media a < +
Asimetra negativa si para algn a es
( ) ( ) f media a f media a > +
Asimetra positiva si para algn a es
9
Cuantil: valor de la variable bajo el cual se encuentra una
cierta proporcin de los valores de la distribucin.
Percentiles o centiles - C,100 partes
Deciles - D, 10 partes
Cuartiles - Q, 4 partes:
Q1(25%), Q2(50%), Q3(75%)
Mediana Md, 2 partes
10
22/08/2012
6
Mediana: Valor de la variable que deja por debajo al
50% de las observaciones
Percentil k: Valor de la variable que deja por debajo
el k% de las observaciones(Ej: P
23
, P
45
)
Decil k: Valor de la variable que deja por debajo el
(k*10)% de las observaciones (Ej: P
10
=D
1
, P
20
=D
2
,etc.)
Cuartil k:Valor de la variable que deja por debajo el
(k*25)% de las observaciones (Ej: P
25
=Q
1
, P
75
=D
3
,etc.)
Medidas de Posicin
11
D
1
=P
10
Q
1
=P
25
Q
2
=Md=P
50
Medidas derivadas:
Rango intercuartil (RIC): Q
3
-Q
1
.
Desviacin intercuartil: (Q
3
-Q
1
)/2
La desviacin intercuartil es una medida que
acompaa a la mediana en la descripcin de sus datos
Tomado de MSp. Wilfredo Mormontoy 12
22/08/2012
7
Tomado de MSp. Wilfredo Mormontoy 13
Edad f
i
F
i
14.5-19.5 10 10
19.5-24.5 30 40
24.5-29.5 20 60
29.5-34.5 30 90
34.5-39.5 10 100
Total (n) 100
0 . 32 5
30
60 75
5 . 29
3
=
(


+ = Q
Q
3
= lr
i
+ ( 3(n/4) F
i-1
) * c
f
cuartil3
f
cuartil3
F
i-1
f
cuartil3
: 30 c: 5
F
i-1
: 60
3(n/4) = 3*(100/4) = 75
lri: 29.5
Calcular:
Q
1
, Q
2
y Q
3
Obtener los limites imaginarios:
Inferior: Q
1
1.5*RIC (RIC = rango intercuartil)
Superior:Q
3
+ 1.5*RIC
RIC = Q
3
Q
1
Considerando los datos de la tabla anterior:
Q
1
= 22.0 ; Q
2
= 27.0 ; Q
3
= 32.0 ; RIC = 32-22=10
Inferior: 22 (1.5)(10) = 7
Superior: 32 + (1.5)(10) = 47
Con estos datos, podemos generar la grfica de caja y bigote.
Tomado de MSp. Wilfredo Mormontoy 14
22/08/2012
8
Tomado de MSp. Wilfredo Mormontoy 15
50
40
30
20
10
Edad
Max. aprox
Q3
Md
Q1
Min. aprox
Tomado de MSp. Wilfredo Mormontoy 16
Edad f
i
F
i
14.5-19.5 20 20
19.5-24.5 60 80
24.5-29.5 40 120
29.5-34.5 60 180
34.5-39.5 20 200
Total (n) 200
83 . 22 ) 5 . 19 5 . 24 (
60
20 60
5 . 19
30
=
(


+ = P
P
30
= lr
i
+ ( 30(200/100) F
i-1
) * c
f
percentil30
f
percentil30
F
i-1
f
percentil30
: 60 c: 5
F
i-1
: 20
Posicin P30: 30(n/100) = 60
lri: 19.5
22/08/2012
9
Curvas de crecimiento
Peso-edad
Talla-edad
Permetro ceflico-edad
Crecimiento intrauterino,etc
17
Para 12 meses
P50 =46cm(aprox)
P90=48cm(aprox)
18
22/08/2012
10
No siempre es necesario indicar todas las medidas de
resumen.
Buscar las ms significativas y representativas.
En distribuciones sesgadas es mas apropiada la mediana como
medida de tendencia central
En distribuciones bimodales o multimodales , esa
caracterstica no debe dejar de mencionarse.
19
20
22/08/2012
11
21
22
22/08/2012
12
23
Proporcin:
Numero (a) de observaciones con una caracterstica dada
(como sano o enfermo) dividido entre el numero total de
observaciones de los sanos y enfermos (a+b) en un grupo
dado. Esto es:
) ( b a
a
proporcion
+
=
Resultado Trat A Trat B Total
Sano 90 350 440
Enfermo 810 750 1560
Total 900 1100 2000
45 . 0
2000
900
) 1100 900 (
900
. = =
+
= A Trat
24
22/08/2012
13
Razn:
Nmero (a) de observaciones en un grupo dado con una
caracterstica dada (como sano) dividido entre el nmero
(b) de observaciones sin la caracterstica dada (como estar
enfermo). Esto es:
b
a
razon =
282 . 0
1560
440
/ = = enf sanos
Tomando los datos de la tabla, la razn de sanos sobre
enfermos es:
25
Tasa:
Est asociado con la rapidez o velocidad de cambio de un
fenmeno como nacimiento, crecimiento, muerte, en funcin o
en relacin con alguna unidad de tiempo.
El numerador debe ser la expresin de un cambio respecto de la
ocurrencia de eventos en individuos desde una condicin basal hasta
una final.
El numerador debe expresar el concepto de exposicin de un conjunto
de individuos, en un periodo determinado.
Por ejemplo: Tasa bruta de mortalidad:
Se considera las defunciones ocurridas en un periodo de tiempo y la
poblacin en la mitad del periodo por una constante k = 100, 1000,
10000.
La tasa es una proporcin en funcin al tiempo (multiplicado por una
constante).
1000
) (
) (
x
t poblacion
t s defuncione
TBM =
Tomado de MSp. Wilfredo Mormontoy 26
22/08/2012
14
Dado los siguientes datos:
1. 11 15 12 13 15 13 14 14 16 14 13 14 12
2. 54 38 62 47 65 31 39 35 43 56 30
3. 27 31 31 34 34 32 30 31 28 34 31 34 26
Calcular:
Las medidas de dispersin: Sx, Error estndar, CV.
Obtener el cuartil 1, el cuartil 3 y el rango intercuartil, que le
sugieren los datos?
Como conclusin indique la medida de tendencia central y
dispersin adecuada para cada grupo de datos.
Que tipo de asimetra hay en cada serie de datos?
27
Dada la siguiente tabla:
Raza Tipo A Tipo AB Total
Albino 90 350 440
Blanco 810 750 1560
Total 900 1100 2000
Obtener:
La razn de albinos sobre blancos
La proporcin de sangre tipo A en albinos
La proporcin de blancos en tipo AB
28

You might also like