You are on page 1of 31

Distribuciones de muestreo fundamentales y descripciones de datos

Muestreo aleatorio

En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de
una poblacin), se selecciona una muestra, entendiendo por tal una parte representativa de la
poblacin. El muestreo es por lo tanto una herramienta de la investigacin cientfica, cuya funcin
bsica es determinar que parte de una poblacin debe examinarse, con la finalidad de hacer
inferencias sobre dicha poblacin.

Poblaciones y muestras

Una poblacin consta de la totalidad de las observaciones en las que estamos


interesados.

Una muestra es un subconjunto de una poblacin.


Algunos estadsticos importantes

Cualquier funcin de las variables aleatorias que forman una muestra aleatoria se llama estadstico.

Medidas de localizacin de una muestra: la media, la mediana y la moda


muestrales

a) Media muestral:

Medidas de localizacin de una muestra: la media, la mediana y la moda


muestrales

b) Mediana muestral:
c) La moda muestral es el valor que ocurre con mayor frecuencia en la muestra.

Ejercicio
Los tiempos que los 9 individuos de una muestra aleatoria tardan en reaccionar ante
un estimulante se registraron como 2.5, 3.6, 3.1, 4.3, 2.9, 2.3, 2.6, 4.1 y 3.4
segundos. Calcule
a) la media;
b) la mediana.

Solucin

.+.++. ,

a) = = = ,

b) Ordenamos los datos de menor a mayor

2,3 2,5 2,6 2,9 3,1 3,4 3,6 4,1 4,3


Las medidas de variabilidad de una muestra: la varianza, la desviacin estndar y
el rango de la muestra

a) La varianza muestral:
Ejemplo: El contenido de alquitrn de 8 marcas de cigarrillos que se seleccionan al azar de
la lista mas reciente publicada por la Comisin Federal de Comercio es el siguiente: 7.3, 8.6,
10.4, 16.1, 12.2, 15.1, 14.5 y 9.3 miligramos. Calcule
a) la media;
b) la varianza.

Solucin

.+.++. ,

a) = = = ,6875

Solucin
,, ++ ,,
b) = = ,

Distribuciones muestrales

El campo de la inferencia estadstica trata bsicamente con generalizaciones y predicciones.

Definicin: La distribucin de probabilidad de un estadstico se denomina distribucin muestral.

La distribucin muestral de un estadstico depende de la distribucin de la poblacin, del tamao de las


muestras y del mtodo de seleccin de las muestras.

Distribucin muestral de medias

Teorema 1.3.1 Supongamos que la poblacin en donde se hace el muestreo es finita de tamao N.

a) Cuando el muestreo se hace con reemplazo, entonces,

La media de la distribucin muestral de X es igual a la media de la poblacin en que se toma la


muestra, es decir, = .
La varianza 2 de la distribucin muestral es igual a la varianza de la poblacin dividida por el tamao de
2
la muestra, es decir, 2 = .

b) Cuando el muestreo se hace sin reemplazo, entonces,

La media de la distribucin muestral de X es igual a la media de la poblacin en que se toma la muestra, es decir,
= .
2
La varianza 2 de la distribucin muestral es igual a 2 = .
1

Ejemplo Supongamos que se eligen muestras de tamao 2 de una poblacin de tamao 3 con valores 0, 2 y 4.
(a) Si el muestreo se hace con reemplazo, entonces, verifique el teorema 1.3.1a.
(b) Si el muestreo se hace sin reemplazo, entonces, verifique el teorema 1.3.1b.

2
Muestra
2
( 0 , 0) 0 4 = y 2 = .
0+2+4
= =2
3 ( 0 , 2) 1 1
( 0 , 4) 2 0 0+1+2+1+2+3+2+3+4
=
2 2 2 9
02 + 22 + 42 ( 2 , 0) 1 1 = 2 =
2 =
3 ( 2 , 2) 2 0
8
2 = ( 2 , 4) 3 1
3 4 + 1 + 0 + 1 + 0 + 1 + 0 + 1 + 4
2 =
( 4 , 0) 2 0 9
2 12 4 8/3
( 4 , 2) 3 1 = = =
9 3 2
( 4 , 4) 4 4
Ejemplo Supongamos que se eligen muestras de tamao 2 de una poblacin de tamao 3 con valores 0, 2 y 4.
(a) Si el muestreo se hace con reemplazo, entonces, verifique el teorema 1.3.1a.
(b) Si el muestreo se hace sin reemplazo, entonces, verifique el teorema 1.3.1b.

2 2
0+2+4 Muestra = y 2 = 1
.
= =2 ( 0 , 2) 1 1
3
( 0 , 4) 2 0
1+2+1+3+2+3
( 2 , 0) 1 1 =
2 2 2 6
02 + 22 + 42 12
2 = ( 2 , 4) 3 1 = =2=
3 6
8 ( 4 , 0) 2 0
2 =
3 ( 4 , 2) 3 1 1+0+1+1+0+1
2 =
6

4 2
2 = =
6 3

8/3 3 2 4 1 2
2 = = =
2 31 3 2 3
Resumen de la distribucin muestral de la media
Ejercicios
Cinco mil personas se presentaron a un control de peso. El peso promedio fue 75 kilogramos y la desviacin estndar 10. Si
de esta poblacin de pesos se toman 300 muestras aleatorias de tamao 40, encuentre:
(a) y .
(b) el nmero aproximado de medias muestrales que caen entre 73 y 77 kilogramos.
(c) la cantidad aproximada de medias muestrales superiores a 72 kilogramos.
Solucin:
2 10
(a) = 75 y = = = = 1,58
40

7375 7375
(b) 73 < < 77 = << = 1,26 < < 1,26
1,58 1,58


(73<<77)=(<1,26)(<1,26)=0,89620,1038=0,7924
Por lo tanto el nmero aproximado de medias muestrales que caen entre 73 y 77 kilogramos ser 3000,7924238
7275
(c) > 72 = 1 72 = 1 1,58 = 1 1,89
> 72 = 1 0,0294 = 0,9706
Por lo tanto la cantidad aproximada de medias muestrales superiores a 72 kilogramos ser 300 0,9706 291
Ejercicio
La duracin de ciertos componentes elctricos producidos por una determinada empresa tiene una media de 1.200 horas y
una desviacin estndar de 400 horas. La poblacin sigue una distribucin normal. Suponga que usted ha comprado 9
bombillas, que pueden ser consideradas como una muestra aleatoria de la produccin de la empresa.
(a) Cul es la media de la media muestral de la duracin de estos componentes elctricos?
(b) Cul es la varianza de la media muestral?
(c) Cul es el error estndar de la media muestral?
(d) Cul es la probabilidad de que el tiempo medio de duracin de tres componentes elctricos sea de menos de 1.050
horas?

Solucin:
Para este caso tenemos que n = 9 < 30, poblacin normal con desviacin estndar poblacional conocida
2 4002 2 = 17.777.77 = 133,33
(a) = 1.200 (b) 2 = = = 17.777,77 (c) =
9

1.0501.200
(d) < 1.050 = < 133,33 = < 1,125 = 0,1303
Distribucin muestral de la media muestral para muestras pequeas

Si el muestreo se hace en una poblacin normal con varianza desconocida y si las muestras
seleccionadas son de tamao n < 30, entonces, la distribucin muestral de la media muestral X es la t de
Student con n 1 grados de libertad.



Este teorema implica que la variable aleatoria = tiene distribucin t con n 1 grados de libertad.


Donde es la media de la poblacin y =

Ejemplos
1. Suponga que de una poblacin normal con media 20 se toma una muestra de tamao 16. Si la
desviacin estndar muestral es 4, encuentre la probabilidad de que la media muestral sea
estrictamente mayor que 21,753.
2. Una muestra aleatoria de seis autos de un determinado modelo consumen las siguientes cantidades
en kilmetros por litro:
18, 6 18, 4 19, 2 20, 8 19, 4 20, 5.
Determine la probabilidad de que el consumo de gasolina medio muestral de los automviles de este
modelo sea menor que 17,6 kilmetros por litro, suponiendo que la distribucin de la poblacin es
normal con media 17.
Ejemplo: Una muestra aleatoria de seis autos de un determinado modelo consumen las siguientes cantidades en
kilmetros por litro:
18, 6 18, 4 19, 2 20, 8 19, 4 20, 5.

Determine la probabilidad de que el consumo de gasolina medio muestral de los automviles de este modelo sea
menor que 17,6 kilmetros por litro, suponiendo que la distribucin de la poblacin es normal con media 17.

Solucin:
Media poblacional = 17. Poblacional normal con varianza desconocida


=1 116,9
Media muestral = = = 19,4833
6


=1
2 4,8083
Desviacin estndar muestral = = = 0,980
1 61

Grados de libertad = 1 = 5
Media de la media muestral = 17
0,980
Error estndar de la media muestral = = 0,40
6

17,6 17
17,6 = 5 = 5 1,5 = 1 5 > 1,5 1 0,10 = 0,9
0,40
Distribucin muestral de una proporcin muestral

Sea X el nmero de xitos en una muestra binomial de n observaciones, donde la probabilidad de xito es p. Entonces, la

proporcin de xitos en la muestra = recibe el nombre de PROPORCIN MUESTRAL.
En la mayora de las aplicaciones, el parmetro p ser la proporcin de individuos de una gran poblacin que posean la
caracterstica de inters.

Teorema Sea p la proporcin de xitos en una muestra aleatoria de n observaciones. Sea p la proporcin de xitos en la
poblacin. Entonces, la distribucin muestral de la proporcin muestral tiene media = y varianza 2 dada por
(Teorema de De Moivre-Laplace) Sea la proporcin de xitos en una muestra aleatoria de n
observaciones. Si se cumple alguna de las dos condiciones siguientes:

n 30 o
np 5 y n(1 p) 5,

entonces, la distribucin muestral de la proporcin muestral p se puede aproximar con una distribucin normal.



Este teorema implica que la variable aleatoria = tiene distribucin normal. Aqu, y varianza se calculan


de acuerdo al teorema anterior.

Ejemplos

1. Se toma una muestra de 250 casas de una poblacin de edificios antiguos para estimar la proporcin de casas de
este tipo cuya instalacin elctrica resulta insegura. Supongamos que, de hecho, el 30% de todos los edificios de
esta poblacin tienen una instalacin insegura. Hallar la probabilidad de que la proporcin de edificios de la
muestra con instalacin insegura est entre 0,25 y 0,35.

2. Hallar la probabilidad de que en 200 lanzamientos de una moneda no falsa, el nmero de caras est
comprendido en el 40% y el 60%.
Distribucin muestral de diferencia de dos proporciones muestrales
Ejemplos

1. Los hombres y mujeres adultos radicados en una ciudad grande del norte de cierto pas difieren en sus
opiniones sobre la promulgacin de la pena de muerte para personas culpables de asesinato. Se cree
que el 12% de los hombres adultos estn a favor de la pena de muerte, mientras que slo el 10% de las
mujeres adultas lo estn. Si se pregunta a dos muestras aleatorias, una de 150 hombres y otra de 100
mujeres, su opinin sobre la promulgacin de la pena de muerte para personas culpables de asesinato,
determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de
mujeres.
Ejemplos

2. Se cree que 0,16 de las industrias de un rea metropolitana I son textiles. Se cree adems que en un
rea metropolitana II esta proporcin es de 0,11. Si estas cifras son exactas, cul es la probabilidad de
que una muestra aleatoria simple de 200 industrias del rea I y una muestra aleatoria simple
independiente de 225 industrias del rea II arrojen una diferencia entre las proporciones muestrales
mayor o igual que 0,10?
Distribucin muestral de diferencia de medias

Primer caso: varianzas poblacionales conocidas o desconocidas y muestras grandes

1
Segundo caso: varianzas poblacionales desconocidas, iguales y muestras pequeas.

Varianza muestral combinada


Tercer caso: varianzas poblacionales desconocidas, diferentes y muestras pequeas.