You are on page 1of 5

Distribuciones muestrales.

El campo de la inferencia estadística trata básicamente, con las generalizaciones y las


predicciones.

Por ejemplo, podría decirse, con base en las opiniones de varias personas entrevistadas en la calle,
que en las próximas elecciones presidenciales el 60% de los votantes favorecerá a un cierto
candidato. En este caso se trata de una muestra de opiniones de una población finita muy grande.

Supongamos que el costo promedio para construir una casa de un tipo determinado en la costa en
una localidad determinada oscila entre $90.000.000 y $95.000.000 con base en las estimaciones
de tres contratistas seleccionados al azar de los 30 que están construyendo en esta ciudad. En este
caso la muestra es finita pero pequeña.

En ambos casos se ha calculado un estadístico de una muestra seleccionada de la población. Y a


partir de estos estadísticos se han hecho afirmaciones acerca de los parámetros de la población
que pueden ser o no verdaderos.

La distribución de probabilidad de un estadístico recibe el nombre de Distribución muestral.

La distribución de probabilidad de 𝑋̅ se llama distribución muestral de la media, la distribución


muestral de un estadístico depende de la población, del tamaño de las muestras y del método de
selección de estas.

Distribuciones muestrales de medias

Supongamos que una muestra aleatoria de n observaciones se toma de una población normal con
media 𝜇 𝑦 varianza 𝜎 2 . Cada observación 𝑋𝑖 , i=1,2…,n de la muestra aleatoria tiene la misma
distribución normal que la población que está siendo muestreada.
𝑥 +𝑥 +⋯𝑥
De aquí podemos concluir que 𝑋̅ = 1 2𝑛 𝑛
𝜇+𝜇…𝜇 𝑛𝜇
Tiene una distribución normal con media 𝜇𝑥̅ = 𝑛
= 𝑛
=𝜇

𝜎 2 +𝜎2 +⋯+𝜎 2 𝑛𝜎 2 𝜎2
Y varianza. 𝜎𝑥̅2 = = =
𝑛2 𝑛2 𝑛

Si se está realizando el muestreo de una población con distribución desconocida, ya sea finita o
𝜎2
infinita, la distribución muestral de 𝑋̅ será aproximadamente normal con media 𝜇 𝑦 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑛
,
dado que el tamaño de la muestra es grande. Este resultado es una consecuencia inmediata del
Teorema del límite central

Teorema del Límite Central.

Si 𝑋̅ se la media de una muestra aleatoria de tamaño n que se toma de una población con media,
𝜇 y varianza 𝜎 2 , entonces la forma límite de la distribución de:

𝑋̅ − 𝜇
𝒁= 𝝈
√𝒏
Conforme n ∞, es la distribución normal estándar n (z; 0, 1)

La aproximación normal para 𝑋̅ generalmente será buena si 𝑛 ≥ 30 sin importar la forma de la


población, si se sabe que la población es normal, la distribución muestral de medias seguirá
exactamente una distribución normal, sin importar que tan pequeño sea el tamaño de las
muestras.

Ejemplo: una empresa fabrica focos que tiene un periodo de vida que está distribuido
aproximadamente en forma normal, con media igual a 800 horas y una desviación estándar de 40
horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida
promedio de menos de 775 horas.

La distribución muestral de 𝑋̅ será aproximadamente normal con:


40
𝜇𝑥̅ = 800 ℎ𝑜𝑟𝑎𝑠 𝑦 𝜎𝑥̅ = = 10
√16

𝜇𝑥̅ =800

𝜎𝑥̅ =10
775 − 800
𝑍= = −2,5
10

𝑃(𝑋̅ < 775) = 𝑃(𝑍 < −2,5) = 0,0062


Ejemplo: Dada la Población uniforme discreta,
𝟏
𝒇(𝒙) = { 𝟒 , 𝒙 = 𝟎, 𝟏, 𝟐, 𝟑
𝟎 𝒄. 𝒐. 𝒄
Encuentre la probabilidad de que una m.a. de tamaño 36, seleccionada con reemplazo, de una
media muestral mayor que 1,4 pero menor que 1,8 si la media se mide y se redondea hasta las
decimas.

Recordemos la media y la varianza de la Distribución Uniforme discreta 𝑓(𝑥; 𝑘):


∑𝑘
𝑖=1 𝑥𝑖 ∑𝑘
𝑖=1(𝑥𝑖 −𝜇)
2
𝜇= y 𝜎2 =
𝑘 𝑘
0+1+2+3 3
𝜇= = ;
4 2

3 2 3 2 3 2 3 2
2 ∑𝑘
𝑖=1(𝑥𝑖 −𝜇)
2 (0− ) +(1− ) +(2− ) +(3− )
2 2 2 2 5
𝜎 = 𝑘
= 4
=4

La distribución muestral de 𝑋̅ puede aproximarse por la distribución normal con

5
3 2 𝜎2 4 5
𝜇𝑥̅ = y 𝜎𝑥̅ =
2 𝑛
= = ,
36 144
𝜎𝑥̅ = 0,186

1,45 1,75 𝑋̅

𝜇𝑥̅ =1,5

𝜎𝑥̅ = 0,186

Valores de Z correspondientes a 𝑥̅1 =1,45 y 𝑥̅2 =1,75

1,45−1,5
𝑧1 = 0,186
= −0,27

1,75−1,5
𝑧2 = 0,186
= 1,34

𝑃(1,4 < 𝑋̅ < 1,8) ≅ 𝑃(−0,27 < 𝑋̅ < 1,34) = 0,5163


Teorema.

Si se sacan al azar muestras independientes de tamaños 𝑛1 𝑦 𝑛2 de dos poblaciones discretas o


continuas, con medias 𝜇1 y 𝜇2 y varianzas 𝜎12 𝑦 𝜎22 respectivamente entonces la distribución
muestral dela diferencia demedias, 𝑋̅1 − ̅̅̅
𝑋2 está distribuida aproximadamente en forma normal
con media y varianzas:
𝜎12 𝜎22
𝜇𝑥̅1 −𝑥̅ 2 = 𝜇1 − 𝜇2 y 𝜎 2 𝑥̅1 −𝑥̅ 2 = +
𝑛1 𝑛2

De este modo:
(𝑥̅1 −𝑥̅2 )−(𝜇1 −𝜇2 )
𝑍=
𝜎 2 𝜎 2
√( 1 )( 2 )
𝑛1 𝑛2

es aproximadamente una variable normal estándar.

Ejemplo. Una muestra de tamaño 𝑛1 =5 se saca aleatoriamente de una población que esta
normalmente distribuida con media 𝜇1= 50 𝑦 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝜎12 = 9 y se registra la 𝑥̅1 . 𝑈𝑛𝑎 segunda
muestra aleatoria de tamaño 𝑛2 =4 se selecciona, independiente de la primera muestra, de una
población diferente que también esta normalmente distribuida, con 𝜇2= 40 𝑦 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝜎22 = 4 y
se registra la media muestral 𝑥̅2 .

Encuentre la probabilidad 𝑃(𝑥̅1 − 𝑥̅2 < 8,2)

De la distribución 𝑥̅1 − 𝑥̅2 , 𝑠𝑒 sabe que la distribución es normal con media:

𝜇𝑥̅1 −𝑥̅2 = 𝜇1 − 𝜇2 = 50 − 40 = 10

Y varianza
𝜎12 𝜎22 9 4
𝜎 2 𝑥̅1 −𝑥̅ 2 = + = + = 2,8
𝑛1 𝑛2 5 4

8,2 10 𝑥̅1 − 𝑥̅2

Para el valor 𝑥̅1 − 𝑥̅2 = 8,2 se encuentra que:


8,2 − 10
𝑍= = −1,08
√2,8

Entonces: 𝑃(𝑥̅1 − 𝑥̅2 < 8,2) = 𝑃(𝑧 < −1,08) = 0,1401


Ejemplo.

Los televisores de marca A tiene una duración promedio de 6,5 años u una desviación estándar
de 0,9 años, mientras que los del fabricante B tienen una vida promedio de 6,0 años con una
desviación estándar de 0,8 años. ¿Cuál es la probabilidad de que una muestra aleatoria de 36
televisores del fabricante A tenga una duración promedio que sea al menos un año más que la
duración promedio de una muestra de 49 televisores del fabricante B?

Datos.

Población 1 Poblaciòn2
𝜇1 = 6,5 𝜇2 = 6,0
𝜎1 = 0,9 𝜎2 = 0,8
𝑛1 = 36 𝑛2 = 49

La distribución muestral de 𝑥̅1 − 𝑥̅2 será aproximadamente normal y tendrá una


media y una desviación estándar dada por:

𝜇𝑥̅1 −𝑥̅ 2 = 6,5 − 6,0 = 0,5

𝜎2 𝜎2 0,81 0,64
𝜎 𝑥̅1 −𝑥̅2 = √𝑛1 + 𝑛2 = √ 36 + 49
=0,189
1 2

0,5 1,0 𝑥̅1 − 𝑥̅2

La probabilidad de que la media de36 televisores del fabricante A sea al menos un año
más grande que la media de 49 televisores del fabricante B, es el área señalada. Que corresponde
al valor 𝑥̅1 − 𝑥̅2 = 1,0

1−0,5
𝑍= 0,189
=2,65

De aquí que: 𝑃(𝑥̅1 − 𝑥̅2 ≥ 1,0)=𝑃(𝑍 > 2,65)

= 1 − 𝑃(𝑍 < 2,65) = 1 − 0,9960 = 0,0040