You are on page 1of 8

TEMA 4.

2 CONCEPTO DE DISTRIBUCIÓN DE MUESTREO DE LA MEDIA

DISTRIBUCIÓN DE LA MEDIA

DISTRIBUCIÓN DE LA POBLACIÓN

La distribución de una variable en la población se obtiene midiendo cada elemento


y estableciendo para cada valor una frecuencia de ocurrencia. Mediante este
procedimiento se puede establecer para la variable medida una función de
distribución. La función de distribución se caracterizara por los valores que asumen
la variable y la frecuencia asociada a cada una de ellos.

En general las medidas realizadas en una población se identifican con letras


griegas. Si se trata de medir la media de la población la nomenclatura es la
siguiente:

N=tamaño de la poblacion

μ=media de la poblacion

σ 2=varian za de la poblacion

DISTRIBUCIÓN EN LA MUESTRA

La distribución de una variable en la muestra se obtiene del mismo modo que en la


población. El resultad de la medición será una función de distribución que replicara
la función de distribución de la variable en la población. La replicación no será
exacta como consecuencia del sesgo de muestreo. Cada valor de la muestra tendrá
asociado una frecuencia de ocurrencia.

En general las medidas realizadas en una muestra se identifican con letras latinas
minúsculas. Si se trata de medir la media de la muestra la nomenclatura se
presenta a continuación.

n=tamaño de la muestra

×=media
´ de lamuestra

s2=varianza de la muestra
DISTRIBUCIÓN DE MUESTREO DE LA MEDIA

La distribución muestral de un estadístico es una distribución de probabilidad


constituida por cada uno de los valores que puede asumir el estadístico en todas
las muestras de tamaño n posibles de extraer sin reposición en una población de
tamaño N. Dados los valores de la población y la muestra el numero de muestras

posibles a extraer se calcula como combinación ( Nn ).


La distribución muestral de la media puede conocerse empíricamente, según se ha
visto, efectuando dos operaciones. A saber, extrayendo todas las muestras
posibles de tamaño n de una población de tamaño N y calculando para cada
muestra la media y probabilidad asociada.

La distribución muestral de las medias muéstrales asume como la media el valor


del parámetro poblacional 𝝁 y la desviación típica de la distribución muestral de
medias- denominado error estándar o error típico

σ2
Asume el valor:
√ n

En consecuencia, la media muestral se distribuye según una curva normal definida


en los siguientes términos:

( √ σn )
N μ;

Media de las medias muéstrales


Es el promedio de todos los valores posibles de las medias que se pueden generar
mediante las diversas muestras aleatorias simples. Se puede demostrar que el valor
esperado de las medias muéstrales es igual a la media poblacional

Error estándar de la media:


Es la desviación estándar de la distribución de muestreo de la media, por lo que
mide el grado en que se espera que varíen las medias de las diferentes muestras de
la media de la población, debido al error aleatorio en el proceso de muestreo.

Aplicaciones:
Una aplicación muy corriente y útil de la distribución muestral es determinar la
probabilidad de que la media de una muestra caiga dentro de un intervalo
determinado. Puesto que la distribución muestral seguirá una distribución normal
(ya sea porque la muestra se toma de una distribución normal, o porque n " #_% _
teorema del límite central garantice la normalidad en el proceso de muestreo), se
podrá utilizar la variable tipificada para obtener la información necesaria en la toma
de decisiones.
X́−μ
Z=
σ X́
EJEMPLO:
Supongamos que el incremento porcentual de los salarios de los funcionarios de
todas las corporaciones medianas se distribuye normal con una media de 12.2% y
una desviación típica de 3.6%. Si se toma una muestra aleatoria de nueve
observaciones de esta población, calcule la probabilidad de que el incremento
medio muestral porcentual sea menor del 10%.
Como la distribución de la población es normal, tenemos que los parámetros de la
distribución muestral de la media son:

μ X́ =12.2

3.6
σ X́ = =1.2
3

−2.2
P(¿ X́ <10)=P Z < ( 1.2 )
=Φ (−1.83 ) =0.0306 ¿

EJERCICIO:
El precio medio de ventas de casa nuevas en una ciudad americana es de $115 000
con una desviación típica de $25 000. Se toma una muestra aleatoria de 100 casas
nuevas de esta ciudad.
a) ¿Cuál es la probabilidad de que la media muestral de los precios de venta sea
menor de $110 000?
X: Precios de venta de las casas.
Dado que el tamaño de muestra n=100 > 30 podemos utilizar el Teorema Central del
Límite, así que tenemos que:

μ X́ =μ=115,000

σ 25,000
σ X́ = = =2,500
√n 10

110,000−115,000
P(¿ X́ <110,000)=P Z < ( 2,500 )
=Φ (−2 )=1−0.9772=0.0228 ¿

b) ¿Cuál es la probabilidad de que la media muestral se encuentre a menos de $500


de la media poblacional?

P( X −m<500)=P(114500< X <115500)=P ¿
DISTRIBUCIÓN DE LA DIFERENCIA ENTRE DOS MEDIAS

Sean X1 y X2 dos variables aleatorias con valores esperados m1 y m2 y varianzas y,


respectivamente. Por ejemplo, X1 puede ser la duración de una batería para carro
de una marca, y X2 la duración de una batería de otra marca diferente. Si los medias
m1 y m2 son desconocidas, podríamos estar interesados en conocer si ambas
baterías tienen la misma duración media. En forma similar, si las varianzas son
desconocidas, podríamos estar interesados en saber si son iguales o no. Para
realizar estas inferencias, se pueden someter a pruebas idénticas diferentes
baterías, controlando los factores externos, de tal forma que las diferencias se
deban exclusivamente a la clase de marca probada

Inicialmente estaremos interesados en verificar si ambas distribuciones tienen la


misma media poblacional, es decir si m1 = m2 ó equivalentemente m1 - m2 = 0.

a) Distribución de la diferencia entre dos medias cuando las varianzas son


conocidas. Si las varianzas y son conocidas, tanto como se distribuyen
normalmente. Por lo tanto la distribución de la diferencia entre las medias
muéstrales es normal con el valor esperado y la varianza dados anteriormente, es
decir,

De acuerdo con lo anterior la siguiente variable aleatoria tiene una distribución


normal estándar:

Por lo tanto, con base en la expresión anterior se pueden realizar inferencias con
respecto a la diferencia de medias poblacionales, bajo el supuesto de que las
varianzas sean conocidas. Si además, son iguales, la expresión anterior se puede
expresar como:

b) Distribución de la diferencia entre dos medias cuando las varianzas son


desconocidas pero iguales (= =)

Cuando las varianzas son desconocidas, se debe realizar previamente una prueba
estadística para verificar si éstas son iguales o diferentes. Para realizar esta prueba
debemos hacer uso de la distribución F para verificar si la relación de varianzas es
igual a uno o diferente de uno.

Para cada una de las dos muestras se definen sus respectivas varianzas como:
Además tienen distribuciones cuadrado con n1–1 y n2–1 grados de libertad
respectivamente. Por lo tanto su suma también sigue otra distribución chi cuadrado
con n1+n2–2 grados de libertad. Es decir:

Ahora bien, si Z es una variable normal (0,1) y tiene una distribución chi cuadrado
con n grados de libertad, entonces la variable tiene una distribución t con n grados
de libertad. Para nuestro caso la variable Z corresponde a la distribución de la
diferencia de las dos medias, con varianzas conocidas, y la variable chi cuadrado
corresponde a la variable Y acabada de definir. Por lo tanto

Donde es un estimador ponderado de la varianza poblacional s obtenida


ponderando las varianzas poblacionales por sus respectivos grados de libertad.

c) Distribución de la diferencia entre dos medias cuando las varianzas son


desconocidas y diferentes

Ejemplo:

En un estudio para comparar los pesos promedio de niños y niñas de sexto grado
en una escuela primaria se usará una muestra aleatoria de 20 niños y otra de 25
niñas. Se sabe que tanto para niños como para niñas los pesos siguen una
distribución normal. El promedio de los pesos de todos los niños de sexto grado de
esa escuela es de 100 libras y su desviación estándar es de 14.142, mientras que el
promedio de los pesos de todas las niñas del sexto grado de esa escuela es de 85
libras y su desviación estándar es de 12.247 libras. Si x́ 1representa el promedio de
los pesos de 20 niños y x́ 2es el promedio de los pesos de una muestra de 25 niñas,
encuentre la probabilidad de que el promedio de los pesos de los 20 niños sea al
menos 20 libras más grande que el de las 25 niñas.

Solución:

Datos:

μ1=100 libras σ 1 =14.142libras

μ2=85libras σ 2=12 .247 libras

n1 =20 niños n2 =25 niñas

P ( X́ 1 − X́ 2 ) 20=?
( X́ 1− X́ 2 )−( μ́1− μ́2 ) 20−(100−85)
Z= = =1.25
σ1 σ2 (14.142)2 (12.247)2
√ +
n1 n2 √ 20
+
25

Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños


sea al menos 20 libras más grande que el de la muestra de las niñas es 0.1056.

0.1056

μ́1− μ́ 2=15 X́ 1 − X́ 2=20

Distribución Muestral de Diferencia de Proporciones

Muchas aplicaciones involucran poblaciones de datos cualitativos que deben


compararse utilizando proporciones o porcentajes. A continuación se citan algunos
ejemplos:

 Educación.- ¿Es mayor la proporción de los estudiantes que aprueban


matemáticas que las de los que aprueban inglés?
 Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento A que
presentan una reacción adversa que el de los usuarios del fármaco B que
también presentan una reacción de ese tipo?
 Administración.- ¿Hay diferencia entre los porcentajes de hombres y mujeres
en posiciones gerenciales.
 Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos
que genera la máquina A los que genera la máquina B?

Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos


proporciones muéstrales, la distribución muestral de diferencia de proporciones es
aproximadamente normal para tamaños de muestra grande (n1p1≥5, n1q1≥5, n2p2≥5 y
n2q2≥5). Entonces p1 y p2 tienen distribuciones muéstrales aproximadamente
normales, así que su diferencia p1-p2 también tiene una distribución muestral
aproximadamente normal.

Formula:

( p 1− p2 )−( p1− p2 )
Z=
p1 q p2 q
√ n1
1
+
n2
2

Ejemplo:

Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren
en sus opiniones sobre la promulgación de la pena de muerte para personas
culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor de
la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si se
pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre
la promulgación de la pena de muerte, determine la probabilidad de que el
porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.

Solución:

Datos:

PH = 0.12

PM = 0.10

N H = 100

N M = 100

P (pH-pM 0.03) =?

Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una
distribución binomial y se está utilizando la distribución normal.

( p 1− p2 )−( p1− p2 ) 0.025−(0.12−0.10)


Z= = =0.11
p1 q p2 q ( 0.12 ) (0.88) ( 0.10 ) (0.90)
√ n1
1
+
n2
2

100
+
100
0.4562

p H −PM =0.02 p H −PM =0.03

0.5
0.03−( 100 )=0.025

Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena


de muerte, al menos 3% mayor que el de mujeres es de 0.4562.

BIBLIOGRAFIA:

 ESTADISTICA PARA ADMINISTRACION Y ECONOMIA


“ANDERSON SWEENEY WILLIANS” “DISTRIBUCIÓN DE MUESTREO DE LA MEDIA”
 ESTADISTICA PARA LA ADMINISTRACION Y ECONOMIA
“RICHARD LEVIN” “DISTRIBUCIÓN DE MUESTREO DE LA MEDIA”

You might also like