You are on page 1of 32

1.

Muestreo y sus distribuciones


tipo de informacin
poblacin infnita
prontitud
ensayos destructivos
costos
exactitud
cuando hacer
sin reposicin
con reposicin
casos
simple
estratifcado
sistemtico
de racimo
aleatorio
de conveniencia
de juicio
de cuota
bola de nieve
no aleatorio
tcnicas
media
proporcin
varianza
una poblacin
diferencia de medias
diferencia de proporciones
relacin de varianzas
dos poblaciones
distribuciones muestrales
mues treo
1.1. Introduccin
La inferencia estadstica comprende el establecer ciertos juicios con respecto a algo despus de exami-
nar solamente una parte o muestra de ello. Como ejemplos, se ofrece una muestra gratis de un nuevo
alimento en un supermercado; se prueba un pedazo de pastel para opinar de su sabor; se prueba la
sopa para ver si le falta sal. De la misma forma, al hojear un libro; ver un momento la televisin antes
de decidir cambiar de canal o medirse alguna prenda de vestir, en realidad se est muestreando.
El muestreo estadstico es semejante a cada uno de los ejemplos anteriores, aunque sus mtodos son
ms formales y precisos, y generalmente incluyen una proposicin de probabilidad. La probabilidad
y el muestreo estn estrechamente relacionados, y juntos, constituyen la base de la teora de la
Estadstica 1 Departamento de Ciencias Bsicas Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 2
inferencia.
Las observaciones de una sola muestra se denotan con x
1
, x
2
, . . . , x
n
. Considere elegir dos muestras
distintas de tamao n de la misma distribucin poblacional. Las x
i
de la segunda muestra casi siem-
pre diferirn por lo menos un poco de las de la primera muestra. Antes de obtener los datos, hay
incertidumbre acerca del valor de cada x
i
. Debido a esta incertidumbre, antes de que estn disponibles
los datos se ve cada observacin como una variable aleatoria y la muestra se representa mediante
X
1
, X
2
, . . . , X
n
(letras maysculas para variables aleatorias).
Esta variacin de valores observados a su vez implica que el valor de cualquier funcin de las observa-
ciones muestrales, por ejemplo la media o la desviacin estndar, tambin vara de una muestra a otra.
Es decir, antes de obtener x
1
, . . . , x
n
, hay incertidumbre en cuanto al valor de x, el valor de s , etc.
En resumen, los valores de cada una de las observaciones muestrales varan de una muestra a otra,
as que, en general, el valor de cualquier cantidad calculada a partir de los datos de la muestra, y
el valor de una caracterstica muestral utilizado como estimacin de la caracterstica poblacional
correspondiente, casi nunca coincidir con lo que est siendo estimado.
1.1.1. Glosario
Censo Examen de todos los elementos de un determinado grupo (poblacin).
Muestra Pequea parte de un grupo (subconjunto).
Poblacin Grupo de elementos que tiene un tamao establecido o limitado, es decir, existe un nmero
entero (N) que indica cuntos elementos hay en la poblacin.
innita Es aquella en la que es tericamente imposible observar todos los elementos o, de
otra forma, una que no podra enumerarse en un periodo razonable de tiempo. (ejemplos:
lanzamiento de una moneda, nacimientos, producciones fabriles)
nita Grupo de tamao limitado (ejemplos: los automviles del estado de Morelos, alumnos de
una clase, productos de un supermercado)
Estadstica Caracterstica de una muestra
Parmetro Caracterstica de una poblacin
Grados de libertad Nmero de observaciones independientes menos el nmero de parmetros
desconocidos que se tratan de estimar sobre la base de dichas observaciones.
Distribucin de frecuencias Listado de las frecuencias observadas de todos los resultados de un
experimento que se presentaron realmente cuando se efectu ste.
Distribucin de probabilidad Listado de las probabilidades de todos los posibles resultados que
podran obtenerse si el experimento se llevara a cabo. Tambin se conoce como distribucin de
frecuencias terica, es decir, una distribucin de probabilidades que describe la forma en que se
espera varen los resultados.
Distribucin binomial Esta distribucin corresponde a los ensayos con reposicin, es decir, ensayos
o pruebas repetidas e independientes, con slo dos resultados posibles: xito (con probabilidad
p) y fracaso (con probabilidad q =1p)
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 3
1.2. Tipos de muestreo
Existen dos mtodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de juicio
y el muestreo aleatorio o de probabilidad. En el muestreo de probabilidad, todos los elementos de la
poblacin tienen la oportunidad de ser escogidos para la muestra. En el muestreo de juicio, se emplea
el conocimiento y la opinin personal para identicar a los elementos de la poblacin que deben incluirse en
la muestra.
En trminos generales, el muestreo aleatorio requiere que cada elemento de una poblacin tenga la
misma oportunidad de ser incluido en la muestra. Esto se puede interpretar de la siguiente manera:
En el caso de poblaciones discretas, una muestra aleatoria es aquella en la que cada elemento de la
poblacin tiene la misma oportunidad de ser incluido en la muestra. En lo referente a poblaciones
continuas, un muestra aleatoria es aquella en que la probabilidad de incluir cualquier intervalo de
valores en la muestra es igual al porcentaje de la poblacion que est comprendida en dicho intervalo.
1.2.1. Tcnicas de muestreo aleatorio
Muestreo aleatorio simple Es la tcnica ms elemental de muestreo, en ella cada unidad listada
se numera del 1 a N(donde N es el tamao de la poblacin) y se designa aleatoriamente los
nmeros de aquellos que sern incluidos en la muestra
Muestreo estraticado La poblacin se divide en subpoblaciones que no se traslapan y se denominan
estratos. Se extrae entonces una muestra aleatoria simple de cada una de las subpoblaciones.
La razn principal para usar muestreo aleatorio estraticado es que sirve para reducir el error
muestral.
Muestreo sistemtico A diferencia del muestreo aleatorio estraticado, el muestreo sistemtico no se
realiza para reducir el error muestral. Ms bien, se emplea por su comodidad y relativa facilidad
de administracin. Con el muestreo sistemtico, cada k-simo elemento se selecciona para
producir una muestra de tamao n de una poblacin de tamao N. El valor de k, a veces llamado
ciclo muestral se puede determinar con la siguiente frmula k =
N
n
.
Muestreo de grupo El muestreo de grupo (o rea) comprende la divisin de la poblacin en reas o
grupos que no se traslapan. A diferencia del muestreo estraticado donde los estratos son ho-
mogneos, el muestreo de grupo identica grupos que tienden a ser internamente heterogneos.
En teora, cada grupo contiene una amplia variedad de elementos, y el grupo es una miniatura, o
microcosmos, de la poblacin.
1.2.2. Tcnicas de muestreo no aleatorio
Muestreo de conveniencia En este muestreo, los elementos para la muestra se seleccionan para
comodidad del investigador. Por lo general el investigador selecciona elementos de los que se
dispone con facilidad, cercanos o dispuestos a participar. La muestra tiende a ser menos variable
que la poblacin porque en muchos entornos los elementos extremos de la poblacin no se
encuentran fcilmente.
Muestreo de juicio Un muestreo de juicio se presenta cuando los elementos seleccionados para la
muestra son escogidos por el juicio del investigador. A veces los investigadores piensan que
pueden obtener una muestra representativa al usar un juicio razonable, que resultar en ahorro
de tiempo y dinero.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 4
Muestreo de cuota Tiene cierta semejanza con el muestreo aleatorio estraticado. Ciertas subclases
poblacionales, por ejemplo grupo de edad, sexo o regin geogrca, se usan como estratos.
No obstante, en lugar de muestrear en forma aleatoria a cada estrato, el investigador usa un
mtodo de muestreo no aleatorio para reunir datos de un estrato hasta llenar la cuota deseada
de muestras.
Muestreo de bola de nieve Los sujetos de entrevista son seleccionados con base en las referencias
de otros entrevistados de encuestas. El investigador identica una persona que llena el perl de
sujetos deseados para el estudio. El investigador pide entonces a esta persona los nombres y
lugares de otros que tambin llenan el perl de sujetos deseados para el estudio.
1.3. Teorema del lmite central
El teorema de lmite central establece que, en condiciones muy generales, las sumas y medias de
muestras aleatorias de mediciones extradas de una poblacin tienden a poseer una distribucin
aproximadamente normal.
Teorema del lmite central Si de una poblacin no normal con media nita y desviacin estndar
se extraen muestras aleatorias de n observaciones, entonces, cuando n es grande, la distribucin
muestral de las medias muestrales x est aproximadamente distribuida de manera normal, con media
y desviacin estndar

x
= y
x
=

n
La aproximacin se vuelve ms precisa a medida que aumenta n.
En otras palabras:
1. Si la poblacin muestreada est distribuida de manera normal, la distribucin de los valores me-
dios de la muestra estarn normalmente distribuidos respecto a todos los tamaos muestrales.
2. Si la poblacin no es normal, la distribucin de los valores medios de la muestra ser aproxima-
damente normal respecto a un tamao muestral grande.
El teorema del lmite central se aplica solamente a valores medios de la muestra. Sin embargo, se
puede destacar que, excepto para valores muy pequeos o muy grandes de p, la distribucin normal
proporciona una aproximacin razonable a las probabilidades binomiales para grandes tamaos de
muestra. Por tanto, la distribucin normal se puede utilizar para medias y proporciones respecto a
grandes tamaos de muestra.
1.3.1. Puntaje z
Un puntaje z es un dato transformado que indica a cuntas unidades de desviacin estndar, por
encima o por debajo de la media, se encuentra un dato en bruto.
El procedimiento por el cual un dato en bruto es modicado se llama transformacin de datos. En
combinacin con una curva normal, los puntajes z nos permiten determinar el nmero o el porcentaje
de los valores que estn por encima o por debajo de cualquier dato en la distribucin. Adems, gracias
a los puntajes z podemos hacer comparaciones entre datos de distribuciones distintas, aunque las
unidades de estas distribuciones sean diferentes.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 5
Caractersticas de los puntajes z
Los puntajes z tienen la misma forma que el conjunto de datos en bruto. La transformacin de los
datos en bruto en sus puntajes z correspondientes no cambia la forma de la distribucin. Tam-
poco las posiciones relativas de los datos se modican. Los valores de los datos son los nicos
que varan.
La media de los puntajes z siempre es igual a cero (
z
=0). Esto es consecuencia de la observa-
cin segn la cual los datos localizados en la media de los datos en bruto ser tambin la media
de los puntajes z. El valor z para los datos en bruto en la media es igual a cero.
La desviacin estndar de los puntajes z siempre es igual a 1 (
z
=1). Esto se debe a que un da-
to en bruto que se localiza 1 desviacin estndar por arriba de la media tiene un puntaje z de
+1:
z =
(+1)

=1
El puntaje z para la distribucin muestral de la media, para una poblacin normalmente distribuida
es:
z =
x

x
donde:
z = la distancia de la media, medida en unidades de error
estndar
x = el valor de la media de la muestra que nos interesa
= media de la poblacin

x
= el error estndar de la distribucin muestral de la me-
dia, o /

n
1.4. Distribuciones muestrales
El objeto de efectuar un muestreo es obtener una idea del valor de uno o ms de los parmetros de
una poblacin, como la media, la desviacin estndar o la proporcin de elementos en la poblacin
que poseen cierta caracterstica en comn. Las estadsticas de la muestra que corresponden a estos
parmetros de la poblacin se emplean para aproximar los valores desconocidos de dichos parmetros.
Una de las realidades del muestreo aleatorio es que cuando de una misma poblacin son tomadas
muestras repetidas, existe una tendencia a que las estadsticas muestrales varen entre s y con res-
pecto al valor verdadero del parmetro de la poblacin, simplemente debido a lo factores aleatorios
relativos al muestreo.
Expresado en trminos generales puede parecer difcil el tratar de manera racional la variabilidad
del muestreo. Sin embargo, en el caso del muestreo aleatorio, se ha demostrado que la variabilidad
puede ser descrita por distribuciones de probabilidad como las distribuciones normal y binomial.
Cuando las distribuciones probabilsticas son usadas de esta forma, se les denomina distribuciones
de muestreo. Como stas slo pueden usarse cuando las muestras son al azar, es esencial utilizar
nicamente muestras aleatorias para hacer inferencia estadsticas.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 6
La interrogante que se plantea en el caso de cada muestra es la siguiente: cun prximo est el valor
estadstico de la muestra al valor real del parmetro de la poblacin? La respuesta depender de tres
factores.
1. El valor estadstico que se est considerando. Se utilizan distribuciones probabilsticas diferentes
para describir la variabilidad de muestreo asociada a distintos valores estadsticos de la muestra.
2. El tamao de la misma. Existe menos variabilidad entre valores estadsticos de grandes muestras
que entre los valores estadsticos de muestras pequeas.
3. La variabilidad que existe en la poblacin de la que se extrae la muestra.
Denicin La distribucin muestral de un estadstico es la distribucin de probabilidad para los
valores posibles del estadstico que resulta cuando se extraen repetidamente de la poblacin las
muestras aleatorias de tamao n
1.4.1. Distribucin de la media
Una distribucin de muestreo de medias es de tipo probabilstico e indica cun probables son diversas
medias de la muestra. La distribucin es una funcin de la media, de la desviacin estndar de la
poblacin, y del tamao de la muestra. Para cada combinacin de la media de la poblacin, de la
desviacin estndar de la poblacin y del tamao de la muestra habr una distribucin de muestreo
nica de los valores medios de la muestra.
Con el uso del mtodo emprico se revelan ciertas propiedades interesantes de las distribuciones
muestrales, una de ellas es que la media de la distribucin muestral parece ser siempre igual a la
media de la poblacin. No es coincidencia el hecho de que la media de una distribucin muestral sea
exactamente igual a la media poblacional en cada caso. Esto resulta del hecho de que la distribucin
muestral est compuesta de todas las muestras posibles, y, por tanto, incluye a todos los elementos
de la poblacin. En esencia, calcular la media de una distribucin de muestreo es simplemente un
mtodo indirecto de calcular la media de la poblacin. Esto se ilustra con un ejemplo sencillo.
Supngase que una poblacin est formada por tres elementos: x
1
, x
2
, x
3
. La media de la poblacin es
(x
1
+x
2
+x
3
)/3. Si se tomaran todas las muestras de dos elementos, las combinaciones seran x
1
y x
2
,
x
1
y x
3
, x
2
y x
3
. Los valores medios de la muestra seran
x
1
+x
2
2
x
1
+x
3
2
x
2
+x
3
2
La media de los tres valores medios de la muestra (y la media de la distribucin de muestreo) sera
_
x
1
+x
2
2
_
+
_
x
1
+x
3
2
_
+
_
x
2
+x
3
2
_
3
=
1
2
(x
1
+x
2
+x
1
+x
3
+x
2
+x
3
)
3
=
1
2
(2x
1
+2x
2
+2x
3
)
3
=
x
1
+x
2
+x
3
3
que es la media de la poblacin. Otra caracterstica es que la desviacin estndar de la distribucin
muestral parece disminuir a medida que aumenta el tamao de las muestras. Esto signica que el
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 7
promedio o valor esperado de la media de la muestra ser igual a la media de la poblacin y que las
muestras ms grandes tienden a ser ms conables que las muestras menores.
Cmo calcular las probabilidades para la media de la muestra x? Si sabe que la distribucin
muestral de x es normal o aproximadamente normal, se puede describir el comportamiento de la media
muestral x al calcular la probabilidad de observar ciertos valores de x en el muestreo repetido.
1. Encuentre y calcule SE=
x
=/

n.
2. Describa el evento de inters en trminos de x, y localice el rea apropiada en la curva normal.
3. Convierta los valores necesarios de x a valores z por medio de
z =
x

x
4. Utilice la tabla de reas bajo la distribucin normal para calcular la probabilidad.
1.4.2. Distribuciones de proporciones muestrales
Una distribucin de este tipo indica cun probable es un conjunto particular de proporciones muestra-
les, dados el tamao de la muestra y la proporcin de la poblacin. Cuando el tamao de la muestra
es 20 menos, las probabilidades para los diferentes resultados posibles se pueden obtener direc-
tamente de una tabla de probabilidades binomiales simplemente convirtiendo el nmero de xitos
a porcentajes. Para tamaos muestrales mayores la aproximacin normal a la binomial producir
valores bastante aceptables. La media (proporcion promedio o porcentaje) de la distribucin muestral
siempre es igual a la proporcin de la poblacin. Es decir
p = p
en donde p proporcin de la poblacin y p es la media de la distribucin muestral de proporciones.
Cuando la poblacin es muy grande o innita, la desviacin estndar de la distribucin muestral se
calcula utilizando la frmula

p
=
_
p(1p)
n
Cmo calcular las probabilidades para la proporcin muestral p?
1. Encuentre los valores necesarios de n y p.
2. Compruebe si la aproximacin normal a la distribucin binomial (np >5) y (nq >5) es apropiada.
3. Describa el evento de inters en funcin de p y localice el rea apropiada bajo la curva normal.
4. Convierta los valores necesarios de p a valores de z mediante
z =
p p
_
pq
n
5. Utilice la tabla de reas bajo la distribucin normal para calcular la probabilidad.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 8
1.4.3. Distribucin muestral de la varianza
Las distribuciones muestrales de estadsticas importantes nos permiten conocer informacin sobre
los parmetros. Por lo general, los parmetros son la contraparte de la estadstica en cuestin. Si un
ingeniero se interesa en la resistencia media de la poblacin de cierto tipo de resistor, la distribucin
muestral de

X se explotar una vez que se rena la informacin de la muestra. Por otro lado si se estudia
la variabilidad en el resistor, la distribucin muestral de S
2
se utilizar para conocer la contraparte
paramtrica, la varianza de la poblacin
2
.
Teorema 1.1. Si S
2
es la varianza de una muestra aleatoria de tamao n que se toma de una poblacin normal que
tiene la varianza
2
, entonces la estadstica

2
=
(n 1)S
2

2
=
n

i =1
(X
i

X)
2

2
tiene una distribucin ji-cuadrada con = n 1 grados de libertad
La probabilidad de que una muestra aleatoria produzca un valor
2
mayor que algn valor especco
es igual al rea bajo la curva a la derecha de este valor. Se acostumbra representar con
2

el valor
2
por arriba del que encontramos un rea .
Ejercicios referentes a distribuciones muestrales de medias
1. Una poblacin muy grande tiene una media de 20.0 y una desviacin estndar de 1.4. Si se toma
una muestra de 49 observaciones, conteste las siguientes preguntas:
a) Cul es la media de la distribucin de muestreo?
b) Cul es la desviacin estndar de la distribucin de muestreo?
c) Qu porcentaje de posibles valores medios de la muestra diferirn de la media de la
poblacin por ms de 0.2?
2. Un fabricante de acumuladores asegura que su producto tiene una vida (promedio) esperada de
50 meses. Mediante estudios realizados por esta compaa se sabe que la desviacin estndar de
la vida del acumulador es de cuatro meses, qu porcentaje de muestras de 36 observaciones ten-
drn una vida promedio que vare en 1 mes, suponiendo que 50 es el promedio de vida verdadera
de los acumuladores? Cul es la respuesta si se toma una muestra de 64 observaciones?
3. Con la informacin del ejercicio 2, cul sera la probabilidad de obtener un valor medio de
muestra menor de 49.8 meses, de una muestra de 100 observaciones?
4. Si se obtiene una muestra de una distribucin normal, cul es la probabilidad de que la media
de la muestra tenga una valor en cada uno de los siguientes intervalos?
a)
x
1.96
x
b)
x
2.00
x
c)
x
2.33
x
5. La media de una distribucin de muestreo de medias es 5, y su desviacin estndar es 10.
Suponga que la distribucin de muestreo es normal.
a) Qu porcentaje de las medias de la muestra estar entre 45 y 55?
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 9
b) Qu porcentaje de los valores medios de la muestra estar entre 42.5 y 57.5?
c) Qu porcentaje de los valores medios de la muestra ser menor que la media de la
poblacin?
d) Qu porcentaje de los valores medios de la muestra ser igual a la media de la poblacin?
6. Determine la media de la distribucin de los promedios de la muestra, dadas cada una de las
medias de la poblacin: a. 5.01, b. 18.41, c. 199.5, d. 0.008
7. Calcule la desviacin estndar de la distribucin muestral de medias para cada uno de los
siguientes casos: a.
x
= 5, n = 16; b.
x
= 1, n = 36; c.
x
= 2, n = 40; d.
x
= 6.2, n = 100; e.

x
=3.2, n =44
8. Se toman muestras de 36 observaciones de una mquina de acuar monedas conmemorativas.
El espesor promedio de las monedas es de 0.20 cm, con una desviacin estndar de 0.01 cm
a) Es fundamental saber que la poblacin es normal, a n de establecer el porcentaje de
valores medios de la muestra que quedarn dentro de ciertos intervalos? Explquelo
b) Qu porcentaje de medias de la muestra quedarn en el intervalo 0.200.004 cm?
c) Cul es la probabilidad de obtener la media de muestra que se desva ms de 0.005 cm de
la media del proceso?
9. La esperanza de vida de quienes adquieren la enfermedad de Alzheimer desde el inicio de los
sntomas hasta su muerte vara de 3 a 20 aos; el promedio es 8 aos con una desviacin estndar
de 4 aos. El administrador de un centro mdico grande selecciona al azar los expedientes
mdicos de 30 pacientes, que murieron de Alzheimer, de la base de datos del centro mdico y
anota el tiempo promedio que sobrevivieron. Encuentre las probabilidades aproximadas para
estos eventos:
a) La duracin promedio de la enfermedad es menor de 7 aos.
b) La duracin promedio de la enfermedad es superior a 7 aos.
c) La duracin promedio de la enfermedad queda dentro de 1 ao de la media de la poblacin
=8.
10. Para evitar dicultades con la comisin de comercio federal o las ocinas de proteccin al
consumidor estatales y locales, un embotellador debe asegurarse de que las botellas de 12 onzas
en realidad contengan esta cantidad de bebida. Para determinar si una mquina embotelladora
est trabajando satisfactoriamente, el embotellador muestrea al azar diez botellas por hora y
mide la cantidad de bebida que contiene cada una. Para decidir si se reajusta la cantidad de
bebida que la mquina de llenado vierte en cada botella se usa la media x de las diez mediciones
de llenado. Si en los registros se observa que la cantidad de llenado por botella est normalmente
distribuida, con una desviacin estndar de 0.2 onzas, y si se ajusta la mquina embotelladora
para producir un llenado medio por botella de 12.1 onzas, cul es la probabilidad aproximada
de que la media muestral x de las diez botellas de prueba sea menor que 12 onzas?
11. Una expectativa importante respecto de una reduccin del impuesto sobre la renta federal es
que los contribuyentes se beneciarn sustancialmente del ahorro en los impuestos. Suponga
que las estimaciones de la proporcin del impuesto total ahorrado, con base en una muestra
aleatoria de 35 economistas, tiene una media de 26 % y una desviacin estndar de 12 %.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 10
a) Cul es la probabilidad aproximada de que una media muestral, basada en una muestra
aleatoria de n = 35 economistas, se ubique a 1 % de la media de la poblacin de las
estimaciones de los economistas?
b) Es necesariamente cierto que la media de la poblacin de las estimaciones de todos los
economistas es igual al porcentaje del ahorro en los impuestos que se lograrn en realidad?
Por qu?
Ejercicios referentes a distribuciones muestrales de proporciones
1. Un detallista compra vasos de cristal en grandes cantidades directamente de la fbrica. Tales
vasos son envueltos uno por uno. Algunas veces, el detallista inspecciona las remesas para
determinar la proporcin de vasos rotos o defectuosos. Si un gran cargamento contiene el 10 %
de vasos rotos o defectuosos, cul es la probabilidad de que el detallista obtenga una muestra
aleatoria de 100 vasos que presenta el 17 % o ms de defectuosos?
2. Encuentre la media de la distribucin de proporciones de muestreo cuando la proporcin de la
poblacin muestreada es: a. 30 %; b. 43 %; c. 50 %; d. 72.3 %
3. Obtenga la desviacin estndar de la distribucin de muestro de proporciones para n =100 y
una proporcin de la poblacin de: a. 10 %; b. 20 %; c. 40 %; d. 50 %; e. 60 %; f. 80 %; g. 90 %
4. Explique por qu se utiliza la distribucin normal para muestras de 20 o ms observaciones,
cuando la distribucin binomial es tericamente correcta al trabajar con proporciones. Cundo
es preferible la binomial a la normal?
5. Si se supone que se tiene un tamao de muestra muy grande, determine el porcentaje de las
proporciones de muestra que se espera que queden en estos intervalos: a. p 1
p
; b. p 1.96
p
;
c. p 2
p
; d. p 2.33
p
6. Calcule z si el porcentaje de proporciones de muestreo que se espera que haya en el intervalo
p +z
p
es: a. 90 %; b. 95 %; c. 99 %; d. 99.7 %
7. Si se toman muestras de n = 100 observaciones de una poblacin muy grande, en la que la
proporcin de la poblacin es el 20 %, qu porcentaje de las proporciones de la muestra
quedarn dentro de estos intervalos?
a) 16 % a 24 %
b) ms del 24 %
c) 12 % a 28 %
d) menos del 12 % o ms del 28 %
8. En una encuesta se pregunt a 500 madres y padres acerca de la importancia de los deportes
para muchachos y muchachas. De los padres entrevistados, 60 % estaba de acuerdo en que
los gneros son iguales y deben tener las mismas oportunidades de participar en los deportes.
Describa la distribucin muestral de la proporcin p de padres que estn de acuerdo en que los
gneros son iguales y deben tener las mismas oportunidades.
9. Regrese al ejercicio anterior. Suponga que la proporcin p de padres en la poblacin en realidad
es igual a 0.55. Cul es la probabilidad de observar una proporcin muestral tan grande o mayor
que el valor observado p =0.60?
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 11
10. Una de las formas en que la mayora de los estadounidenses alivia el estrs es premiarse con
dulces. Segn un estudio, 46 % admite ingerir comidas dulces en exceso cuando est estresado.
Suponga que la cifra 46 % es correcta y que se selecciona una muestra aleatoria de n = 100
personas.
a) La distribucin de p, la proporcin muestral de estadounidenses que alivian el estrs
ingiriendo comidas dulces en exceso tiene una distribucin aproximadamente normal? Si
ste es el caso, cules son su media y desviacin estndar?
b) Cul es la probabilidad de que la proporcin muestral, p, sea mayor que 0.5?
c) Cul es la probabilidad de que p quede dentro de un intervalo entre 0.35 y 0.55?
d) Qu podra concluir si la proporcin muestral fuera tan pequea como 30 %?
11. En 1996 hubo una batalla en los tribunales, as como en el mercado, entre Intel y Digital
Equipment Corp. por los avances tcnicos que sustentaba el microprocesador Pentium de
Intel. Digital acus a Intel de violacin intencionada de las patentes de Digital. Aunque el
microprocesador Alfa de Digital era en ese entonces el ms rpido del mercado, su velocidad
sucumbi ante la inuencia de la mercadotecnia de Intel. Ese mismo ao, Intel abarc 76 %
del mercado de microprocesadores. Suponga que se revisa una muestra aleatoria de n =1000
ventas de computadoras personales y se anota el tipo de microprocesador instalado. Sea p la
proporcin de computadoras personales con un microprocesador Pentium en la muestra.
a) Cul es la distribucin de p?Cmo puede aproximar la distribucin de p?
b) Cul es la probabilidad de que la proporcin muestral de las PC con chips Pentium sea
mayor que 80 %?
c) Cul es la probabilidad de que la proporcin muestral de computadoras personales con
microprocesadores Pentium estuviese entre 75 % y 80 %?
d) Una proporcin muestral de computadoras con microprocesadores Pentium igual a 70 %
parecera contradecir la cifra reportada de 76 %?
Ejercicios referentes a distribuciones muestrales de la varianza
1. Un ingeniero qumico arma que el rendimiento medio de la poblacin de cierto proceso en
lotes es 500 gramos por milmetro de materia prima. Para vericar esta armacin muestrea 25
lotes cada mes. Si el valor t calculado cae entre t
0.05
y t
0.05
, queda satisfecho con su armacin.
Qu conclusin extraera de una muestra que tiene una media x =518 gramos por milmetro y
una desviacin estndar muestral s =40 gramos? Suponga que la distribucin de rendimientos
es aproximadamente normal.
2. Una empresa manufacturera arma que las bateras que utiliza en sus juegos electrnicos duran
un promedio de 30 horas. Para mantener este promedio, se prueban 16 bateras cada mes. Si
el valor t que se calcula cae entre t
0.025
y t
0.025
, la empresa queda satisfecha con su armacin.
Qu conclusiones extraera la empresa de una muestra que tiene una media de x =27.5 horas y
una desviacin estndar de s =5 horas? Suponga que la distribucin de las duraciones de las
bateras es aproximadamente normal.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 12
.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 13
1 -1 -2 -3 2 3
68%
95.5%
99.7%
Figura 1: rea bajo una curva normal dentro de 1, 2 y 3 desviaciones estndar de la media
1.5. Estimaciones puntuales y de intervalo
Los valores estadsticos muestrales se utilizan como estimadores de los parmetros de poblacin. La
media de una muestra se utiliza como una estimacin del valor medio de la poblacin; una desviacin
estndar muestral se emplea como una estimacin de la desviacin estndar de la poblacin y la
proporcin de elementos de una muestra con cierta caracterstica en comn se usa para estimar la
proporcin de una poblacin que presenta la misma caracterstica. Tales estimaciones reciben el
nombre de estimaciones de punto o puntuales, ya que proporcionan la estimacin de un solo valor de
un parmetro. Sin embargo, se sabe que muestras aleatorias tienden a producir muestras en las que,
por ejemplo, la media de la muestra no es igual a la de la poblacin, aunque generalmente ambos
valores estn muy cercanos entre s. Debido a la variabilidad de muestreo, suele ser deseable incluir
una estimacin de intervalo para acompaar la estimacin puntual. Esta estimacin proporciona un
intervalo de los valores posibles para el parmetro de poblacin.
Denicin 1.1. Estimacin puntual: Estimacin de un valor nico de un parmetro de la poblacin
Denicin 1.2. Estimacin por intervalo: Estimacin que incluye un intervalo de valores posibles en
el que se considera que est comprendido un parmetro de la poblacin.
La capacidad para estimar los parmetros de poblacin mediante el empleo de datos muestrales, se
relaciona directamente con el conocimiento que se tiene acerca de la distribucin muestral del valor
estadstico que se est utilizando como estimador. Es posible considerar el valor estadstico de la
muestra como una observacin de la distribucin muestral.
Supngase que se toma una muestra aleatoria de una poblacin de profesionales titulados, en la que
se observa que la edad promedio es de 24.2 aos. Se sabe que ste es uno de los valores de la distri-
bucin muestral, pero la pregunta es cul? Es decir, cun cercano est 24.2 a la media de la poblacin?
Al tratar de responder esta pregunta, se deben tener en cuenta las caractersticas de la distribucin
muestral. En muchos casos, la distribucin de valores de la muestra es normal o aproximadamente
normal. Supngase que este es el caso. En la gura 1 se muestran los porcentajes de los valores
estadsticos de la muestra comprendidos para varias desviaciones estndar.
Si se establece la proposicin de que la media de una muestra est dentro de 1.96 desviaciones
estndar de la media verdadera, es posible esperar estar en lo cierto un 95 % de las veces, y estar
equivocado el 5 % restante. De esta manera, decir que 24.2 queda dentro de 1.96 desviaciones estndar
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 14
?
?
?
?
x
_
24. 2
x
_
? ?
Proviene el valor
estadstico de la muestra
del extremo (o cola)
superior de la distribucin
de muestreo, como se
indica aqu ?
Proviene el valor
estadstico de la muestra
del extremo (o cola)
inferior de la distribucin
de muestreo, como se
indica aqu ?
Como no hay forma de
estar seguros, se supone lo
peor y se establece un
intervalo de valores
verdaderos posibles
Figura 2: Concepto de la estimacin de intervalo
de la media conlleva un riesgo de error del 5 %. Como es imposible saber con exactitud, nos debemos
conformar con esta evaluacin probabilstica del intervalo en el que puede estar comprendido el valor
verdadero. Este recibe el nombre de intervalo de conanza, y la conanza es 1 P(error). Por tanto,
un intervalo de conanza de 95 % implicara un 5 % de riesgo de error; el 5 % de los intervalos as
designados no incluiran la media de la poblacin. Para reducir el riesgo es necesario establecer un
intervalo ms amplio de valores posibles para la media de la poblacin.
Ahora bien, independientemente del nivel de conanza que se escoja, no se puede decir que una
muestra determinada es menor o mayor que el valor no conocido de la media de la poblacin. Por
ejemplo, la media muestral puede provenir del extremo (cola) superior de la distribucin de muestreo
es decir, el valor medio de la muestra puede provenir del extremo (cola) inferior de la distribucin del
mismo tipo. No hay forma de saber si un determinado valor estadstico de la muestra es demasiado
alto, demasiado bajo o casi igual al valor real. Por tanto, se establece una categora o intervalo de
valores posibles, en el que se cree que puede estar el valor verdadero del parmetro, teniendo en
mente el mximo error que se est dispuesto a aceptar. Esto se ilustra en la gura 2.
El intervalo de conanza presenta la forma x z
x
; el valor de la media de la muestra tiene dos
signicados. Uno de ellos es que sirve como punto medio del intervalo de conanza. Adems, funciona
como estimacin puntual de la media real. Hay que recordar que el valor medio de la muestra tiene un
valor esperado que es igual a la media de la poblacin. Por tanto, en promedio, el valor de la muestra
ser igual al parmetro de la poblacin.
La gura 3 muestra que un intervalo de conanza de 95 % incluir la media de la poblacin para todas,
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 15

Distribucin muestral
para x
_
- 1.96
X
_
+ 1.96
X
_
x1
_
x1 + 1.96
_
x1 - 1.96
x2
_
x2 + 1.96
_
x2 - 1.96
x3
_
x3 + 1.96
_
x3 - 1.96
x4
_
x4 + 1.96
_
x4 - 1.96
x5
_
x5 + 1.96
_
x5 - 1.96
Muestra
1
2
3
4
5
_
_
_
_
_
Figura 3: Las estimaciones de intervalos basados en los valores medios de muestras repetidas no
presentarn todas el valor verdadero. Se ilustra esto con intervalos de conanza de 95 % (z =1.96)
excepto el 5 % de los valores medios de la muestra.
Denicin 1.3. Un intervalo de conanza proporciona un intervalo de valores, centrado en el valor
estadstico de la muestra, en el cual supuestamente se ubica el parmetro de la poblacin, con un
riesgo de error conocido.
1.6. Estimaciones de una poblacin
1.6.1. Estimacin de la media
La pregunta de cun cerca puede estar determinado valor medio muestral con respecto a la media de
la distribucin muestral, en unidades reales, depende de la variabilidad de la distribucin muestral
esto es, la desviacin estndar de la distribucin muestral. Debe recordarse que a medida que
aumenta el tamao de la muestra,la desviacin estndar de la distribucin muestral disminuye. Esto
hace que muestras grandes tendern a producir valores medios muestrales ms cercanos a la media
que los de las muestras pequeas. La variabilidad en la poblacin tambin es un factor importante;
cuanto mayor sea la variabilidad en la poblacin, mayor ser la variabilidad en la distribucin muestral.
El mtodo empleado para estimar la media de una poblacin depende de si se conoce la desviacin
estndar de la misma o si sta se debe estimar a partir de los datos muestrales.
Desviacin estndar poblacional conocida Cuando se conoce la desviacin estndar de la pobla-
cin, las estimaciones de punto y de intervalo de la media de la poblacin se calculan de la siguiente
manera:
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 16
a)
Intervalo
de confanza
x - z
_
x
_ x
_
x + z
_
x
_
x - e
_
x
_
x + e
_
Error
probable
mximo
Error
probable
mximo
Intervalo
de confanza
b)
Figura 4: a) El intervalo de conanza est centrado respecto al valor medio de la muestra. b) El error es
igual a la mitad de la amplitud del intervalo de conanza.
estimacin de punto de : x
estimacin de intervalo de : x z
x
en donde
x
=/

n.
En la gura 6a se presenta la forma como se establece el intervalo de conanza, tomando el valor medio
de la muestra como punto medio. La estimacin de intervalo de la media poblacional se basa en el
supuesto de que la distribucin muestral de los valores medios de la muestra es normal. En el caso de
tamaos de muestra grandes, esto no constituye una gran dicultad, puesto que se aplica el teorema
del lmite central. Sin embargo, para muestras menores de 30 observaciones, es importante saber que
la poblacin que se muestrea est distribuida normalmente, o por lo menos, casi normalmente. De
otra manera, no pueden utilizarse estas tcnicas.
Error de estimacin El error en una estimacin de intervalos se reere a la desviacin (diferencia)
entre el valor medio de la muestra y la media real de la poblacin. Como el intervalo de conanza est
centrado con respecto al valor medio de la muestra, el error mximo probable equivale a la mitad de la
amplitud del intervalo. Por tanto, el intervalo
x z

n
se puede representar como x error
siendo el error e = z

n
.
La frmula para el error indica que realmente hay tres factores determinantes del tamao o grado de
error:
1. la conanza deseada, que se representa por medio el valor de z
2. la dispersin en la poblacin,
3. el tamao de la muestra, n
Los factores que forman el numerador ejercen un efecto directo sobre el error, ya que un aumento
en esas variables har que aumente e , es decir, cuanto mayor sea el coeciente de conanza o la
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 17
(a) Efecto del
coefciente de
confanza
(b) Efecto del
tamao de
la muestra
(c) Efecto de la
dispersin de
la poblacin
Confanza z Amplitud del intervalo
Tamao de la muestra

Amplitud del intervalo


Amplitud del intervalo
68%
95%
99%
1.00
1.96
2.58
8
16
32
64
5
10
15
20
Figura 5: Factores que inuyen en la amplitud de un intervalo de conanza; (a) coeciente de conanza,
(b) tamao de la muestra, (c) dispersin de la poblacin.
dispersin de la poblacin, tanto mayor ser el error potencial. El tamao de la muestra, que se
encuentra en el denominador, ejerce un efecto inverso sobre el error. El efecto neto depender de
las tres variables.En la gura 7a se observa que al aumentar el grado de conanza resulta en una
ampliacin del intervalo. En la gura 7b se indica que un aumento en el tamao de la muestra
provocar que se reduzca el intervalo. La gura 7c ilustra como la dispersin de la poblacin puede
alterar el intervalo: a mayor dispersin, mayor intervalo.
Determinacin del tamao muestral Algo que se pregunta frecuentemente en estadstica es: de
qu tamao debe ser la muestra? La frmula para el error se puede utilizar de tal forma que sea posible
determinar el valor de n.
n =
_
z

e
_
2
Por tanto, el tamao muestral necesario depender de
1. el grado de conanza deseado
2. la cantidad de dispersin entre los valores individuales de la poblacin
3. cierta cantidad especicada de error tolerable
Se debe observar que al obtener el valor de n siempre se redondea la respuesta al siguiente valor
entero.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 18
Estimacin de la media cuando no se conoce Cuando no se conoce el valor de la desviacin
estndar de la poblacin lo cual generalmente ocurre, la desviacin estndar de la muestra se
utiliza como una estimacin de s y sustituye a en ecuaciones de intervalo de conanza y errores. Esto
no presenta una dicultad importante, ya que la desviacin estndar de la muestra proporciona una
aproximacin al valor verdadero, muy razonable en la mayora de los casos. Adems por el teorema del
lmite central se sabe que, cuando el tamao de la muestra es mayor que 30, la distribucin muestral
de las medias ser casi normal. Sin embargo, para tamaos de muestra de 30 o menos observaciones,
la aproximacin normal resulta inadecuada. En lugar de ello, los clculos de los intervalos de conanza
se deben basar en la distribucin t, que es la distribucin tericamente correcta siempre que se utiliza s .
El aspecto interesante y complicado con respecto a la distribucin t es que no es una de tipo
estandarizado en el mismo sentido que lo es la distribucin normal; en el caso de cada tamao de
muestra existe una distribucin t ligeramente diferente. De este modo, en tanto que la distribucin
normal es esencialmente independiente del tamao de la muestra, la distribucin t no lo es.
El intervalo de conanza para una media muestral cuando se usa s es muy semejante al intervalo con

x t
s

n
Como ltimo punto diremos que la distribucin t es tericamente apropiada slo cuando se muestrea
a partir de una distribucin normal. Como aspecto prctico, a medida que n aumenta ms all de 30
0bservaciones, disminuye la necesidad de suponer normalidad.
1.6.2. Estimacin de la proporcin
Qu porcentaje de los productos de un gran embarque est defectuoso? Qu proporcin de las
canicas que hay en una urna son rojas? Qu porcentaje de los votantes aprobarn un decreto? Cul
es la probabilidad de que un alumno de este estado no reciba la vacuna requerida contra el sarampin?
Estas preguntas y otras semejantes se pueden contestar utilizando datos muestrales para estimar el
parmetro de la poblacin. Como se vio en la seccin anterior, las estimaciones suelen establecerse,
en trminos de estimaciones de punto y de intervalo.
La estimacin de proporciones de la poblacin es muy semejante a la de las medias de la poblacin.
Por ejemplo, un intervalo de conanza de una muestra grande se basa en una distribucin muestral
que es aproximadamente normal, y el valor estadstico de la muestra en este caso, la proporcin
de la muestra se utiliza como la estimacin de punto del parmetro verdadero proporcin de la
poblacin. Existe una excepcin importante. La distribucin t no se utiliza en absoluto y, por
tanto, se evita completamente la relacin entre t y z.
Mtodo de la frmula El valor esperado de una proporcin muestral es decir, la media de una
distribucin muestral de proporciones muestrales siempre es igual a la proporcin de la poblacin
verdadera. Por tanto, la proporcin de la muestra se utiliza como la estimacin de punto de la
proporcin verdadera:
estimacin de punto dep : p =
x
n
La estimacin de intervalo del parmetro de la poblacin para tamaos grandes de muestra es
simtrica respecto de la proporcin de la muestra, del mismo modo que el intervalo para una media
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 19
de la poblacin es simtrico respecto a la media muestral. La principal diferencia entre estimacin de
medias y la de proporciones radica en las desviaciones estndar de las distribuciones muestrales. La
desviacin estndar de una proporcin se basa en la distribucin binomial. La estimacin de
p
se
presenta a continuacin.

x/n
=
_
(x/n)[1(x/n)]
n
es equivalente a
p
=
_
(p)(q)
n
donde x = nmero de elementos de la muestra; z = desviacin estndar normal; n = tamao de la
muestra; p = proporcin de la muestra y q =1p. La estimacin de intervalo de p es:
x
n
z
_
(x/n)[1(x/n)]
n
que equivale a p z
_
(p)(q)
n
Error La cantidad de errores de una estimacin equivale simplemente a la mitad de la amplitud del
intervalo de conanza. Por tanto su ecuacin es
e = z
_
pq
n
Los dos factores, z y n, producen exactamente el mismo efecto que en el caso de errores en la
estimacin de medias de poblacin. Es decir, cuanto mayor sea z la conanza, mayor ser el error
posible, y cuanto mayor sea el tamao de muestra, tanto menor ser el error.
Determinacin del tamao de la muestra Uno de los usos ms frecuentes de la frmula del error
es en la determinacin del tamao muestral necesario para obtener un grado de precisin en la
estimacin de proporciones. Despejando n su frmula es
n = z
2
_
pq
e
2
_
Nuevamente, el resultado se debe redondear al entero superior.
1.6.3. Estimacin de la varianza
En los prrafos precedentes se explic que por lo general se necesita una estimacin de la varianza
poblacional
2
antes de poder hacer inferencias respecto a las medias poblacionales. Sin embargo,
en ocasiones el objetivo principal de una investigacin experimental es determinar, precisamente,
la varianza poblacional
2
. Para el investigador esta ltima puede ser ms importante que la media
poblacional. Considere los ejemplos que se dan a continuacin:
Los instrumentos cientcos de medicin deben proporcionar lecturas insesgadas con un muy
pequeo error de medicin. Un altmetro de un avin que mide la altitud correcta promedio no es
muy til si las mediciones que proporciona contienen un error tan grande como 1000 pies arriba
o abajo de la altitud real.
Las partes hechas a mquina en un proceso de fabricacin deben ser producidas con la mnima
variabilidad para reducir el nmero de partes que no dan las medidas correctas y, por tanto, las
piezas defectuosas.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 20
Los exmenes de aptitud se deben disear de modo que las puntuaciones muestren una cantidad
razonable de variabilidad. Por ejemplo, una prueba de 800 puntos no es muy selectiva si todos
los estudiantes obtienen puntuaciones entre 601 y 605 puntos.
Si se toma una muestra de tamao n de una poblacin normal con varianza
2
, y se calcula la varianza
muestral s
2
, se obtiene un valor del estadstico S
2
. Esta varianza muestral calculada se utilizar como
una estimacin puntual de
2
. Por lo que al estadstico S
2
se le denomina estimador de
2
.
Puede establecerse una estimacin de intervalo de
2
utilizando el estadstico:

2
=
(n 1)S
2

2
El estadstico
2
tiene una distribucin ji-cuadrada con n 1 grados de libertad cuando las muestras
se seleccionan a partir de una poblacin normal. Para la muestra aleatoria particular de tamao n se
calcula la varianza muestral s
2
y se obtiene el siguiente intervalo de conanza para
2
.
(n 1)s
2

2
/2
<
2
<
(n 1)s
2

2
1/2
donde
2
/2
y
2
1/2
son los valores de
2
superior e inferior, que localizan una mitad de en cada cola
de la distribucin ji-cuadrada. Supuesto: la muestra se elige al azar de una poblacin normal.
1.7. Estimaciones de dos poblaciones
1.7.1. Estimacin de la diferencia de dos medias
Un problema que es tan importante como la estimacin de una sola media poblacional para una
poblacin cuantitativa es la comparacin de dos medias poblacionales. Es posible que quiera hacer
comparaciones como stas:
Las calicaciones promedio en el examen de admisin de la escuela de medicina para estudiantes
cuya asignatura principal era bioqumica y para los que la asignatura principal era biologa.
Los rendimientos promedio en una planta qumica que utiliza materia prima adquirida con dos
proveedores.
Los dimetros promedio del tallo de plantas cultivadas con dos tipos diferentes de nutrientes.
Para cada uno de estos ejemplos hay dos poblaciones: la primera con media
1
y varianza
2
1
y la
segunda con
2
y varianza
2
2
. Una muestra aleatoria de n
1
mediciones se extrae de la poblacin 1, y
n
2
de la poblacin 2, donde se supone que las muestras fueron extradas de manera independiente
una de otra.
Por ltimo, las estimaciones de los parmetros de la poblacin se calculan de los datos de la muestra
por medio de los estimadores x
1
, s
2
1
, x
2
y s
2
2
.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 21
Propiedades de la distribucin muestral de (x
1
x
2
), la diferencia entre dos medias muestrales
Cuando de poblaciones con medias
1
y
2
y varianzas
2
1
y
2
2
, respectivamente, se han seleccionado
muestras aleatorias independientes de n
1
y n
2
observaciones, la distribucin muestral de la diferencia
( x
1
x
2
) tiene las propiedades siguientes:
1. La media y el error estndar de ( x
1
x
2
) son

( x
1
x
2
)
=
1

2
e =
( x
1
x
2
)
=
_

2
1
n
1
+

2
2
n
2
2. Si las poblaciones muestreadas estn normalmente distribuidas, entonces la distribucin mues-
tral de ( x
1
x
2
) se distribuye de manera exactamente normal, sin importar el tamao de la
muestra.
3. Si las poblaciones muestreadas no se distribuyen normalmente, entonces la distribucin mues-
tral de ( x
1
x
2
) se distribuye de manera aproximadamente normal cuando n
1
y n
2
son grandes,
de acuerdo al teorema de lmite central.
Intervalo de conanza de (1)100% para (
1

2
) para muestras grandes
( x
1
x
2
) z
_

2
1
n
1
+

2
2
n
2
Si no se conocen los valores de
2
1
y
2
2
, se pueden aproximar mediante las varianzas muestrales s
2
1
y
s
2
2
, y el intervalo de conanza aproximado es
( x
1
x
2
) z
_
s
2
1
n
1
+
s
2
2
n
2
Intervalo de conanza de (1)100% para (
1

2
) para muestras pequeas
Caso 1: Varianzas iguales pero desconocidas
( x
1
x
2
) t
/2
_
s
2
p
_
1
n
1
+
1
n
2
_
donde s
2
p
es la estimacin agrupada de
2
y se calcula con
s
2
p
=
(n
1
1)s
2
1
+ (n
2
1)s
2
2
n
1
+n
2
2
El procedimiento con dos muestras en el que se usa una estimacin agrupada de la varianza comn

2
se sustenta en cuatro supuestos importantes:
Las muestras se deben seleccionar al azar. Las muestras que no se escogen de esta mane-
ra podran introducir un sesgo en el experimento y, por consiguiente, alterar los niveles de
signicacin que se estn informando.
Las muestras deben ser independientes. Si no es as, ste no es el procedimiento estadstico
apropiado.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 22
Las poblaciones de donde obtenga sus muestras deben ser normales. Aunque desviaciones
moderadas de la normalidad no afectan seriamente a la distribucin del estadstico de prueba,
sobre todo si los tamaos de muestra son casi iguales.
Las varianzas poblacionales deben ser iguales o casi iguales para tener la certeza de que los
procedimientos son vlidos.
Caso 2: Varianzas distintas y desconocidas Si las varianzas poblacionales estn lejos de ser iguales, hay
un procedimiento alternativo denominado aproximacin de Satterthwaite para estimar y probar
que se tiene una distribucin T aproximada en el muestreo repetido. Como regla prctica, este
procedimiento es el indicado si la razn de las dos varianzas muestrales
varianza mayor
varianza menor
>3
Como las varianzas poblacionales no son iguales, el estimador agrupado s
p
ya no es apropiado, y para
cada varianza poblacional se debe estimar su correspondiente varianza muestral.
El intervalo es:
( x
1
x
2
) t
/2
_
_
s
2
1
n
1
+
s
2
2
n
2
_
Los grados de libertad para t se aproximan mediante la frmula:
=
_
s
2
1
n
1
+
s
2
2
n
2
_
2
(s
2
1
/n
1
)
2
(n
1
1)
+
(s
2
2
/n
2
)
2
(n
2
1)
El resultado debe redondearse al entero ms cercano.
1.7.2. Estimacin de la diferencia entre dos proporciones
Del mismo modo que la estimacin de una media poblacional condujo a la estimacin de la diferencia
entre dos medias poblacionales, la estimacin de una proporcin poblacional binomial lleva a la
estimacin de la diferencia entre dos proporciones poblacionales binomiales. Tal vez desee hacer
comparaciones como stas:
La proporcin de artculos defectuosos fabricados en dos lneas de produccin.
La proporcin de mujeres votantes y la de hombres votantes que estn a favor de una enmienda
de igualdad de derechos.
Las tasas de germinacin de semillas tratadas y no tratadas con un fungicida.
En estos casos la pregunta por contestar tiene que ver con la diferencia (p
1
p
2
) entre dos proporciones
binomiales basadas en muestras aleatorias extradas de cada una de las dos poblaciones binomiales.
En este caso las poblaciones binomiales tienen los parmetros p
1
y p
2
. Las muestras aleatorias
independientes que consisten en n
1
y n
2
ensayos se extraen de las poblaciones 1 y 2, respectivamente,
y se calculan las estimaciones muestrales p
1
y p
2
. El estimador insesgado de la diferencia (p
1
p
2
) es
la diferencia muestral ( p
1
p
2
).
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 23
Propiedades de la distribucin muestral de la diferencia (
^
p
1

^
p
2
) entre dos proporciones mues-
trales Suponga que las muestras aleatorias independientes de n
1
y n
2
observaciones se seleccionaron
de poblaciones binomiales con parmetros p
1
y p
2
, respectivamente. La distribucin muestral de la
diferencia entre las proporciones muestrales
( p
1
p
2
) =
_
x
1
n
1

x
2
n
2
_
tiene estas propiedades:
1. La media y el error estndar de ( p
1
p
2
) son

( p
1
p
2
)
= p
1
p
2
y e =
( p
1
p
2
)
=
_
p
1
q
1
n
1
+
p
2
q
2
n
2
2. La distribucin muestral de ( p
1
p
2
) se puede aproximar mediante una distribucin normal
cuando n
1
y n
2
son grandes, de acuerdo con el teorema del lmite central.
Aunque el rango de una sola proporcin es de 0 a 1, la diferencia entre dos proporciones vara entre
1 y 1. Para aproximar la distribucin de ( p
1
p
2
) por medio de una distribucin muestral, tanto p
1
como p
2
deben ser aproximadamente normales; es decir, n
1
p
1
>5, n
1
q
1
>5, n
2
p
2
>5, n
2
q
2
>5.
Intervalo de conanza de (1)100 % de (p
1
p
2
) para una muestra grande
( p
1
p
2
) z
_
p
1
q
1
n
1
+
p
2
q
2
n
2
Suposicin: n
1
y n
2
deben ser sucientemente grandes para que la distribucin muestral de ( p
1
p
2
)
se pueda aproximar mediante una distribucin norma; a saber, si n
1
p
1
, n
1
q
1
, n
2
p
2
y n
2
q
2
son mayores
que 5.
1.7.3. Estimacin de la razn de dos varianzas poblacionales
As como a veces una sola varianza poblacional es importante para un investigador, tambin se podra
necesitar comparar dos varianzas poblacionales. Quiz necesite comparar la precisin de un dispositivo
de medicin con la de otro, la estabilidad de un proceso de manufactura con la de otro, o incluso la
variabilidad en el procedimiento que un profesor universitario utiliza para calicar con la de otro.
Una manera de comparar dos varianzas poblacionales,
1
y
2
, es usar la razn de las varianzas
muestrales, s
2
1
/s
2
2
. Si s
2
1
/s
2
2
es casi igual a 1, se encontrar poca evidencia para concluir que
2
1
y
2
2
no
iguales. Por otro lado, un valor muy grande o muy pequeo para s
2
1
/s
2
2
proporciona evidencia de que
las varianzas poblacionales son diferentes.
Intervalo de conanza para
2
1
/
2
2
_
s
2
1
s
2
2
_
1
F

1
,
2
<

2
1

2
2
<
_
s
2
1
s
2
2
_
F

2
,
1
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 24
donde
1
= (n
1
1) y
2
= (n
2
1). F

1
,
2
es el valor crtico tabulado de F que corresponde a los grados
de libertad
1
y
2
del numerador y denominador de F, respectivamente, con rea /2 a su derecha.
Supuestos: las muestras se seleccionan al azar y de forma independiente de poblaciones normalmente
distribuidas.
1.8. Estimaciones de una poblacin
1.8.1. Estimacin de la media
La pregunta de cun cerca puede estar determinado valor medio muestral con respecto a la media de
la distribucin muestral, en unidades reales, depende de la variabilidad de la distribucin muestral
esto es, la desviacin estndar de la distribucin muestral. Debe recordarse que a medida que
aumenta el tamao de la muestra,la desviacin estndar de la distribucin muestral disminuye. Esto
hace que muestras grandes tendern a producir valores medios muestrales ms cercanos a la media
que los de las muestras pequeas. La variabilidad en la poblacin tambin es un factor importante;
cuanto mayor sea la variabilidad en la poblacin, mayor ser la variabilidad en la distribucin muestral.
El mtodo empleado para estimar la media de una poblacin depende de si se conoce la desviacin
estndar de la misma o si sta se debe estimar a partir de los datos muestrales.
Desviacin estndar poblacional conocida Cuando se conoce la desviacin estndar de la pobla-
cin, las estimaciones de punto y de intervalo de la media de la poblacin se calculan de la siguiente
manera:
estimacin de punto de : x
estimacin de intervalo de : x z
x
en donde
x
=/

n.
En la gura 6a se presenta la forma como se establece el intervalo de conanza, tomando el valor medio
de la muestra como punto medio. La estimacin de intervalo de la media poblacional se basa en el
supuesto de que la distribucin muestral de los valores medios de la muestra es normal. En el caso de
tamaos de muestra grandes, esto no constituye una gran dicultad, puesto que se aplica el teorema
del lmite central. Sin embargo, para muestras menores de 30 observaciones, es importante saber que
la poblacin que se muestrea est distribuida normalmente, o por lo menos, casi normalmente. De
otra manera, no pueden utilizarse estas tcnicas.
Error de estimacin El error en una estimacin de intervalos se reere a la desviacin (diferencia)
entre el valor medio de la muestra y la media real de la poblacin. Como el intervalo de conanza est
centrado con respecto al valor medio de la muestra, el error mximo probable equivale a la mitad de la
amplitud del intervalo. Por tanto, el intervalo
x z

n
se puede representar como x error
siendo el error e = z

n
.
La frmula para el error indica que realmente hay tres factores determinantes del tamao o grado de
error:
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 25
a)
Intervalo
de confanza
x - z
_
x
_ x
_
x + z
_
x
_
x - e
_
x
_
x + e
_
Error
probable
mximo
Error
probable
mximo
Intervalo
de confanza
b)
Figura 6: a) El intervalo de conanza est centrado respecto al valor medio de la muestra. b) El error es
igual a la mitad de la amplitud del intervalo de conanza.
1. la conanza deseada, que se representa por medio el valor de z
2. la dispersin en la poblacin,
3. el tamao de la muestra, n
Los factores que forman el numerador ejercen un efecto directo sobre el error, ya que un aumento
en esas variables har que aumente e , es decir, cuanto mayor sea el coeciente de conanza o la
dispersin de la poblacin, tanto mayor ser el error potencial. El tamao de la muestra, que se
encuentra en el denominador, ejerce un efecto inverso sobre el error. El efecto neto depender de
las tres variables.En la gura 7a se observa que al aumentar el grado de conanza resulta en una
ampliacin del intervalo. En la gura 7b se indica que un aumento en el tamao de la muestra
provocar que se reduzca el intervalo. La gura 7c ilustra como la dispersin de la poblacin puede
alterar el intervalo: a mayor dispersin, mayor intervalo.
Determinacin del tamao muestral Algo que se pregunta frecuentemente en estadstica es: de
qu tamao debe ser la muestra? La frmula para el error se puede utilizar de tal forma que sea posible
determinar el valor de n.
n =
_
z

e
_
2
Por tanto, el tamao muestral necesario depender de
1. el grado de conanza deseado
2. la cantidad de dispersin entre los valores individuales de la poblacin
3. cierta cantidad especicada de error tolerable
Se debe observar que al obtener el valor de n siempre se redondea la respuesta al siguiente valor
entero.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 26
(a) Efecto del
coefciente de
confanza
(b) Efecto del
tamao de
la muestra
(c) Efecto de la
dispersin de
la poblacin
Confanza z Amplitud del intervalo
Tamao de la muestra

Amplitud del intervalo


Amplitud del intervalo
68%
95%
99%
1.00
1.96
2.58
8
16
32
64
5
10
15
20
Figura 7: Factores que inuyen en la amplitud de un intervalo de conanza; (a) coeciente de conanza,
(b) tamao de la muestra, (c) dispersin de la poblacin.
Estimacin de la media cuando no se conoce Cuando no se conoce el valor de la desviacin
estndar de la poblacin lo cual generalmente ocurre, la desviacin estndar de la muestra se
utiliza como una estimacin de s y sustituye a en ecuaciones de intervalo de conanza y errores. Esto
no presenta una dicultad importante, ya que la desviacin estndar de la muestra proporciona una
aproximacin al valor verdadero, muy razonable en la mayora de los casos. Adems por el teorema del
lmite central se sabe que, cuando el tamao de la muestra es mayor que 30, la distribucin muestral
de las medias ser casi normal. Sin embargo, para tamaos de muestra de 30 o menos observaciones,
la aproximacin normal resulta inadecuada. En lugar de ello, los clculos de los intervalos de conanza
se deben basar en la distribucin t, que es la distribucin tericamente correcta siempre que se utiliza s .
El aspecto interesante y complicado con respecto a la distribucin t es que no es una de tipo
estandarizado en el mismo sentido que lo es la distribucin normal; en el caso de cada tamao de
muestra existe una distribucin t ligeramente diferente. De este modo, en tanto que la distribucin
normal es esencialmente independiente del tamao de la muestra, la distribucin t no lo es.
El intervalo de conanza para una media muestral cuando se usa s es muy semejante al intervalo con

x t
s

n
Como ltimo punto diremos que la distribucin t es tericamente apropiada slo cuando se muestrea
a partir de una distribucin normal. Como aspecto prctico, a medida que n aumenta ms all de 30
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 27
0bservaciones, disminuye la necesidad de suponer normalidad.
1.8.2. Estimacin de la proporcin
Qu porcentaje de los productos de un gran embarque est defectuoso? Qu proporcin de las
canicas que hay en una urna son rojas? Qu porcentaje de los votantes aprobarn un decreto? Cul
es la probabilidad de que un alumno de este estado no reciba la vacuna requerida contra el sarampin?
Estas preguntas y otras semejantes se pueden contestar utilizando datos muestrales para estimar el
parmetro de la poblacin. Como se vio en la seccin anterior, las estimaciones suelen establecerse,
en trminos de estimaciones de punto y de intervalo.
La estimacin de proporciones de la poblacin es muy semejante a la de las medias de la poblacin.
Por ejemplo, un intervalo de conanza de una muestra grande se basa en una distribucin muestral
que es aproximadamente normal, y el valor estadstico de la muestra en este caso, la proporcin
de la muestra se utiliza como la estimacin de punto del parmetro verdadero proporcin de la
poblacin. Existe una excepcin importante. La distribucin t no se utiliza en absoluto y, por
tanto, se evita completamente la relacin entre t y z.
Mtodo de la frmula El valor esperado de una proporcin muestral es decir, la media de una
distribucin muestral de proporciones muestrales siempre es igual a la proporcin de la poblacin
verdadera. Por tanto, la proporcin de la muestra se utiliza como la estimacin de punto de la
proporcin verdadera:
estimacin de punto dep : p =
x
n
La estimacin de intervalo del parmetro de la poblacin para tamaos grandes de muestra es
simtrica respecto de la proporcin de la muestra, del mismo modo que el intervalo para una media
de la poblacin es simtrico respecto a la media muestral. La principal diferencia entre estimacin de
medias y la de proporciones radica en las desviaciones estndar de las distribuciones muestrales. La
desviacin estndar de una proporcin se basa en la distribucin binomial. La estimacin de
p
se
presenta a continuacin.

x/n
=
_
(x/n)[1(x/n)]
n
es equivalente a
p
=
_
(p)(q)
n
donde x = nmero de elementos de la muestra; z = desviacin estndar normal; n = tamao de la
muestra; p = proporcin de la muestra y q =1p. La estimacin de intervalo de p es:
x
n
z
_
(x/n)[1(x/n)]
n
que equivale a p z
_
(p)(q)
n
Error La cantidad de errores de una estimacin equivale simplemente a la mitad de la amplitud del
intervalo de conanza. Por tanto su ecuacin es
e = z
_
pq
n
Los dos factores, z y n, producen exactamente el mismo efecto que en el caso de errores en la
estimacin de medias de poblacin. Es decir, cuanto mayor sea z la conanza, mayor ser el error
posible, y cuanto mayor sea el tamao de muestra, tanto menor ser el error.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 28
Determinacin del tamao de la muestra Uno de los usos ms frecuentes de la frmula del error
es en la determinacin del tamao muestral necesario para obtener un grado de precisin en la
estimacin de proporciones. Despejando n su frmula es
n = z
2
_
pq
e
2
_
Nuevamente, el resultado se debe redondear al entero superior.
1.8.3. Estimacin de la varianza
En los prrafos precedentes se explic que por lo general se necesita una estimacin de la varianza
poblacional
2
antes de poder hacer inferencias respecto a las medias poblacionales. Sin embargo,
en ocasiones el objetivo principal de una investigacin experimental es determinar, precisamente,
la varianza poblacional
2
. Para el investigador esta ltima puede ser ms importante que la media
poblacional. Considere los ejemplos que se dan a continuacin:
Los instrumentos cientcos de medicin deben proporcionar lecturas insesgadas con un muy
pequeo error de medicin. Un altmetro de un avin que mide la altitud correcta promedio no es
muy til si las mediciones que proporciona contienen un error tan grande como 1000 pies arriba
o abajo de la altitud real.
Las partes hechas a mquina en un proceso de fabricacin deben ser producidas con la mnima
variabilidad para reducir el nmero de partes que no dan las medidas correctas y, por tanto, las
piezas defectuosas.
Los exmenes de aptitud se deben disear de modo que las puntuaciones muestren una cantidad
razonable de variabilidad. Por ejemplo, una prueba de 800 puntos no es muy selectiva si todos
los estudiantes obtienen puntuaciones entre 601 y 605 puntos.
Si se toma una muestra de tamao n de una poblacin normal con varianza
2
, y se calcula la varianza
muestral s
2
, se obtiene un valor del estadstico S
2
. Esta varianza muestral calculada se utilizar como
una estimacin puntual de
2
. Por lo que al estadstico S
2
se le denomina estimador de
2
.
Puede establecerse una estimacin de intervalo de
2
utilizando el estadstico:

2
=
(n 1)S
2

2
El estadstico
2
tiene una distribucin ji-cuadrada con n 1 grados de libertad cuando las muestras
se seleccionan a partir de una poblacin normal. Para la muestra aleatoria particular de tamao n se
calcula la varianza muestral s
2
y se obtiene el siguiente intervalo de conanza para
2
.
(n 1)s
2

2
/2
<
2
<
(n 1)s
2

2
1/2
donde
2
/2
y
2
1/2
son los valores de
2
superior e inferior, que localizan una mitad de en cada cola
de la distribucin ji-cuadrada. Supuesto: la muestra se elige al azar de una poblacin normal.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 29
1.9. Estimaciones de dos poblaciones
1.9.1. Estimacin de la diferencia de dos medias
Un problema que es tan importante como la estimacin de una sola media poblacional para una
poblacin cuantitativa es la comparacin de dos medias poblacionales. Es posible que quiera hacer
comparaciones como stas:
Las calicaciones promedio en el examen de admisin de la escuela de medicina para estudiantes
cuya asignatura principal era bioqumica y para los que la asignatura principal era biologa.
Los rendimientos promedio en una planta qumica que utiliza materia prima adquirida con dos
proveedores.
Los dimetros promedio del tallo de plantas cultivadas con dos tipos diferentes de nutrientes.
Para cada uno de estos ejemplos hay dos poblaciones: la primera con media
1
y varianza
2
1
y la
segunda con
2
y varianza
2
2
. Una muestra aleatoria de n
1
mediciones se extrae de la poblacin 1, y
n
2
de la poblacin 2, donde se supone que las muestras fueron extradas de manera independiente
una de otra.
Por ltimo, las estimaciones de los parmetros de la poblacin se calculan de los datos de la muestra
por medio de los estimadores x
1
, s
2
1
, x
2
y s
2
2
.
Propiedades de la distribucin muestral de (x
1
x
2
), la diferencia entre dos medias muestrales
Cuando de poblaciones con medias
1
y
2
y varianzas
2
1
y
2
2
, respectivamente, se han seleccionado
muestras aleatorias independientes de n
1
y n
2
observaciones, la distribucin muestral de la diferencia
( x
1
x
2
) tiene las propiedades siguientes:
1. La media y el error estndar de ( x
1
x
2
) son

( x
1
x
2
)
=
1

2
e =
( x
1
x
2
)
=
_

2
1
n
1
+

2
2
n
2
2. Si las poblaciones muestreadas estn normalmente distribuidas, entonces la distribucin mues-
tral de ( x
1
x
2
) se distribuye de manera exactamente normal, sin importar el tamao de la
muestra.
3. Si las poblaciones muestreadas no se distribuyen normalmente, entonces la distribucin mues-
tral de ( x
1
x
2
) se distribuye de manera aproximadamente normal cuando n
1
y n
2
son grandes,
de acuerdo al teorema de lmite central.
Intervalo de conanza de (1)100% para (
1

2
) para muestras grandes
( x
1
x
2
) z
_

2
1
n
1
+

2
2
n
2
Si no se conocen los valores de
2
1
y
2
2
, se pueden aproximar mediante las varianzas muestrales s
2
1
y
s
2
2
, y el intervalo de conanza aproximado es
( x
1
x
2
) z
_
s
2
1
n
1
+
s
2
2
n
2
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 30
Intervalo de conanza de (1)100% para (
1

2
) para muestras pequeas
Caso 1: Varianzas iguales pero desconocidas
( x
1
x
2
) t
/2
_
s
2
p
_
1
n
1
+
1
n
2
_
donde s
2
p
es la estimacin agrupada de
2
y se calcula con
s
2
p
=
(n
1
1)s
2
1
+ (n
2
1)s
2
2
n
1
+n
2
2
El procedimiento con dos muestras en el que se usa una estimacin agrupada de la varianza comn

2
se sustenta en cuatro supuestos importantes:
Las muestras se deben seleccionar al azar. Las muestras que no se escogen de esta mane-
ra podran introducir un sesgo en el experimento y, por consiguiente, alterar los niveles de
signicacin que se estn informando.
Las muestras deben ser independientes. Si no es as, ste no es el procedimiento estadstico
apropiado.
Las poblaciones de donde obtenga sus muestras deben ser normales. Aunque desviaciones
moderadas de la normalidad no afectan seriamente a la distribucin del estadstico de prueba,
sobre todo si los tamaos de muestra son casi iguales.
Las varianzas poblacionales deben ser iguales o casi iguales para tener la certeza de que los
procedimientos son vlidos.
Caso 2: Varianzas distintas y desconocidas Si las varianzas poblacionales estn lejos de ser iguales, hay
un procedimiento alternativo denominado aproximacin de Satterthwaite para estimar y probar
que se tiene una distribucin T aproximada en el muestreo repetido. Como regla prctica, este
procedimiento es el indicado si la razn de las dos varianzas muestrales
varianza mayor
varianza menor
>3
Como las varianzas poblacionales no son iguales, el estimador agrupado s
p
ya no es apropiado, y para
cada varianza poblacional se debe estimar su correspondiente varianza muestral.
El intervalo es:
( x
1
x
2
) t
/2
_
_
s
2
1
n
1
+
s
2
2
n
2
_
Los grados de libertad para t se aproximan mediante la frmula:
=
_
s
2
1
n
1
+
s
2
2
n
2
_
2
(s
2
1
/n
1
)
2
(n
1
1)
+
(s
2
2
/n
2
)
2
(n
2
1)
El resultado debe redondearse al entero ms cercano.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 31
1.9.2. Estimacin de la diferencia entre dos proporciones
Del mismo modo que la estimacin de una media poblacional condujo a la estimacin de la diferencia
entre dos medias poblacionales, la estimacin de una proporcin poblacional binomial lleva a la
estimacin de la diferencia entre dos proporciones poblacionales binomiales. Tal vez desee hacer
comparaciones como stas:
La proporcin de artculos defectuosos fabricados en dos lneas de produccin.
La proporcin de mujeres votantes y la de hombres votantes que estn a favor de una enmienda
de igualdad de derechos.
Las tasas de germinacin de semillas tratadas y no tratadas con un fungicida.
En estos casos la pregunta por contestar tiene que ver con la diferencia (p
1
p
2
) entre dos proporciones
binomiales basadas en muestras aleatorias extradas de cada una de las dos poblaciones binomiales.
En este caso las poblaciones binomiales tienen los parmetros p
1
y p
2
. Las muestras aleatorias
independientes que consisten en n
1
y n
2
ensayos se extraen de las poblaciones 1 y 2, respectivamente,
y se calculan las estimaciones muestrales p
1
y p
2
. El estimador insesgado de la diferencia (p
1
p
2
) es
la diferencia muestral ( p
1
p
2
).
Propiedades de la distribucin muestral de la diferencia (
^
p
1

^
p
2
) entre dos proporciones mues-
trales Suponga que las muestras aleatorias independientes de n
1
y n
2
observaciones se seleccionaron
de poblaciones binomiales con parmetros p
1
y p
2
, respectivamente. La distribucin muestral de la
diferencia entre las proporciones muestrales
( p
1
p
2
) =
_
x
1
n
1

x
2
n
2
_
tiene estas propiedades:
1. La media y el error estndar de ( p
1
p
2
) son

( p
1
p
2
)
= p
1
p
2
y e =
( p
1
p
2
)
=
_
p
1
q
1
n
1
+
p
2
q
2
n
2
2. La distribucin muestral de ( p
1
p
2
) se puede aproximar mediante una distribucin normal
cuando n
1
y n
2
son grandes, de acuerdo con el teorema del lmite central.
Aunque el rango de una sola proporcin es de 0 a 1, la diferencia entre dos proporciones vara entre
1 y 1. Para aproximar la distribucin de ( p
1
p
2
) por medio de una distribucin muestral, tanto p
1
como p
2
deben ser aproximadamente normales; es decir, n
1
p
1
>5, n
1
q
1
>5, n
2
p
2
>5, n
2
q
2
>5.
Intervalo de conanza de (1)100 % de (p
1
p
2
) para una muestra grande
( p
1
p
2
) z
_
p
1
q
1
n
1
+
p
2
q
2
n
2
Suposicin: n
1
y n
2
deben ser sucientemente grandes para que la distribucin muestral de ( p
1
p
2
)
se pueda aproximar mediante una distribucin norma; a saber, si n
1
p
1
, n
1
q
1
, n
2
p
2
y n
2
q
2
son mayores
que 5.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca
Estadstica 1 Departamento de Ciencias Bsicas 32
1.9.3. Estimacin de la razn de dos varianzas poblacionales
As como a veces una sola varianza poblacional es importante para un investigador, tambin se podra
necesitar comparar dos varianzas poblacionales. Quiz necesite comparar la precisin de un dispositivo
de medicin con la de otro, la estabilidad de un proceso de manufactura con la de otro, o incluso la
variabilidad en el procedimiento que un profesor universitario utiliza para calicar con la de otro.
Una manera de comparar dos varianzas poblacionales,
1
y
2
, es usar la razn de las varianzas
muestrales, s
2
1
/s
2
2
. Si s
2
1
/s
2
2
es casi igual a 1, se encontrar poca evidencia para concluir que
2
1
y
2
2
no
iguales. Por otro lado, un valor muy grande o muy pequeo para s
2
1
/s
2
2
proporciona evidencia de que
las varianzas poblacionales son diferentes.
Intervalo de conanza para
2
1
/
2
2
_
s
2
1
s
2
2
_
1
F

1
,
2
<

2
1

2
2
<
_
s
2
1
s
2
2
_
F

2
,
1
donde
1
= (n
1
1) y
2
= (n
2
1). F

1
,
2
es el valor crtico tabulado de F que corresponde a los grados
de libertad
1
y
2
del numerador y denominador de F, respectivamente, con rea /2 a su derecha.
Supuestos: las muestras se seleccionan al azar y de forma independiente de poblaciones normalmente
distribuidas.
Instituto Tecnolgico de Zacatepec Ing. Nelson Mariaca