You are on page 1of 21

UNIDAD 5

ESTIMACIN
5.1 DEFINCIN, CLASIFICACIN Y PROPIEDADE S DE LOS ESTIMADORS.
Estimacin de Parmetros.
En la prctica profesional a menudo resulta necesario inferir informacin acerca de una
poblacin mediante el uso de muestras extradas de ella; existen diversos motivos: econmicos,
de tiempo, tamao poblacional, etc.
Recordemos que en la unidad I utilizamos datos muestrales para calcular medidas
estadsticas (media, varianza, etc.); ahora en inferencia estadstica debemos diferenciar entre
clculos obtenidos a partir de una muestra con respecto a los obtenidos a partir de una
poblacin, es por ello que llamaremos parmetros poblacionales () a las estadsticas obtenidas
de una poblacin, y llamaremos estadsticos (E) a las obtenidas a partir de una muestra.
Una parte bsica de dicha inferencia consiste en estimar los valores de los parmetros
de la poblacin (media , varianza 2, etc.) a partir de las estadsticas correspondientes de la
muestra (media , varianza S2, etc) como se explica a continuacin.
Un estimador es una medida estadstica que especifica cmo utilizar los datos de la
muestra para estimar un parmetro desconocido de la poblacin.
Clasificacin:
Puntuales o de punto
Estimadores
Por intervalos de confianza

Si un estimador de un parmetro de la poblacin consiste en un slo valor de una


estadstica, se le conoce como estimador puntual del parmetro.
Propiedades de los estimadores de punto.
Cuando la media de la distribucin muestral de una estadstica es igual al parmetro
que se est estimando de la poblacin, entonces la estadstica se conoce como estimador
insesgado del parmetro; si no sucede as, entonces se denomina estimador sesgado. Ambos
estimadores son puntuales, y sus valores correspondientes se llaman estimaciones insesgadas
o sesgadas respectivamente. Dicho de otra manera, si E es una estadstica cuya distribucin
muestral tiene media E, y el parmetro correspondiente de la poblacin es , se dice que E es
un estimador insesgado de si

130

E =
Por ejemplo, si se cumple = , se dice que es un estimador insesgado de .
Por otra parte, si la estadstica E de la muestra tiende a ser igual al parmetro de la
poblacin a medida que se hace ms grande el tamao de la muestra, entonces la estadstica
recibe el nombre de estimador consistente del parmetro.
Empleando smbolos, si

Lm En
n

Resulta que la estadstica En es un estimador consistente.


Por ejemplo, el promedio aritmtico es un estimador insesgado y consistente de la
media, y la varianza de la muestra es un estimador sesgado y consistente de la varianza de la
poblacin.
Si varias estadsticas tienen distribuciones muestrales con la misma media, se dice que
la estadstica que cuenta con la menor varianza es un estimador eficiente de la media
poblacional, en tanto que las estadsticas restantes se conocen como estimadores ineficientes
del parmetro.
Por ejemplo, cuando las distribuciones muestrales del promedio aritmtico y de la
mediana cuentan con medias que son, en ambos casos, igual a la media de la poblacin. Sin
embargo, la variancia de la distribucin muestral del promedio aritmtico es menor que la de
la distribucin de la mediana, por lo que el promedio aritmtico obtenido de una muestra
aleatoria proporciona un estimador eficiente de la media de la poblacin, en tanto que la
mediana obtenida de la muestra proporciona un estimador ineficiente de dicho parmetro.
Es improbable que incluso el estimador insesgado ms eficaz estime con exactitud el
parmetro poblacional. Es cierto que nuestra precisin aumenta con muestras grandes; pero
no hay razn por la cual deberamos esperar que una estimacin puntual de una muestra dada
sea exactamente igual al parmetro poblacional que se supone estima. Hay muchas situaciones
en que es preferible determinar un intervalo dentro del cual esperaramos encontrar el valor
del parmetro. Tal intervalo se llama intervalo de confianza.

5.2 ESTIMACIN DE INTERVALOS DE CONFIANZA A PARTIR DE UNA MUESTRA.


Mediante la distribucin de muestreo de la medida estadstica usada se definen
intervalos de confianza, que comprenden con alta probabilidad el valor del parmetro
poblacional desconocido.
Sea E una estadstica obtenida de una muestra de tamao n para estimar el valor del
parmetro , y sea E la desviacin estndar (conocida o estimada) de su distribucin muestral.
La probabilidad, 1-, de que el valor de se localice en el intervalo de E-zcE a E+ zcE, donde zc
es una constante, se escribe en la forma
P [E-zc E E + zc E] = 1-

131

Si se fija el valor de 1-, se puede obtener el valor de zc necesario para que se satisfaga
la ecuacin anterior, con lo cual queda definido el intervalo de confianza del parmetro , (E-zc
E, E+zc E), correspondiente al nivel de confianza 1-.
La constante zc que fija el intervalo de confianza se conoce como valor crtico o punto
crtico. Si la distribucin de E es normal, el valor de zc correspondiente a uno de se obtiene de
la tabla de reas bajo la curva normal o de la tabla siguiente:
VALORES DE zc PARA DISTINTOS NIVELES DE CONFIANZA
Nivel de confianza en porcentaje

zc

99.73
99.00
98.00
96.00
95.45
95.00
90.00
80.00
68.27
50.00

3.00
2.58
2.33
2.05
2.00
1.96
1.64
1.28
1.00
0.674

5.2.1 Intervalos de confianza para la media, conocida


Estimacin de intervalos de confianza para la media poblacional, , cuando es
conocida y poblacin distribuida normalmente, o conocida y el tamao de la muestra
mayor de 30.
Los lmites de confianza para la media de una poblacin con variable aleatoria X
asociada estn dados por
x zc x
en donde zc depende del nivel de confianza deseado. Si x tiene distribucin normal, zc puede
obtenerse en forma directa de la tabla anterior. Por ejemplo, los lmites de confianza de 95 y 99
por ciento para estimar la media, , de la poblacin son x 1.96 x y x 2.58 x ,
respectivamente. Al obtener estos lmites hay que usar el valor calculado de x para la muestra
correspondiente.
Entonces, los lmites de confianza para la media de la poblacin quedan dados por

X zc

en caso de que el muestro se haga a partir de una poblacin infinita o de que se efectu con
reemplazo a partir de una poblacin finita, o por

132

zc

Np n
N p 1

si el muestreo es sin reemplazo a partir de una poblacin finita de tamao Np.


Ejemplo
Las mediciones de los dimetros de una muestra aleatoria de 100 tubos de albaal
mostraron una media de 32 cm. Suponiendo una desviacin estndar poblacional es de 2 cm.
Obtnganse los lmites de confianza de
a) 95 por ciento
b) 97 por ciento
para el dimetro medio de todos los tubos.
Solucin:
a) De la tabla, los lmites de confianza del 95% son

-1.96

x 1.96

1.96

32 1.96 (2/ 100 )


32 0.392 cm.
o sea 31.608 y 32.292, Esto significa que con una probabilidad de 95%, el valor de se
encuentra entre 31.608 y 32.392 cm.

31.608 32.392
b) Si Z = zc es tal que el rea bajo la curva normal a la derecha de zc es el 1.5 % del rea total,
entonces el rea entre 0 y zc es 0.5-0.015 =0.485, por lo que de la tabla de rea bajo la curva
normal se obtiene zc = 2.17. Por lo tanto, los lmites de confianza del 97% son:

z
-2.17

2.17

133

x 2.17

32 2.17 (2/ 100 )


32 0.434 cm.
y el intervalo de confianza respectivo es (31.566 cm., 32.434 cm.)
o sea,

31.566 cm. < < 32.434 cm.

Ejemplo
Una muestra aleatoria de 50 calificaciones de cierto examen de admisin tiene un
promedio aritmtico de 72 puntos. Suponiendo desviacin estndar poblacional, = 10, y si el
examen se aplic a 1018 personas, obtener
a) El intervalo de confianza del 95% para la media del total de calificaciones.
b) El tamao de muestra necesario para que el error en la estimacin de la media no
exceda de 2 puntos, considerando el mismo nivel de confianza.
c) El nivel de confianza para que el intervalo 72 1 puntos contenga a la media
poblacional.
Solucin
a) Los datos son los siguientes: x = 72, Zc = 1.96, = 10, Np = 1018 y n = 50,
Como tenemos una poblacin finita, la frmula que se utilizar es la siguiente:

X zc

Np n

N p 1

Sustituyendo:
72 1.96 10

1018 50
50

(1018 1)

72 1.96 (1.4142) (0.9755)


72 2.704
y el intervalo de confianza respectivo es:
69.296 < < 74.704
b. Puesto que el error en la estimacin de la media es para poblacin finita,
Error en la estimacin =

zc

NP n
NP 1

En este caso se tendra

zc

NP n
2
NP 1
134

o sea, para un nivel de confianza de 95%,


1.96

19.6
n

1018 n
2
1018 1

10
n

1018 n
2
1018 1

Elevando al cuadrado la desigualdad, queda

384.16 1018 n
4

n 1017
o sea
n 87.85
por lo cual, se requieren al menos 88 elementos en la muestra para que el error en la estimacin
no exceda de 2 puntos, para 1- = 0.95.
Lo anterior nos indica que si deseamos disminuir el error de estimacin debemos
aumentar el tamao de la muestra.
c) Los lmites de confianza son, en este caso
72 zc

10
50

1018 50
1018 1

72 zc (1.4142) (0.9755)
o sea
72 1.3795 zc
Puesto que se desea que el valor de la media sea 72 1 puntos, se verifica que
1= 1.3795 zc
es decir
zc =

1
= 0.725
1.3795

El rea bajo la curva normal estndar entre 0 y zc = 0.725 es, por interpolacin lineal,
igual a 0.2657. Por lo tanto, el nivel de confianza es igual al doble del rea anterior, es decir,
2(0.2657) = 0.5314 (o 53.14%), tal como se muestra en la figura
f(z)

z
0.725

135

Se puede observar que si deseamos disminuir el error de estimacin sin aumentar el


tamao de la muestra, entonces el nivel de confianza disminuye, o sea, la probabilidad o
confianza de que el valor poblacional se encuentre en el intervalo disminuye.
Cuando la desviacin estndar poblacional sea desconocida y el tamao de la muestra
n 30, podemos usar estas mismas frmulas sustituyendo el valor de por la desviacin
estndar muestral, S, ya que es un estimador puntual consistente de . Sin embargo, hay que
considerar que el resultado obtenido es slo una aproximacin.
Ejemplo
Se seleccion una muestra aleatoria de 50 ingenieros de entre un gran nmero
empleado por una corporacin cuya lnea es la exploracin petrolera. Para cada ingeniero se
determinaron las horas trabajadas en una semana determinada. Estos datos tuvieron un
promedio de 46 y una desviacin estndar de 3 horas. Para esa semana determinada, estimar
las horas promedio trabajadas por todos los ingenieros de esa corporacin con un coeficiente
de confianza igual a 95%.
Datos:
= 50; =3 horas; = 46; 1- = 95%;
es desconocida
Sin embargo, es vlido utilizar la frmula con la distribucin normal x zc

sustituyendo el valor de por s, la desviacin estndar muestral, ya que es un estimador


puntual consistente de , pues conforme aumenta el tamao de la muestra ms se aproxima s
al valor de . Como veremos ms adelante, cuando es desconocida y n 30 corresponde
seleccionar la distribucin t de Student, sin embargo, con la distribucin normal obtenemos un
resultado aproximado.
Solucin
El valor crtico para un nivel de confianza de 95% es como sigue
f(z)

z
-1.96

x zc

46 1.96

3
50

136

1.96

46 0.8315
45.1685 < < 46.8315

5.2.2 Intervalo de confianza para la media poblacional, es desconocida


Intervalo de confianza para la media poblacional, , cuando es desconocida y la
poblacin distribuida normalmente, o desconocida y n 30.
Para estos casos se utilizar la distribucin t de student con n 1 grados de libertad.
El intervalo de confianza para con nivel de confianza 1- es como sigue:

x tc

S
n 1

Ejemplo
Un da al azar se toma una muestra aleatoria de 10 varillas de la produccin de una
laminadora, al probarlas a la tensin hasta la ruptura se obtiene una resistencia media de 4800
kg./cm.2, con una desviacin estndar de 200 kg. /cm.2. Con un nivel de confianza del 95%,
estime la resistencia media de las varillas producidas el da que se tom la muestra. Considere
que la variable poblacional resistencia tiene distribucin normal.
Solucin.-

n = 10 x 4800kg / cm 2

S = 200 kg. /cm.2

1- = 95%

Se desconoce la desviacin estndar poblacional, , y la poblacin est distribuida


normalmente, por lo que usaremos la distribucin t de student para estimar el promedio
poblacional, .
Se estima que la media de la poblacin queda comprendida entre los lmites
siguientes:

x tc

S
x tc
n 1

S
n 1

con = n-1 grados de libertad.


En este caso los valores de t para el 95% de nivel de confianza y 9 grados de libertad
son t = -2.26 y t = 2.26, en la siguiente figura se detalla esta situacin.

f(t)

t
-2.26

2.26

Sustituyendo valores se tiene

137

4800 2.26

200
200
4800 2.26
10 1
10 1

4649.4 4950.6

5.2.3 Intervalo de confianza para la proporcin


Intervalo de confianza para la proporcin poblacional, P, en muestras grandes (n30).
La fraccin observada de xitos, o la proporcin de xitos en la muestra,

x
, es la que se usa
n

como estimacin de P y se representa mediante p .


El intervalo

p z c

p 1 p
n

es la representacin de un intervalo de confianza de muestra grande para P con coeficiente


confianza aproximadamente igual a 1-.
Ejemplo.
Una inspeccin cuidadosa de 70 soportes de concreto precolado que se ha de usar en
una construccin, revel que 28 estaban fisurados. Estimar la proporcin verdadera de
soportes de este tipo con fisuras, en un intervalo de confianza del 98%.
Solucin.-

p z c

n = 70 x = 28 1- = 98%

p 1 p
n

Sustituyendo:

x 28

0.4
n 70

0.40.6
70
0.4 0.1364 o sea 0.2635 < P < 0.5364
0.4 2.33

5.2.4 Intervalo de confianza para la varianza.


Si X1,..., Xn denotan una muestra aleatoria proveniente de una distribucin normal,
entonces

(n 1) S 2

22

(n 1) S 2

12

es una representacin de un intervalo de confianza para 2 con nivel de confianza igual


a
1-. Se utiliza la distribucin Ji cuadrada con = n-1 grados de libertad.
138

Distribucin Ji cuadrada, 2
f(
f(

)
)

90%
1-

1.145
11.071
Ejemplo
Se ha observado durante 20 das que una lnea de ensamble de una fbrica, tiene una
desviacin estndar de 30 minutos al realizar el proceso de ensamble. Estime con un nivel de
confianza del 90% la desviacin estndar del proceso durante un ao.
Solucin.
n = 20,
S = 30 minutos
= n 1 = 20 -1 = 19
Se tiene que los lmites del intervalo de confianza para la varianza poblacional 2 est dado por

(n 1) S 2

22

(n 1) S 2

12

Los valores crticos se obtienen en la tabla al entrar con el valor de y el rea correspondiente,
como se ve en la siguiente figura:

f(

90%
5%

5%

10.1

Sustituyendo

30.1

(20 1)(30) 2
(20 1)(30) 2
2
30.1
10.1

Entonces la varianza poblacional est comprendida entre los dos siguientes valores:

568.10 2 1693.07
y si lo que se desea estimar es la desviacin estndar, , entonces

139

568.10 1693.07
o sea

23.83 < < 41.15

5.3 ESTIMACIN DE INTERVALO DE CONFIANZA A PARTIR DE DOS MUESTRAS


5.3.1 Intervalo de confianza para diferencia de medias, conocidas
Intervalo de confianza para diferencia de medias poblacionales, x y , cuando las
desviaciones estndar poblacionales, x y y son conocidas y poblaciones distribuidas
normalmente, o, x y y conocidas y tamaos de muestras mayores o iguales a 30.
Considerando que las muestras aleatorias seleccionadas son independientes, los lmites
de confianza para la diferencia de las medias cuando las poblaciones X y Y son infinitas, o
cuando el muestreo se realiza con reemplazo de poblaciones finitas, se encuentran dados por:
x - y zc x y

x - y zc

X2
nX

Y 2
nY

en donde x , nx y y , ny son los respectivos promedios aritmticos y tamaos de las dos


muestras extradas de las poblaciones, y X y Y las desviaciones estndar de estas ltimas.
En el caso de que las poblaciones X y Y sean finitas y el muestreo sin reemplazo, los
limites de confianza son
x - y zc x y

x y zc

X 2 N X nX
nX

N X 1

Y 2 N Y nY
nY

NY 1

en donde NX y NY son los tamaos de las poblaciones X y Y, respectivamente.


Ejemplo
Se toman muestras aleatorias de 100 varillas de acero que se fabrican en las compaas
A y B. De la muestra de la compaa A se obtiene un peso medio de 6.5 kg., asimismo, la muestra
de la compaa B indica un peso medio de 6.3 kg. Considerando que las desviaciones estndar
poblacionales de ambas compaas son A = 0.4 kg. y B = 0.3 kg. encontrar el intervalo de
confianza del 95.45% para la diferencia de las medias poblacionales.
Solucin
nA = nB = 100 x A 6.5

A = 0.4 kg x B 6.3

B = 0.3 kg.

Los lmites de confianza para la diferencia de las medias son:

140

1 95.45%

x A xB zc
6.5 6.3 2

A2
nA

B2
nB

0.42 0.32
100

100

0.2 0.1
por lo tanto el intervalo de confianza respectivo es:

0.1 A B 0.3
Cuando las desviaciones estndar poblacionales sean desconocidas y los
tamaos de las muestras mayores o iguales a 30, podemos usar estas mismas frmulas
sustituyendo los valores de por las desviaciones estndar muestrales , ya que stas
son estimadores puntuales consistentes de . Sin embargo, hay que considerar que el
resultado obtenido es slo una aproximacin.
5.3.2 Intervalo de confianza para la diferencia de medias, desconocidas
Intervalo de confianza para la diferencia de medias poblacionales, x y , cuando las
desviaciones estndar poblacionales son desconocidas y poblaciones distribuidas
normalmente, o, desviaciones estndar poblacionales desconocidas y muestras mayores o
iguales a 30. Considerando 12 22 .
Si x1 y x 2 son las medias de muestras aleatorias independientes de tamao n1 y n2
respectivamente, de poblaciones aproximadamente normales con varianzas poblacionales
iguales pero desconocidas, 12 22 , un intervalo de confianza de 1- para 1 2 es:

( x1 x2 ) t / 2 S p

1
1
1
1

1 2 ( x1 x2 ) t / 2 S p

n1 n2
n1 n2

Donde Sp es la estimacin comn de la desviacin estndar poblacional y t/2 es el valor


t con n1 n2 2 grados de libertad.
Una estimacin puntual de la variable comn desconocida puede obtenerse
2

combinando las varianzas muestrales. Al representar el estimador de ambas con S p2 se escribe:

S p2
Por consiguiente

(n1 1) S12 (n2 1) S 22


n1 n2 2

S p S p2

141

Ejemplo
Se deben eliminar gases cidos de otros gases de refinera en una instalacin de
productos qumicos para reducir al mnimo la corrosin de las plantas. Dos mtodos para
eliminar estos gases produjeron el ritmo de corrosin (mm./ao) que se representan a
continuacin:
Mtodo A: 0.3, 0.7, 0.5, 0.8, 0.9, 0.7, 0.8
Mtodo B: 0.7, 0.8, 0.7 0.6, 2.1, 0.6, 1.4, 2.3
Estimar la diferencia entre el ritmo promedio de corrosin para los dos mtodos, con
un coeficiente de confianza de 0.90. Qu hiptesis se deben hacer para que sea vlida la
respuesta?
Solucin.

x A 0.6714 S A2 0.0424

x B 1.15

S p2

nA = 7

1- = 90%

.10 y / 2 .05

S B2 0.4886 nB = 8

(n A 1) S A2 (n B 1) S B2 (7 1)(0.0424) (8 1)(0.4886)

0.2827
n A nB 2
782

S p 0.2827 0.5316
El intervalo de confianza para la diferencia de medias poblacionales A B est dado
por:

( x A x B ) t / 2 S p

1
1
1
1

A B ( x A x B ) t / 2 S p

n A nB
n A nB
f(t)

t
-1.77

1.77

Al entrar a la tabla de distribucin t de student con n1 n2 2 7 8 2 13 y t / 2 t.05


obtenemos 1.771 que es el valor crtico.
Sustituyendo tenemos:

(0.6714 1.15) 1.771(0.5316)

1 1
1 1
A B (0.6714 1.15) 1.77(0.5316)

7 8
7 8

142

0.4786 0.4869784 A B 0.4786 0.4869784


0.9656 A B 0.0083784
Como el lmite inferior tiene signo negativo y el lmite superior tiene signo positivo, el
cero est incluido dentro del intervalo. En estos casos se considera que no existe una diferencia
significativa entre los promedios de los dos mtodos.
Las hiptesis que deben hacerse para considerar vlida esta respuesta son:
Las variables aleatorias provienen de distribuciones normales independientes.

Las variables aleatorias tienen varianza comn, o sea 12 22 .

Intervalo de confianza para la diferencia de medias poblacionales, x y , cuando las


desviaciones estndar poblacionales son desconocidas y poblaciones distribuidas
normalmente, o, desviaciones estndar poblacionales desconocidas y muestras mayores o
iguales a 30. Considerando 12 22 .
Si x1 y S12 , y x 2 y S 22 son las medias y las varianzas de muestras pequeas
independientes de tamao n1 y n 2 respectivamente, de distribuciones aproximadamente
normales con varianzas diferentes y desconocidas, un intervalo de confianza de 1- para
1 2 est dado por:

( x1 x 2 ) t / 2

S12 S 22

n1 n2

donde t / 2 es el valor t con,

S12 S 22

n1 n2
2

S
S


n1 n2
n1 1 n2 1
2
1

2
2

Grados de libertad.

Ejemplo
Puede tomarse un curso con crdito ya sea asistiendo a sesiones de clases en horas y
das fijos, o haciendo sesiones en lnea que el estudiante puede hacer a su propio paso y en los
tiempos que el estudiante escoja. El coordinador del curso desea determinar si estos dos das
de tomar el curso resultaron en una diferencia significativa en rendimiento medido por el
examen final para el curso. La siguiente informacin da las calificaciones en un examen con 45
puntos posibles para un grupo de nL= 9 estudiantes que tomaron el curso en lnea y un segundo
grupo de nC = 9 estudiantes que tomaron el curso de clases convencionales. Estos datos
presentan suficiente evidencia para indicar que existe diferencia significativa entre las

143

calificaciones para estudiantes que tomaron el curso en lnea y las de quienes asistieron a una
clase convencional? Calcular el intervalo con un nivel de confianza de 95%. Considere que la
variable calificaciones tiene distribucin normal y que 2 2 .
Calificaciones
En lnea

Saln de
clase

32
37
35
28
41
44
35
31
34

35
31
29
25
34
40
27
32
31

Con los datos muestrales de la tabla anterior se calcularon los siguientes estadsticos:

En lnea
=35.22
2 = 24.44

Saln de clase
= 31.56
2 = 20.03

Como las desviaciones estndar poblacionales son desconocidas y diferentes, asimismo,


la variable calificaciones tiene distribucin aproximadamente normal, entonces se utilizar la
distribucin t de Student con las siguientes frmulas:

( x1 x 2 ) t / 2

S12 S 22

n1 n2

S12 S 22

n1 n2

S12
S 22


n1 n2
n1 1 n2 1
2

24.44 20.03

9
9

15.84
Sustituyendo:
2
2
24.44
20.03

9 9
8
8
Se toma la parte entera de este resultado, o sea, = 15
Con el valor de y con el rea en dos colas = 0.05 entramos a la tabla t de Student y
obtenemos el valor crtico 2.131

144

Sustituyendo para obtener el intervalo tenemos:

(35.22 31.56) 2.131

24.44 20.03

9
9

3.66 4.7368
El intervalo de confianza queda como sigue
-1.076 < < 8.396
Como el cero est incluido en el intervalo podemos concluir que no existe diferencia
significativa entre el promedio de calificaciones del curso en lnea y el del saln de clase, con un
nivel de confianza de 95%.

5.3.3 Intervalo de confianza para diferencia de proporciones


Intervalo de confianza para diferencia de proporciones poblacionales P1 P2 , con
muestras mayores o iguales a 30.
Considrese el problema en el cual se desea estimar la diferencia entre dos parmetros
binomiales P1 P2 . Por ejemplo, se podra hacer que P1 representara la proporcin de
fumadores con problemas de cncer en los pulmones y P2 la proporcin de no fumadores con
el mismo padecimiento. La dificultad, entonces, consiste en estimar la diferencia entre estas dos
proporciones. Primero, se seleccionan muestras aleatorias independientes de tamao n1 y n2
de las dos poblaciones Bernoulli con parmetros 1 2 , medias n1 p1 y n2 p 2 , y varianzas

n1 p1 q1 y n2 p 2 q 2 , respectivamente, entonces se determinan los nmeros x1 y x 2 de personas


en cada muestra con cncer en los pulmones y se forman las proporciones muestrales p 1
y p 2

x1
n1

x2
. Un estimador puntual de la diferencia entre las dos proporciones, p1 p 2 , est
n2

dado por el estadstico p 1 p 2 . Por lo tanto, la diferencia entre las proporciones muestrales,

p 1 p 2 , se utilizar como estimacin puntual de P1 P2 a la que se sumar y restar un error


de estimacin y as establecer el siguiente intervalo de confianza:

( p 1 p 2 ) z / 2

p 1q1 p 2 q 2

p1 p 2 ( p 1 p 2 ) z / 2
n1
n2

donde q 1 p .

Ejemplo

145

p 1q1 p 2 q 2

n1
n2

Se est considerando cambiar el procedimiento de manufactura de partes. Se toman


muestras tanto del procedimiento actual como del nuevo para determinar si este ltimo resulta
mejor. Si 75 de 1500 artculos del procedimiento actual presentaron defectos y lo mismo
sucedi con 80 de 2000 partes del nuevo procedimiento, determine un intervalo de confianza
del 90% para la diferencia real de las fracciones de partes defectuosas entre los dos procesos.
Solucin
Sean PA y PN las proporciones reales de partes defectuosas para los procedimientos
actual y nuevo, respectivamente. De aqu que p A

75
80
0.05 y p N
0.04 , y la
1500
2000

estimacin puntual p A p N 0.05 0.04 0.01


Al utilizar la tabla de la distribucin normal se encuentra que z / 2 z.05 1.645
Por lo tanto, al sustituir en la frmula, se obtiene el intervalo de confianza de 90%:
(0.05 0.04) 1.645

(0.05)(0.95) (0.06)(0.94)
(0.05)(0.95) (0.04)(0.96)

p1 p 2 (0.05 0.04) 1.645

1500
2000
1500
2000

el cual se simplifica a,

0.0017 PA PN 0.0217
Dado que el intervalo contiene el valor cero, no hay razn para creer que el nuevo
procedimiento ocasion una disminucin significativa en la proporcin de partes defectuosas
con respecto al mtodo actual.

EJERCICIOS
1. Cules son las caractersticas de un buen estimador puntual?
2. Consideras que la desviacin estndar muestral es un estimador consistente de la
desviacin estndar poblacional? Por qu?
3. Explique lo que significa margen de error en estimacin puntual.
4. En la siguiente grfica se presentan las distribuciones muestrales para dos estimadores
insesgados, una con una varianza pequea (A) y la otra con una varianza ms grande (B).

146

Verdadero valor
del parmetro
a) Cul de las dos distribuciones asegura que, con una alta probabilidad, una estimacin
puntual caer cerca del valor verdadero del parmetro?
b) Cmo se llama la caracterstica deseable en un estimador, que se describe en el
ejercicio anterior?
5. En determinados estudios de la calidad del agua es importante verificar la presencia o
ausencia de varios tipos de microorganismos. Supongamos que 30 muestras de 100
seleccionadas al azar muestran la presencia de un determinado microorganismo. Estimar la
probabilidad verdadera P de encontrar este microorganismo en una muestra de este mismo
volumen, con un intervalo de confianza de 90%.
6.- La agencia de proteccin ambiental ha reunido datos de mediciones de DL50 (dosis letal, es
decir, mata al 50% de los animales de prueba en un determinado intervalo de tiempo) para
determinadas sustancias qumicas que se encuentran probablemente en ros y lagos de agua
dulce. Para determinada especie de pescado, las mediciones de DL50 para el DDT en 12
experimentos dieron los siguientes resultados: 16, 5, 21, 19, 10, 5, 8, 2, 7, 2, 4, 9 (las mediciones
estn en partes por milln). Suponiendo que estas determinaciones de DL50 tienen una
distribucin aproximadamente normal, estimar la DL50 promedio real para el DDT con un
coeficiente de confianza igual a 90%.
7. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la
variabilidad de los resultados que producen muestras estndar. En un estudio de la cantidad de
calcio en el agua potable, el cual se efecta como parte del control de calidad de un agua, se
analiz seis veces la misma muestra en el laboratorio en intervalos aleatorios. Los seis
resultados, en partes por milln fueron 9.54, 9.61, 932, 9.48, 9.70, 9.26. Estimar la varianza de
los resultados de la poblacin para este estndar, usando un intervalo de confianza de 90%.

147

8. Al producir resistores, la variabilidad de las resistencias es una cantidad importante porque


refleja la estabilidad del proceso de manufactura. Estimar la varianza verdadera de las
mediciones de resistencia, en un intervalo de confianza de 90%, si una muestra de 15 resistores
present resistencias con una desviacin estndar igual a 0.5 ohms.
9. Un rea en la que los errores de ingeniera son crticos es la construccin de presas. Cun
grande se necesita que sea una muestra para estimar el porcentaje de presas que necesita
reparacin inmediata a no ms de un punto porcentual de error de estimacin con un nivel de
confianza de 90%?
10. Una cisterna abastece de agua a una zona urbana, recibe segn las observaciones diarias de
los ltimos 30 das una media de 100 m3/da, con una desviacin estndar de 12 m3/da.
Simultneamente se observ que el consumo de agua tiene una media de 90 m 3/da, con una
desviacin estndar de 16 m3/da. Estime con un nivel de confianza del 99% la diferencia media
que existe entre el abasto y el consumo. Suponga 2 = 2 .
11.- Las obleas de silicio se almacenan y despus se parten en muchos microchips que se
montarn en los circuitos. Se comparan dos mtodos de ruptura. De 400 microchips partidos
con el mtodo A, ya no se pueden utilizar 32 debido a grietas. De 400 microchips partidos con
el mtodo B, slo 28 son intiles. Estimar la diferencia entre las proporciones de microchips
mal partidos con respecto a los dos mtodos de ruptura. Usar un coeficiente de confianza igual
a 0.95. Cul mtodo considera mejor?
12.- En un experimento que se rese en Popular Science en 1981, se comparaban las
economas de combustible para dos tipos de minivehculos diesel equipados en forma similar.
Se supone que se utilizaron 12 automviles Volkswagen y 10 Toyota en pruebas a velocidad fija
de 90 km/hr. Si para los doce Volkswagen se obtuvo un promedio de 16 km/litro con una
desviacin estndar de 1.0 km/litro y para los 10 Toyota aqul fue de 11 km/litro, con una
desviacin estndar de 1.8 km/litro, calcule un intervalo de confianza de 90% para la diferencia
entre los kilmetros promedio por litro de estos dos miniautomviles. Asuma que las distancias
por litro para cada modelo de vehculo se distribuyen aproximadamente en forma normal con
varianzas poblacionales iguales.
13. Se realiza un estudio de comparacin del tiempo total de impresin de diversas tareas, en
segundos, con dos marcas de impresora lser. Los datos siguientes corresponden a la impresin
de grficos.

148

Tarea

Tiempo de la marca 1

Tiempo de la marca 2

21.8

36.5

22.6

35.2

21.0

36.2

19.7

34.0

21.9

36.4

21.6

36.1

22.5

37.5

23.1

38.0

22.2

36.3

10

20.1

35.9

11

21.4

35.7

12

20.5

34.9

13

22.7

37.1

14

20.5

34.2

15

21.3

35.4

a) Determine un intervalo de confianza de 95% para la diferencia promedio en los tiempos


de impresin.
b) Le sorprendera la afirmacin de que las dos impresoras son igualmente rpidas en la
impresin de grficos? Explique su respuesta.

Suponga que las variables poblacionales, tiempo de impresin, tienen distribucin


aproximadamente normal y varianzas iguales.
14. Se midi el nmero de ciclos hasta el colapso de vigas de concreto armado, tanto en agua
de mar como en aire. Los resultados, en miles, fueron los siguientes:
Agua de mar: 774, 633, 477, 268, 407, 576, 659, 963, 193
Aire: 734, 571, 520, 792, 773, 276, 411, 500, 672
Estimar la diferencia entre los ciclos promedio antes del colapso en agua de mar y aire, usando
un coeficiente de confianza igual a 0.95. En el agua de mar, disminuye el nmero de ciclos antes
del colapso?

149

BILBIOGRAFA
1. Mendenhall/Beaver/Beaver, (2010). Introduccin a la Probabilidad y Estadstica, Dcimo
Tercera Edicin, Editorial Cengage Learning, Mxico.
2. Jay L. Devore, Probabilidad y Estadstica para Ingeniera y Ciencias, (2008). Sptima Edicin,
Editorial Cengage Learning, Mxico.
3. Irwin Miller, John E. Freund, (2008). Probabilidad y Estadstica para Ingenieros, Editorial
Revert S.A. de C.V., Espaa.
4. Triola Mario F., (2009). Estadstica, Dcima edicin, Editorial Pearson Addison Wesley,
Mxico.
5. Walpole/Myers/Myers/Ye, (2007). Probabilidad y Estadstica para Ingeniera y Ciencias,
Octava Edicin, Editorial Pearson Prentice Hall, Mxico.

150