You are on page 1of 34

T´ecnicas de Inferencia Estad´ıstica II

Tema 2. Contrastes de hip´ otesis en poblaciones
normales
M. Concepci´on Aus´ın
Universidad Carlos III de Madrid
Grado en Estad´ıstica y Empresa
Curso 2011/12
Tema 2. Contrastes de hip´ otesis en poblaciones normales
Contenidos

Contrastes para una muestra de una poblaci´on normal.

Contrastes para la media con varianza conocida.

Contrastes para la media con varianza desconocida.

Contrastes para la varianza.

Contrastes para dos muestras de dos poblaciones normales
independientes.

Contrastes para la igualdad de varianzas.

Contrastes para la igualdad de medias.

Contrastes para una muestra bivariante de una poblaci´on normal
bivariante (dos muestras no independientes).

Contrastes para la igualdad de medias.

Contrastes para muestras grandes.
Contrastes para una muestra de una poblaci´ on normal
Suponemos una muestra aleatoria simple (X
1
, X
2
, . . . , X
n
) de una
poblaci´on normal, N(µ, σ
2
). Queremos resolver contrastes del tipo:
Bilateral Unilateral Unilateral
por la derecha por la izquierda
H
0
: θ = θ
0
H
0
: θ = θ
0
H
0
: θ = θ
0
H
1
: θ = θ
0
H
1
: θ > θ
0
H
1
: θ < θ
0
donde θ representa el par´ametro de inter´es, que puede ser la media, µ, o
la varianza, σ
2
.

Las regi´on de rechazo se obtiene usando un estad´ıstico de contraste,
que es una medida de discrepancia entre la muestra de datos y la
hip´ otesis nula.

Un estad´ıstico de contraste ser´a cualquier funci´on de la muestra y
del par´ametro especificado en H
0
(con distribuci´on conocida cuando
H
0
es cierta) que permita decidir hasta qu´e punto la muestra de
datos est´a de acuerdo o no con la hip´otesis nula.
Contrastes para la media con varianza conocida
Suponemos primero una muestra aleatoria (X
1
, X
2
, . . . , X
n
) de una
poblaci´on normal, N(µ, σ
2
), con la varianza, σ
2
conocida.
Queremos resolver contrastes para la media del tipo:
H
0
: µ = µ
0
H
1
: µ = µ
0
H
0
: µ = µ
0
H
1
: µ > µ
0
H
0
: µ = µ
0
H
1
: µ < µ
0
El estad´ıstico de contraste en este caso es:
¯
X −µ
0
σ/

n

H
0
N(0, 1)

Este estad´ıstico proporciona una medida de discrepancia entre los
datos y la hip´otesis nula.

Para elegir la regi´on de rechazo, de la hip´otesis nula debemos de
fijar el nivel de significaci´on, α, donde recordamos que:
α = Pr(rechazar H
0
| H
0
cierta)
Contrastes para la media con varianza conocida

H
0
: µ = µ
0
vs H
1
: µ = µ
0

Dados los datos, (x
1
, . . . , x
n
), si

¯ x−µ
0
σ/

n

es grande, se rechazar´a H
0
.

La regi´ on de rechazo es:
R =

¯ x −µ
0
σ/

n

> z
α/2

B
i
o
e
s
t
a
d
í
s
t
i
c
a
C
o
n
t
r
a
s
t
e
s

d
e

h
i
p
ó
t
e
s
i
s
Las regiones de aceptación-rechazo dependen de la hipótesis alternativa, H
1
:
a)
0 1
: θ θ ≠ H . La región de rechazo la forman
las dos colas de la distribución del
estadístico bajo H
0
, ambas con la misma
probabilidad α/2.
α − 1
Aceptación
Rechazo
2
α
Rechazo
2
α

b)
0 1
: θ θ < H . La región de rechazo la forman
la cola inferior de la distribución del
estadístico bajo H
0
, con la probabilidad α.
α − 1
Aceptación
Rechazo
α
c)
0 1
: θ θ > H . La región de rechazo la forman
la cola superior de la distribución del
estadístico bajo H
0
, con la probabilidad α.
α − 1
Aceptación
Rechazo
α

p-valor = 2 Pr

Z >
¯ x−µ
0
σ/

n

Ejemplo 2.1.
Uno de los productos de una empresa es caf´e molido en paquetes de 200
gramos. Se dise˜ na un experimento en el que se pesan con precisi´on el
peso de 15 paquetes, seleccionados aleatoriamente. Los pesos son 208,
206, 210, 199, 202, 196, 198, 209, 211, 204, 206, 197, 196, 203 y 207.
Se supone que el peso de estos paquetes sigue una distribuci´on normal y
que su desviaci´on t´ıpica es conocida (no realista) e igual a 4.5 gramos.

La empresa desea saber si el peso medio de los paquetes es distinto
de los 200 gramos que figuran en la etiqueta. Contrastar dicha
hip´otesis usando el p-valor para α = 0.05 y 0.01.

Construir dos intervalos de confianza al 95 % y al 99 % para el valor
real del peso medio de un paquete de caf´e.
Contrastes para la media con varianza conocida

H
0
: µ = µ
0
vs H
1
: µ > µ
0

Dados los datos, (x
1
, . . . , x
n
), si
¯ x−µ
0
σ/

n
es grande, se rechazar´a H
0
.

La regi´ on de rechazo es:
R =

¯ x −µ
0
σ/

n
> z
α

B
i
o
e
s
t
a
d
í
s
t
i
c
a
C
o
n
t
r
a
s
t
e
s

d
e

h
i
p
ó
t
e
s
i
s
Las regiones de aceptación-rechazo dependen de la hipótesis alternativa, H1:
a)
0 1
: θ θ ≠ H . La región de rechazo la forman
las dos colas de la distribución del
estadístico bajo H0, ambas con la misma
probabilidad α/2.
α − 1
Aceptación
Rechazo
2
α
Rechazo
2
α

b)
0 1
: θ θ < H . La región de rechazo la forman
la cola inferior de la distribución del
estadístico bajo H0, con la probabilidad α.
α − 1
Aceptación
Rechazo
α
c)
0 1
: θ θ > H . La región de rechazo la forman
la cola superior de la distribución del
estadístico bajo H0, con la probabilidad α.
α − 1
Aceptación
Rechazo
α

p-valor = Pr

Z >
¯ x−µ
0
σ/

n

Contrastes para la media con varianza conocida

H
0
: µ = µ
0
vs H
1
: µ < µ
0

Dados los datos, (x
1
, . . . , x
n
), si
¯ x−µ
0
σ/

n
es peque˜ no, se rechazar´a H
0
.

La regi´ on de rechazo es:
R =

¯ x −µ
0
σ/

n
< z
α

B
i
o
e
s
t
a
d
í
s
t
i
c
a
C
o
n
t
r
a
s
t
e
s

d
e

h
i
p
ó
t
e
s
i
s
Las regiones de aceptación-rechazo dependen de la hipótesis alternativa, H1:
a)
0 1
: θ θ ≠ H . La región de rechazo la forman
las dos colas de la distribución del
estadístico bajo H0, ambas con la misma
probabilidad α/2.
α − 1
Aceptación
Rechazo
2
α
Rechazo
2
α

b)
0 1
: θ θ < H . La región de rechazo la forman
la cola inferior de la distribución del
estadístico bajo H0, con la probabilidad α.
α − 1
Aceptación
Rechazo
α
c)
0 1
: θ θ > H . La región de rechazo la forman
la cola superior de la distribución del
estadístico bajo H0, con la probabilidad α.
α − 1
Aceptación
Rechazo
α

p-valor = Pr

Z <
¯ x−µ
0
σ/

n

Ejemplo 2.2.
Uno de los productos de una empresa es caf´e molido en paquetes de 200
gramos. Se dise˜ na un experimento en el que se pesan con precisi´on el
peso de 15 paquetes, seleccionados aleatoriamente. Los pesos son 208,
206, 210, 199, 202, 196, 198, 209, 211, 204, 206, 197, 196, 203 y 207.
Se supone que el peso de estos paquetes sigue una distribuci´on normal y
que su desviaci´on t´ıpica es conocida (no realista) e igual a 4.5 gramos.

A la vista del resultado anterior, la empresa desea saber si el peso
medio de los paquetes es de hecho superior a los 200 gramos que
figuran en la etiqueta. Contrastar dicha hip´otesis usando el p-valor
para α = 0.05 y 0.01.
Contrastes para la media con varianza desconocida
En la pr´actica, la varianza poblacional σ es casi siempre desconocida.
Consideramos ahora el caso para una muestra aleatoria (X
1
, X
2
, . . . , X
n
)
de una poblaci´on normal, N(µ, σ
2
), con la varianza, σ
2
, desconocida.
Queremos resolver contrastes del tipo:
H
0
: µ = µ
0
H
1
: µ = µ
0
H
0
: µ = µ
0
H
1
: µ > µ
0
H
0
: µ = µ
0
H
1
: µ < µ
0
El estad´ıstico de contraste en los tres casos es:
¯
X −µ
0
S/

n

H
0
t
n−1
Gracias a la simetr´ıa de la distrbuci´on t, las regiones de rechazo se
obtienen de manera equivalente a las de los contrastes para la media con
varianza conocida.
Contrastes para la media con varianza desconocida
C´alculo del p-valor

H
0
: µ = µ
0
vs H
1
: µ > µ
0
p-valor = Pr
_
t
n−1
>
¯ x −µ
0
s/

n
_

H
0
: µ = µ
0
vs H
1
: µ < µ
0
p-valor = Pr
_
t
n−1
<
¯ x −µ
0
s/

n
_

H
0
: µ = µ
0
vs H
1
: µ = µ
0
p-valor = 2 Pr
_
t
n−1
>
¯ x −µ
0
s/

n
_
Ejemplo 2.3.
Uno de los productos de una empresa es caf´e molido en paquetes de 200
gramos. Se dise˜ na un experimento en el que se pesan con precisi´on el
peso de 15 paquetes, seleccionados aleatoriamente. Los pesos son 208,
206, 210, 199, 202, 196, 198, 209, 211, 204, 206, 197, 196, 203 y 207.
Se supone que el peso de estos paquetes sigue una distribuci´on normal y
que su desviaci´on t´ıpica es desconocida.

La empresa desea saber si el peso medio de los paquetes es distinto
de los 200 gramos que figuran en la etiqueta y, en ese caso,
averiguar si es superior a 200 gramos. Contrastar dicha hip´otesis
usando el p-valor para α = 0.05 y 0.01.

Construir dos intervalos de confianza al 95 % y al 99 % para el valor
real del peso medio de un paquete de caf´e.
Contrastes para la varianza
Consideramos una muestra aleatoria (X
1
, X
2
, . . . , X
n
) de una poblaci´on
normal, N(µ, σ
2
), con µ, desconocida. Queremos contrastar:
H
0
: σ
2
= σ
2
0
H
1
: σ
2
= σ
2
0
H
0
: σ
2
= σ
2
0
H
1
: σ
2
> σ
2
0
H
0
: σ
2
= σ
2
0
H
1
: σ
2
< σ
2
0
El estad´ıstico de contraste en los tres casos es:
(n −1)S
2
σ
2
0

H
0
χ
2
n−1
Las regiones de rechazo se obtienen de manera equivalente a los casos
anteriores, pero teniendo en cuenta que la distribuci´on χ
2
n−1
es asim´etrica.
Varianza de una poblaci´on normal
Procedimiento

Seleccionamos los valores como
P(χ
2
n−1
≥ χ
2
n−1,1−α/2
) = 1 −α/2, P(χ
2
n−1
≥ χ
2
n−1,α/2
) = α/2

Estos valores cumplen
P(χ
2
n−1,1−α/2
≤ χ
2
n−1
≤ χ
2
n−1,α/2
) = 1 −α
!"# !"# 1-!
$
#
%&'('&!"# $
#
%&'(!"#
Contrastes para la varianza
C´alculo del p-valor

H
0
: σ
2
= σ
2
0
vs H
1
: σ
2
> σ
2
0
p-valor = Pr
_
χ
2
n−1
>
(n −1)s
2
σ
2
0
_

H
0
: σ
2
= σ
2
0
vs H
1
: σ
2
< σ
2
0
p-valor = Pr
_
χ
2
n−1
<
(n −1)s
2
σ
2
0
_

H
0
: σ
2
= σ
2
0
vs H
1
: σ
2
= σ
2
0
p-valor = m´ın
_
2 Pr
_
χ
2
n−1
>
(n −1)s
2
σ
2
0
_
, 2 Pr
_
χ
2
n−1
<
(n −1)s
2
σ
2
0
__
Ejemplo 2.4.
Un inversor quiere saber si la variaci´on del precio de las acciones de una
compa˜ n´ıa este mes ser´a superior a la variaci´on del mes pasado, que fue
de 114.09. Ha observado que la varianza muestral de los precios de los
primeros 10 d´ıas de este mes ha sido igual a 110.2. Asumiendo que los 10
datos pueden considerarse una muestra aleatoria de una poblaci´on
normal, contrastar al 5 % la hip´otesis anterior.
En las siguientes secciones, vamos a abordar problemas en los que
disponemos de dos muestras de poblaciones normales.
Distinguiremos dos casos:

Dos muestras independientes: Suponemos dos muestras aleatorias
simples (X
1
, X
2
, . . . , X
n
) e (Y
1
, Y
2
, . . . , Y
m
) de dos poblaciones
normales independientes:
X ∼ N(µ
1
, σ
2
1
) e Y ∼ N(µ
2
, σ
2
2
).

Una muestra bivariante: Suponemos una muestra bivariante,
{(X
1
, Y
1
), . . . , (X
n
, Y
n
)} de una poblaci´on normal bivariante,
(X, Y) ∼ N
__
µ
1
µ
2
_
,
_
σ
2
1
σ
12
σ
12
σ
2
2
__
.
En el primer caso las variables X e Y son independientes. En el segundo,
X e Y son dependientes (a no ser que σ
12
= 0).
Supondremos siempre que las medias (µ
1
y µ
2
), las varianzas (σ
1
y σ
2
), y
en su caso, la covarianza (σ
12
), son desconocidas.
Ejemplo 2.5.
En los siguientes ejemplos distinguir si se trata de dos muestras
independientes de dos variables X e Y independientes o de una muestra
bivariante de una variable (X, Y) de modo que X e Y puedan ser
dependientes.
1. (X
1
, X
2
, . . . , X
10
) e (Y
1
, Y
2
, . . . , Y
15
) representan los salarios de 10
mujeres y 15 hombres, respectivamente.
2. (X
1
, X
2
, . . . , X
8
) e (Y
1
, Y
2
, . . . , Y
8
) son las calificaciones de 8
estudiantes en matem´aticas y estad´ıstica, respectivamente.
3. (X
1
, X
2
, . . . , X
16
) e (Y
1
, Y
2
, . . . , Y
16
) son las edades de 16 fumadores
y 16 no fumadores.
4. (X
1
, X
2
, . . . , X
20
) e (Y
1
, Y
2
, . . . , Y
20
) representan el n´ umero de
parados en 20 ciudades de dos paises distintos.
5. (X
1
, X
2
, . . . , X
32
) e (Y
1
, Y
2
, . . . , Y
32
) representan el peso de 32
pacientes antes y despu´es de un tratamiento de adelgazamiento.
Contrastes para dos muestras independientes de dos
poblaciones normales
Suponemos ahora la primera situaci´on en la que disponemos de dos
muestras aleatorias simples (X
1
, X
2
, . . . , X
n
) e (Y
1
, Y
2
, . . . , Y
m
) de dos
poblaciones normales, N(µ
1
, σ
2
1
) y N(µ
2
, σ
2
2
), independientes.
Queremos resolver contrastes del tipo:
H
0
: µ
1
= µ
2
H
1
: µ
1
= µ
2
H
0
: µ
1
= µ
2
H
1
: µ
1
> µ
2
H
0
: µ
1
= µ
2
H
1
: µ
1
< µ
2
H
0
: σ
2
1
= σ
2
2
H
1
: σ
2
1
= σ
2
2
H
0
: σ
2
1
= σ
2
2
H
1
: σ
2
1
> σ
2
2
H
0
: σ
2
1
= σ
2
2
H
1
: σ
2
1
< σ
2
2
Contrastes para la igualdad de varianzas
Se tienen dos muestras (X
1
, X
2
, . . . , X
n
) e (Y
1
, Y
2
, . . . , Y
m
) de dos
poblaciones normales e independientes, N(µ
1
, σ
2
1
) y N(µ
2
, σ
2
2
), con
medias, µ
1
y µ
2
, desconocidas.
Queremos resolver contrastes del tipo:
H
0
: σ
2
1
= σ
2
2
H
1
: σ
2
1
= σ
2
2
H
0
: σ
2
1
= σ
2
2
H
1
: σ
2
1
> σ
2
2
H
0
: σ
2
1
= σ
2
2
H
1
: σ
2
1
< σ
2
2
El estad´ıstico de contraste es:
S
2
1
S
2
2

H
0
F
n−1,m−1
Las regiones de rechazo y el c´alculo del p-valor se realiza de manera
an´aloga al contraste para la varianza, teniendo en cuenta que la
distribuci´on de F
n−1,m−1
es asim´etrica.
Ejemplo 2.6.
Se conjetura que las acciones de una compa˜ n´ıa sufrir´ıan m´as variaci´on en
una industria con competencia en precios que en una en la que existiera
un duopolio y colusi´on t´acita.
En un estudio sobre la industria de generadores mediante turbinas de
vapor, se hall´o que en 4 a˜ nos de competencia en precios la variaci´on de
las acciones de la General Electric fue de 114.09. En los siguientes 7
a˜ nos, en los cuales hubo un duopolio y colusi´on t´acita, esta varianza fue
de 16.08.
Asumir que los datos pueden considerarse muestras aleatorias
independientes de dos poblaciones normales y contrastar al 5 % la
conjetura anterior.
Contrastes para la igualdad de medias
Se tienen dos muestras (X
1
, X
2
, . . . , X
n
) e (Y
1
, Y
2
, . . . , Y
m
) de dos
poblaciones normales e independientes, N(µ
1
, σ
2
1
) y N(µ
2
, σ
2
2
), con
varianzas, σ
2
1
y σ
2
2
, desconocidas.
Queremos resolver contrastes del tipo:
H
0
: µ
1
= µ
2
H
1
: µ
1
= µ
2
H
0
: µ
1
= µ
2
H
1
: µ
1
> µ
2
H
0
: µ
1
= µ
2
H
1
: µ
1
< µ
2
Contrastes para la igualdad de medias
Si las varianzas son iguales: σ
2
1
= σ
2
2
El estad´ıstico de contraste es:
¯
X −
¯
Y
_
(n−1)S
2
1
+(m−1)S
2
2
n+m−2
_
1
n
+
1
m

H
0
t
n+m−2
Si las varianzas son distintas: σ
2
1
= σ
2
2
El estad´ıstico de contraste es:
¯
X −
¯
Y
_
S
2
1
n
+
S
2
2
m

H
0
t
f
donde:
f =
_
S
2
1
n
+
S
2
2
m
_
2
1
n−1
_
S
2
1
n
_
2
+
1
m−1
_
S
2
2
m
_
2
Ejemplo 2.7.
De una muestra aleatoria de 12 licenciados en Econ´omicas en una
Universidad p´ ublica, los sueldos de su primer empleo fueron los siguientes
(expresados en miles de d´olares):
26.2, 29.3, 31.3, 28.7, 27.4 , 25.1,
26.0, 27.2, 27.5, 29.8, 32.6, 34.6
De otra muestra aleatoria independiente de 10 licenciados en Econ´omicas
en una Universidad privada los primeros sueldos fueron los siguientes:
25.3, 28.2, 29.2, 27.1, 26.8,
26.5, 30.7, 31.3, 26.3, 24.2
Asumiendo normalidad en los datos, discutir si existen diferencias entre
los sueldos de los licenciados de Universidades p´ ublicas y privadas.
Contrastes para una muestra bivariante de una poblaci´ on
normal bivariante
Consideramos que se tiene una muestra (X
1
, Y
1
), (X
2
, Y
2
), . . . , (X
n
, Y
n
)
de una poblaci´on normal bidimensional:
(X, Y) ∼ N
__
µ
1
µ
2
_
,
_
σ
2
1
σ
12
σ
12
σ
2
2
__
.
Queremos resolver contrastes del tipo:
H
0
: µ
1
= µ
2
H
1
: µ
1
= µ
2
H
0
: µ
1
= µ
2
H
1
: µ
1
> µ
2
H
0
: µ
1
= µ
2
H
1
: µ
1
< µ
2
Contrastes para una muestra bivariante de una poblaci´ on
normal bivariante
Transformamos el problema en otro en el que se tiene una sola muestra
(D
1
= X
1
−Y
1
, D
2
= X
2
−Y
2
, . . . , D
n
= X
n
−Y
n
) de la variable:
D = X −Y ∼ N(µ
D
, σ
2
D
)
donde µ
D
= E[X −Y] = µ
1
−µ
2
.
El problema se convierte en resolver los contrastes:
H
0
: µ
D
= 0
H
1
: µ
D
= 0
H
0
: µ
D
= 0
H
1
: µ
D
> 0
H
0
: µ
D
= 0
H
1
: µ
D
< 0
El estad´ıstico de contraste es:
¯
D
S
D
/

n

H
0
t
n−1
donde S
2
D
es la cuasivarianza muestral de (D
1
, . . . , D
n
).
Ejemplo 2.8.
Antes de lanzar una promoci´on muy agresiva de un cierto producto
dirigida a los hipermercados de grandes superficies, la directora de
marketing de la empresa quiere saber si es o no rentable. Para ello se
seleccionan al azar 5 hipermercados de Madrid para llevar a cabo la
promoci´on y se recogen datos de las ventas en miles de euros antes y
despu´es de la promoci´on. Se supone que las ventas se distribuyen
normalmente.
Antes 102 120 135 114 175
Despu´es 110 125 141 113 182

Contrastar la hip´otesis de que dicha promoci´on sea rentable,
teniendo en cuenta que se trata de datos apareados.

Contrastar la misma hip´otesis, pero asumiendo que son muestras
independientes.

Comparar y explicar las diferencias en los dos apartados anteriores.
Contrastes para muestras grandes: contraste para una
media
Supongamos que se tiene una muestra (X
1
, . . . , X
n
) de una poblaci´on
cualquiera con n grande (n >30).
Aunque la poblaci´on no sea normal, se pueden resolver contrastes para la
media:
H
0
: µ = µ
0
H
1
: µ = µ
0
H
0
: µ = µ
0
H
1
: µ > µ
0
H
0
: µ = µ
0
H
1
: µ < µ
0
utilizando el Teorema Central del L´ımite, que garantiza que:
¯
X −µ
0
S/

n

H
0
N(0, 1)
Ejemplo 2.9.
La vida media de una muestra de 55 tubos fluorescentes producidos por
una empresa es de 1750 horas con una cuasi-desviaci´on t´ıpica de 120
horas. Contrastar la hip´otesis de que la vida media sea distinta de 1600
horas, utilizando un nivel de significaci´on de 0.05.
Contrastes para muestras grandes: contraste para la
igualdad de dos medias
Consideramos ahora que se tienen dos muestras (X
1
, X
2
, . . . , X
n
) e
(Y
1
, Y
2
, . . . , Y
m
) de dos poblaciones no necesariamente normales de
medias µ
1
y µ
2
y varianzas, σ
2
1
y σ
2
2
, resp., tales que n y m sean grandes
(n, m >30).
Aunque las poblaciones no sean normales, se pueden resolver contrastes
para la diferencia de medias:
H
0
: µ
1
= µ
2
H
1
: µ
1
= µ
2
H
0
: µ
1
= µ
2
H
1
: µ
1
> µ
2
H
0
: µ
1
= µ
2
H
1
: µ
1
< µ
2
utilizando el Teorema Central del L´ımite, que garantiza que:
¯
X −
¯
Y
_
S
2
1
n
+
S
2
2
m

H
0
N(0, 1)
Ejemplo 2.10.
El m´etodo MATWES fue dise˜ nado para medir las actitudes hacia las
mujeres ejecutivas. Una puntuaci´on alta indica actitudes negativas hacia
las mujeres ejecutivas. Se conjetura que la actitud hacia las mujeres
ejecutivas cambia en funci´on del sexo.
Para contrastar esta hip´otesis se tomaron muestras aleatorias
independientes de 151 hombres y de 108 mujeres estudiantes de M.B.A.
En el grupo de los hombres se obtuvo una puntuaci´on media de 85.8 con
una desviaci´on t´ıpica de 19.3. En el de mujeres se obtuvo una puntuaci´on
media de 71.5 con una desviaci´on t´ıpica de 12.2.

Plantea el contraste oportuno y resu´elvelo para α = 0.01.

¿C´omo se construir´ıa un intervalo de confianza al 99 % para la
diferencia de puntuaciones medias? ¿contendr´ıa al 0?
Contrastes para muestras grandes: contraste para una
proporci´ on
Consideramos que se tiene una muestra (X
1
, X
2
, . . . , X
n
) con n grande
(n >30) de una poblaci´on Bernouilli, B(1, p):
X =
_
1, con probabilidad p
0, con probabilidad 1 −p
Aunque la poblaci´on no sea normal, se pueden resolver contrastes para la
proporci´ on:
H
0
: p = p
0
H
1
: p = p
0
H
0
: p = p
0
H
1
: p > p
0
H
0
: p = p
0
H
1
: p < p
0
utilizando el Teorema Central del L´ımite, que garantiza que:
ˆ p −p
0
_
p
0
(1−p
0
)
n

H
0
N(0, 1)
donde,
ˆ p =

n
i =1
X
i
n
.
Ejemplo 2.11.
Se trabaja con la hip´otesis de que uno de cada diez varones manifiesta
alg´ un tipo de daltonismo.

Elegidos 400 varones, se detectan 50 dalt´onicos. Con un nivel de
significaci´on del 10 %, ¿se puede rechazar la hip´otesis de partida? ¿se
obtendr´a la misma conclusi´on si el nivel de significaci´on es del 2 %?
Contrastes para muestras grandes: contraste para la
igualdad de dos proporciones
Consideramos ahora que se tiene dos muestras independientes
(X
1
, X
2
, . . . , X
n
) y (Y
1
, Y
2
, . . . , Y
m
) con n y m grandes (n, m >30) de dos
poblaciones Bernouilli, B(1, p
1
) y B(1, p
2
).
Aunque las poblaciones no sean normales, se pueden resolver contrastes
para la diferencia de proporciones:
H
0
: p
1
= p
2
H
1
: p
1
= p
2
H
0
: p
1
= p
2
H
1
: p
1
> p
2
H
0
: p
1
= p
2
H
1
: p
1
< p
2
utilizando el Teorema Central del L´ımite, que garantiza que:
ˆ p
1
− ˆ p
2
_
p
0
(1 −p
0
)
_
1
n
+
1
m
_

H
0
N(0, 1)
donde p
0
= p
1
= p
2
es la proporci´on com´ un bajo H
0
que se estima
mediante:
ˆ p
0
=
nˆ p
1
+ m ˆ p
2
n + m
.
Ejemplo 2.12.
Se quiere determinar si el paro en dos grandes ´areas urbanas del pa´ıs,
como son Madrid y Barcelona, es diferente. Para ello se toman muestras
aleatorias en ambas ciudades, cada una de 500 personas, obteni´endose
que en Madrid 35 estaban desempleadas y en Barcelona 25. ¿Existe
alguna raz´on para creer que las frecuencias de paro en Madrid y
Barcelona son diferentes?

Plantea el contraste oportuno con un nivel de significaci´on del 5 %,
especificando claramente la hip´otesis nula y alternativa que
consideras, as´ı como las hip´otesis de trabajo.