You are on page 1of 51

PRUEBA DE

HIPTESIS
OBJETIVO: Determinar la validez de
supuestos poblacionales a partir del mtodo
de prueba de hiptesis para una, dos, tres o
ms poblaciones.
CONCEPTOS BSICOS
La prueba de hiptesis comienza con una suposicin,
denominada hiptesis, que hacemos entorno a un
parmetro de la poblacin. Reunimos datos
mustrales, producimos estadsticos de la muestra y
con esta informacin decidimos la probabilidad de
que el parmetro supuesto de la poblacin sea
correcto. Por ejemplo, suponemos cierto valor de una
media de la poblacin. Para verificar la validez de la
suposicin, obtenemos los datos mustrales y
determinamos la diferencia entre el valor supuesto y el
valor real de la media muestral. A continuacin
juzgamos si la diferencia es significativa. Cuanto
menos sea la diferencia, mayores probabilidades
habr de que sea correcto el valor supuesto de la
media. Y a una diferencia ms amplia corresponder
una probabilidad menor.
No podemos aceptar ni rechazar una hiptesis referente
a un parmetro de la poblacin por mera intuicin. Por
el contrario, necesitamos aprender a decidir con
objetividad, basndonos en la informacin de la
muestra, si aceptamos o rechazamos un
presentimiento.
a) Hiptesis
Se debe formular el supuesto valor del parmetro de la poblacin
antes de empezar el muestreo. La suposicin que se desea
probar, se denomina hiptesis nula y se representa por H
0
. Si se
rechaza la hiptesis nula, la conclusin que debemos aceptar se
llama hiptesis alternativa y se simboliza por H
1
.
Supongamos que se quiere probar la hiptesis de que el promedio de
calificacin de los alumnos de cierta Universidad es de 8.5,
entonces:

H
0
: = 8.5 Establece que la media de la poblacin es igual a 8.5

La hiptesis alternativa se puede interpretar de tres maneras:

H
1
: = 8.5 Establece que la media de la poblacin no es igual a 8.5.
H
1
: > 8.5 Establece que la media de la poblacin es mayor que 8.5.
H
1
: < 8.5 Establece que la media de la poblacin es menor que 8.5.

La prueba de hiptesis tiene como finalidad emitir un juicio sobre la
diferencia que existe entre el valor calculado del estadstico
muestral y el parmetro supuesto de la poblacin. No consiste en
poner en duda el valor calculado del estadstico muestral.
Despus de formular las hiptesis nula y alternativa, se debe decidir
el criterio que se va a aplicar para aceptar o rechazar la primera.
b) Nivel de significancia
Supongamos que la media de
calificaciones del ejemplo anterior de
8.5, se expresa con un nivel de
confianza del 95%, entonces el nivel
de significancia ser de 0.05, es
decir:
o = 1 0.95
Entonces: o = 0.05 Que representa el
nivel de significancia.
Se puede comprender mejor
observando la grfica siguiente:
El nivel de significancia est repartido en las
zonas de rechazo, 0.025 + 0.025 = 0.05,
significa que existe una diferencia
significativa entre el estadstico de la
muestra y el supuesto parmetro de la
poblacin, es decir, que si esto se
demuestra, se rechaza la hiptesis nula H
0

de que el promedio de la poblacin sea de
8.5 y se acepta la hiptesis alternativa H
1
.
Entonces se concluira que el promedio de
las calificaciones de la poblacin, no es de
8.5, puede se diferente, mayor o menor de
8.5.
El nivel de significancia representa la zona
de rechazo de la hiptesis nula y el nivel
de confianza la zona de aceptacin.
c) Seleccin de un nivel de
significancia
No hay un nivel de significancia que
sea oficial o universal con el cual
probar las hiptesis. Pero la eleccin
del criterio mnimo de una
probabilidad aceptable, o nivel de
significancia, es asimismo el riesgo
que se corre de rechazar una
hiptesis nula aunque sea
verdadera. Cuando ms alto sea el
nivel de significancia que utilizamos
al probar una hiptesis, mayores
probabilidades habr de rechazar
una hiptesis nula que sea
verdadera.
d) Errores de tipo I y II
Si se rechaza una hiptesis nula que sea verdadera es
un error de tipo I, y su probabilidad se representa con
o. Si se acepta una hiptesis nula que sea falsa se
llama error de tipo II, y su probabilidad se representa
con |. La probabilidad de cometer uno de estos
errores se reduce si se aumenta la probabilidad de
incurrir en otro tipo de error. A fin de conseguir una |
baja, habremos de conformarnos con una o alta. Para
sortear esto en situaciones personales y
profesionales, los encargados de tomar decisiones
eligen el nivel apropiado de significancia examinando
los costos o castigos que conllevan a ambos tipos de
error.
Por ejemplo: supngase que el cometer un error de tipo I
implica el tiempo y el trabajo de reelaborar un lote de
sustancias qumicas que debera haber sido aceptado.
En cambio, el incurrir en un error de tipo II significa
correr el riesgo de que se envenene un grupo entero
de usuarios de la sustancia. La gerencia de esta
compaa preferira el error de tipo I al de tipo II y, en
consecuencia, establecera niveles muy elevados de
significancia en sus pruebas para conseguir | bajas.
e) Pasos para seleccionar la
distribucin correcta
1.- Se define el nivel de significancia a usar.
2.- Determinar la distribucin adecuada de
probabilidad: puede ser la distribucin
normal o la distribucin t. Las reglas para
elegir la distribucin apropiada al
efectuar pruebas de las medias son:
a. Si la muestra tomada es mayor de 30
(muestras grandes), debe elegirse la
distribucin normal (Z).
b. Si la muestra tomada es igual o menor
que 30 (muestras pequeas), debe
elegirse la distribucin t.
PRUEBA DE HIPTESIS DE LAS
MEDIAS DE MUESTRAS GRANDES
Realizaremos algunos
ejemplos, en diferentes
condiciones cuando se
conocen las desviaciones
estndar de la poblacin.
a) Prueba de dos extremos para las
medias
Es cuando el nivel de significancia
(zona de rechazo) abarca los
dos extremos o colas de la
campana de Gauss.
Ejemplo 1.-
El fabricante de una llanta especial para
camiones afirma que la duracin media de
la parte rodante de agarre es de 60,000 mi.
La desviacin estndar de los millajes es
de 5,000 mi. Una empresa de transportes
compr 48 llantas y hall que la duracin
media para sus vehculos fue de 59,500
mi. Es la experiencia distinta de la
expresada por el fabricante al nivel de
significacin de 0.05?
= 60,000 mi
o = 5,000 mi
Datos: n = 48 llantas
= 59,500 mi
o = 0.05
x
Solucin:
Las hiptesis se expresan de la siguiente manera:

H
0
: = 60,000 mi La duracin de las llantas es de
60,000 millas
H
1
: = 60,000 mi La duracin de las llantas es distinta
a 60,000 millas

Primero, vamos a calcular el error estndar de la media y
para ello emplearemos la expresin del error estndar:
n
x
o
o =
Sustituyendo valores en ella, se tiene:
mi x x x 69 . 721
9282 . 6
000 , 5
48
000 , 5
= = = o o o
En el siguiente paso vamos a obtener el valor de Z y
para ello vamos a apoyarnos en la grfica siguiente:
Recurrimos a las tablas de la distribucin normal y en
ellas localizamos 0.475, que se ubica en un valor
de Z = 1.96
En el tercer paso, vamos a determinar los lmites
superior e inferior de confianza para el intervalo de
la media poblacional ya que se trata de una prueba
de dos extremos. Para ello aplicaremos la
expresin siguiente:
x o
Sustituyendo valores en ella, se tiene:

Lc = 60,000 1.96 (721.69)
Ls = 60,000 + 1,414.51 Ls = 61,414.51 millas.
Li = 60,000 1,414.51 Li = 58,585.49 millas

Entonces la media de la poblacin flucta entre
58,585.49 y 61,414.51 millas en un nivel de
confianza del 95%.
x Z Lc
H
o =
0
Regresemos a la grfica anterior para ubicar los
lmites de confianza y la media muestral. Con ello
analizaremos si se acepta la hiptesis nula
adems de verificar si es verdadera o falsa.
La media muestral se ubica dentro de la zona de
aceptacin, por lo que podemos decir que la
hiptesis nula es verdadera, pero vamos a
verificar est aseveracin por medio de la
expresin siguiente:
x
x
Z
o

=
__
693 . 0
69 . 721
000 , 60 500 , 59
X
Z
Z
o =

=
Entonces la media muestral se ubica en -0.693 y
se confirma que cae en la zona de aceptacin.
Concluimos que la duracin media de las
llantas es muy cercana a la que afirma el
fabricante de 60,000 millas, con un nivel de
significancia de 0.05.
x o
b) Prueba de un extremo para las
medias
En este caso, el nivel de
significancia (zona de rechazo)
slo abarca un extremo o cola
de la campana de Gauss.
Ejemplo 2.-
Una cadena de restaurantes afirma que el tiempo
medio de espera de clientes por atender est
distribuido normalmente con una media de 3
minutos y una desviacin estndar de 1
minuto. Su departamento de aseguramiento de
la calidad hall en una muestra de 50 clientes
en un cierto establecimiento que el tiempo
medio de espera era de 2.75 minutos. Al nivel
de significacin de 0.05, Es dicho tiempo
menor de 3 minutos?
= 3 minutos.
o = 1minutos.
Datos: n = 50 clientes.
= 2.75 minutos.
o = 0.05
x
Representemos estos datos en la campana de Gauss:
Las hiptesis son:

Ho : = 3 El tiempo promedio de espera es de 3 minutos.

H1 : < 3 El tiempo promedio de espera es menor de 3 minutos.
Primero calculemos el error estndar de la media:
Ahora determinemos el valor de Z, ya que tenemos
una muestra mayor de 30:
Como o = 0.05 y es una prueba de hiptesis para un
extremo, en este caso, el extremo izquierdo,
entonces, el nivel de significancia est contenido en
este extremo, por lo que el nivel de confianza es 0.5
0.05 = 0.45 .
Buscando en las tablas de la distribucin normal 0.45,
encontramos que: Z= 1.64
El lmite izquierdo del intervalo de confianza ser:

Li = 3 1.64 (0.1414)
Li = 3 0.2319
Li = 2.768

Grficamente esto se representa as:
1414 . 0
07 . 7
1
50
1
= = = x x x o o o
x o
La media muestral 2.75, se localiza en la zona de
rechazo, por lo que se puede establecer que
se rechaza la hiptesis nula y se acepta la
alternativa.
Comprobemos con :
x
x
Z
o

=
x Z Z Z o 77 . 1
1414 . 0
25 . 0
1414 . 0
3 75 . 2
=

=
Como podemos observar 1.77 est localizado
ms hacia la izquierda del lmite de
confianza 1.64.
Podemos concluir que el tiempo medio de
espera de clientes por atender en este
establecimiento es menor de 3 minutos.
Ahora realizaremos un ejemplo
cuando se desconoce la
desviacin estndar de la
poblacin.
Ejemplo 3.-
Una cadena grande de tiendas de autoservicio,
expide su propia tarjeta de crdito. El gerente de
crdito desea averiguar si el saldo insoluto medio
mensuales mayor que 400 dlares. El nivel de
significacin se fija en 0.05. Una revisin
aleatoria de 172 saldos insolutos revel que la
media muestral 407 dlares y la desviacin
estndar de la muestra es 38 dlares. Debera
concluir ese funcionario de la media poblacional
es mayor que 400 dlares, o es razonable
suponer que la diferencia de 7 dlares (obtenida
de 407- 400 = 7) se debe al azar?
= 400 dlares.
n = 172 saldos insolutos.
Datos: = 407 dlares.
s = = 38 dlares (desviacin
estndar estimada).
o = 0.05
x
o

Las hiptesis son:


Ho : = 400 dlares.
H1 : > 400 dlares.
Debido a que la hiptesis
alternativa nos indica un sentido
a la derecha de la media,
debemos aplicar una prueba de
una cola. Veamos la grfica:
Si calculamos el error estndar estimados, tenemos que:
n
x
o
o

=
897 . 2

115 . 13
38

172
38

= = = x x x o o o
Si leemos en las tablas de la distribucin
normal 0.45, encontramos que: Z = 1.64
Determinando el lmite superior del intervalo
de confianza, se tiene:
Ls = 400 + 1.64 (2.897)
Ls = 404.75 dlares.
Grficamente esto ocurre:
x o

Comprobando con:
x
x
Z
o

=
x Z Z Z o

416 . 2
897 . 2
7
897 . 2
400 407
= =

=
Con esto comprobamos que el valor de la
media muestral, cae dentro de la zona de
rechazo, por lo que se rechaza la
hiptesis nula y se acepta la alternativa.
Con esto el gerente de crdito debe
concluir que el saldo insoluto medio
mensuales es mayor que 400 dlares.
PRUEBAS DE HIPOTESIS DE LAS
MEDIAS DE MUESTRAS
PEQUEAS.
a) Prueba de dos extremos para
medias
Mediante el siguiente ejemplo
explicaremos el razonamiento a
seguir para demostrar una
prueba de hiptesis de dos
extremos con una muestra
menor a 30, en donde
aplicaremos la distribucin t.
Ejemplo 1.-
Un especialista en personal que labora en una gran
corporacin, est reclutando un vasto nmero de
empleados para un trabajo en el extranjero.
Durante la realizacin de pruebas, la gerencia
pregunta cmo marchan las cosas y el especialista
contesta: Bien, creo que la puntuacin promedio
en el test de actitudes ser 90. Cuando la
gerencia revisa 20 de los resultados de la prueba,
averigua que la puntuacin media es 84 y la
desviacin estndar de esta puntuacin es 11. Si la
gerencia quiere probar la hiptesis del especialista
en personal en el nivel de significancia de 0.10,
cul ser el procedimiento a que recurra?
= 90
n = 20
Datos: = 84
s = = 11
o = 0.10
x
Las hiptesis son:
H
o
: = 90
H
1
: = 90
El error estndar estimado de la media ser:
46 . 2

472 . 4
11

20
11

= = = = x x x
n
x o o o
o
o
En la tabla t de Student se localiza o = 0.10 y gl = 20 1, o
sea gl = 19 y se encuentra que: t = 1.729
Con estos datos ya podemos determinar los limites superior
e inferior del intervalo de confianza, mediante la
expresin:
x o

x t Lc o

=
Lc = 90 1.729 (2.46) Ls = 90 + 4.246 Ls = 94.25
Li = 90 1.729 (2.46) Li = 90 4.246 Li = 85.75
Grficamente esto sucede:
Como la media muestral cae en la zona de rechazo,
entonces se rechaza la hiptesis nula y se acepta la
hiptesis alternativa.
Concluimos que la gerencia tiene suficientes
evidencias para demostrar que el especialista est
equivocado, que la puntuacin media no es 90.
b) Prueba de un extremo para
medias
Para este caso, ya sabemos que
el nivel de significancia (zona de
rechazo) slo abarca un
extremo o cola de la campana
de Gauss.
Ejemplo 2.-
Una persona tom una muestra aleatoria de
7 casas en un suburbio muy elegante de
una gran ciudad y encontr que el valor
promedio estimado del mercado era de
$560,000, con una desviacin estndar de
$49,000. Pruebe la hiptesis de que, para
todas las casas del rea, el valor medio
estimado es de $600,000, contra la
alternativa de que sea menor que
$600,000. Use el nivel de significancia de
0.05.
n = 7 casas
= $560,000
Datos: s = = $49,000
= $600,000
o = 0.05
x
o

Las hiptesis son:


H
o
: = $600,000
H
1
: < $600,000
Calculando el error estimado de la muestra, se tiene que:
52 . 518 , 18 $

646 . 2
000 , 49

7
000 , 49

= = = = x x x
n
x o o o
o
o
Sabemos que el nivel de significancia es de 0.05, para una
cola, por lo que se supone, que si fuera una prueba para
dos colas, cada una tendra 0.05, es decir, el nivel de
significancia o = 0.10. Por lo tanto 0.10 es el valor que
debemos localizar en la tabla correspondiente de la
distribucin t de Student, con 6 grados de libertad (7 1).
Encontramos entonces que t = 1.943
Con estos datos, ya podemos determinar el lmite inferior del
intervalo de confianza en donde se encuentra la
verdadera media de la poblacin.
x o

x t Li o

=
Li = 600,000 1.943 (18,518.52) Li = $564,018.52

En la campana de Gauss:
Como la media muestral cae la zona de rechazo,
entonces se rechaza la hiptesis nula y se acepta
la hiptesis alternativa.
Comprobando lo anterior, se tiene que:
Podemos concluir que el valor medio estimado
del valor de todas las casas es menor de
$600,000.
x Z Z Z o 16 . 2
52 . 518 , 18
000 , 40
52 . 518 , 18
000 , 600 000 , 560
=

=
PRUEBA DE HIPOTESIS PARA
PROPORCIONES
a) Prueba de dos extremos para
proporciones.
La prueba de hiptesis para
proporciones, tiene algunas
variantes en la demostracin de
las hiptesis respecto a la
prueba de hiptesis de medias,
variantes que se irn explicando
conforme se vayan aplicando.
Ejemplo 1.-
Una compaa que est evaluando la promovibilidad de sus
empleados; es decir, est determinando la proporcin de
aquellos cuya habilidad, preparacin y experiencia en la
supervisin los clasifica para un ascenso a niveles
superiores de la jerarqua. El director de recursos
humanos le dice al presidente que el 80%,o sea el 0.8, de
los empleados son promovibles. El presidente crea un
comit especial para valorar la promovibilidad de todo el
personal. El comit realiza entrevistas en profundidad con
150 empleados y en su juicio se da cuenta que slo el
70% de la muestra llena los requisitos de la promocin. El
presidente quiere probar, en un nivel de significancia de
0.05, la hiptesis de que 0.8 de los empleados pueden
ser promovidos.
p = 0.8
q = 0.2
Datos: n = 150
= 0.7
= 0.3
o = 0.05
p
q
Las hiptesis son:
H
o
: p = 0.8 80% de los empleados son
promovibles.
H
1
: p = 0.8 La proporcin de empleados
promovibles no es 80%.
Primero calculamos el error estndar de la proporcin,
mediante la siguiente expresin:
n
q p
H H 0 0
= o
Sustituyendo valores:
0327 . 0 0010666 . 0
150
) 2 )(. 8 (.
= = = p p p o o o
En este caso, la compaa quiere saber si la
verdadera proporcin es mayor o menor que la
supuesta proporcin. Por consiguiente, es
apropiada una prueba de dos extremos para una
proporcin. El nivel de significancia corresponde a
las dos regiones sombreadas, cada una de las
cuales contiene 0.025 del rea. La regin de
aceptacin de 0.95 se ilustra como dos reas de
0.475 cada una. Puesto que la muestra es mayor
que 30, podemos recurrir la distribucin normal.
Basndonos en la tabla de sta distribucin,
podemos calcular que el valor correspondiente de
Z para 0.475 del rea bajo la curva es 1.96 . Por
tanto, los limites de la regin de aceptacin son:
Lc = PH0 Z
Lc = 0.8 1.96(0.0327)
Ls = 0.8 + 0.06409 Ls = 0.8641
Li = 0.8 0.06409 Li = 0.7359

Vindolo en la campana de Gauss:
o
La probabilidad de la muestra = 0.7,
se localiza en la zona de rechazo,
por lo que se rechaza la hiptesis
nula y se acepta la alternativa.
Vamos a demostrarlo:
p
p Z Z Z o 058 . 3
0327 . 0
1 . 0
0327 . 0
8 . 0 7 . 0
=

=
Podemos concluir que existe una
diferencia significativa entre la supuesta
proporcin de empleados promovibles
comunicada por el director de recursos
humanos y la observada en la muestra,
la proporcin de toda la compaa no es
del 80%.
b) Prueba de un extremo para
proporciones
Ejemplo 2.- Un artculo reciente en el peridico
Reforma report que un empleado est
disponible slo para que uno de tres egresados
universitarios con grado. Las principales razones
aportadas fueron que existe una
sobreabundancia de graduados de universidad y
una economa dbil. Suponga que una encuesta
con 200 graduados recientes de la institucin de
usted, revela que 80 estudiantes tenan empleo.
Al nivel de significancia de 0.02, se puede
concluir que una proporcin mayor de
estudiantes egresados tienen trabajo?
p = 0.8
q = 0.2
Datos: n = 150
= 0.7
= 0.3
o = 0.05
p
q
Las hiptesis son:
H
o
: p = 0.3333
H
1
: p > 0.3333
Calcularemos primero el error estndar de la proporcin:
n
q p
p
Ho Ho
= o
Sustituyendo valores:
0333 . 0 0011 .
200
2222 . 0
200
) 6667 . 0 ( ) 3333 . 0 (
= = = = p p p p o o o o
En este caso, se quiere saber si la verdadera proporcin es
mayor que la supuesta proporcin. Por consiguiente, es
apropiada una prueba de un extremo para una
proporcin. El nivel de significancia corresponde a la
regin derecha de rechazo. La regin de aceptacin de
0.98 se ilustra como un rea de 0.5 y otra de 0.48 como
la muestra es mayor de 30, podemos recurrir a la
distribucin normal. Basndonos en la tabla de de esta
distribucin el valor correspondiente de Z, para 0.48 del
rea bajo la curva es 2.05, por tanto, el lmite de la regin
de aceptacin es:
Ls = 0.3333 + 2.05 (0.0333) Ls = 0.3333 + 0.068265
Ls = 0.4016
Como = 0.4, y es menor que 0.4016, se localiza en la zona
de aceptacin, entonces, se acepta la hiptesis nula.
Demostrando lo anterior se tiene:
p
p
p p
Z
o

=
p Z Z Z o 003 . 2
0333 . 0
0667 . 0
0333 . 0
3333 . 0 4 . 0
= =

=
En la campana de Gauss:
Concluimos que no es mayor la proporcin de
estudiantes egresados que tienen trabajo.
C) Prueba de hiptesis para
proporciones de muestras
pequeas.
Si usamos la distribucin t para una prueba hiptesis
para proporciones en muestras pequeas, de dos
colas, seguimos el mismo procedimiento que se
utiliz en la prueba para medias de muestras
pequeas.
Lo mismo sucede si se trata de una prueba de un
extremo, recordando que, para obtener el valor
apropiado de t en un nivel de significancia de 0.05
con 10 grados de libertad, buscaremos en la tabla
de la distribucin t bajo la columna 0.10, frente al
rengln 10 grados de libertad. Esto es verdad
porque la columna 0.10 del rea bajo la curva
contenida en ambos extremos combinados; por
ello tambin representa 0.05 del rea bajo la
curva contenida en cada uno de los extremos.
Por esta razn en lugar de buscar en la columna
0.05, se busca 0.10.

You might also like