Professional Documents
Culture Documents
DOCENTE
Ing. JAVIER DE LA HOZ MAESTRE
ESTADISTICA II
UNIVERSIDAD DEL MAGDALENA
TEMA
PRUEBAS DE HIPOTESIS
Los mtodos estudiados en el tema anterior usan la informacin proporcionada por los
estadsticos muestrales para estimar con cierta probabilidad el valor de un parmetro
poblacional. En ste captulo se introducir la prueba de hiptesis que es un enfoque diferente.
En ste caso, se supone a priori el valor del parmetro y sobre la base de la informacin
obtenida en una muestra se somete a prueba la suposicin, para luego tomar con cierta
probabilidad, la decisin de rechazar o no rechazar la hiptesis. En ste punto es importante
sealar que la expresin no rechazar pudiera ser sustituida por aceptar, sin embargo antes
de hacerlo es necesario atender cuidadosamente algunas explicaciones que se darn ms
adelante. La prueba de hiptesis tambin conocida como docimasia o contrastacin de hiptesis
es uno de los mtodos estadsticos ms usados en las ciencias e ingeniera por ser un
procedimiento que le proporciona al investigador un criterio objetivo para tomar decisiones
con base a un nmero limitado de observaciones. Frecuentemente un ingeniero tiene que
decidir: a) al comparar magnitudes de propiedades fsicas, qumicas o biolgicas en dos o ms
condiciones o categoras; b) al valorar los efectos de diferentes niveles de algn factor
ambiental como la temperatura, la humedad, el contenido de oxgeno sobre algn proceso, ; y c)
al relacionar dos o ms variables, . En ste captulo se trataran varios procedimientos para
probar hiptesis que dan respuesta a este tipo de problemas o a otros similares.
2.1.2. Comentarios.
(a) H0 siempre se refiere a un valor especfico del parmetro de poblacin (como, porejemplo,
), no al estadstico muestral (como
x ).
(b) H0 siempre debe contener un signo igual respecto al valor especificado del parmetro
poblacional (por ejemplo, H0 : = 36, H0 : 36 o H0 : 36).
(c) H1 nunca debe contener un signo igual respecto al valor especificado de parmetro de
poblacin.
inicia a partir de una hiptesis la cual es una explicacin tentativa que se da a un hecho
observado. La misma puede surgir a partir de una teora general que explica cierta realidad a la
cual pertenece el fenmeno observado, o por la experiencia propia o de otros investigadores, o
por simple intuicin. Ahora bien, en la formulacin de cualquier hiptesis est implcita una
hiptesis alternativa. Estas hiptesis de investigacin para poderse someter a prueba deben
concretarse en trminos cuantitativos, transformndose en hiptesis estadsticas. En forma
general las hiptesis estadsticas son afirmaciones que involucran una propiedad de la
distribucin probabilstica de la variable aleatoria que se est estudiando, propiedades como
son la media (), la varianza (2), un valor de proporcin () o la forma de la distribucin. De
modo que el primer paso en un proceso de decisin es formular las hiptesis estadstica, las
cuales reciben el nombre de hiptesis nula (H0) e hiptesis alternativa (H1). La hiptesis nula se
dice que es una hiptesis simple, porque es una afirmacin de igualdad con un valor especfico,
mientras que las hiptesis alternativas se dicen que es compuesta porque puede asumir
diferentes valores.
Si se representa un parmetro poblacional por letra griega y con k un valor cualquiera del
parmetro, la forma genrica de la hiptesis nula sera una igualdad entre el parmetro y un
valor especfico del mismo,
H0 : = k
Por su parte la hiptesis alternativa se puede representar con una de las tres posibilidades
siguientes:
H1:
>k
<k
k
La expresin > k se interpreta como que el parmetro puede asumir cualquier valor mayor a
k y se dice que la prueba de hiptesis es de una cola a la derecha. Por su parte < k indica que
el parmetro puede ser cualquier valor menor a k y la prueba de hiptesis se llama de una
cola a la izquierda. Finalmente k representa la posibilidad que el parmetro asuma
cualquier valor diferente (mayor o menor) al valor k y la prueba de hiptesis se denomina de
dos colas. Ms adelante, cuando se trate lo referente al establecimiento de la zona de
decisin, se aclarar la razn de esta nomenclatura. Como vimos existen tres formas distintas
de planteamiento para la hiptesis alternativa. La seleccin de una de ellas depende de la
naturaleza del problema que se quiere docimar. Algunos ejemplos pueden ayudar a entender la
lgica para seleccionar una hiptesis alternativa
Ejemplo 2.1 Dada las siguientes situaciones, identifique las hiptesis nula y alternativa para la
hiptesis estadstica formulada en cada situacin.
(a) Un empresario afirma que el peso medio poblacional (en gramos) de lapiceros por caja
es de por lo menos 300 gramos
(b) Una empresa decide aceptar envos de piezas siempre y cuando no tenga evidencia para
sospechar que ms del 4% son defectuosas.
(c) Supongamos que la conjetura de una profesor es que la utilizacin de la tecnologa no
produce diferencias en el promedio de las calificaciones del examen final.
SOLUCION:
(a) Sea el peso medio poblacional (en gramos) de lapiceros por caja. Si la hiptesis es que
esta media es por lo menos 300 gramos, entonces, la hiptesis nula es
H0 : 300.
La alternativa obvia es que el verdadero peso medio es inferior a 300 gramos, es decir,
H1 : < 300.
(b) Sea la proporcin poblacional de piezas defectuosas. En este caso, la hiptesis nula es que
esta proporcin es cuando mucho 0,05, es decir,
H0 : 0, 05.
Basndose en la informacin muestral, se contrasta esta hiptesis frente a la alternativa
unilateral
H1 : > 0, 05.
(c) Sea la diferencia entre las calificaciones medias poblacionales para las dos partes del
curso, con y sin uso de la tecnologa. Entonces, la hiptesis nula es
H0 : = 0.
Sin embargo, el profesor puede sospechar que posiblemente el uso de la tecnologa produzca un
incremento en el promedio y, en consecuencia, querr contrastar la hiptesis nula frente a la
alternativa unilateral
H1 : > 0
Especificacin del nivel de significacin . Cualquier decisin dentro del proceso de prueba
de hiptesis lleva asociado cierto riesgo de fallar. Es decir que siempre existe la posibilidad de
tomar una decisin equivocada, slo que en este tipo de prueba se tiene la ventaja de conocer
de antemano la probabilidad de equivocarse. En la Tabla 2.1 se muestran las posibles
consecuencias de tomar una decisin con relacin a la hiptesis nula. Se dice que cometemos un
error de tipo I si rechazamos la hiptesis nula cuando en realidad es verdadera y que
cometemos un error de tipo II si aceptamos la hiptesis nula cuando es falsa.
Tabla 2.1. Situaciones derivadas de una decisin estadstica
Como se puede notar tanto como son probabilidades condicionadas. Los valores de ambos
errores no pueden calcularse en un sentido absoluto. Para calcular es necesario asumir que H 0
es cierta y para calcular se asume que H1 es cierta.
En cualquier prueba de hiptesis lo ms conveniente ser que ambos tipos de errores sean lo
ms pequeo posible, pero esto no es fcil de lograr, porque al intentar disminuir uno el otro
aumenta proporcionalmente como se muestra en la siguiente figura.
Seleccin del estadstico de prueba. Para poder someter a prueba las hiptesis
formuladas, es necesario usar alguna propiedad o estadstico de las muestras que est
relacionado con el parmetro objeto de la inferencia. Estas propiedades muestrales reciben el
nombre genrico de estadsticos de prueba. En las Tablas 2.3; 2.4; 2.5 se muestra como se
seleccionan segn los parmetros los estadsticos de prueba correspondiente
Establecer una zona de aceptacin para H0. Una vez conocido el estadstico de prueba a
utilizar, as como su distribucin, es necesario definir en la distribucin del estadstico
muestral una zona de aceptacin y una zona de rechazo de la hiptesis nula. La zona de
aceptacin de H0 est formada por todos los valores del estadstico de prueba con una
probabilidad de ocurrencia mayor al establecido en el nivel de significacin.. Por el contrario la
zona de rechazo est formada por todos los valores del estadstico de prueba cuya
probabilidad de ocurrencia es igual o menor al valor establecido en el nivel de significacin. La
zona de rechazo a diferencia de la zona de aceptacin y dependiendo de la hiptesis
alternativa planteada puede estar orientada en diferentes direcciones a lo largo del eje de
valores de la variable aleatoria.
Zona de rechazo a la derecha: esta formada por todos los valores del estadstico de prueba
ubicados a la derecha del parmetro cuya probabilidad de ocurrencia es menor a la del nivel
de significacin. Esta zona se especifica cuando H 1: > 0 y la docimasia se llama prueba de una
cola a la derecha (Figura 2.1 A)
Zona de rechazo a la izquierda: esta formada por todos los valores del estadstico de prueba
nivel de significacin. Esta zona se especifica cuando H 1: <0 y la docimasia se llama prueba
de una cola a la derecha (Figura 2.1 B)
Zona de rechazo doble: La zona de rechazo puede ser dividida en dos partes iguales ubicadas a
cada lado del parmetro. La zona de la derecha y de la izquierda estn formadas por todos los
valores del estadstico de prueba
k = valor crtico.
k , que como se ve en la
Figura 2.1 es el valor del estadstico de prueba que separa la regin de aceptacin de la regin
de rechazo. Esto explica la importancia de conocer la distribucin del estadstico de prueba.
Este valor crtico por lo general se expresa en trminos de los estadsticos de prueba
derivados debido a la facilidad de encontrar el valor requerido usando las tablas de
probabilidad acumulada de las distribuciones de probabilidad que estos estadsticos siguen.
Como se observa en la Figura 2.1 y la Tabla 2.6 la cuanta del valor crtico depende, adems de
la distribucin de probabilidad, del valor de .
Tabla 2.6: Algunos valores crticos de Z usados en las pruebas de hiptesis.
El valor crtico del estadstico de prueba marca el punto de separacin de las zonas de
aceptacin y de rechazo de la hiptesis nula. En la figura 2.2 se muestra algunos de estos
valores cuando se somete a prueba la hiptesis nula = 0. Se seleccion como estadstico de
prueba a Z y el nivel de confianza especificado fue = 0.05.
Cmputos necesarios. Con los datos proporcionados por una muestra de tamao n se
muy cercana a la regin de rechazo, digamos que la P( ) = 0.0614, se debe aceptar H0 con un
= 0.05 si se acta estrictamente. Pero el investigador puede decidir rechazar H 0 puesto que la
probabilidad de cometer un error tipo I no aumento mucho, siempre y cuando quede explicito
en el informe de investigacin el valor del nivel de significacin usado. Actualmente, esta
forma de proceder es muy usada debido a la facilidad que ofrecen los paquetes estadsticos y
otros programas de aplicacin de calcular los valores de P para cualquier estadstico de prueba.
El p-valor o valor p es el mnimo nivel de significancia bajo la cual H 0 es rechazada.
Tenemos que
2.3 APLICACIONES
Ejemplo 2.1 Prueba de hiptesis acerca de la media poblacional cuando la muestra
proviene de una poblacin distribuida normalmente, con varianza desconocida y tamao de
muestra grande (n > 30).
Un entomlogo sospecha que en cierta zona endmica para el dengue el valor de la tasa neta
reproductiva (Ro) de una poblacin del mosquito Aedes aegypti vector de dicha enfermedad, ha
cambiado en relacin con el valor determinado hace 5 aos el cual era igual a 205 individuos.
Con tal propsito determin el valor de Ro a 40 hembras criadas en el laboratorio y
pertenecientes a una cepa desarrollada a partir de mosquitos capturados en la zona estudiada.
Los resultados fueron los siguientes:
SOLUCION:
a. Formulacin de hiptesis
Las hiptesis de investigacin son las siguientes:
Ho : La tasa neta de reproduccin no ha cambiado
H1 : La tasa neta de reproduccin de modific despus de cinco aos
Las hiptesis estadsticas
Ho : = 205
H1 : 205 (Analice porque la hiptesis alternativa es de diferencia)
x
s
e. Cmputos necesarios.
e.1) Media: 202.9
e.2) Desviacin estndar: s = 36.17
e.3) Estadstico de prueba:
202,9 205
36,17
0,367
40
f. Decisin.
Como z = -0.367, el valor del estadstico de prueba se encuentra dentro de la zona de no
rechazo . Por lo tanto se concluye con una confianza del 95% que los datos no proporcionan
suficiente evidencia para rechazar Ho.
SOLUCION:
g. Formulacin de hiptesis
Las hiptesis de investigacin son las siguientes:
Ho : La concentracin de nitrgeno en las hojas jvenes de Rhizophora mangle es mayor
o igual en la zona protegida.
H1 : La concentracin de nitrgeno en las hojas jvenes de Rhizophora mangle es menor
en la regin protegida.
Las hiptesis estadsticas
Ho : > 14.6
H1 : < 14.6
h. Especificacin de un valor de probabilidad crtico o nivel de significacin.
El nivel de significacin especificado es = 0.01
i. Eleccin de un estadstico de la muestra y de su distribucin.
Puesto que el parmetro involucrado en la docimasia es la media poblacional , y la
variable se distribuye normalmente con varianza desconocida y el tamao de la muestra
es pequeo lo ms conveniente es usar como estadstico de la t (ver tabla 2.3))
x
s
e. Cmputos necesarios.
e.1) Media: x = 10.48
e.2) Desviacin estndar: s = 2.41
e.3) Estadstico de prueba:
10, 48 14, 6
2, 41
8,55
25
e.4) Zona de aceptacin:
ZA = {t / t > -t(; n-1) } = {t / t > -t(0.01; 24)} = {t/ t> -2.492}
f. Decisin.
Como t = - 8.55 < -t(0.01; 24) = -2.492 el valor del estadstico de prueba se encuentra
dentro de la zona de rechazo de Ho. Por lo tanto se concluye que los datos
proporcionan suficiente evidencia para rechazar Ho
que al menos la mitad de los compradores pagan sus artculos con tarjetas de crdito
frente a la alternativa de que la proporcin poblacional es menor de la mitad.
SOLUCION:
a. Formulacin de hiptesis
Sea la proporcin poblacional de compradores que pagan sus artculos con tarjetas de
crdito. Queremos probar la hiptesis
Las hiptesis estadsticas
Ho : > 0,5
H1 : <0,5
b. Especificacin de un valor de probabilidad crtico o nivel de significacin.
El nivel de significacin especificado es = 0.10
c. Eleccin de un estadstico de la muestra y de su distribucin.
Puesto que el parmetro involucrado en la docimasia es una proporcion lo ms
conveniente es utilizar como estadstico Z (ver tabla 2.4)
(1 )
n
e. Cmputos necesarios.
e.1)
378
0, 471
802
Z 1, 64
Entonces, como Z = -1,64 es menor que Z = -1,28, con una confianza del 90% al nivel de
se rechaza la hiptesis nula, lo que significa que la proporcin de compradores que
pagan sus artculos con tarjetas de crdito es menor a la mitad.
SOLUCION:
d. Formulacin de hiptesis
Sean p1 y p2 las proporciones poblacionales de hombres y mujeres, respectivamente,
que tienen auto en el campus. Entonces,
Las hiptesis estadsticas
Ho : p1 p2 0
H1 : p1 p2 > 0.
p1 p2 p1 p2
p0 (1 p0 ) p0 (1 p0 ) donde
n1
n2
p0
n1 p1 n2 p2
n1 n2
p1 = 0,34
p2 =0,27
p0 0,305
0,34 0, 27
100
100
1, 075