Professional Documents
Culture Documents
Dentro del proceso de inferencia, adems de la estimacin puntual y la por intervalo, en muchas ocasiones es necesario hacer pruebas de hiptesis, las cuales se hacen con base en la informacin muestral. En este captulo se ver la prueba de hiptesis para la media, la proporcin, la varianza, la diferencia de medias, la diferencia de proporciones, el cociente de varianzas, la prueba de independencia y la prueba de bondad de ajuste. 3.1 HIPOTESIS Una hiptesis estadstica es un supuesto acerca del valor de un parmetro de una poblacin determinada. Este supuesto debe comprobarse con la informacin suministrada por una muestra aleatoria obtenida de dicha poblacin. Cuando se realiza una prueba de hiptesis, se plantean dos hiptesis que deben ser mutuamente excluyentes; una es la hiptesis nula que se nota como H0 y la otra es la hiptesis alternativa que se nota como H1 . Se debe establecer un criterio o regla de decisin segn la cual no se rechace la hiptesis nula o se rechace. Si se rechaza la hiptesis nula (H0 ) se acepta hiptesis alternativa (H1 ). Para establecer esta regla de decisin la distribucin de probabilidad se divide en dos categoras mutuamente excluyentes: la que lleva al rechazo de H0 , es decir est en la zona de rechazo y la que lleva al no rechazo de H0 , es decir, est en la zona de no rechazo. Debido a que se est trabajando con una muestra aleatoria, cuando se realiza una prueba de hiptesis se pueden cometer dos tipos de errores. La hiptesis nula (H0 ) es en realidad verdadera, pero debido a que los datos muestrales parecen ser inconsistentes con ella, se la rechaza (ERROR TIPO I) y la probabilidad de cometer un error tipo I se llama nivel de significancia ( ). Puesto que cuando se comete un error tipo I, seguiramos una accin errnea, se puede definir el nivel de significancia como la probabilidad de decidirnos por H1 dado que H0 es verdadera. Por otro lado, podemos no rechazar H0 siendo en realidad falsa, a este error se le llama ERROR TIPO II.
H0 : H1 :
=k >k
H0 : H1 :
k >k
En las distribuciones en el muestreo se vi que para el caso de la media, hay tres situaciones, por consiguiente la estadstica de trabajo a utilizar depende de los supuestos de la poblacin y del tamao de la muestra. Prueba de hiptesis para la media si la poblacin de donde se obtiene la muestra tiene distribucin normal con conocida. La estadstica de trabajo a usar corresponde a la expresin (1.6):
REGLA DE DECISION
- Si se ha planteado la hiptesis alternativa como: H1 : k se tiene una prueba de hiptesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribucin como se aprecia en la figura 3.1
Figura 3.1 Regla de decisin para una prueba de hiptesis a dos colas.
y pertenecen a una distribucin normal estndar. Si el valor de la estadstica de trabajo (Zx) est entre y no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1. Es decir:
H1 : > k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel de significancia ( ) en la parte superior de la distribucin, como se aprecia en la figura 3.2
Figura 3.2 Regla de decisin para una prueba de hiptesis a una cola superior.
pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo (Zx) es menor que no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1. Es decir,
Si se ha planteado la hiptesis alternativa como: H1 : < k, se tiene una prueba de hiptesis a una cola inferior, quedando el nivel de significancia ( ) en la parte inferior de la distribucin, como se aprecia en la figura 3.3
Figura 3.3 Regla de decisin para una prueba de hiptesis a una cola inferior.
Z pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo (Zx) es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1. Es decir,
EJEMPLO
Un proceso manufacturero usado por una fbrica durante los ltimos aos da una produccin media de 100 unidades por hora con una desviacin estndar de 8 unidades. Se acaba de introducir en el mercado una nueva mquina para realizar ese tipo de producto. Aunque es muy cara comparada con la que est ahora en uso, si la media de produccin de la nueva mquina es de ms de 150 unidades por hora, su adopcin dara bastantes beneficios. Para decidir si se debiera comprar la nueva mquina, a la gerencia de la fbrica se le permite hacer un ensayo durante 35 horas, hallndose un promedio de 160 unidades por hora. Con sta informacin qu decisin se debe tomar si se asume un nivel de confianza del 99 por ciento. Solucin . Segn el enunciado, solo se compra la mquina si la produccin es de mas de 150 unidades por hora, por lo tanto las hiptesis son: H0 : H1 : = 150 > 150
Para elegir la estadstica de trabajo se tiene en cuenta que se conoce la varianza poblacional, por lo tanto se usa la expresin 3.1
por el planteamiento de la hiptesis alternativa se trabaja a una cola superior. En la distribucin normal, con una confiabilidad del 99 por ciento el valor de Z es 2,33. como puede observarse en la figura 3.4, la estadstica de trabajo est en la zona de rechazo de la hiptesis nula, por lo tanto, se acepta que la produccin promedio por hora es superior a las 150 unidades y asumiendo un riesgo del 1 por ciento se puede comprar la nueva mquina.
Figura 3.4 Regla de desicin para una prueba de hiptesis a una cola inferior.
Prueba de hiptesis para la media si se selecciona una muestra aleatoria de tamao n 30de una poblacin con cualquier distribucin. La estadstica de trabajo a usar es la expresin (1.7):
REGLA DE DECISION
Es la misma que en el caso anterior y depende en todo caso de la hiptesis alternativa.
EJEMPLO
La duracin promedio de las llantas producidas por una fbrica de llantas, segn experiencias registradas es de 46.050 kms. Se desea probar si el promedio poblacional ha cambiado; para tal efecto se toma una muestra aleatoria de 60 llantas y se obtiene una duracin promedio de 45.050 kms. con una desviacin estndar de 3.070 kms. Solucin H
0
= 46.050 46.050
H1 :
Teniendo en cuenta que el tamao de la muestra es grande, como estadstica de trabajo se utiliza la expresin 3.2
Por la hiptesis alternativa, la regla de decisin es a dos colas. La tabla a utilizar es la de la distribucin normal. Asumiendo un nivel de confianza del 95 por ciento, los correspondientes valores de Z son -1,96 y 1,96. Como puede observarse en la figura 3.5, el valor de la estadstica de trabajo est en la zona de rechazo de la hiptesis nula, por consiguiente, con una confiabilidad del 95 por ciento se acepta que la duracin promedio de las llantas ha cambiado.
Figura 3.5 Regla de decisin para una prueba de hiptesis a dos colas
Cuando se va a estimar una proporcin el tamao de la muestra (n) siempre debe ser mayor a 30, por lo tanto se tiene un solo caso. La estadstica de trabajo a utilizar es la expresin (1.13):
(3.5)
REGLA DE DECISION
Si se ha planteado la hiptesis alternativa como: H1: k se tiene una prueba de hiptesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribucin como se aprecia en la figura 3.1 y pertenecen a una distribucin normal estndar. Si el valor de la estadstica de trabajo (Zp) est entre y no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si < Zp < no se rechaza H0 . - Si se ha planteado la hiptesis alternativa como:
H1 :
> k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel de significancia ( ) en la parte superior de la distribucin, vease figura 3.2
pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo (Zp ) es menor que no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si Zp < no se rechaza H0 . - Si se ha planteado la hiptesis alternativa como: H1 : < k, se tiene una prueba de hiptesis a una cola inferior, quedando el nivel de significancia ( ) en la parte inferior de la distribucin, vease figura 3.3
pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo (Zp ) es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si Zp > Z no se rechaza H0 .
EJEMPLO
Un fabricante afirma que por lo menos el 90 por ciento de las piezas de una maquinaria que suministra a una fbrica guardan las formas especificadas. Un exmen de 200 de esas piezas revel que 160 de ellas no eran defectuosas. Pruebe si lo que afirma el fabricante es cierto. Solucin H0 : H1 : 0,9 < 0,9
Para realizar una prueba de hiptesis para la proporcin se utiliza la expresin 3.5
Asumiendo una confiabilidad del 95 por ciento, el valor correspondiente a Z en la distribucin normal es -1,64
Como puede observarse en la figura 3.7, el valor de la estadstica de trabajo se encuentra en la zona de rechazo de la hiptesis nula, por consiguiente, con una confiabilidad del 95 por ciento se concluye que la afirmacin del fabricante no es cierta.
Figura 3.7 Regla de decisin para una prueba de hiptesis a una cola inferior
La estadstica de trabajo depende de las caractersticas de las poblaciones y del tamao de las muestras.
Prueba de hiptesis para la diferencia de medias, si las muestras se obtienen de poblaciones con distribucin normal, con varianzas poblacionales conocidas , la estadstica de trabajo es la expresin (1.10):
(3.9)
REGLA DE DECISION
- Si se ha planteado la hiptesis alternativa como: H1 : > H1 : > k se tiene una prueba de hiptesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribucin como se aprecia en la figura 3.1 y pertenecen a una distribucin Normal estndar. Si el valor de la estadstica de trabajo est entre y no se rechaza la hiptesis nula, en caso contrario se rechaza H o lo cual implica aceptar H 1 . Es decir,
- Si se ha planteado la hiptesis alternativa como: H1 : > H1 : > k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel de significancia ( ) en la parte superior de la distribucin, como se aprecia en la figura 3.2 pertenece a una distribucin Normal estndar. Si el valor de la estadstica de trabajo es menor que se acepta la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H<sub>1 . Es decir,
- Si se ha planteado la hiptesis alternativa como: H1 : < H1 : < k, se tiene una prueba de hiptesis a una cola inferior, quedando el nivel de significancia ( ) en la parte inferior de la distribucin, como se aprecia en la figura 3.3 Z pertenece a una distribucin Normal estndar. Si el valor de la estadstica de trabajo es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir,
EJEMPLO
Un constructor est considerando dos lugares alternativos para construir un centro comercial. Como los ingresos de los hogares de la comunidad son una consideracin importante en sta seleccin, desea probar que el ingreso promedio de la primera comunidad excede al promedio de la segunda comunidad en cuando menos $1.500 diarios. Con la informacin de un censo realizado el ao anterior sabe que la desviacin estndar del ingreso diario de la primera comunidad es de $1.800 y la de la segunda es de $2.400 Para una muestra aleatoria de 30 hogares de la primera comunidad, encuentra que el ingreso diario promedio es de $35.500 y con una muestra de 40 hogares de la segunda comunidad el ingreso promedio diario es de $34.600. Pruebe la hiptesis con un nivel de confianza del 95 por ciento. Solucin Se desea probar si la diferencia entre los ingresos de la comunidad 1 y la 2 es de $1.500 o ms, por lo tanto: H0 : H1 : 1.500 < 1.500
El tamao de las muestras es grande y las varianzas poblacionales son conocidas, por consiguiente la estadstica de trabajo a utilizar es la expresin 3.9
Para un nivel de confianza del 95 por ciento, en la tabla de la distribucin normal se tiene un valor de Z de -1,64. Como puede observarse en la figura 3.13, la estadstica de trabajo se ubica en la zona de aceptacin de la hiptesis nula; por lo tanto, con una confiabilidad del 95 por ciento, la diferencia entre el ingreso promedio por hogar en las dos comunidades es mayor a $1.500 diarios.
Figura 3.13 Regla de decisin para una prueba de hiptesis a una cola inferior
Cuando se tienen dos poblaciones y se han tomado muestras aleatorias de tamaos n 1 y n 2, para observar una caracterstica o cualidad, se puede comparar el comportamiento de dicha caracterstica en las poblaciones a travs de la diferencia de proporciones. Hiptesis Como en los casos anteriores se puede plantear uno de los siguientes tres tipos de hiptesis: - Prueba de hiptesis a dos colas H0 : H1 : 1= 1 2 H0 : 2 H1 : 12 2=k k
1-
(3.14)
REGLA DE DECISION
Como en los casos anteriores depende del tipo de hiptesis que se haya planteado. - Si se ha planteado la hiptesis alternativa como: H1 : 1 2 H1 : p 1 - p 2 k se tiene una prueba de hiptesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribucin como se aprecia en la figura 3.1
y pertenecen a una distribucin Normal estndar. Si el valor de la estadstica de trabajo (Zp1-p2 ) est entre y no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si < Zp1-p2 < no se rechaza H0 . - Si se ha planteado la hiptesis alternativa como: H1 : 1 > 2 H1 : 1 - 2 > k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel de significancia ( ) en la parte superior de la distribucin, como se aprecia en la figura 3.2 pertenece a una distribucin Normal estndar. Si el valor de la estadstica de trabajo es menor que no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si Zp1-p2 < no se rechaza H0 . - Si se ha planteado la hiptesis alternativa como: H1 : 1 < 2 H1 : 1 - 2 < k, se tiene una prueba de hiptesis a una cola inferior, quedando el nivel de significancia ( ) en la parte inferior de la distribucin, como se aprecia en la figura 3.3 Z pertenece a una distribucin Normal estndar. Si el valor de la estadstica de trabajo (Zp1) es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H o lo cual implica aceptar H1 . Es decir, si Zp1-p2 > Z no se rechaza H0 .
p2
EJEMPLOS:
Se seleccion una muestra aleatoria de 100 hombres y 100 mujeres de un departamento de Colombia; se hall que de los hombres 60 estaban a favor de una ley de divorcio y de las mujeres 55 estaban a favor de dicha ley. Con base en sta informacin, pruebe que la proporcin de hombres que favorece sta ley es mayor que la proporcin de mujeres. Asuma un nivel de confianza del 99 por ciento. Solucin H0 : H1 : H= H> M M
Por la hiptesis alternativa se trabaja a una cola superior. En la tabla de la distribucin normal con una confiabilidad del 99 por ciento, el valor de Z es 2,33. La estadstica de trabajo est en la zona de no rechazo de la hiptesis nula (figura 3.19), es decir, con una seguridad del 99 por ciento se concluye que no hay diferencia en la proporcin de hombres y mujeres que favorecen la ley de divorcio.
Figura 3.19 Regla de decisin para una prueba de hiptesis a una cola superior
Hasta ahora se han mencionado formas de probar lo que se puede llamar hiptesis paramtricas con relacin a una variable aleatoria, o sea que se ha supuesto que se conoce la ley de probabilidad y se vieron pruebas de hiptesis que declaran valores para los parmetros. En algunos casos se necesita probar si una variable o unos datos siguen determinada distribucin de probabilidad, un mtodo para hacer esta prueba es el de bondad de ajuste o chi-cuadrado. La informacin debe estar presentada en un cuadro de distribucin de frecuencias. Sea m el nmero de clases y nj el nmero de observaciones en cada clase (frecuencias observadas). Se trata de comparar los valores o frecuencias observadas (nj ) con las frecuencias que habra en cada grupo o clase o sea el valor esperado (ej ) si se cumple la hiptesis nula (H0 ). Las diferencias entre lo observado y lo esperado dan las discrepancias entre la teora y la realidad. Si no hay diferencias, la realidad coincidir perfectamente con la teora y por el contrario, si las diferencias son grandes indica que la realidad y la teora no se parecen. Los pasos a seguir son: Hiptesis H0 : La variable tiene distribucin X con tales parmetros H1 : La variable no tiene la distribucin X
Estadistica de Trabajo
ej : frecuencia esperada segn la distribucin terica n: tamao de la muestra Nota. El nmero de observaciones esperadas en cada clase debe ser mayor o igual a 5, es decir, ej 5. Si esto no ocurre se unen las clases adyacentes hasta cumplir el requisito. Al unir las clases se disminuirn los grados de libertad de la chi-cuadrado.
Estadistica de Trabajo
(3.15) nj : frecuencia observada en la muestra ej : frecuencia esperada segn la distribucin terica n: tamao de la muestra Nota. El nmero de observaciones esperadas en cada clase debe ser mayor o igual a 5, es decir, ej 5. Si esto no ocurre se unen las clases adyacentes hasta cumplir el requisito. Al unir las clases se disminuirn los grados de libertad de la chi-cuadrado.
EJEMPLOS:
Se desea probar si la estatura de los empleados tiene distribucin normal. Se toma una muestra aleatoria de 200 empleados a quienes se les pregunta su estatura en pulgadas. Los resultados obtenidos son:
ESTATURA
No. EMPLEADOS
29
75
68
28
Solucin H0 : La estatura de los empleados tiene distribucin normal H1 : La estatura de los empleados no tiene distribucin normal Para hallar la estadstica de trabajo se utiliza la expresin 3.15. Para calcular la frecuencia esperada es necesario obtener la probabilidad en cada intervalo y para sto se requiere el promedio aritmtico y la desviacin estndar, que se obtienen con la informacin suministrada por la muestra, los que respectivamente son: 68,42 y 4,4451.
ESTATURA
nj
pj
ej =n pj
57,5 - 63,5
29
0,.1335
26,70
63,5 - 69,5
75
0,4613
92,26
69,5 - 72,5
68
0,2264
45,28
72,5 - 78,5
28
0,1788
35,76
TOTAL
n = 200 1,0000
200
Con una confiabilidad del 95 por ciento, en una tabla de la distribucin chi-cuadrado y un grado de libertad (nmero de clases: m=4, nmero de estimadores obtenidos a partir de la muestra: k=2, promedio y desviacin estndar. Entonces m-k-1 = 1) se obtiene un valor para Z de 3,84. El valor de la estadstica de trabajo est en la zona de rechazo de la hiptesis nula (Figura 3.21), por lo tanto con una confiabilidad del 95 por ciento, se acepta que la estatura de los empleados no tiene distribucin normal.
En este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral sin corregir o corregida. Si se utiliza la varianza sin corregir ( ) la estadstica de trabajo es la expresin (1.4):
(3.7)
REGLA DE DECISION
- Si se ha planteado la hiptesis alternativa como: H1 : k se tiene una prueba de hiptesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribucin como se aprecia en la figura 3.8
Figura 3.8 Regla de decisin para una prueba de hiptesis a dos colas
y pertenecen a una distribucin X2 con (n-1) grado de libertad. Si el valor de la estadstica de trabajo (T) est entre y no se rechaza la hiptesis nula, en caso contrario se rechaza H0lo cual implica aceptar H1 . Es decir, si <T< no se rechaza H0. - Si se ha planteado la hiptesis alternativa como: H1 : > k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel de significancia ( ) en la parte superior de la distribucin, vease figura 3.9
Figura 3.9 Regla de decisin para una prueba de hiptesis a una cola superior
Z1- pertenece a una distribucin X2 con (n-1) grado de libertad. Si el valor de la estadstica de trabajo (T) es menor que no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si T < no se rechaza H0 . - Si se ha planteado la hiptesis alternativa como: H1 : < k, se tiene una prueba de hiptesis a una cola inferior, quedando el nivel de significancia ( ) en la parte inferior de la distribucin, vease figura 3.10
Figura 3.10 Regla de decisin para una prueba de hiptesis a una cola inferior
Z pertenece a una distribucin X2 con (n-1) grado de libertad. Si el valor de la estadstica de trabajo (T) es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si T >Z no se rechaza H0.
EJEMPLO
Se supone que los dimetros de cierta marca de vlvulas estn distribudos normalmente con una varianza poblacional de 0,2 pulgadas 2 , pero se cree que ltimamente ha aumentado. Se toma una muestra aleatoria de vlvulas a las que se les mide su dimetro, obtenindose los siguientes resultados en pulgadas: 5,5 5,4 5,4 5,6 5,8 5,4 5,5 5,4 5,6 5,7 Con sta informacin pruebe si lo que se cree es cierto. Solucin Se cree que la varianza poblacional ha aumentado, es decir es superior a 0,2; por lo tanto: H0 : H1 : = 0,2 > 0,2
Asumiendo un nivel de confianza del 95 por ciento, en la tabla de la distribucin chi-cuadrado con 9 grados de libertad, se obtiene un valor para Z de 16,919. Como puede observarse en la figura 3.11, el valor de la estadstica de trabajo se ubica en la zona de no rechazo de la hiptesis nula, por consiguiente con una confiabilidad del 95 por ciento se puede afirmar que la varianza poblacional no ha aumentado.
Figura 3.11 Regla de decisin para una prueba de hiptesis a una cola superior