Pruebas de hipótesis para una muestra

Ref: Apuntes de Estadística, Mtra Leticia de la Torre Instituto Tecnológico de Chiuhuahua

Las secciones anteriores han mostrado cómo puede estimarse un parámetro de una población a partir de los datos contenidos en una muestra. Puede encontrarse ya sea un sólo número (estimador puntual) o un intervalo de valores posibles (intervalo de confianza). Sin embargo, muchos problemas de ingeniería, ciencia, y administración, requieren que se tome una decisión entre aceptar o rechazar una proposición sobre algún parámetro de la población. Esta proposición recibe el nombre de hipótesis. tesis Este es uno de los aspectos más útiles de la inferencia estadística, puesto que muchos tipos de problemas de toma de decisiones, pruebas o experimentos en el mundo de la ingeniería, pueden formularse como problemas de prueba de hipótesis.

Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más poblaciones. Empecemos con un ejemplo, suponga que se tiene interés en la rapidez de combustión de un agente propulsor sólido utilizado en los sistemas de salida de emergencia para la tripulación de aeronaves. El interés se centra sobre la rapidez de combustión promedio. De manera específica, el interés recae en decir si la rapidez de combustión promedio es o no 50 cm/s. Esto puede expresarse de manera formal como dos alternativas o hipótesis: Ho; μ = 50 cm/s La rapidez promedio sí es de 50 cm/s H1; μ ≠ 50 cm/s La rapidez promedio no es de 50 cm/s La proposición Ho; μ = 50 cm/s se conoce como hipótesis nula (PENSAR: NO HAY DIFERENCIA) , mientras que la proposición H1; μ ≠ 50 cm/s, recibe el nombre de hipótesis alternativa (PENSAR: SÍ HAY DIFERENCIA).

Ahora bien, se podría considerar sólo una dirección en el caso en la hipótesis alternativa o sea que la hipótesis alternativa especifique valores de μ que pueden ser mayores o menores que 50 cm/s, esto también se conoce como hipótesis alternativa de una cola o unilateral. unilateral En algunas situaciones, lo que se desea es formular una hipótesis alternativa unilateral, como en los casos: Ho; μ = 50 cm/s H1; μ > 50 cm/s o Ho; μ = 50 cm/s H1; μ < 50 cm/s

o de obligaciones contractuales. el objetivo usual de la prueba de hipótesis es probar el cumplimiento de las especificaciones. Por lo general. el objetivo de la prueba de hipótesis es verificar la teoría o modelo. Cuando el valor del parámetro proviene de consideraciones externas tales como las especificaciones de diseño o ingeniería. 2. Puede obtenerse a partir de alguna teoría o modelo que se relaciona con el proceso bajo estudio. 3. entonces el objetivo de la prueba de hipótesis usualmente es determinar si ha cambiado el valor del parámetro.Es importante recordar que las hipótesis siempre son proposiciones sobre la población o distribución bajo estudio. Puede ser resultado de la experiencia pasada o del conocimiento del proceso. En este caso. . En esta situación. el valor del parámetro de la población especificado en la hipótesis nula se determina en una de tres maneras diferentes: 1. no proposiciones sobre la muestra.

se concluye que ésta es verdadera. sin embargo si esta información es inconsistente con la hipótesis. Por tanto. . Si esta información es consistente con la hipótesis. es necesario desarrollar un procedimiento de prueba de hipótesis teniendo en cuenta la probabilidad de llegar a una conclusión equivocada. Usualmente esto es imposible en muchas situaciones prácticas.Un procedimiento que conduce a una decisión sobre una hipótesis en particular recibe el nombre de prueba de hipótesis. Debe hacerse hincapié en que la verdad o falsedad de una hipótesis en particular nunca puede conocerse con certidumbre. se concluye que esta es falsa. a menos que pueda examinarse a toda la población. Los procedimientos de prueba de hipótesis dependen del empleo de la información contenida en la muestra aleatoria de la población de interés.

La hipótesis nula. Entonces. Si la muestra no contradice decididamente a Ho. es la afirmación sobre una o más características de poblaciones que al inicio se supone cierta (es decir. las dos conclusiones posibles de un análisis por prueba de hipótesis son: Rechazar Ho o No rechazar Ho. . nula representada por Ho. La hipótesis alternativa. la “creencia a priori”). investigar La hipótesis nula se rechaza en favor de la hipótesis alternativa. se continúa creyendo en la validez de la hipótesis nula. es la afirmación contradictoria a Ho. sólo si la evidencia muestral sugiere que Ho es falsa. alternativa representada por H1. y ésta generalmente es la hipótesis a investigar.

lo que se desea probar es: Ho. una media muestral muy diferente de 50 cm/s constituye una evidencia que apoya la hipótesis alternativa H1. μ = 50 cm/s H1. . Por otra parte.Prueba de una Hipótesis Para ilustrar los conceptos generales. considere el problema anterior de la rapidez de combustión. la media muestral es el estadístico de prueba. como se mencionó al principio. Por tanto. en este caso. mientras que la hipótesis alternativa es que ésta no es igual a 50 cm/s. μ ≠ 50 cm/s Supóngase que se realiza una prueba sobre una muestra de 10 especímenes. esto es. La media muestral es un estimador de la media verdadera de la población. La hipótesis nula podría ser que la rapidez promedio de combustión es 50 cm/s. Esto es. que apoya la hipótesis nula Ho. y que se observa cual es la rapidez de combustión promedio muestral. Un valor de la media muestral x que esté próximo al valor hipotético μ = 50 cm/s es una evidencia de que el verdadero valor de la media μ es realmente 50 cm/s.

Supóngase que si 48. entonces no se rechaza la hipótesis nula Ho.5 ó x >51. Por tanto.La media muestral puede tomar muchos valores diferentes. entonces se acepta la hipótesis alternativa H1. ¿Puedes ver la similitud de esto con los intervalos de confianza? .5 ≤ x ≤ 51.5 ≤ x ≤ 51. μ ≠ 50 cm/s. Los valores de x que son menores que 48.5 constituyen la región crítica de la prueba.5 o mayores que 51. μ = 50 cm/s.5. y que si x < 48.5 forman la región de aceptación de la hipótesis nula. Las fronteras entre las regiones crítica y de aceptación reciben el nombre de valores críticos. ticos La costumbre es establecer conclusiones con respecto a la hipótesis nula Ho. no se rechaza Ho. se rechaza Ho en favor de H1 si el estadístico de prueba cae en la región crítica. mientras que todos los valores que están en el intervalo 48.5. de lo contrario.

El error tipo I se define como el rechazo de la hipótesis nula Ho cuando ésta es verdadera. de hecho. es posible que el valor verdadero de la rapidez promedio de combustión del agente propulsor sea igual a 50 cm/s. bien puede observarse un valor del estadístico de prueba x que cae en la región crítica. Sin embargo. la hipótesis nula Ho será rechazada en favor de la alternativa H1 cuando. Ho en realidad es verdadera. Este tipo de conclusión equivocada se conoce como error tipo I. para todos los especímenes bajo prueba.Este procedimiento de decisión puede conducir a una de dos conclusiones erróneas. Por ejemplo. . En este caso.

A este nivel se denomina con la letra α.95) entonces el nivel de significancia sería del 5% (0.Para probar si cometemos un error del tipo I consideramos un “nivel de significancia” que nos ayuda a determinar la probabilidad de cometer este tipo de error.05). . Nivel de confianza = (1.α) Análogamente si se tiene un nivel de confianza del 90% entonces el nivel de significancia sería del 10%. Si tuviéramos un nivel de confianza del 95% (0.

aunque la media muestral x cae por error de muestreo dentro de la región de aceptación. En este caso se acepta Ho cuando ésta es falsa. . El error tipo II se define como la aceptación de la hipótesis nula cuando ésta es falsa. Este tipo de conclusión recibe el nombre de error tipo II. II A la probabilidad de tener un error de tipo II se denomina con la letra β.Ahora supóngase que la verdadera rapidez promedio de combustión es diferente de 50 cm/s.

Ho. μ = 50 H1. μ ≠ 50 2. o bilateral. o uniilateral. μ = 50 Este último puede ser de cola derecha o izquierda. μ < 50 . De una cola. se pueden presentar dos tipos de pruebas de hipótesis que son: 1. H1.Tipos de Pruebas de Hipótesis Como mencionamos antes. μ > 50 H1. De dos colas. Ho.

Dato > x Región de aceptación de Ho Región de rechazo de Ho = α . 1. El investigador desea comprobar la hipótesis de un valor mayor en el parámetro que el de la hipótesis nula. Dato ≤ x H1. para definir las regiones de aceptación y de rechazo. en este caso el nivel de significancia se carga todo hacia el lado derecho.El tipo de prueba depende de lo que se necesite probar. Prueba de hipótesis: Ho. De una cola derecha.

De una cola izquierda: El investigador desea comprobar la hipótesis de que el parámetro sea menor que el de la hipótesis nula. para definir las regiones de aceptación y de rechazo. Parámetro < x Región de aceptación de Ho Región de rechazo de Ho= α . Parámetro ≥ x H1. en este caso el nivel de significancia se carga todo hacia el lado izquierdo. Prueba de hipótesis: Ho.2.

El nivel de significancia se divide en dos y existen dos regiones de rechazo. es decir. Parámetro = x H1. Parámetro ≠ x Región de aceptación de Ho Región de rechazo de Ho= α/2 Región de rechazo de Ho= α/2 . no importa si es mayor o menor y lo que se busca es si hay diferencia con el valor planteado. Prueba de hipótesis: Ho.De dos colas: El investigador desea comprobar la hipótesis de un cambio en el parámetro.

rechaza H0 .Una Regla para Rechazar H0 Seleciona la probabilidad de error tipo I: α (nivel de significancia).tα entonces. Encuentra el valor estadístico crítico correspondiente (zα en la tabla de la distribución normal estándar o tα en la distribución t de student). Calcula el valor del estadístico para la muestra Si Z o t cae en el rango crítico zα .

05.Datos: μ =70 años s = 8. La muestra parecería indicar que es así pero ¿Cuál es la probabilidad de que la media de la muestra no refleje la verdadera media de la población? Utilizar un nivel de significancia de 0. Queremos probar si la vida media hoy en día es mayor a 70 años con base en esa muestra. 1.05 . 1.EJEMPLOS. Solución: Se trata de una distribución muestral de medias con desviación estándar conocida.8 años n = 100 α = 0.9 años.8 años.9 años x = 71. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado muestra una vida promedio de 71. Suponga una desviación estándar poblacional de 8.

64 6. Regla de decisión: Si z ≤ 1. μ > 70 años.645 no se rechaza Ho. 5. . 3. StDev=1 0. zα = 1. Mean=0. Cálculos: Density Normal. μ = 70 años.1 0.645 4. Decisión y justificación. H1.645 se rechaza Ho y se concluye con un nivel de significancia del 0.2.0 0 X 1.02 >1.3 0.05 que la vida media hoy en día es mayor que 70 años.05 0.2 0.4 0. Nivel de significancia α = 0. Como 2. Establecemos la hipótesis Distribution Plot Ho.05.645 se rechaza Ho. Si z > 1.

Por lo tanto usamos la distribución normal. Una empresa eléctrica fabrica baterías de celular que tienen una duración que se distribuye de forma aproximadamente normal con una media de 800 horas y una desviación estándar de 40 horas. Datos: μ =800 horas s = 40 horas x = 788 horas n = 30 α = 0. Si una muestra aleatoria de 30 baterías tiene una duración promedio de 788 horas. ¿muestran los datos suficiente evidencia para decir que la duración media no es 800? Utilice un nivel de significancia del 0.04. Se trata de una distribución muestral de medias con desviación estándar poblacional conocida.04 . Solución: 1. 2.2.

Nivel de significancia a = 0. za = -1.75 0. StDev=1 0. entonces las hipótesis a plantear son: Ho.04.4 Distribution Plot Normal.3.1 0. Mean=0.3 Density 0.2 0.0 -1. Prueba de hipótesis. μ < 800 horas 4. μ ≥ 800 horas H1.04 0. Como a la empresa no le preocupa si la duración es igual o mayor a su propuesta.75 0 z .

2 0. .04 que la duración media de las baterías no ha cambiado.3 Density 0. z < -1. 0.643 ≥ -1.75 0 z 7. Mean=0.0 -1.75 se rechaza Ho.4 5. Decisión y justificación Como -1.04 6.1 0. Cálculos: 0. StDev=1 0.75 no se rechaza Ho.75 por lo tanto.Distribution Plot Normal. Si Si Regla de decisión: z ≥ -1. no se rechaza Ho y se concluye con un nivel de significancia del 0.

con la diferencia que empleamos la distribución t de student . el procedimiento a seguir es similar al anterior.Muestras pequeñas Para el caso de muestras pequeñas (n < 30).

¿esto sugiere con un nivel de significancia de 0. Se afirma que una aspiradora gasta un promedio de 46 kilowatt-hora al año. El Instituto Eléctrico Edison publica cifras del número anual de Kilowatt-hora que gastan varios aparatos eléctrodomésticos. en promedio. Datos: μ= 46 kilowatt-hora s= 11.9 kilowatt-hora.05 que las aspiradoras gastan.05 .9 kilowatt-hora x = 42 kilowatt-hora n = 12 α = 0.Ejemplos: 1. menos de 46 kilowatt-hora anualmente? Suponga que la población de kilowatt-hora es normal. Si una muestra aleatoria de 12 hogares que se incluye en un estudio indica que las aspiradoras gastan un promedio de 42 kilowatt-hora al año con una desviación estándar de 11. Solución: 1.

μ < 46 kilowatt-hora 3.95 (α = 0. Prueba de hipótesis Ho.796 No se rechaza Ho Si t < -1.2.3 Density tc para 0.05) con 11 grados de libertad 4.1 0.0 -1.796 Se rechaza Ho .05 0.796 0 X Si t ≥ -1. Regla de decisión: 0. df=11 0.2 0. μ = 46 kilowatt-hora H1.4 0. Valores críticos Distribution Plot T.

0 -1.16 11.4 0.1 0.3 Density 0. por lo tanto no se rechaza Ho y se concluye con un nivel de significancia del 0. Cálculo del valor t para los datos Distribution Plot T.05 que el número promedio de kilowatt-hora que gastan al año las aspiradoras no es significativamente menor que 46.05 0.16 > -1.9 s 12 n 6. Decisión y justificación : Como –1.796.2 0. df=11 0.796 0 X t= 42 − 46 x−μ = = −1.5. .

Nivel de significancia α ¿Cuál es el máximo de probabilidad de error tipo I (α) que estaríamos dispuestos a aceptar? Región de rechazo de Ho= α .

Pruebas de Hipótesis en general Si σ es conocida y los datos son normales. aplicamos el Teorema del Límite Central y dependiendo de lo que se desea probar: H0 : µ = µ 0 H0 : µ = µ 0 H0 : µ = µ 0 Ha: µ < µ0 una cola izquierda Ha: µ > µ0 una cola derecha Ha: µ ≠ µ0 dos colas Se compara z= x − μ0 σ con zα/2 ó zα n .

Si σ es desconocida (la desviación estándar de la población). Usamos la prueba t con la desviación estándar de la muestra: x − μ0 t= s n Recordando que: La estadística de la prueba y se compara con α/2 ó α t t student con n-1 grados de libertad. . t tiene una distribución t de Cuando n > 30. se puede usar la tabla de la distribución normal en vez de la t. pero tenemos datos distribuídos de forma normal y n ≤ 30.

observar z < -2. y la alternativa es Ha: µ< µ0 ¿Cuál es la probabilidad de El área desde z = -2.41 0 X . Mean=0. 0.00798 por lo que ese es el valor de p.2 0.00798 0. StDev=1 0.41 hacia el extremo nos da un valor de 0.Valor p de la prueba Es la probabilidad de observar un valor extremo de la estadística a prueba si se supone que la hipótesis nula es cierta.3 Density Distribution Plot Normal.41? Si H0 es cierta.1 0.0 -2.4 0.

Pero también se puede comparar el valor de p directamente con el de α (= 0. P(t<-1. El área color amarillo sería el valor p para una t = . puede verse que es menor al área azul que es la región crítica. Eso implica que un valor de t = .7293) = . -t.05 -2.7293 se rechaza H0 al nivel α del 5% de significancia. Si p es menor que α se rechaza H0 al nivel del 5% de significancia.Ejemplo de empleo del valor p.05).41 -1.2.41 rechaza la hipótesis nula.05 = -1.7293 .7293 Si t < -1.2.41.

.Más ejercicios de Pruebas de Hipótesis.

05.5 onzas.5 onzas s= 0.5 onzas con un nivel de significancia de 0.24 onzas x = 5.1.23 onzas con una desviación estándar de 0.05 .24 onzas. Datos: μ= 5. pero como el tamaño de muestra es mayor a 30 se puede tomar la desviación muestral como un estimador puntual para la poblacional. El fabricante quiere poner en la etiqueta que el peso promedio es de 5. en promedio 5. Probar la hipótesis de que μ ≥ 5.5 onzas contra la hipótesis alternativa. Solución. μ < 5. Se trata de una distribución muestral de medias con desviación estándar desconocida. Una muestra aleatoria de 64 bolsas de hojuelas de maíz pesan.23 onzas n = 64 α = 0.

5 onzas H1.24 n 64 . μ < 5.23 − 5.5 z= = = −9 s 0.Prueba de hipótesis Ho.645 Se rechaza Ho Cálculos x − μ 5.645 No se rechaza Ho Si Z < -1.5 onzas Regla de decisión: Si Z ≥ -1. μ ≥ 5.

05 que las bolsas de hojuelas de maíz pesan en promedio menos de 5.70 p = 8/15 = 0.Justificación y decisión: Como –9 < -1. ¿Estaría de acuerdo con esta afirmación si una investigación de casas nuevas en esta ciudad muestra que 8 de 15 tienen instaladas calefactores ? Utilizar un nivel de significancia de 0.645 por lo tanto se rechaza Ho y se concluye con un nivel de significancia del 0.10 Datos: Como nP ≥ 5 y n(1-P) casi 5. P= 0. Un constructor afirma que se instalan calefactores en 70% de todas las casas que se construyen hoy en día en la ciudad de Richmond. Solución.5333 n = 15 α = 0.5 onzas.10. 2. Se trata de una distribución muestral de proporciones y una prueba de dos colas. 30 podemos usar la z .

7613 t=1.7613 Regla de Decisión: Si –1.7613 Se rechaza Ho Cálculos: t= p− P P (1 − P ) n = 0. P = 0.Prueba de hipótesis Ho.70 H1. P ≠ 0.7613 ≤ t ≤ 1.41 .7613 ó si Z > 1.7613 No se rechaza Ho Si Z < -1.533 − 0.70 (0.30) 15 = −1.70)(0.70 t= -1.

7613≤ -1.10 que la afirmación del constructor es cierta.41 ≤ 1.7613 No se rechaza Ho y se concluye con un nivel de significancia de 0.Decisión y justificación: Como –1. .

el fabricante supone que μ es igual o mayor a 12 onzas.5 onzas con una desviación estándar de 2 onzas. establecer si se puede afirmar con un nivel de significancia de 0. Suponiendo que se prueba una muestra de 45 latas y se encuentra un volúmen promedio de 10. Una lata de 12 onzas de refresco se diseña para que contenga una cantidad ligeramente mayor que 12 onzas. un volúmen menor a 12 onzas ocasiona que los consumidores demanden al fabricante. Solución Se trata de una distribución de medias con n > 30.01 que el fabricante está en lo correcto.3. Sin embargo.01 .5 s=2 n = 45 α = 0. de tal manera que si excede este volúmen no hay problemas. Datos: μ= 12 x =10. En el proceso normal de producción.

5 − 12.03 s 2 n 45 . μ < 12 onzas α =0.326 No se rechaza Ho Si Z < -2.326 Regla de decisión: Si Z ≥ -2.Prueba de hipótesis Ho.0 z= = = −5.326 Se rechaza Ho Cálculos: x − μ 10.01 Zα=-2. μ ≥ 12 onzas H1.

03 < . 4. por lo tanto la Ho también se rechaza a un nivel de significancia de 0.Justificación y decisión: Como –5.03 < .2.01 que no se pude afirma que las latas tengan un volumen de 12 onzas en promedio. por lo que el resultado anterior no se altera ya que –5.05 Mismas hipótesis Mismos cálculos Encontramos que el valor crítico de Z es ahora Zα = -1.649. Solución Mismos datos excepto α = 0. Resolver el problema anterior considerando un nivel de significancia de 0.649.1.326 por lo tanto se rechaza Ho y se concluye con un nivel de significancia del 0.05.05 .