You are on page 1of 14

Pruebas de Hipótesis.

Pruebas de Significancia1 REMIX desde Collaborative Statistics
http://cnx.org/content/m18944/latest/. Recurso en electrónico. http://cnx.org/content/col10522/1.40/pdf

A partir de las muestras realizamos el primer tipo de estudio que se puede elaborar en la estadística inferencial a saber el de la estimación de los parámetros a partir de un intervalo de confianza. Otro tipo de inferencia que podemos hacer es el de tomar una decisión acerca de un parámetro, por ejemplo decir que un tratamiento funciona mejor que otro, que un producto es menos efectivo, más caro, rinde menos….o qué son iguales. Entonces para poder decirlo a partir de una muestra podremos rechazar o aceptar una hipótesis estadística. Lo haremos sobre las distribuciones muestrales que hemos trabajado. • Las medias con varianza de la población conocida • Las medias con varianza de la población desconocida • Las proporciones El procedimiento contempla los siguientes pasos 1. Establecer dos hipótesis contradictorias 2. Recopilar las datos de la muestra (en algunos problemas ya son dados los datos o los valores para los estadísticos) 3. Determinar la distribución para llevar a cabo la prueba de hipótesis 4. Analizar los datos de la muestra para llevar a cabo los cálculos que permitirán rechazar o no la hipótesis nula 5. Tomar una decisión y escribirla en forma significativa y en lenguaje natural.

Establecer dos hipótesis contradictorias
DOS HIPÓTESIS OPUESTAS Y COMPLEMENTARIAS HIPÓTESIS NULA H0 HIPÓTESIS ALTERNATIVA Ha En la hipótesis nula es la que se asume como cierta mientras no se muestre lo contrario de acuerdo a una duda razonable. (SIEMPRE LLEVA EL SIGNO IGUAL) La hipótesis alternativa generalmente es lo que se quiere probar que cambió… y es contraria a H0. Es lo que se concluye si se rechaza la hipótesis nula.
1

Texto, ejercicios adaptados y traducidos al español desde: Collaborative Statistics http://cnx.org/content/m18944/latest/. Recurso en electrónico. http://cnx.org/content/col10522/1.40/pdf

Ejemplo 1 Ho: No más del 70% del electorado votó el 2 de Julio para presidente de la República Ha: Más del 70% del electorado votó el 2 de Julio para presidente de la República Ejemplo 2 Se quiere probar que a los estudiantes les toma menos de 5 años en promedio terminar su carrera. Ho: µ=5 Ha: µ<5 En resumen

Ho = ≥ ≤

Ha ≠ < >

La hipótesis nula siempre tiene el signo igual. La alternativa nunca tiene el signo igual. El símbolo dependerá de lo que se quiere probar.

Ejercicio de formulación de Hipótesis
Encuentra información de tu interés sobre los cuáles puedas formular al menos 5 hipótesis nulas y sus alternativas complementarias, en los siguientes sitios y utilizando la guía de trabajo. Infografías: http://visual.ly/ Blogs de divulgación científica: http://quetraman.com/lista-de-25-o-mas-grandes-blogs-dedivulgacion-cientifica/ Periódico local:http://www.elsiglodetorreon.com.mx/votaciones/ Nombre del Artículo Sitio en Internet: ¿Qué afirma el sitio:? ¿Qué quieres probar o piensas que podría ser diferente? ¿Cuál es tu variable?

¿Es una media o una proporción? Hipótesis Nula.: Hipótesis Alternativa.:

Ejemplo.
Nombre del Artículo 100 Years of Change Sitio en Internet: http://visual.ly/100-years-change ¿Qué afirma el sitio:?

¿Qué quieres probar o piensas que podría ser diferente? ¿Cuál es tu variable? ¿Es una media o una proporción? Hipótesis Nula.: Hipótesis Alternativa.: Error Tipo I

El número de personas que habitan en una casa en Torreón en promedio es mayor de 2.59 Número de personas que habitan en una casa en Torreón Es una media El número de personas que habitan una casa en Torreón es en promedio menor o igual a 2.59 El número de personas que habitan una casa en Torreón es en promedio mayor de 2.59 Rechazar siendo cierta Afirmar que el número de personas que habitan en promedio una casa en Torreó es mayor a 2.59 cuando en realidad es menor (hacer casas de 3 habitaciones cuando sólo se necesitan 2)… No Rechazar siendo falsa Afirmar que el número de personas que habitan en Torreón es en promedio menor o igual a 2.59 cuando en realidad son más (Hacer casas de 2 habitaciones cuando se necesitan 3 o más)

Error Tipo II

Resultados posibles en las pruebas de hipótesis
Son cuatro los resultados que puedes obtener cuando llevas a cabo una prueba de hipótesis de acuerdo a si aciertas o te equivocas, que se pueden resumir en la siguiente tabla Acción Cierta No se rechaza Correcto Error tipo II Se rechaza Error Tipo I • • • • H0 es Falsa

β

α

Correcto

La decisión es de no rechazar cuando la hipótesis nula es cierta (decisión correcta) La decisión de rechazar Ho cuando es cierta (decisión incorrecta, conocida como error tipo I) La decisión de no rechazarla cuando es falsa (decisión incorrecta conocida como error tipo II) La decisión de rechazar Ho cuando es falsa (decisión correcta)

α β

es la probabilidad de cometer el error tipo I… rechazarla siendo cierta (conocido como

nivel de significancia) es la probabilidad de cometer el error tipo II aceptarla siendo falsa

Ejemplos Pensar que la tirolesa no es segura cuando si lo es (error tipo I) Pensar que la tirolesa es segura cuando no lo es (error tipo II) (en este caso es más grave el error tipo II) Suponer que la hipótesis nula dice que la víctima de un accidente automovilístico está viva cuando llega al hospital. El médico de urgencias piensa que la víctima está muerta cuando está viva (rechaza siendo cierta, error tipo I) (en este caso es más grave el error tipo I) El médico de urgencias piensa que la víctima está viva cuando está muerta (acepta siendo falsa, error tipo II)

Nombre del Artículo Sitio en Internet: ¿Qué afirma el sitio:? ¿Qué quieres probar o piensas que podría ser diferente? ¿Cuál es tu variable? ¿Es una media o una proporción? Hipótesis Nula.: Hipótesis Alternativa.: Error Tipo I Error Tipo II

Ejemplo incorporando la lectura de los errores tipo I y II.
Nombre del Artículo 100 Years of Change http://visual.ly/100-years-change Sitio en Internet: ¿Qué afirma el sitio:?

¿Qué quieres probar o piensas que podría ser diferente? ¿Cuál es tu variable? ¿Es una media o una proporción? Hipótesis Nula.: Hipótesis Alternativa.: Error Tipo I

El número de personas que habitan en una casa en Torreón en promedio es mayor de 2.59 Número de personas que habitan en una casa en Torreón Es una media El número de personas que habitan una casa en Torreón es en promedio menor o igual a 2.59 El número de personas que habitan una casa en Torreón es en promedio mayor de 2.59 Rechazar siendo cierta Afirmar que el número de personas que habitan en promedio una casa en Torreó es mayor a 2.59 cuando en realidad es menor (hacer casas de 3 habitaciones cuando sólo se necesitan 2)… No Rechazar siendo falsa Afirmar que el número de personas que habitan en Torreón es en promedio menor o igual a 2.59 cuando en realidad son más (Hacer casas de 2 habitaciones cuando se necesitan 3 o más)

Error Tipo II

Cuáles distribuciones se utilizarán para la prueba de Hipótesis
• • • Distribución normal varianza conocida si la hipótesis incluye la media Distribución t student varianza desconocida y tamaño de muestra menor de 30 si la hipótesis incluye la media Distribución normal si la hipótesis incluye a la proporción.

Información para tener en cuenta
• • • • En una prueba de hipótesis la prueba tiene un nivel de significancia denominado con la letra que es el error tipo I El nivel de significancia debe escogerse antes de realizar la prueba

α

= .05 Si no se da un nivel de significancia el estándar aceptado es de De acuerdo a las siguientes hipótesis las pruebas son de dos colas, cola izquierda o cola derecha.

α

Ho =

Ha ≠

Gráfica

<

>

La Hipótesis alternativa Ha nunca lleva el signo igual.

• • •

Si α>p-value rechazar H0. Por los resultados de la muestra hay suficiente evidencia para concluir que es incorrecta la hipótesis nula y que la alternativa podría ser la correcta. Si α<p-value aceptar H0. Por los resultados de la muestra hay suficiente evidencia para concluir que es correcta la hipótesis nula y que la alternativa podría sería la incorrecta. Cuando no se rechaza la Ho, no significa que se crea que es cierta sino que no hay suficiente evidencia para dudar de ella.

Ejemplo tamaño de muestra pequeña y varianza conocida
Suponga que un panadero anuncia que el pan que el hace tiene una altura mayor de 15 cms. Muchos de sus clientes no le creen. Para comprobarlo el panadero decide hacer una prueba de hipótesis. Hornea 10 panes y les mide su altura, resultando la media de esta muestra de 17 cm. El sabe con anterioridad que la desviación estándar del horneado de pasteles es de 0.5 cm

Ejemplo Media Varianza conocida de población, de muestra, tamaño menor o igual a 30
Un entrenador de fútbol de la universidad piensa que sus jugadores levantan pesas en un promedio de 275 libras. Se sabe que la desviación estándar es de 55 libras. Tres de sus jugadores piensan que el peso promedio es mayor y le pidieron a 30 de sus compañeros que levantaran diferentes pesos. Los datos que obtuvieron fueron los siguientes. Peso levantado 205 215 225 241 252 265 275 313 316 338 341 345 368 385 Frecuencia 3 3 1 2 2 2 2 2 5 2 1 2 2 1

Para establecer estadísticamente cuál es lo más razonablemente posible se lleva a cabo una prueba de hipótesis con un nivel de significancia de 2.5% para determinar si los jugadores levantan más de 275 libras.

Ejemplo Varianza desconocida, tamaño de muestra pequeña
Se sabe que la puntuación promedio que obtienen los estudiantes de psicología en un test de inteligencia abstracta es de 65. Un instructor piensa que el promedio es mayor y aplica el test a 10 estudiantes de psicología obteniendo las siguientes puntuaciones. 65 65 70 67 66 63 63 68 72 71

Realiza una prueba de hipótesis en la que se pueda estadísticamente apoyar lo que piensa el instructor, con un nivel de significancia del 5%, esto es con el riesgo de rechazar la hipótesis nula siendo cierta.

Ejemplo proporciones
Se cree que en el 50% de los matrimonios los contrayentes son del mismo lugar de origen. Se realiza una prueba de hipótesis para determinar si el porcentaje es el mismo o diferente al 50%. Para hacerlo se muestrea 100 matrimonios y en 53 de ellos los contrayentes son del mismo lugar de origen. Para la prueba de hipótesis utilice un nivel de significancia del 1% Ejemplo 5 El siguiente ejemplo es un poema escrito por un estudiante de estadísticas llamado Nicole Hart. El poema es inteligente con buen humor, así que por favor disfruten! Mi perro tiene muchas pulgas, que no se quitan fácilmente. En cuanto al champú, he probado muchos. Incluso uno llamado bomba-burbuja, con el que sólo murieron el 25% de las pulgas. Por desgracia yo no estaba contento también utilicé muchos tipos de jabón, había perdido la esperanza hasta que ví un anuncio que me llamó la atención Este champú es para perros se llama “mejor imposible” y dice que sirve hasta para un chango Y que garantizaba matar más pulgas que el otro. Lo compré y bañe a Fido Dispuesto a hacer los cálculos Las pulgas empezaron a caer en un dos por tres Antes de ponerle su champú conté 42. al finalizar el baño las volví a contar. El nuevo champú había matado 17 pulgas Lo que realmente me encantó.

Ahora es el momento de que me hagas un favor Con un nivel de significancia del 0.01, Tienes que ayudarme a averiguar si utilizó el nuevo champú o sigo buscando otro más.

Ejercicios
1. Supongamos que en un artículo reciente se afirmó que el tiempo promedio que pasa en la cárcel un ladrón condenado por primera vez es de 2.5 años. Recientemente se realizó un estudio para ver si el tiempo promedio se ha incrementado en este nuevo siglo. Se seleccionó una muestra aleatoria de 26 ladrones condenados por primera vez y el tiempo promedio de tiempo de esa encuesta fue de 3 años con una desviación estándar de 1.8 años. Supongamos que se sabe la desviación estándar de la población y que es igual a 1.5 años. Realiza una prueba de hipótesis para determinar si el promedio de tiempo que pasa un ladrón condenado por primera vez ha aumentado. 2. Un estudio aleatorio de 75 presos condenados a muerte reveló que el promedio de tiempo en el corredor de la muerte es de 17.4 años con una desviación estándar de 6.3 años. Realiza una prueba de hipótesis para determinar si el tiempo de la media poblacional en el corredor de la muerte podría ser de 15 años. 3. El Instituto Nacional de Salud Mental publicó un artículo afirmando que en cualquier período del año, aproximadamente el 9.5% de los adultos estadounidenses sufren depresión o una enfermedad depresiva. (http://www.nimh.nih.gov/publicat/depression.cfm). Supongamos que en una encuesta realizada a 100 personas en una determinada ciudad, siete de ellos sufría de depresión o una enfermedad depresiva. Realiza una prueba de hipótesis para determinar si la verdadera proporción de personas en esa ciudad que sufren de depresión o un trastorno depresivo es más baja que el porcentaje en la población general estadounidense adulta. 4. De generación en generación, la edad media cuando los fumadores comienzan a fumar varía. Sin embargo, la desviación estándar de la edad se mantiene constante de alrededor de 2,1 años. Se hizo un estudio de 40 fumadores de esta generación para ver si la edad media de inicio es al menos 19. La media de la muestra fue 18,1 con una desviación estándar de muestra de 1,3. ¿Los datos apoyan la afirmación al nivel del 5%? 5. El costo de un periódico varía de ciudad en ciudad. Sin embargo, la variación entre los precios permanece estable con una desviación estándar de 20 ¢. Se realizó un estudio para probar la aseveración de que el promedio del costo de un diario es de $ 1.00. Doce periódicos promediaron 95 ¢ con una desviación estándar de 18 ¢. ¿Los datos apoyan la afirmación al nivel del 1%?

6. Un artículo en el San Jose Mercury News dijo que a los estudiantes de la universidad estatal de California les lleva en promedio 4,5 años, terminar sus estudios universitarios. Supongamos que usted cree que la media de tiempo es más largo. Se realiza una encuesta a 49 estudiantes y se obtiene una media muestral de 5.1 con desviación estándar de la muestra de 1,2. ¿Los datos apoyan su reclamo en el nivel de 1%? 7. Se piensa que el número promedio de días anuales por enfermedad de un empleado es de aproximadamente 10. Miembros de un departamento de personal no cree esta cifra y examinan al azar 8 empleados. El número de días de enfermedad que cada uno de ellos tuvo son: 12, 4, 15, 3, 11, 8, 6, 8. Sea x = el número de días de enfermedad que tuvo el año pasado. ¿Tiene razón el equipo de personal en creer que al promedio es de aproximadamente 10? 8. En 1955, la revista Life informó de que las mujeres de edad de 25 años y con tres hijos trabaja en promedio por semana 80 horas. Recientemente, muchos grupos han estado estudiando si el movimiento de mujeres ha, dado lugar a un aumento en el promedio de horas de trabajo por semana para las mujeres. (que combinan el empleo y el trabajo en casa). Supongamos que se realizó un estudio para determinar si la semana laboral promedio se ha incrementado. 81 mujeres fueron encuestadas con los siguientes resultados. La media de la muestra fue de 83; la desviación estándar de la muestra fue de 10. ¿El promedio de las horas de trabajo por semana ha aumentado para las mujeres en un nivel de significancia del 5%? 9. Un Nissan Motor Corporation anuncio decía: "IQ del hombre común es 107. El promedio I.Q. de la trucha marrón es 4. ¿Por el hombre que es más inteligente no puede pescar truchas marrones? "Supongamos que usted cree que el IQ promedio de la trucha marrón es mayor que 4. Un psicólogo de pescado determina el IQ de 12 truchas y reporta los resultados así: 5; 4; 7; 3; 6; 4; 5; 3; 6; 3; 8; 5. Realiza una prueba de hipótesis alrededor de su creencia. 10. Una encuesta realizada por la revista Newsweek reveló que 13% de los estadounidenses han visto o detectado la presencia de un angel. Un contingente duda de que este porcentaje sea realmenente tan alto, lleva su propia encuesta de 76 estadounidenses encuestados, sólo 2 habían visto o sentido la presencia de un ángel. Como resultado de la encuesta de los contingentes, ¿Está de acuerdo con la encuesta de Newsweek?

Ejercicio y procedimiento (hoja de trabajo).
1. Establecer dos hipótesis contradictorias ¿Qué es lo que se quiere probar? ________________________________________________ H0: _____________________________________ Ho: µ ___ _____ Ha: _____________________________________ Ha: µ ___ _____

2. Recopilar las datos de la muestra (en algunos problemas ya son dados los datos o los valores para los estadístico. 3. n = _____
X = ___ µ = ____ p = ____ ρ = _____

σX =

σ

n S SX = = n

σp =

ρ (/ 1 − ρ )
n

1. Determinar la distribución para llevar a cabo la prueba de hipótesis Normal o T de Student con Grados de libertad:____ 2. Analizar los datos de la muestra para llevar a cabo los cálculos que permitirán rechazar o no la hipótesis nula. a. Con el nivel de significancia encontrar los valores críticos de Z o de t según corresponda (TABLAS)

α = .05

b. Con el nivel de significancia calcularlos valores de Z o de t según corresponda de la muestra X −µ Z muestra = p−ρ X −µ σ t muestra = Z muestra = S ρ (1 − ρ ) n n n 3. Tomar una decisión y escribirla en forma significativa y en lenguaje natural, ubicando el valor de la muestra en la zona de aceptación o de rechazo.

4. Calcular el valor de la probabilidad para el valor Z o t de la muestra.

http://www.stat.tamu.edu/~west/applets/tdemo.html

α > pvalue α < pvalue
• • Si α>p-value rechazar H0. Por los resultados de la muestra hay suficiente evidencia para concluir que es incorrecta la hipótesis nula y que la alternativa podría ser la correcta. Si α<p-value aceptar H0. Por los resultados de la muestra hay suficiente evidencia para concluir que es correcta la hipótesis nula y que la alternativa podría sería la incorrecta.