EDUC 6390: Estadística aplicada en la educación Julio E. Rodríguez Torres Conferencia 14 Prueba de hipótesis cuando σ x es desconocida Bosquejo I.

Introducción..................................................................................................................1 II. La prueba de t para la media.......................................................................................1 A. La familia de distribuciones t...................................................................................1 B. Prueba t de una cola...............................................................................................2 III. Tipos de pruebas estadísticas de hipótesis.................................................................3 A. Pruebas paramétricas.............................................................................................3 La robustez en las pruebas paramétricas...............................................................4 B. Pruebas libres de distribución.................................................................................4 C. Pruebas no paramétricas........................................................................................4 IV. Supuestos para la prueba de z...................................................................................4 V. Supuestos para la prueba de t.....................................................................................4 VI. El intervalo de confianza para la prueba de t..............................................................4 Determinación del intervalo de confianza...............................................................5 VII. Significación estadística y significación práctica........................................................6 I. Introducción En la unidad anterior se hizo la prueba de hipótesis cuando se conocía la desviación estándar de la población. Pero esto ocurre muy raramente. Por lo general, en los experimentos que se llevan a cabo se conoce la desviación estándar de la muestra solamente. En esos casos es necesario utilizar otra prueba estadística. II. La prueba de t para la media A. La familia de distribuciones t Cuando no se conoce la desviación estándar de la población siempre se puede usar la desviación estándar de la muestra, pero dividida entre la raíz cuadrada de n.

pero no se pueden usar las tablas de la distribución normal. Cuando se hace la sustitución, sobre todo para muestras pequeñas, la distribución muestral es diferente de la normal. Realmente se usa toda una familia de distribuciones semejante a la familia de las distribuciones normales, pero que tienen más área bajo los extremos y menos en el centro. (Hinkle, p. 207)

Sin embargo, a medida que el tamaño de la muestra aumenta las distribuciones de t se parecen más a la normal. Por esta razón cuando el tamaño de la muestra es de más de 120 se deja de utilizar la tabla de t y se regresa a la tabla de z. Sin embargo la tabla de t no es tan detallada como la de z. Sólo aparecen los valores críticos de ciertas áreas de rechazo. (Hinkle p.637, Tabla C3) Cada una de las distribuciones de t está asociada con el tamaño de la muestra por medio de los llamados grados de libertad (degrees of freedom). El grado de libertad de la distribución corresponder a (n-1) donde n representa el tamaño de la muestra. Mientras más pequeño es el tamaño de la muestra, hay más área bajo la curva en los extremos de la misma. Por lo tanto, a medida que aumentan los grados de libertad, las distribuciones de t se parecen más a la distribución normal. A partir de 120 la diferencia es tan mínima que se utiliza la normal. Para las pruebas de hipótesis cuando se desconoce la desviación estándar de la población se utiliza la misma metodología que se ha estudiado anteriormente, sólo cambia la estadística y la tabla. La estadística que se utiliza en estos casos es

B. Prueba t de una cola Ejemplo: En una fábrica la capacidad promedio de cierto tipo de batería es 140 amperes-horas. La distribución de la capacidad es normal. Una agencia de servicio al consumidor quiere asegurarse o comprobar que la media prometida por la fábrica es correcta y para hacerlo escogen una muestra aleatoria de 20 baterías. Su interés primordial es asegurarse de que no se estafe a los consumidores. Los resultados son los siguientes: 137.4 139.2 141.1 138.0 140.0 141.8 139.7 140.9 138.8 137.3 136.7 140.6 139.1 133.5 136.3 136.7 144.4 138.2 135.6 134.1

La prueba de hipótesis en esta situación debe ser una prueba de una cola donde la media y la desviación estándar ( obtenidas por medio de la calculadora) son s = 2.66; media = 138.47 Prueba de hipótesis Paso 1 y 2:

Ho: µ H1: µ

x

≥ 140 (no se estafa a los consumidores) < 140 (se estafa a los consumidores)

x

Paso 3: α = 0.05 Paso 4: n = 20 por lo tanto hay n -1 = 19 d.f. Paso 5: En este caso donde σ x no es conocida se usa la prueba t

Paso 6: Para tener 5% del área en la zona de rechazo para una prueba de una cola y 19 df. Esta área corresponde al valor crítico tc = -1.7291

Paso 7: Si t < -1.7291 entonces se rechaza H. Si t > -1.7291 entonces no se rechaza H0. Paso 8:

Paso 9: to cayó en la zona de rechazo, por lo tanto se rechaza la hipótesis nula Paso 10: Hay evidencia para concluir que la capacidad promedio de las baterías es menos de lo que la compañía reclama.

III. Tipos de pruebas estadísticas de hipótesis Uno de los aspectos más importantes de las estadísticas en la investigación es comprender que para poder utilizar una prueba estadística el experimento tiene que cumplir con los supuestos que exige la prueba. Las pruebas de hipótesis pueden ser paramétricas, libres de distribución y noparamétricas. A. Pruebas paramétricas Requieren 1. variables medidas en la escala de razón o intervalar 2. análisis de un parámetro de la población y otros requisitos que dependen de la prueba en específico. La robustez en las pruebas paramétricas Una prueba paramétrica es robusta si a pesar de no cumplir cabalmente con todos los requisitos se puede emplear sin que deforme mucho las conclusiones. Cuando la prueba no es robusta es necesario utilizar otra prueba libre de distribución o no paramétrica. B. Pruebas libres de distribución 1. La prueba estadística no depende de la forma de la distribución de la población 2. Los datos están en escala nominal u ordinal C. Pruebas no paramétricas No tienen que ver con los parámetros de la población IV. Supuestos para la prueba de z La prueba de z es paramétrica por lo tanto requiere que: 1. las variables se midan en la escala de razón o la escala intervalar 2. se lleve a cabo el análisis de un parámetro de la población Además requiere que: 3. las observaciones sean independientes y seleccionadas aleatoriamente 4. la distribución de la población sea normal o que el tamaño de la muestra sea mayor de 30 para poder utilizar el Teorema Central del Límite. V. Supuestos para la prueba de t Es paramétrica por lo tanto requiere que: 1. las variables se midan en la escala de razón o la escala intervalar

2. se lleve a cabo el análisis de un parámetro de la población Además requiere que: 3. las observaciones sean independientes y seleccionadas aleatoriamente 4. la distribución de la población sea normal La prueba de t es robusta si la distribución de la población difiere un poco de la normal, pero el tamaño de la muestra es suficientemente grande (más de 30). Sin embargo, si el tamaño de la muestra es menor de 30 y la población no es normal, entonces es preferible olvidarse de la prueba y usar otra libre de distribución. VI. El intervalo de confianza para la prueba de t Con la prueba de t se utiliza el intervalo de confianza como con la prueba de z, pero la fórmula cambia para los límites del intervalo. Se utiliza la siguiente fórmula:

Ejemplo: En una fábrica la capacidad promedio de cierto tipo de batería es 140 amperes-horas. Un técnico de control de control de calidad quiere chequear que esto sea cierto y para hacerlo escoge una muestra aleatoria de 20 baterías. Para hacerlo debe hallar el intervalo de confianza de 95% que le permitiría decir que la fábrica está funcionando adecuadamente. 137.4 139.2 141.1 138.0 140.0 141.8 139.7 140.9 138.8 137.3 136.7 140.6 139.1 133.5 136.3 136.7 144.4 138.2 135.6 134.1

Si se hiciese una prueba de hipótesis en esta situación ésta debería ser una prueba de dos colas donde la media y la desviación estándar ( obtenidas por medio de la calculadora) son s = 2.66; media = 138.47 Determinación del intervalo de confianza Utilizando la siguiente fórmula

el intervalo es: 138.47 ± (2.093) (2.66/4.47)

138.47 ± 1.24 137.23 < µ
X

< 139.71

Por lo tanto la media de la población se espera que esté en ese intervalo Como la media de la hipótesis nula no está en el intervalo de confianza se puede decir con un 95% de confianza que: Hay evidencia para concluir que la media es diferente de 140 amperes hora. VII. Significación estadística y significación práctica Cuando se rechaza una hipótesis nula, en el lenguaje técnico de las estadísticas se dice que La diferencia entre el parámetro hipotético y la estadística de la muestra es estadísticamente significativa. La pregunta que queda por hacer es si el hecho de que la diferencia sea estadísticamente significativa indica que esta diferencia tenga importancia práctica. Cuando la muestra es grande una pequeña diferencia entre estadística y parámetro puede llegar a ser significativa. Esto se debe a que al aumentar el tamaño de la muestra se logra más precisión estadística, pues el intervalo de confianza se hace más estrecho. Por lo tanto es necesario, en términos del experimento que se lleva a cabo, determinar si esta diferencia es de valor práctico. Puede ser que cueste más parar la fábrica para reparar la máquina que permitir que siga funcionando con un ligero desperfecto. Estas preguntas no las puede responder la estadística, sino la situación en que se da el problema. Lectura: Hinkle capt. 8,9 pp.204-213; pp.217-227 Actividades: Hinkle pp. 213 # 2,3,5,14; pp.227 ej. 6 MENU 6390

Sign up to vote on this title
UsefulNot useful