You are on page 1of 14

¿Qué es una prueba de Hipótesis?

Una prueba de hipótesis es una regla que especifica si se puede aceptar o rechazar una
afirmación acerca de una población dependiendo de la evidencia proporcionada por
una muestra de datos.

Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la
hipótesis nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se
probará. Por lo general, la hipótesis nula es un enunciado de que "no hay efecto" o "no
hay diferencia". La hipótesis alternativa es el enunciado que se desea poder
concl0075ir que es verdadero de acuerdo con la evidencia proporcionada por los datos
de la muestra.

Con base en los datos de muestra, la prueba determina si se puede rechazar la


hipótesis nula. Usted utiliza el valor p para tomar esa decisión. Si el valor p es menor
que el nivel de significancia (denotado como α o alfa), entonces puede rechazar la
hipótesis nula.

Un error común de percepción es que las pruebas estadísticas de hipótesis están


diseñadas para seleccionar la más probable de dos hipótesis. Sin embargo, al diseñar
una prueba de hipótesis, establecemos la hipótesis nula como lo que queremos
desaprobar. Puesto que establecemos el nivel de significancia para que sea pequeño
antes del análisis (por lo general, un valor de 0.05 funciona adecuadamente), cuando
rechazamos la hipótesis nula, tenemos prueba estadística de que la alternativa es
verdadera. En cambio, si no podemos rechazar la hipótesis nula, no tenemos prueba
estadística de que la hipótesis nula sea verdadera. Esto se debe a que no establecimos
la probabilidad de aceptar equivocadamente la hipótesis nula para que fuera pequeña.

Entre las preguntas que se pueden contestar con una prueba de hipótesis están las
siguientes:

 ¿Tienen las estudiantes de pregrado una estatura media diferente de 66 pulgadas?

 ¿Es la desviación estándar de su estatura igual a o menor que 5 pulgadas?

 ¿Es diferente la estatura de las estudiantes y los estudiantes de pregrado en promedio?

 ¿Es la proporción de los estudiantes de pregrado significativamente más alta que la


proporción de las estudiantes de pregrado?

1
Ejemplo de una prueba de hipótesis básica
Usted puede seguir seis pasos básicos para configurar y realizar correctamente una prueba
de hipótesis. Por ejemplo, el gerente de una fábrica de tuberías desea determinar si el
diámetro promedio de los tubos es diferente de 5 cm. El gerente sigue los pasos básicos
para realizar una prueba de hipótesis.

NOTA
Debe determinar los criterios para la prueba y el tamaño de muestra necesario antes de
recolectar los datos.

1. Especificar las hipótesis.

En primer lugar, el gerente formula las hipótesis. La hipótesis nula es: la media de la
población de todos los tubos es igual a 5 cm. Formalmente, esto se escribe como:
H0: μ = 5

Luego, el gerente elige entre las siguientes hipótesis alternativas:

Condición que se probará Hipótesis alternativa

La media de la población es menor que el objetivo. unilateral: μ < 5

La media de la población es mayor que el objetivo. unilateral: μ > 5

La media de la población es diferente del objetivo. bilateral: μ ≠ 5

Como tiene que asegurarse de que los tubos no sean más grandes ni más
pequeños de 5 cm, el gerente elige la hipótesis alternativa bilateral, que indica que
la media de la población de todos los tubos no es igual a 5 cm. Formalmente, esto
se escribe como H1: μ ≠ 5

2. Elegir un nivel de significancia (también denominado alfa o α).

El gerente selecciona un nivel de significancia de 0.05, que es el nivel de


significancia más utilizado.

2
3. Determinar la potencia y el tamaño de la muestra para la prueba.

El gerente utiliza un cálculo de potencia y tamaño de la muestra para determinar


cuántos tubos tiene que medir para tener una buena probabilidad de detectar una
diferencia de 0.1 cm o más con respecto al diámetro objetivo.

4. Recolectar los datos.

Recoge una muestra de tubos y mide los diámetros.

5. Comparar el valor p de la prueba con el nivel de significancia.

Después de realizar la prueba de hipótesis, el gerente obtiene un valor p de 0.004.


El valor p es menor que el nivel de significancia de 0.05.

6. Decidir si rechazar o no rechazar la hipótesis nula.

El gerente rechaza la hipótesis nula y concluye que el diámetro medio de todos los
tubos no es igual a 5 cm.

Hipótesis Nula y Alternativa

Las hipótesis nula y alternativa son dos enunciados mutuamente excluyentes acerca de una
población. Una prueba de hipótesis utiliza los datos de la muestra para determinar si se
puede rechazar la hipótesis nula.

Hipótesis nula (H0)

La hipótesis nula indica que un parámetro de población (tal como la media, la


desviación estándar, etc.) es igual a un valor hipotético. La hipótesis nula suele ser
una afirmación inicial que se basa en análisis previos o en conocimiento
especializado.

Hipótesis alternativa (H1)


La hipótesis alternativa indica que un parámetro de población es más pequeño,
más grande o diferente del valor hipotético de la hipótesis nula. La hipótesis
alternativa es lo que usted podría pensar que es cierto o espera probar que es
cierto.

3
Significancia Estadística y Práctica

La diferencia entre un estadístico de muestra y un valor hipotético es estadísticamente


significativa si una prueba de hipótesis indica que es muy poco probable que la misma
haya ocurrido en virtud de las probabilidades. Para evaluar la significancia estadística,
examine el valor p de la prueba. Si el valor p está por debajo de un nivel de significancia
(α) especificado (generalmente 0.10, 0.05 o 0.01), usted puede decir que la diferencia es
estadísticamente significativa y rechazar la hipótesis nula de la prueba.

Por ejemplo, supongamos que usted desea determinar si el grosor de unos parabrisas de
vehículo supera los 4 mm, tal como lo exigen las normas de seguridad. Usted toma una
muestra de parabrisas y realiza una prueba t de 1 muestra con un nivel de significancia (α)
de 0.05 y plantea las hipótesis siguientes:

 H0: μ = 4
 H1: μ > 4
Si la prueba produce un valor p de 0.001, usted declara significancia estadística y rechaza
la hipótesis nula, porque el valor p es menor que α. Usted concluye a favor de la hipótesis
alternativa: que el grosor de los parabrisas es mayor que 4 mm.
Sin embargo, si el valor p es igual a 0.50, usted no puede declarar significancia estadística.
No tiene suficiente evidencia para afirmar que el grosor promedio de los parabrisas es
mayor de 4 mm.

Un resultado estadísticamente significativo podría no ser significativo desde el punto

de vista práctico

La significancia estadística por sí sola no implica que los resultados tengan una
consecuencia práctica. Si utiliza una prueba con una potencia muy alta, podría concluir que
una pequeña diferencia con respecto al valor hipotético es estadísticamente significativa.
Sin embargo, esa pequeña diferencia podría ser insignificante para su situación. Debe usar
su conocimiento especializado para determinar si la diferencia es significativa desde el
punto de vista práctico.

Por ejemplo, supongamos que usted está evaluando si la media de la población (μ) para
las horas trabajadas en una planta de manufactura es igual a 8. Si μ no es igual a 8, la
potencia de la prueba se acercará a 1 a medida que aumente el tamaño de la muestra y el
valor p se acerque a 0.

4
Con suficientes observaciones, es probable que incluso las diferencias triviales entre los
valores hipotéticos y reales de los parámetros se vuelvan significativas. Por ejemplo,
supongamos que el valor real de mu es 7 horas, 59 minutos y 59 segundos. Con una
muestra lo suficientemente grande, lo más probable es que usted rechace la hipótesis nula
de que μ es igual a 8 horas, aunque la diferencia no tenga importancia práctica.

Los intervalos de confianza (si corresponde) suelen ser más útiles que las pruebas de
hipótesis, porque ofrecen una manera de evaluar la importancia práctica, además de la
significancia estadística. Ayudan a determinar cuál es el valor de un parámetro en lugar de
determinar cuál no es.

¿Qué es un intervalo de confianza?

Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la


muestra, que posiblemente incluya el valor de un parámetro de población desconocido.
Debido a su naturaleza aleatoria, es poco probable que dos muestras de una población en
particular produzcan intervalos de confianza idénticos. Sin embargo, si usted repitiera
muchas veces su muestra, un determinado porcentaje de los intervalos de confianza
resultantes incluiría el parámetro de población desconocido.

En este caso, la línea negra horizontal representa el valor fijo de la media desconocida de
la población, µ. Los intervalos de confianza azules verticales que se sobreponen a la línea
horizontal contienen el valor de la media de la población. El intervalo de confianza rojo
que está completamente por debajo de la línea horizontal no lo contiene. Un intervalo de
confianza de 95% indica que 19 de 20 muestras (95%) de la misma población producirán
intervalos de confianza que contendrán el parámetro de población.

5
Utilice el intervalo de confianza para evaluar la estimación del parámetro de población. Por
ejemplo, un fabricante desea saber si la longitud media de los lápices que produce es
diferente de la longitud objetivo. El fabricante toma una muestra aleatoria de lápices y
determina que la longitud media de la muestra es 52 milímetros y el intervalo de confianza
de 95% es (50,54). Por lo tanto, usted puede estar 95% seguro de que la longitud media de
todos los lápices se encuentra entre 50 y 54 milímetros.

El intervalo de confianza se determina calculando una estimación de punto y luego


determinando su margen de error.

Estimación de punto
Este valor individual estima un parámetro de población usando los datos de la
muestra.

Margen de error
Cuando usted utiliza estadísticos para estimar un valor, es importante recordar que,
sin importar lo bien que esté diseñado su estudio, su estimación está sujeta a error
de muestreo aleatorio. El margen de error cuantifica este error e indica la precisión
de la estimación.

Usted probablemente ya entiende el margen de error, porque está relacionado con


los resultados de las encuestas. Por ejemplo, una encuesta política podría indicar
que el nivel de popularidad de un candidato es de 55% con un margen de error de
5%. Esto significa que el nivel de popularidad real es +/- 5% y, por lo tanto, se
ubica entre 50% y 60%.

Para un intervalo de confianza bilateral, el margen de error es la distancia desde el


estadístico estimado hasta cada el valor del intervalo de confianza. Cuando un
intervalo de confianza es simétrico, el margen de error es la mitad del ancho del
intervalo de confianza. Por ejemplo, la longitud media estimada de un árbol de
levas es 600 mm y el intervalo de confianza oscila entre 599 y 601. El margen de
error es 1.

Mientras mayor sea el margen de error, más ancho será el intervalo y menos
seguro podrá estar usted del valor de la estimación de punto.

6
¿Qué es un nivel de confianza?

El nivel de confianza representa el porcentaje de intervalos que incluirían el parámetro de


población si usted tomara muestras de la misma población una y otra vez. Por lo general,
un nivel de confianza de 95% funciona adecuadamente. Esto indica que si usted recogió
cien muestras y creó cien intervalos de confianza de 95%, cabría esperar que
aproximadamente 95 de los intervalos incluyeran el parámetro de población, tal como la
media de la población, como se muestra en la siguiente figura.

En este caso, la línea negra horizontal representa el valor fijo de la media desconocida de
la población, µ. Los intervalos de confianza azules verticales que se sobreponen a la línea
horizontal contienen el valor de la media de la población. El intervalo de confianza rojo
que está completamente por debajo de la línea horizontal no lo contiene. Un nivel de
confianza de 95% indica que 19 de 20 muestras (95%) de la misma población producirán
intervalos de confianza que incluirán el parámetro de población.

Métodos de obtención de un intervalo confiable

Si el intervalo de confianza es demasiado ancho, usted no puede estar muy seguro del
valor real de un parámetro, como por ejemplo la media. Sin embargo, puede utilizar varias
estrategias para reducir el ancho de un intervalo de confianza y hacer que la estimación
sea más precisa. Las siguientes características afectan el ancho del intervalo de confianza.

 Tamaño de la muestra

 Variación en los datos

 Tipo de intervalo

 Nivel de confianza

7
Aumentar el tamaño de la muestra

Con frecuencia, la manera más práctica de reducir el margen de error es aumentar el


tamaño de la muestra. Por lo general, mientras más observaciones haya, más estrecho será
el intervalo alrededor del estadístico de la muestra. Por lo tanto, se recomienda recolectar
más datos para obtener una estimación más precisa de un parámetro de población.

Debe sopesar los beneficios de una mayor precisión con respecto al tiempo y los recursos
adicionales necesarios para recopilar una muestra más grande. Por ejemplo, un intervalo
de confianza que sea lo suficientemente estrecho como para contener solamente el
parámetro de población requiere que se midan todos los sujetos de la población.
Obviamente, esta estrategia por lo general resultaría muy poco práctica.

Reducir la variabilidad

Mientras menos varíen los datos, más precisa será la estimación de un parámetro de
población.

Eso se debe a que al reducirse la variabilidad de los datos, disminuye la desviación


estándar y, por ende, el margen de error de la estimación. Aunque puede ser difícil reducir
la variabilidad de los datos, a veces se puede lograr ajustando la forma en que se
recolectan los datos. Por ejemplo, puede utilizar un diseño pareado para comparar dos
grupos. También podría reducir la variabilidad mejorando el proceso, de manera que el
proceso sea más consistente, o midiendo con mayor precisión.

Utilizar un intervalo de confianza unilateral

Un intervalo de confianza unilateral tiene un margen de error más pequeño que un


intervalo de confianza bilateral. Sin embargo, un intervalo unilateral indica solo si un
parámetro es menor que o mayor que un valor de corte. Un intervalo unilateral no
proporciona información acerca del parámetro en la dirección opuesta. Por lo tanto, utilice
un intervalo de confianza unilateral para aumentar la precisión de una estimación solo
cuando le preocupe que la estimación sea mayor o menor que un valor de corte, pero no
ambos.

Reducir el nivel de confianza

La ventaja de un nivel de confianza más bajo es que se obtiene un intervalo de confianza


más estrecho y más preciso. La desventaja es que se está menos seguro de que el intervalo
de confianza contiene el parámetro de población de interés.

8
Entonces, reduzca el nivel de confianza solo si, en su situación, la ventaja de una mayor
precisión supera a la desventaja de un menor grado de certeza. Por ejemplo, si es
demasiado costoso aumentar el tamaño de la muestra en su estudio, disminuir el nivel de
confianza reducirá la longitud del intervalo a expensas de perder algo de confianza.

Uso del intervalo de confianza

Supongamos que usted realiza una prueba de hipótesis. Recuerde que la decisión de
rechazar la hipótesis nula (H0) o no rechazarla puede depender del valor p y del nivel
de significancia elegido (también denominado α). Si el valor p es menor que o igual al
nivel de significancia (α), usted rechaza H0; si es mayor que α, usted no puede rechazar
H0.

La decisión también puede basarse en el intervalo de confianza (o límite) calculado


usando el mismo nivel de significancia (α). Por ejemplo, la decisión para una prueba en
el nivel de significancia de 0.05 puede basarse en el intervalo de confianza de 95%:

 Si el valor de referencia especificado en H0 está fuera del intervalo (es decir, es


menor que el límite inferior o mayor que el límite superior), usted puede rechazar H0.
 Si el valor de referencia especificado en H0 está dentro del intervalo (es decir, no
es menor que el límite inferior ni mayor que el límite superior), usted no puede
rechazar H0.

Relaciones lineales, no lineales y monótonas

Cuando se evalúa la relación entres dos variables, es importante determinar cómo se


relacionan las variables. Las relaciones lineales son muy comunes, pero las variables
también pueden tener una relación no lineal o monótona, como se muestra a
continuación. También es posible que no haya relación entre las variables. Usted debería
comenzar por crear una gráfica de dispersión de las variables para evaluar la relación.

Una relación lineal es una tendencia en los datos que se puede modelar mediante una
línea recta. Por ejemplo, supongamos que una aerolínea desea estimar el impacto de los
precios del combustible en los costos de los vuelos. Descubren que por cada dólar de
aumento en el precio de un galón de combustible para aviones, el costo de su vuelo Los

9
Angeles-Nueva York aumenta en aproximadamente $3500. Esto describe una relación
lineal entre el costo del combustible para aviones y el costo del vuelo.

Gráfica 1: Relación lineal positiva fuerte Gráfica 2: Relación lineal negativa fuerte
Cuando ambas variables aumentan o disminuyen simultáneamente a un ritmo constante,
existe una relación lineal positiva. Los puntos de la Gráfica 1 siguen la línea muy de cerca,
lo que sugiere que la relación entre las variables es fuerte. El coeficiente de correlación de
Pearson para esta relación es +0.921.

Cuando una variable aumenta mientras la otra variable disminuye, existe una relación lineal
negativa. Los puntos de la Gráfica 2 siguen la línea muy de cerca, lo que sugiere que la
relación entre las variables es fuerte. El coeficiente de correlación de Pearson para esta
relación es −0.968.

Gráfica 3: Relación lineal débil Gráfica 4: Relación no lineal


Los puntos de los datos de la Gráfica 3 parecen estar distribuidos de manera aleatoria. No
se encuentran cerca de la línea, lo que indica una relación muy débil, si existe alguna. El
coeficiente de correlación de Pearson para esta relación es −0.253. Si una relación entre
dos variables no es lineal, la tasa de aumento o descenso puede cambiar a medida que
una variable cambia, causando un "patrón de curva" en los datos. Esta tendencia en forma
de curva se podría modelar mejor mediante una función no lineal, como una función
cuadrática o cúbica, o se podría transformar para convertirla en lineal. La Gráfica 4 muestra
una relación fuerte entre dos variables. Sin embargo, puesto que la relación es no lineal, el
coeficiente de correlación de Pearson es solo +0.244. Esta relación ilustra por qué es
importante graficar los datos para poder explorar las relaciones que pudieran existir.

10
Gráfica 5: Relación monótona
En una relación monótona, las variables tienden a moverse en la misma dirección relativa,
pero no necesariamente a un ritmo constante. En una relación lineal, las variables se
mueven en la misma dirección a un ritmo constante. La Gráfica 5 revela que ambas
variables aumentan al mismo tiempo, pero no al mismo ritmo. Esta relación es monótona,
pero no lineal. El coeficiente de correlación de Pearson para estos datos es 0.843, pero la
correlación de Spearman es mayor, 0.948.

Las relaciones lineales también son monótonas. Por ejemplo, la relación que se muestra en
la Gráfica 1 es tanto monótona como lineal.

¿Qué es un estadístico de prueba?

Un estadístico de prueba es una variable aleatoria que se calcula a partir de datos de


muestra y se utiliza en una prueba de hipótesis. Puede utilizar los estadísticos de
prueba para determinar si puede rechazar la hipótesis nula. El estadístico de prueba
compara sus datos con lo que se espera bajo la hipótesis nula. El estadístico de prueba
se utiliza para calcular el valor p.

Un estadístico de prueba mide el grado de concordancia entre una muestra de datos y


la hipótesis nula. Su valor observado cambia aleatoriamente de una muestra aleatoria a
una muestra diferente. Un estadístico de prueba contiene información acerca de los
datos que es relevante para decidir si se puede rechazar la hipótesis nula. La
distribución del muestreo del estadístico de prueba bajo la hipótesis nula se denomina
distribución nula. Cuando los datos muestran evidencia clara en contra de los
supuestos de la hipótesis nula, la magnitud del estadístico de prueba se vuelve
demasiado grande o demasiado pequeña dependiendo de la hipótesis alternativa. Esto
hace que el valor p de la prueba se vuelva lo suficientemente pequeño como para
rechazar la hipótesis nula.

11
Por ejemplo, el estadístico de prueba para una prueba Z es el estadístico Z, que sigue
la distribución normal estándar bajo la hipótesis nula. Supongamos que usted realiza
una prueba Z de dos colas con un nivel de significancia (α) de 0.05 y un obtiene un
estadístico Z (también denominado valor Z) de 2.5 basado en sus datos. Este valor Z
corresponde a un valor p de 0.0124. Puesto que este valor p es menor que α, usted
declara significancia estadística y rechaza la hipótesis nula.

Las diferentes pruebas de hipótesis utilizan diferentes estadísticos de prueba según el


modelo de probabilidad asumido en la hipótesis nula. Las pruebas comunes y sus
respectivos estadísticos de prueba incluyen:

Prueba de hipótesis Estadístico de prueba

Prueba Z Estadístico Z

Pruebas t Estadístico t

ANOVA Estadístico F

Pruebas de chi-cuadrada Estadístico de chi-cuadrada

¿Qué es un valor Crítico?

Un valor crítico es un punto en la distribución del estadístico de prueba bajo la hipótesis


nula que define un conjunto de valores que apoyan el rechazo de la hipótesis nula. Este
conjunto se denomina región crítica o de rechazo. Por lo general, las pruebas unilaterales
tienen un valor crítico y las pruebas bilaterales tienen dos valores críticos. Los valores
críticos se determinan de manera que la probabilidad de que el estadístico de prueba
tenga un valor en la región de rechazo de la prueba (cuando la hipótesis nula sea
verdadera) sea igual al nivel de significancia (denotado como α o alfa).

12
Figura A Figura B

Valores críticos en la distribución normal estándar para α = 0.05


La Figura A muestra que los resultados de una prueba Z de una cola son significativos si el
valor del estadístico de prueba es igual a o mayor que 1.64, el valor crítico en este caso. El
área sombreada representa la probabilidad de un error tipo I (α = 5% en este ejemplo) del
área por debajo de la curva. La Figura B muestra que los resultados de una prueba Z de
dos colas son significativos si el valor absoluto del estadístico de prueba es igual a o mayor
que 1.96, el valor crítico en este caso. Las dos áreas sombreadas suman 5% (α) del área por
debajo de la curva.

Ejemplos del cálculo de los valores críticos

En las pruebas de hipótesis, hay dos maneras de determinar si existe suficiente evidencia
con base en la muestra para rechazar H0 o para no rechazar H0. La manera más común es
comparando el valor p con un valor preespecificado de α, donde α es la probabilidad de
rechazar H0 cuando H0 es verdadera. Sin embargo, un método equivalente es comparar el
valor calculado del estadístico de prueba basado en sus datos con el valor crítico. Los
siguientes son ejemplos de cómo calcular el valor crítico para una prueba t de 1 muestra y
un ANOVA de un solo factor.

Cálculo de un valor crítico para una prueba t de 1 muestra

Supongamos que usted está realizando una prueba t de 1 muestra con diez observaciones,
tiene una hipótesis alternativa bilateral (es decir, H1 no es igual a) y está utilizando un nivel
de significancia de 0.10:

1. Seleccione Calc > Distribuciones de probabilidad > t.

2. Seleccione Probabilidad acumulada.

3. En Grados de libertad, ingrese 9 (el número de observaciones menos uno).

4. En Constante de entrada, ingrese 0.95 (uno menos la mitad del nivel de significancia).

13
Esto da una probabilidad acumulada inversa, que es igual al valor crítico, de 1.83311. Si el
valor absoluto del estadístico t es mayor que este valor crítico, entonces usted puede
rechazar la hipótesis nula, H0, en el nivel de significancia de 0.10.

Cálculo de un valor crítico para un análisis de varianza (ANOVA)

Supongamos que usted está realizando un ANOVA de un solo factor con doce
observaciones, el factor tiene tres niveles y usted está usando un nivel de significancia de
0.05:

1. Elija Calc > Distribuciones de probabilidad > F.

2. Seleccione Probabilidad acumulada inversa.

3. En Grados de libertad del numerador, ingrese 2 (el número de niveles de los factores
menos uno).

4. En Grados de libertad del denominador, ingrese 9 (los grados de libertad para el error).

5. En Constante de entrada, ingrese 0.95 (uno menos el nivel de significancia).

Esto da una probabilidad acumulada inversa (valor crítico) de 4.25649. Si el estadístico F es


mayor que este valor crítico, entonces usted puede rechazar la hipótesis nula, H0, en el
nivel de significancia de 0.05.

14

You might also like