You are on page 1of 14

¿Qué es una hipótesis?

Con origen en el término latino hypothesis, que a su vez deriva de un concepto griego,
una hipótesis es algo que se supone y a lo que se le otorga un cierto grado de posibilidad para
extraer de ello un efecto o una consecuencia.

Su validez depende del sometimiento a varias pruebas, partiendo de las teorías elaboradas.

Un ejemplo de hipótesis seria “Mi hipótesis es que, si lanzamos el nuevo producto antes de fin de
año, lograremos aumentar la cuota de mercado”

¿Como se desarrolla una hipótesis?


Para el método científico, una hipótesis es una solución provisoria y que aún no ha sido confirmada
para un determinado problema. De acuerdo a la información empírica que pueda obtenerse en el
trabajo de campo, la hipótesis podrá tener un menor o mayor grado de fiabilidad.

Estos son los pasos a seguir para su construcción y desarrollo:

 Primero se confeccionan preguntas, que surgen naturalmente del desconocimiento acerca


del fenómeno natural que se está estudiando.

 Se sigue con una búsqueda de posibles respuestas, siempre que se basen en procedimientos
y teorías que puedan ser probadas en el campo de la ciencia. Al contrario, aquellas que no
se puedan probar se consideran especulaciones y son ignoradas.
 Procedemos a predecir los resultados que se obtendrán al poner en práctica las respuestas
elaboradas.

 Luego de intentar predecir, se debe experimentar y registar detalladamente los hallazgos,


de modo que se puedan reproducir tantas veces como sea necesario si se reúnen las mismas
condiciones.

 Se analizan y procesan los resultados obtenidos, y se intenta buscar una relación entre los
datos que se hayan registrado a lo largo de la realización de los diversos experimentos.
Además, se contrasta esta información con la predicción antes mencionada. Generalmente,
este análisis culmina en una expresión matemática para organizar la hipótesis, la predicción
y los resultados.

 Por último, se concluye si la hipótesis es verdadera o falsa, dependiendo del grado de


exactitud de la predicción.
1) Prueba de hipótesis para una sola muestra
a) Para la media: Se utiliza una prueba de una muestra para probar una afirmación con
respecto a una media de una población única.

Se considera práctico utilizar la distribución t solamente cuando se requiera que el tamaño de la


muestra sea menor de 30, ya que para muestras más grandes los valores t y z son aproximadamente
iguales, y es posible emplear la distribución normal en lugar de la distribución t.
Ejemplo ilustrativo: La duración media de una muestra de 300 focos producidos por una compañía
resulta ser de 1620 horas.

Como se tiene como dato el tamaño de la población se tiene que verificar si cumple con la condición
para utilizar el factor finito de corrección.
b) Para la proporción: Cuando el objetivo del muestreo es evaluar la validez de una afirmación
con respecto a la proporción de una población, es adecuado utilizar una prueba de una
muestra. La metodología de prueba depende de si el número de observaciones de la
muestra es grande o pequeño.

Como se habrá observado anteriormente, las pruebas de grandes muestras de medias y


proporciones son bastante semejantes. De este modo, los valores estadísticos de prueba miden la
desviación de un valor estadístico de muestra a partir de un valor propuesto. Y ambas pruebas se
basan en la distribución normal estándar para valores críticos. Quizá la única diferencia real entre
las ambas radica en la forma corno se obtiene la desviación estándar de la distribución de muestreo.

Esta prueba comprende el cálculo del valor estadístico de prueba Z

Posteriormente este valor es comparado con el valor de Z, obtenido a partir de una tabla normal a
un nivel de significación seleccionado.
Como ocurrió con la prueba de medias de una muestra, las pruebas de proporciones pueden ser de
una o dos colas.

La primera alternativa establece una prueba de cola derecha, la segunda, izquierda y la tercera, una
prueba de dos colas.

Ejemplo ilustrativo: En un estudio se afirma que 3 de 10 estudiantes universitarios trabajan. Pruebe


esta aseveración, a un nivel de significación de 0,025, respecto a la alternativa de que la proporción
real de los estudiantes universitarios trabajan es mayor de lo que se afirma, si una muestra aleatoria
de 600 estudiantes universitarios revela que 200 de ellos trabajan. La muestra fue tomada de 10000
estudiantes.

Los datos son:

Como en los datos aparece el


tamaño de la población, se
debe verificar si el tamaño de
la nuestra es mayor que el 5%.
Se remplaza valores en la
siguiente fórmula:
c) Para la varianza: En situaciones como control estadístico de la calidad, de antemano se
conocen los parámetros de referencia del proceso bajo control. La actividad para decidir si
en un momento dado, el proceso está bajo de control, es la confrontación permanente de
los datos obtenidos con la hipótesis sobre la centralidad del proceso (media) sobre la
magnitud de su variabilidad (varianza)

La varianza como medida de dispersión es importante dado que nos ofrece una mejor visión de
dispersión de datos.

Así podremos determinar una franja de confianza, con la base en la cual podríamos tomar decisiones
al respecto.

Para esto entonces debemos conocer nuestro estadístico de prueba considerando que la población
sigue una distribución normal:

Distribución de probabilidad normal, para lo cual usamos el siguiente estadístico de prueba:


Este estadístico de prueba se le conoce como Hi cuadrada:

Es frecuente que se desee comprobar si la variación o dispersión de una variable ha tenido alguna
modificación, lo cual se hace con la prueba de hipótesis para la varianza.

- Prueba de hipótesis a dos colas


H0 : σ2 = k
H1 : σ2 ≠ k
- Prueba de hipótesis a una cola superior

H0 : σ2 = k ó H0 : σ2 ≤ k
H1 : σ2 > k ó H1 : σ2 > k
- Prueba de hipótesis a una cola inferior

H0 : σ2 = k ó H0 : σ2 ≥ k
H1 : σ2 < k ó H1 : σ2 < k
Varianza muestral sin corregir o corregida:

Regla de decisión:

Si se ha planteado la hipótesis alternativa como:


H1:σ2≠k se tiene una prueba de hipótesis a dos colas,
por lo tanto, el nivel de significancia α se divide en dos
partes iguales, quedando estos valores en los
extremos de la distribución como se aprecia.

Zα/2 y Z1- α/2 pertenecen a una distribución X2 con


(n-1) grado de libertad. Si el valor de la estadística de
trabajo (T) está entre Zα/2 y Z1- α/2no se rechaza la
hipótesis nula, en caso contrario se rechaza H1 , es
decir, si Zα/2<T<Z1- α/2no se rechaza H0.
- Si se ha planteado la hipótesis alternativa como:
H1 : σ2 > k , se tiene una prueba de hipótesis a una
cola superior, quedando el nivel de significancia (α) en
la parte superior de la distribución.
Ejemplo práctico: Una empresa del giro alimenticio desea determinar si el lote de una materia prima
tiene o no una varianza poblacional mayor a 15 en su grado de endulzamiento. Se realiza un
muestreo de 20 elementos y se obtiene una varianza muestral de 20.98; realizar la prueba de
hipótesis con alfa = 0.05.

Paso 1: Determinar la hipótesis Nula “Ho” y Alternativa “H1”.


Ho: La varianza poblacional es igual a 15.
(Algunos autores colocarían “La varianza poblacional es igual o menor a 15”).
H1:La varianza es mayor a 15.
Es decir: Ho: σ2 ≤ 15
H1: σ2 > 15 (prueba de una cola)

Paso 2: Determinar el nivel de significancia. Definido por el analista,


en este caso se desea usar α = 0.05
Esta es la forma gráfica de ji cuadrada
Z1-α pertenecen a una distribución X2con (n-1) grado de libertad. Si el valor de la estadística de
trabajo (T) es menor que Z1- α/2 no se rechaza la hipótesis nula, en caso contrario se rechaza H0lo
cual implica aceptar H1, es decir
T<Z1- α/2 no se rechaza H0.
H1 : σ2 <k, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de significancia
(α) en la parte inferior de la distribución.

El área sombreada representa alfa o la fracción de error. Nótese que es prueba de una cola por lo
que alfa no se divide en dos.
Paso 3: Calcular los intervalos o valores críticos que implican ese nivel de significancia.

Xαv2
Usamos α = 0.05 y v (grados de libertad) = 20-1= 19
X0.05 v2
Leamos en la tabla:
X0.05 192 = 30.143
Gráficamente queda de la siguiente forma:

Paso 4: Calcular el “estadístico” de la prueba

gl = n-1
Dónde:
gl: Grados de libertad
n: Número de elementos en la muestra
S2: Varianza muestral
σ2: Varianza considerada por la hipótesis nula
X2: Ji-cuadrada (también conocido como chi-cuadrada)
Para este problema la sustitución queda:
gl = n-1 = 20-1 = 19

Paso 5: Determinar si el estadístico cae dentro de la región que hace la hipótesis nula verdadera.

Paso 6: Aceptar o rechazar la hipótesis nula.


Se acepta que la varianza poblacional es igual a 15 como hipótesis nula.
2) Prueba de hipótesis para dos muestras
a) Para la diferencia de medias: En ocasiones interesa definir un intervalo de valores tal que
permita establecer cuáles son los valores mínimo y máximo aceptables para la diferencia
entre las medias de dos poblaciones.

Si puede suponerse que las varianzas de ambas poblaciones son iguales, el intervalo de confianza
para la diferencia de medias poblacionales está centrado en la diferencia de las medias muestrales,
siendo sus límites superior e inferior:

t /2 es el valor crítico correspondiente al grado de confianza 1- de la distribución t de Student

con n1+ n2-2 grados de libertad y es una estimación de la


desviación típica común a ambas poblaciones obtenida a partir de las varianzas de las dos muestras.
En la práctica si n1 y n2 son moderadamente grandes, el valor crítico
t /2 se aproxima, como ya se ha visto anteriormente, a los valores de la distribución normal.
Si las varianzas poblacionales no pueden suponerse iguales los límites del intervalo de confianza
son:

El valor crítico t /2 corresponde a una distribución t cuyos grados de libertad se calculan en base a
ambos tamaños muestrales y a las desviaciones típicas de cada grupo según la corrección propuesta
por Dixon y Massey:

Para obtener el intervalo de confianza en ambos casos la secuencia es:


Analizar
Comparar medias
Prueba T para muestras independientes
En el cuadro de diálogo hay que seleccionar en Contrastar variables la variable objeto de análisis e
indicar la Variable de agrupación junto con el criterio para Definir grupos (las dos poblaciones).

Los grupos pueden definirse en función de una variable cuantitativa o de una cualitativa. Si la
variable de agrupación presenta sólo dos valores o modalidades, entonces se debe seleccionar Usar
valores especificados e indicar la modalidad que define el grupo 1 y la del grupo 2. Si la variable tiene
más de 2 valores o modalidades se elige la opción Punto de corte indicando el valor de la variable
que induce una partición en dos grupos, uno de los cuales estará formado por todos los casos con
valores menores que el especificado y el otro por el resto de casos.

Al aceptar se obtienen:
- resultados de la prueba de Levene para contrastar la igualdad de varianzas *
- resultados de la prueba T para contrastar la igualdad de medias
- intervalo de confianza para la diferencia de medias al 95% por defecto.
Si se quiere cambiar el grado de confianza del intervalo, antes de aceptar hay que modificarlo con
el botón Opciones.

b) Para la diferencia de proporciones:

El estadístico de prueba que permite contrastar frente a a partir de dos

muestras aleatorias e independientes es siendo p la estimación


de obtenida del total de observaciones.
Si se consideran las proporciones como medias y se aplica la prueba t utilizada para comparar
medias poblacionales los resultados no son fiables ya que la estimación del error típico que realiza
el programa no coincide con la del estadístico de prueba. Para resolver el problema con el programa
SPSS se deberá cruzar la variable analizada con la que define los grupos (obtener la tabla de
contingencia) y realizar el contraste de independencia Chi-cuadrado.

El estadístico de prueba Chi-cuadrado se define: y presenta una


distribución Chi-cuadrado con (I-1)(J-1) grados de libertad. Las Eij se calculan multiplicando las
frecuencias marginales y dividendo el producto por n. Estas Eij son estimaciones de las frecuencias
absolutas que cabría esperar en cada casilla bajo el supuesto de que la proporción de éxitos es la
obtenida a partir del total de observaciones muestrales sin considerar diferencias entre los dos
grupos.

.
EJEMPLO
Con referencia a la encuesta Enctrans.sav se quiere comprobar si la proporción de alumnos con
vehículo difiere significativamente entre los grupos definidos según el género.
La hipótesis nula del contraste es ; siendo la proporción poblacional de hombres con
vehículo y la proporción poblacional de mujeres con vehículo.
Con la secuencia Analizar > Estadísticos Descriptivos > Tablas de contingencia se accede al cuadro
de diálogo donde se indica que la variable a contrastar es Vehículo y que la variable de agrupación
es el Género, y se selecciona la opción Chi-cuadrado en Estadísticos. Al aceptar se obtiene el
siguiente cuadro de resultados.

Si es cierto que la proporción de propietarios de vehículo es la misma en los dos


grupos, , la estimación de es la proporción de propietarios de vehículo para el
total de alumnos de la muestra, es decir, 39/114=0,3421. La frecuencia esperada de hombres con
vehículo se obtendrá multiplicando esta proporción por el total de hombres en la muestra, o sea,
0,3421·54=18,5; y de la misma forma se obtendrá la frecuencia esperada de mujeres con vehículo:
0,3421·60=20,5 (véase que estas frecuencias esperadas coinciden con las que cabría esperar en el
caso de que las variables Género y Vehículo fueran independientes).
El estadístico Chi-cuadrado toma el valor 0,998 y el nivel de significación crítico es 0,318, por lo
tanto, no se rechaza la hipótesis nula para los niveles de significación habituales y se puede aceptar
que no hay diferencia entre la proporción de hombres y mujeres propietarios de vehículos.

c) Para la diferencia de varianzas:

Si de dos poblaciones con distribución normal se seleccionan dos muestras


aleatorias independientes de tamaños n1 y n2, se puede comparar la
homogeneidad o variabilidad de dichas poblaciones a través de una prueba de
hipótesis para el cociente de varianzas.
Cuando se planteen las hipótesis debe quedar en el numerador la población
cuya muestra tenga mayor varianza. Es decir que la población 1 será la que
tenga mayor varianza muestral.

Hipótesis
Se puede plantear uno de los siguientes tres tipos de hipótesis:

Ejemplo practico:
Dos fuentes de materias primas están siendo consideradas. Ambas fuentes
parecen tener características similares, pero no se está seguro de su
homogeneidad. Una muestra de 10 grupos de la fuente A produce una varianza
de 250 y una muestra de 11 grupos de la fuente B produce una varianza de
195. Con base en esta información se puede concluir que la varianza de la
fuente A es significativamente mayor que la de la fuente B?. Asuma un nivel de
confianza del 99 por ciento.
Solución:

Con un nivel de confianza del 99 por ciento, en la tabla de la distribución F con


9 grados de libertad en el numerador y 10 grados de libertad en el
denominador, se obtiene un valor para Z de 4,94. Como puede observarse en
la figura 3.12, el valor de la estadística de trabajo está en la zona de no
rechazo de la hipótesis nula, por lo tanto, con una confiabilidad del 99 por
ciento, no se puede rechazar que la variabilidad de las dos fuentes de materia prima es igual.

You might also like