Professional Documents
Culture Documents
PRUEBAS DE HIPÓTESIS
Usualmente =0.1, 0.05 ó 0.01, que corresponden a intervalos de confianza del 90, 95 y 99 por ciento
respectivamente. La siguiente tabla muestra los Z/2 más usados. Compruébelos
En este problema la fábrica de llantas tiene dos turnos de operarios, turno de día y turno mixto. Se
selecciona una muestra aleatoria de 100 llantas producidas por cada turno para
ayudar al gerente a sacar conclusiones de cada una de las siguientes preguntas
- ¿Es la duración promedio de las llantas producidas en el turno de día igual a 25 000 millas?
- ¿Es la duración promedio de las llantas producidas en el turno mixto menor de 25 000 millas?
- ¿Se revienta más de un 8% de las llantas producidas por el turno de día antes de las 10 000
millas?
Prueba de Hipótesis para la media. En la fábrica de llantas la hipótesis nula y alternativa para el
problema se plantearon como,
Ho: μ = 25 000 H1: μ ≠ 25 000
Dado que ya se tiene la distribución normal, los valores críticos se pueden expresar en
unidades de desviación. Una región de rechazo de 0.25 en cada cola de la distribución normal,
da por resultado un área de .475 entre la media hipotética y el valor crítico. Si se busca está
área en la distribución normal, se encuentra que los valores críticos que dividen las regiones de
rechazo y no rechazo son + 1.96 y - 1.96
Por tanto, la regla para decisión sería rechazar Ho si Z > +1.96 o sí z < -1.96, de lo contrario, no
rechazar Ho.
Para una muestra de 100, si se selecciona un nivel de significancía de 0.05, los valores críticos de la
distribución t con 100-1= 99 grados de libertad se puede obtener como se indica en la siguiente tabla
tenemos el valor de 1.9842. Como esta prueba de dos colas, la región de rechazo de 0.05 se vuelve a
dividir en dos partes iguales de 0.025 cada una. Con el uso de las tablas para t, los valores críticos son –
1.984 y +1.984. La regla para la decisión es,
Rechazar Ho si t 99 1.9842 o t 99 1.9842 de lo contrario, no rechazar Ho
Los resultados de la muestra para el turno de día (en millas) fueron
X dìa 25.430, Sdìa 4.000 y n día 100 millas. Puesto que se esta probando si la media es
diferente a 25 000 millas, se tiene con la ecuación
X 25.430 25.00
t n 1 t 1001 1.075
S/ n 4.000 / 100
Dado que t100-1=1.075, se ve que -1.984 < +1.075 < + 1.984, entonces no se rechaza Ho.
Por ello, la decisión de no rechazar la hipótesis nula Ho. En conclusión es que la duración
promedio de las llantas es 25 000 millas. A fin de tener en cuenta la posibilidad de un error de
tipo II, este enunciado se puede redactar como no hay pruebas de que la duración promedio de
las llantas sea diferente a 25 000 millas en las llantas producidas en el turno de día.
Suponga que en el día de la licitación se informó que, de acuerdo con la regla de decisión diríamos que
las lámparas son de origen americano. ¿Podemos estar herrados en esa conclusión?. O en otras palabras,
¿es posible que una muestra de 25 lámparas de origen europeo presente una media de 15800? Si, es
posible. Entonces, para un mejor entendimiento de la regla de decisión adoptada, es interesante estudiar
los tipos de errores que podemos cometer y las respectivas probabilidades de cometer esos errores.
Retomando el ejemplo vamos a indicar por RC una región determinada por los valores de X menores que
16000, es decir RC={X 16000}. El valor 16000 se denomina punto crítico y se denotará como xc.
Con las notaciones indicadas arriba, la probabilidad de cometer cada uno de los errores puede ser escrito
del siguiente modo:
- P[Error Tipo I] = P[ X pertenezca a RC | H0 es verdadera] = .
- P[Error Tipo II] = P[ X no pertenezca a RC | H0 es falsa ] =
Ejemplo. En el ejemplo anterior, cuando H0 es verdadera, es decir, las lámparas son de origen europea,
sabemos del teorema central del límite que x , o sea la media de las muestras de tamaño 25, tendrán
2000
distribución aproximadamente normal con media 16500 y = 400 , es decir X N(16500,
25
1600). Entonces,
Para cada regla de decisión adoptada, es decir, para cada valor crítico x c se obtiene un valor de
probabilidad de error tipo 1. Por otra parte, si xc se elige menor que 15000 disminuye pero aumenta.
Sin embargo, se puede proceder de manera inversa, es decir, fijado encontramos la regla de decisión
que corresponderá a una probabilidad de error 1 igual a .
CONTRASTES DE HIPÓTESIS
Ejemplo, Supongamos que debemos realizar un estudio sobre la altura media de los habitantes de cierto
pueblo. Antes de tomar una muestra, lo lógico es hacer la siguiente suposición a priori, (hipótesis
que se desea contrastar y que denotamos H0):
H0: la altura media no difiere del resto del país
Al obtener una muestra de tamaño n=8, podríamos encontrarnos ante uno de los siguientes casos:
1. Muestra = {1,50 ;1,52; 1,48; 1,55; 1,60; 1,49; 1,55; 1,63}
2. Muestra = {1,65; 1,80; 1,73; 1,52; 1,75; 1,65; 1,75; 1,78}
Ejemplo. Conocemos que las alturas X de los individuos de una ciudad, se distribuyen de modo
gaussiano. Deseamos contrastar con un nivel de significación de =5% si la altura media es
diferente de 174 cm. Para ello nos basamos en un estudio en el que con una muestra de n=25
personas se obtuvo: media 170 y desviación 10
La técnica a utilizar consiste en suponer que H0 es cierta y ver si el valor que toma el estadístico
X 174
Texp t 24
ŝ n
es razonable o no bajo esta hipótesis, para el nivel de significación dado. Aceptaremos la hipótesis
alternativa (y en consecuencia se rechazará la hipótesis nula) si no lo es, es decir, si
Texp t 1 / 2, 24 t 0.975, 24 2.06
El valor de Texp no está en la región crítica (aunque ha quedado muy cerca), por tanto al no ser
la evidencia en contra de H0 suficientemente significativa, ésta hipótesis no se rechaza.
Ejemplo. Se desea comparar la actividad motora espontánea de un grupo de 25 ratas control y otro de 36
ratas desnutridas. Se midió el número de veces que pasaban delante de una célula fotoeléctrica
durante 24 horas. Los datos obtenidos fueron los siguientes:
Ratas de control n1=25 x 1 =869.8 S1=106.7
Ratas Desnutridas n2=36 x 2 =465 S2=153.7
Solución: En primer lugar, por tratarse de un problema de inferencia estadística, nos serán más útiles las
cuasivarianzas que las varianzas. Por ello calculamos:
n 1 2 25 n 2 2 36
ŝ12 s1 106.7 2 11 .859 ŝ 22 s 2 153.7 24.298
2
n1 1 24 n2 1 35
En este caso:
ŝ 22
Fexp 2.049 Fn 2 1,n1 1 Fteo 2.97
ŝ12
Como Fexp≤Tteo, no podemos concluir (al menos al nivel de significación =5%) que H0 deba ser
rechazada.
calculamos en primer lugar la cuasivarianza muestral ponderada y los valores del test:
(n 1 1)ŝ12 (n 2 1)ŝ 22
ŝ
2
19.238
n1 n 2 2
x1 x 2
Texp 11 .210 t n n 2 t 59
1 1 1 2
ŝ
n1 n 2
Como Tteo Texp concluimos que se ha de rechazar la hipótesis de igualdad de las medias,
y por tanto aceptamos que las medias son diferentes.