You are on page 1of 15

UC - Estadística Aplicada Doc. Mg.

Victor Huaraccallo Huillca

PRUE BA DE HIPÓTESIS
INTRODUCCIÓN

“Una hipótesis se constituye como toda afirmación que se hace sobre una
propiedad de una población con la intención de probar si es cierta”

 El proceso de pruebas de hipótesis nos conduce a tomar la decisión de


rechazar o no rechazar la afirmación o conjetura a cerca del valor
numérico del parámetro de la población en estudio.
 Tal suposición tiene el nombre genérico de hipótesis estadística y puede
ser verdadera o no.
 La inferencia incluye una medida del error que se cometería al rechazar
la hipótesis principal cuando realmente es cierta.
 Esta mediada de error es denominado el nivel de significación.

DEFINICIÓN: Se denomina hipótesis estadística a cualquier afirmación o


conjetura que se hace a cerca de la distribución de una o más poblaciones.
Algunos ejemplos son:

 La longitud media de un tipo de objetos es 15 centímetros.


 La proporción de objetos en mal estado producidos en un proceso es
superior al 10%.
 La varianza de los contenidos de un producto que se comercializa en
bolsas de 240 gramos es 0.24 gramos2.

TIPOS DE HIPÓTESIS

Se denomina hipótesis simple a cualquier hipótesis estadística que especifique


un valor del parámetro. Como por ejemplo, afirmar que 𝜇 = 200 es una hipótesis
simple.

Se denomina hipótesis compuesta, si la hipótesis no indica un valor específico


del parámetro. Po ejemplo, afirmar 𝜇 > 150, es una hipótesis compuesta.

Se denomina hipótesis nula y se representa 𝐻0 a la hipótesis que es aceptada


provisionalmente como verdadera y cuya valides es sometida a comprobación
experimental.
UC - Estadística Aplicada Doc. Mg. Victor Huaraccallo Huillca

Se denomina hipótesis alternativa y se representa por 𝐻1 a la hipótesis


contraria a la hipótesis nula.

Ejemplo: Se está interesado en realizar un estudio de los tiempos en minutos


que lleva realizar determinada tarea, las hipótesis nulas y alternativas son:

 𝐻0 : 𝜇 = 50 y 𝐻1 : 𝜇 ≠ 50
 𝐻0 : 𝜇 ≤ 50 y 𝐻1 : 𝜇 > 50
 𝐻0 : 𝜇 ≥ 50 y 𝐻1 : 𝜇 < 50

(La hipótesis nula es la hipótesis principal que se plantea y se supone que es


verdadera con el fin de obtener un criterio que nos lleve a aceptarla o rechazarla.)

El hecho de aceptar la hipótesis nula y rechazar la hipótesis alternativa (por que


pueda ser que realmente la hipótesis nula no sea verdadera) nos lleva a cometer
un error, o viceversa.

ERROR TIPO I Y ERRO TIPO II

Existen cuatro acciones o situaciones que determinan si la decisión tomada es


correcta o incorrecta. Dos son decisiones correctas y dos son decisiones
erradas.

Decisión / 𝐻0 Verdadera 𝐻0 Falsa


Hipótesis
Rechazar 𝐻0 Error tipo I Decisión correcta
𝛼 1−𝛽
Aceptar 𝐻0 Decisión correcta Error tipo II
1−𝛼 𝛽
DEFINICIÓN: El error tipo I, es el error que se comete al tomar la decisión de
rechazar la hipótesis nula 𝐻0 cuando realmente es verdadera.

𝛼 = 𝑃[𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼] = 𝑃[𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑐𝑢𝑎𝑛𝑑𝑜 𝐻0 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎 ]

DEFINICIÓN: El error tipo II, es el error que se comete al tomar la decisión de


aceptar la hipótesis nula 𝐻0 cuando realmente es falsa

𝛽 = 𝑃[𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼𝐼] = 𝑃[𝑎𝑐𝑒𝑝𝑡𝑎𝑟 𝐻0 𝑐𝑢𝑎𝑛𝑑𝑜 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎]

PROCEDIMIENTO DE CINCO PASOS PARA PROBAR UNA HIPÓTESIS

Paso I: “establecer la hipótesis nula y la hipótesis alternativa”


 La hipótesis nula es: que el número medio de millas recorridas con llantas
con cinturones de acero no son diferentes a 60000.
 La hipótesis nula se desarrolla para propósitos de las pruebas, y esta se
rechaza o no.
UC - Estadística Aplicada Doc. Mg. Victor Huaraccallo Huillca

 La hipótesis nula es una afirmación que no se rechaza a menos que la


información de la muestra ofrezca evidencias convincentes de que es
falsa.
 Debemos enfatizar que si la hipótesis nula no se rechaza con base en los
datos de la muestra, no podemos decir que la hipótesis nula sea
verdadera.
 Para probar sin duda alguna que la hipótesis nula es verdadera, es preciso
que el parámetro poblacional sea conocido.
 Asimismo debemos hacer notar que a menudo empezamos la hipótesis
nula afirmando:
 “no hay diferencia significativa entre …”
 “la resistencia media del vidrio a los impactos no es diferente de
…”
 Al seleccionar una muestra de una población el estadístico muestral casi
siempre es numéricamente distinto al parámetro poblacional hipotético
 Ejemplo: un artículo reciente indica que la edad media de los aviones
comerciales es de 15 años. Para realizar una prueba estadística acerca
de esta afirmación, el primer paso es determinar la hipótesis nula y
alternativa. La hipótesis nula representa la condición actual o reportada, y
se expresa 𝐻0 : 𝜇 = 15. La hipótesis alternativa es la afirmación que no es
cierta, es decir 𝐻1 : 𝜇 ≠ 15.
 Es necesario recordar que no importa cómo se plantee el problema, la
hipótesis nula siempre va a contener el signo igual.
 El signo igual nunca va a aparecer en la hipótesis alternativa, porque esta
es la afirmación que se va a probar, y necesitamos un valor específico
para incluirlo en nuestros cálculos.
 Recurrimos a la hipótesis alternativa solo si la información sugiere que la
hipótesis nula no es cierta

Paso II: “seleccionar el nivel de significancia”

 Al nivel de significancia en ocasiones se le conoce con el nombre de nivel


de riesgo, este es el término más apropiado porque es el riesgo que se
corre de rechazar la hipótesis nula cuando es verdadera.
 No hay ningún nivel de significancia que se aplique a todas las pruebas.
Se toma la decisión de utilizar el nivel 0.05, el nivel 0.01, etc.
 El nivel 0.05 se selecciona para los proyectos de investigación del
consumidor.
 El nivel 0.01 para el aseguramiento de la calidad.
 El 0.10 para encuestas políticas.
 Ejemplo: suponga que una empresa que fabrica computadores
personales utiliza gran cantidad de tarjetas con circuitos impresos. Los
proveedores participan en una licitación y el que presente la cotización
más baja obtiene un contrato considerable. Suponga que el contrato
especifica que el departamento de aseguramiento de la calidad del
fabricante de computadoras tomara una muestra de todos os envíos que
llegan. Si más del 6% de las tarjetas de la muestra no cumplen con las
normas, el envió se rechaza. La hipótesis nula es que el envió de tarjetas
UC - Estadística Aplicada Doc. Mg. Victor Huaraccallo Huillca

contiene 6% o menos tarjetas que no cumplen con las normas. La


hipótesis alternativa es que más del 6% de las tarjetas están defectuosas.
 Una muestra de 50 tarjetas de circuitos de un proveedor que se
recibieron, revelo que 4 de ellas, es decir el 8%, no cumplían con las
normas. El envió se rechazó porque excedía el máximo de 6% de tarjetas
que no cumplen con las normas. Si en realidad, el envió no cumplía con
las normas, la decisión de regresar las tarjetas al proveedor fue correcta.
Sin embargo, que las 4 tarjetas seleccionadas en la muestra de 50 eran
las únicas que no cumplían con las normas en un envió de 4000 tarjetas.
Entonces solo el 0.1% eran defectuosas (4/4000 = 0.001). en este caso,
menos del 6% de todo el envió no cumplía con las normas y rechazarlo
fue un error. En términos de la prueba de la hipótesis, rechazamos la
hipótesis nula de que el envió cumplía con las normas cuando deberíamos
haber aceptado la hipótesis nula, al rechazar la hipótesis nula, cometimos
un error Tipo I, la probabilidad de cometer este tipo de error es 𝛼.

Paso III: “seleccionar el estadístico de prueba”

 Hay muchos estadísticos de prueba. En este capítulo utilizaremos tanto Z


como t.
 Estadístico de prueba: valor, determinado a partir de la información de la
muestra, que se utiliza para determinar si se va a rechazar la hipótesis
nula.

Paso IV: “formular la regla de decisión”

 Una regla de decisión es una afirmación de las condiciones específicas


en las que la hipótesis nula se rechaza y aquellas en las que se acepta.
UC - Estadística Aplicada Doc. Mg. Victor Huaraccallo Huillca

 La región o área de rechazo define la ubicación de todos esos valores


que son tan grandes o tan pequeños que la probabilidad de su ocurrencia
bajo una hipótesis nula verdadera es más bien remota.
 Valor crítico: el punto divisor entre la región en la que la hipótesis nula se
rechaza y aquella en la que se acepta.

Paso V: “tomar una decisión”

 El quinto y último paso en la prueba es calcular el estadístico de la


prueba, comparándola con el valor crítico y tomando la decisión de
rechazar o no la hipótesis nula.
 En lugar de aceptar la hipótesis nula, algunos investigadores prefieren
expresar la decisión como “no rechazar Ho”, “decidimos no rechazar Ho”
o “los resultados de la muestra no nos permiten rechazar Ho”
 Debemos enfatizar el hecho de que siempre hay una posibilidad de que
la hipótesis nula se rechace cuando en realidad no se debería rechazar
(error tipo I). asimismo hay una probabilidad de que la hipótesis nula se
acepte cuando en realidad se debería rechazar (error tipo II).

PRUEBA DE HIPÓTESIS ACERCA DE LA MEDIA 𝝁


Cuando se va a realizar pruebas de hipótesis relativas a la media poblacional,
se debe saber si la varianza poblacional es conocida o desconocida.

CUANDO LA VARIANZA 𝝈𝟐 SUPUESTA CONOCIDA


Suponemos que la varianza poblacional es conocida, entonces la estadística
adecuada para la prueba de: 𝐻0 : 𝜇 = 𝜇0 contra 𝐻1 : 𝜇 ≠ 𝜇0 es:

𝑿−𝝁
𝒁 = 𝝈/ Cuya distribución es exacta o aproximadamente normal 𝑁(0,1)
√𝒏

El error típico ET es
𝜎
𝐸𝑇 = 𝑒𝑠 𝑒𝑙 𝑒𝑟𝑟𝑟𝑜𝑟 𝑡í𝑝𝑖𝑐𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑋
√𝑛
UC - Estadística Aplicada Doc. Mg. Victor Huaraccallo Huillca

1. Prueba bilateral o de dos colas


Se prueba:
𝐻0 : 𝜇 = 𝜇0
𝐻1 : 𝜇 ≠ 𝜇0

2. Prueba unilateral o de cola a la derecha


Se prueba:
𝐻0 : 𝜇 = 𝜇0
𝐻1 : 𝜇 > 𝜇0

3. Prueba unilateral o de cola a la izquierda


Se prueba:
𝐻0 : 𝜇 = 𝜇0
𝐻1 : 𝜇 < 𝜇0

Ejemplo: Al estudiar si conviene tener o no una sucursal en la ciudad de Cusco,


la gerencia de una gran tienda comercial de Lima, establece el siguiente criterio
para tomar una decisión: abrir la sucursal solo si el ingreso promedio familiar
mensual en dicha ciudad no es menos de s/. 500 y no abrirla en caso contrario.
Si una muestra aleatoria de 100 ingresos familiares de esta ciudad ha dado una
media de s/. 480 y una desviación estándar de s/. 80. ¿Cuál es la decisión a
tomar al nivel de significación del 5%?
UC - Estadística Aplicada Doc. Mg. Victor Huaraccallo Huillca

CUANDO LA VARIANZA 𝝈𝟐 SUPUESTA DESCONOCIDA


Población no normal
Si la población no tiene distribución normal y si la varianza es desconocida, para
probar hipótesis acerca de la media se utiliza la estadística 𝑍 (solo si el tamaño
de la muestra es grande 𝑛 ≥ 30)
̅−𝝁
𝒙
𝒛=
𝝈/√𝒏
Población normal
Si la población tiene distribución normal 𝑁(𝜇, 𝜎 2 ), donde 𝜇 y 𝜎 2 son parámetros
desconocidos, para 𝑛 ≥ 2 la estadística de la prueba acerca de la media es:

̅−𝝁
𝒙
𝑻=
𝒔/√𝒏

Cuya distribución es 𝑡 − 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 con 𝑛 − 1 grados de libertad.


𝑠
El error típico de la media muestral es 𝐸𝑇 =
√𝑛

Nota: la estructura de la prueba es similar en el caso de varianza conocida, salvo


que 𝜎 se estima por 𝑠 y la distribución normal estándar se sustituye por la
distribución t de student con 𝑛 − 1 grados de libertad.

1. Prueba bilateral o de dos colas


Se prueba:
𝐻0 : 𝜇 = 𝜇0
𝐻1 : 𝜇 ≠ 𝜇0

2. Prueba unilateral o de cola a la derecha


Se prueba:
𝐻0 : 𝜇 = 𝜇0
𝐻1 : 𝜇 > 𝜇0
UC - Estadística Aplicada Doc. Mg. Victor Huaraccallo Huillca

3. Prueba unilateral o de cola a la izquierda


Se prueba:
𝐻0 : 𝜇 = 𝜇0
𝐻1 : 𝜇 < 𝜇0

Ejemplo: Antes de que una sustancia se pueda considerar segura para


enterrarse como residuo se deben caracterizar sus propiedades químicas. El
artículo “Landfilling Ash/Sludge Mixtures” (J. Benoît, T. Eighmy y B. Crannell, en
Journal of Geotechnical and Geoenvironmental Engineering 1999:877-888)
notifica que en una de seis muestras de lodo de una planta de tratamiento de
agua residual de Nueva Hampshire, la media del pH era 6.68 con desviación
estándar de 0.20. ¿Se puede concluir que la media del pH es menor de 7.0?

Ejemplo: En una de las estaciones de combustible de la empresa REPSOL,


indica que el promedio del número de galones de gasolina que venden a sus
clientes es igual a 4 galones. Además, los registros muestran que los consumos
de gasolina de sus clientes tienen una distribución normal. Sin embargo, debido
a la creciente alza en el precio de la gasolina se cree que este consumo ha
bajado. Para verificar esta hipótesis se escogió una muestra aleatoria de 15 de
sus clientes resultando los siguientes consumos de gasolina en galones:
4.25 3.75 4.05 3.8 3.5 4 3.75 2.5
6.1 2.5 2.5 3.4 3.2 2.8 5
Con un nivel de significación de 5%, ¿el incremento en el precio de la gasolina
ha influido en la baja del consumo promedio?
UC - Estadística Aplicada Doc. Mg. Victor Huaraccallo Huillca

PRUEBA DE HIPÓTESIS DE LA VARIANZA DE UNA POBLACIÓN

Sea 𝑥1 , 𝑥2 , … , 𝑥𝑛 una muestra aleatoria de tamaño 𝑛 seleccionada de una


población con media 𝜇 y varianza 𝜎 2 parámetros desconocidos, y sea la varianza
muestral
∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙)𝟐
𝒔𝟐 =
𝒏−𝟏
(𝑛−1)𝑠2
Entonces la variable aleatoria 𝜒 2 = 𝜎2 tiene una distribución Chi-cuadrado
con 𝑛 − 1 grados de libertad. Esta estadística se utiliza para obtener la región
crítica de la prueba de hipótesis acerca de una varianza.

Si la hipótesis nula 𝐻0 : 𝜎 2 = 𝜎02 es supuesta verdadera, entonces la estadística


es
(𝒏 − 𝟏)𝒔𝟐
𝑿= ~𝝌𝟐(𝒏−𝟏)
𝝈𝟐

1. Prueba bilateral o de dos colas


Se prueba:
𝐻0 : 𝜎 2 = 𝜎02
𝐻1 : 𝜎 2 ≠ 𝜎02

2. Prueba unilateral o de cola a la derecha


Se prueba:
𝐻0 : 𝜎 2 = 𝜎02
𝐻1 : 𝜎 2 > 𝜎02

3. Prueba unilateral o de cola a la izquierda


Se prueba:
𝐻0 : 𝜎 2 = 𝜎02
𝐻1 : 𝜎 2 < 𝜎02
UC - Estadística Aplicada Doc. Mg. Victor Huaraccallo Huillca

Ejemplo: Una compañía que produce una parte de máquina para un motor,
afirma que tiene una varianza de diámetro no mayor a 0.0002 pulgadas. Una
muestra aleatoria de 10 de dichas partes dio una varianza de muestra 0.0003. Si
se supone que las medidas del diámetro se distribuyen en forma normal, ¿hay
evidencia para refutar lo que afirma el proveedor? Use 𝛼 = 0.05.

Ejemplo: En la actualidad las monedas de 25 centavos se acuñan con un peso


medio de 5.670 g y una desviación estándar de 0.062 g. Se prueba un nuevo
equipo con la intención de mejorar la calidad reduciendo la variación. Se obtiene
una muestra aleatoria simple de 24 monedas de 25 centavos acuñadas con el
nuevo equipo, y esta muestra tiene una desviación estándar de 0.049 g. Utilice
un nivel de significancia de 0.05 para probar la aseveración de que las monedas
acuñadas con el nuevo equipo tienen pesos con una desviación estándar menor
que 0.62 g. Al parecer, ¿el nuevo equipo es eficaz para reducir la variación de
los pesos? ¿Cuál sería una consecuencia adversa del hecho de tener monedas
con pesos muy variables?
UC - Estadística Aplicada Doc. Mg. Victor Huaraccallo Huillca

PRUEBA DE HIPÓTESIS DE LA PROPORCIÓN DE UNA POBLACIÓN

La proporción es la razón del número de éxitos con el número de observaciones,


𝒙
̂= ,
esto es 𝒑
𝒏
Donde: x: número de éxitos
n: número de observaciones

Considere las siguientes situaciones potenciales de prueba de hipótesis:

 Históricamente General Motors reporta que el 70% de los vehículos


rentados se regresan con menos de 36000 millas. En una muestra
reciente de 200 vehículos regresados al final del periodo de
arrendamiento, 158 tenían menos de 36000 millas, ¿la proporción se ha
incrementado?
 La American Association reporta que el 60% de las personas jubiladas
menores de 65 años regresarían trabajar de tiempo completo si
encontraran un empleo adecuado. Una muestra de 500 jubilados menores
de 65 años revelo que 315 regresarían a trabajar. ¿podemos llegar a la
conclusión que más del 60% volvería a trabajar?
 Una empresa de mudanza, anuncia a sus clientes que, en el caso de
mudanzas residenciales a largas distancias, sus cosas llegaran en un
periodo de 3 a 5 días a partir de que las recojan. Los registros de esta
empresa muestran que el 90% de las veces cumplen su promesa. Una
auditoria reciente revelo que tuvieron éxito 190 de 200 veces, ¿puede
llegar a la conclusión de que su índice de éxitos aumento?

Podemos hacer algunas suposiciones y algunas condiciones antes de probar la


proporción de una población. Para probar una hipótesis acerca de la proporción
de una población, se elige una muestra aleatoria de la población, debe cumplir:

1. La información recopilada de la muestra es el resultado de conteos.


2. El resultado de un experimento se clasifica en una de dos categorías
mutuamente excluyentes un “éxito” o un “fracaso”.
3. La probabilidad de un éxito es la misma para cada intento.
4. Los intentos son independientes, lo que significa que el resultado de uno
no afecta al resultado de ningún otro.

Si se supone verdadera la hipótesis nula 𝐻0 : 𝑝 = 𝑝0 , entonces, la distribución


muestral de 𝑋 es exactamente binomial 𝐵(𝑛, 𝑝0 ). Y la estadística es

̂−𝒑
𝒑
𝒁= ~𝑵(𝟎, 𝟏)
√𝒑(𝟏 − 𝒑)
𝒏
Donde:

𝜋: es la proporción de la población
𝑝: es la por porción de la muestra
𝝈𝒑 : es el error estándar de la proporción (√𝑝(1 − 𝑝)/𝑛)
UC - Estadística Aplicada Doc. Mg. Victor Huaraccallo Huillca

La prueba que realizaremos en breve es apropiada cuando tanto 𝑛𝑝 como


𝑛(1 − 𝑝) son por lo menos 5. 𝑛 es el tamaño de la muestra y 𝑝 es la proporción
de la población. Aprovechar el hecho de que una distribución binomial se pueda
aproximar mediante la distribución normal.

Ejemplo: El National Safety reporto que 52% de los conductores en las


carreteras estadounidenses son hombres. Una muestra de 300 autos que ayer
viajaron hacia el sur por la New Jersey revelo que 170 iban conducidos por un
hombre. En el nivel de significación de 0.01, ¿podemos llegar a la conclusión de
que por la New Jersey conducía una proporción de hombre mayor que la
indicada por las estadísticas estadounidenses?

Ejemplo: El artículo “Refinement of Gravimetric Geoid Using GPS and Leveling


Data” (W. Thurston, en Journal of Surveying Engineering, 2000:27-56) presenta
un método para medir las alturas ortométricas arriba del nivel del mar. Para una
muestra de 1 225 puntos de partida, 926 dieron resultados que están dentro del
espíritu de la clase C nivelando los límites de tolerancia. ¿Se puede llegar a la
conclusión de que este método produce resultados dentro de los límites de
tolerancia más de 75% de las veces?
UC - Estadística Aplicada Doc. Mg. Victor Huaraccallo Huillca

Ejemplo 1
Calcula la ecuación de la circunferencia que pasa por los puntos:
, y .
Vamos a sustituir los valores de las coordenadas de cada punto en la ecuación de la
circunferencia en la forma general. Así por cada punto obtendremos una ecuación.
Ecuación para el punto :

De manera semejante obtenemos la ecuación que le corresponde a :

Y finalmente para el punto :

Así hemos obtenido el siguiente S.E.L.:

Ahora debemos resolverlo. Vamos a utilizar el método de determinantes. Empezamos


escribiendo el S.E.L. en forma matricial:

Calculamos primero el determinante principal:


UC - Estadística Aplicada Doc. Mg. Victor Huaraccallo Huillca

Dado que es distinto de cero, el S.E.L. tiene solución única. Ahora calculamos los
determinantes auxiliares para las incógnitas del S.E.L. Determinante auxiliar para :

Determinante auxiliar para :

Determinante auxiliar para :

Finalmente, tenemos:

Y sabiendo que es fácil concluir que: . También,


si implica que .

Sabemos que , de donde:

Finalmente podemos calcular la ecuación de la circunferencia que pasa por los


puntos , y :

La siguiente figura muestra la situación:


UC - Estadística Aplicada Doc. Mg. Victor Huaraccallo Huillca

Se te queda como ejercicio escribir la ecuación de esta circunferencia en la forma


general.

You might also like