PRUEBA DE HIPOTESIS: (Estadísticos de prueba

)
I. DEFINICIONES PRELIMINARES:

 ¿QUÉ ES UNA HIPÓTE SIS?
Es un respuesta a priori a un problema.

 ¿QUÉ ES UNA HIPÓTE SIS ESTADÍS TIC A?
Es un enunciado acerca del valor de un parámetro poblac ional

 ¿QUÉ ES UNA PRUEBA DE HIPÓTESI S?
Es un procedimiento basado en la información muestral y en la teoría de probabilidad, para
determinar si una hipótesis estadística debe ser aceptada o rechazada.

 ¿QUÉ CLASES DE HIPÓTESIS EXISTEN?
HIPOTESIS NULA.
• Se denota por Ho.
• Es una afirmación o enunciado tentativo que se realiza acerca del valor de un parámetro
poblacional.
• Por lo común es una afirmación acerca del parámetro de población cuando toma un valor
específico.
HIPOTESIS ALTERNATIVA.
• Se denota por H1.
• Es una afirmación o enunciado contraria a la presentada en la hipótesis nula

 ¿QUÉ ERRORES SE COMETEN EN UNA PRUEBA DE HIPÓTESIS?
Error Tipo I:
• Se comete este error cuando se rechaza la hipótesis nula, cuando es verdadera.
• Se denota por α = P(Rechazar Ho/Ho es verdadera)
Error Tipo II:
• Se comete este error cuando se acepta la hipótesis, cuando es falsa.
• Se denota por β = P(Aceptar Ho/Ho es falsa)

 Nivel de Significancia ( )
Para ser muy cuidadosos en no cometer el error tipo 1, debemos especificar la probabilidad de
rechazar H0 , denotada por  . A ésta se le llama nivel de significancia.

Nivel de Significancia: La probabilidad ( más alta de rechazar H0 cuando H0 es cierto se llama
nivel de significancia.
Comentario: Para mantener la probabilidad de cometer el error tipo 1 baja, debemos escoger un valor pequeño de .

Usando un valor pre-asignado de  se construye una región de rechazo o región crítica en la
curva normal estándar o en la curva t que indica si debemos rechazar H0 .

Región Crítica o de Rechazo: Una región crítica o de rechazo es una parte de la curva de z o de
la curva t donde se rechaza H0 .
La región puede ser de una cola o de dos dependiendo de la hipótesis alterna.

Ejemplos Para H1 :  > valor aceptado, la región de rechazo está dada por:

 1

la región de rechazo está dada por:  (cola izquierda. (Se encuentran en la tabla de probabilidades) • Determinar la Región de Aceptación y de Rechazo. Si la varianza poblacional se conoce y n es mayor de 30: Estadístico de prueba: Valor crítico: x Z t  Z / 2 (distribución normal) Z   n B. • Establecer el valor o valores críticos para rechazar o aceptar Ho. (cola derecha. la región de rechazo es de dos colas y está dada por: (2-colas. z ó t) /2 /2 • ETAPAS DE UNA PRUEBA DE HIPÓTESIS • Plantear la hipótesis nula y alternativa. • Especificar el nivel de significancia (o confianza) que se va a utilizar. 2 . • Dar conclusión respectiva II. n 1) (distribución t de student) s n II. PRUEBA DE HIPOTESIS PARA EL PROMEDIO POBLACIONAL: A. Si la varianza poblacional no se conoce y n es menor o igual a 30: Estadístico de prueba: Valor crítico: x t t t  t (  / 2. PRUEBA DE HIPOTESS PARA LA PROPORCION POBLACIONAL Estadístico de prueba: Valor crítico: pP Z Z t  Z / 2 pq n Esta formula es tanto para muestras grandes como para muestras pequeñas. z ó t) Para H1 :   valor aceptado. FORMULAS DE LOS ESTADISTICOS DE PRUEBA: FORMULAS DE LOS ESTADISTICOS DE PRUEBA I. z ó t) Para H1 :  < valor aceptado.(Generalmente la plantea el investigador) • Elegir el estadístico de prueba que debe ser especificado en términos de un estimador del parámetro a probar. en función a los v alores críticos.

PRUEBA DE HIPOTES IS PARA LA DIFERENCIA DE MEDIAS A. PRUEBA DE HIPÓTESIS PARA LA MEDIA 1. obteniendo como resultado una media de 25. Verifique si la afirmación del investigador es realmente cierta. Varios de estos representantes piensan que realizan un número de visitas promedio superior a 40. Si las varianzas poblacionales se conocen y las muestras son de tamaño n1 >30 y n2 >30 (grandes): Estadístico de prueba: Valor crítico: ( x1  x2 )  ( 1  2 ) Z Z t  Z / 2 1 2  n1 n2 B. PRUEBA DE HIPOTES IS PARA LA DIFERENCIA DE PROPORCIONES: A. Un investigador de mercados y hábitos de comportamiento afirma que el tiempo que los niños de tres a cinco años dedican a ver la televisión cada semana se distribuye normalmente con una media de 22 horas y desviación estándar 6 horas. Utilice un nivel de confianza del 99% para aclarar esta cuestión. una empresa de investigación de mercados cree que la media es mayor y para probar su hipótesis toma una muestra de 64 observaciones procedentes de la misma población. Un gerente de ventas de libros universitarios afirma que en promedio sus representantes de ventas realiza 40 visitas a profesores por semana. se llama varianza mancomunada n1  n 2  2 IV. Si las varianzas poblacionales se desconocen y las muestras son de tamaño n1 ≤30 y n2 ≤30 (pequeñas): Estadístico de prueba: Valor crítico: ( x1  x2 )  ( 1  2 ) t t t  t (  / 2. n  n (distribución t de student) 1 1 1 2 2) Sc  n1 n2 Donde : (n 1  1)s 12  (n 2  1)s 22 sc  2 . Si se utiliza un nivel de significación del 5%. 3 . Una muestra tomada al azar durante 8 semanas reveló un promedio de 42 visitas semanales y una desviación estándar de 2 visitas.III. Si p1 y p2 se determinan a partir de muestras: Estadístico de prueba: Valor crítico: ( p1  p2 )  ( P1  P2 ) Z Z t  Z / 2 p1q1 p2 q2  n1 n2 Esta formula es tanto para muestras grandes como para muestras pequeñas. Frente a este estudio. 2.

expide su propia tarjeta de crédito. 4.06 . para decir que tuvo éxito. Verificar H0:  = 3 frente a H1:  < 3. Un fabricante de papel higiénico DELUXE considera que tiene asegurado el 20% del mercado. se considera un parámetro de evaluación si arranca en menos de 3 minutos. Una revisión aleatoria de 172 saldos reveló que la media muestral es $407 y la desviación estándar de la muestra es $38. ¿puede decirse que la serie tuvo éxito. promedio que consideramos demasiado alto. Se plantea una hipótesis de trabajo de que no más del 5% de las piezas que se fabrican en un proceso de manufactura tienen defectos. se encontró que 54 de ellos se retiraron. para probar si en realidad el fabricante de DELUXE tiene asegurado una mayor proporción del mercado de la que sostiene? Darle solución. 3. Una cadena grande de supermercados. con base en la información de la muestra?. o es razonable suponer que la diferencia de $7 (de $407 – $400 = $7) se debe al azar? 5. utilizando α =0. 6. capsulas encontrándose los siguientes resultados: Ῡ=251 mg. El jefe de admisión de una universidad afirmo en una reunión con las directivas que el 15% de los estudiantes que ingresan.14 . ¿Cuál es la solución?. En una revisión a los registros de los últimos años. 3. encontrándose que 10 están defectuosas.94 .10. Para verificar si el llenado se está realizando satisfactoriamente. ¿Debería concluir el gerente que la media poblacional es mayor que $400.94 . PRUEBA DE HIPÓTESIS PARA LA PROPORCION 1. Una muestra aleatoria de 100 docentes universitarios del país. elevándose así los costos de producción.000 ∑Xi² = 990. ∑Xi = 4. 3. 60 prefieren el papel DELUXE. Probar si los automóviles cumplen con este parámetro de calidad. Para lo cual se ha tomado 10 autos de la misma marca para estudiar el tiempo de arranque encontrándose los siguientes resultados (en segundos): 2. dio los siguientes resultados. la fábrica de la competencia toma una muestra de 200 clientes potenciales a quienes les pregunta por la marca papel higiénico de su preferencia. Para tal estudio se selecciona una muestra de 100 piezas. Un laboratorio contrata a un especialista en estadística para controlar el llenado de capsulas de antibióticos cuyo peso neto es de 250 mg.42 . 4. De los 200 entrevistados. se retiran antes de haber completado cuatro semestres académicos. mediante una muestra aleatoria de 300 alumnos. Pruebe la hipótesis anterior al 5% de significación. Para probar esta aseveración. use alfa = 0. A un nivel de significación de 0. 2. 3. 84 . En un estudio de control de calidad de automóviles. 2.3.01. Suponga que en una muestra de 400 familias 112 estaban viendo la serie. 3. El gerente financiero desea averiguar si el saldo deudor medio mensual es mayor que $400.82 . 4 .05. 3. si este presenta fallas muy notorias regresa para el correspondiente ajuste. El llenado de estas capsulas es automático y realiza de inmediato un control para verificar el llenado. establezca.86 . Una nueva serie de TV debe demostrar que capta más del 25% de la audiencia después de su periodo inicial de 10 semanas. se toma al azar n=19.02 . s=2mg. b) Realice una prueba de hipótesis. El nivel de significación se fija en 0.16. ¿Cuáles deberían ser las hipótesis que se deben plantear. 000 a) La autoridad educativa afirma que el promedio de edad de un docente universitario es de 43 años.05 ¿A qué conclusión llegaría usted?. ¿Al nivel del 1% es válida dicha información?. 2. 2. 2.

Mañana 6 4.10 4. ¿Al nivel del 1%. Se procedió a seleccionar 16 almacenes que distribuyen el producto cuya marca es ampliamente conocida y 12 almacenes que vende el mismo producto pero con marca que apenas entra al mercado.50 3. 2 “organizadores previos” en relación con el rendimiento de matemáticas abstractas.10 4. Los tiempos en minutos que registró fueron los siguientes: Mañana 2.00 4.50 S2= 5. Grupo 01 (organizador previo) Grupo 02 (resumen histórico) n1 = 25 n2 = 25 x1 = 7. hicieron un experimento de material introductorio que organiza lo que se va a aprender. ¿A qué conclusión llegó Ricardo?. mientras que una muestra de 32 vehículos marca B 5 . en el sentido de que la marca A es menos ahorradora de combustible. 2. mañana y tarde. Una compañía de transportes requiere comprar un gran lote de buses para el transporte urbano con el fin de reemplazar su parque automotor y para tal fin desea comprobar la afirmación hecha por el proveedor de la marca B.70 6.45 Ricardo procesó los datos en un programa estadístico y obtuvo la siguiente información: n Promedio Desviación Estándar.90 Contraste las hipótesis respectivas 3. está interesado en saber si existe diferencia significativa entre los tiempos de atención al cliente de los empleados que trabajan en los dos turnos. Scandura y Wells. era el “número de respuestas correctas”. Para tal fin la empresa toma una muestra aleatoria de 35 vehículos marca A y encuentra que la misma tiene un promedio en el rendimiento de 18 kilómetros/galón con una desviación estándar de 8 kilómetros/galón. Ricardo García.958 0.00 S1= 6. Los resultados fueron en promedio de $30.70 4. 25 de los cuales recibirán un “organizador previo” antes de estudiar un ensayo de 1000 palabras sobre topología de Euler. Utilice un nivel de confianza del 99% para aclarar esta cuestión. PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS 1. se puede aceptar tal información? determine su estimación. Compruebe con 5% de significación. Un departamento de investigación de mercados en software para usos educativos desea saber si un producto con marca conocida se vende a un precio superior al de una marca desconocida.28 Tarde 6 3.000.70 3. a ambos grupos se les administro una prueba objetiva sobre conceptos topológicos.65 x2 = 6. 4. Una muestra tomada al azar durante 8 semanas reveló un promedio de 42 visitas semanales y una desviación estándar de 2 visitas. La variable dependiente X. con desviación estándar poblacional de $6200 y $ 4800 respectivamente.90 Tarde 4. Al respecto.08 1. Al final del periodo experimental.00 4. Se selecciona 50 estudiantes.10 3.000 y $26. ayer personalmente registró los tiempos que utilizaron los empleados para atender a los clientes en ambos turnos y en forma aleatoria. Varios de estos representantes piensan que realizan un número de visitas promedio superior a 40. Un gerente de ventas de libros universitarios afirma que en promedio sus representantes de ventas realiza 40 visitas a profesores por semana. 5.358 A la luz de estos resultados. gerente de operaciones de UNIBANK.00 3.

Samuels (1967) efectuó un experimento para determinar si los dibujos facilitaban o interferían el aprendizaje de palabras en niños pequeños. Establezca la regla de decisión adecuada suponiendo que el riesgo de concluir que el asunto de la encuesta tiene un efecto cuándo realmente no existe tal efecto debe ser 0.01. mientras que una muestra de 400 piezas del proveedor B presentó 70 con fallas. 81 se rehusaron a contestar. 6. A continuación se muestran las medias y desviaciones típicas de los respectivos aciertos.05. Se escogió aleatoriamente a 20 niños del 1º grado de primaria para que aprendan palabras ilustradas por sencillos dibujos o para que aprendieran las mismas palabras sin ilustración de ningún tipo. Selecciona 6 obreros y mide su productividad en un día corriente. Indican estos resultados que el asunto de la encuesta afecta a la proporción de personas que se rehusaron a contestar. presenta un promedio de 22 kilómetros/galón con desviación estándar de 3 kilómetros /galón. En la encuesta sobre ingresos aplicada a 1. ¿Qué debe concluir el investigador al 1% de significación? 4. una referente a los ingresos buscaba tener información sobre los cambios en los gastos de artículos de consumo como resultado de los cambios en los ingresos. trataba de explicar la adquisición de un automóvil. Las cifras que miden la productividad son las que siguen: Con  = 0. sobre la productividad de sus obreros. Un fabricante de microprocesadores compra los microcircuitos de sus productos a dos proveedores: una muestra de 300 microcircuitos del proveedor A contuvo 50 defectuosos. en comparación con 21% (n = 45) de aquellos que no tienen título universitario. A pesar de que las 2 muestras fueron seleccionadas independientemente. Los resultados de una encuesta mostraron que un 30% (n = 60) de los entrevistados con título universitario poseen automóvil. Una organización de investigación de mercados realizó 2 encuestas al mismo tiempo. Una empresa de estudios de mercado quiere saber si un producto promocionado a nivel nacional lo adquieren los hombres en mayor proporción que las mujeres. En la encuesta sobre preferencias de marcas aplicada a 1. y luego mide la productividad de los mismos 6 obreros en un día que se concede la pausa para el café. Un investigador de mercados que trabaja para una agencia de publicidad. TRABAJADOR 1 2 3 4 5 6 Sin pausa 23 35 29 33 43 32 Con pausa 28 38 29 37 42 30 PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE PROPORCIONES 1.30 δ1= 7.200 personas. ¿A qué conclusión deberá llegarse? 6 . Después de varios ensayos se determinó el dominio de dichas palabras.79 Con α = 0. Pruebe la hipótesis nula de que no hay diferencia entre la proporción de circuitos defectuosos de los dos proveedores. Una compañía desea estudiar el efecto que tiene la pausa para el café. 189 se rehusaron a contestar. 2. contrastar la respectiva hipótesis.05. ¿Qué decisión debe tomar el gerente de la compañía con un nivel de significación del 5%? 5. La otra encuesta se refería a las preferencias de marcas y buscaba obtener información sobre las preferencias por las marcas de los diferentes tipos de alimentos . ¿Cuál es su decisión al 5% de significación? 3. Grupo 01 (sin ilustración) Grupo 02 (con ilustración) n1 = 10 n2 = 10 x1 = 19. midiendo el número de respuestas correctas de cada niño.20 x2 = 11. De dos muestras aleatorias independientes de 900 hombres y 800 mujeres se encontró que 270 hombres y 200 mujeres adquieren el producto.500 personas. Ambas se relacionaban con la población de personas de 18 años o mayores.93 δ 2= 5. ¿A qué conclusión llegará la compañía?.

PRUEBA DE HIPÓTESIS PARA UNA VARIANZA EJEMPLO: 7 .

8 .

a la variable X independiente y a A.. hacer estimaciones futuros de la variable dependiente. Realizar el diagrama de dispersión y ver el comportamiento de la variable. REGRESIÓN Y CORRELACIÓN ANALISIS DE REGRESIÓN LINEAL SIMPLE:  El análisis de regresión es una técnica estadística que consisten en determinar la relación funcional entre dos variables cuantitativas en estudio. reemplazar en la ecuación matemática el respectivo valor de Xo. de la siguiente manera: Y = A + B (Xo) 9 . que recibe el nombre también de Función de Regresión o Modelo de Regresión. es una ecuación matemática de la forma Y= A + B X. Para hacer el pronóstico o el valor estimado de Y.B se les llama parámetros de la ecuación de regresión.  PASOS A SEGUIR: a. Las formulas son las siguientes: n n n n X i Yi   X i  Yi B i 1 n i 1 n i 1 n X i2  ( X i ) 2 i 1 i 1 A  Y  BX c.  A la variable Y se le denomina variable dependiente. Aplicar el método de los Mínimos Cuadrados Ordinarios para estimar los parámetros de la ecuación. b.  La finalidad del Análisis de Regresión es hacer pronósticos es decir.  Esta relación funcional entre las variables.

4 0.05. es el estadígrafo que mide el grado de asociación o afinidad entre las variables cuantitativas y se denota por “r” la cual se define como: n n n n X i Yi   X i  Yi r n i 1 n i 1 n i 1 n n X i2  ( X i ) 2 n Yi 2  ( Y1 ) 2 i 1 i 1 i 1 i 1 Interpretación -1 -0.4 0 0. Evalúe el consumo (en miles de kilowatts-hora). LA EMPRESA LUZANDINA de la ciudad de Piura.  Se llamará CORRELACION SIMPLE cuando se trata de analizar la relación entre dos variables. Determine la variable dependiente (y) y la variable independiente (x) Y = X = b. d. para una casa de 11 habitaciones. Determine e interprete el coeficiente de determinación y de correlación. Estime la ecuación de regresión lineal e interprete sus coeficientes c. está haciendo un estudio sobre los consumos de energía (en miles de kilowatts .ANALISIS DE CORRELACION LINEAL SIMPLE:  El análisis de correlación es una técnica estadística que mide el grado de asociación o afinidad entre las variables cuantitativas consideradas en un estudio.hora) y el número de habitaciones en una residencia privada multifamiliar. establezca su intervalo de confianza use α = 0. Pruebe la contribución de la variable explicativa. e.7 -0. Se llamará CORRELACION LINEAL O RECTILINEA si la función es una recta. Para este estudio se selecciona una muestra aleatoria de 10 residencias multifamiliares. en la cual se obtuvo los siguientes resultados: Nº de Número de Consumo de energía (miles casa habitaciones de kw) 1 12 9 2 9 7 3 14 10 4 6 5 5 10 8 6 8 6 7 10 8 8 10 10 9 5 4 10 7 7 Total a.7 -1 Perfecta Alta Regular Baja Baja Regular Alta Perfecta NEGATIVA POSI TIVA 1. 10 .  El COEFICIENTE DE CORRELACION DE PEARSON. y de CORRELACION NO LINEAL cuando la func ión es una curva o una función de grado superior.

05. Estime la ecuación de regresión lineal: Y=A + B X c. d. Evalúe las ventas estimadas si se contacta. Determine la variable dependiente (y) y la variable independiente (x) Y = X = b. e. 11 .2.05. Para 6 operarios ¿Cuál es la producción esperada? d. Pruebe la contribución de la variable explicativa. Determine e interprete el coeficiente de determinación y de correlación. con 40 clientes. establezca su intervalo de confianza use α = 0. o comunica. e. Para esto recurre al departamento de ventas y contabilidad obteniendo la siguiente información: Número de Ventas (en miles Nº contactos de dólares) 1 14 24 2 12 14 3 20 28 4 16 30 5 46 80 6 23 30 7 48 90 8 50 85 9 55 120 10 50 110 Total a. El gerente de una empresa está haciendo un estudio entre el número de contactos que tienen sus vendedores y sus ventas en miles de dólares. El departamento de producción de una fábrica desea explorar la relación entre el número de obreros que ensamblan y la cantidad de artículos producidos. Determine e interprete el coeficiente de determinación y de correlación. Pruebe la contribución de la variable explicativa. Determine la variable dependiente (y) y la variable independiente (x) Y = X = b. 3. Como experimento se asignaron grupos de trabajadores para verificar su producción y los resultados obtenidos fueron los siguientes: Nº Número de Producción en ensambladores (unidades) 1 2 15 2 4 25 3 1 10 4 5 40 5 3 30 Total a. Estime la ecuación de regresión lineal: Y = a + b X c. establezca su intervalo de confianza use α = 0.

f. Pruebe la contribución de la variable explicativa. Construya el diagrama de dispersión.4. Determine e interprete el coeficiente de determinación y de correlación. El jefe de personal de una empresa cree que existe una relación entre la ausencia al trabajo y la edad del empleado. Obtenga la ecuación de la recta de regresión c. 12 .05. Los resultados fueron como se observa en la tabla que sigue: Edad en Ausencia en Nº años días 1 25 20 2 50 5 3 35 10 4 20 20 5 45 8 6 50 2 7 30 15 8 40 12 9 62 1 10 40 8 Total a. ¿Cuántos días se espera que falte al año? d. Con el propósito de estudiar el problema tomó en cuenta la edad de diez trabajadores escogidos al azar y contabilizó los días de ausencia durante el año. b. establezca su intervalo de confianza use α = 0. ¿Qué edad se puede esperar que tenga este trabajador? e. Si un trabajador tiene 38 años. Si un trabajador faltó 3 días al año.