You are on page 1of 23

UNIDAD III

INFERENCIA ESTADÍSTICA

3.1 INTRODUCCION AL MUESTREO


¿QUE ES MUESTREO?
EL MUESTREO ES UNA FORMA DE DETERMINAR ALGO ACERCA DE UNA
POBLACION A PARTIR DE UNA PARTE DE ELLA
¿POR QUE ES NECESARIO?
• Por la naturaleza destructiva de ciertas pruebas
• Por la imposibilidad física de revisar todos los integrantes de la población
• El costo de estudiar a todos los integrantes de una población puede ser prohibitivo
• En ocasiones se necesita mucho tiempo para entrevista a toda la población
• Por lo adecuado de los resultados de la muestra

HAY DOS TIPOS DE MUESTRAS

ProbabilísticoNo Probabilístico

TIPOS DEMETODOS DE MUESTREO PROBABILISTICO

• Muestreo Aleatorio Simple


• Muestreo Aleatorio Sistemático
• Muestreo Aleatorio Estratificado
• Muestreo por Conglomerados

• Muestreo Aleatorio Simple: Muestra seleccionada de manera que cada integrante de


la población tenga la misma probabilidad de quedar incluido
• Muestreo Aleatorio Sistemático: Los integrantes de la población se ordena en alguna
forma. Se selecciona al azar un punto de partida y después se elige para la muestra
cada k-ésimo elemento de la población
• Muestreo Aleatorio Estratificado: Una población se subdivide en subgrupos,
denominados estratos y se selecciona una muestra de cada uno
• Muestreo por Conglomerados: Se emplea frecuentemente para reducir el costo de
muestrear una población dispersa en un área geográfica grande

1
El estadístico muestral no necesariamente coincide exactamente con el parámetro
poblacional

• Estimación puntual: El valor, calculado a partir de la información de muestreo, que


se emplea para estimar el parámetro de la población.

• Intervalo de confianza: Una gama de valores obtenidos a partir de datos de


muestreo, de modo que el parámetro ocurre dentro de esa variedad a una
probabilidad específica a la cual se le denomina nivel de confianza

Intervalo de confianza depende:

• Del nivel de confianza deseado

• De la variabilidad en la población estimada a partir de S

• Del tamaño de la muestra n


Factor de
s  N n corrección
x  Z  
2 n  N  1  por finitud
Si n/N > 5%

Para P = 95%

Para P = 99%

Para P = 90%

3.2 ESTIMACION DE MEDIA POBLACIONAL.

Cuando nosotros sacamos una muestra de tamaño n de la población de tamaño N, solo tenemos
el valor de la media muestral x (estadígrafo), pero nuestro interés es por el parámetro (media
poblacional  ). Nunca conoceremos el verdadero valor de  (al menos que realizamos un
censo, investigamos toda la población), entonces necesitamos estimarla. Existen dos tipos de
estimaciones: Estimación puntual y Estimación por intervalo de confianza.
Estimación por intervalos de confianza: Los estimadores por intervalo se denominan
comúnmente intervalos de confianza. Los extremos superior e inferior de un intervalo de
confianza se llaman límites de confianza superior e inferior respectivamente. La probabilidad de
que un intervalo de confianza contenga el parámetro se conoce como coeficiente de confianza
( o nivel de confianza) se denota 1- . Donde  es el nivel de significación.
Si en base de la muestra se desea estimar la media poblacional se usarán las siguientes formulas
según el caso.
2
     
Si n  30    x  z  Si n < 30    x  t  ,( n1) g .l . 
 2 n  2 n
n
Si se conoce el tamaño de la población (N) y la razón 100  5% (la muestra forma una
N
parte apreciable de población), entonces la formula de intervalo de confianza para la media
tendrá un factor de corrección por población finita (FCF).
  N n
Si n  30    x  z 
 2 n N 1 
  N n
Si n < 30   x  t  
 ( ,( n 1) g .l )
2 n N 1 

Estimación puntual: Se realiza cuando la media poblacional toma valor de la media muestral.
=x
x  . En este caso se indica el Error Máximo de estimación.

  
Error Máximo es  z  
 2 n

n
Si se conoce el tamaño de la población (N) y la razón 100  5% , se utiliza el F.C.P.
N
  N n
Error Máximo es  z  
 2 n N 1 
Ejemplo 1: Demos una estimación por intervalo de confianza del 95% para la longitud media
de los lápices de cierta marca, si una muestra de 64 lápices arrojo una longitud promedio de 191
mm., siendo la distribución de la longitud de tales lápices normal con varianza de 400.
SOLUCION: Primero hay que determinar los datos. 95% es el nivel de confianza: 1-  = 0.95,
por lo tanto  = 1- 0.95 = 0.05(es el nivel de significación).
 = 0.05, Media muestral x = 191mm, Tamaño de muestra n = 64, Varianza que nos dan no es
de la muestra sino de la población, porque hablan de la distribución de los lápices, entonces
denotaremos  2 = 400, sacando la raíz cuadrada obtenemos la desviación estándar  =20. Nos
piden un intervalo de confianza para la media, además n  30, no conocemos el tamaño de la
población, por eso no usaremos el FCF usamos la formula
 0.05
   Calculamos primero 1  2  1  2  1  0.025  0.975 , después
   x  z 
 2 n z   z 0.975  1.96
buscamos en la tabla de la Normal, 1 . Sustituimos en la
2

 20 
formula los datos   191  1.96 ;
 64 

3
  191  4.9 ,   186.1,195.9 . La longitud promedio de los lápices en la población es
de 186 a 195 milímetros, con un nivel de confianza de 95%.

Ejemplo 2: Una muestra aleatoria de cinco ejemplares de cierto tipo de helado tiene un
contenido de grasa medio de 11.3% y una desviación estándar de 0.38%. Construya un intervalo
de confianza del 95% para el contenido promedio de la grasa en el helado.

SOLUCION: Los datos: x = 11.3, la desviación estándar que se da es de la muestra S=0.38,


 = 1- 0.95 = 0.05, n = 5<30, por lo tanto usaremos la formula
    0.05
   x  t  , calculamos 1   1   0.975 , después usamos la tabla de la
 2
,( n 1) g .l . n 2 2
distribución t ( de Student) con (n-1= 5-1 = 4) grados de libertad. El uso de la tabla es muy
simple en la fila superior buscamos t0.975 y en la columna g.l. buscamos 4. El valor de la
 0.38 
intersección es 2.7764. Sustituyendo en la fórmula obtenemos:   11 .3  2.7764
 5 
  11 .3  0.47  ,   10.83,11 .77  . El promedio de la grasa en el helado es de 10.8% a
11.8%.

Ejemplo 3: Un estudio muestral conducido en una ciudad de 400 familias de las cuales
tomaron 50 los que tenían un ingreso anual promedio de $27 565 con una desviación estándar de
$5000. Construya un intervalo de confianza del 90% en relación con el ingreso anual promedio
real de todas las familias de esta ciudad.

SOLUCION: Los datos: x = 27565, S = 5000,  = 1- 0.90 = 0.1, N = 400. N = 50,


n 50
calculamos si  100   12.5  5% , y n >30 por lo tanto usaremos la formula
N 400
  N n z  z 0.95  1.645
   x  z  ,calculamos 1 2 sustituyendo
 2 n N  1 
 5000 400  50 
  27565  1.645  ,    27565  1089.43 ,    26475.57,28654.43 . El
 50 400  1 
ingreso anual promedio de las familias de una ciudad está entre $26475.57 y $28654.43.

3.3 ESTIMACION DE PROPORCIONES.


x
Sea x es el número de veces que ha ocurrido un evento en n ensayos, entonces es la
n
proporción muestral, si p es la proporción poblacional entonces el intervalo para la proporción
poblacional es

4
 x x
 1   
x n n
p    z
n 2
n 
 
 

Donde ;

Ejemplo 4: El análisis de 500 ventas seleccionadas al azar de un comerciante indicó que 465
de ellas se hicieron a crédito. Construya un intervalo de confianza del 95% para la proporción
real de estas ventas que se hacen a crédito.
SOLUCION: Los datos: n = 500, los 465 de 500 son las ventas que se hicieron a crédito por lo
z  z 0.975  1.96
tanto x = 465,  = 1- 0.95 = 0.05, calculando 1

2
y sustituyendo en la formula
 0.931  0.93 
dada obtenemos p  0.93  1.96  , p   0.93  0.022 , p   0.908,0.952 .
 500 
Podemos decir que las ventas que se hacen a crédito en la población es de 90.8 % a 95.2%

3.4 CALCULO DEL TAMAÑO DE LA MUESTRA

Para el cálculo del tamaño de la muestra adecuado, si en base de esta muestra queremos estimar
el promedio usaremos la formula siguiente:

donde E es el error máximo que se desea tener al estimación y  es la desviación


2
 z   
n 2 
1

 E  estándar poblacional, si no se conoce se toma una


  muestra pequeña (piloto) y se calcula desviación muestral que puede ser usada para la
formula.

n0 N
Si la población es finita de tamaño N, el tamaño de la población es: n  , donde
n0  ( N  1)
2
 z   
 1 2 
n0   
 E 
 

Para el cálculo del tamaño de la muestra adecuado, si en base de esta muestra queremos
estimar la proporción usaremos la formula siguiente:

5
2
 z 
 
Si se tiene idea de la proporción poblacional: n p
ˆ (1  p
ˆ ) 2 
E
 

2
 z 
1  2 
Si no se conoce la proporción poblacional: n
4 E 
 

Si la población es finita de tamaño N, el tamaño de la población es:


2
 
Npˆ (1  pˆ )  E 
n donde n0    E es el error máximo, p es la
( N  1)n0  pˆ (1  pˆ )  z 
 2 

proporción que se crea que tiene el valor de interés de la variable de estimar, se determina en una
(0.25) N
muestra piloto, en el caso que no se conoce usamos la formula n 
( N  1)n0  0.25

Autoaprendizaje No. 5
Inferencia Estadística

1. La asociación de ex alumnos de una universidad quiere estimar los salarios anuales


promedios de los graduados en 1996. Una muestra aleatoria de 100 personas reveló un salario
promedio de $850 con una desviación estándar de $145. Establezca e interprete una
estimación por intervalo con una confiabilidad de 95%, del salario promedio mensual de los
graduados en 1996.

2. Los ingresos del impuesto sobre venta en una comunidad particular se recaudan cada
trimestre. Los siguientes datos representan los ingresos (en miles de dólares) cobrados
durante el primer trimestre de una muestra de nueve establecimientos de menudeo de la
comunidad: 15, 18, 11, 17, 13, 10, 22, 15, 16.
a) Establezca e interprete una estimación por intervalo con un 99% de confianza, de los ingresos
trimestrales del impuesto sobre ventas en los establecimientos de menudeo.
b) Si hay un total de 300 establecimientos de menudeo en esa comunidad, estime e interprete un
intervalo con un 95% de confianza de los ingresos trimestrales del impuesto sobre venta en
los establecimientos de menudeo.

6
3 Al examinar los registros de facturación mensual de una empresa editora con ventas por
correo, el auditor toma una muestra de 10 de las facturas no pagadas. Las sumas que se
adeudan a la compañía son: $4, $18, $11, $7, $10, $5, $33, $9, $12, $15.
a) Determine e interprete una estimación por intervalo con un 90% de confianza de la cantidad
promedio de facturas no pagadas.
b) Si hubiera un total de 250 facturas no pagadas. Determine e interprete una estimación por
intervalo del 99% de confianza de la cantidad promedio de facturas no pagadas.

4. El gerente de control de calidad de una fábrica de lámparas eléctricas desea estimar la


duración promedio de un embarque de lámparas (focos). Los resultados indican que la
desviación estándar del proceso es de 100 horas y el gerente desea estimar la duración
promedio con aproximación de ± 20 horas del promedio real con una confiabilidad del 95%.
¿Qué tamaño de muestra se necesita?

5. Se va a vender un nuevo cereal para desayuno y se pone a prueba de mercado durante un mes
en las tiendas de una cadena de autoservicio, se desea estimar la suma promedio de venta con
aproximación de ± $100 con un 95% de confianza y se supone que la desviación estándar es de
$200. ¿Qué tamaño de muestra se necesita?

6. Un grupo de estudio quería estimar fa facturación mensual promedio por luz eléctrica en el
mes de Julio en casas unifamiliares en una ciudad. Con base en estudios efectuados en otras
ciudades, se supone que la desviación estándar es de $20. El grupo quiere estimar ¡a facturación
promedio de julio con aproximación de ± $5 del promedio real con un 95% de confianza, ¿Qué
tamaño de muestra se necesita?

7. El gerente de una sucursal bancaria en una ciudad quiere determinar la proporción de sus
cuenta habientes a los cuales se les paga el sueldo por semana, por experiencia previa en otras
áreas se sabe que sólo el 30% prefieren este sistema, si el gerente quiere tener 95% de confianza
de que esta en lo correcto con aproximación de ± Q.05 de la proporción do sus clientes a quienes
se les paga por semana. ¿Qué tamaño de muestra se necesita?

8 Los resultados de un estudio realizado en una universidad mostraron que una muestra
tomada al azar de 25 alumnos utiliza las instalaciones del centro de estudiantes en promedio 6.8
veces por semana, con desviación estándar de 2.4. Construya un intervalo de confianza del 99%
en relación con el número promedio de veces que un alumno de la universidad utiliza las
instalaciones del centro de estudiantes a la semana.

9 Una tienda de quesos para conocedores lleva un registro de las compras hechas por sus
clientes. Una muestra tomada al azar de 15 de estos registros arroja compras de 28.3 onzas de
queso en promedio con desviación estándar de 2.7 onzas. Construya un intervalo de confianza
de 95% de la media de la población que se muestrea.

10 Para estimar el número promedio de millas que los estudiantes de una universidad
suburbana recorren para asistir a clase, un funcionario de la universidad seleccionó una muestra
al azar de 75 estudiantes que hacen el recorrido y obtuvo una media de 18.2 millas con una
7
desviación estándar de 2.30 millas. Con el 99% de confianza ¿qué se puede decir acerca del
error máximo en la estimación del recorrido promedio real como 18.2 millas?

11 En un estudio de costos anuales de renta de apartamientos de una ciudad del Este, una
muestra de 25 apartamientos tiene un costo de renta medio de $11 535 y una desviación estándar
de $875.
a) Construya un intervalo de confianza del 99% del costo anual promedio real de renta de los
apartamientos.
b) ¿Qué se puede decir con el 95% de confianza acerca del error máximo si la media de la
muestra de %11 535 se utiliza como estimación del costo anual promedio de renta de los
apartamientos?

12 Una muestra tomada al azar de 50 de los 500 estudiantes de preparatoria de un distrito


escolar que realizaron las pruebas de rendimiento escolar en el otoño tuvieron una calificación
promedio de lenguaje de 475 con una desviación estándar de 125. Construya un intervalo de
confianza del 95% de la calificación media de todos los 500 estudiantes de la preparatoria que
realizaron la prueba.

13 Diez estudiantes seleccionados al azar de una gran muestra de alumnos, tardaron 60, 50,
45, 60, 75, 35, 42, 53, 49 y 65 minutos en terminar un examen de inglés. Si la media de esta
muestra se utiliza para estimar el tiempo promedio real que tardan en terminar el examen, ¿qué
podemos decir con el 95% de confianza acerca del error máximo?

14 En un estudio de muestras aleatorias, 120 de 365 personas entrevistadas en una ciudad


grande, dijeron que se oponen a autorizar la construcción de otras unidades habitacionales.
Construya un intervalo de confianza del 99% para la proporción de la población correspondiente.

15 En un estudio de muestras aleatorias, a 200 estudiantes con promedios acumulativos de


calificaciones superiores a 3.00, se les preguntó dónde, con mayor probabilidad, realizarían la
mayor parte de sus tareas o estudios. Si 72 de los alumnos optaron por la biblioteca, construya
un intervalo de confianza del 90% para la proporción real de los estudiantes de este grupo que
prefieren la biblioteca para estudiar.

16 En una muestra aleatoria de 575 capitanes de puerto, 360 pensaban que el gobierno
debería de exigir a los propietarios de botes recreativos que presentarán un examen para obtener
360
la licencia. Si se utiliza =0.63 como estimación de la proporción real correspondiente de la
575
población que se muestrea, ¿qué se puede afirmar con el 98% de confianza acerca del error
máximo?

17 El gerente de control de calidad de una fábrica de lámparas eléctricas desea estimar la


duración promedio de un embarque de lámparas. Los resultados indican que la desviación
estándar del proceso es de 100 horas y el gerente desea estimar la duración promedio con un

8
error máximo de 20 horas con una confiabilidad del 95%. ¿ Que tamaño de la muestra se
necesita?

18 Se va a vender un nuevo cereal para desayuno y se pone a prueba de mercado durante un


mes en las tiendas de una cadena de autoservicio. Se desea estimar la suma promedio de venta
con aproximación(error máximo) de mas o menos $100 con un 95% de confianza y se supone
que la desviación estándar es de $200. ¿Qué tamaño de muestra se necesita?

19 El gerente de una sucursal bancaria en una ciudad quiere determinar la proporción de sus
cuenta habientes a los cuales se les paga el sueldo por semana, por experiencia previa en otras
áreas se sabe que sólo el 30% prefieren este sistema, si el gerente quiere tener 95% de confianza
de que esta en lo correcto con aproximación de mas o menos 0.05 de la proporción de sus
clientes a quienes se les paga por semana. ¿Que tamaño de muestra se necesita?

9
3.5 PRUEBAS DE HIPÓTESIS

• HIPOTESIS: Enunciado acerca de una población elaborado con el propósito de poner a


prueba.
• PRUEBA DE HIPOTESIS: Procedimiento basado en la evidencia muestral y en la teoría
de probabilidad que se emplea para determinar si la hipótesis es un enunciado razonable.
PROCEDIMIENTO DE SEIS PASOS PARA PROBAR UNA HIPOTESIS

1 2 3

6to paso: CALCULAR EL


VALOR DE P
Si p < α se rechaza la Ho. Si la
prueba es bilateral 2p < α se
rechaza la Ho.

Hipótesis nula: Afirmación acerca del valor de un parámetro. (Siempre lleva la igualdad).

10
Hipótesis alternativa: Afirmación que se aceptará si los datos muestrales proporcionan
amplia evidencia de que la hipótesis nula es falsa. Se define siempre lo contrario de la
hipótesis nula.
Nivel de Significancia: Probabilidad de rechazar la hipótesis nula cuando es verdadera
Valor crítico: Número que es el punto divisorio entre la región de aceptación y la región de
rechazo, de la hipótesis nula
Valor estadístico de prueba: Valor obtenido a partir de la información muestral, que se
utiliza para determinar si se rechaza la hipótesis nula.

3.5.1 PRUEBA DE HIPÓTESIS PARA LA MEDIA POBLACIONAL


1) Pantear las hipótesis.

LA PRUEBA DE HIPOTESIS PARA LA MEDIA DE UNA POBLACION PUEDE


PLANTEARSE EN CUALQUIERA DE LOS TRES FORMATOS

Formato 1 Formato 2 Formato 3


Prueba de una cola Prueba de dos Prueba de una cola
(Unilateral colas (Bilateral) (Unilateral
Izquierda) derecha)

Ho:  =  o Ho:  =  o Ho:  =  o


H1:  <  o H1:  ¹  o H1:  >  o

2) Establecer el nivel de significación α:


Los errores que podrían cometerse al realizar una prueba de Hipótesis son dos error tipo I y
error tipo II . Analizar la siguiente tabla.

Realidad
Decisión Cierta la H0 Falsa H0
H0 se rechaza Error Tipo I Decisión Correcta
H0 se acepta Decisión Error Tipo II
Correcta

La probabilidad de cometer el Error tipo I, P(Error I) = . ( es rechazar la Ho cuando


debería ser aceptada)
La probabilidad de cometer el Error tipo II, P(Error II) = ( es aceptar la Ho. cuando
debería ser rechazada)
Interesa medir las magnitudes de estos Errores y tratar de que esas magnitudes sean las
menores posibles. Resulta imposible reducir ambas probabilidades de cometer el error tanto

11
como se quiera, puesto que una disminución en una de ellas provoca, en general, un aumento de
otra. Una solución es fijar el valor de una de ellas. En esto caso se fija el valor de , por lo
general se dan valores de 0.01, 0.05, 0.1 (se trabajará con error tipo I)
Si
Nivel de confianza 99%=0.99 95%=0.95 90%= 0.90
(1-α)
Nivel de 1%= 0.01 5%=0.05 10%= 0.10
significación (α)
2.58 1.96 1.645
2.33 1.645 1.28

Si si utilizar la tabla t-student con gl = n-1

3) Estadística de Prueba

x x
Z t
Si ;  n si ; s n

4) Regla de decisión:
Si la prueba es bilateral: /Zc/ > Zα se rechaza la Ho.
Si la prueba es unilateral: Zc > Zα se rechaza la Ho. Ó bien Zc < -Zα se rechaza la Ho.
5) Conclusión
6) Valor de p

EJEMPLO 1:El tiempo promedio dedicado al estudio individual por los estudiantes de segundo
año de administración en los cursos anteriores fue de 18.75 horas semanales. Una muestra simple
aleatoria de 16 estudiantes del curso actual arrojo que dedicaban al estudio individual un
promedio de 19.23 horas semanales con varianza de 0.25. ¿Podemos afirmar con un nivel de
significación de 0.01 que los estudiantes de este curso estudian más? Consideremos la
distribución del tiempo de estudio semanal en la población Normal.

SOLUCION: Primero en que debemos fijarnos es que si la distribución es Normal. En este caso
si. Por lo tanto después nos fijamos en la varianza o desviación estándar, si es de población
usamos Z, si es de muestra entonces la t-dtudent. En este caso es la t-student, por lo que la
varianza que nos dan es de la muestra. Determinamos los datos.
Datos: n =16, S2 = 0.25, por lo tanto S =0.5, x = 19.23,  = 0.01, el valor con el que
vamos a comparar la media se denota  0 = 18.75, es el promedio anterior.

12
Paso I.
Hipótesis: (Como se quiere saber que los estudiantes estudian más y esto nos confirma la
muestra, por lo tanto la hipótesis alternativa es H1:    0 , la nula es lo contrario.)
Ho:   18.75
H1:  18.75
Paso II.
Región Critica: como la muestra es menor de 30 se usará la tabla t- student y  = 0.01
Calculamos el valor de t ,( n1) g .l . = t 0.01,15 g .l . = 2.6025

t ( 0.01,15)  2.6025

Paso III.
x   o 19.23  18.75
tc 
S 0.5
Estadística de la Prueba: calculamos: n = 16 = 3.84
Paso IV.
Decisión: Como la estadística de la prueba 3.84 es mayor de 2.6 cae en la región de rechazo, por
lo tanto Rechazamos la Hipótesis nula. tc > tα se rechaza la Ho.
Paso V.
Conclusión: Al rechazar la hipótesis nula, decimos: Podemos afirmar que el tiempo promedio de
estudio de los estudiantes de estudiantes de este curso es mayor que de los cursos anteriores, con
un nivel de significación de 0.01.
Paso VI
El valor de p < α se rechaza la Ho.
Con lo gl = 15 y tc = 3.84 se busca en la tabla t-student el valor más cercano a 3.84 esto es 2.9467
y este valor está por debajo de la probabilidad de p= 0.005 < 0.01 por tanto se rechaza la Ho.
EJEMPLO 2: El consumo diario de arroz en un comedor estudiantil ha sido históricamente de 63
Kg. con una varianza de 49. Se observa en una muestra simple aleatoria de 81 días que el
consumo promedio de arroz es de 61Kg. ¿Podemos afirmar basándonos en este resultado que el
consumo diario de arroz ha disminuido, con un nivel de significación de 0.05?
Datos: x = 61, n = 81, 2 = 49,  =7,  0 = 63,  = 0.05
Como no nos dicen que la distribución es Normal veamos, nos fijarnos solamente en el tamaño
de muestra, como es mayor de 30 usamos la Z normal
1) Hipótesis: Como queremos saber si ha disminuido el consumo de arroz, por lo tanto
hipótesis es: Ho:   63

13
H1: 63
2) Región Crítica: Como la prueba es unilateral izquierda y  = 0.05 el valor de Z=
1.645

 z1 =1.645
x  o
tc  61  63
S
3) Estadística de la prueba: n = 7
81 = -2.57

4) Decisión: Como -2.57 es menor de -1.645 rechazamos la hipótesis nula.


5) Conclusión: Podemos afirmar con un nivel de significación de 0.05 que el consumo
diario de arroz ha disminuido.
6) Valor de p
Si p < α se rechaza la Ho.
Se busca en la tabal normal el valor de Zc= -2.57, equivale a 0.0051 entonces p= 0.0051<
0.05 es verdadero por tanto se rechaza la Ho.
I Prueba de hipótesis para la media de una población con distribución Normal y de la
población conocida.
HIPOTESIS ESTADIGRAFO COMUN REGION CRITICA

Ho:    o
H1:  ¹  0
 z z
2 2

Ho:    o z
x  o

H1: 0 n
z

Ho:    o

H1: 0  z

14
II Prueba de hipótesis para la media de una población con distribución normal y varianza de la
población desconocida.
HIPOTESIS ESTADIGRAFO COMUN REGION CRITICA

Ho:    o
H1:  ¹  0
 t
, ( n 1) g .l .
2

t
, ( n 1) g .l .
2

Ho:    o t
x  o
H1: 0 S
n
t ,( n 1) g .l .

Ho:    o

H1: 0  t  ,( n 1) g .l .

III Prueba de hipótesis para la media de una población no normal.



Si n 30, usar tabla II.
Si n  30, usar tabla I

3.5.2 PRUEBA DE HIPOTESIS PARA LA PROPORCIÓN


Para la prueba de hipótesis para la proporción usaremos el siguiente formulario.
IV Prueba de hipótesis para la proporción de una población
HIPOTESIS ESTADIGRAFO COMUN REGION CRITICA

Ho: p  p o
H1: p ¹ p 0
 z z
2 2

15
Ho: p  po z
x  np o
np o (1  p 0 )
H1: p po
z

Ho: p  po

H1: p p0  z

EJEMPLO: Un constructor afirma que se instalan bombas de calor en 70% de todas las casas
que se constituyen hoy en día en la ciudad de Richmond. ¿Estaría de acuerdo con esta
afirmación si una de casas nuevas en esta ciudad muestra que 8 de 15 tienen instaladas bombas
de calor? Utilice un nivel de significancia de 0.1.

Datos: n = 15,x = 8, el valor con el que vamos a comparar la proporción denotaremos


p0 = 0.7,  = 0.1, si calculamos x/n =8/15 = 0.53.
1) Hipótesis: Como no nos piden probar de que la proporción es menor o mayor de 70%
(0.7), por lo tanto es una prueba bilateral.
Ho: p  p o La afirmación del constructor es correcta
H1: p ¹ p0 La afirmación del constructor es equivocada.
2) Región critica: Copiamos de la tabla, según nuestra hipótesis.

z z z z
1
 = -1.645 1
 =1.645 Calculamos 1
 = 1
0 .1
= z 0.95 = 1.645
2 2 2 2

x  np o 8  (15)(0.7)
3). Estadística de la prueba: z 
np o (1  p 0 )

(15)(0.7)(1  0.7) 
Zc= -1.41
4). Decisión: Aceptamos la hipótesis nula. Porque el valor -1.41 esta en la región de aceptación,
entre -1.645 y 1.645.
5).Conclusión: No hay razón suficiente para dudar de la afirmación de constructor.
6) Valor de p
Como la prueba es bilateral la regla de decisión: 2p<α se rechaza la Ho.
Zc = -1.41 se busca en la tabla normal 0.0793 = p entonces 2( 0.0793) = 0.1586 < 0.10 es falso
por lo tanto No se rechaza la Ho.

Autoaprendizaje No.6

16
1 Una cadena de restaurantes planea construir un nuevo expendio, si cuando menos 200 autos
pasan por el lugar propuesto cada hora, durante determinadas horas. Para 20 horas
muestreadas al azar, se encuentra que el # promedio de autos que pasan por ese lugar es 208.5,
con s = 30. Los administradores piensan que el volumen de tráfico satisface sus
requerimientos. Realice una prueba de hipótesis respecto a este problema con  igual a 5%?

2 Suponga que los resultados muéstrales del problema anterior se basan en una muestra de n =
50 horas. Puede rechazarse la hipótesis nula con  = 5%?

3 Se encuentra que el número promedio de empleados para una muestra de 50 empresas de


una industria es de 420.4, con una desviación estándar de 55.7. Antes de recolectar los datos
se planteó la hipótesis de que el número promedio de empleados por empresa en esa industria
no era superior a 408. Pruebe esa hipótesis con á = 5%

4 En un departamento de reparación de maquinaria se recibe en embarque de 100 máquinas


defectuosas. Se encuentra que, para una muestra de 10 de ellas, el tiempo promedio de
reparación que se requiere es 85 minutos con s = 15 minutos. Pruebe la hipótesis Ho:  =100
minutos con  = 10%

5 Una empresa industrial supone que la vida de su prensa rotativa más grande es cuando menos
14500 horas con  =2100 horas. De una muestra de 25 prensas la compañía obtiene una
media muestral de 13000 horas. Con  = 1%, ¿debe la compañía concluir que la vida media
de las prensas es menor que las 14500 supuestas?

6 Antes del embargo petrolero de 1973 y de los incrementos posteriores en los precios del
petróleo crudo, el consumo de gasolina en E.E.U.U. había crecido a una tasa mensual de 57%
con una desviación estándar de 10% al mes. En 15 meses escogidos aleatoriamente, el
consumo de gasolina aumentó a un porcentaje promedio de apenas 33% por mes. Con un
nivel de significación de 0.01, ¿puede afirmar usted que el crecimiento en el consumo de
gasolina disminuyó a raíz del embargo y sus consecuencias?

7 El gerente de una compañía financiera se queja de que el 7% de los pagos parciales de


préstamos hechos a consumidores no se cubre a tiempo. Pruebe esta afirmación, con el nivel
de significación de 0.05, contra la hipótesis alternativa de que esta cifra es demasiado alta, si
80 de 1500 pagos de préstamos no se hacen a tiempo.

8 El propietario de un parque de diversiones hizo un estudio con 400 visitantes y descubrió que
220 de ellos se habían enterado de la existencia del parque a través de la publicidad por la
radio. Utilice el nivel de significación de 0.05 para determinar si esto fundamenta la
afirmación de que el 60% de los visitantes se entero de la existencia del parque a través de
esta forma de publicidad.

9. Gerente, de producción de una Compañía manufacturera estima que la edad media de sus
empleados es 22.8 años. El tesorero de la firma necesita una cifra de la edad medía de los
empleados más exacta, a fin de estimar el costo de una prestación por antigüedad que se
considera para los empleados. El tesorero toma una muestra aleatoria de 70 trabajadores y
17
observa que la edad media de los empleados muestreados es de 26.2 años con una desviación
estándar de 4.6 años. Con un nivel de significación del 1%. ¿Qué puede concluir acerca de la
exactitud de la estimación del Gerente de producción?

10. La producción diaria de una planta industrial química registrada durante 50 días, tiene una
media muestral de 871 toneladas y una desviación estándar de 21 toneladas. Pruebe la hipótesis
de que el promedio de la producción diaria del producto químico es de 880 toneladas por día,
contra la alternativa de que es mayor o menor que 880 toneladas por día, usando una
significación del 5%,

11. Una muestra aleatoria de 6 observaciones de una población normal, generó los
siguientes datos: 3.7 6.4 8.1 8.8 4.9 5.0 Proporcionan los datos suficiente evidencia que
señale que µ < 7, a un nivel del 5%.

12. Se diseñó un nuevo sistema para el control del inventarlo de un pequeño fabricante, con
el propósito de reducir el mismo para un motor eléctrico en particular, a menos de 3000 motores
por día. Se llevó a cabo un muestreo del Inventarlo en reserva al final de cada uno de los ocho
días, seleccionados aleatoriamente; los resultados se muestran a continuación. Con los datos hay
evidencia suficiente que señalen que el promedio del número diario de motores en el Inventarlo
es menor de 3000. Use un nivel da significación del 1%.

Número de Motores
2905 2725
2835 3065
2605 2835
3005 2895

13. Se sabe que en el pasado, la captura promedio de langostas en cada trampa colocada en
una zona particular de! Caribe ha sido de 30.31 lbs. Una muestra aleatoria de 20 trampas
colocadas recientemente dio los siguientes resultados (en Ibs.)

43.2 19.6 27.5 22,1 24.4


12.2 23.8 34.4 41,7 25.5
37.2 39.6 21.1 39.6 43.4
17.4 33.7 24.1 29.3 18.9
Presentan estos datos suficiente evidencia a favor de la afirmación, de que la captura promedio
por trampa de langosta ha disminuido, use un nivel de significación del 5%.

14. Suponga que el promedio de clientes que entrar a una tienda por día es de 175. Se hace
una campaña publicitaria durante 7 semanas. Durante la campaña, el promedio de clientes
aumentó a 181 por día. con una varianza muestra! de 441. Aumentó en forma significativa e!

18
número de clientes que entran B la tienda gracias a la campaña publicitaria a un nivel del 1% y a
un nivel del 5%.

15. De 1980 a 1985, fa tasa promedio de precios/utilidades (p/u) de los aproximadamente


1800 valores inscritos en la Bolsa de Valores de Nueva York fue de 14.35 con una desviación
estándar de 9.73. En una muestra de 32 valores de la Bolsa, aleatoriamente escogidos, la tasa p/u
promedio en 1986 fue de 11,37, ¿Esta muestra presenta evidencia suficiente para concluir al
nivel de significación del 5% que en 1986 la tasa p/u promedio para los valores de la Bolsa se
habría modificado de su anterior valor?

16. American Theaters sabe que una película de éxito se exhibió un promedio de 34 días en
cada ciudad, y la desviación estándar correspondiente fue de 10 días. El administrador del
distrito sudorienta! estaba Interesado en comprar la popularidad de la película en su reglón con la
de los demás cines de la American. Eligió aleatoriamente 75 cines de su reglón y encontró que
proyectaron la película un promedio de 81.5 días.

Establezca las hipótesis apropiadas para probar si hubo una diferencia significativa en la
duración de la exhibición de la película entre los cines del distrito sudorienta! y los demás de la
American. A un nivel de significación del 1% pruebe esta hipótesis.

17. Tina Dennis es la Jefa de contabilidad de Meck Industries (MÍ). Ella cree que los
problemas de flujo de efectivo en MI se deben a fa cobranza lenta de cuentas pendientes. Estima
que más de 60% de las cuentas están en atraso más de tres meses. Una muestra de 200 cuentas
señaló que 140 tenían más de tres meses de antigüedad. Al nivel de significación de 0.01. ¿se
puede concluir que más do 60% de las cuentas están en atraso por mas de tres meses?

18. Experiencias en la Wills Travel Agency Indica que 44% de las personas
desean que esa agencia planee unas vacaciones para viajar a Europa. Durante la temporada más
reciente, una muestra de 1000 fue seleccionada al azar de los archivos y se encontró que 480
querían Ir a Europa de vacaciones. ¿Ha sido un cambio significativo hacia arriba en el porcentaje
de personas que desean ir a Europa? Pruebe a un nivel del 5%,

3.5.3 PRUEBA DE INDEPENDENCIA.


Antes de explicar la prueba de independencia aprendemos a construir una tabla de contingencia.
DEFINICION: Una tabla de contingencia es una disposición de datos en una clasificación de
dobla entrada. Los datos se ordenan en celdas y se reporta el número de datos en cada una. En
una tabla de contingencia (o cruces de variables) están implicadas dos variables.
Veamos un ejemplo donde podemos observar como hacer una tabla de cruces de variables.
EJEMPLO: Supongamos que teníamos una muestra de 15 personas a las cuales se les preguntó
su sexo y si tiene trabajo o no.
SEXO: masculino - codificado con valor 1; Femenino- 2
TRABAJA: si - 1; no – 2.

19
SEXO 1 2 2 1 2 1 2 1 1 2 1 2 1 2 1
TRABAJA 1 1 1 2 2 1 1 2 2 2 1 1 1 2 1

Ahora realizamos la tabla de contingencia:


SEXO MASCULINO FEMENINO TOTALES
TRABAJA 1 2
SI 1 5 4 9
NO 2 3 3 6
TOTALES 8 7 15

Observen que en la celda donde tenemos valor 5 corresponde a número de personas que son de
sexo masculino y tienen trabajo (1,1) y así sucesivamente. Después se calculan los totales de las
columnas y de las filas y el total general que debe corresponder a los totales de los datos de la
muestra.
Si nosotros queremos saber si hay relación entre el sexo y trabaja persona o no (si el hecho de
que la persona trabaja o no depende de sexo) debemos realizar una prueba de independencia.
En base de un ejemplo explicaré como se realiza la prueba de independencia (o de chi-cuadrada
(2) porque se utiliza el estadígrafo chi- cuadrada)
EJEMPLO: A los 300 alumnos de una escuela se les pregunto cual es su área favorita y el sexo.
Los datos están dados en una tabla de contingencia. Determine si la preferencia por el área
depende de sexo del alumno o no con un nivel de significación de 0.05.
Área favorita
Sexo Matemáticas Ciencias Humanidades TOTALES
Sociales
Masculino 37 41 44 122
Femenino 35 72 71 178
TOTALES 72 113 115 300

Paso I: Plantear la hipótesis. Siempre la hipótesis nula tiene que decir que las variables son
independientes.
H0: La preferencia por el área no depende de sexo del alumno.
H1: La preferencia por el área depende de sexo del alumno.
Paso II: Región crítica.

 2(g.l.,)
5.991
Para calcular los grados de libertad de la distribución chi-cuadrada usaremos la fórmula:
g.l. = (f-1)(c-1), donde f- número de filas, c-número de columnas, sin tomar en cuenta totales.
g.l.=(2-1)(3-1)=2.

20
Usando la tabla de la guía calculamos el valor de la chi-cuadrada (uso de la tabla es similar de T
de Student) 2(gl.,)= 2(2g.l. ,0.05)= 5.991
Paso III: Estadística de la prueba.
Antes de calcular la estadística de la prueba hay que calcular los valores esperados para cada
celda de la tabla. Los valores que aparecen en la tabla son valores observados. Para calcular los
valores esperados se multiplica los subtotales de la fila y columna correspondiente al valor
observado y se divide entre total general.
(122)(72) (122)(113) (122)(115)
E11   29.28 E12   45.95 E13   46.77
300 300 300
(178)(72) (178)(113) (178)(115)
E 21   42.72 E 22   67.05 E 23   68.23
300 300 300
Ahora estos valores se ubicarán en la tabla entre paréntesis en la celda correspondiente.
Área favorita
Sexo Matemáticas Ciencias Humanidades TOTALES
Sociales
Masculino 37 (29.28) 41 (45.95) 44 (46.77) 122
Femenino 35 (42.72) 72 (67.05) 71 (68.23) 178
TOTALES 72 113 115 300

Usamos ahora la fórmula para calcular la estadística de la prueba.


(O  E ) 2
2   , donde O- valor observado de la celda, E- valor esperado de la celda.
E
2=
(37  29.28) 2 (41  45.95) 2 (44  46.7) 2 (35  42.72) 2 (72  67.05) 2 (71  68.23) 2
     
29.28 45.95 46.77 42.72 67.05 68.23
=2.035+0.533+0.164+1.395+0.365+0.112 = 4.604

Paso IV: Decisión.


Estadística de la prueba nos dio 4.604, si colocamos este valor en la gráfica veamos que se
encuentra en la región de aceptación.
H0 se acepta.
Paso V: Conclusión. Al nivel de significación de 0.05 no podemos afirmar que la preferencia
por área preferida depende de sexo de alumno.
Paso VI: Valor de p
p< α se rechaza la Ho.
Se busca el valor de χ2c = 4.604 con gl=2 el valor que esté más cercano a éste = 4.605 y le
corresponde el valor de p= 0.10 < 0.05 esto es falso por lo tanto la Ho. No se rechaza, se acepta.
NOTA: No debe utilizarse la prueba de chi-cuadrada si n<30 o si hay mas de 20% de celdas
con la frecuencias esperadas menores de 5.

21
Autoaprendizaje No.6
1 A un grupo de 350 adultos, que participaron en una encuesta de salud, se les pregunto si
llevan o no una dieta. Las respuestas por sexo fueron los siguientes.
Dieta Sexo Masculino Femenino Totales
A dieta 14 25
Sin dieta 159 152
Totales
¿Sugieren estos datos que el estar a dieta depende de sexo? Use nivel de significación de 0.01.
2 Cuatrocientos individuos fueron clasificados como políticamente FSLN, PLC o ALN.
Además cada uno se clasifica por edad, como se indica en la siguiente tabla. ¿Podemos
decir que la preferencia política depende de edad de la persona, con nivel de significación
de 0.05?
Grupos de Edad
Preferencia 20-35 36-50 Mayor de Totales
Política 50
FSLN 20 40 20
PLC 80 85 45
ALN 40 25 45
Totales

3 Se realiza un análisis de datos sobre accidentes, para determinar la distribución del


número de accidentes automovilísticos mortales según el tamaño del auto. Loa datos para
346 accidentes son siguientes.
Tamaño del auto Pequeño Mediano Grande
Mortal 67 26 16
No Mortal 128 63 46

¿Indican estos datos que la frecuencia de accidentes mortales depende del tamaño de los
automóviles con nivel de significación de 0.05?
4 Se entrevisto a un grupo de 306 personas para determinar su opinión respecto a un tema especifico
de política exterior. Al mismo tiempo, se .registro su afiliación política. Los datos son los siguientes:

De acuerdo con la En desacuerdo con No opinaron


política la política

Partido del 114 53 17


gobierno

22
Oposición 87 27 81

Presentan los datos suficiente evidencia que indique que hay relación entre la afiliación política y la
opinión expresada. Use un nivel de 0,05.

23

You might also like