Professional Documents
Culture Documents
INFERENCIA ESTADÍSTICA
ProbabilísticoNo Probabilístico
1
El estadístico muestral no necesariamente coincide exactamente con el parámetro
poblacional
Para P = 95%
Para P = 99%
Para P = 90%
Cuando nosotros sacamos una muestra de tamaño n de la población de tamaño N, solo tenemos
el valor de la media muestral x (estadígrafo), pero nuestro interés es por el parámetro (media
poblacional ). Nunca conoceremos el verdadero valor de (al menos que realizamos un
censo, investigamos toda la población), entonces necesitamos estimarla. Existen dos tipos de
estimaciones: Estimación puntual y Estimación por intervalo de confianza.
Estimación por intervalos de confianza: Los estimadores por intervalo se denominan
comúnmente intervalos de confianza. Los extremos superior e inferior de un intervalo de
confianza se llaman límites de confianza superior e inferior respectivamente. La probabilidad de
que un intervalo de confianza contenga el parámetro se conoce como coeficiente de confianza
( o nivel de confianza) se denota 1- . Donde es el nivel de significación.
Si en base de la muestra se desea estimar la media poblacional se usarán las siguientes formulas
según el caso.
2
Si n 30 x z Si n < 30 x t ,( n1) g .l .
2 n 2 n
n
Si se conoce el tamaño de la población (N) y la razón 100 5% (la muestra forma una
N
parte apreciable de población), entonces la formula de intervalo de confianza para la media
tendrá un factor de corrección por población finita (FCF).
N n
Si n 30 x z
2 n N 1
N n
Si n < 30 x t
( ,( n 1) g .l )
2 n N 1
Estimación puntual: Se realiza cuando la media poblacional toma valor de la media muestral.
=x
x . En este caso se indica el Error Máximo de estimación.
Error Máximo es z
2 n
n
Si se conoce el tamaño de la población (N) y la razón 100 5% , se utiliza el F.C.P.
N
N n
Error Máximo es z
2 n N 1
Ejemplo 1: Demos una estimación por intervalo de confianza del 95% para la longitud media
de los lápices de cierta marca, si una muestra de 64 lápices arrojo una longitud promedio de 191
mm., siendo la distribución de la longitud de tales lápices normal con varianza de 400.
SOLUCION: Primero hay que determinar los datos. 95% es el nivel de confianza: 1- = 0.95,
por lo tanto = 1- 0.95 = 0.05(es el nivel de significación).
= 0.05, Media muestral x = 191mm, Tamaño de muestra n = 64, Varianza que nos dan no es
de la muestra sino de la población, porque hablan de la distribución de los lápices, entonces
denotaremos 2 = 400, sacando la raíz cuadrada obtenemos la desviación estándar =20. Nos
piden un intervalo de confianza para la media, además n 30, no conocemos el tamaño de la
población, por eso no usaremos el FCF usamos la formula
0.05
Calculamos primero 1 2 1 2 1 0.025 0.975 , después
x z
2 n z z 0.975 1.96
buscamos en la tabla de la Normal, 1 . Sustituimos en la
2
20
formula los datos 191 1.96 ;
64
3
191 4.9 , 186.1,195.9 . La longitud promedio de los lápices en la población es
de 186 a 195 milímetros, con un nivel de confianza de 95%.
Ejemplo 2: Una muestra aleatoria de cinco ejemplares de cierto tipo de helado tiene un
contenido de grasa medio de 11.3% y una desviación estándar de 0.38%. Construya un intervalo
de confianza del 95% para el contenido promedio de la grasa en el helado.
Ejemplo 3: Un estudio muestral conducido en una ciudad de 400 familias de las cuales
tomaron 50 los que tenían un ingreso anual promedio de $27 565 con una desviación estándar de
$5000. Construya un intervalo de confianza del 90% en relación con el ingreso anual promedio
real de todas las familias de esta ciudad.
4
x x
1
x n n
p z
n 2
n
Donde ;
Ejemplo 4: El análisis de 500 ventas seleccionadas al azar de un comerciante indicó que 465
de ellas se hicieron a crédito. Construya un intervalo de confianza del 95% para la proporción
real de estas ventas que se hacen a crédito.
SOLUCION: Los datos: n = 500, los 465 de 500 son las ventas que se hicieron a crédito por lo
z z 0.975 1.96
tanto x = 465, = 1- 0.95 = 0.05, calculando 1
2
y sustituyendo en la formula
0.931 0.93
dada obtenemos p 0.93 1.96 , p 0.93 0.022 , p 0.908,0.952 .
500
Podemos decir que las ventas que se hacen a crédito en la población es de 90.8 % a 95.2%
Para el cálculo del tamaño de la muestra adecuado, si en base de esta muestra queremos estimar
el promedio usaremos la formula siguiente:
n0 N
Si la población es finita de tamaño N, el tamaño de la población es: n , donde
n0 ( N 1)
2
z
1 2
n0
E
Para el cálculo del tamaño de la muestra adecuado, si en base de esta muestra queremos
estimar la proporción usaremos la formula siguiente:
5
2
z
Si se tiene idea de la proporción poblacional: n p
ˆ (1 p
ˆ ) 2
E
2
z
1 2
Si no se conoce la proporción poblacional: n
4 E
proporción que se crea que tiene el valor de interés de la variable de estimar, se determina en una
(0.25) N
muestra piloto, en el caso que no se conoce usamos la formula n
( N 1)n0 0.25
Autoaprendizaje No. 5
Inferencia Estadística
2. Los ingresos del impuesto sobre venta en una comunidad particular se recaudan cada
trimestre. Los siguientes datos representan los ingresos (en miles de dólares) cobrados
durante el primer trimestre de una muestra de nueve establecimientos de menudeo de la
comunidad: 15, 18, 11, 17, 13, 10, 22, 15, 16.
a) Establezca e interprete una estimación por intervalo con un 99% de confianza, de los ingresos
trimestrales del impuesto sobre ventas en los establecimientos de menudeo.
b) Si hay un total de 300 establecimientos de menudeo en esa comunidad, estime e interprete un
intervalo con un 95% de confianza de los ingresos trimestrales del impuesto sobre venta en
los establecimientos de menudeo.
6
3 Al examinar los registros de facturación mensual de una empresa editora con ventas por
correo, el auditor toma una muestra de 10 de las facturas no pagadas. Las sumas que se
adeudan a la compañía son: $4, $18, $11, $7, $10, $5, $33, $9, $12, $15.
a) Determine e interprete una estimación por intervalo con un 90% de confianza de la cantidad
promedio de facturas no pagadas.
b) Si hubiera un total de 250 facturas no pagadas. Determine e interprete una estimación por
intervalo del 99% de confianza de la cantidad promedio de facturas no pagadas.
5. Se va a vender un nuevo cereal para desayuno y se pone a prueba de mercado durante un mes
en las tiendas de una cadena de autoservicio, se desea estimar la suma promedio de venta con
aproximación de ± $100 con un 95% de confianza y se supone que la desviación estándar es de
$200. ¿Qué tamaño de muestra se necesita?
6. Un grupo de estudio quería estimar fa facturación mensual promedio por luz eléctrica en el
mes de Julio en casas unifamiliares en una ciudad. Con base en estudios efectuados en otras
ciudades, se supone que la desviación estándar es de $20. El grupo quiere estimar ¡a facturación
promedio de julio con aproximación de ± $5 del promedio real con un 95% de confianza, ¿Qué
tamaño de muestra se necesita?
7. El gerente de una sucursal bancaria en una ciudad quiere determinar la proporción de sus
cuenta habientes a los cuales se les paga el sueldo por semana, por experiencia previa en otras
áreas se sabe que sólo el 30% prefieren este sistema, si el gerente quiere tener 95% de confianza
de que esta en lo correcto con aproximación de ± Q.05 de la proporción do sus clientes a quienes
se les paga por semana. ¿Qué tamaño de muestra se necesita?
8 Los resultados de un estudio realizado en una universidad mostraron que una muestra
tomada al azar de 25 alumnos utiliza las instalaciones del centro de estudiantes en promedio 6.8
veces por semana, con desviación estándar de 2.4. Construya un intervalo de confianza del 99%
en relación con el número promedio de veces que un alumno de la universidad utiliza las
instalaciones del centro de estudiantes a la semana.
9 Una tienda de quesos para conocedores lleva un registro de las compras hechas por sus
clientes. Una muestra tomada al azar de 15 de estos registros arroja compras de 28.3 onzas de
queso en promedio con desviación estándar de 2.7 onzas. Construya un intervalo de confianza
de 95% de la media de la población que se muestrea.
10 Para estimar el número promedio de millas que los estudiantes de una universidad
suburbana recorren para asistir a clase, un funcionario de la universidad seleccionó una muestra
al azar de 75 estudiantes que hacen el recorrido y obtuvo una media de 18.2 millas con una
7
desviación estándar de 2.30 millas. Con el 99% de confianza ¿qué se puede decir acerca del
error máximo en la estimación del recorrido promedio real como 18.2 millas?
11 En un estudio de costos anuales de renta de apartamientos de una ciudad del Este, una
muestra de 25 apartamientos tiene un costo de renta medio de $11 535 y una desviación estándar
de $875.
a) Construya un intervalo de confianza del 99% del costo anual promedio real de renta de los
apartamientos.
b) ¿Qué se puede decir con el 95% de confianza acerca del error máximo si la media de la
muestra de %11 535 se utiliza como estimación del costo anual promedio de renta de los
apartamientos?
13 Diez estudiantes seleccionados al azar de una gran muestra de alumnos, tardaron 60, 50,
45, 60, 75, 35, 42, 53, 49 y 65 minutos en terminar un examen de inglés. Si la media de esta
muestra se utiliza para estimar el tiempo promedio real que tardan en terminar el examen, ¿qué
podemos decir con el 95% de confianza acerca del error máximo?
16 En una muestra aleatoria de 575 capitanes de puerto, 360 pensaban que el gobierno
debería de exigir a los propietarios de botes recreativos que presentarán un examen para obtener
360
la licencia. Si se utiliza =0.63 como estimación de la proporción real correspondiente de la
575
población que se muestrea, ¿qué se puede afirmar con el 98% de confianza acerca del error
máximo?
8
error máximo de 20 horas con una confiabilidad del 95%. ¿ Que tamaño de la muestra se
necesita?
19 El gerente de una sucursal bancaria en una ciudad quiere determinar la proporción de sus
cuenta habientes a los cuales se les paga el sueldo por semana, por experiencia previa en otras
áreas se sabe que sólo el 30% prefieren este sistema, si el gerente quiere tener 95% de confianza
de que esta en lo correcto con aproximación de mas o menos 0.05 de la proporción de sus
clientes a quienes se les paga por semana. ¿Que tamaño de muestra se necesita?
9
3.5 PRUEBAS DE HIPÓTESIS
1 2 3
Hipótesis nula: Afirmación acerca del valor de un parámetro. (Siempre lleva la igualdad).
10
Hipótesis alternativa: Afirmación que se aceptará si los datos muestrales proporcionan
amplia evidencia de que la hipótesis nula es falsa. Se define siempre lo contrario de la
hipótesis nula.
Nivel de Significancia: Probabilidad de rechazar la hipótesis nula cuando es verdadera
Valor crítico: Número que es el punto divisorio entre la región de aceptación y la región de
rechazo, de la hipótesis nula
Valor estadístico de prueba: Valor obtenido a partir de la información muestral, que se
utiliza para determinar si se rechaza la hipótesis nula.
Realidad
Decisión Cierta la H0 Falsa H0
H0 se rechaza Error Tipo I Decisión Correcta
H0 se acepta Decisión Error Tipo II
Correcta
11
como se quiera, puesto que una disminución en una de ellas provoca, en general, un aumento de
otra. Una solución es fijar el valor de una de ellas. En esto caso se fija el valor de , por lo
general se dan valores de 0.01, 0.05, 0.1 (se trabajará con error tipo I)
Si
Nivel de confianza 99%=0.99 95%=0.95 90%= 0.90
(1-α)
Nivel de 1%= 0.01 5%=0.05 10%= 0.10
significación (α)
2.58 1.96 1.645
2.33 1.645 1.28
3) Estadística de Prueba
x x
Z t
Si ; n si ; s n
4) Regla de decisión:
Si la prueba es bilateral: /Zc/ > Zα se rechaza la Ho.
Si la prueba es unilateral: Zc > Zα se rechaza la Ho. Ó bien Zc < -Zα se rechaza la Ho.
5) Conclusión
6) Valor de p
EJEMPLO 1:El tiempo promedio dedicado al estudio individual por los estudiantes de segundo
año de administración en los cursos anteriores fue de 18.75 horas semanales. Una muestra simple
aleatoria de 16 estudiantes del curso actual arrojo que dedicaban al estudio individual un
promedio de 19.23 horas semanales con varianza de 0.25. ¿Podemos afirmar con un nivel de
significación de 0.01 que los estudiantes de este curso estudian más? Consideremos la
distribución del tiempo de estudio semanal en la población Normal.
SOLUCION: Primero en que debemos fijarnos es que si la distribución es Normal. En este caso
si. Por lo tanto después nos fijamos en la varianza o desviación estándar, si es de población
usamos Z, si es de muestra entonces la t-dtudent. En este caso es la t-student, por lo que la
varianza que nos dan es de la muestra. Determinamos los datos.
Datos: n =16, S2 = 0.25, por lo tanto S =0.5, x = 19.23, = 0.01, el valor con el que
vamos a comparar la media se denota 0 = 18.75, es el promedio anterior.
12
Paso I.
Hipótesis: (Como se quiere saber que los estudiantes estudian más y esto nos confirma la
muestra, por lo tanto la hipótesis alternativa es H1: 0 , la nula es lo contrario.)
Ho: 18.75
H1: 18.75
Paso II.
Región Critica: como la muestra es menor de 30 se usará la tabla t- student y = 0.01
Calculamos el valor de t ,( n1) g .l . = t 0.01,15 g .l . = 2.6025
t ( 0.01,15) 2.6025
Paso III.
x o 19.23 18.75
tc
S 0.5
Estadística de la Prueba: calculamos: n = 16 = 3.84
Paso IV.
Decisión: Como la estadística de la prueba 3.84 es mayor de 2.6 cae en la región de rechazo, por
lo tanto Rechazamos la Hipótesis nula. tc > tα se rechaza la Ho.
Paso V.
Conclusión: Al rechazar la hipótesis nula, decimos: Podemos afirmar que el tiempo promedio de
estudio de los estudiantes de estudiantes de este curso es mayor que de los cursos anteriores, con
un nivel de significación de 0.01.
Paso VI
El valor de p < α se rechaza la Ho.
Con lo gl = 15 y tc = 3.84 se busca en la tabla t-student el valor más cercano a 3.84 esto es 2.9467
y este valor está por debajo de la probabilidad de p= 0.005 < 0.01 por tanto se rechaza la Ho.
EJEMPLO 2: El consumo diario de arroz en un comedor estudiantil ha sido históricamente de 63
Kg. con una varianza de 49. Se observa en una muestra simple aleatoria de 81 días que el
consumo promedio de arroz es de 61Kg. ¿Podemos afirmar basándonos en este resultado que el
consumo diario de arroz ha disminuido, con un nivel de significación de 0.05?
Datos: x = 61, n = 81, 2 = 49, =7, 0 = 63, = 0.05
Como no nos dicen que la distribución es Normal veamos, nos fijarnos solamente en el tamaño
de muestra, como es mayor de 30 usamos la Z normal
1) Hipótesis: Como queremos saber si ha disminuido el consumo de arroz, por lo tanto
hipótesis es: Ho: 63
13
H1: 63
2) Región Crítica: Como la prueba es unilateral izquierda y = 0.05 el valor de Z=
1.645
z1 =1.645
x o
tc 61 63
S
3) Estadística de la prueba: n = 7
81 = -2.57
Ho: o
H1: ¹ 0
z z
2 2
Ho: o z
x o
H1: 0 n
z
Ho: o
H1: 0 z
14
II Prueba de hipótesis para la media de una población con distribución normal y varianza de la
población desconocida.
HIPOTESIS ESTADIGRAFO COMUN REGION CRITICA
Ho: o
H1: ¹ 0
t
, ( n 1) g .l .
2
t
, ( n 1) g .l .
2
Ho: o t
x o
H1: 0 S
n
t ,( n 1) g .l .
Ho: o
Ho: p p o
H1: p ¹ p 0
z z
2 2
15
Ho: p po z
x np o
np o (1 p 0 )
H1: p po
z
Ho: p po
H1: p p0 z
EJEMPLO: Un constructor afirma que se instalan bombas de calor en 70% de todas las casas
que se constituyen hoy en día en la ciudad de Richmond. ¿Estaría de acuerdo con esta
afirmación si una de casas nuevas en esta ciudad muestra que 8 de 15 tienen instaladas bombas
de calor? Utilice un nivel de significancia de 0.1.
z z z z
1
= -1.645 1
=1.645 Calculamos 1
= 1
0 .1
= z 0.95 = 1.645
2 2 2 2
x np o 8 (15)(0.7)
3). Estadística de la prueba: z
np o (1 p 0 )
(15)(0.7)(1 0.7)
Zc= -1.41
4). Decisión: Aceptamos la hipótesis nula. Porque el valor -1.41 esta en la región de aceptación,
entre -1.645 y 1.645.
5).Conclusión: No hay razón suficiente para dudar de la afirmación de constructor.
6) Valor de p
Como la prueba es bilateral la regla de decisión: 2p<α se rechaza la Ho.
Zc = -1.41 se busca en la tabla normal 0.0793 = p entonces 2( 0.0793) = 0.1586 < 0.10 es falso
por lo tanto No se rechaza la Ho.
Autoaprendizaje No.6
16
1 Una cadena de restaurantes planea construir un nuevo expendio, si cuando menos 200 autos
pasan por el lugar propuesto cada hora, durante determinadas horas. Para 20 horas
muestreadas al azar, se encuentra que el # promedio de autos que pasan por ese lugar es 208.5,
con s = 30. Los administradores piensan que el volumen de tráfico satisface sus
requerimientos. Realice una prueba de hipótesis respecto a este problema con igual a 5%?
2 Suponga que los resultados muéstrales del problema anterior se basan en una muestra de n =
50 horas. Puede rechazarse la hipótesis nula con = 5%?
5 Una empresa industrial supone que la vida de su prensa rotativa más grande es cuando menos
14500 horas con =2100 horas. De una muestra de 25 prensas la compañía obtiene una
media muestral de 13000 horas. Con = 1%, ¿debe la compañía concluir que la vida media
de las prensas es menor que las 14500 supuestas?
6 Antes del embargo petrolero de 1973 y de los incrementos posteriores en los precios del
petróleo crudo, el consumo de gasolina en E.E.U.U. había crecido a una tasa mensual de 57%
con una desviación estándar de 10% al mes. En 15 meses escogidos aleatoriamente, el
consumo de gasolina aumentó a un porcentaje promedio de apenas 33% por mes. Con un
nivel de significación de 0.01, ¿puede afirmar usted que el crecimiento en el consumo de
gasolina disminuyó a raíz del embargo y sus consecuencias?
8 El propietario de un parque de diversiones hizo un estudio con 400 visitantes y descubrió que
220 de ellos se habían enterado de la existencia del parque a través de la publicidad por la
radio. Utilice el nivel de significación de 0.05 para determinar si esto fundamenta la
afirmación de que el 60% de los visitantes se entero de la existencia del parque a través de
esta forma de publicidad.
9. Gerente, de producción de una Compañía manufacturera estima que la edad media de sus
empleados es 22.8 años. El tesorero de la firma necesita una cifra de la edad medía de los
empleados más exacta, a fin de estimar el costo de una prestación por antigüedad que se
considera para los empleados. El tesorero toma una muestra aleatoria de 70 trabajadores y
17
observa que la edad media de los empleados muestreados es de 26.2 años con una desviación
estándar de 4.6 años. Con un nivel de significación del 1%. ¿Qué puede concluir acerca de la
exactitud de la estimación del Gerente de producción?
10. La producción diaria de una planta industrial química registrada durante 50 días, tiene una
media muestral de 871 toneladas y una desviación estándar de 21 toneladas. Pruebe la hipótesis
de que el promedio de la producción diaria del producto químico es de 880 toneladas por día,
contra la alternativa de que es mayor o menor que 880 toneladas por día, usando una
significación del 5%,
11. Una muestra aleatoria de 6 observaciones de una población normal, generó los
siguientes datos: 3.7 6.4 8.1 8.8 4.9 5.0 Proporcionan los datos suficiente evidencia que
señale que µ < 7, a un nivel del 5%.
12. Se diseñó un nuevo sistema para el control del inventarlo de un pequeño fabricante, con
el propósito de reducir el mismo para un motor eléctrico en particular, a menos de 3000 motores
por día. Se llevó a cabo un muestreo del Inventarlo en reserva al final de cada uno de los ocho
días, seleccionados aleatoriamente; los resultados se muestran a continuación. Con los datos hay
evidencia suficiente que señalen que el promedio del número diario de motores en el Inventarlo
es menor de 3000. Use un nivel da significación del 1%.
Número de Motores
2905 2725
2835 3065
2605 2835
3005 2895
13. Se sabe que en el pasado, la captura promedio de langostas en cada trampa colocada en
una zona particular de! Caribe ha sido de 30.31 lbs. Una muestra aleatoria de 20 trampas
colocadas recientemente dio los siguientes resultados (en Ibs.)
14. Suponga que el promedio de clientes que entrar a una tienda por día es de 175. Se hace
una campaña publicitaria durante 7 semanas. Durante la campaña, el promedio de clientes
aumentó a 181 por día. con una varianza muestra! de 441. Aumentó en forma significativa e!
18
número de clientes que entran B la tienda gracias a la campaña publicitaria a un nivel del 1% y a
un nivel del 5%.
16. American Theaters sabe que una película de éxito se exhibió un promedio de 34 días en
cada ciudad, y la desviación estándar correspondiente fue de 10 días. El administrador del
distrito sudorienta! estaba Interesado en comprar la popularidad de la película en su reglón con la
de los demás cines de la American. Eligió aleatoriamente 75 cines de su reglón y encontró que
proyectaron la película un promedio de 81.5 días.
Establezca las hipótesis apropiadas para probar si hubo una diferencia significativa en la
duración de la exhibición de la película entre los cines del distrito sudorienta! y los demás de la
American. A un nivel de significación del 1% pruebe esta hipótesis.
17. Tina Dennis es la Jefa de contabilidad de Meck Industries (MÍ). Ella cree que los
problemas de flujo de efectivo en MI se deben a fa cobranza lenta de cuentas pendientes. Estima
que más de 60% de las cuentas están en atraso más de tres meses. Una muestra de 200 cuentas
señaló que 140 tenían más de tres meses de antigüedad. Al nivel de significación de 0.01. ¿se
puede concluir que más do 60% de las cuentas están en atraso por mas de tres meses?
18. Experiencias en la Wills Travel Agency Indica que 44% de las personas
desean que esa agencia planee unas vacaciones para viajar a Europa. Durante la temporada más
reciente, una muestra de 1000 fue seleccionada al azar de los archivos y se encontró que 480
querían Ir a Europa de vacaciones. ¿Ha sido un cambio significativo hacia arriba en el porcentaje
de personas que desean ir a Europa? Pruebe a un nivel del 5%,
19
SEXO 1 2 2 1 2 1 2 1 1 2 1 2 1 2 1
TRABAJA 1 1 1 2 2 1 1 2 2 2 1 1 1 2 1
Observen que en la celda donde tenemos valor 5 corresponde a número de personas que son de
sexo masculino y tienen trabajo (1,1) y así sucesivamente. Después se calculan los totales de las
columnas y de las filas y el total general que debe corresponder a los totales de los datos de la
muestra.
Si nosotros queremos saber si hay relación entre el sexo y trabaja persona o no (si el hecho de
que la persona trabaja o no depende de sexo) debemos realizar una prueba de independencia.
En base de un ejemplo explicaré como se realiza la prueba de independencia (o de chi-cuadrada
(2) porque se utiliza el estadígrafo chi- cuadrada)
EJEMPLO: A los 300 alumnos de una escuela se les pregunto cual es su área favorita y el sexo.
Los datos están dados en una tabla de contingencia. Determine si la preferencia por el área
depende de sexo del alumno o no con un nivel de significación de 0.05.
Área favorita
Sexo Matemáticas Ciencias Humanidades TOTALES
Sociales
Masculino 37 41 44 122
Femenino 35 72 71 178
TOTALES 72 113 115 300
Paso I: Plantear la hipótesis. Siempre la hipótesis nula tiene que decir que las variables son
independientes.
H0: La preferencia por el área no depende de sexo del alumno.
H1: La preferencia por el área depende de sexo del alumno.
Paso II: Región crítica.
2(g.l.,)
5.991
Para calcular los grados de libertad de la distribución chi-cuadrada usaremos la fórmula:
g.l. = (f-1)(c-1), donde f- número de filas, c-número de columnas, sin tomar en cuenta totales.
g.l.=(2-1)(3-1)=2.
20
Usando la tabla de la guía calculamos el valor de la chi-cuadrada (uso de la tabla es similar de T
de Student) 2(gl.,)= 2(2g.l. ,0.05)= 5.991
Paso III: Estadística de la prueba.
Antes de calcular la estadística de la prueba hay que calcular los valores esperados para cada
celda de la tabla. Los valores que aparecen en la tabla son valores observados. Para calcular los
valores esperados se multiplica los subtotales de la fila y columna correspondiente al valor
observado y se divide entre total general.
(122)(72) (122)(113) (122)(115)
E11 29.28 E12 45.95 E13 46.77
300 300 300
(178)(72) (178)(113) (178)(115)
E 21 42.72 E 22 67.05 E 23 68.23
300 300 300
Ahora estos valores se ubicarán en la tabla entre paréntesis en la celda correspondiente.
Área favorita
Sexo Matemáticas Ciencias Humanidades TOTALES
Sociales
Masculino 37 (29.28) 41 (45.95) 44 (46.77) 122
Femenino 35 (42.72) 72 (67.05) 71 (68.23) 178
TOTALES 72 113 115 300
21
Autoaprendizaje No.6
1 A un grupo de 350 adultos, que participaron en una encuesta de salud, se les pregunto si
llevan o no una dieta. Las respuestas por sexo fueron los siguientes.
Dieta Sexo Masculino Femenino Totales
A dieta 14 25
Sin dieta 159 152
Totales
¿Sugieren estos datos que el estar a dieta depende de sexo? Use nivel de significación de 0.01.
2 Cuatrocientos individuos fueron clasificados como políticamente FSLN, PLC o ALN.
Además cada uno se clasifica por edad, como se indica en la siguiente tabla. ¿Podemos
decir que la preferencia política depende de edad de la persona, con nivel de significación
de 0.05?
Grupos de Edad
Preferencia 20-35 36-50 Mayor de Totales
Política 50
FSLN 20 40 20
PLC 80 85 45
ALN 40 25 45
Totales
¿Indican estos datos que la frecuencia de accidentes mortales depende del tamaño de los
automóviles con nivel de significación de 0.05?
4 Se entrevisto a un grupo de 306 personas para determinar su opinión respecto a un tema especifico
de política exterior. Al mismo tiempo, se .registro su afiliación política. Los datos son los siguientes:
22
Oposición 87 27 81
Presentan los datos suficiente evidencia que indique que hay relación entre la afiliación política y la
opinión expresada. Use un nivel de 0,05.
23