Professional Documents
Culture Documents
La ji cuadrada ( )
Es una nueva prueba estadística que se usa para los datos que miden con una escala nominal.
La prueba de bondad de ajuste es una de las pruebas estadísticas más comunes. La primera
explicación de esta prueba incluye el caso donde las frecuencias esperadas de las celdas son
iguales.
La finalidad de la prueba de bondad de ajuste es comparar una distribución observada con una
distribución observada.
Jugador Tarjetas
vendidas, f0
Tom Server 13
Nolan Ryan 33
Ty Cobb 14
George Brett 7
Hank Aaron 36
Jhonny Bench 17
Total 120
¿Qué sucede con el nivel de medida en este problema? Observe que cuando se vende una
tarjeta, la “medida” se basa en el nombre del jugador. No hay un orden natural para los
jugadores. Ningún jugador es mejor que el otro, por tanto, se utiliza una escala nominal para
evaluar cada observación.
Como en la muestra hay 120 tarjetas, esperamos que (fe) sea de 20 tarjetas, es decir la
frecuencia esperada fe, caiga en cada una de las seis categorías como se muestra en la tabla
siguiente. Estas categorías se llaman celdas. Un estudio de la serie de frecuencias observadas
en la tabla anterior, indica que la tarjeta de George Brett no se vende con frecuencia, mientras
que la de Hank Aaron y Nolan Ryan se venden más a menudo. La diferencia en las ventas se
debe a una casualidad o podemos llegar a la conclusión de que existe una preferencia de ciertos
jugadores.
Paso 2: Establecer el nivel de significancia. Seleccionamos el nivel 0.05, que es igual a ala
probabilidad de error de tipo I por tanto, la probabilidad de que se rechace la hipótesis nula es de
0.05.
Si el valor calculado de Ji cuadrada es mayor a 11.070, la regla de decisión es rechazar H0. sin
es menor o igual a 11.070, se acepta H0 se deberá observar el gráfico para tomar la decisión
Paso 5: Calcular el valor de ji cuadrada y tomar una decisión. De las 120 tarjetas vendidas
en la muestra, contamos con el número de veces que se vendieron Tom Server Nolan Ryan y
cada uno de los demás jugadores
2 2
Jugador f0 fe (f0 - fe) (f0 - fe) (f0 - fe) / fe
Tom Server 13 20 -7 49 49/20 = 2.45
Nolan Ryan 33 20 13 169 169/20 = 8.45
Ty Cobb 14 20 -6 36 36/20 = 1.80
George Brett 7 20 -13 169 169/20 = 8.45
Hank Aaron 36 20 16 256 256/20 = 12.80
Jhonny Bench 17 20 -3 9 9/20 = 0.45
Sumas Debe ser 0 34.40
La calculada es de 34.40 y está en la región de rechazo más allá del valor crítico de 11.070.
Por lo tanto, la decisión es rechazar H0 con un nivel 0.05 y aceptar H1. La diferencia entre las
frecuencias observada y esperada no se debe a la casualidad. Más bien, las diferencias entre f 0
y fe son lo bastante grandes para considerarse significativas. La casualidad de que estas
diferencias se deban al error de muestreo es muy pequeña. Así pues, llegamos a la conclusión
de que no es probable que las ventas de las tarjetas sean iguales.
Días Número de
ausencias
Lunes 12
Martes 9
Miércoles 11
Jueves 10
Viernes 9
Sabado 9
total
EJERCICIOS.
1. En una prueba de bondad de ajuste de ji cuadrada particular, existen cuatro categorías y
200 observaciones. Utilice un nivel de significancia 0.05.
a. ¿Cuántos grados de libertad existen?
b. ¿Cuál es el valor crítico de ji cuadrada?
2. En una prueba de bondad de ajuste de ji cuadrada particular, existen seis categorías y
500 observaciones. Utilice un nivel significancia 0.01
a. ¿Cuántos grados de libertad existen?
b. ¿Cuál es valor crítico de ji cuadrada?
3. La hipótesis nula y la alternativa son:
H0: las categorías de las celdas son iguales
H1: Las categorías de las celdas no son iguales.
Categoría F0
A 10
B 20
C 30
Categoría F0
A 10
B 20
C 30
D
5. un dado de seis caras se lanza 30 veces y aparecen los números del 1 al 6 según se
muestra en la distribución de frecuencia a continuación: con un nivel de significancia
0.10, ¿podemos llegar a la conclusión de que el dado es legal?
Resultado Frecuencia
1 3
2 6
3 2
4 3
5 9
6
6. Classic Golf Inc. Administra cinco cursos en el área de Jacksonville, Florida. El director
quiere estudiar el número de rondas de golf que se juegan por día de la semana en los
cinco cursos, por lo que reunió la siguiente información de muestra.
Días Rondas
Lunes 124
Martes 74
Miércoles 104
Jueves 98
Viernes 120
Con un nivel de significancia 0.05, ¿existe una diferencia en el número de rondas jugadas
por día de la semana?
Opinión No de
compradores
Sobresaliente 47
Excelente 45
Muy Buena 50
Buena 39
Regular 35
Indeseable 34
Como el número más grande (47) indicó que la nueva línea sobresaliente, el jefe de diseño
piensa que esta es una razón para iniciar la producción masiva de los vestidos. El jefe de
barredoras (que de alguna manera se involucró en esto) cree que no existe una razón clara y
afirma que las opiniones se distribuyen de manera uniforme entre las seis categorías.
Además, dice que las leves diferencias entre las cuentas podrían deberse a la casualidad.
Pruebe que en la hipótesis nula no existe una diferencia significativa entre las opiniones de
los compradores. Pruebe al nivel de significancia 0.01. siga un planteamiento formal, es decir
establezca la hipótesis nula, la hipótesis alternativa y así sucesivamente.
SOLUCIÓN. Empecemos por organizar la información anterior. Se nota que no hay punto de
comparación en los porcentajes que los administradores del hospital presentan en el estudio de
las frecuencias reportadas por Bartow Estates. Sin embargo, estos porcentajes se pueden
convertir en frecuencias esperadas, f e. Según los administradores del hospital, 40% de los
residentes de Bartow que participaron en la encuesta no necesitaron hospitalización. Por tanto, si
no existe diferencia entre la experiencia nacional y la de Bartow Estates, entonces 40% de las
150 personas de la tercera edad entrevistadas (60 residentes) no habrían sido hospitalizados.
Además, 30% de los entrevistados fueron admitidos una vez (45 residentes), y así
sucesivamente. En el siguiente cuadro presentaremos las frecuencias observadas y las
frecuencias esperadas. Con base en los porcentajes del estudio nacional.
Número de Porcentaje de Número de residentes Número esperado
admisiones AHAA del total en Bartow (f0) de residentes (fe)
0 40 55 60
1 30 50 45
2 20 32 30
3 o más 10 13 15
Total 100 150 150
Número de
2
admisiones (f0) (fe) f0 -fe (f0 - fe) /fe
0 55 60 40 55
1 50 45 30 50
2 32 30 20 32
3 o más 13 15 10 13
Total 150 150 100 150
Limitaciones de la ji cuadrada. Tener cuidado en la aplicación en algunos problemas de la ji
cuadrada si en una celda existe una pequeña frecuencia esperada inusual, ji cuadrada (si se
aplica) podría dar como resultado una conclusión equivocada. Lo anterior puede suceder porque
fe aparece en el denominador y, al dividirlo entre un número muy pequeño, ¡el cociente aumenta
mucho! Por lo general, dos reglas aceptadas respecto a las pequeñas frecuencias de celda son:
1. Si sólo existen dos celdas, la frecuencia esperada en cada celda debe ser de 5 o más. El
cálculo de ji cuadrada sería permisible en la siguiente problema, que implica una f e
mínima de 6.
Persona fo fe
Alfabeta 643 642
Analfabeta 7 6
2. Si se espera que más de 20% de las celdas f e tengan frecuencia esperadas menores a
5, no se debe usar ji cuadrada para más de dos celdas. Según está regla, no seria
conveniente usar la prueba de bondad de ajuste en los siguientes datos. Tres de las
siete celdas. o 43 % , tienen frecuencias esperadas menores a 5
Nivel de administración fo fe
Encargado 30 32
Supervisor 110 113
Gerente 86 87
Gerencia de nivel medio 23 24
Asistente del vicepresidente 5 2
Vicepresidente 5 4
Vicepresidente ejecutivo 4 1
Total 263 263
EJERCICIOS.
9. Se presentan las siguientes hipótesis:
H0 : 40% de las observaciones están en la categoría A, 40% en la categoría
B y 20% en la Categoría C.
H1 : Las observaciones no son como se describen en H0.
Tomamos una muestra de 60 con los siguientes resultados.
Categoría F0
A 30
B 20
C 10
10. Al jefe de seguridad de Mall of the Dakotas se le pidió que estudiará el problema de los
faltantes de mercancía. Seleccionó una muestra de 100 cajas que se manipularon
indebidamente y averiguo que 60 de las cajas, los pantalones, zapatos y demás
mercancía que faltaba se debía a hurtos en las tiendas. Los empleados robaron
mercancía de otras 30 cajas y el faltante de las 10 cajas restantes lo atribuyo a control
de inventario deficiente. En su informe la gerencia del centro comercial, ¿puede decir
que probablemente el hurto en tiendas sea el doble de la perdida en comparación con el
robo por parte de los empleados o un control de inventario deficiente y que el robo por
parte de los empleados y el deficiente control de inventarios quizá son iguales? Utilice un
nivel de significancia 0.02
11. El departamento de tarjetas crédito bancarias de Carolina Bank sabe por experiencia
que 5% de los tarjetahabientes tienen un nivel de estudios universitarios y que 55%
termino la universidad. De los 500 tarjetahabientes a quienes se les llamó por no pagar
su cargos en el mes, 50 tenían estudios de preparatoria, 100 terminaron la preparatoria,
190 tenían ciertos estudios universitarios y 160 terminaron la universidad. ¿Podemos
llegar a al conclusión de que la distribución de los tarjetahabientes que no pagan sus
cargos es diferente a los demás? Utilice un nivel de significancia 0.01.
12. Durante muchos años, ejecutivos de televisión utilizaron el lineamiento de que 30% del
público veía cada una de las cadenas televisivas de mayor audiencia y 10% veía canales
de televisión por cable durante una noche entre semana. El pasado lunes por la noche,
una muestra aleatoria de 500 televidentes en el área de Tampa-St. Petersburg, Florida,
reveló que 165 hogares sintonizaron la filial de ABC, 140 la filial CBS, 125 la filial de
NBC y el resto vio canal de televisión por cable. En el nivel de significancia 0.05,
¿Podemos llegar a la conclusión de que el lineamiento sigue siendo razonable?