You are on page 1of 7

2

La ji cuadrada ( )

Es una nueva prueba estadística que se usa para los datos que miden con una escala nominal.

Prueba de bondad de ajuste: Frecuencias igualmente esperadas.

La prueba de bondad de ajuste es una de las pruebas estadísticas más comunes. La primera
explicación de esta prueba incluye el caso donde las frecuencias esperadas de las celdas son
iguales.

La finalidad de la prueba de bondad de ajuste es comparar una distribución observada con una
distribución observada.

EJEMPLO. La señorita Jan Kilpatrick es gerente de mercadotecnia de una fábrica de tarjetas


deportivas. Ella piensa iniciar una serie de tarjetas con fotografías y estadísticas de juego de
exjugadores de la Ligas Mayores de Béisbol. Uno de los problemas es la selección de los
exjugadores. Durante la exhibición de tarjetas de beisbol en el Southwyck Mall el fin de semana
pasado, puso un stand y ofreció tarjetas de los siguientes seis jugadores de beisbol del Salón de
la Fama: Tom Server, Nolan Ryan, Ty Cobb, George Brett, Hank Aaron y Jhonny Bench. Al final
del día vendió 120 tarjetas. Como se indica en el cuadro siguiente. ¿Puede llegar ella a la
conclusión de que las ventas no son iguales para cada jugador?

Jugador Tarjetas
vendidas, f0
Tom Server 13
Nolan Ryan 33
Ty Cobb 14
George Brett 7
Hank Aaron 36
Jhonny Bench 17
Total 120

¿Qué sucede con el nivel de medida en este problema? Observe que cuando se vende una
tarjeta, la “medida” se basa en el nombre del jugador. No hay un orden natural para los
jugadores. Ningún jugador es mejor que el otro, por tanto, se utiliza una escala nominal para
evaluar cada observación.

Como en la muestra hay 120 tarjetas, esperamos que (fe) sea de 20 tarjetas, es decir la
frecuencia esperada fe, caiga en cada una de las seis categorías como se muestra en la tabla
siguiente. Estas categorías se llaman celdas. Un estudio de la serie de frecuencias observadas
en la tabla anterior, indica que la tarjeta de George Brett no se vende con frecuencia, mientras
que la de Hank Aaron y Nolan Ryan se venden más a menudo. La diferencia en las ventas se
debe a una casualidad o podemos llegar a la conclusión de que existe una preferencia de ciertos
jugadores.

Jugador Tarjetas Número vendido


vendidas, f0 esperado, fe
Tom Server 13 20
Nolan Ryan 33 20
Ty Cobb 14 20
George Brett 7 20
Hank Aaron 36 20
Jhonny Bench 17 20
Total 120 120
SOLUCIÓN. Usaremos el mismo procedimiento sistemático de prueba de hipótesis de cinco
pasos que hicimos en los capítulos anteriores.

Paso 1: Establecer la hipótesis nula y la hipótesis alternativa. La Hipótesis nula H0 es que no


existe ninguna diferencia entre la serie de frecuencias observadas y la serie de frecuencias
esperadas; es decir cualquier diferencia entre las dos series de frecuencias se puede atribuir al
muestreo (casualidad). La hipótesis alternativa H1 es que existe una diferencia entre las series de
frecuencias observadas y esperadas. Si se rechaza H 0 y se acepta H1 significa que las ventas no
se distribuyeron de manera equitativa entre las seis categorías (celdas).

Paso 2: Establecer el nivel de significancia. Seleccionamos el nivel 0.05, que es igual a ala
probabilidad de error de tipo I por tanto, la probabilidad de que se rechace la hipótesis nula es de
0.05.

Paso 3: Establecer el estadístico de prueba. El estadístico de prueba sigue la distribución de ji


cuadrada la cual se designa como 
( f  fe )2 
Estadístico de prueba ji cuadrada  2    0 
 fe 
Con k – 1 grados de libertad:
k = Número de categorías
f0 = Frecuencia observada en una categoría particular
fe = Es una frecuencia esperada en una categoría particular

Paso 4: Formular la regla de decisión. Recordar que se requiere establecer la zona de


decisión en base al nivel de significancia para el evento, la cual se determina a través de la tabla
de la 
  grados de libertad k – 1 = 6 – 1 = 5
nivel de significancia = 0.05

Área de la cola derecha


Grados de
libertad gl 0.10 0.05 0.02 0.01
1 2.706 3.841 5.412 6.635
2 4.605 5.991 7.824 9.210
3 6.251 7.815 9.837 11.345
4 7.779 9.488 11.668 13.277
5 9.236 11.070 13.388 15.086

Si el valor calculado de Ji cuadrada es mayor a 11.070, la regla de decisión es rechazar H0. sin
es menor o igual a 11.070, se acepta H0 se deberá observar el gráfico para tomar la decisión

Paso 5: Calcular el valor de ji cuadrada y tomar una decisión. De las 120 tarjetas vendidas
en la muestra, contamos con el número de veces que se vendieron Tom Server Nolan Ryan y
cada uno de los demás jugadores
2 2
Jugador f0 fe (f0 - fe) (f0 - fe) (f0 - fe) / fe
Tom Server 13 20 -7 49 49/20 = 2.45
Nolan Ryan 33 20 13 169 169/20 = 8.45
Ty Cobb 14 20 -6 36 36/20 = 1.80
George Brett 7 20 -13 169 169/20 = 8.45
Hank Aaron 36 20 16 256 256/20 = 12.80
Jhonny Bench 17 20 -3 9 9/20 = 0.45
Sumas Debe ser 0 34.40
La  calculada es de 34.40 y está en la región de rechazo más allá del valor crítico de 11.070.
Por lo tanto, la decisión es rechazar H0 con un nivel 0.05 y aceptar H1. La diferencia entre las
frecuencias observada y esperada no se debe a la casualidad. Más bien, las diferencias entre f 0
y fe son lo bastante grandes para considerarse significativas. La casualidad de que estas
diferencias se deban al error de muestreo es muy pequeña. Así pues, llegamos a la conclusión
de que no es probable que las ventas de las tarjetas sean iguales.

La directora de recursos humanos de Georgetown Paper Inc., está preocupada por el


ausentismo entre los trabajadores por hora. Decide hacer una muestra de los registros a fin de
determinar si el ausentismo se distribuye de manera uniforme entre la semana laboral de seis
días. La hipótesis nula que se va a probar es: el ausentismo se distribuye de manera uniforme
durante la semana. Los resultados de muestra son:

Días Número de
ausencias
Lunes 12
Martes 9
Miércoles 11
Jueves 10
Viernes 9
Sabado 9
total

Utilice un nivel de significacia 0.01 y el procedimiento de prueba de hipótesis en cinco pasos.


a) ¿Cómo se denomina los números 12, 9, 11, 10 9 y 9?
b) ¿Cuántas categorías (celdas) hay?
c) ¿Cuál es la frecuencia esperada por día?
d) ¿Cuántos grados de libertad existen?
e) ¿Cuál es valor crítico de ji cuadrada con un nivel de significancia del 1%?
f) Calcule el estadístico de prueba 
g) ¿Cuál es al decisión respecto a la hipótesis nula?
h) Específicamente, ¿qué indica lo anterior a la directora de recursos humanos?

EJERCICIOS.
1. En una prueba de bondad de ajuste de ji cuadrada particular, existen cuatro categorías y
200 observaciones. Utilice un nivel de significancia 0.05.
a. ¿Cuántos grados de libertad existen?
b. ¿Cuál es el valor crítico de ji cuadrada?
2. En una prueba de bondad de ajuste de ji cuadrada particular, existen seis categorías y
500 observaciones. Utilice un nivel significancia 0.01
a. ¿Cuántos grados de libertad existen?
b. ¿Cuál es valor crítico de ji cuadrada?
3. La hipótesis nula y la alternativa son:
H0: las categorías de las celdas son iguales
H1: Las categorías de las celdas no son iguales.

Categoría F0
A 10
B 20
C 30

a. Establezca la regla de decisión usando un nivel de significancia 0.05


b. Calcule el valor de ji cuadrada.
c. ¿Cuál es su decisión acerca de H0
4. La hipótesis nula y la alternativa son:
H0: las categorías de las celdas son iguales
H1: Las categorías de las celdas no son iguales.

Categoría F0
A 10
B 20
C 30
D

a. Establezca la regla de decisión usando un nivel de significancia 0.05


b. Calcule el valor de ji cuadrada.
c. ¿Cuál es su decisión acerca de H0

5. un dado de seis caras se lanza 30 veces y aparecen los números del 1 al 6 según se
muestra en la distribución de frecuencia a continuación: con un nivel de significancia
0.10, ¿podemos llegar a la conclusión de que el dado es legal?

Resultado Frecuencia
1 3
2 6
3 2
4 3
5 9
6

6. Classic Golf Inc. Administra cinco cursos en el área de Jacksonville, Florida. El director
quiere estudiar el número de rondas de golf que se juegan por día de la semana en los
cinco cursos, por lo que reunió la siguiente información de muestra.

Días Rondas
Lunes 124
Martes 74
Miércoles 104
Jueves 98
Viernes 120

Con un nivel de significancia 0.05, ¿existe una diferencia en el número de rondas jugadas
por día de la semana?

7. Un grupo de compradores en tiendas departamentales vio una nueva línea de vestidos y


opinó al respecto. Los resultados fueron:

Opinión No de
compradores
Sobresaliente 47
Excelente 45
Muy Buena 50
Buena 39
Regular 35
Indeseable 34
Como el número más grande (47) indicó que la nueva línea sobresaliente, el jefe de diseño
piensa que esta es una razón para iniciar la producción masiva de los vestidos. El jefe de
barredoras (que de alguna manera se involucró en esto) cree que no existe una razón clara y
afirma que las opiniones se distribuyen de manera uniforme entre las seis categorías.
Además, dice que las leves diferencias entre las cuentas podrían deberse a la casualidad.
Pruebe que en la hipótesis nula no existe una diferencia significativa entre las opiniones de
los compradores. Pruebe al nivel de significancia 0.01. siga un planteamiento formal, es decir
establezca la hipótesis nula, la hipótesis alternativa y así sucesivamente.

8. El director de seguridad de Honda USA tomó muestras aleatorias del archivo de


accidentes menores relacionados con el trabajo y las clasifico conforme al momento en
que ocurrió el accidente.
Hora No de
accidentes
8 a 9 am 6
9 a 10 am 6
10 a 11 am 20
11 a 12 am 8
1 a 2 pm 7
2 a 3 pm 8
3 a 4 pm 19
4 a 5 pm 6

Prueba de bondad de ajuste: Frecuencias esperadas desiguales.


2
La prueba de ji cuadrada ( ) también se puede usar si las frecuencias no son iguales. El
ejemplo a continuación explica el caso de frecuencias desiguales y también ofrece uso práctico,
en especial de la prueba de bondad de ajuste de ji cuadrada, para encontrar si una experiencia
local difiere de la experiencia nacional.

La American Hospital Administrators Association (AHAA) informa lo siguiente respecto al número


de ocasiones en que los ciudadanos de la tercera edad son admitidos en un hospital durante un
período de un año. El 40% no es admitido; el 30% es admitido una vez; 20 % es admitido dos
veces, y el 10% restante es admitido tres veces o más.
Una encuesta entre 150 residentes de Bartow Estates, en una comunidad destinada a
personas de la tercera edad activas en Florida Central, revelo que 55 residentes no fueron
admitidos durante el último año 50 fueron admitidos una vez y el resto de entrevistados fueron
admitidos tres veces o más. ¿Podemos llegar a la conclusión de que la encuesta en Bartow
Estates coincide con la información sugerida por AHAA? Utilice un nivel de significancia 0.05.

SOLUCIÓN. Empecemos por organizar la información anterior. Se nota que no hay punto de
comparación en los porcentajes que los administradores del hospital presentan en el estudio de
las frecuencias reportadas por Bartow Estates. Sin embargo, estos porcentajes se pueden
convertir en frecuencias esperadas, f e. Según los administradores del hospital, 40% de los
residentes de Bartow que participaron en la encuesta no necesitaron hospitalización. Por tanto, si
no existe diferencia entre la experiencia nacional y la de Bartow Estates, entonces 40% de las
150 personas de la tercera edad entrevistadas (60 residentes) no habrían sido hospitalizados.
Además, 30% de los entrevistados fueron admitidos una vez (45 residentes), y así
sucesivamente. En el siguiente cuadro presentaremos las frecuencias observadas y las
frecuencias esperadas. Con base en los porcentajes del estudio nacional.
Número de Porcentaje de Número de residentes Número esperado
admisiones AHAA del total en Bartow (f0) de residentes (fe)
0 40 55 60
1 30 50 45
2 20 32 30
3 o más 10 13 15
Total 100 150 150

Número de
2
admisiones (f0) (fe) f0 -fe (f0 - fe) /fe
0 55 60 40 55
1 50 45 30 50
2 32 30 20 32
3 o más 13 15 10 13
Total 150 150 100 150
Limitaciones de la ji cuadrada. Tener cuidado en la aplicación en algunos problemas de la ji
cuadrada si en una celda existe una pequeña frecuencia esperada inusual, ji cuadrada (si se
aplica) podría dar como resultado una conclusión equivocada. Lo anterior puede suceder porque
fe aparece en el denominador y, al dividirlo entre un número muy pequeño, ¡el cociente aumenta
mucho! Por lo general, dos reglas aceptadas respecto a las pequeñas frecuencias de celda son:

1. Si sólo existen dos celdas, la frecuencia esperada en cada celda debe ser de 5 o más. El
cálculo de ji cuadrada sería permisible en la siguiente problema, que implica una f e
mínima de 6.
Persona fo fe
Alfabeta 643 642
Analfabeta 7 6

2. Si se espera que más de 20% de las celdas f e tengan frecuencia esperadas menores a
5, no se debe usar ji cuadrada para más de dos celdas. Según está regla, no seria
conveniente usar la prueba de bondad de ajuste en los siguientes datos. Tres de las
siete celdas. o 43 % , tienen frecuencias esperadas menores a 5
Nivel de administración fo fe
Encargado 30 32
Supervisor 110 113
Gerente 86 87
Gerencia de nivel medio 23 24
Asistente del vicepresidente 5 2
Vicepresidente 5 4
Vicepresidente ejecutivo 4 1
Total 263 263
EJERCICIOS.
9. Se presentan las siguientes hipótesis:
H0 : 40% de las observaciones están en la categoría A, 40% en la categoría
B y 20% en la Categoría C.
H1 : Las observaciones no son como se describen en H0.
Tomamos una muestra de 60 con los siguientes resultados.
Categoría F0
A 30
B 20
C 10

a. Establezca la regla de decisión usando un nivel de significancia 0.01


b. Calcule el valor de ji cuadrada
c. ¿Cuál es la decisión acerca de H0?

10. Al jefe de seguridad de Mall of the Dakotas se le pidió que estudiará el problema de los
faltantes de mercancía. Seleccionó una muestra de 100 cajas que se manipularon
indebidamente y averiguo que 60 de las cajas, los pantalones, zapatos y demás
mercancía que faltaba se debía a hurtos en las tiendas. Los empleados robaron
mercancía de otras 30 cajas y el faltante de las 10 cajas restantes lo atribuyo a control
de inventario deficiente. En su informe la gerencia del centro comercial, ¿puede decir
que probablemente el hurto en tiendas sea el doble de la perdida en comparación con el
robo por parte de los empleados o un control de inventario deficiente y que el robo por
parte de los empleados y el deficiente control de inventarios quizá son iguales? Utilice un
nivel de significancia 0.02

11. El departamento de tarjetas crédito bancarias de Carolina Bank sabe por experiencia
que 5% de los tarjetahabientes tienen un nivel de estudios universitarios y que 55%
termino la universidad. De los 500 tarjetahabientes a quienes se les llamó por no pagar
su cargos en el mes, 50 tenían estudios de preparatoria, 100 terminaron la preparatoria,
190 tenían ciertos estudios universitarios y 160 terminaron la universidad. ¿Podemos
llegar a al conclusión de que la distribución de los tarjetahabientes que no pagan sus
cargos es diferente a los demás? Utilice un nivel de significancia 0.01.

12. Durante muchos años, ejecutivos de televisión utilizaron el lineamiento de que 30% del
público veía cada una de las cadenas televisivas de mayor audiencia y 10% veía canales
de televisión por cable durante una noche entre semana. El pasado lunes por la noche,
una muestra aleatoria de 500 televidentes en el área de Tampa-St. Petersburg, Florida,
reveló que 165 hogares sintonizaron la filial de ABC, 140 la filial CBS, 125 la filial de
NBC y el resto vio canal de televisión por cable. En el nivel de significancia 0.05,
¿Podemos llegar a la conclusión de que el lineamiento sigue siendo razonable?

You might also like