You are on page 1of 28

PRUEBAS DE BONDAD DE

AJUSTE

Clase # 3
Nombre del docente: Verónica Espinoza
Propósito de la Clase

• Realizar una prueba de bondad de ajuste, que es


una prueba de hipótesis para determinar si una
sola fila (o columna) de conteos de frecuencias
concuerda con alguna distribución especifica
(como uniforme o normal).
Prueba de una aseveración respecto de una
desviación estándar o de una varianza
Requisitos Prueba de Hipótesis Estadístico de prueba

H0 σ = σ0
La muestra es 𝑛−1 𝑠 2
σ < σ0 χ2 =σ
aleatoria simple σ2
Ha σ > σ0
σ ≠ σ0
Valores P y valores
La población tiene críticos
una distribución H0 σ2 = A
normal. Depende de α y grados de
σ2 < A
libertad gl = n – 1.
Ha σ2 > A
DECISIÓN
σ2 ≠A
Ejemplo 1:
El mundo de la industria comparte esta meta común: mejorar la calidad reduciendo la variación. Los
ingenieros de control de calidad desean asegurarse de que un producto tenga una media aceptable, pero
también quieren producir artículos con una calidad consistente, eliminando los defectos. La Newport Bottling
Company ha fabricado latas de bebidas de cola con cantidades que tienen una desviación estándar de
0.051 onzas. Se prueba una nueva máquina embotelladora, y una muestra aleatoria simple de 24 latas
produce las cantidades (en onzas) que se listan a continuación. (Las 24 cantidades tienen una desviación
estándar de s = 0.039 oz). Utilice un nivel de significancia de 0.05 para probar la aseveración de que las
latas de bebidas de cola de la nueva máquina tienen cantidades con una desviación estándar menor que
0.051 oz.

11.98 11.98 11.99 11.98 11.90 12.02 11.99 11.93

12.02 12.02 12.02 11.98 12.01 12.00 11.99 11.95

11.95 11.96 11.96 12.02 11.99 12.07 11.93 12.05


Ejemplo 1:
1. Realizar el Histograma para probar Normalidad
2. Determinar las hipótesis nula y alternativa H0 σ = 0.051
Ha σ < 0.051
3. El estadístico de prueba es

𝑛−1 𝑠 2 24−1 (0.039)2


χ2 =σ = σ = 13.450
σ2 (0.051)2

4. El valor crítico considerando  = 0.05 y (grados de libertad =


n – 1= 23) es
Decisión: Puesto que el estadístico de
prueba no está en la región crítica, no
rechazamos la hipótesis nula.
inv.chicuad(alfa, grados de libertad)
Prueba de bondad de ajuste

o La prueba de bondad de ajuste se utiliza para probar la hipótesis de que una


distribución de frecuencias se ajusta a (o coincide con) alguna distribución
aseverada.

Notación
O representa la frecuencia observada de un resultado.
E representa la frecuencia esperada de un resultado.
k representa el número de categorías diferentes o resultados.
n representa el número total de ensayos.
Requisitos

• La muestra es aleatoria simple.


• Se tiene k clases o categorías en las que se puede clasificar cada uno de los
elementos de una población.
• Las frecuencias esperadas se obtienen de E = npi, la probabilidad pi se
obtiene de la distribución de probabilidad especificada.
• Se tiene una frecuencia esperada en cada categoría E ≥ 5.
Proceso de la Prueba de Bondad de
ajuste
Ho Ha o H1
O=E O≠E
Los conteos de
Los conteos de
frecuencias concuerdan
frecuencias concuerdan
con la distribución
con la distribución
esperada
esperada

El estadístico de prueba se calcula de:


𝑂−𝐸 2
χ2 = σ
𝐸

E = npi, la probabilidad pi se obtiene de la distribución de probabilidad especificada.


Proceso de la Prueba de Bondad de
ajuste
Valor crítico
La prueba es de una cola a la derecha.
El valor crítico o valor-p con la
distribución χ2
El Valor Crítico (VC) con nivel de
significancia α y grados de libertad gl =
K – 1.
Se calcula el valor-p

inv.chicuad.cd (alfa, grados de libertad)


Ejemplo 1: frecuencias esperadas iguales
Ejm de Neumático desinflado y clase perdida
Una historia clásica involucra a 4 estudiantes que compartían el auto y que faltaron a un examen; su excusa
fue un neumático desinflado. En la reposición del examen, el profesor les pidió a los estudiantes que
identificaran el neumático en particular que se desinfló. Si realmente no tuvieran un neumático desinflado
¿podrían identificar el mismo neumático? El profesor les pidió a los 41 estudiantes que identificaran el
neumático que seleccionarían. Los resultados se listan en la siguiente tabla (excepto por un estudiante que
seleccionó el neumático de repuesto). Use un nivel de significancia de 0.05 para probar la afirmación del
profesor de que los resultados se ajustan a una distribución uniforme. ¿Qué sugiere el resultado sobre la
probabilidad de que cuatro estudiantes identifiquen el mismo neumático cuando realmente nunca tuvieron el
accidente?
Neumático Delantero izquierdo Delantero derecho Trasero izquierdo Trasero derecho

Número de 11 15 8 6
selecciones
𝐻0 : 𝑝1 = 𝑝2 = 𝑝3 = 𝑝4
𝐻𝑎 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒𝑠 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑎 𝑙𝑎𝑠 𝑜𝑡𝑟𝑎𝑠.

Como 4.6 no se encuentra en la región crítica, entonces no se rechaza 𝐻0


Ejemplo 2: frecuencias esperadas desiguales

Ejm de Juegos de la Serie Mundial


La siguiente tabla muestra las cantidades de juegos realizados en 105 series mundiales
de las Grande Ligas de Béisbol (MLB). Esta tabla también incluye las proporciones
esperadas para el número de juegos en una Serie Mundial, suponiendo que, en cada
serie, ambos equipos tienen casi la misma posibilidad de ganar. Use un nivel de
significancia de 0.05 para probar la afirmación de que el número real de juegos se ajusta a
la distribucion indicada por las proporciones esperadas.

Juegos realizados 4 5 6 7
Número de Series Mundiales 18 20 22 37
Proporcion esperada 2/16 4/16 5/16 5/16
Como 7.346 no se encuentra en la región crítica, entonces no se rechaza 𝐻0
Ejemplo 5

Cierto tipo de linterna eléctrica se vende con las cuatro baterías incluidas. Se
obtiene una muestra aleatoria de 150 linternas y se determina el número de
baterías defectuosas; con los resultados siguientes:

Número defectuoso 0 1 2 3 4
Linternas 26 51 47 16 10

Se debe probar si la distribución de las baterías sigue una distribución binomial con
p=0.36
Tabla de contingencia
Se tienen “i” filas ≥ 2 y “j” columnas
en las que se puede clasificar cada Prueba de independencia
Pone a prueba la hipótesis nula de que no
uno de los elementos de una
existe asociación entre la variable de
población.
renglón y la variable de columna en una
Variable B
tabla de contingencia.
1 2 3 ... j
1 a11 a12 a13 . . . a1j
Prueba de homogeneidad
2 a21 a22 a23 . . . a2j
Variable A

Pone a prueba la aseveración de que


3 a31 a32 a33 . . . a3j poblaciones diferentes tienen las mismas
.. ... .. ... ... .. proporciones de algunas características.
. . .
i ai1 ai2 ai3 . . . aij
Hipótesis nula y alternativa

De prueba de Independencia De prueba de Homogeneidad


H0: O = E; La variable de filas es H0: O = E; Las poblaciones en las filas son
independiente de la variable de columnas. homogéneas

H1: O ≠ E; Las variables no son H1: O ≠ E; Las poblaciones no son


independientes, relacionan de alguna homogéneas con respecto a las categorías.
manera.

Estadístico de prueba para una prueba de independencia

𝑂−𝐸 2
2
χ =𝛴
𝐸
Valores críticos

Los valores críticos se encuentran en la tabla,


utilizando grados de libertad (r - 1)(c - 1)
r: número de renglones
c: número de columnas.
La región crítica se localiza sólo en la cola
derecha.

Frecuencia esperada para una tabla de contingencia

𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑟𝑒𝑛𝑔𝑙ó𝑛 (𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑜𝑙𝑢𝑚𝑛𝑎)


𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎 =
(𝑔𝑟𝑎𝑛 𝑡𝑜𝑡𝑎𝑙)
Ejemplo 3 de prueba de Independencia
La Ford Motor Company opera una planta de ensamble en Dearborn, Michigan. La
planta opera tres turnos. El gerente de control de calidad quiere comparar el nivel de
calidad en los tres turnos. Los vehículos se clasifican por su nivel de calidad
(aceptable, inaceptable) y por turno (matutino, vespertino, nocturno). ¿Hay alguna
diferencia en el nivel de calidad en los tres turnos? Es decir, al nivel del 5% de
significancia ¿está relacionada la calidad del producto con el turno donde se fabricó?
Los datos siguientes pertenecen a una muestra de 87 unid.

Nivel de Calidad
Total de
Aceptable Inaceptable
Filas
1 12 14 26
Turno 2 18 23 41
3 6 14 20
Total 36 51 87
H0: O = E; La calidad del producto es independiente del turno
Estadístico de prueba
donde se fabricó:
𝑂−𝐸 2
 =σ
2
H1: O ≠ E: La calidad del producto no es independiente del turno 𝐸

donde se fabricó. (Calidad y turno se relacionan o son


dependientes).

Total de
Aceptable Inaceptable
Filas
1 12 14 26
Turno 2 18 23 41
3 6 14 20
Total 36 51 87
Realizamos una tabla para los Valores Esperados (E)

Total de Total de
Aceptable Inaceptable Aceptable Inaceptable
Filas Filas
1 (36)(26) 26 1 10,759 15,241 26
87 Turno 2 16,966 24,034 41
Turno
2 41
3 8,276 11,724 20
3 20
Total 36 51 87 Total 36 51 87

12 − 10,759 2 14 − 15,241 2 18 − 16,966 2 23 − 24,034 2

2= 10,759
+
15,241
+
16,966
+
24,034  2 =1,419
6 − 8,276 2 14 − 11,724 2
+ +
8,276 11,724
Punto crítico:
Si α = 0,05 y gl = (f-1)(c-1) = (2)(1) = 2 2 0.05;2 = 5,991.
Regla de decisión:

 2 =1,419  2 0,05;2 = 5,991


Decisión
Por tanto no se rechaza H0 dado que 2 calculado es menor que el 2 0,05;6
Conclusión: Existe evidencia suficiente para probar que la calidad del
producto es independiente del turno donde se fabricó. Es decir Calidad y turno
no se relacionan
Ejemplo 4 de prueba de Homogeneidad
Una compañía empaca un producto particular en latas de tres tamaños diferentes. La mayor parte
de las latas se apegan a especificaciones, pero un ingeniero de control de calidad ha identificado
los siguientes errores: Defecto en lata, Grieta en lata, Ubicación incorrecta de arillo y otros.
¿Sugiere la información que las proporciones que caen en las diversas categorías de fuera de
especificación son iguales para las tres líneas? Realice una prueba al nivel del 5% de significancia
si se tiene una muestra de 321 con fallas clasificadas según la tabla siguiente

Razón de falla
Tamaño
Defecto Grieta Ubicación Otros
muestral
1 34 65 17 13 129
Línea de
2 23 52 25 6 106
Producción
3 32 28 16 10 86
Total 89 145 58 29 321
H0: O = E; las proporciones que caen en las diversas categorías
de fuera de especificación son homogéneas (iguales) para las tres Estadístico de prueba
líneas 𝑂−𝐸 2
 =σ
2
𝐸
H1: O ≠ E; las proporciones que caen en las diversas categorías de
fuera de especificación son no homogéneas (diferentes ) para las
tres líneas

Realizamos una tabla para los valores Esperados (E)


Tamaño
Tamaño Defecto Grieta Ubicación Otros
Defecto Grieta Ubicación Otros muestral
muestral (89)(129)
1 34 65 17 13 129 1 321 129
2 23 52 25 6 106 2 106
3 32 28 16 10 86
3 86
Total 89 145 58 29 321
Total 89 145 58 29 321
Valores Esperados (E)

Tamaño
Tamaño Defecto Grieta Ubicación Otros
Defecto Grieta Ubicación Otros muestral
muestral
1 35.766 58.271 23.308 11.654 129
1 34 65 17 13 129
2 29.389 47.882 19.153 9.576 106
2 23 52 25 6 106
3 23.844 38.847 15.539 7.769 86
3 32 28 16 10 86
Total 89 145 58 29 321
Total 89 145 58 29 321

2 2 2 2
34 − 35,766 65 − 58,274 17 − 23,308 13 − 11,654
+ + +
35,667 58,274 23,308 11,654
2=
2 2 2 2  2 =14,063
23 − 29,389 52 − 47,882 25 − 19,153 6 − 9,576
+ + + +
29,389 47,882 19,153 9,576

2 2 2 2
28 − 23,844 28 − 38,847 16 − 15,539 10 − 7,769
+ + + +
23,844 38,847 15,539 7,769
Regla de decisión: Si α = 0,05 y gl = (f-1)(c-1) = (2)(3) = 6
 2 0.05;6 = 12,592.

 2 0.05;2 = 12.592  2 =14.063

Por tanto se rechaza H0 dado que 2 es mayor que el 2 0.05;6


Conclusión: Existe evidencia suficiente para probar que las líneas de
producción son homogéneas con respecto a las cinco categorías de falla.
¿Qué aprendimos hoy?

• Como plantear la prueba de hipótesis para un


experimento multinomial
BIBLIOGRAFÍA

• Triola, M. (2012) decimosegunda edición. Edit. Pearson

• Lind, Marchal y Wathen. Estadística Aplicada a los Negocios y Economía. México: Mc


Graw Hill. 2012

You might also like