You are on page 1of 38

ESTADÍSTICA Y

PROBABILIDADES II

Mg. Erick Reyes Martinez


TEMA: PRUEBA DE BONDAD DE
AJUSTE
LOGRO
Al finalizar la clase los alumnos aplican
la prueba chi-cuadrado en las pruebas
de bondad de ajuste para determinar si
los datos de una muestra se ajustan a
una distribución específica.
VARIABLE CATEGÓRICA.

Una variable categórica es un a variable que clasifica cada


individuo de una población en una de las varias clases
mutuamente excluyentes en que esta se divide.
Esta clasificación en categorías puede establecerse tanto
para variables cuantitativas, discretas y continuas, como
variables cualitativas
Características:

❑Los datos categóricos aparecen cuando una variable se mide en una


escala que solo clasifica a los encuestados en un numero limitado de
grupos.
❑Además de distinguir una variable como categoría(cualitativa), las
variables también se pueden clasificar como independientes o
dependientes:
✓Variable que se puede manipular experimentalmente.
✓Variable que se utiliza para predecir otra variable.
PRUEBAS PARA DATOS CATEGORICOS

Prueba de
Una variable Bondad de
Ajuste

Estadística no Prueba de Chi-


paramétrica Cuadrado
Prueba de
Homogeneidad

Dos Variables

Prueba de
Independencia
En diversas situaciones se requiere conocer si la data muestral proviene o no de una
determinada distribución probabilística.

¿Cómo proceder?

La prueba de bondad de ajuste Chi-cuadrado es una prueba estadística que permite


determinar si una data muestral proviene o no de una hipotética distribución.
¿Los datos de la muestra son coherentes con una distribución supuesta?
BONDAD DE AJUSTE

Plantear Hipótesis:

Ho: Los datos se ajustan a una distribución específica (Uniforme, Poisson, Binomial, Normal)
H1: Los datos se ajustan a una distribución específica (Uniforme, Poisson, Binomial, Normal)

Establecer el nivel de significación: 𝛼 = 1%, 5%, 10%,𝑒𝑡𝑐…

: Estadístico de Prueba:
Donde:
σ 0𝑖 − 𝐸𝑖 2
2 O: frecuencia observada → Generalmente dato del problema
𝜒 = E: frecuencia esperada → Se tiene que estimar y depende del tipo
𝐸𝑖 de la distribución
Region Crítica:

𝑵𝑹𝒉𝟎 𝑹𝒉 𝟎
1-𝛼
Dónde:
𝑔𝑙 = 𝐾 − 𝑚 − 1
𝑋2 1−𝛼;𝑔𝑙
K: Número de categorías o clases
m: número de parámetros estimados
BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN UNIFORME
EJERCICIO

El gerente de ventas de un supermercado obtiene los siguientes datos d


preferencias de cada una de las marcas detergentes: A, B, C,D, E, F

Detergente A B C D E F
Numero de amas de casa 28 27 32 34 30 29

Con estos resultados ¿Se puede concluir con un nivel 0,05 que hay
diferencias en la marcas de preferencias de las marcas de detergentes en la
población de consumidores?
Plantear Hipótesis:

H0: No hay diferencias entre los valores observados y esperados


H1: Si hay diferencia entre los valores observados y esperados

Establecer el nivel de significación: 𝛼 =0.05

Estadístico de Prueba:

2 Donde:
2
σ 0𝑖 − 𝐸𝑖
𝜒 = O: frecuencia observada →Dato del problema
𝐸𝑖 E: frecuencia esperada → Se tiene que estimar
Detergente A B C D E F
Numero de amas de casa 28 27 32 34 30 29

1
𝐸𝑖 = 𝑛. 𝑝𝑖 𝐸𝑖 = 180 = 30
6

Detergente A B C D E F
Valor Observado 𝑂𝑖 28 27 32 34 30 29

Valor Esperado 𝐸𝑖 30 30 30 30 30 30
Detergente A B C D E F
Valor Observado 𝑂𝑖 28 27 32 34 30 29

Valor Esperado 𝐸𝑖 30 30 30 30 30 30

σ 0𝑖 − 𝐸𝑖 2
Determinar el valor del Chi-cuadrado Calculado 2
𝜒 =
𝐸𝑖

(28−30)2 (27−30)2 (32−30)2 34−30 2 30−30 2 29−30 2


𝜒2 = + 30 + + + +
30 30 30 30 30

𝜒 2 = 1,133
1,133 El valor del Chi-cuadrado Calculado

Dónde:
𝛼 = 0.05 𝑔𝑙 = 𝐾 − 𝑚 − 1
𝑔𝑙= 6 − 0 − 1 =5

𝑵𝑹𝒉𝟎 𝑹𝒉 𝟎 𝑚 = 0,
1-𝛼 debido a que no se ha estimado
el parámetro de la
distribución uniforme
𝑋 2 1−𝛼;𝑔𝑙 = 𝑋2 0.95;5 =11,07

Interpretación:
Con un nivel de significancia del 5% se ha encontrado evidencia estadística suficiente para no
rechazar la Hipótesis Nula. Todos los valores observados son iguales
BONDAD DE AJUSTE : LA DISTRIBUCIÓN BINOMIAL
BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN BINOMIAL

Distribución Binomial 𝑃 𝑋 = 𝑥 = 𝐶𝑥𝑛 . 𝑝 𝑥 . 𝑞𝑛−𝑥

Paso4: Region Crítica:

Dónde:
𝑵𝑹𝒉𝟎 𝑹𝒉 𝟎 𝑔𝑙 = 𝐾 − 𝑚 − 1

1-𝛼 K: Número de categorías o clases


m: número de parámetros estimados

𝑋2 1−𝛼;𝑔𝑙
EJERCICIO
La intención de los estudiantes es saber a qué distribución teórica se puede ajustar los datos
encontrados. Se realizó un estudio en un supermercado muy conocido que consistió en
evaluar 600 bolsas de peras, cada una de las bolsas contiene 3 peras de las cuales algunas se
encuentran en buen estado y otras en mal estado. Los resultados al evaluar 600 bolsas son
los siguientes:

Número de peras en mal estado por bolsa 0 1 2 3


Frecuencia (Número de bolsas) 300 150 100 50

Use nivel de significación del 5%


• X = Nº de peras en mal estado
Solución: • n = 3 peras analizadas por bolsa que pueden estar en mal o buen estado
• P = ? Se tiene que estimar(calcular)
• N=600 bolsas
Plantear Hipótesis:

𝐻 0 : 𝐸𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑒𝑟𝑎𝑠 𝑒𝑛 𝑚𝑎𝑙 𝑒𝑠𝑡𝑎𝑑𝑜 𝑝𝑜𝑟 𝑏𝑜𝑙𝑠𝑎 𝑠𝑖𝑔𝑢𝑒𝑛 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙
𝐻1 : 𝐸𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑒𝑟𝑎𝑠 𝑒𝑛 𝑚𝑎𝑙 𝑒𝑠𝑡𝑎𝑑𝑜 𝑝𝑜𝑟 𝑏𝑜𝑙𝑠𝑎 𝑛𝑜 𝑠𝑖𝑔𝑢𝑒𝑛 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙

Establecer el nivel de significación: 𝛼 =0.05

Estadístico de Prueba:

2 Donde:
2
σ 0𝑖 − 𝐸𝑖
𝜒 = O: frecuencia observada →Dato del problema
𝐸𝑖 E: frecuencia esperada → Se tiene que estimar
Calculamos el parámetro de la distribución xi 0 1 2 3
σ 𝑥𝑖 𝑂𝑖 𝐸(𝑥) = 𝑛𝑝 Oi 300 150 100 50
= 𝑛𝑝
𝑁
0 300 + 1 150 + 2 100 + 3(50)
= 3𝑝 0,833 = 3𝑝 0,278 = 𝑝
600
Calculamos la probabilidad para cada X
𝑃 𝑋 = 𝑥 = 𝐶𝑥𝑛 . 𝑝 𝑥 . 𝑞𝑛−𝑥
Datos: 𝑃 𝑋 = 0 = 𝐶03 . (0,278)0 . (0,722)3−0 = 0,38
𝑝 = 0,278 𝑃 𝑋 = 1 = 𝐶13 . (0,278)1 . (0,722)3−1 = 0,43
𝑞 = 0,722
𝑛=3 𝑃 𝑋 = 2 = 𝐶23 . (0,278)2 . (0,722)3−2 = 0,17
𝑃 𝑋 = 3 = 𝐶33 . (0,278)3 . (0,722)3−3 = 0,02
𝐸𝒊 = 600 𝒑 𝒊
clase(𝑿𝒊) 𝑶𝒊 𝑷𝒊 𝑬𝒊
0 300 0.38 228
1 150 0.43 258
𝐸𝒊 = 𝑁𝒑 𝒊
2 100 0.17 102
3 50 0.02 12
Total 600 1 600

NOTA: 𝐸𝑖 ≥ 5
𝐸𝒊 = 600𝒑 𝒊
clase(𝑿𝒊) 𝑶𝒊 𝑷𝒊 𝑬𝒊
0 300 0.38 228 𝐸𝒊 = 𝑁𝒑 𝒊
1 150 0.43 258
2 100 0.17 102
3 50 0.02 12
Total 600 1 600

σ 0𝑖 − 𝐸𝑖 2
2
𝜒 =
Determinar el valor del Chi-cuadrado Calculado
𝐸𝑖

(300 − 228) 2 (150 − 258) 2 (100 − 102) 2 50 − 12 2


2
𝜒 = + + + = 188,32
228 258 102 12
188.32 El valor del Chi-cuadrado Calculado

Dónde:
𝛼 = 0.05 𝑔𝑙 = 𝐾 − 𝑚 − 1
𝑔𝑙= 4 − 1 − 1 =2

𝑵𝑹𝒉𝟎 𝑹𝒉 𝟎 𝑚 = 1,
1-𝛼 debido a que se haestimado el
parámetro dela
distribución binomial
𝑋 2 1−𝛼;𝑔𝑙 = 𝑋2 0.95;2 =5,99

Interpretación:
Con un nivel de significancia del 5% se ha encontrado evidencia estadística suficiente para
rechazar la Hipótesis Nula. El número de peras en mal estado no siguen una Distribución
Binomial.
EJERCICIO
Durante 100 días un ingeniero controlo la calidad de un producto revisando
diariamente una muestra aleatoria de 5 unidades del producto clasificándolas como
defectuosa o no defectuosa, resultando la siguiente distribución de frecuencias:

Número de defectuosos 0 1 2 3 4 5
Número de días 12 25 30 20 10 3
En el nivel de significancia de 5%¿podemos concluir que esta distribución de
frecuencias observadas concuerda con la distribución binomial?
Plantear Hipótesis:

𝐻 0 : 𝐸𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 defectuosos 𝑠𝑖𝑔𝑢𝑒𝑛 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙


𝐻1 : 𝐸𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 defectuosos 𝑛𝑜 𝑠𝑖𝑔𝑢𝑒𝑛 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙

Establecer el nivel de significación: 𝛼 =0.05

Estadístico de Prueba:

2 Donde:
2
σ 0𝑖 − 𝐸𝑖
𝜒 = O: frecuencia observada →Dato del problema
𝐸𝑖 E: frecuencia esperada → Se tiene que estimar
Calculamos el parámetro de la distribución
σ 𝑥𝑖 𝑂𝑖
= 𝑛𝑝 𝐸(𝑥) = 𝑛𝑝
𝑁
0 12 + 1 25 + 2 30 + 3 20 + 4 10 + 5(3) 0,4 = 𝑝
= 5𝑝 2 = 5𝑝
100
Calculamos la probabilidad para cada X 𝑃 𝑋 = 𝑥 = 𝐶𝑥𝑛 . 𝑝 𝑥 . 𝑞𝑛−𝑥
Datos:
𝑝 = 0,4 𝑃 𝑋 = 0 = 𝐶05 . (0,4)0 . (0,6)5−0 = 0,08
𝑞 = 0,6 𝑃 𝑋 = 1 = 𝐶15 . (0,4)1 . (0,6)5−1 = 0,30
𝑛=5
𝑃 𝑋 = 2 = 𝐶25 . (0,4)2 . (0,6)5−2 = 0,35
𝑃 𝑋 = 3 = 𝐶35 . (0,4)3 . (0,6)5−3 = 0,23
𝑃 𝑋 = 4 = 𝐶45 . (0,4)4 . (0,6)5−4 = 0,08
𝑃 𝑋 = 3 = 𝐶55 . (0,4)5 . (0,6)5−5 = 0,01
Tabla de valores observados y
𝐸𝒊 = 100 𝒑 𝒊 esperados
clase(𝑿𝒊) 𝑶𝒊 𝑷𝒊 𝑬𝒊
0 12 0,08 8 clase(𝑿𝒊) 𝑶𝒊 𝑬𝒊
1 25 0,30 30 0 12 8
2 30 0,35 35 1 25 30
3 20 0,23 23 2 30 35
4 10 0,08 8 3 20 23
13 9 4 13 9
5 3 0,01 1

NOTA: 𝐸𝑖 ≥ 5
clase(𝑿𝒊) 𝑶𝒊 𝑬𝒊
0 12 8
1 25 30
2 30 35
3 20 23
4 13 9
σ 0𝑖 − 𝐸𝑖 2
Determinar el valor del Chi-cuadrado Calculado 2
𝜒 =
𝐸𝑖

(12 − 8) 2 (25 − 30) 2 (30 − 35) 2 20 − 23 2 13 − 9 2


2
𝜒 = + + + + = 5,72
8 30 35 23 9
5,72 El valor del Chi-cuadrado Calculado

Dónde:
𝛼 = 0.05 𝑔𝑙 = 𝐾 − 𝑚 − 1
𝑔𝑙= 5 − 1 − 1 =3

𝑵𝑹𝒉𝟎 𝑹𝒉 𝟎 𝑚 = 1,
1-𝛼 debido a que se haestimado el
parámetro dela
distribución binomial
𝑋 2 1−𝛼;𝑔𝑙 = 𝑋2 0.95;3 =7,815

Interpretación:
Con un nivel de significancia del 5% se ha encontrado evidencia estadística suficiente para no
rechazar la Hipótesis Nula. El número de defectuosos sigue una Distribución Binomial
EJERCICIOS PROPUESTOS
EJERCICIO
El gerente de ventas de una compañía P&C afirma que todos sus vendedores
realizan el mismo numero de visitas durante el mismo periodo de tiempo. Una
muestra aleatoria de 5 registros de los vendedores en una semana dada revelo el
siguiente número de visita.
Vendedor A B C D E
Número de visitas 23 29 25 23 30
Con el nivel de significancia del 5% ¿Es razonable aceptar la afirmación del gerente?
EJERCICIO
El gerente de personal de la compañía “REXA” quiere probar la hipótesis que hay
diferencias significativas de tardanzas de los diferentes días de la semana. De los
registros de asistencia obtuvo la siguiente tabla de tardanzas de su personal para
cada uno de los siguientes días de la semana:
Días Lunes Martes Miércoles Jueves Viernes
Tardanzas 58 39 75 48 80

¿Se puede aceptar la hipótesis del gerente con un nivel de significancia del 5%
EJERCICIO
El gerente de ventas de un supermercado obtiene los siguientes datos de
preferencia de cada una de las siguiente s marcas detergentes A, B, C, D, E. F

Detergente A B C D E F
Números de ama de casa 28 27 32 34 30 29

Con estos resultados ¿Se puede concluir con un nivel de significancia del 2,5% que
hay diferencia entre las preferencias de las marcas de detergentes en la población
de consumidores?
EJERCICIO
Cierta máquina de última tecnología de empresa embotelladora produce muchos artículos,
se ha contabilizado la cantidad de artículos en función a los defectos producidos como se
puede ver en el siguiente cuadro. Un ingeniero Industrial sospecha que los defectos
producidos por la máquina se ajustan a una distribución binomial con parámetro 0.8, Para
verificar ello se muestrea a 2 artículos.

Número de Marca Frecuencia Observada


0 5
1 82
2 251
Total 338
Establecer la Hipótesis Correspondiente para probar la sospecha del Ingeniero:
EJERCICIO

Un vendedor de la compañía ELECTRIC visita a 6 clientes por dia. Se cree que el


numero de ventas por día que el realiza es una variable aleatoria que puede ser
descrita mediante una distribución Binomial. Durante días se han registrado las
siguientes ventas por día de ese vendedor:

Número de ventas 0 1 2 3 4 5
Número de días 10 41 60 20 6 3
En el nivel de significancia de 1%¿podemos concluir que esta distribución de
frecuencias observadas concuerda con la distribución binomial?
EJERCICIO

Una moneda fue lanzada al aire 1000 series, de 5 veces cada serie y se
observó el número de caras de cada serie. El número de series en los que se
presentaron 0, 1, 2, 3, 4 y 5 caras se muestra en la siguiente tabla.
Numero de Caras 0 1 2 3 4 5
Numero de Series(Oi) 38 144 342 287 164 25

ajustar una distribución binomial al 5% de significancia.


EJERCICIO

En la encuesta telefónica realizada el pasado curso por los alumnos los resultados
fueron muy dispares, mientras algunos realizaron las cuatro entrevistas
programadas otros no consiguieron cumplimentar ninguna de ellas. La
distribución del número de entrevistas conseguidas por los 57 alumnos que
participaron en el proyecto fue la siguiente:

Numero de Entrevistas 0 1 2 3 4
Numero de Alumnos 6 16 24 9 2

ajustar una distribución binomial al 1% de significancia

You might also like