You are on page 1of 4

Prueba : Bondad de Ajuste

Los procedimientos de pruebas de hiptesis que se han presentado en


las secciones anteriores estn diseados para problemas en los que se
conoce la distribucin de probabilidad, y las hiptesis involucra los
parmetros de la distribucin. En esta seccin se describe un
procedimiento formal basado en la distribucin
2
que permitir
verificar la hiptesis de que una distribucin en particular ser un
modelo satisfactorio de la poblacin. Por ejemplo tal vez se quiera
probar la hiptesis de que la poblacin es normal.
Cabe mencionar que este es slo uno de los muchos procedimientos
utilizados para tal fin. Cuando se trabaja con funciones continuas, la
prueba
2
tal vez no sea el mejor procedimiento, pero es bastante
popular este mtodo.
Estadstica de Prueba: 2
k
1 i i
2
i i
~
E
) E - O (
L

=
=
, donde
k es el N de intervalos en donde estn las frecuencias
O i es la frecuencia observada del i - simo intervalo
E i es la frecuencia esperada del i - simo intervalo
Nota: Si el valor E i de la ltima celda es menor que 3, se suman
las dos ultimas frecuencias esperadas, o bien hasta ser
superior a tres.
H0 : La distribucin es la propuesta v/s H1: no es esta la
distribucin
R.C. = {x / L >
2
( 1- , k p 1 ) } , donde p es el N de
parmetros de la distribucin propuesta.

Ejemplo : Se propone que el nmero de defectos en las tarjetas de
circuito impreso sigue una distribucin Poisson. Se rene una m.a.(60)
tarjetas de circuito impreso y se observa el nmero de defectos. Los
resultados obtenidos son los siguientes. Use = 0.05
N Defectos 0 1 2 3
Frec. Observada 32 15 9 4

Solucin
1 La media es un estimador de cuando estamos en el caso
Poisson, luego
0.75

=
= 32*0 + 15*1 + 9*2 + 4*3) / 60 .
Sea X : N defectos en las tarjetas
2 H0 : X~ P( 0.75 ) v/s X no proviene de P( 0.75 )
Calculemos entonces las respectivas probabilidades
! k
e 0.75
k) P(X
0.75 - k
= =




3 X =k 0 1 2 3 .
P( X = k ) 0.472 0.354 0.133 0.041
E i 28.32 21.24 7.98 2.46
( Nota : E 1 = 0.472 * 60 = 28.32 , )
Advertencia : La ltima celda tiene frecuencia esperada < 3.

4 X =k 0 1 2 ( o ms )
E i 28.32 21.24 10.44

5 valor de la estaddtica
2.94
10.44
10.44) - (13

21.24
21.24) - (15

28.32
28.32) - (32

E
) E - O (
L
2 2 2
k
1 i i
2
i i
= + + = =
=

R.C ={x / L >
2
( 1- , k p 1 ) =
2
( 0.95 , 3 1 1 ) =
2
( 0.95 , 1 ) = 3.841 }

6 Conclusin: x R.C. luego se acepta H0 , esto es se puede
asumir con un nivel de significacin del 5% que la distribucin es
P (0.75).


Ejercicio 3 : Las especificaciones en la produccin de tanques de
aire, utilizados en inmersin, requiere que los tanques se llenen a
una presin promedio de 600 libras por pulgadas cuadrada (psi)
con una desviacin estndar de 10 psi.
Ud. Ha sido contratado(a) por un importante fabricante de equipos
de inmersin, que produce este tipo de tanques y su primera tarea
es verificar si la presin del llenado se distribuye normalmente,
como lo especifica la norma. En base a una muestra aleatoria de
1000 tanques
Presin
de
Llenados
(psi)
Menos
de 580
580-
590
590-
600
600-
610
610-
620
620
y
ms
N de
tanques
20 142 310 370 128 30

a) Qu concluira Ud. respecto a lo especificado por la norma,
con un 5% de nivel de significacin ?
b) con = 0.05 Cambiara Ud. su decisin si la media y
desviacin estndar fueran desconocidas y los valores
especificados en el enunciado fueran muestrales ? Justifique
su respuesta.










Solucin

a) H0 : X ~ N ( 600 , 100 ) v/s X no proviene de la distribucin N
( 600 , 100 )
= 0.05
Tabla resumen
X ( psi ) Ni Pi N * pi
Menos 580
580-590
590-600
600-610
610-620
620 y ms
20
142
310
370
128
30
0.0228
0.1359
0.3413
0.3413
0.1359
0.0228
22.8
135.9
341.3
341.3
135.9
22.8
1000 1.0 1000

P1 = P(X<580) = P( Z< (580-600)/10 ) = 0.0228
P2 = P(580<X<590) = P( Z< (590-600)/10 ) - 0.0228 = 0.1587
0.0228 = 0.1359
P3 = P(590<X<600) = P( Z< (600-600)/10 ) 0.1587 = 0.5
0.1587 = 0.3413
P4 = P(600<X<610) = P( Z< (610-600)/10 ) - 0.5 = 0.8413 0.5 =
0.3413
P5 = P(610<X<620) = P( Z< (620-600)/10 ) 0.8413 = 0.9772
0.8413 = 0.1359
P6 = 0.0228

R.C = { x / L >
2
( k-1, 1- ) =
2
( 5, 0.95 ) = 11.071 }

Conclusin : x R.C. no existe evidencia suficiente para rechazar
H0, con = 0.05. Luego, la presin de llenado se distribuye N ( 600 ,
100 ).

b) H0 ~ N ( ,
2
) v/s H1 no proviene de N ( ,
2
)
y
2
desconocidas ( promedio = 600 y S
2
= 100 )
R.C = { x / L >
2
( k-p-1, 1- ) =
2
( 6-2-1, 1-0.05 ) =
2
( 3,
0.95 ) =7.815 }

Conclusin : x R.C. existe evidencia suficiente para
rechazar H0, con = 0.05.
Luego, la presin de llenado no se distribuye N ( 600 , 100 ).


Conclusin : x R.C. existe evidencia suficiente para rechazar
H0, con = 0.05. Luego, la presin de llenado no se distribuye N (
600 , 100 ).


Pruebas con Tablas de Contingencia
En muchas ocasiones, los n elementos de una muestra tomada de
una poblacin pueden clasificarse de acuerdo con dos criterios
diferentes. Por tanto es interesante saber si dos mtodos de
clasificacin son estadsticamente independientes; por ejemplo, es
posible considerar si las carreras a las que postula un estudiante ala
Universidad XX depende de la regin de la cual proceden los
estudiantes. Supngase que el primer mtodo de clasificacin
tiene r niveles, y que el segundo tiene c niveles. Sea O i j la
frecuencia observada para el nivel i del primer mtodo de
clasificacin y el nivel j del segundo mtodo de clasificacin. En
general, los datos aparecern como se muestran en la siguiente
tabla. Una tabla de este tipo usualmente se conoce como tabla de
contingencia r * c.
Tabla de contingencia r * c
COLUMNAS
1 2 c

1

2
FILAS
.
.

r
O 1 1 O 1 2 O 1 c
O 2 1 O 2 2 O 2 c

.
.

.
.

.
.

.
.
O r 1 O r 2 O r c
donde : n * k =

=
r
1 i
k
i
n
; n h * =

=
c
1 j
j
h
n
;
n =
=
= =
r
1 t
*
t
c
1 s
s
*
n n

El inters recae en probar la hiptesis de que los mtodos de
clasificacin fila columna son independientes. Si se rechaza esta
hiptesis, entonces se concluye que existe alguna interaccin entre
los dos criterios de clasificacin.
8.6344
22.8
22.8) - (30

135.9
135.9) - (128

341.3
341.3) - (370


341.3
341.3) - (310

135.9
135.9) - (142

22.8
22.8) - (20

E
) E - O (
L
2 2 2
2 2 2 k
1 i i
2
i i
= + + +
+ + = =

=
8.6344
22.8
22.8) - (30

135.9
135.9) - (128

341.3
341.3) - (370


341.3
341.3) - (310

135.9
135.9) - (142

22.8
22.8) - (20

E
) E - O (
L
2 2 2
2 2 2
k
1 i i
2
i i
= + + +
+ + = =
=

Estadstica de Prueba :
~
E
)2 E - O (
* L
r
1 i
c
1 j
2
j i
j i j i

= =
=

r es el nmero de clasificaciones del primer mtodo
c es el nmero de clasificaciones del segundo mtodo
O i j es la frecuencia observada para el nivel i del primer mtodo
de clasificacin y el nivel j del segundo mtodo de clasificacin
E i j es la frecuencia esperada para el nivel i del primer mtodo de
clasificacin y el nivel j del segundo mtodo de clasificacin
H0 : Hay independencia entre los criterios de clasificacin v/s
H1 : no hay independencia ( hay interaccin )
R.C. = { x / L* >
2
( 1 - , (r 1) * (c 1) ) }

Ejemplo : Una compaa tiene que escoger un plan de pensin entre
tres posibles. La gerencia desea saber si la preferencia por los planes
es independiente de la clasificacin del trabajo, con = 0.05. En la
tabla siguiente aparecen las opiniones de una muestra aleatoria de 500
empleados.

Solucin
Para encontrar las frecuencias esperadas E i j , se procede de la
siguiente manera:
E 11 = ( n * 1 * n 1 * ) / n = ( 200 * 340 ) / 500 = 136
E 12 = ( n * 2 * n 1 * ) / n = ( 200 * 340 ) / 500 = 136
E 13 = ( n * 3 * n 1 * ) / n = ( 100 * 340 ) / 500 = 68
E 21 = ( n * 1 * n 2 * ) / n = ( 200 * 160 ) / 500 = 64
E 22 = ( n * 2 * n 2 * ) / n = ( 200 * 160 ) / 500 = 64
E 23 = ( n * 3 * n 2 * ) / n = ( 100 * 160 ) / 500 = 32
Frecuencias esperadas :
Plan de pensin
Clasif. del Trabajo 1 2 3 Totales
Asalariados 136 136 68 340
Por hora 64 64 32 160 .
Totales 200 200 100 500
1.La variable de inters es la preferencia de los empleados entre los
planes de pensin
2.H0 : La preferencia es independiente de la clasificacin asalariado
contra empleo por horas
3.H1 : La preferencia no es independiente de la clasificacin
asalariado contra empleo por horas.







4. estadstico de prueba es:

49.63
32
) 32 - 60 (

64
) 64 - 60 (

64
) 64 - 40 (


68
) 68 - 40 (

136
) 136 - 140 (

136
) 136 - 160 (


E
)2 E - O (
* L
2 2 2
2 2 2
2
1 i
3
1 j j i
j i j i
= + + +
+ +
= =

= =


5.R.C = { x / L* >
2
( 1 - , (r 1) * (c 1) ) }
= { x / L* >
2
( 0.95 , 2 ) = 5.99 }

6.Conclusin: Como x R.C. se rechaza H0, luego la preferencia
por los planes de pensin no es independiente de la
clasificacin del trabajo.

Pruebas de homogeneidad
Hay otro tipo de problema en la tabla de contingencia. Se
denomina prueba de homogeneidad. Esta prueba se usa cuando una
de las dos variables es controlada por el experimentador, de modo
que los totales por fila ( o columnas ) estn predeterminados.

Ilustracin : Suponga que se encuesta a los electores sobre una ley
propuesta por el gobernador. En la encuesta se seleccionan
aleatoriamente 200 residentes urbanos, 200 suburbanos y 100
rurales, a quienes se pregunta si estn a favor o en contra de la
propuesta. Es decir, para cada uno de estos tres grupos se toma una
muestra aleatoria simple. Se encuesta a 500 electores. Sin embargo,
observe que se ha predeterminado ( antes de tomar la muestra )
cuntas personas caen en cada categora por fila, como se observa
en la siguiente tabla, y cada categora ha sido muestreada por
separado.

Propuesta del gobernador
Tipo de residencia A favor En contra Totales
Urbano 200
Suburbano 200
Rural 100
Total 500
En una prueba de esta naturaleza, realmente se est probando la
hiptesis la distribucin de proporciones en las filas es la misma
para todos . Es decir, la distribucin de proporciones en la fila 1
es la misma que en la fila 2, es igual que en la fila 3, etc. La
alternativa a esta hiptesis es la distribucin de proporciones en
las filas no e la misma para todos .
Ms all de esta diferencia conceptual, la prueba real de
independencia y homogeneidad con tablas de contingencia es la
misma

Ejemplo: Continuemos con nuestro ejemplo del gobernador, suponga
que las opiniones vertidas son se muestran en la siguiente
tabla:
Frec. Obs.
Propuesta del gobernador
Tipo de residencia A favor En contra Totales
Urbano 143 57 200
Suburbano 98 102 200
Rural 13 87 100
Total 254 246 500
los hechos muestrales observados en la tabla, sustentan la hiptesis
de que los lectores de los distintos grupos de residentes tienen
opiniones diferentes sobre la propuesta del gobernador ?
Use = 0.05.

Solucin
1. Parmetros poblacionales de inters: la proporcin de electores a
favor o en contra
2. H0: La proporcin de los electores que estn a favor de la ley
propuesta es la misma en los tres grupos
H1: La proporcin de los electores que estn a favor de la ley
propuesta no es la misma en los tres grupos ( es decir, en por lo
menos un grupo, las proporciones son diferentes a las de otros )
3. Clculo de frec. esperadas
E 11 = ( 254 * 200 ) / 500 = 101.6 = E 21
E 12 = ( 246 * 200 ) / 500 = 98.4 = E 22
E 31 = ( 254 * 100 ) / 500 = 50.8
E 32 = ( 246 * 100 ) / 500 = 49.2

Frec. Esperada. Propuesta del gobernador
Tipo de residencia A favor En contra Totales
Urbano 101.6 98.4 200
Suburbano 101.6 98.4 200
Rural 50.8 49.2 100
Total 254 246 500

4. El estadstico de prueba es:

91.72
2 . 49
) 49.2 - 87 (

8 . 50
) 50.8 - 13 (

4 . 98
) 98.4 - 102 (


6 . 101
) 101.6 - 98 (

4 . 98
) 98.4 - 57 (

6 . 101
) 101.6 - 143 (


E
)2 E - O (
* L
2 2 2
2 2 2
2
1 i
3
1 j j i
j i j i
= + + +
+ + =
=

= =




5. R.C = { x / L* >
2
( 1 - , (r 1) * (c 1) ) } = { x / L* >
2
( 0.95 , 2 )
= 5.99 }

6. Conclusin: Como x R.C. se rechaza H0, luego no todos los
grupos de electores tienen las mismas proporciones a favor de la
ley propuesta.