You are on page 1of 11

Universidad de San Carlos.

Facultad de ingeniera Estadstica 2

Bondad de ajuste

Jorge Mario Vettorazzi Camo. Jorge Santiago Suruy Tocay

200718871 200718805

Introduccin. Cuando se realizan investigaciones, con frecuencia es importante obtener informacin a travs de una muestra sobre la forma como se distribuyen los datos de una poblacin. Algunos estudios producen resultados sobre los que no podemos afirmar que se distribuyan de una forma normal, es decir que tiene la forma de campana. En estos casos debemos emplear tcnicas como lo es la bondad de ajuste cuando una muestra no se ajuste a una distribucin normal.

Porque aplicamos la Bondad de Ajuste. En la estadstica no para mtrica que es una rama de la estadstica que estudia las pruebas de la estadstica cuya distribucin no se ajusta a los criterios para mtricos. De los cuales algunos experimentos producen respuestas que no son cuantificables, o en otras palabras mediciones que no pueden ordenarse. Pero la posicin de la respuesta en una escala de medicin es arbitraria, las pruebas no para mtricas no asumen ningn parmetro de distribucin de las variables mustrales. Como aplicamos la bondad de ajuste. Para resolver el problema de las pruebas no para mtricas usamos una prueba estadstica que recibe el nombre de Pruebas de bondad de ajuste las cuales pueden ser: y y y y y Chi-cuadrada. De Anderson Darling. Binomial De Fisher. Entre otras.

Bondad de ajuste Binomial: Un experimento Binomial consiste en una secuencia de ensayos independientes en los que cada ensayo produce uno de dos resultados posibles xito o fracaso. Se supone que la probabilidad de xito, representado por P, es constante de un ensayo a otro, y el numero n de ensayos es fijo al inicio del experimento. Si se presenta una prueba Z con muestras grandes para probar  Observe que esta hiptesis nula especifica tanto P (xito) como P (fracaso), puesto que si , entonces . Si la P (fracaso) se denota con q y 1 p, la hiptesis nula se puede escribir de otro modo como . La prueba z es bilateral cuando la alternativa de inters es . Un experimento multinomial generaliza un experimento Binomial permitiendo que cada ensayo de lugar a uno de K resultados posibles, donde K>2. Por ejemplo: Suponga que un almacn acepta tres tipos de tarjetas de crdito. Un experimento multinomial resultara de observar el tipo de tarjeta de crdito, tipo 1, tipo 2, tipo 3, que utiliza cada uno de los n clientes siguientes que paga con tarjeta de crdito. En general, se hace referencia a los K resultados posibles en un determinado ensayo como categora, y representa la probabilidad de que un ensayo como categora . Si el experimento consiste en seleccionar n individuos u objetos de una poblacin y categorizar cada uno, entonces es la probabilidad de la poblacin que cae en la i- sima categora. La hiptesis nula de inters especifica el valor de cada . Por ejemplo: En el caso que K=3, se podra tener . La hiptesis alternativa expresa que no es verdad, es decir que menos de los tienen un valor diferente del afirmado en cuyo caso por el menos dos deben ser diferentes, puesto que su suma es igual a 1.

El smbolo representa el valor de mencionado,   

que se afirma en la hiptesis nula. En el ejemplo antes .

Antes de llevar a cabo el experimento multinomial, el numero de ensayos que da lugar a la categora    es una variable aleatoria, al igual que el numero de xitos y el numero de fracasos en un experimento Binomial son variables aleatorias. Esta variable aleatoria se denota con y su valor observado con . Puesto que cada ensayo produce exactamente una de las K categoras, y lo mismo resulta cierto para las . Por ejemplo Un experimento esperado de xitos y el nmero esperado de fracasos en un experimento Binomial son np y nq, respectivamente. Cuando  es verdad, los nmeros previstos de acierto y errores son   , respectivamente. De manera similar, en un experimento multinomial el nmero esperado de ensayos que dan lugar a la categora i es  . Cuando    es verdad, estos valores esperados se convierten en . Es comn representar la en un formato tabular que consiste en un rengln de k celdas, una para cada categora, como se ilustra en la tabla, los valores esperados cuando es verdadera se muestra debajo de los valores observados. Las y las por lo comn se denominan cuentas de celdas observadas y son las cuentas de celda esperadas correspondientes bajo . categora observada esperada i=1 n1 np10 i=2 n2 np20 .. .. i=k nk NPk0 total de rengln n n

Las deben estar razonablemente cerca de las correspondientes cuando es verdadera. Por otro lado, varias de las cuentas observadas deben difer sustancialmente de estas cuentas esperadas cuando los valores reales de las defieren en forma notable de lo que se afirma en la hiptesis nula. El procedimiento de prueba requerida evaluar la discrepancia entre las y las , con que se rechaza cuando la discrepancia es suficientemente grande.

DISTRIBUCION MULTINOMIAL La distribucin multinomial es similar a la distribucin binomial, con la diferencia de que en lugar de dos posibles resultados en cada ensayo, puede haber mltiples resultados: Ejemplo de distribucin multinomial: a esas elecciones se presentaron 4 partidos polticos: el POPO obtuvo un 40% de los votos, el JEJE el 30%, el MUMU el 20% y el LALA el 10% restante. Cul es la probabilidad de que al elegir 5 ciudadanos al azar, 3 hayan votado al POPO, 1 al MUMU y 1 al LALA? La distribucin multinomial sigue el siguiente modelo:

Donde: X1 = x1: indica que el suceso X1 aparezca x1 veces (en el ejemplo, que el partido POPO lo hayan votado 3 personas) n: indica el nmero de veces que se ha repetido el suceso (en el ejemplo, 5 veces) n!: es factorial de n (en el ejemplo: 5 * 4 * 3 * 2 * 1) p1: es la probabilidad del suceso X1 (en el ejemplo, el 40%) Veamos el ejemplo:

Luego: P = 0,0256 Es decir, que la probabilidad de que las 5 personas elegidas hayan votado de esta manera es tan slo del 2,56% Nota: 0! es igual a 1, y cualquier nmero elevado a 0 es tambin igual a 1 Veamos otro ejemplo: En una fiesta, el 20% de los asistentes son espaoles, el 30% franceses, el 40% italiano y el 10% portugueses. En un pequeo grupo se han reunido 4 invitados: cual es la probabilidad de que 2 sean espaoles y 2 italianos? Aplicamos el modelo:

Luego P = 0,0384 Por lo tanto, la probabilidad de que el grupo est formado por personas de estos pases es tan slo del 3,84%.

DISTRIBUCION HIPERGEOMETRICA Las distribucin hipergeomtrica es el modelo que se aplica en experimentos del siguiente tipo: En una urna hay bolas de dos colores (blancas y negras), cul es la probabilidad de que al sacar 2 bolas las dos sean blancas? Son experimentos donde, al igual que en la distribucin binomial, en cada ensayo hay tan slo dos posibles resultados: o sale blanca o no sale. Pero se diferencia de la distribucin binomial en que los distintos ensayos son dependientes entre s: Si en una urna con 5 bolas blancas y 3 negras en un primer ensayo saco una bola blanca, en el segundo ensayo hay una bola blanca menos por lo que las probabilidades son diferentes (hay dependencia entre los distintos ensayos). La distribucin hipergeomtrica sigue el siguiente modelo:

Donde:

Vamos a tratar de explicarlo: N: es el nmero total de bolas en la urna N1: es el nmero total de bolas blancas N2: es el nmero total de bolas negras k: es el nmero de bolas blancas cuya probabilidad se est calculando n: es el nmero de ensayos que se realiza

Veamos un ejemplo: en una urna hay 7 bolas blancas y 5 negras. Se sacan 4 bolas Cul es la probabilidad de que 3 sean blancas? Entonces: N = 12; N1 = 7; N2 = 5; k = 3; n = 4 Si aplicamos el modelo:

Por lo tanto, P (x = 3) = 0,3535. Es decir, la probabilidad de sacar 3 bolas blancas es del 35,3%. Pero este modelo no slo se utiliza con experimentos con bolas, sino que tambin se aplica con experimentos similares: Ejemplo: en una fiesta hay 20 personas: 14 casadas y 6 solteras. Se eligen 3 personas al azar Cul es la probabilidad de que las 3 sean solteras?

Por lo tanto, P (x = 3) = 0,0175. Es decir, la probabilidad de que las 3 personas sean solteras es tan slo del 1,75%.

DISTRIBUCION DE POISSON Las distribucin de Poisson parte de la distribucin binomial: Cuando en una distribucin binomial se realiza el experimento un nmero "n" muy elevado de veces y la probabilidad de xito "p" en cada ensayo es reducida, entonces se aplica el modelo de distribucin de Poisson: Se tiene que cumplir que: " p " < 0,10

" p * n " < 10 La distribucin de Poisson sigue el siguiente modelo:

Vamos a explicarla: El nmero "e" es 2,71828 " l " = n * p (es decir, el nmero de veces " n " que se realiza el experimento multiplicado por la probabilidad " p " de xito en cada ensayo) " k " es el nmero de xito cuya probabilidad se est calculando Veamos un ejemplo: La probabilidad de tener un accidente de trfico es de 0,02 cada vez que se viaja, si se realizan 300 viajes, cual es la probabilidad de tener 3 accidentes? Como la probabilidad " p " es menor que 0,1, y el producto " n * p " es menor que 10, entonces aplicamos el modelo de distribucin de Poisson.

Luego, P (x = 3) = 0,0892 Por lo tanto, la probabilidad de tener 3 accidentes de trfico en 300 viajes es del 8,9% Otro ejemplo: La probabilidad de que un nio nazca pelirrojo es de 0,012. Cul es la probabilidad de que entre 800 recien nacidos haya 5 pelirrojos?

Luego, P (x = 5) = 4,602

Por lo tanto, la probabilidad de que haya 5 pelirrojos entre 800 recien nacidos es del 4,6% Prueba de Chi-Cuadrado Una pregunta importante que necesita responderse en cualquier experimento gentico es cmo podemos decidir si nuestros datos estn de acuerdo con las proporciones Mendelianas que hemos expuesto. Una prueba estadstica que resulta muy til es la prueba de hiptesis de Chi-cuadrado. Frmula de Chi-cuadrado:

grados de libertad (gl): n-1 donde n es el nmero de clases. Probemos si los siguientes datos se ajustan a la proporcin 9:3:3:1 Valores Observados 108 semillas redondas y verdes 32 semillas arrugadas y verdes 556 Total de semillas Aplicando la ecuacin: Valores Esperados (3/16)(556) = 104.25 redondas y verdes (1/16)(556) = 34.75 arrugadas y verdes 556.00 Total de semillas

315 semillas redondas y amarillas (9/16)(556) = 312.75 redondas y amarillas 101 semillas arrugadas y amarillas (3/16)(556) = 104.25 arrugadas y amarillas

X2 = 0,47 Nmero de clases: 4 Gl (grados de libertad): n-1= 4-1= 3 Valor de Chi-cuadrado: 0.47 Si se entra en la Tabla de Chi-cuadrado por tres grados de libertad, se observa que el valor de Chicuadrado encontrado se encuentra con una probabilidad mayor de 0,90. Quiere decir que la probabilidad de encontrar un valor de Chi-cuadrado como el calculado para nuestro experimento es mayor del 90%, que es lo mismo que decir que las diferencias entre los valores observados y calculados se deben al azar con una probabilidad mayor al 90%.

Por convencin estadstica se utiliza el valor de 0.05 de probabilidad como el valor lmite o crtico. Si el valor de Chi-cuadrado calculado para un experimento es mayor que el correspondiente al de la probabilidad del 5% se rechaza la hiptesis. En el caso del ejemplo anterior el valor calculado es menor que el valor encontrado en la tabla de Chi-cuadrado por lo que se acepta la hiptesis de que los datos se ajustan a una distribucin 9:3:3:1. Tabla de Chi-cuadrado probabilidad Grados de Libertad 0.9 0.5 0.1 0.05 0.01 1 2 3 0.02 0.46 2.71 3.84 6.64 0.21 1.39 4.61 5.99 9.21 0.58 2.37 6.25 7.82 11.35

Bibliografa

Probabilidad y estadstica para ingeniera y ciencias Jay L. Devore Sexta edicin.

http://uvigen.fcien.edu.uy/utem/genmen/06chi2.htm#

http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm

You might also like