You are on page 1of 4

Distribucin Chi Cuadrado para la Bondad de Ajustes: El Test Chi Cuadrado puede utilizarse para determinar la calidad del

el ajuste mediante distribuciones tericas (como la distribucin normal o la binomial) de distribucin empricas (o sea las obtenidas de los datos de la muestra). Distribucin Chi Cuadrado y Tablas de Contingencia Suceso E1 E2 E3 Ek Frecuencia observada 01 O2 O3 e0 Frecuencia esperada e1 e2 e3 ek En esta tabla las frecuencias observadas ocupan una sola fila y la llamamos tabla de calcificacin de entrada nica como el nmero de columnas es K tambin se llama una tablas 1 x K (Ledo 1<<1 por k>>) Extendiendo estas ideas, podemos llegar a tablas de doble entrada tablas h x k, en las que las frecuencias observadas ocupan h filas y k columnas tales tablas se suelen llamar tablas de contingencia. Correspondiendo a cada frecuencia observada en una tabla de contingencia h x k, hay una frecuencia esperada o terica que se calcula sujeta a ciertas hiptesis de acuerdo con las leyes de las probabilidades. Estas frecuencias que ocupan las celdas de una tabla de contingencia, se llaman frecuencias de celdas. La frecuencia total de cada fila o en cada columna se llama frecuencia marginal. Para investigar el acuerdo entre las frecuencias observadas y las frecuencias esperadas, calculamos el estadstico. Donde la suma de toma sobre todas las celdas de una tabla de contingencia y donde los smbolos Oj y el representan respectivamente las frecuencias observadas y esperada de la j sima celda. La suma de todas las frecuencias observadas se denota por N y es igual a la suma de todas las frecuencias observadas se denota por N y es igual a la suma de todas las frecuencias esperadas. Como antes el estadstico (5) tiene una distincin muestral dada muy aproximadamente por (4), supuesto quelas frecuencias esperadas no sean demasiado pequeas. El nmero de grado de libertad, v de esta distribucin chi cuadrado viene dado por h > 1 y k >1 por: 1. v = (h 1) (k 1) si las frecuencias esperadas se pueden calcular sin recurrir a estimaciones mustrales d los parmetros de la poblacin. 2. v = (h 1) (k 1) m. Si las frecuencias esperadas solo se pueden calcular mediante estimacin de m parmetros de la poblacin a partir de estadsticas de la muestra. Los contrastes de significacin para las tablas h x k son similares a los de las tablas 1 x k. Las frecuencias esperadas se hallan sujetas a una hiptesis particular h0.

Las tablas de contingencia se pueden generalizar a ms dimensiones. As, por ejemplo, podemos tener tablas h x k x 1, donde estn presentes tres clasificaciones. Muestras. Es un subconjunto de la poblacin que contiene las mediciones obtenidas mediante un experimento. Dos varianzas Utilizando la razn de varianzas (f de Fisher). Como hemos visto es importante conocer la distribucin de muestreo de la diferencia en medias de dos muestras. De la misma manera, podemos necesitar la distribucin de muestreo de la diferencia en varianzas (s21 s22). Resulta sin embargo, que esta distribucin es complicada, por lo que en lugar de eso, consideramos el estadstico s21 / s22, ya que en un cociente grande o pequeo indicar una gran diferencia, mientras un cociente cercano a 1 indica una pequea diferencia. Su distribucin de muestra se llama distribucin f, en honor a R. A. Fisher. Mas correctamente, sean dos muestras 1 y 2 de tamaos N1 Y N2, respectivamente, tomadas de dos poblaciones normales (o casi) con varianzas y , Definamos el estadstico. Donde Entonces la distribucin de muestreo de F se llama distribucin de F de Fisher o en breve, distribucin F, Con v1 = N1 1 y v2 = N2 1 grados de libertad. Esta distribucin viene dada por: Donde C es una constante que depende de v1 y v2 tal que el rea total bajo la curva es 1. La forma de esta curva puede variar considerablemente segn los valores de v1 y v2. Puede probarse que la distribucin F es el modelo de probabilidad por el cociente de las varianzas de muestras tomadas en forma independiente de la misma poblacin con distribucin normal y que existe una distribucin F diferente para cada combinacin de grados de libertad (g1) correspondiente al nmero demuestra. Para todas las muestras, g1 = n 1 por ello, la estadstica que se utiliza para probar la hiptesis nula con respecto a la diferencia entre dos varianzas es: F = Aun cuando esta hiptesis nula sea cierta, no es probable que las varianzas muestras de cualquier par demuestras sean idnticas. Para datos Apareados y no Apareados.. Distribucin T Student. Definamos el estadstico: Que es anlogo al estadstico Z dado por:

Si consideramos muestras de tamao N tomadas de una poblacin normal (o casi normal) con para cada una calculamos t, usando la media muestral x y la desviacin tpica muestral S ^s, puede obtenerse la distribucin de muestreo para t. Esta distribucin viene dada por: Donde yo es una constante que depende de N tal que al rea total bajo la curva es 1, y donde la constante V = (n 1) se llama el nmero de grados de libertad (v es la letra griega nu). La distribucin (2) se llama distribucin t de Stunden en honor de su descubridor, W.S Gosset; para grandes valores de v o de N (ciertamente N " 30), las curvas (2) se ajustan mucho a la curva normal cannica. Muestras Grandes y Muestras Pequeas. Para muestras de tamao N > 30, llamadas grandes muestras, las distribuciones de muestreo de muchos estadsticos son aproximadamente normales, siendo la aproximacin tanto mejor cuanto mayor sea N. Para muestra de tamao menor que 30, llamadas pequeas muestras, esa aproximacin no es buena y empeora al decrecer N, de modo que son precisas ciertas modificaciones. El estudio de la distribucin de muestreo de estadsticos para pequeas muestras se llama teora de pequeas muestras, sin embargo un nombre ms apropiado seria teora exacta del muestreo, pues sus resultados son validos tanto para pequeas muestras como para grandes. Para datos Apareados y no Apareados. En muchas situaciones las muestras se extraen como pares de valores, tal como cuando se determina el nivel de productividad de los trabajadores, antes y despus de un programa de capacitacin. A esta clase de datos se les denomina observaciones apareadas a pares asociados. Tambin a diferencia de las muestras independientes a dos muestras que contienen observaciones apareadas se les denomina dependientes. El mtodo apropiado para probar la diferencia entre observaciones apareadas consiste en determinar la diferencia d entre cada par de valores y despus probar la hiptesis nula de que la diferencia poblacional promedio es 0. por ello desde el punto de vista de los clculos, se aplica una prueba a una muestra de valores d. La diferencia promedio para el conjunto de observaciones apareadas es: La frmula de desviacin y la abreviada para la distribucin estndar y las diferencias entre datos apareados son: El error estndar del promedio de las diferencias entre datos apareados se obtiene mediante la frmula del error estndar de la media, excepto que se sustituye el por x:

Como el error estndar del promedio de las diferencias se calcula con base a datos apareados y como por lo general, se supone que los valores d tienen una distribucin normal, la distribucin t resulta apropiada para probar la hiptesis nula de que d = 0. Una proporcin Muestral y una Poblacional: Muestras Grandes Distribucin Normal (z). Puede utilizarse la distribucin normal como aproximacin de la binomial cuando n " 30 y, tanto np " 5 como n (q) " 5, donde q = 1 p. Sin embargo en el caso de intervalos de confianza se requiere un tamao demuestra n =100. En pruebas de hiptesis, el valor del error estndar de la poblacin que se utiliza se basa en el valor hipottico. La frmula del error estndar de la proporcin que incluye el factor de correccin por poblacin finita es: La frmula para la distribucin normal z sera: Para determinar el tamao de la muestra que se requiere para probar el valor de una proporcin (antes de extraerla) especificando el valor hipottico de la proporcin, un valor alternativo especifico de la proporcin, de manera que la diferencia con respecto al valor hipottico nulo resulte considerable; el nivel de significacin que debe utilizar en la prueba, y la probabilidad del error tipo II que se permite. La frmula que determinar el tamao mnimo de las muestras que se requieren para probar dicho valor de la proporcin es: Donde z0 es el valor crtico de z que se utiliza con el nivel especificado de significancia tanto que z1. Es el valor que corresponde a la probabilidad designada del error tipo II (nivel ). Cuando se determina el tamao de la muestra para probar la media, z0 y z1 siempre tienen signos algebraicos opuestos.