Definición. La variable χ2 de Pearson.

Este modelo de probabilidad puede ser introducido como caso particular de la familia de distribuciones Gamma de párametros  y p ,constantes positivas, cuya función de densidad responde a la siguiente forma:

Concretamente, si se considera = 1/2 y p = r/2 , donde r es un entero positivo, el modelo de probabilidad resultante se denomina χ2Chi-cuadrado, con r grados de libertad. Gráfica de la función de densidad de la variable χ2 con 10 grados de libertad :

Resultado que afecta a la distribución de S2. Si X1, X2, ..., Xn son variables aleatorias independientes con ley de probabilidad normal N(μ,σ) , es decir, una muestra aleatoria de tamaño n extraída de una población N(μ,σ), entonces

sigue la ley de probabilidad del modelo χ2 con (n-1) grados de libertad.

Como en la distribución de t. A diferencia de la distribución Normal o la de t (Test de Student o de t). Por tanto.Distribución de Ji. pero más o menos acercándose a la simetría para los grados de libertad superiores.cuadrado (x²) Distribución de datos discretos. Frecuencia relativa esperada . Las curvas son en forma de (jota invertida) al principio. Frecuencia relativa esperada x² x² para v=1 x² para v=2 x² para v=3 x² para v=6 Las tablas de x² convencionales muestran que cada x² es el valor a partir del cual el área bajo la curva de la distribución para v grados de libertad. es función v.cuadrado (x²) sino que existe una distribución para cada número de grados de libertad (v). la función se aproxima asintóticamente al eje horizontal sólo en la cola derecha de la curva y NO en ambas colas. no hay solo una distribución de ji. que es función de la densidad poblacional y cuyos valores varían desde cero hasta +∞(infinito positivo). representa la probabilidad indicada.

cuadrado y por la que muchos han llamado así también al estadístico obtenido X².cuadrado o Chi.cuadrado o Chi.fe)² fe Donde: fo = frecuencia observada fe = frecuencia esperada La razón por la que la que esta prueba se ha denominado Ji. Para evaluar el ajuste entre frecuencias observadas y esperadas existen estadísticos que prueban en qué medida difieren las mismas y si esa diferencia es significativa o no. es que la distribución de muestreo de esta sumatoria se aproxima a la de una distribución de x² con v= 1 grados de libertad. hasta que su suma alcance un valor mayor o igual a 5 (∑fe≥5). el agrupamiento produce una reducción en el número de clases y es frecuente entonces que el número de grados de libertad no sea suficiente para evaluar estadísticamente el ajuste. Snedecor & Cochran. Por ello. Por esta restricción. 1967) ha considerado que tal restricción debilita la sensibilidad del test y ha sugerido que los . Cochran (1954. Desventajas del método 1) Deben agruparse aquellas clases con una frecuencia esperada menor o igual a 5 (fe≤5). La prueba es siempre a una cola ya que las desviaciones están elevadas al cuadrado y conducen siempre a valores positivos de x² (de allí que tome sólo valores positivos hasta +∞).cuadrado (x²) X²= ∑(fo.cuadrado (x²) Método G o prueba del logaritmo de la razón de Verosimilitudes Método de Ji.x² x² tabulado Análisis de frecuencias. Hay dos métodos que son los más utilizados: Método de Ji. Pruebas de Bondad de Ajuste.

El valor de G obtenido tiene una distribución de x² con v= n-1 grados de libertad. Método G o Prueba de razón de Verosimilitudes: Si la proporción observada po es en realidad igual a la proporción esperada pe según la hipótesis nula (Ho). Para una distribución: Normal. fo y fe tienen el mismo significado que antes. las 2 probabilidades calculadas serán iguales y su razón será igual a 1. 2) El número de grados de libertad es v= n-a-1. para otros modelos. para el modelo de Poisson. Esta prueba se calcula de la siguiente manera: G= 2 * ∑ fo* ln fo fe Siendo ln= logaritmo en base neperiana. son estimados 2 parámetros de los datos muestreados: µ (media o esperanza poblacional) y σ(desvío estándar de la población). donde a es el número de parámetros estimados para ajustar el modelo elegido. pero además debemos restar un grado de libertad adicional por cada parámetro (a) de la distribución esperada de frecuencias que se ha estimado de la distribución muestrada. de manera que el número mínimo de clases que se pueden comparar es: 3 comparaciones . De aquí que los grados de libertad sean v= n-a-1= n-2-1= n-3 Binomial. Esto indica que la razón de estas 2 probabilidades o verosimilitudes puede utilizarse como estadístico para medir el grado de ajuste entre las frecuencias observadas y las esperadas. mayor será la razón entre ambas. El parámetro de este modelo es λ (lambda) y como los grados de libertad de cualquier distribución no pueden ser menores a la unidad (v≥1): v= n-a-1 siendo a=λ=1 parámetro v= n-2 Por tanto n debe ser ≥ 3 4 comparaciones . Cuanto mayor sea la diferencia entre po y pe. El número de grados de libertad es entonces: v= nº de clases luego de la agrupación –a-1 Teniendo a la interpretación mencionada más abajo.valores esperados no deben ser menores a 1 (∑fe≥1) y no a 5. es estimado un solo parámetro: pe (probabilidad esperada bajo la hipótesis nula) y por ello v= n-a-1= n-1-1= n-2 .

que se denomina corrección de continuidad o corrección de Yates. a veces es necesario conocer el tipo de distribución a la cual se ajustan adecuadamente (normal. se acepta Ho y se rechaza Ha. es válido el ejemplo siguiente: Ejemplo: Ajuste de datos para una distribución normal. Para todo valor de probabilidad igual o menor que 0. aproximando más estrictamente el valor de G a la distribución de ².5} fe1 fe2 Siendo fo1 y fo2 las frecuencias observadas 1 y 2. de un conjunto de mediciones en la tabla de niños de 5 años. Elección de la prueba estadística.5 *ln fo1±0. Las frecuencias observadas difieren de las que corresponden a una distribución normal. el investigador podrá también elegir el procedimiento estadístico más adecuado. Talla de niños de 5 años de edad.5]+fo2 ±0.   Hipótesis alterna (Ha). Planteamiento de la hipótesis. Zona de rechazo. Hipótesis nula (Ho). Para todo valor de probabilidad mayor que 0. se acepta Ha y se rechaza Ho. De los datos obtenidos en una experimentación. se aplica una corrección al valor de G. respectivamente Eligiendo además.05. Esta corrección consiste en sumar o restar 0. No obstante. Nivel de significación. (+) para fo1 y (-) para fo2 o viceversa. Para un caso de 2 clases: G= 2 * fo1± 0. respectivamente fe1 y fe2 las frecuencias esperadas 1 y 2. El modelo experimental tiene una muestra y nuestro objetivo es la bondad del ajuste.Cuando el n es menor a 200. Tamaño de la muestra 100.5 de las frecuencias observadas (fo) de tal manera que se haga mínimo el valor de G. Las diferencias observadas entre los valores observados y los teóricos se deben al azar. Así. no es necesario agrupar clases y se puede comparar hasta un mínimo de 2 clases. binomial o de Poisson). . según cual sea la combinación que produzca el menor valor de G. ya que es más susceptible al error por tener que tomar tantos logaritmos como clases se tengan. La única desventaja del método es la de cálculo. Al respecto.5 * ln fo2 ±0.05.

= 100. Una vez anotados los valores del área bajo la curva normal para cada Z.1 σ = 3. se calcula el área que corresponde a cada talla.91 En seguida se determinan los límites reales de cada clase y se calcula el valor Z para cada límite real. Para cada valor de Z. primero se debe obtener el valor promedio y la desviación estándar de los valores por ajustar. se localiza el valor del área bajo la curva de valores Z. Para calcular el valor teórico. se debe aplicar el valor Z. por lo tanto.Aplicación de la prueba estadística. Obtención de valores teóricos de la distribución normal. Para fines prácticos y a fin de ejecutar el .

1) + (-0. En seguida se aplica la ecuación de X2.0.2852 .1 = 3 El valor de X2 calculado con 3 gl se compara con los respectivos valores críticos de la tabla de valores críticos de X2 y corresponde a 7.05.2852) = 0. Interpretación.333 + 0 + 0.(-0. se acepta Ho y se rechaza Ha. Para obtener los valores teóricos.101 = 0. Decisión.094 Cada valor del área para la curva de clase se multiplica por el tamaño de la muestra (N).(-0.4951) = 0.105 + (-0.4656 .4884 .3034 Clase 106 . y se realiza de la manera siguiente: Clase 90 . gl = K .3762 Clase 102 .procedimiento. En virtud de que el valor calculado cae en la zona de rechazo.0295 Clase 94 . el signo de Z se mantiene en el valor del área bajo la curva.105 = 0.1 = 5 .1 .091 = 0.4656) = 0.0.111) = 1. X2 = 1.091 .227 Cálculo de los grados de libertad.109 = 0. Los valores de las frecuencias observadas para las cinco series de talla tienen una distribución normal y no difiere de los valores calculados en función de las áreas bajo la curva normal tipificada. .3944 = 0.82 para una probabilidad de 0.1804 Clase 98 .93 = -0. en este caso corresponde a 100.(-0.97 = -0.3944 .1 . se selecciona el valor entero más cercano.