UNIVERSIDAD NACIONAL DE EDUCACIÓN

ENRIQUE GUZMÁN Y VALLE
Alma Máter del Magisterio Nacional

ESCUELA DE POSTGRADO
SECCIÓN DE DOCTORADO

Curso: Seminario de Estadística Aplicada
a la Investigación Educacional
Tema: Estadísticos no paramétricos Ji-Cuadrada

Dr. Florencio Flores Ccanto

¿CUÁLES SON LAS SUPOSICIONES DE LA ESTADÍSTICA
NO PARAMÉTRICA?

Para realizar análisis no paramétricos, debe partirse de las
siguientes consideraciones:

•La mayoría de estos análisis no requieren de supuestos
acerca de la forma de la distribución poblacional. Aceptan
distribuciones no normales.

•Las variables no necesariamente deben estar medidas en un
nivel por intervalo o de razón, pueden analizar datos nominales
u ordinales.

•Si se quieren aplicar análisis no paramétrica a datos por
intervalos o razón, éstos deben ser resumidos a categorías
discretas (a unas cuantas). Las variables deben ser
categorías.

Los coeficientes de correlación por rangos ordenados de Spearman y Kendall. Pruebas W de Wilcoxon . ¿CUÁLES SON LOS MÉTODOS O PRUEBAS ESTADÍSTICAS NO PARAMÉTRICAS MÁS UTILIZADAS? Las Pruebas no paramétricas más utilizadas son: 1. La Chi-cuadrada o Ji-Cuadrada o X2. 2. Prueba de U de Mann Whitney 2. 1. Los coeficientes de correlación e independencia para tabulaciones cruzadas. 1.

Distribución Ji-Cuadrada o Chi-cuadrada o X2?. Es una prueba útil para variables categóricas y estadística. La prueba Chi-cuadrada de asociación. 2. es aplicable cuando la variable nominal está compuesto por dos o más categorías. Tiene dos aplicaciones: 1. . La prueba de bondad de ajuste Chi-cuadrada. Ambas pruebas se utilizan para determinar si las frecuencias observadas (O) en las categorías difieren significativamente de las frecuencias esperadas (E).

.Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables categóricas. cada variable se subdivide en dos o más categorías. A su vez. que es una tabla de dos dimensiones y cada dimensión contiene una variable. Nivel de medición Nominal u ordinal (o intervalos o razón de las variables reducidas a ordinales) Procedimiento La Chi-cuadrada se calcula por medio de una tabla de contingencia o tabulación cruzada. Símbolo: X2 Hipótesis a Correlaciones probar: Variables Dos variables (la prueba Chi-cuadrada no involucradas: considera relaciones causales).

6.L = (Nº de filas . Se utiliza para variables medidas en escala nominal u ordinal.1). La Distribución X2 se lee con grados de libertad G. Cuando aumentan los grados de libertad las curvas son menos elevadas y más extendidas a la derecha. Las fórmulas son: Total de Fila x Total de Columna F. Esperada= Total General .1)(Nº de columnas .CARACTERÍSTICAS 1. 2. Todas las curvas son asimétricas 4. 3. No tiene valores negativos. El valor mínimo es 0. 5.

La tabla de contingencia o tabulación cruzada es: CANDIDATO “A” “B” Masculino 20 30 SEXO Femenino 40 25 .Ejemplo 1. categoría y tabla de contingencia 2x2: Sean las variables SEXO (Masculino y Femenino) y CANDIDATO (“A” y “B”). Variable.

Variable Categoría CANDIDATO “A” “B” Masculino 20 30 SEXO Femenino 40 25 .

Ejemplo 2. NIVEL DE EDUCACIÓN categorías: Primaria. Procedimental. en las dimensiones de aprendizaje conceptual. Estudio de Tabla de contingencia 3x2: Se estudia a 1040 estudiantes de los niveles de educación primaria y secundaria y a los cuales se aplica un instrumento que mide el aprendizaje de la matemática. Secundaria. Variables: APRENDIZAJE categorías: Conceptual. Actitudinal. TABLA DE CONTINGENCIA NIVEL DE EDUCACIÓN Primaria Secundaria Conceptual 180 100 APRENDIZAJE 190 280 Procedimental Actitudinal 170 120 . procedimental y actitudinal.

.Tabla de frecuencias observadas (O): NIVEL DE EDUCACIÓN TOTAL Primaria Secundaria Conceptual 180 100 280 APRENDIZAJE 190 280 470 Procedimental Actitudinal 170 120 290 TOTAL 540 500 1040 La Chi-cuadrada es una comparación entre las tablas de frecuencias observadas y la denominada tabla de frecuencias esperadas (la tabla que esperaríamos encontrar si las variables fueran estadísticamente independientes o no estuvieran relacionadas).

Tabla de frecuencias esperadas (E): La frecuencia esperada de cada celda. se calcula mediante la siguiente fórmula aplicada a la tabla de frecuencias observadas: N = es el número total de frecuencias observadas. E = (marginal del reglón)(marginal de columna) / N. casilla o recuadro. NIVEL DE EDUCACIÓN Primaria Secundaria Marginal de filas Conceptual (280) (280) 280 (540)/1040 (500)/1040 APRENDIZAJE Procedimental (470) (470) Actitudinal (540)/1040 470 ( 500)/1040 (290) (290) 290 (540)/1040 (500)/1040 .

6 139.Frecuencia observada: NIVEL DE EDUCACIÓN TOTAL Primaria secundaria Donde: O: frecuencia observada Conceptual 180 100 280 en cada celda APRENDI E: frecuencia esperada Procedimental 190 280 470 ZAJE en cada celda Actitudinal 170 120 290 TOTAL 540 500 1040 Frecuencia esperada: NIVEL DE EDUCACIÓN TOTAL Primaria Secundaria Conceptual 145.4 290 TOTAL 540 500 1040 .0 470 AJE Procedimental Actitudinal 150.4 134.0 226.6 280 APRENDIZ 244.

  O  E  2 X2  E Celda O E O-E (O-E)2 (O-E)2 / E Conceptual/Primaria 180 145.70 X2 = 47.80 Actitudinal / Secundaria 120 139.0 54.4 -54. = (Nº de filas .0 2916.1)(Nº de columnas .6 1197. .6 19.L.69 Procedimental /Secundaria 280 226.16 8.36 2.50 Conceptual / Secundaria 100 134.6 1197.36 2.4 376.11 Actitudinal / Primaria 170 150.1).4 -19.4 376.6 -34. debemos calcular los grados de libertad.16 8.4 34.23 Procedimental/ Primaria 190 244. G.4 2959.00 12.36 12.33 Para saber si el valor de X2 es o no significativo.

33 X2Crítico = 5.05 y g. X2Obtenido = 47. Luego. = 2. Aplicación: Para el nivel de confianza de =0. decimos que las variables están relacionadas o no son independientes.L. = (3-1)(2-1) = 2. Si el valor obtenido de X2 es igual o superior al valor de la “tabla”. entonces G. eligiendo nuestro nivel de confianza ( = 0. acudimos a la “tabla de distribución de Chi- cuadrado”.01).9915 (ver tabla).l.9915 . el X2 de tabla es 5.05 ó  = 0.Para el ejemplo: Nº de filas = 3 y Nº de columnas = 2.

.

Prueba de hipótesis: H0: No existe relación entre el aprendizaje y los niveles de educación. H1: Existe relación entre el aprendizaje y niveles de educación. y por lo tanto se acepta la hipótesis alterna (H1). . es decir existe una relación entre Aprendizaje y los niveles educativos X2obtenido  X2crítico entonces se rechaza la hipótesis nula (H0). X2obtenido  X2crítico entonces variables no son independientes.

1) Calcule el valor de X2 a partir de las frecuencias obtenidas y Paso Nº 3 frecuencias esperadas. por ejemplo. .5 Haga una tabla de frecuencias obtenidas Deduzca las frecuencias esperadas a partir de Ho: Calcule el grado de libertad: Producto de (categorías .5 Paso Nº 2 Especifique el nivel de significancia α. Retenga Ho si valor de tabla < Valor calculado.Paso Nº 1 Establezca la Ho a ser probada. por ejemplo: α = 0. Mediante la tabla de X2 obtenga el valor teórico. Ho: 1 = 2 = 0. Establezca la conclusión con respecto a Ho: Paso Nº 4 Retenga Ho si valor de tabla > Valor calculado. Compara dichos valores.

este científico social obtiene una muestra aleatoria de 750 habitantes. durante los últimos años. ¿Cuál es la hipótesis nula? b). . Para verificar esta idea. ¿Cuál es la hipótesis alterna? c). 5% alemanes y 2% italianos. ¿Cuál es la conclusión?. Utilice  = 0. 8% irlandeses. la composición étnica de la ciudad donde vive ha cambiado. Las cifras más actuales (reunidas hace unos cuántos años) muestran que los habitantes de dicha ciudad presentan la siguiente composición étnica: 53% noruegos. con los resultados que se presentan en la siguiente tabla: Países Noruegos Suecos Irlandeses Alemanes Italianos frecuencia 399 193 63 82 13 a).Ejercicio: Un politólogo cree que. 32% suecos.05.

Se elige una muestra aleatoria de 200 estudiantes del área ingeniería. y 100 de bellas artes.0 y aprobado- reprobado Bellas artes 26 55 19 Ciencias 24 118 58 Ingeniería 20 112 68 a).0 4.0 y (3) 90% de las calificaciones están en el sistema 4. (2) todas las calificaciones están en el sistema 4.0 y 10% son a probados-reprobado. Utilice  = 0. ¿Cuál es la hipótesis nula? b). ¿Cuál es la conclusión?.05. Se realiza una encuesta para determinar si existe una relación entre el área de interés de cada alumno y su presencia para algún sistema de calificación. Se pregunta a cada alumno cuál de los tres calificaciones prefieren. Los resultados aparecen en la siguiente tabla: Sistema de calificación Aprobado-reprobado 4. 200 de ciencias. ¿Cuál es la hipótesis alterna? c). . Ejercicio: Una universidad está pensando en implantar uno de los tres sistemas de calificaciones siguientes: (1) todas las calificaciones son aprobados-reprobado.

Un economista del gobierno.05. Los datos muestran. Actitud hacia el control de precios y salarios A favor En contra Obreros 90 60 Empresarios 100 150 Profesionales 110 90 a). . ¿Cuál es la hipótesis nula? b). el número de individuos en la muestra que están a favor o contra de los controles. ¿Cuál es la hipótesis alterna? c). Utilice  = 0. ¿Cuál es la conclusión?. para cada tipo de empleo. Ejercicio: Debido a la inflación galopante. el gobierno está considerando la imposición de un control de precios y salarios. interesado en determinar si existe una relación entre el empleo y la actitud hacia este control. reúne los siguientes datos.

Grado académico y el Ingreso familiar de los docentes de la Institución Educativa de la UGEL Nº 6. Por favor responda cada ítem de la presente encuesta: Sexo: ( ) Femenino ( ) Masculino Grado académico: ( ) Bachiller ( ) Magíster ( ) Doctor ( ) Otros Ingreso familiar: ( ) Menos o iguales de S/. 800 ( ) Mayor que S/. 800 y menor que S/. 1200.1200. ( ) Mayor que S/. 550 y menor que S/. . ENCUESTA Se quiere estudiar la relación que existe entre el Sexo. 550 ( ) Mayor que S/.

DEFINIR LA VARIABLES EN SPSS .

Datos resultados de la encuesta .

INGRESO DE DATOS .

Cálculo de X2 .

600 gl 3 Sig.308 . . Tabla de contingencia Sexo Femenino Masculino Grado Bachiller 2 3 Magister 2 0 Doctor 2 1 Otros 2 0 Pruebas de chi-cuadrado de Pearson Sexo Grado Chi-cuadrado 3.

Cálculo Manual de Ji-Cuadrada .