You are on page 1of 8

PRUEBAS NO PARAMETRICAS

En este captulo presentamos el uso de la distribucin Chi- Cuadrado en contrastes no


paramtricos, esto es, aquellos que no dependen de los parmetros poblacionales no de sus
respectivos estimadores. Este tipo de pruebas frecuentemente ocurre, cuando el anlisis se
basa en conteos o frecuencias y no en medidas tales como metros, kilogramos o puntajes de
pruebas.

I. PRUEBA DE CHI-CUADRADO PARA LA INDEPENDENCIA DE DOS


VARIABLES
1.1. TABLA DE CONTINGENCIA
Es una tabla estadstica en la que cada observacin de la muestra es clasificada en dos o ms
niveles de categoras.

TABLA DE CONTINGENCIA DE LAS VARIABLES CUALITATIVAS X E Y


Categoras de Y
Total
Categoras de X
CY1
CY2
..
CYk
Subtotales
CX1
O11
O12
..
O1k
OX1
(e11 )
(e12 )
(e1k )
CX2
O21
O22
..
O2k
OX2
(e21 )
(e22 )
(e2k )
.
.
.
..
.
.
.
.
.
.
.
CXm
Om1
Om2
..
Omk
OXm
(em1 )
(em2 )
(emk )
Subtotales
OY1
OY2
..
OYk
n

Donde

Oij son las Frecuencias observadas


k

eij

Oij n de veces que se presenta el nivel

OX
i

j 1

son las frecuencias esperadas

xi , i 1, 2, . . ., m

OY Oij n de veces que se presenta el nivel yi , i 1, 2, . .., k


j
i 1

n OX
i 1

m k

OY
j 1

Oij tamao de la muestra

i 1 j 1

1.2. CONTRASTE DE INDEPENDENCIA


Con frecuencia un investigador est interesado en saber si dos mtodos de clasificacin son
independientes o probablemente estn relacionadas. Se dice que dos mtodos de categorizacin son
independientes si la distribucin de un mtodo no depende de la distribucin del otro.

HIPTESIS

H0

H1

Los dos m todos de clasificacin son ind ependientes

Los dos m todos de clasificacin no son independientes

Que tambin se puede expresar:


Ho: No existe relacin entre los dos mtodos de clasificacin
H1: Existe relacin entre los dos mtodos de clasificacin

ESTADSTICO DE PRUEBA A USAR


Dada la Tabla de Contingencia

TABLA DE CONTINGENCIA DE LAS VARIABLES CUALITATIVAS X E Y


Categoras de Y
Total
Categoras de X
CY1
CY2
..
CYk
Subtotales
CX1
O11
O12
..
O1k
OX1
(e11 )
(e12 )
(e1k )
CX2
O21
O22
..
O2k
OX2
(e21 )
(e22 )
(e2k )
.
.
.
..
.
.
.
.
.
.
.
CXm
Om1
Om2
..
Omk
OXm
(em1 )
(em2 )
(emk )
Subtotales
OY1
OY2
..
OYk
n
Donde

Oij son las Frecuencias observadas

eij

son las frecuencias esperadas; donde

eij

O Xi .OY j
n

Entonces el estadstico de prueba es


m

o2

i 1 j 1

Decisin Si

Oij eij 2
ei j

o2 es denominado valor calculado

Oi2j

e
i 1

o2 (2 ,( m 1)( k 1)) 2 se rechaza H 0 ,

Donde :

j 1

ij

es el nivel des significancia a considerar por ejemplo

0.05

(2 ,( m 1)( k 1)) 2 es el valor tabular correspondiente a la distribucin Chi-Cuadrada con


( m 1)( k 1) grados de libertad con nivel de significancia

m es el nmero de filas de la tabla de contingencia


k es el nmero de columnas de la tabla de contingencia
Observaciones finales:
Cuando empleamos la v.a. 2 en un contraste de hiptesis debemos tener en cuenta las
siguientes consideraciones:
1) Para que la v.a. 2 tenga una buena aproximacin a la distribucin Chi cuadrado es
necesario que las frecuencias esperadas de las distintas categoras no sea inferior a 5 (es
decir, debemos tener ei j 5 )
2) Si hay alguna categora que tiene una frecuencia esperada menor que cinco se agrupan
dos o ms categoras en una sola hasta lograr que la nueva frecuencia esperada sea
mayor o igual que cinco.
3) Se puede aplicar la prueba Chi cuadrado en situaciones en las que deseamos decidir si
una serie de observaciones se ajustan o no a una distribucin terica previamente
determinada que puede ser binomial, Poisson , exponencial, normal o hipottica

EJEMPLO1. Verificar si existe o no independencia entre el sexo y carrera profesional escogida con una
muestra de 80 alumnos de Economa y Administracin de cierta Universidad al nivel de 5%. Los datos se
dan en la siguiente tabla de contingencia:
Total

Sexo
Carrera
Economa
Administracin
Total

Masculino
36
14
50

Femenino
11
19
30

SOLUCION:
i)

Hiptesis

H o : El sexo y la carrera son independientes (no tienen relacin)


H 1 : El sexo y la carrera no son independientes (estn relacionados)
ii)

Calculando las frecuencias esperadas:

47
33
80

e1 1

47 50
29 . 38
80

e1 2

47 3 0
17 .62
80

e21

33 50
2 0. 62
80

e22

33 30
12 . 38
80

iii) Con lo anterior podemos formar la siguiente tabla de contingencia 2x2


Total

Sexo
Carrera

Masculino
36

Femenino
11

Economa

(29.38)
14

(17.63)
19

Administracin
Total

(20.62)
50

(12.38)
30

47
33
80

iv) Calculamos ahora el valor de 2 con nuestros datos segn el estadstico de prueba:

o2

Oij eij 2
ei j

i 1 j 1

v)

36 29.38

29.38

Oi2j

e
i 1

14 20.62

20.62

Hallamos en la tabla el valor crtico

j 1

ij

11 17.63

17.63

19 12.38

12.38

9.659

(2 ,( m 1)( k 1)) 2 para 0.05 . Para nuestro

caso
m=2 filas y k=2 columnas, por lo cual los grados de libertad = (2-1)(2-1)=1, entonces buscaremos
en la tabla con

2
0.05
,1 3.84

vi) Decisin:
Como

2 9.659 3.84 entonces rechazamos Ho y decimos que El sexo y la carrera no son

independientes (estn relacionados)


EJEMPLO 2

En un trabajo de Investigacin se tiene que su Hiptesis central es:


Hiptesis

H o : No existe una relacin entre la Gestin de los Directores y el Clima Laboral de los docentes
en las Instituciones Educativas

H 1 : Si existe una relacin entre la Gestin de los Directores y el Clima Laboral de los docentes en
las Instituciones Educativas.
Ahora determinaremos el valor calculado valor del estadstico de prueba a partir de la siguiente tabla
de contingencia
TABLA DE CONTINGENCIA DE LA GESTION DE LOS DIRECTORES Y EL CLIMA
LABORAL DE LOS DOCENTES EN LAS I. E. DE NIVEL SECUNDARIA

DIRECTORESGESTIN DE

NIVEL DE CALIDAD DEL


CLIMA LABORAL

NIVELES DE CALIDAD
Bueno
Frecuencias Observadas: Oij
( Frecuencias Esperadas eij : )
Regular

Frecuencias Observadas: Oij

o Malo

( Frecuencias Esperadas ei j : )

Subtotales

Total

Bueno

Regular o
Malo

Subtotales

21

29

(12.5)

(16.5)

25

29

(12.5)
25

(16.5)
33

58

Estadstico de prueba
De la tabla de contingencia tenemos que

o2

i 1

j 1

Oi2j

212
82
42
25 2
n

58 20.3 18
ei j
12 .5 16.5 12 .5 6.5

Entonces

o2 20 .3 18 .
El valor tabular de la Ch-Cuadrada con 1 grado de libertad y aun nivel de significancia de
es

0.05

2
2 (0
.05, 1) 3.841

Decisin
Como

o2 20.318 2 3 .8 4 1 , rechazamos H 0 , es decir que entre la Gestin de los

Directores y el Clima Laboral de los docentes en las Instituciones Educativas de nivel secundario de
la zona urbana de Andahuaylas Existe una relacin estadsticamente significativa.

PRACTICA 01 CONTRASTE DE INDEPENDENCIA - CHI CUADRADO


1. Un investigador clasific en forma cruzada a 355 nios de una escuela primaria de acuerdo con su grupo
socioeconmico y la presencia o ausencia de un defecto congnito. Con base en estos datos,
Podramos concluir que los defectos congnitos estn relacionados con la posicin econmica a un
nivel de confianza del 99%?
Grupo Socioeconmico
Defecto
Congnito
Presente
Ausente
Total

Total
Alto
4
46

Medio
32
138

Bajo
35
100

2. Sean los datos de 3 proveedores en relacin a las condiciones de sus productos vendidos. Probar a un
5% de significancia si la condicin de los productos depende del tipo de proveedor.

Tipo de
Proveedor
A
B
C

Buenos
90
170
135

Condicin del producto


Con defectos
Con defectos
menores
graves
3
7
18
7
6
9

3. Al final de un semestre, las calificaciones de Psicologa clnica fueron tabuladas en la siguiente tabla de
contingencia de 3 2 para estudiar la relacin entre la asistencia a clase y la calificacin obtenida.

Ausencias
0-3
4-6
7 - 45

Condicin
No aprobado
110
4
6

Aprobado
135
36
9

Con 0.05 , indican los datos que son independientes la asistencia a clase y la calificacin
obtenida?

4.

Se trata de ver si el nmero de reclamaciones depende de la marca para un 5% de nivel de


significancia. Ho: Los rechazos son independientes de la marca?
Ha: los rechazos dependen de la marca?
Reclamaciones
Marca

OK

Rechazos

200

35

150

24

210

40

EJERCICIOS 02 DE CHI CUADRADO

16. En momentos de baja en los negocios y de recesin, se ofrecen muchas


sugerencias para activar la economa. Se hizo un estudio entre 100 ejecutivos de
la iniciativa privada, 100 economistas y 100 funcionarios del gobierno para
averiguar sus opiniones en relacin a la mejor forma de activar una economa en
receso. Sus respuestas se encuentran en la siguiente tabla.
Opinin

Ejecutivos de
iniciativa privada

Economistas

Funcionario
pblicos

Aumentar el gasto
pblico

10

15

39

Disminuir la
carga de
impuestos
personales

37

37

33

Bajar las tasas de


inters

24

34

15

Ofrecer liberacin
de impuesto como
incentivo a
industrias

29

14

13

Total

100

100

100

17. Una muestra aleatoria de 4000 individuos (todos hombres de la misma edad) dio
los siguientes resultados.
Ingreso Anual
Mxima
educacin
De S/.5000 a
alcanzada Menos de S/.5000
S/.15000

Ms de
S/.15000

Total

Primaria

350

35

15

400

Secundaria

100

850

50

1000

Superior

40

1200

760

2000

Profesional

10

415

175

600

Total

500

2500

1000

4000

Presentan estos datos suficiente evidencia de que el salario anual (para varones de esta
edad) depende de la educacin lograda? Use = 0.10
18. La Asociacin de Estudiantes de Estadstica de la Universidad Nacional Mayor de
San Marcos quera determinar si hay una relacin entre el inters de los
estudiantes por la estadstica y su capacidad para las matemticas. Se selecciona
a una m.a. De 200 estudiantes y se les pregunta si su capacidad para las
matemticas y su inters en la estadstica son bajo, promedio o alto. Los
resultados fueron como sigue:
Inters en

Capacidad para matemticas

Total

Estadstica

Bajo

Promedio

Alto

Bajo

60

15

15

90

Promedio

15

45

10

70

Alto

10

25

40

Total

80

70

50

200

Con un nivel de significancia de 0.01, hay una relacin entre el inters por la estadstica
y la capacidad para las matemticas?
19. Se efectu un estudio de mercados a escala nacional para determinar las
preferencias de diversos grupos de edad de varones por los diferentes deportes.
Se seleccion una m.a. De 1000 hombres y a cada persona se le pidi indicar su
deporte favorito. Los resultados fueron como sigue:
Grupo de
edad

Beisbol

Ftbol

Baloncesto

Tenis

Total

Menos de
20

26

47

41

36

150

20 29

38

84

80

48

250

30 39

72

68

38

22

200

40 49

96

48

30

26

200

50 a ms

134

44

18

200

Total

366

291

207

136

1000

Con un nivel de significacin de 0.01, hay una relacin entre la edad de los hombres y
su preferencia por los deportes?

You might also like