You are on page 1of 26

AnlisisdeDatosI

1ersemestre2010

UnidadIV:Tablasdecontingencia
C
Creacin
i y llectura
t
d
de ttablas
bl d
de contingencia
ti
i

P f
Profesoras:
P
PamelaAyalaA.
l A l A
DaniellaLealV.

TABLASDECONTINGENCIA
BIVARIADAS CONSTRUCCIN
BIVARIADAS:CONSTRUCCIN,
LECTURAEINTERPRETACIN

Por qu tablas de contingencia?


Se busca resumir los datos conjuntos de dos variables.
variables La tcnica a utilizar
depender del nivel de medicin de las variables:

Cualitativa Cualitativa

- Tablas de contingencia, grficos de


barras.

Cualitativa Cuantitativa

- Resumen de estadsticos descriptivos


por grupos de variable cualitativa,
cualitativa
boxplot por grupos.

Cuantitativa Cuantitativa

- Tablas de correlacin, grficos de


dispersin
dispersin.
3

Segn tipo de OBJETIVO

DESCRIPTIVO

Lo relevante es poder establecer


una descripcin de los datos
segn grupos de variables de
clasificacin (ejemplo: variables
sociodemogrficas).

OBJETIVO

EXPLICATIVO

Su objetivo est asociado a la


comprobacin de hiptesis: se
busca probar la dependencia
entre variables, de esta forma
hay que distinguir entre variable
dependiente e independiente.

OBJETIVO DESCRIPTIVO
Variable sociodemogrfica
Variable
de inters

% columna

Variable
de inters
Variable
socio-demogrfica

% fila

Responder a la pregunta sobre cmo se distribuye una


p
sociodemogrficamente
g
determinada variable en ggrupos
relevantes?
No pretende una relacin causal entre las variables, slo
comparar la distribucin de frecuencias
Se leen siempre en la direccin de la variable sociodemogrfica:
importante distinguir % fila y % columna
5

OBJETIVO DESCRIPTIVO
Pobre
NoPobre
Total

Ocupado
10,2
89,8
100,0
,

Pobre
NoPobre
b
Total

Pobre
NoPobre
Total

1990
38,6
61,4
100,0

Desocupado
36,9
63,1
100,0
,

Hombres
18,3
81,7
100,0
1992
32,9
67,1
100,0

1994
27,6
72,4
100,0

Inactivo
19,7
80,3
100,0
,

Mujeres
19,0
81,0
100,0
1996
23,2
76,8
100,0

Total
15,8
84,2
100,0
,

Total
18,7
81,3
100,0
1998
21,7
78,3
100,0

2000
20,2
79,8
100,0

2003
18,7
81,3
100,0

Ejemplostablasdescriptivas:
Pobrezasegnsituacindeocupacin,sexoyao(CASEN2003ySerie19902003)
Cmosedistribuyelapobrezasegnestasvariables?
6

OBJETIVO EXPLICATIVO

Variable
dependiente

Variable
independiente

Variable
dependiente

% columna

% fila

Variable
independiente

Responde a la pregunta sobre la relacin causal entre dos


variables: cmo la variacin en X afecta o no afecta la variacin
en Y?
Supone que podamos distinguir a priori entre variable
independiente y variable dependiente y que podamos especificar
hipotticamente una relacin causal esperada
Se leen siempre en la direccin de la variable independiente:
importante distinguir % fila y % columna
7

OBJETIVO EXPLICATIVO
Hiptesis: La percepcin de la evolucin de la educacin chilena depende del
NSE de una persona: quienes pertenecen a un NSE bajo tienen una visin ms
pesimista de la evolucin del sistema.
Mejorado
Estigual
Haempeorado
p
Total
N=

Bajo
j
61,0
23,8
15,2
100,0
6920

Medio
54,4
26,2
19,5
100,0
5731

Alto
49,8
31,5
18,7
100,0
4964

Total
55,7
26,7
17,6
100,0
17615

Secomprueba?
p

Hiptesis: La percepcin de la evolucin de la educacin chilena depende del


NSE de una persona: quienes pertenecen a un NSE alto visualizan un
estancamiento de la educacin en el ltimo tiempo.
Mejorado
Estigual
Ha empeorado
Haempeorado
Total
N=

Bajo
61,0
23,8
15 2
15,2
100,0
6920

Medio
54,4
26,2
19 5
19,5
100,0
5731

Alto
49,8
31,5
18 7
18,7
100,0
4964

Total
55,7
26,7
17 6
17,6
100,0
17615

Se comprueba?
Secomprueba?

Qu relaciones son posibles?


1 Si
1.
Simtricas:
t i
ninguna
i
variable
i bl influye
i fl
causalmente
l
t sobre
b las
l
otras,
t
aunque varen juntas (no causalidad)
Ej:PSULenguajeyPSUMatemticas
(indicadoresalternativos;relacinesprea)

2. Recprocas: ambas variables


(
(causalidad
lid d bi-direccional)
bi di
i
l)

se

influencian

causalmente

Ej: Asociatividad barrial y Antigedad residencial; Participacin laboral femenina y


Divorcio

3. Asimtricas: slo una de las variables influencia causalmente a la


otra (causalidad uni-direccional)
Ej: Religin de los padres y Religin del individuo; Nivel de estudios y Empleabilidad
(anterioridad temporal, anterioridad estructural, estmulorespuesta, mediofin;
predisposicinaccin)

CALCULANDO PORCENTAJES
PORCENTAJEFILAS:
Mejorado
Estigual
Haempeorado
Total

Mejorado
Estigual
Haempeorado
Total

Bajo
4221
1647
1052
6920

Medio
3118
1502
1118
5731

Bajo
Bajo
(4221/9812)*100
(1647/4703)*100
(1052/3100)*100
(6920/17615)*100

Alto
2472
1564
928
4964

Total
9812
4703
3100
17615

Medio
Medio
(3118/9812)*100
(1502/4703)*100
(1118/3100)*100
(5731/17615)*100

Frecuencias
porcategora
p
g

Alto
Alto
Total
Total
(2472/9812)*100
(9812/9812)*100
(1564/4703)*100
(4703/4703)*100
(928/3100)*100
(3100/3100)*100
(4964/17615)*100 (17615/17615)*100

Bajo
j

Medio

Alto

Total

Mejorado

43.0

31.8

25.2

100

Estigual

35.0

31.9

33.3

100

Haempeorado
p

33.9

36.1

29.9

100

Total

39.3

32.5

28.2

100

Porcentaje
filas

10

CALCULANDO PORCENTAJES
PORCENTAJECOLUMNAS:
Mejorado
Estigual
g
Haempeorado
Total

Mejorado
Estigual
Haempeorado
Total

Bajo
4221
1647
1052
6920

Medio
3118
1502
1118
5731

Bajo
Bajo
(4221/6920)*100
(1647/6920)*100
(1052/6920)*100
(6920/6920)*100

Alto
2472
1564
928
4964

Total
9812
4703
3100
17615

Medio
Medio
(3118/5731)*100
(1502/5731)*100
(1118/5731)*100
(5731/5731)*100

Frecuencias
porcategora
p
g

Alto
Alto
(2472/4964)*100
(1564/4964)*100
(928/4964)*100
(4964/4964)*100

Bajo
j

Medio

Alto

Total

Mejorado

61.0

54.4

49.8

55.7

Estigual

23.8

26.2

31.5

26.7

Haempeorado
p

15.2

19.5

18.7

17.6

Total

100.0

100.0

100.0

100.0

Total
Total
(9812/17615)*100
(4703/17615)*100
(3100/17615)*100
(17615/17615)*100

Porcentaje
columnas

11

% FILAS VS. % COLUMNAS


Test de la independencia entre variables:
Si en todas las categoras de la variable independiente,
los casos se comportan igual para la variable
d
dependiente
di
(i
(tienen
una misma
i
di ib i
distribucin
porcentual), entonces la variable independiente no est
afectando el comportamiento de la variable
dependiente (hiptesis nula).

12

% FILAS VS. % COLUMNAS

nmeros
absolutos

RENDIM
MIENTO
ESCO
OLAR

AUTOESTIMA
AUTOESTIMA
ALTA

BAJA

ALTO

25

25

50

BAJO

25

25

50

50

50

100

%
fila

RENDIMIENTO
ESCOLAR

%
columna

REND
DIMIENTO
ESSCOLAR

AUTOESTIMA
ALTA

BAJA

ALTO

50

50

50

BAJO

50

50

50

Total (%)

100

100

100

AUTOESTIMA
ALTA

BAJA

Total (%)
Total(%)

ALTO

50

50

100

BAJO

50

50

100

50

50

100

MXIMAINDEPENDENCIA:
Noexisterelacinentrelas
variables.
i bl
Entre los que tienen alta
autoestima, hay un % igual
de individuos que tienen alto
rendimiento q
que entre los
que tienen baja autoestima.
Entre los q
que tienen alto
rendimiento, hay un % igual
de individuos que tienen alta
autoestima que entre los que
tienen bajo rendimiento
13

% FILAS VS. % COLUMNAS

nmeros
absolutos

RENDIM
MIENTO
ESCO
OLAR

AUTOESTIMA
AUTOESTIMA
ALTA

BAJA

ALTO

50

50

BAJO

50

50

50

50

100

MXIMADEPENDENCIA:
Existerelacinunoauno
entrelasvariables.
t l
i bl

%
fila

RENDIMIENTO
ESCOLAR

%
columna

REND
DIMIENTO
ESSCOLAR

AUTOESTIMA
ALTA

BAJA

ALTO

100

50

BAJO

100

50

Total (%)

100

100

100

Entre los que tienen alta


autoestima, hay un 100% con
alto rendimiento.

AUTOESTIMA
ALTA

BAJA

Total (%)
Total(%)

ALTO

100

100

BAJO

100

100

50

50

100

Entre los que tienen alto


rendimiento, hay un 100%
con alta autoestima.
14

% FILAS VS. % COLUMNAS

nmeros
absolutos

RENDIM
MIENTO
ESCO
OLAR

AUTOESTIMA
AUTOESTIMA
ALTA

BAJA

ALTO

30

20

50

BAJO

20

30

50

50

50

100

%
fila

RENDIMIENTO
ESCOLAR

%
columna

REND
DIMIENTO
ESSCOLAR

AUTOESTIMA
ALTA

BAJA

ALTO

60

40

50

BAJO

40

60

50

Total (%)

100

100

100

AUTOESTIMA
ALTA

BAJA

Total (%)
Total(%)

ALTO

60

40

100

BAJO

40

60

100

50

50

100

DEPENDENCIA(orelacin)
MODERADA:
Existe relacin (NO unoa
Existerelacin(NOuno
a
uno)entrelasvariables.
Entre los individuos que
tienen
i
alta
l autoestima,
i
h
hay
un mayor porcentaje (60%)
con alto rendimiento que
entre los individuos con baja
autoestima (40%).
Entre los individuos que
tienen alto rendimiento, hay
un mayor porcentaje (60%)
con alta autoestima que
entre
t los
l individuos
i di id
con bajo
b j
rendimiento (40%).
15

% FILAS VS. % COLUMNAS

%
columna

RENDIM
MIENTO
ESCO
OLAR

%
columna

RENDIMIEENTO
ESCOLA
AR

AUTOESTIMA
ALTA

BAJA

ALTO

20

20

20

BAJO

80

80

80

Total (%)

100

100

100

NOHAYRELACIN
A t ti
Autoestima
Rendimiento
R di i t

AUTOESTIMA
ALTA

BAJA

Total(%)

ALTO

70

10

20

BAJO

30

90

80

100

100

100

HAYRELACIN
Autoestima Rendimiento
Autoestima

La relacin se observa respecto de la situacin hipottica de no relacin: entre los


individuos con alta autoestima, un mayor porcentaje de individuos tiene un alto
rendimiento escolar (70%), que entre los individuos con baja autoestima (10%). Si
autoestima
t ti
es la
l variable
i bl independiente
i d
di t (% columnas),
l
) se puede
d pensar que una
alta autoestima est relacionada causalmente con un alto rendimiento escolar.
16

CMO LEER UNA TABLA?


1. Describir el marginal columna (total columna:
distribucin variable dependiente): lgica desde afuera
hacia adentro
adentro

Desde lo ms frecuente a lo menos frecuente/ desde lo ms


relevante a lo menos relevante.

Si la variable dependiente tiene muchas categoras de


respuesta, no es necesario describir todas las categoras ni leer
todos los porcentajes.

Si la variable dependiente tiene slo dos categoras, basta con


leer lo que ocurre en una de ellas (especialmente si es
ausencia/presencia).

17

CMO LEER UNA TABLA?


2 Comparar a lo largo de la fila: lgica horizontal*
2.
horizontal *

El porcentaje de lo primero que se describi (ejemplo: lo ms


ffrecuente),
ecue te), se da por
po igual
gua een todas las
as co
columnas
u as (g
(grupos
upos que
se estn comparando), o cambia entre ellas?

Si cambia, cul es el patrn de cambio?

Intuitivamente, son diferencias significativas en la poblacin sobre


los 5 puntos porcentuales (depende del tamao muestral); siempre
son significativas a nivel muestral.
muestral

A mayor cantidad de casos de la muestra, una pequea diferencia


puede ser significativa en la poblacin, a menor cantidad de casos
se requiere una gran diferencia para que sea significativa (regla se
aplica a muestras que tienen entre 400 y 2000 casos).

*NOTA:
NOTA: slo si el total est calculado a nivel de columnas,
columnas si est calculado a nivel de filas
(con la variable dependiente a nivel de columnas), es exactamente a la inversa (lgica
vertical)
18

CMO LEER UNA TABLA?


3.Sugerenciasprcticas

No poner demasiados nmeros en la redaccin.

Sealar primero la tendencia y usar representativamente los


porcentajes entre parntesis.

Nombrar claramente la unidad de anlisis (casos de la tabla), no


hablar de casos.

Nombrar claramente las variables y la direccin de las


relaciones, no decir la primera variable est relacionada
con la segunda, sino existe una relacin positiva entre la
variable x y la variable y.

19

EJEMPLO 1: % FILA

%
fila

AGR
RADOCLIM
MA
LLABORAL

Climalaboral(agrado)ySatisfaccinlaboral
SATISFACCINLABORAL
(Muy)
satisfecho

Regularmente
satisfecho

(Muy)
insatisfecho

TOTAL

Desagradable

17,0

47,2

35,7

100

97

Regularmente
agradable

35,8

49,1

15,0

100

343

Agradable

74,2

21,2

4,6

100

577

TOTAL

55,7

33,2

11,1

100

1018

La
La mayora de los trabajadores encuestados se siente muy satisfecho con su trabajo (56%),
(56%)
un tercio se siente regularmente satisfecho (33%) y slo un 11% se siente insatisfecho.
Existe una relacin positiva entre estar en un clima ms agradable en el trabajo y sentir ms
satisfaccin. Los trabajadores que estn en un clima agradable, se sienten muy satisfechos
en un mayor porcentaje (74%), que los que estn en un clima que consideran desagradable
(17%).
(Slo si queda espacio)
(Slosiquedaespacio)
Por su parte, quienes estn en un clima desagradable, se sienten insatisfechos en una
proporcin mucho mayor (36%) que quienes estn en un clima agradable (5%).
20

EJEMPLO 1: % COLUMNA

%
fila

AGR
RADOCLIM
MA
LLABORAL

Climalaboral(agrado)ySatisfaccinlaboral
SATISFACCINLABORAL
(Muy)
satisfecho

Regularmente
satisfecho

(Muy)
insatisfecho

TOTAL

Desagradable

2,9

13,7

30,8

9,6

Regularmente
agradable

21,7

50,0

45,6

33,7

Agradable

75,4

36,3

23,6

56,7

100,0

100,0

100,0

100,0

567

338

113

1018

TOTAL
N

La mayora de los trabajadores encuestados siente un clima agradable en su trabajo (57%),


un poco ms de un tercio lo siente regularmente agradable (34%) y slo un 10% siente que
el clima laboral es desagradable.
Existe una relacin positiva entre sentir ms satisfaccin laboral y sentir un clima agradable
en el trabajo. Los trabajadores que estn muy satisfechos laboralmente sienten un clima
agradable (75%), que los que estn muy insatisfechos laboralmente (24%).
21

% FILAS VS. % COLUMNAS


Variable
independiente

Variable
dependiente
Variable
independiente

> agrado

% fila

> satisfaccin

Variable
dependiente

> satisfaccin

% satisfaccin

% columna

> agrado
% agrado

agradable

74%

satisfecho

75%

regular

21%

regular

36%

insatisfecho

24%

desagradable

5%

En este caso, coinciden bastante los porcentajes calculados en cambas direcciones:


Cmo podramos interpretar esto en trminos de la relacin de causalidad entre
ambas variables?
22

EJEMPLO 2: % COLUMNA
Asistencia a oficios religiosos (frecuencia) y Religin
Asistenciaaoficiosreligiosos(frecuencia)yReligin

%
columna

ASISITTENCIA
OFIC
CIOS

RELIGIN
Catlica

Evanglica/
Protestante

Otra

Ninguna

TOTAL

Msdeunavez alasemana

8,1

30,2

14,2

1,5

10,9

Unavezalasemanaovarias
vecesalmes

31,9

31,6

20,2

6,9

26,0

Nunca ocasinunca

60,0

38,2

65,6

91,6

63,0

TOTAL

100,0

100,0

100,0

100,0

100,0

31839

7907

8161

9475

57382

1. Quvariablesestnsiendotesteadasensuindependencia?
2. Culeslahiptesisquehaydetrsdeestatabla?
3 Cmoserealizaralalecturadeestatabla?
3.
Cmo se realizara la lectura de esta tabla?
23

EJEMPLO 2: LECTURA
La mayora de los individuos encuestados no asiste a oficios religiosos, o lo hace
rara vez (63%), un 26% lo hace una vez a la semana o varias veces al mes y una
minora ((10%)) asiste ms de una vez a la semana.
Existe una clara relacin entre la religin que se profesa y la frecuencia con que se
asiste a oficios religiosos. Los evanglicos o protestantes asisten con alta
frecuencia (ms de una vez a la semana) en mucha mayor proporcin (30%) que
los catlicos (8%) y que individuos de otras religiones (14%).
Esta relacin no se observa tan claramente para la frecuencia regular (una vez a la
semana),
) donde
d d evanglicos/protestantes
li /
y catlicos
li
asisten
i
en igual
i l proporcin
i
(32%), pero vuelve a observarse claramente en la frecuencia baja o nula. Entre los
catlicos, un 60% no asiste nunca o casi nunca a oficios religiosos, en comparacin
con un 38% de los protestantes
protestantes

24

EJERCICIO EN CLASES
A continuacin se presentan una serie de tablas bivariadas. Para cada
una de ellas:
1. Identifique las variables en relacin
2. La posible hiptesis a contrastar
3. El tipo de porcentaje calculado
4. Y realice una lectura de los principales resultados

25

AnlisisdeDatosI
1ersemestre2010

UnidadIV:Tablasdecontingencia
C
Creacin
i y llectura
t
d
de ttablas
bl d
de contingencia
ti
i

P f
Profesoras:
P
PamelaAyalaA.
l A l A
DaniellaLealV.

You might also like