Professional Documents
Culture Documents
________________________________________________________________________________
UNIDAD TEMATICA 1: ORGANIZACIN Y PRESENTACIN DE DATOS EN TABLAS
BIDIMENSIONALES
INTRODUCCION
A menudo, es necesario estudiar en la poblacin dos o ms variables simultneamente, como
por ejemplo, cuando se observa en determinada regin el rea de los predios agrcolas y la
produccin de legumbres (o de papa, algodn, trigo, caf, etc.); la cantidad producida, el tipo de
abono y el tipo de riego, la poblacin de cada departamento del Per segn el sexo y la edad en un
ao determinado, los ingresos familiares mensuales y los gastos de consumo de un grupo de
familias, el nmero de muertes por tipos de accidentes de trabajo, el peso y la edad de un grupo de
nios, la estatura de padres e hijos, las horas de estudio y las notas obtenidas en un examen.
En casos como estos, es posible analizar si existe alguna relacin funcional entre las
variables e incluso cuantificar el grado o intensidad de esta relacin.
Analizar la distribucin de una variable con relacin a otra u otras es una tarea comn en
muchas reas de actividad, orientada, la mayora de las veces, a la bsqueda de un patrn que
indique la relacin (o la falta de ella) entre las variables estudiadas.
Los datos bidimensionales son los valores obtenidos al medir dos variables distintas en
cada unidad de anlisis, ya sea en la poblacin o en la muestra.
Se les utiliza cuando se trata de averiguar si dos variables estn asociadas o relacionadas.
Para analizar la relacin o asociacin existente entre dos variables, debe efectuarse un
anlisis de correlacin y de regresin.
PRESENTACION DE DATOS BIVARIADOS O BIDIMENSIONALES:
y1
j=1
f11
f21
y2
j=2
f12
f22
.
.
yj
j=j
f1j
f2j
..
yr
j=r
f1r
f2r
Total (f i .)
f1.
f2.
_____________________________________________________________________________
PROFESORA DEL CURSO: Ana Mara Crdenas Rojas
fi j
, i = 1,2,..,k,
fij
, j = 1,2,..,r,
j=1
k
i=1
n=
f i.
=n
f.j
=n
i=1
r
j=1
f i j
i=1 j=1
En su expresin ms elemental, las tablas tienen slo 2 filas y 2 columnas (tablas de 2x2);
como la que se muestra a continuacin:
Esta tabla nos informa acerca de una situacin de salud, en la que se conoce que hay 300
individuos. Las frecuencias marginales nos dicen, por una parte, que 100 estn enfermos de
diabetesy 200 sanos y, por otra parte, que 60 de los 300 estuvieron expuestos a cierto factor de
riesgo y 240 no. Las frecuencias bidimensionales nos dicen que 20 de los 300 individuos estuvieron
expuestos a cierto factor de riesgo y sufrieron la enfermedad de diabetes; 160 de los 300 no
estuvieron expuestos a cierto factor de riesgo y no sufrieron la enfermedad de diabetes.
En el anlisis de datos bidimensionales, las variables X e Y pueden ser:
a) Ambas cualitativas. As por ejemplo, clase social y simpata poltica, ocupacin y profesin.
b) Una cualitativa y la otra cuantitativa, como por ejemplo, ingreso y profesin, ocupacin y
nmero de hijos, nivel educativo y nmero de hijos.
c) Ambas cuantitativas, como por ejemplo, nmero de personas y nmero de habitaciones por
vivienda, ingresos y nmero de hijos, ingresos y tiempo de servicios.
Cualquiera que sea el tipo de variable, sus valores o modalidades se ubican en los
encabezados de filas y columnas, y en el cuerpo de la tabla y en los mrgenes se ubican las
frecuencias absolutas conjuntas y absolutas marginales, respectivamente.
fij es la frecuencia absoluta conjunta o bidimensional. Indica el nmero de veces que se presenta, al
mismo tiempo, la clase o categora ci de X y la clase o categora cj de Y.
fi. es la frecuencia absoluta marginal de X. Indica el nmero de veces que se presenta la clase ci de
X.
f.j es la frecuencia absoluta marginal de Y. Indica el nmero de veces que se presenta la clase cj de
Y.
_____________________________________________________________________________
PROFESORA DEL CURSO: Ana Mara Crdenas Rojas
Yi
BA
ME
AL
BA
ME
AL
BA
ME
AL
fi
40
30
20
35
15
10
30
15
5
200
X : opinin
X: variable cualitativa o categrica, con 3
niveles
Aprueba : AP Desaprueba: DE
No opina: NO
Y: nivel socioeconmico
Y: variable cualitativa o categrica, con 3
niveles
Bajo: BA Medio: ME Alto: AL
DISTRIBUCIN CONJUNTA
A continuacin, los datos bidimensionales sern puestos en una tabla de doble entrada la cual nos
mostrar la clasificacin de los habitantes de una comunidad de Lima de acuerdo a las dos variables
de estudio.
Tabla 1: Tabla de frecuencias absolutas conjuntas y absolutas marginales
DISTRIBUCION CONJUNTA DE HABITANTES DE UNA COMUNIDAD DE LIMA SEGN
SU OPINION SOBRE EL CONTROL DE LA NATALIDAD Y NIVEL SOCIOECONOMICO
Xi / Yj
i = 1 AP
i= 2 DE
i= 3 NO
f. a. m.Y: f . j
j= 1 BA
40
35
30
105
j= 2
30
15
15
60
ME
j = 3 AL
20
10
5
35
f. a. m. X: f i .
90
60
50
n = 200
Notaciones:
fij : frecuencia absoluta conjunta, i = 1, 2, 3 indica las filas de X (OPINION)
j = 1,2,3 indica las columnas de Y(NIVEL SOCIOECONOMICO)
f i . : frecuencia absoluta marginal de X i , i = 1, 2, 3
3
i = 1 = AP
f1. =
f1 j
= 40+30+20 = 90
f 2j
= 35+15+10 = 60
j=1
3
i = 2 = DE
f2. =
j=1
_____________________________________________________________________________
PROFESORA DEL CURSO: Ana Mara Crdenas Rojas
i = 3 = NO
f3. =
f3j
= 30+15+5 = 50
j=1
j = 1 = BA
f.1=
f i1
= 40+35+30 = 105
f i2
= 30+15+15 = 60
f i3
= 20+10+15 = 35
i=1
3
j = 2 = ME
f.2=
i=1
3
j = 3 = AL
f.3=
i=1
DISTRIBUCIONES MARGINALES
A partir de la tabla bidimensional, podemos obtener las distribuciones marginales. En los
mrgenes derecho e inferior de la tabla, se encuentran los totales de filas y columnas. Los totales de
la derecha son las frecuencias de la variable X, y los totales de la parte inferior son las frecuencias
de la variable Y. Si se desea, se puede obtener cada distribucin por separado, obtenindose as las
distribuciones marginales.
Tablas 2 y 3: Tablas de distribuciones marginales de la opinin y del nivel
socioeconmico, respectivamente
Tabla 2
Distribucin marginal de
los habitantes de una comunidad de Lima segn opinin
sobre control de la natalidad
Xi
fi.
AP
DE
NO
TOTAL
Tabla 3
Distribucin marginal de los
habitantes de una comunidad
de Lima segn nivel socioeconmico
Yj
f.j
90
60
50
200
BA
ME
AL
TOTAL
105
60
35
200
A partir de la frecuencia absoluta conjunta se puede obtener la frecuencia relativa conjunta hij que
indica la proporcin de veces que se presenta, al mismo tiempo, la clase xi de X y la clase yj de Y:
hij = fij / n
k
Se cumple que : h i j = 1
i=1 j=1
hi.
=1
i=1
r
h. j
=1
j=1
_____________________________________________________________________________
PROFESORA DEL CURSO: Ana Mara Crdenas Rojas
BA
20.0
17.5
15.0
52.5
ME
15.0
7.5
7.5
30.0
AL
10.0
5.0
2.5
17.5
f. r. m.X: h i . %
45
30
25
100
Todas las frecuencias de esta tabla han sido obtenidas dividiendo las frecuencias conjuntas y
marginales de la tabla 1 entre el nmero total de datos (n = 200)
h ij : frecuencia relativa conjunta h 11 = f11 / n = 40 / 200 = 0.20
h 12 = f12 / n = 30 / 200 = 0.15, ., h33 = f33 / n = 0.025
Frecuencias relativas marginales de X: h i .
h 1 . = 20 + 15+ 10 = 45 = 90/200
h 2 . = 17.5+7.5+5 = 30 = 60/200
h 3 . = 15+7.5+2.5 = 25 = 50/200
Tabla 5
h i .%
AP
DE
NO
TOTAL
45
30
25
100
Yj
Tabla 6
h . j%
BA
ME
AL
TOTAL
52.5
30
17.5
100.0
Xi / Y 1 = BA
Xi / Y 2 = ME
Xi / Y 3 = AL
h i j=1
h i j=2
h i j=3
AP
38.1
50
57.1
DE
33.3
25
28.6
NO
28.6
25
14.3
_____________________________________________________________________________
PROFESORA DEL CURSO: Ana Mara Crdenas Rojas
BA
45.0
ME
33
AL
22.0
TOTAL
100
58.3
25
16.7
100
60.0
30
10.0
100
h j i=1
Yj / X 2 = DE
h j i=2
Yj / X 3 = NO
h j i=3
En la segunda fila de esta tabla se presenta la distribucin condicional de la variable Y cuando la
variable X toma la modalidad X1 = AP.
Para
j = 1, BA / X 1 = AP = h 1 i = 1 = h 11 / h 1 . = 20/45 = 0.45
j = 2 ME / X 1 = AP = h 2 i = 1 = h 12 / h 1 . = 15/45 =0.33
j = 3 AL / X 1 = AP = h 3 i = 1 = h 13 / h 1 . = 10/45 =0.22
Como puede observarse, la tabla 8 nos muestra tres distribuciones diferentes para Y. Nos informa
acerca de la distribucin del nivel socioeconmico de aquellos habitantes cuya opinin es
aprueba o desaprueba o no opina (se considera el total de cada fila como una submuestra)
Esta tabla se denomina Tabla de Perfiles Fila o Lnea.
Interpretacin de las frecuencias de la 2 fila de la tabla 8: Del total de habitantes de una comunidad
de Lima que aprueban el control de la natalidad, el 45% provienen del nivel socioeconmico bajo,
el 33% del nivel socioeconmico medio y el 22% del nivel socioeconmico alto.
_____________________________________________________________________________
PROFESORA DEL CURSO: Ana Mara Crdenas Rojas
Total
f.a.m. Yj
Y: Gnero
Total
Masculino
3
6
13
9
10
7
3
4
2
Femenino
1
2
3
5
6
5
13
6
2
f. a. m. Xi
3
7
15
12
15
13
8
17
8
2
57
43
100
DISTRIBUCIONES MARGINALES
A continuacin, mostramos las distribuciones marginales de las edades y del sexo de los empleados
de la empresa Vida Solar.
Tabla N 10
Edades
Total
20 - 24
3
Tabla N 11
25 - 29
7
30 - 34
15
Sexo
frecuencia
35 - 39
12
Masculino
57
40 - 44
15
femenino
43
45 - 49
13
_____________________________________________________________________________
Total
100
50 - 54
8
PROFESORA
DEL CURSO:
Ana Mara Crdenas Rojas
55 - 59
17
60 - 64
8
65 - 69
2
1
10
20
15
45
Tabla N 13
2
15
8
5
28
Notaciones:
fij : frecuencias absoluta conjunta
f i . : frecuencia absoluta marginal de X
f . j : frecuencia absoluta marginal de Y
Fij : frec. absoluta acumulada conjunta
h j i: frec. Condicional de Y/X en %
3
20
17
10
47
f.a.m.X: f i .
45
45
30
120
_____________________________________________________________________________
PROFESORA DEL CURSO: Ana Mara Crdenas Rojas
Grfico de bastones en R3
Grfico de dispersin o nube de puntos
Frecuencias marginales
absolutas y relativas
Hij
fi. hi.
f.j
h.j
Frecuencias marginales de Xi y de Yj: Absolutas (f i .), relativas (h i .), acumuladas absolutas (Fi .)
y acumuladas relativas (H i .).
Tabla N 15
Tabla N 16
Xi
fi.
h i . F i . Hi .
Yj
f.j
h.j
F.j
H.j
%
%
%
%
[15 25)
[25 35)
[35 45)
Total
52
68
28
148
34.5 52
46.0 120
19.5 148
100.0
34.5
80.5
100.0
[15 25)
[25 35)
[35 45)
Total
Ejercicio:
56
33
11
30
50
20
17
50
33
Yj
h j i=1
h j i=2
h j i=3
[15 25)
Tabla N 18
[25 35) [35 45) Total
100
100
100
_____________________________________________________________________________
PROFESORA DEL CURSO: Ana Mara Crdenas Rojas
_____________________________________________________________________________ 10
PROFESORA DEL CURSO: Ana Mara Crdenas Rojas