You are on page 1of 5

Estadística Descriptiva Bivariada Unidad IV

Estadística Descriptiva Bivariada Unidad


III IVEstadística Descriptiva Bivariada Unidad IV
III III
MEDIDAS DE ASOCIACIÓN
4.2 MEDIDAS PARA VARIABLES
DE ASOCIACIÓN CUANTITATIVAS.
PARA VARIABLES CUANTITATIVAS. Solución:

4.2 MEDIDAS DE ASOCIACIÓN PARA VARIABLES CUANTITATIVAS. Sean:


EJERCICIOS.
EJERCICIOS RESUELTOS
X: Puntaje de la primera prueba.
EJERCICIOS RESUELTOS Y: Puntaje de la segunda prueba.
1.- Se han registrado las siguientes puntuaciones en las pruebas de Música (X) y de
Matemática
1.- Se han (Y), obtenidas
registrado las por una muestra
siguientes de niñosen
puntuaciones de las
10 años de un
pruebas de colegio
Músicade(X)
la Zona
y de ∑ 𝑥𝑖 584
Austral.
Matemática (Y), obtenidas por una muestra de niños de 10 años de un colegio de la Zona 𝑥̅ 58,4
𝑛 10
Austral. ∑ 𝑥𝑖 𝑥̅ 2
1498,4
𝑋 𝑌 𝑋∙𝑌 𝑠𝑥2 149,84
5 6 𝑛 10
𝑋 𝑌 𝑋30∙𝑌 𝑠𝑥 𝑠𝑥2 149,84 12,2409
75 86 56
30
87 78 56
56 ∑ 𝑦𝑖 695
58 67 30
56 𝑦̅ 69,5
95 10 90 𝑛 10
6 30 ∑ 𝑦𝑖 𝑦̅ 2
1096,5
49 5
10 20
90 𝑠𝑦2 109,65
54 55 25 𝑛 10
20
55 75 35
25 𝑠𝑦 𝑠𝑦2 109,65 10,4714
75 67 42
35 ∑ 𝑥𝑖 𝑥̅ 𝑦𝑖 𝑦̅ 1207
87 96 72
42 𝑠𝑥𝑦 120,7
𝑛 𝑛
Fuente: D. F.
𝑋 86,3 𝑌 9 6,9 𝑋 ∙ 72
𝑌 456
𝑋 6,3 𝑌 6,9 𝑋∙𝑌 456 Fuente: D. F. Coeficiente de correlación:
Calcule la covarianza. Interprete. 𝑠𝑥𝑦 120,7
Calcule la covarianza. Interprete. 𝑟 0,9416
Solución: 𝑠𝑥 𝑠𝑦 12,2409 ∙ 10,4714
Solución:
𝑋∙𝑌 456 Interpretación: si existe asociación lineal entre las variables porque 𝑟 0,9416, lo que
𝑆𝑋𝑌 𝑋∙𝑌 6,3 ∙ 6,9 2,13 indica que hay una buena correlación lineal entre los puntajes de la primera y segunda
𝑋𝑛∙ 𝑌 456
10
𝑆𝑋𝑌 𝑋∙𝑌 6,3 ∙ 6,9 2,13 prueba, ya que esto se gráfico en un diagrama de dispersión y con eso se confirma lo
𝑛 10 bueno de r.
Interpretación: las variables puntaje de la prueba de música y puntaje de la prueba de
matemática estánlasasociadas
Interpretación: variablespositivamente.
puntaje de la prueba de música y puntaje de la prueba de
3.- A un grupo de alumnos se les examina de teoría (X) y práctica (Y) de una asignatura.
matemática están asociadas positivamente. La nota global de dicha asignatura (Z) se obtiene de la siguiente forma:
2.- Se tiene una muestra de las puntuaciones de 10 estudiantes en la primera y segunda
prueba del curso
2.- Se tiene de Estadística
una muestra Descriptiva yde
de las puntuaciones Nociones de Probabilidad.
10 estudiantes en la primera y segunda
𝑍𝑘 𝑋𝑖 𝑌𝑗 𝑖 𝑗 𝑘
prueba del curso de Estadística Descriptiva y Nociones de Probabilidad.
Primera Prueba 60 74 66 34 60 66 57 71 39 57
Compare la Homogeneidad de la distribución de la nota global en los dos casos siguientes:
Segunda
Primera Prueba 72 60 82
74 7566 4634 73 74 57
60 66 70 7182 39 60 5761 Fuente: D. F.
Segunda Prueba 72 82 75 46 73 74 70 82 60 61 Fuente: D. F. a. Las variables X e Y están totalmente correlacionadas.
Calcule el coeficiente de correlación lineal e interprete el resultado.
b. Las variables X e Y son totalmente independientes.
Calcule el coeficiente de correlación lineal e interprete el resultado.
indica que hay una buena correlación lineal entre los puntajes de la primera y segunda El 𝐶𝑉 𝑍 en el caso a.2 siempre será menor que el 𝐶𝑉 𝑍 del caso b.
prueba, ya que esto se gráfico en un diagrama de dispersión y con eso se confirma lo
bueno de r. Luego la más homogénea será cuando existe correlación perfecta negativa.

3.- A un grupo de alumnos se les examina de teoría (X) y práctica (Y) de una asignatura. 4.- La siguiente tabla expone la distribución de frecuencias bidimensional de las variables
La nota global de dicha asignatura (Z) se obtiene de la siguiente forma: X, ingresos en millones de pesos, en concepto de permisos de circulación, e Y, gastos en
mantenimiento de calles, en millones de pesos, de un grupo de municipalidades.
𝑍𝑘 𝑋𝑖 𝑌𝑗 𝑖 𝑗 𝑘
Gasto en mantenimiento de calles en millones
Compare la Homogeneidad de la distribución de la nota global en los dos casos siguientes:
Y [6,5 – 13,5[ [13,5 – 14,5[ [14,5 – 15,5]

Ingreso en millones
Estadística Descriptiva
a. Las variables Bivariada
X e Y están totalmente correlacionadas. Unidad IV X
b. Las variables X e Y son totalmente independientes.
Solución:
III [5 – 55[ 0,08 0,02 0,06

[55 – 65[ 0,02 0,13 0,04


Zk Xi Yj i j k
[65 – 75] 0,12 0,13 0,22 Fuente: D. F.
∑ Z k nk ∑ Xk Yk nk ∑ X k nk ∑ Yk nk Estadística Descriptiva Bivariada Unidad IV
Z X Y
N N 130 N N
a. ¿Cuál es el ingreso medio por municipalidad en concepto de permisos
III
de
2 2
circulación en las municipalidades cuyos gastos en mantenimiento de calles están
∑ Zk Z 2 ∑ Xi Yj X Y ∙ nij ∑ Xi X Yj Y ∙ nij 131
comprendidos entre 13,5 y 14,5 millones de pesos?
S2
N N N b. Obtenga el gasto medio por municipalidad en mantenimientos de calles entre las
2
∑ Xi X 2 ∙ ni ∑ Yj Y ∙ nj ∑ Xi X Yj Y ∙ nij municipalidades con ingresos por permisos de circulación entre 65 y 75 millones de
2 S2 SY2 2SXY
N N N pesos.
SZ c. ¿Cuál de las dos medias es más representativa?
CV Z
Z

S +S +2S
Solución:
a.1 r 1 ⇒ SXY 0 ⇒ CV Z X+Y
S +S −2S a. El ingreso medio es la media de la distribución condicionada 𝑋/𝑌 𝑦2 ; 𝑓𝑖/2 ,
a.2 r 1 ⇒ SXY 0 ⇒ CV Z
X+Y donde 𝑦2 es la marca de clase del intervalo 13,5 – 14,5.
S +S
b. r 0 ⇒ SXY 0 ⇒ CV Z Los valores de esta distribución de frecuencias son los valores de la variable X, siendo
X+Y
la frecuencia relativa del valor genérico 𝑥𝑖 , marca de clase del intervalo genérico.

La variable es más homogénea es aquella que tiene menor coeficiente de variación. 𝑓𝑖2
𝑓𝑖/2
El 𝐶𝑉 𝑍 en el caso a.1 siempre será mayor que el 𝐶𝑉 𝑍 del caso b. 𝑓2

El 𝐶𝑉 𝑍 en el caso a.2 siempre será menor que el 𝐶𝑉 𝑍 del caso b. De este modo se obtiene la tabla de distribución de frecuencias condicionada:
Luego la más homogénea será cuando existe correlación perfecta negativa. 𝑓𝑖/2
𝑥𝑖 /𝑌 𝑦2
0,02
30 0,072
4.- La siguiente tabla expone la distribución de frecuencias bidimensional de las variables 0,28
0,13
X, ingresos en millones de pesos, en concepto de permisos de circulación, e Y, gastos en 60 0,464
0,28
mantenimiento de calles, en millones de pesos, de un grupo de municipalidades. 0,13
70 0,464
0,28
Gasto en mantenimiento de calles en millones
b. pesos.
Obtenga el gasto medio por municipalidad en mantenimientos de calles entre las
municipalidades
c. ¿Cuál con ingresos
de las dos medias es máspor permisos de circulación entre 65 y 75 millones de
representativa?
Estadística Descriptiva Bivariada Unidad IV
pesos.
c. ¿Cuál de las dos medias es más representativa?
𝑓
III
Solución: 𝑓/
𝑓
Solución: Al aplicar ésta relación a cada uno de los valores de la variable se obtiene la siguiente
a. El ingreso medio es la media de la distribución condicionada 𝑋/𝑌 𝑦2 ; 𝑓𝑖/2 ,
tabla de distribución condicionada.
donde 𝑦2 es la marca de clase del intervalo 13,5 – 14,5.
a. El ingreso medio es la media de la distribución condicionada 𝑋/𝑌 𝑦2 ; 𝑓𝑖/2 , 𝑦 /𝑋 𝑥 𝑓/
Los donde
valores𝑦 deesesta distribución
la marca dedel
de clase frecuencias
intervalo son
13,5los valores de la variable X, siendo
– 14,5.
2
la frecuencia relativa del valor genérico 𝑥𝑖 , marca de clase del intervalo genérico. 10
0,12
0,255
Los valores de esta distribución de frecuencias son los valores de la variable X, siendo 0,47
la frecuencia relativa del valor genérico 𝑓𝑖2 de clase del intervalo genérico.
𝑥𝑖 , marca
𝑓𝑖/2 0,13
𝑓2 14 0,277
0,47
𝑓𝑖2
𝑓𝑖/2 de frecuencias condicionada:
De este modo se obtiene la tabla de distribución 0,22
𝑓2 15 0,468
0,47
De este modo se obtiene la tabla𝑥de
𝑖 /𝑌distribución
𝑦2 de𝑓𝑖/2
frecuencias condicionada:
0,02
30 0,072
𝑥𝑖 /𝑌 𝑦2 0,28 𝑓𝑖/2 La media de la distribución conjunta condicionada es:
0,13
0,02
60
30 0,464
0,072
0,28
0,28 𝑦/𝑋 𝑥 𝑦 ∙𝑓 13,448 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑑𝑒 𝑝𝑒𝑠𝑜𝑠.
0,13
0,13
70
60 0,464
0,464
0,28
0,28 c. Para estudiar la representatividad se puede utilizar el coeficiente de variación de
0,13 cada una.
70
Luego calculamos la media de la distribución 0,464 con la información de la tabla.
condicionada
0,28 𝑠 /
𝐶𝑉 𝑋/𝑌 𝑦2
𝑥̅ / 𝑌 𝑦2
Luego calculamos la media
𝑥̅ / 𝑌 de𝑦la
2
distribución
𝑥𝑖 ∙ 𝑓 𝑖condicionada con la 𝑑𝑒
62,48 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 información
𝑝𝑒𝑠𝑜𝑠. de la tabla.
2
b. El gasto medio por municipalidad en mantención de calles entre las 𝑠 2/ 𝑥 2 ∙ 𝑓 /2 𝑥̅ / 𝑌 𝑦2 2
105,05
𝑥̅ / 𝑌 𝑦2 𝑥𝑖 ∙ 𝑓 𝑖 62,48 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑑𝑒 𝑝𝑒𝑠𝑜𝑠.
municipalidades con ingresos por permisos 2 de circulación entre 65 y 75 millones de
b. pesos
El gasto mediodepor
es la media municipalidad
la distribución en mantención
condicional 𝑦 /𝑋 𝑥3 ;de 𝑓 calles
/3 , conentre
𝑥3 70, las 𝑠 𝑠 2/ 105,05 10,25 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑑𝑒 𝑝𝑒𝑠𝑜𝑠.
/
municipalidades con ingresos
marca de clase del intervalo 65-75.por permisos de circulación entre 65 y 75 millones de
Por lo tanto,
pesos es la media de la distribución condicional 𝑦 /𝑋 𝑥3 ; 𝑓 /3 , con 𝑥3 70, 10,25
Los valores de de
marca esta distribución
clase son 10,
del intervalo 14, 15, marcas de clase de los intervalos en los que
65-75. 𝐶𝑉 𝑋/𝑌 𝑦2 0,16
62,48
están agrupados los datos de la variable Y, respondiendo a las frecuencias relativas a la
Los valores
siguiente de esta distribución son 10, 14, 15, marcas de clase de los intervalos en los que
expresión: Por otra parte,
están agrupados los datos de la variable Y, respondiendo a las frecuencias relativas a la 𝑠 /
𝐶𝑉 𝑌/𝑋 𝑥
siguiente expresión: 𝑦/ 𝑋 𝑥
132 𝑠 2/ 2
𝑦 ∙ 𝑓/ 𝑦/ 𝑋 𝑥 2
4,24

132
𝑠 / 𝑠 2/ 4,24 2,06 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑑𝑒 𝑝𝑒𝑠𝑜𝑠.

133
sindicato. Conociendo que el índice de satisfacción es de 6 predecir los años que
Estadística Descriptiva Bivariada Unidad IV lleva en el sindicato.

Por lo tanto,
III
2.- Las siguientes son las calificaciones obtenidas por los 25 alumnos de un grupo de
2,06 Bachillerato en las asignaturas de Biología y Química:
𝐶𝑉 𝑌/𝑋 𝑥 0,15
13,448
B 4 5 5 5 6 6 6 5 5 7 7 7 7 7 7 5 4 3 2 2 7 7 6 5 5
El coeficiente de variación de 𝐶𝑉 𝑌/𝑋 𝑥 0,15 es más pequeño que 𝐶𝑉 𝑋/𝑌
Q 3 5 5 6 7 7 7 7 7 7 4 4 5 6 2 2 4 7 6 5 7 7 5 4 4
𝑦 0,16, pero la diferencia es muy ínfima entre ambos coeficientes, por ende no
podemos afirmar que una de las medias es más representativa que la otra, en conclusión Fuente: D. F.
ambas medias tienen similar coeficiente de variación. a. Obtenga la tabla de frecuencias conjunta.
b. ¿Qué proporción de alumnos obtienen más de un cinco en ambas asignaturas? ¿Qué
proporción de alumnos obtienen más de un cinco en Biología? ¿Qué proporción de
Estadística Descriptiva Bivariada Unidad IV alumnos obtienen más de un cinco en Química?
c. Obtenga la distribución de frecuencias condicionales de la calificación en Biología
III de los estudiantes que obtuvieron un 6 en Química ¿Qué proporción de estos
EJERCICIOS PROPUESTOS estudiantes obtuvieron la mejor nota en Biología?
d. Obtenga el coeficiente de correlación. Interprete el resultado.
1.- Se está estudiando la relación entre el número de años que una persona está afiliada al
sindicato y el nivel de satisfacción con la actuación de dicho sindicato (nivel de 3.- Se calculó el coeficiente de correlación entre las puntuaciones en dos test X e Y en dos
satisfacción de 1 a 10). Para ello se parte de los datos de 6 individuos tomados muestras de sujetos pertenecientes a dos países A y B. Para la muestra A se obtuvo un
aleatoriamente de personas adscritas a partidos políticos, obteniéndose: 𝑟𝑋𝑌 = 0,3 mientras que para la muestra B un 𝑟𝑋𝑌 = 0,6

Años 8 7 10 3 6 13 a. ¿Qué se puede decir en términos comparativos acerca de la asociación entre X e Y


Satisfacción 7 5 8 5 9 9 Fuente: D. F.
en ambos países?
Estadística Descriptiva Bivariada Unidad IV
a. Calcule el coeficiente de correlación lineal. Interprete el resultado obtenido.
b. Prediga el índice de satisfacción de una persona que lleva 11 años militando en el
4.- La relación entre el precio de un producto y el volumen de consumo es la siguiente:
III
sindicato. Conociendo que el índice de satisfacción es de 6 predecir los años que
lleva en el sindicato. Precio 180 220 260 300 340
135
2.- Las siguientes son las calificaciones obtenidas por los 25 alumnos de un grupo de Consumo 1.905 2.370 2.835 3.300 3.765
Bachillerato en las asignaturas de Biología y Química:
Fuente: D. F.
B 4 5 5 5 6 6 6 5 5 7 7 7 7 7 7 5 4 3 2 2 7 7 6 5 5
Q 3 5 5 6 7 7 7 7 7 7 4 4 5 6 2 2 4 7 6 5 7 7 5 4 4 Halle el valor del coeficiente de correlación.

Fuente: D. F. 5.- El departamento de Marketing de un grupo financiero ha realizado un estudio sobre la


a. Obtenga la tabla de frecuencias conjunta.
influencia de la renta en las decisiones de inversión de sus clientes. Para ello eligió una
b. ¿Qué proporción de alumnos obtienen más de un cinco en ambas asignaturas? ¿Qué
muestra de 20 clientes, cuya renta anual, junto con las cantidades invertidas en un cierto
proporción de alumnos obtienen más de un cinco en Biología? ¿Qué proporción de
año, en millones de pesos, aparecen recogidas en la siguiente tabla:
alumnos obtienen más de un cinco en Química?
c. Obtenga la distribución de frecuencias condicionales de la calificación en Biología
de los estudiantes que obtuvieron un 6 en Química ¿Qué proporción de estos
estudiantes obtuvieron la mejor nota en Biología? Inversión [0 – 4[ [4 – 8[ [8 – 12]
d. Obtenga el coeficiente de correlación. Interprete el resultado. Renta
Fuente: D. F.

Halle el valor del coeficiente de correlación.

5.- El departamento de Marketing de un grupo financiero ha realizado un estudio sobre la


influencia de la renta en las decisiones de inversión de sus clientes. Para ello eligió una
muestra de 20 clientes, cuya renta anual, junto con las cantidades invertidas en un cierto
año, en millones de pesos, aparecen recogidas en la siguiente tabla:

Inversión [0 – 4[ [4 – 8[ [8 – 12]
Renta
[6 – 14[ 4 2 0
[14 – 26[ 2 2 3
[26 – 34] 0 1 6
Fuente: D. F.
a. Halle las medias y varianzas de las variables consideradas.
b. ¿Cuál es la covarianza entre la inversión y la renta?
c. ¿Cuál sería el valor de la covarianza si cada cliente aumentara su inversión en un
millón de pesos?¿Qué valor tendría la covarianza si la renta de cada cliente se
incrementa en un 6%?

136

You might also like