Capitulo 3

Estadística descriptiva: métodos numéricos

3.5

MEDIDAS DE ASOCIACIÓN ENTRE DOS VARIABLES
Hasta ahora hemos examinado métodos numéricos cuyo objeto es resumir los datos de una sola variable. Con frecuencia, al gerente o a quien toma decisiones le interesa la relación entre dos variables. En esta sección presentaremos la covarianza y la correlación como medidas descriptivas de la relación entre dos variables. Retomemos el caso del almacén de equipos de sonido estereofónico en San Francisco, que presentamos en la sección 2.4. Al administrador del almacén le interesa investigar la relación entre la cantidad de comerciales de televisión que aparece en el fin de semana y las ventas en su negocio durante la siguiente semana. En la tabla 3.7 aparecen datos de la muestra, donde las ventas se expresan en cientos de dólares con una observación para cada semana (;/ = 10). El diagrama de dispersión de la figura 3.6 indica una relación positiva, donde las ventas mayores (y) están asociadas con una mayor cantidad de comerciales (.v). De hecho, el diagrama de dispersión sugiere que se podría emplear una recta como una aproximación de esa relación. A continuación presentaremos la covarianza como medida descriptiva de la asociación lineal entre dos variables.

.

un valor negativo de siy indica una asociación lineal negativa entre x y y.11) se usó la notación px para representar la media de la población de la variable x y fiv para la de la variable y. De acuerdo con todo lo anterior. y así sucesivamente. con s„ =11. La covarianza de la población ff se define para una población de tamaño N. Entonces. los puntos que tuvieron la máxima influencia sobre sxy deben estar en los cuadrantes I y III. Sin embargo.7.8 muestra los valores de sxy que se pueden esperar con tres tipos distintos de diagrama de dispersión.8. esto es. Por consiguiente. Retomando la figura 3. En la gráfica quedan cuatro cuadrantes: los puntos del cuadrante I corresponden a valores de x¡ mayores que x y a valores de y¡ mayores que y. Por consiguiente. Interpretación de la covarianza Para auxiliarnos en la interpretación de la covarianza de la muestra es necesario tomar en cuenta la figura 3.7. pero con una recta vertical punteada en x = 3 y una recta horizontal punteada en y = 51. el de y aumenta. si el valor de sxv es negativo.x)(y¡ . . Como cabría esperar. Si el valor de sxy es positivo. si los puntos se distribuyen uniformemente en los cuatro cuadrantes. indicando que no hay asociación lineal entre x y y. un problema del uso de la covarianza como medida de la La covarianza es una medida de la asociación lineal entre dos variables. los puntos del cuadrante II a valores de x. parecería que un valor positivo grande de la covarianza indica una fuerte relación lineal positiva. vemos que el diagrama de dispersión del almacén de equipos de sonido sigue el patrón de la parte superior de la figura 3.y) debe ser positivo para los puntos ubicados en el cuadrante I. Sin embargo. los puntos que tuvieron la mayor influencia sobre s„ están en los cuadrantes II y IV. que es la misma que el diagrama de dispersión de la figura 3. La figura 3. negativo para puntos del II. el valor de (x. al aumentar el valor de x.102 Capítulo 3 numéricos Estadística descriptiva: métodos En la ecuación (3. el valor de la covarianza de la muestra es positivo. un valor positivo de sxy indica una asociación lineal positiva entre x y y. Por último.6. menores que x y a valores de y¡ mayores que y. al aumentar el valor de x el valor de y disminuye. el valor de sxy será cercano a cero. . esto es. positivo para puntos del III y negativo para los del IV. y que un valor negativo grande indica una fuerte relación lineal negativa.

.

Así. y el peso. . que también mide la relación entre dos variables. de los individuos. x. de correlación de momento del producto de Pesaron. Para evitar esta dificultad se usa el coeficiente de correlación. y.x) que cuando se expresa en pies. 2(A.x)(y¡ . cuando la altura se expresa en pulgadas se obtienen valores numéricos mucho mayores de (.v. como sigue.Capítulo 3 numéricos Estadística descriptiva: métodos intensidad de la relación lineal es que el valor de la covarianza que obtenemos depende de las unidades de medida de x y y. suponga que nos interesa la relación entre la altura. si medimos la altura en pies o en pulgadas.. Por ejemplo. Es claro que la intensidad de la relación debe ser la misma.10). y con él una mayor covarianza.J') en la ecuación (3. No obstante.. con la altura expresada en pulgadas. Coeficiente de correlación Para los datos de una muestra. . obtendríamos un mayor valor en el numerador. se define el coeficiente. cuando de hecho no hay diferencia en la relación.

5 Medidas de asociación entre dos variables .3.

Sign up to vote on this title
UsefulNot useful